Explanation(explanation for)

  • 时间:
  • 浏览:82
  • 来源:奥一装修网

explanation音标

本文是我在推荐系统研究中研究的论文的翻译和解释。原文:通过专注多视图学习 AAAI2019会议论文的可解释性建议。本说明由Microsoft亚洲研究团队制作。包含作者自己对问题的理解的标准翻译仅供参考。欢迎学习和交流摘要。由于信息的爆炸性增长,推荐系统在我们的日常生活中发挥着越来越重要的作用。准确性和可解释性是评估推荐模型的两个核心方面,它们已成为机器学习中的基本折衷方案。 本文建议通过构建可解释的深度模型来减少准确性和可解释性之间的权衡,该模型将基于深度学习的模型的优点与现有的可解释方法相结合。 基本思想是基于可解释的深层次结构(例如Microsoft Concept Graph)构建初始网络,并通过优化层次结构中的关键变量(例如节点重要性和相关性)来提高模型准确性。 为了确保准确的分数预测,提出了一种多视图注意力学习框架。该框架能够通过执行不同特征层之间的联合正则化和注意力组合预测来处理稀疏和嘈杂的数据。为了从层次结构中挖掘出可读的解释,我们将个性化解释概括为约束树节点选择问题,并提出了一种动态规划算法来解决。实验结果表明,该模型在准确性和可解释性方面优于现有方法。简介建议社区已达成共识,即准确性只能用于部分评估系统。同样重要的是,模型的可解释性,解释为什么建议使用某项的能力。正确的解释可以说服用户尝试该项目,增强用户的信任度,并帮助用户做出更好的决策。 确定是朝着准确性还是准确性进行优化是一个基本问题。当前,选择仅限于两个模型:Deep但无法解释:Deep Model所学的高维和高级功能对于普通用户而言是无法理解的。但是,缺乏有效的机制来建模高级显式特征会限制其准确性和/或可解释性。这些方法只能从预定义的候选级别中选择解释。他们无法确定最能代表用户真正兴趣的功能级别。例如,他们无法判断用户是只喜欢虾(低含量)还是对海鲜感兴趣(高含量)。因此,本文提出了一个可解释的推荐深度模型“深且可解释”,以减少准确性和可解释性之间的权衡。该模型实现了最新的准确性和高解释性。另外,它使我们能够准确地描述分层的用户兴趣。 此模型可以自动推断多级用户的兴趣,并确定哪个功能水平最能抓住用户的真实兴趣,例如他(她)对低级功能(例如虾)还是高级功能(例如海鲜)。 要设计可解释的深度模型,存在两个主要技术挑战。 第一个挑战是从噪声和稀疏数据中准确构建多级显式特征模型。由于高级功能和低级功能具有重叠的语义,因此很难对它们之间的关系进行建模。例如,了解海鲜对用户是否重要是一个挑战,因为用户在重新查看时只能提及虾或肉。第二个挑战是要生成易于普通用户从多级结构理解的解释。为了解决这些挑战,我们开发了一个深层次的显式注意力多视图学习模型(DEAML)。基本思想是基于可解释的深层结构(例如知识图)构建初始网络,并通过优化可解释结构中的关键变量(例如节点重要性和相关性)来提高准确性。 问题定义输入:模型输入包括用户集,项目集和显式要素层次结构。定义1:显式要素层次结构是一棵树,每个节点是某个项目(例如餐厅)的显式要素或外观(例如肉)。每个边都是一个元组(),这意味着子节点(例如,牛肉)是父节点(例如,肉)的子概念。我们将节点集合表示为,其中,是节点总数。建筑的方法文章使用Microsoft的概念图,这是一种广泛使用的知识图,具有超过500万个概念和8500万个“是”关系(例如,catisa动物)分层通信和注意力多视图学习的联合优化使我们能够以端到端的方式同时推断用户的偏好和预测分数。

explanation用法

Step 2:个性化的说明生成个性化的说明生成使用DEAML模型来生成说明。首先,定义候选特征的效用函数,其中考虑了用户的兴趣特征,项目特征质量和不同视图的注意力得分。然后将解释生成解释为约束树节点选择问题,并提出一种动态规划算法对其进行有效求解。 Specific details分层传播机制分层传播此方法主要用于构造分层的用户兴趣特征或项目特征。 构造用户要素兴趣层次结构的直接方法是将元素映射到其中。具体地说,对于其中的每个要素,我们可以假定用户的兴趣等于其中的元素。因为它是通过计算用户的次数来计算的写评论,此方法在一定程度上吸引了用户的兴趣。但是,由于数据的稀疏性,数据中的噪声以及特征语义的重叠,用户对特征的关注程度可能不准确。例如,对肉类感兴趣的用户可能经常在牛肉和猪肉上发表评论,但很少提及“肉”一词。 要解决此问题,请通过传播来推断用户的真实兴趣。对于每个父节点,我们通过用户的注意力机制对其进行计算:同样,该项目也以这种方式分层表示。 作者的注释:这部分看起来很复杂,但可以理解如下:对于不同级别的特征,必须构造不同的特征向量。初始向量仅通过统计获得,上层和下层之间的相关性被忽略,因此使用注意力机制将子节点的特征与当前节点的特征进行整合;这样,每一层将获得新的特征向量表示。当然,底部叶节点层应保持不变。层次结构特征表示,通常较为合理。 Attentive Multi-view Learning获得用户特征兴趣和项目特征质量的准确建模后,基于预测用户对项目的喜爱程度,设计了一个多视图注意力学习框架。我们首先展示如何在单个视图中基于信息预测分数。我们首先从一个角度考虑分数预测。假设在该级别上具有特征,则可以获得本地用户特征兴趣向量和项目特征质量向量。 基于此,扩展的EFM模型用于进行得分预测。与协作过滤相比,EFM添加了一组从功能中学习的显式潜在因素,以丰富用户和项目表示。具体来说,用户嵌入第二层是,那么其中一个是从显式特征中学习的向量,另一个是隐式向量,并且可以将两者拼接在一起。相应地,对于项,有use显式因子用于拟合(使用)和使用de-fit(使用),其中h级特征的投影矩阵是,传统EFM直接预测用户的水平i具体损失设计如下,包括评分误差项和拟合误差项共正则损失然后,我们考虑多视图中的模型如何相互补充。基于旨在最大化多视角一致性的共识原则,多视角学习的通用范式是共正则化。实际上,分布在不同视图中的信息从多个方面描述了用户特征兴趣和项目特征质量的固有特征。我们可以通过加强多视点预测之间的一致性来规范多视点的学习。补充信息可用于帮助学习每个视图。通过实现两个相邻视图之间的协议,共同调节损失为:联合学习应将来自多个视图的预测合并起来以进行最终预测。一种方法是平均所有视图的预测。但是,这假设每个视图对评级的贡献均等。实际上,不同的观点揭示了不同抽象级别的用户特征兴趣和项目特征质量。兴趣程度也因用户和项目而异。一些用户可能更关心一般特征(例如食物和服务),而其他用户可能更喜欢特定特征(例如牛肉)。这对于项目是相同的。视图并不是同等有用,应该为它们分配不同的权重。权重的确定取决于用户的项目的特定方式,并考虑到用户的兴趣和项目的质量。因此,我们使用注意力机制来组合多个视图。假设表示视图尺寸的一维矢量:通过注意力机制获得最终预测分数,结合不同任务的损失和L2正则化方法:

explanation for

个性化解释生成个性化解释生成个性化解释生成的目标是选择最有用的功能,以帮助用户确定是否尝试项目。选择跨多个级别分布的功能具有挑战性,因为1)用户兴趣在不同级别上分布不均,以及2)我们需要避免选择语义重叠的功能。 在本节中,我们首先介绍实用程序功能,该功能估计每个功能的有用性。然后,将特征选择问题描述为约束树节点选择问题,并提出了一种动态规划方法来有效地解决该问题。 Utility功能给定用户和项目,在确定功能是否有用时要考虑三个因素:•用户是否感兴趣。 •项目的执行情况。 •拥有视图的权重。然后将特征上的“ mathimg =“ 1”》效用得分定义为:分别使用显式因素和用户兴趣特征以及项特征,并表示第一层的关注权重;表示根特征,效用得分因没有特殊含义而设置为0,该效用函数结合了上述三个因素:约束树节点选择约束树节点选择然后选择T特征生成解释,目的是最大程度地提高效用得分。此外,还要求不能同时在t(例如肉)中同时选择要素(例如牛肉)及其父/祖先节点特征,因为它们完全重叠,在数学上,我们将每种解释描述为约束树节点选择问题:对于,如果它是祖先节点,则返回1;通过动态编程算法解决该问题可以说,通过选择t节点可以获得最大效用子树中的s(根为第一个子功能的ID),用于指示从上一个子功能中选择一个节点可获得的最大效用,并使用表显示的子功能总数。 实验部分需要验证两个特征:准确性和可解释性效果关于可解释性部分的研究,评估模型的解释将帮助现实世界的用户做出更好的决策。有用性。 在数据注释公司的帮助下,我们招募了20名参与者,他们是独立的,彼此不认识。他们提到的有关餐厅的所有评论都已被抓取并与Yelp数据集中的其他评论合并。使用两个基线进行比较。第一个基准是PAV,这是著名的“人们看到它”的解释。第二个基准是EFM,这是生成要素级解释的最新方法。我们将我们的方法和基准应用于合并后的数据集,并随机抽样100家餐厅进行测试。我们保证没有参与者会去这些餐厅。对于每个餐厅,我们使用PAV,EFM和DEAML为每个参与者生成三种解释。 EFM模板与DEAML相同,PAV具有自己的格式:“人们也查看了此项目”。 EFM和DEAML的T均设置为3。参与者需要根据每种解释在帮助他们决定是否去餐厅中所扮演的角色给出1至5个笔记。我们随机更改解释的顺序,以使他们不知道哪种解释来自哪种方法。 具体评估结果如下:DEAML的满意度显着提高。总结本文提出了一种基于多视图注意力学习的可解释的推荐模型。在实践中,知识图用于构造层次结构。该层次结构的作者使用注意力机制和EFM模型来实现分数预测和解释生成。在特定设计中使用了许多技术。总的来说,它是创新的,可以在注意力机制和图表方面进行进一步优化。 。