论文阅读笔记
- 培训职业
- 2025-05-05 08:27:01
推荐系统利用交互历史来估计用户偏好,已在广泛的行业应用中广泛使用。然而,由于其固有的缺点,静态推荐模型很难很好地回答两个重要的问题:(a) 用户到底喜欢什么?(b) 为什么一个用户喜欢一个项目?这些缺点是由于静态模型学习用户偏好的方式,即没有明确的指令和来自用户的主动反馈。最近,会话推荐系统(CRSs)的兴起从根本上改变了这种情况。在CRS中,用户和系统可以通过自然语言交互进行动态通信,这为明确获得用户的确切偏好提供了前所未有的机会。在不同的环境和应用中付出了大量的努力。现有的crs模型、技术和评价方法还远未成熟。在本文中,我们对在当前的crs中使用的技术进行了系统的综述。我们从五个方向总结了开发CRSs的关键挑战:基于(1)问题的用户偏好引出。(2)多回合对话推荐策略。(3)对话的理解和生成。(4)的开发-勘探的权衡。(5)评估和用户模拟。这些研究方向涉及信息检索(IR)、自然语言处理(NLP)和人机交互(HCI)等多个研究领域。基于这些研究方向,我们讨论了我们未来面临的一些挑战和机遇。我们为来自多个社区的研究人员提供了一个在这个领域开始的路线图。我们希望这项调查可以帮助识别和解决CRSs中的挑战,并启发未来的研究。
一种推荐系统,可以引出用户的动态偏好,并根据用户当前的需求采取行动。CRS组成(三大组件):问题驱动方法、多回合对话推荐策略、对话的理解和生成、开发-勘探的权衡、评估和用户模拟。CRS不仅应该提出澄清问题和询问用户,还应该承担引导主题和影响用户思维的责任。因此,CRS不仅应该提出澄清问题和询问用户,还应该承担引导主题和影响用户思维的责任。为了实现这一目标,一些研究试图丰富CRS的某些个性,或赋予CRS引导对话的能力,从而使对话更有吸引力。理解用户的意图是一个CRS的用户界面的关键要求,因为下游任务,例如推荐,严重依赖于这些信息。端到端语言模型有潜力作为CRS模型的一部分,在具有复杂上下文的真实应用程序中直接与人类交互。一个基于自然语言的CRS反应至少应该满足两个级别的标准。较低级别的标准要求生成的语言是正确的;较高层次的标准要求响应包含关于推荐结果的有意义和有用的信息。使用端到端框架作为用户界面的CRSs有一个主要的限制:只有在训练语料库中提到的项目才有机会被推荐,因为从未被提到的项目没有被端到端模型建模。因此,该方法的性能受到训练数据中人工推荐质量的极大限制。为了克服这一问题,建议整合领域知识来帮助推荐引擎。结合知识图谱有利于CRS中的对话接口和推荐引擎。CRSs面临的一个挑战是处理历史交互很少的冷启动用户。解决这一问题的自然方法是通过勘探开发(E&E)权衡。在本节中,我们将讨论如何评估CRSs,这是一个尚未得到充分探索的问题。我们将评估crs的尝试分为两类:(1)回合级评估,它评估系统输出的单个回合,包括推荐任务和响应生成任务,这两者都是有监督的预测任务。(2)对话级评价,它评估了作为顺序决策任务的多回合对话策略的性能。为了实现这一目标,用户模拟很重要的。我们首先介绍了CRSs中常用的数据集,然后介绍了CRSs的回合级和对话级评估中的指标、方法和问题。最后,我们讨论了在crs中的用户仿真策略。
虽然CRS的建立是一个新兴的领域,但我们已经从不同的角度发现了巨大的努力。在这次调查中,我们承认这些努力,目的是为了总结现有的研究,并提供深刻的讨论。我们初步给出了CRS的定义,并介绍了CRS的总体框架,它由三个组件组成:用户界面、对话策略模块和推荐引擎。在此基础上,我们总结了现有的五个研究方向,即:基于(1)问题的用户偏好引出;(2)多回合会话推荐策略;(3)对话的理解和生成;针对冷用户的(4)开发-探索权衡;(5)评估和用户模拟。尽管在上述五个方向上取得了进展,但在CRSs领域仍有更多有趣的问题有待探索,如三部分的(1)联合优化;(2)CRSs中的偏置和去偏置方法;(3)多回合会话推荐策略;(4)多模态知识丰富;(5)评估和用户模拟。
通过提供这项调查,我们呼吁这个新兴和有趣的研究领域的分支。我们希望这项调查能够激励来自业界和学术界的研究人员和从业者来推动CRSs的前沿,使CRSs的思想和技术在下一代的信息寻求技术中更加普遍。
上一篇
芬兰的美称
多重随机标签