谷歌RecLLM,大模型赋能对话推荐算法系统

发布于:2025-08-29 ⋅ 阅读:(19) ⋅ 点赞:(0)

注:此文章内容均节选自充电了么创始人,CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)【陈敬雷编著】【清华大学出版社】

清华《GPT多模态大模型与AI Agent智能体》书籍配套视频课程【陈敬雷】

GPT多模态大模型与AI Agent智能体系列一百一十九

谷歌RecLLM,大模型赋能对话推荐算法系统

谷歌放大招!用大模型打造端到端对话推荐系统,推荐效果绝了

在当今数字化时代,推荐系统已经成为我们生活中不可或缺的一部分。从电商平台的商品推荐,到流媒体服务的内容推荐,它们无处不在,为我们提供个性化的服务。然而,传统的推荐系统存在一些局限性,例如冷启动问题、数据稀疏性问题,以及无法捕捉用户复杂多样的兴趣和需求。随着自然语言处理(NLP)技术的飞速发展,对话式推荐系统(CRS)应运而生,为解决这些问题提供了新的思路。而谷歌更是在此基础上,利用大模型构建了端到端的对话式推荐系统,让推荐效果达到了一个新的高度。

一、对话式推荐系统,开启推荐新模式

在传统的推荐系统模式中,用户往往处于被动接受的状态,只能在推荐列表中选择消费物料,缺乏与推荐机制的深入互动。这就导致了一系列不佳体验,如流行度偏差、低效的兴趣试探、信息茧房等问题,让用户感到束手无策。

对话式推荐系统的出现,彻底改变了这一局面。它通过对话交流的方式向用户做推荐,不再仅仅依赖于用户行为,而是能够随着用户提供的反馈语句逐渐优化所推荐的内容。在这种模式下,用户对推荐系统拥有了更强的影响力,能够更加主动地参与到推荐过程中。

例如,在YouTube场景下的对话式推荐系统中,用户可以与系统进行对话,系统会根据用户的反馈实时调整推荐结果。淘宝的服务助手中也存在类似的对话推荐系统,推荐内容会在对话中直接给出,让用户能够更加便捷地获取到自己感兴趣的商品或内容。

二、谷歌RecLLM,大模型赋能对话推荐

大规模语言模型的出现,为对话式推荐系统的发展注入了新的活力。这些模型集成了海量知识内容,具备强大的逻辑推理能力,能够以自然语言的形式与用户进行互动交流,与对话式推荐系统的需求相当契合。

谷歌基于大语言模型LaMDA实现了对话式推荐系统RecLLM,开启了对话式推荐系统的新模式。RecLLM的整体框架包含多个关键部分:

  1. 对话管理模块:负责与用户交流并适时向推荐系统发起请求。它通过LLM驱动,能够在与用户的交流中,有效地将对话引导至推荐相关话题,同时注意对话的自然流畅,掌握恰当的时机和交流方法来启发用户,抽取其兴趣喜好。
  2. 召回模块:负责在大规模语料库中检索出适合的推荐候选集。RecLLM探讨了四种不同的推荐召回策略,包括“Generalized Dual Encoder Model”“Direct LLM Search”“Concept Based Search”“Search API Lookup”,每种策略都有其优缺点,RecLLM会根据实际情况选择最合适的策略。
  3. 排序模块:对推荐候选集合评分并提供推荐理由。召回生成的候选集中的每一物料都将逐一被LLM打分,并同时生成语言解释,这些解释不仅向用户展示,也起到了思维链的作用,帮助用户更好地理解推荐结果。
  4. 用户画像模块:负责形成可解释性的用户兴趣并参与推荐流程。用户画像由Memory Extraction、Triggering and Retrieval、System Integration三个关键部分组成,能够记录用户显著的喜好表达,筛选出所需要使用的用户画像,并将代表长期兴趣的用户画像与当前对话内容集成。
  5. 用户模拟器:模拟用户以生成对话示例,在系统冷启时作为样本对各个模块中的LLM做微调。用户模拟器通过LLM实现,为了确保其真实性,RecLLM提出了两种控制策略,包括全局对话控制和单次对话控制。

三、各模块深度解析,揭秘RecLLM强大之处

(一)对话管理,自然交互的艺术

对话管理模块的核心功能包括与用户的互动交流以及适时向推荐系统发起请求。为了实现这一职能,它需要在与用户的交流中,巧妙地将对话引导至推荐相关话题,同时保持对话的自然流畅。

输入到大模型中的数据可分为三个部分:Dialogue,涵盖会话的上下文信息;User Profile用户画像,用于记录用户的兴趣偏好;Item Summary,为当前推荐内容的概述。模型的输出同样分为三个部分:Context tracking,对会话上下文的总结;Instruction,即由模型产生的指令,类似于思维链,为后续步骤的正确推理做铺垫;Response,包括“Response:”用于与用户进行交流,“Request:”用于向推荐系统发起请求。

通过特定数据对模型做微调,能够强化对话管理模块引导话题的功能,使其能够更好地理解用户意图,提供更加自然、流畅的对话体验。

(二)召回,精准筛选的智慧

RecLLM探讨了四种不同的推荐召回策略:

  1. Generalized Dual Encoder Model:最常用的双塔召回方法。但由于RecLLM仅通过分析用户的对话内容来抓取用户兴趣点,不依赖点击或其他行为数据,无法使用行为样本训练双塔。因此,RecLLM将会话上下文等用户信息输入至LLM,直接使用其隐藏层作为用户向量,而物料向量则依赖于其他业务场景中已有的物料表示。然而,未经训练的方式无法确保用户和物料向量处于同一语义空间内,导致性能表现较差。
  2. Direct LLM Search:通过LLM直接生成物料的ID或标题,进而在物料库中进行匹配。这种方法的缺点是对大模型做微调既耗时又费力,并且无法应对物料库的频繁更新。
  3. Concept Based Search:对双塔召回的改进。在这种方式中,LLM输出一组相关“概念”,并利用“Concept Activation Vectors”将这些概念聚合并映射到物品表示空间中,确保用户和物品在相同的语义空间内。尽管如此,概念生成和概念激活向量的使用可能会损失一定的准确性,进而影响推荐精度。
  4. Search API Lookup:大模型生成搜索查询query,随后利用已经存在于业务中的搜索API来获得推荐内容。这种策略能够利用已有的搜索资源,提高召回效率和准确性。

(三)排序,有理有据的推荐

排序模块对召回生成的候选集中的每一物料进行评分,并同时生成语言解释。由于物料的Item Metadata(例如视频字幕、用户评论等)和用户对话上下文Context内容冗长,都需经过总结处理后再输入到LLM中。

随后,该模型会输出评分以及语言解释。这些语言解释不仅向用户展示推荐的理由,还起到了思维链的作用,帮助用户更好地理解推荐结果,增加用户对推荐系统的信任度。

(四)用户画像,个性化体验的关键

为了提供更加个性化的体验,创建用户画像至关重要。用户画像由三个关键部分组成:

  1. Memory Extraction:负责使用LLM识别并记录用户显著的喜好表达,例如识别“我不喜欢看偶像剧”,并将其加入到用户画像中。
  2. Triggering and Retrieval:负责匹配每轮的对话内容与用户画像之间的文本相似性,由此筛选出所需要使用的用户画像。
  3. System Integration:解决如何将代表长期兴趣的用户画像与当前对话内容集成的问题,即使它们相互矛盾,仍能够融合到一起。例如,一个用户可能平时不喜欢偶像剧,但由于对某个热点事件感兴趣,可能暂时需要查找特定的偶像剧。RecLLM将两者统一输入至LLM,借助其强大的文本理解能力和推理能力来解决这一矛盾。

(五)数据模拟和微调,提升系统性能的秘诀

用户模拟器的任务是仿真用户与对话式推荐系统(CRS)的交互响应。为了确保用户模拟器的真实性,它与CRS互动所产生的对话分布Q应和真实用户与CRS的对话分布R无差异。RecLLM提出了衡量两分布差异性的三种不同策略:第一种方法依赖于人工判断;第二种方法涉及创建分类器以确定样本是否来自真实分布;第三种方法则是构建对话的主题、情感和用户意图等细粒度分类器,精准评估两个分布间的差异。

用户模拟器通过LLM实现,为了确保其真实性,RecLLM提出了两种控制策略:第一种为全局对话控制,涉及通过类似用户画像声明作为输入来引导LLM;第二种则是单次对话控制,利用用户在其他业务中的行为序列(例如搜索引擎中的Query序列)实现对用户对话轨迹的模拟。

使用用户模拟器便可生成微调LLM的样本,例如额外输入提示词“在第j轮对话中提出生成x物料推荐的需求”。召回和排序阶段使用模拟的数据来微调即可,其中在召回阶段中为解决样本选择偏差问题需要额外负采样。对于对话管理模块,使用了RLHF算法来微调。

(一)为什么要学习大模型?

学习大模型课程具有极其重要的意义,它能够极大地促进个人在人工智能领域的专业发展。大模型技术,如自然语言处理和图像识别,正在推动着人工智能进入新的发展阶段。

通过学习大模型课程,可以掌握设计和实现基于大模型的应用系统所需的基本原理和技术,从而提升自己在数据处理、分析和决策制定方面的能力。此外,大模型技术在多个行业中的应用日益增加,掌握这一技术将有助于提高就业竞争力,并为未来的创新创业提供坚实的基础。

(二)大模型实际应用案例分享

  1. 智能客服:某科技公司员工在学习了大模型课程后,成功开发了一套基于自然语言处理的大模型智能客服系统。该系统不仅提高了客户服务效率,还显著降低了人工成本。
  2. 医疗影像分析:一位医学研究人员通过学习大模型课程,掌握了深度学习技术在医疗影像分析中的应用。他开发的算法能够准确识别肿瘤等病变,为医生提供了有力的诊断辅助。
  3. 金融风险管理:一位金融分析师利用大模型课程中学到的知识,开发了一套信用评分模型。该模型帮助银行更准确地评估贷款申请者的信用风险,降低了不良贷款率。
  4. 智能推荐系统:一位电商平台的工程师在学习大模型课程后,优化了平台的商品推荐算法。新算法提高了用户满意度和购买转化率,为公司带来了显著的增长。

这些案例表明,学习大模型课程不仅能够提升个人技能,还能为企业带来实际效益,推动行业创新发展。

谷歌利用大模型构建的端到端对话式推荐系统RecLLM,为推荐系统的发展带来了新的思路和方法。通过对话管理、召回、排序、用户画像以及数据模拟和微调等多个模块的协同工作,RecLLM能够为用户提供更加个性化、精准、可解释的推荐服务。相信在未来,随着大模型技术的不断发展和应用,对话式推荐系统将会在更多领域发挥重要作用,为我们的生活带来更多便利和惊喜。同时,学习大模型技术也将成为未来人工智能领域发展的关键,希望大家能够抓住机会,通过我们提供的学习资料,深入学习大模型技术,为自己的未来发展打下坚实的基础。

下一篇内容详解更多…

更多技术内容

更多技术内容可参见
清华《GPT多模态大模型与AI Agent智能体》书籍配套视频【陈敬雷】
更多的技术交流和探讨也欢迎加我个人微信chenjinglei66。

总结

此文章有对应的配套新书教材和视频:

【配套新书教材】
《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)【陈敬雷编著】【清华大学出版社】
新书特色:《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)是一本2025年清华大学出版社出版的图书,作者是陈敬雷,本书深入探讨了GPT多模态大模型与AI Agent智能体的技术原理及其在企业中的应用落地。
全书共8章,从大模型技术原理切入,逐步深入大模型训练及微调,还介绍了众多国内外主流大模型。LangChain技术、RAG检索增强生成、多模态大模型等均有深入讲解。对AI Agent智能体,从定义、原理到主流框架也都进行了深入讲解。在企业应用落地方面,本书提供了丰富的案例分析,如基于大模型的对话式推荐系统、多模态搜索、NL2SQL数据即席查询、智能客服对话机器人、多模态数字人,以及多模态具身智能等。这些案例不仅展示了大模型技术的实际应用,也为读者提供了宝贵的实践经验。
本书适合对大模型、多模态技术及AI Agent感兴趣的读者阅读,也特别适合作为高等院校本科生和研究生的教材或参考书。书中内容丰富、系统,既有理论知识的深入讲解,也有大量的实践案例和代码示例,能够帮助学生在掌握理论知识的同时,培养实际操作能力和解决问题的能力。通过阅读本书,读者将能够更好地理解大模型技术的前沿发展,并将其应用于实际工作中,推动人工智能技术的进步和创新。

【配套视频】

清华《GPT多模态大模型与AI Agent智能体》书籍配套视频【陈敬雷】
视频特色: 前沿技术深度解析,把握行业脉搏

实战驱动,掌握大模型开发全流程

智能涌现与 AGI 前瞻,抢占技术高地

上一篇:《GPT多模态大模型与AI Agent智能体》系列一》大模型技术原理 - 大模型技术的起源、思想
下一篇:DeepSeek大模型技术系列五》DeepSeek大模型基础设施全解析:支撑万亿参数模型的幕后英雄


网站公告

今日签到

点亮在社区的每一天
去签到