【字节跳动】数据挖掘面试题0017：推荐算法：双塔模型，怎么把内容精准地推送给用户-易微帮

在这里插入图片描述

双塔模型：推荐算法中的“高效匹配引擎

推荐系统的本质是解决“用户-物品匹配”问题——即预测用户对物品的偏好程度。
传统方法（如协同过滤、逻辑回归）在处理 海量用户/物品或高维稀疏特征时，常面临计算复杂、泛化能力弱 的问题。
双塔模型的核心创新在于 “分离建模+向量匹配”：
- 1. 分离建模：将用户特征和物品特征通过两个独立的神经网络（“塔”）分别处理，避免用户与物品特征直接交互带来的 计算爆炸；
- 1. 向量匹配：将用户和物品分别映射到低维稠密的向量空间（称为“用户向量”和“物品向量”），通过向量相似度（如内积、余弦相似度）衡量用户对物品的偏好，简化匹配计算。

形象来说，双塔模型就像“红娘”：先分别深入了解“用户”（用户塔）和“物品”（物品塔）的特征，再通过两者的“性格匹配度”（向量相似度）决定是否推荐。

双塔模型的结构可分为输入层、塔网络层、交互层三部分。

输入层负责接收用户和物品的原始特征，并进行初步预处理。

这些特征可能是离散型（如ID、类别）或连续型（如价格、年龄），需通过嵌入层（Embedding Layer） 统一转换为低维稠密向量（离散特征通过查表映射，连续特征直接输入或分箱后嵌入）。

“用户塔”和“物品塔”是两个独立的神经网络（通常为全连接网络，也可结合CNN、RNN、注意力机制等），负责将预处理后的特征转化为抽象的向量表示。

用户塔：聚焦于“用户偏好建模”，例如通过RNN处理用户历史行为序列，捕捉用户的短期兴趣；通过全连接层融合 demographics 特征，捕捉长期偏好；
物品塔：聚焦于“物品特性建模”，例如通过CNN提取物品图片特征，通过全连接层融合价格、品牌等属性，生成物品的“身份标签”向量。

经过塔网络编码后，用户和物品分别得到固定维度的向量（如128维、256维），交互层通过相似度函数计算两者的匹配度，作为推荐分数。常用的相似度函数包括：

最终输出的相似度分数越高，代表用户对物品的潜在偏好越强。

双塔模型在推荐系统中被广泛应用（如电商、短视频、信息流），核心优势体现在以下方面：

离线计算与在线检索分离：物品塔的向量可离线预计算并存储在向量数据库（如FAISS、Milvus）中，在线推荐时仅需实时计算用户向量，再通过向量检索快速召回TopN相似物品，避免实时计算所有用户-物品对的复杂度；
可扩展性强：新增物品时仅需重新计算该物品的向量，无需更新整个模型，适合物品库动态变化的场景（如电商新品上架、短视频实时更新）。

用户和物品的特征（如ID、标签）往往是高维稀疏的（例如用户ID可能有10亿级），双塔模型通过嵌入层将稀疏特征压缩为低维稠密向量࿰