以下内容整理自AI,进行一个概念扫盲:
Prompt(提示词)
Prompt是用户提供给AI模型的指令或问题,用于引导模型生成特定输出。良好的Prompt设计能显著提升模型的任务理解能力和响应质量,例如通过结构化提示(Few-shot Prompting)让模型学习上下文中的示例,或使用思维链(Chain-of-Thought)提示引导模型分步推理。在Agent开发中,Prompt是控制行为的第一环,直接影响任务拆解、工具调用和结果生成的准确性。RAG(检索增强生成)
RAG通过结合实时检索和文本生成技术,让模型在回答时参考外部知识库的最新信息,解决静态模型的知识局限性。其核心流程包括:将用户查询转换为向量,从向量数据库中检索相关文档片段,再基于检索内容生成回答。这种技术广泛应用于客服、医疗问答等需要实时数据的场景,能有效减少模型幻觉。Embedding(嵌入向量)
Embedding是将文本、图像等数据映射为高维向量的技术,这些向量能捕捉语义特征(如“猫”和“狗”的向量相似度高于“猫”和“汽车”)。通过对比向量距离,可实现语义搜索、聚类和推荐。常用模型如OpenAI的text-embedding-ada-002或开源的Sentence-BERT,它们是构建RAG、记忆系统的基础工具。向量数据库
向量数据库(如Pinecone、Milvus)专为存储和检索高维向量优化,支持高效的相似度搜索。与传统数据库不同,它通过近似最近邻(ANN)算法快速找到语义相似的条目,适合处理非结构化数据。在Agent中,向量数据库用于存储知识库Embedding或用户交互历史,实现快速上下文检索。召回率
召回率衡量检索系统覆盖相关结果的能力,计算为“正确检索到的相关项/所有相关项”。高召回率意味着系统遗漏较少,适用于需全面性的场景(如法律条文查询)。实际应用中需与精确率(Precision)平衡,例如通过调整检索阈值或结合重排序(Re-ranking)技术提升效果。Top_K与Top_p
Top_K限制生成时仅从概率最高的K个候选词中采样,适合需要确定性的任务;Top_p(核采样)动态选择累积概率超过p的最小词集,增强多样性。两者共同控制生成结果的创造性,例如客服场景用低Top_p保证严谨性,而创意写作可用高Top_p激发灵感。温度(Temperature)
温度参数调节生成随机性:高温(如1.0)增加多样性但可能偏离事实,低温(如0.2)使输出更确定但缺乏新意。在Agent中,需根据任务调整——事实查询用低温,诗歌生成用高温,而对话系统可能选择中间值(0.7)平衡流畅性与准确性。Memory(记忆)
Memory使Agent能存储和利用历史信息,分为短期记忆(如对话上下文缓存)和长期记忆(如向量化的用户偏好)。实现方式包括:数据库存储结构化数据、向量库保存语义记忆,或通过递归摘要(Recursive Summarization)压缩长上下文。记忆机制是个性化服务的核心。MCP(Model Context Protocol)
MCP是一种系统性管理AI模型交互上下文的框架协议,旨在通过结构化上下文传递和状态维护来增强复杂任务中模型的连贯性与可控性。其核心是通过标准化接口(如JSON Schema)定义对话历史、环境状态、工具调用结果等上下文要素,使模型能动态跟踪多轮交互的完整信息流。例如,在客服Agent场景中,MCP会记录用户历史问题、已尝试的解决方案、系统反馈等元数据,形成可追溯的任务图谱;在自动化流程中,它可协调多个子模型间的上下文传递,确保链式调用(如检索→分析→执行)的信息一致性。该协议通常与记忆模块(Memory)、函数调用(Function Call)深度集成,既能解决长上下文窗口的容量限制问题(通过分层存储关键信息),也能减少因上下文丢失导致的模型幻觉或逻辑断层,是构建企业级Agent系统的底层支撑技术之一。Function Call(函数调用)
Function Call允许模型调用外部工具(如API、数据库)扩展能力,例如查询天气或执行数学计算。OpenAI等平台提供结构化函数描述,模型根据需求自动触发调用。这是Agent实现复杂任务(如订机票、数据分析)的关键技术。模型幻觉
模型幻觉指生成内容与事实或逻辑不符,成因包括训练数据偏差、过度依赖参数化知识。缓解方法包括:RAG提供真实依据、设置低温/低Top_p限制随机性、添加事后验证(如事实性检查API)以及多步推理(Self-Consistency)。模型微调
微调是在领域数据上继续训练预训练模型,使其适应特定任务(如法律文本分析)。相比Prompt工程,微调能更深度调整模型行为,但需标注数据和算力支持。轻量级方法如LoRA(低秩适应)可降低资源消耗。链式调用
链式调用将多个步骤串联成工作流,例如“检索→生成→验证→执行”。框架如LangChain提供标准化接口,支持灵活组合工具和模型。复杂Agent可能嵌套多条链,如先规划任务步骤,再逐步调用子链完成。Agent(智能代理)
Agent是整合感知、决策与执行的自主系统,核心能力包括:通过Prompt和Memory理解上下文,利用Function Call调用工具,基于RAG获取实时知识,并通过链式调用协调多步骤任务。高级Agent还能通过强化学习(RLHF)从反馈中持续优化行为。
总的来说,在人工智能领域,Prompt是指用户输入给模型的指令或问题,它直接影响模型的输出质量和方向,好的Prompt设计能显著提升任务完成效果。RAG(检索增强生成)是一种结合信息检索和文本生成的技术,通过从外部知识库实时获取相关信息来增强生成内容的准确性,特别适合需要实时数据的场景。Embedding技术将文本、图像等数据转化为高维向量,这些向量能够捕捉语义信息,为相似性搜索和推荐系统提供基础。向量数据库是专门为存储和检索这些嵌入向量优化的数据库,支持高效的相似度计算和大规模数据查询,是构建智能检索系统的核心组件。召回率衡量的是检索系统找到所有相关项目的能力,高召回率意味着系统很少遗漏重要信息,这在信息检索和推荐系统中尤为重要。Top_K和Top_p是控制文本生成多样性的参数,前者限制候选词范围,后者通过概率累积动态调整候选词集合,两者共同影响生成结果的创造性和准确性。温度参数调节生成过程中的随机性,较高的温度会产生更多样化的输出,而较低的温度则使结果更加确定和保守。Memory使AI系统能够记住历史交互信息,分为短期记忆(如当前会话上下文)和长期记忆(如用户偏好存储),是实现个性化服务的关键。MCP(多选提示)通过提供候选答案让模型选择最佳响应,能有效减少模型幻觉问题。Function Call允许模型调用外部工具或API来扩展能力,比如查询天气或执行计算,极大提升了Agent的功能范围。模型幻觉是指AI生成与事实不符的内容,通过RAG、参数调优和事实校验可以有效缓解。模型微调通过在特定领域数据上继续训练预训练模型,使其适应专业任务,如医疗或法律问答。链式调用将多个处理步骤串联起来,形成连贯的工作流程,常用于复杂任务的自动化处理。Agent作为智能代理,整合了上述所有技术,具备自主决策、工具调用和持续学习能力,能够完成从简单问答到复杂问题解决的全方位任务。构建高效Agent需要合理设计工作流程,选择适当的技术栈,并通过持续优化参数和评估指标来提升系统性能。