Cohere Command R+:企业级可扩展大模型

发布于:2024-04-20 ⋅ 阅读:(13) ⋅ 点赞:(0)

Command R+ 是一种最先进的 RAG 优化模型,旨在处理企业级工作负载,并首先在 Microsoft Azure 上提供

今天,我们推出了 Command R+,这是我们最强大、可扩展的大型语言模型 (LLM),专为在实际企业用例中表现出色而构建。Command R+ 加入了我们的 R 系列 LLM,专注于平衡高效率和高精度,使企业能够超越概念验证,并通过 AI 进入生产。

NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割 

Command R+ 与我们最近推出的 Command R 模型一样,具有 128k 令牌上下文窗口,旨在提供一流的功能:

  • 高级检索增强生成 (RAG) 与引用以减少幻觉
  • 10 种主要语言的多语言覆盖,支持全球业务运营
  • 工具用于自动化复杂的业务流程

我们的最新模型建立在 Command R 的关键优势之上,并进一步全面提高了性能。Command R+ 在可扩展市场类别中优于类似模型,并且在关键业务关键功能上与价格高得多的模型竞争。在实现这一目标的同时,我们始终致力于保护数据隐私和安全。

随着我们继续为全球企业社区服务,我们很自豪地宣布与 Microsoft Azure 进行新的合作,以加速企业 AI 的采用。

Microsoft Azure AI 平台 CVP John Montgomery 表示:“与 Cohere 的合作突显了我们致力于引领 AI 革命的决心,将创新的 Command R+ 模型引入 Azure AI。“这种合作关系体现了我们致力于提供一套全面的人工智能工具的承诺,使企业能够在遵守最高安全性和合规性的同时实现更多目标。我们共同为企业人工智能的可能性设定了新的基准,促进了技术增强人类能力和创新的未来。

(左)Azure 上可用模型在三个关键功能上的性能比较:多语言、RAG 和工具使用。 性能是下图中列出的基准模型得分的平均值。 (右)比较 Azure 上可用模型的每百万个输入和输出令牌成本。

从今天开始,开发人员和企业可以首先在 Azure 上访问 Cohere 的最新模型,并且很快将在 Oracle 云基础设施 (OCI) 以及未来几周内的其他云平台上提供。 Command R+ 也将立即在 Cohere 的托管 API 上提供。

甲骨文应用开发与战略集团副总裁 Miranda Nash 表示:“企业显然正在寻求高度准确和高效的人工智能模型,例如 Cohere 最新的 Command R+,以投入生产。” “Cohere 的模型集成在 Oracle NetSuite 和 Oracle Fusion Cloud 应用程序中,正在帮助客户解决实际业务问题并提高财务、人力资源和营销等领域的生产力。”

1、行业领先的 RAG 解决方案

RAG 已成为企业采用LLM并使用自己的专有数据对其进行定制的基础构建块。 Command R+ 建立在 Command R 在 RAG 用例中的卓越性能之上。

Command R+ 针对高级 RAG 进行了优化,可提供企业级、高度可靠且可验证的解决方案。 新模型提高了响应准确性,并提供了减轻幻觉的内联引用。 此功能可帮助企业利用人工智能进行扩展,以快速找到最相关的信息来支持跨业务职能部门的任务,例如财务、人力资源、销售、营销和客户支持等一系列部门的任务。

(左)使用结合文本流畅性、引用质量和整体实用性的整体评分方案得出人类面对面偏好结果。 引用是在与源文档的一大块相关的摘要内的句子级别上进行测量的。 我们使用了由 250 个高度多样化的文档和摘要请求组成的专有测试集,以及类似于 API 数据的复杂指令。 基线模型经过广泛的提示设计,具有很少的镜头提示(Sonnet)和先进行两步总结,然后进行引文插入(GPT4),而 Command R+ 使用我们的 RAG-API。

(右)由各种模型支持的多跳 REACT 代理的准确性,可以访问从维基百科(HotpotQA)和互联网(Bamboogle 和 StrategyQA)检索的相同搜索工具。 HotpotQA 和 Bamboogle 的准确性是通过提示评估者(Command R、GPT3.5 和 Claude3-Haiku 以减少已知的模型内偏差)的三向多数投票来判断的,我们使用人工注释对 1000 个示例子集进行了验证。 StrategyQA 的准确性是使用以是/否判断结尾的长格式答案来判断的。 我们使用 (Shin et al. 2023)、(Press et al. 2023) 和 (Chen et al. 2023) 的测试集。

2、使用工具自动化复杂的业务工作流程

大型语言模型的一个主要承诺是它们不仅能够摄取和生成文本,而且能够充当核心推理引擎:能够做出决策并使用工具来自动执行需要智能来解决的困难任务。 为了提供此功能,Command R+ 配备了工具使用功能,可通过我们的 API 和 LangChain 访问,以无缝地自动化复杂的业务工作流程。

我们的模型系列与工具相结合,可用于解决重要的企业用例,例如自动保持客户关系管理 (CRM) 任务、活动和记录最新。 此功能有助于将我们的模型应用程序从简单的聊天机器人升级为强大的代理和研究工具,以提高生产力。

Command R+ 中的新增功能现在支持多步骤工具使用,允许模型在多个步骤中组合多个工具来完成困难的任务。 Command R+甚至可以在尝试使用工具但失败时进行自我纠正,例如在工具中遇到错误或故障时,使模型能够多次尝试完成任务并提高成功率。

我们使用 Microsoft 的 ToolTalk (Hard) 基准 (Farn & Shin 2023) 和 Berkeley 的函数调用排行榜 (BFCL) (Yan et al. 2024) 评估会话工具使用和单轮函数调用功能。 对于 ToolTalk,预测的工具调用是根据真实情况进行评估的,总体对话成功指标取决于模型调用所有工具调用并避免不良操作(即具有不需要的副作用的工具调用)的可能性。 对于 BFCL,我们使用 2024 年 3 月的版本,并在评估中包含了错误修复(所有模型都从中受益),并报告了可执行子类别的平均功能成功率得分。 我们通过额外的人工评估清理步骤验证了我们的错误修复,以防止漏报。

3、全球业务运营的多语言支持

Command R+ 旨在为尽可能多的人、组织和市场提供服务。 在与公司的讨论中,我们遇到了对多语言功能的巨大需求,这些功能可以帮助组织更无缝地跨地区和文化工作。 这就是为什么我们构建 Command R+ 以擅长全球商业的 10 种主要语言:英语、法语、西班牙语、意大利语、德语、葡萄牙语、日语、韩语、阿拉伯语和中文。

这种多语言功能使用户能够从大量数据源生成准确的响应,无论其母语是什么,帮助我们为地理位置不同的全球公司提供产品功能和工具。 我们期待看到世界各地的企业尝试我们的 Command R 型号系列来为其业务运营和产品提供动力。

FLoRES(法语、西班牙语、意大利语、德语、葡萄牙语、日语、韩语、阿拉伯语和中文)和 WMT23(德语、日语和中文)翻译任务的模型比较。

Command R+ 不仅是一个强大的多语言模型,而且 R 系列模型还配备了一个分词器,它对非英语文本的压缩效果比市场上其他型号使用的分词器要好得多,能够实现高达 57% 的成本降低 。

比较 Cohere、Mistral (Mixtral) 和 OpenAI 标记器针对不同语言生成的标记数量(作为 Cohere 标记器生成的标记数量的倍数)。 Cohere 分词器生成的表示相同文本的标记要少得多,尤其是非拉丁脚本语言的减少量特别大。 例如,在日语中,OpenAI 标记生成器输出的标记数量是 Cohere 标记生成器的 1.67 倍。

4、供货情况和定价

Cohere 与所有主要云提供商以及受监管行业和隐私敏感用例的本地云提供商合作,以使我们的模型普遍可用。

要了解你的公司如何开始在生产规模上部署 Command R+,请联系我们的销售团队。

我们最新的 Command R+ 模型现已在 Cohere 的演示环境中,为任何人提供通过简单的聊天界面测试模型的实践体验。

Cohere API Pricing $ / M input tokens $ / M output tokens
Command R $0.50 $1.50
Command R+ $3.00 $15.00

5、我们对数据隐私和安全的承诺

凭借 Command R 型号系列,我们始终致力于保护客户数据、隐私和安全,帮助企业安心使用我们的 AI。 我们始终以数据隐私为核心构建产品,并为客户提供额外的保护,包括针对侵权索赔的版权保证。 除非客户希望我们这样做,否则我们不会访问客户的数据。 我们提供私人LLM部署和选择退出数据共享的选项。

6、公司评价

“许多组织现在专注于从生成式人工智能实验转向规模化实施。 通过我们的基础模型定制服务,埃森哲正在帮助客户将企业数据情境化,以推动整个企业的有形价值。”埃森哲首席人工智能官关兰表示。 “Command R+ 等能够处理大型生产工作负载的新模型的推出将为我们的客户提供新的机会,我们期待利用 Cohere 的功能来帮助我们的客户根据成本、性能和准确性优化生成式 AI,以满足他们的特定需求 ”。
“规模是开发、应用和评估人工智能的数据基础。在我们帮助企业简化优化和部署人工智能解决方案的过程中,我们期待看到 R+ 将如何帮助客户在保持性能的同时优化 TCO。Command R+ 的新 RAG 多语言功能将使我们能够在其他用例中部署 Cohere。我们很高兴继续发展与 Cohere 的合作伙伴关系。” –Arun C Murthy,Scale AI 首席产品和技术官
“使用 Cohere 的模型构建使我们能够准确回答客户有关全球就业法、工资法规和税收的问题。 借助 RAG 优化的 Command R+ 模型,我们可以利用我们广泛的专有数据库构建一个解决方案,提供准确且可验证的信息,同时从成本角度来看可扩展。” –Willson Cross,无边界人工智能首席执行官
“我们很高兴与 Cohere 合作,将 Command R 和 Command R+ 深度集成到 LangChain 生态系统中。 Command R+ 在 RAG 和 Tool Use 方面是一个功能异常强大的模型,这是我们看到开发人员使用 LangChain 构建的两个顶级功能。” ——Harrison Chase,浪链联合创始人兼首席执行官
“在 Microsoft Azure 上推出 Cohere 的 Command R+ 模型对 Atomicwork 来说是一个巨大的胜利,因为它有助于加速我们为企业客户提供的现代服务管理服务。现在,我们可以为客户提供由 Cohere 的 Command R+ 模型功能支持的一流企业人工智能。 我们的客户可以在值得信赖的云平台上改善他们的数字工作场所体验并提高企业生产力。” ——Vijay Rayapati,Atomicwork 联合创始人兼首席执行官

原文链接:Command R+企业LLM - BimAnt