大语言模型 14 - Manus 超强智能体 开源版本 OpenManus 上手指南

发布于:2025-05-21 ⋅ 阅读:(17) ⋅ 点赞:(0)

写在前面

Manus 是由中国初创公司 Monica.im 于 2025 年 3 月推出的全球首款通用型 AI 智能体(AI Agent),旨在实现“知行合一”,即不仅具备强大的语言理解和推理能力,还能自主执行复杂任务,直接交付完整成果。

什么是 Manus?

“Manus”一词源自拉丁语“Mens et Manus”,意为“心智与双手”,强调其不仅能思考,还能动手执行。与传统 AI 助手(如 ChatGPT)主要提供建议或回答问题不同,Manus 能够独立完成从任务规划到执行的全过程。例如,用户只需输入一句话,Manus 就能自动完成数据分析、代码编写、文档生成等任务,真正实现从想法到成果的闭环。

Manus AI

https://manus.im/

在这里插入图片描述

这里放几个用户的案例:
● https://manus.im/share/jr5CKBMJJZDxvU2S5VdZLw?replay=1
● https://manus.im/share/c3onakN6Iajcm1Vt1xAVG7?replay=1
● https://manus.im/share/xFgpHb15vKqfRPWIs3JJPJ?replay=1

应用场景

  • 数据分析与可视化:处理上传的数据,生成图表、趋势分析或仪表盘。
  • 市场调研:搜索网络信息,整合数据并输出结构化分析结果。
  • 旅行规划:根据用户偏好生成详细行程和旅行手册。
  • 代码编写与运行:生成代码并测试,提供可执行程序或脚本。
  • 文件操作与整理:解压文件、对比文档并生成比较表格。
  • 网页生成:根据需求设计并输出展示型网页。
  • 多任务并行处理:支持同时处理多个任务,提升工作效率。

GAIA 基准

Manus 采用多智能体(Multiple Agent)架构,包含规划代理、执行代理和验证代理等模块,协同工作以提升任务处理效率。每个代理可能基于独立的语言模型或强化学习模型,彼此通过 API 或消息队列通信。此外,Manus 支持异步任务处理,用户在提交任务后无需持续监督,系统会在任务完成后通知用户。

GAIA 是一个用于评测通用AI助手的基准测试,衡量它们在不同难度等级(Level1、Level2、Level3)的表现。

  • 图片来源:https://manus.im/
  • GAIA:https://openreview.net/forum?id=fibxvahvs3

在这里插入图片描述

Agent

在这里插入图片描述

目前问题

如下图所示,解决问题的泛化能力方面,当前主要的Agent产品仍然距离通用的Agent有一定的差距:
● 任务规划方面:目前主要是基于成熟的任务流程进行复现,或基于训练数据对任务进行简单拆分
● 工具使用方面:Agent目前主要按照人类部署进行流程化操作,工具主要是通过API来进行(通过Function Calling 或 其他方式)

在这里插入图片描述

多Agent协同

主要是企业协同,从Agent落地方式看,可以分为:
● 单 Agent 部署
● 多 Agent 交互
● 人-Agent 交互

其中,多Agent交互 与 人-Agent交互 协同通过不同的方式给 Agent 反馈,有助于 Agent 不断强化解决问题的能力。更进一步的模拟Agent社会框架中,在个人层面Agent表现出计划、推理和反思等内在行为,以及涉及认知、情感和性格在内的个性特征。

在这里插入图片描述

AGENT AI: SURVEYING THE HORIZONS OF MULTIMODAL INTERACTION

论文地址:https://arxiv.org/abs/2401.03568
在这里插入图片描述

OpenManus

基本介绍

OpenManus 是一个开源的通用型 AI 智能体项目,旨在复刻并优化 Manus 的核心能力,为开发者和研究者提供无需邀请码、本地部署的智能体解决方案。该项目由 MetaGPT 团队开发,采用模块化设计,支持多种语言模型和工具链,能够执行代码、处理文件、搜索网络信息等复杂任务。

核心功能与架构

OpenManus 的架构包括多个协同工作的智能代理(Agents),如:

  • 主代理(Manus 主体):协调各子代理的工作流程。
  • 规划代理(PlanningAgent):将复杂任务拆解为可执行的子任务。
  • 工具调用代理(ToolCallAgent):负责调用外部工具,如搜索引擎、代码执行器等。

项目地址

项目组:“Manus 非常棒,但 OpenManus 无需邀请码即可实现任何创意 🛫!”
所以有了这个开源项目:
● https://github.com/mannaandpoem/OpenManus
● https://openmanus.github.io/

在这里插入图片描述

准备环境

克隆项目

git clone https://github.com/mannaandpoem/OpenManus.git
cd OpenManus

(注意官方要求的 Python 版本是 3.11 及以上)
在这里插入图片描述

虚拟环境

创建虚拟环境,防止干扰环境:

python3 -m venv env
source env/bin/activate

安装依赖

安装项目的依赖:

pip install -r requirements.txt

有些包安装不上,要注意观察:
在这里插入图片描述

额外补充一下 playwright,这个框架是用来启动浏览器的:

# 如果没有 playwright 的话,需要先 pip install playwright
playwright install

安装需要等待比较长的时间:
在这里插入图片描述

配置文件

cp config/config.example.toml config/config.toml

默认配置如下:
在这里插入图片描述
修改我们的配置如下,需要注意配置 [llm] 和 [llm.vision] 的部分。
在这里插入图片描述

启动程序

# 对话式的
python main.py
# 官方提供的新方式(但不稳定)
python run_flow.py

启动结果如下:
在这里插入图片描述


网站公告

今日签到

点亮在社区的每一天
去签到