Manus是什么?

简单来说,Manus是一个云端运行的AI智能体平台,目标是从任务输入到成果交付全流程自动化。不同于传统的聊天机器人(如ChatGPT)只提供建议或回答问题,Manus更像是一个“数字助理”,能够主动理解你的需求,分解任务,调用工具,最终直接给你一个成品。它的名字“Manus”来自拉丁文“手”,寓意“知行合一”——不仅有智慧,还能动手做事。

技术架构

多智能体协作系统

  • 规划代理:采用蒙特卡洛树搜索 (MCTS) 算法优化任务拆解效率。

  • 执行代理:调用工具(如代码编写、网页爬虫),但不能调用CS架构应用程序。

  • 验证代理:集成对抗性测试模块,检测生成结果的逻辑矛盾,如财报数据与行业基准偏差超过5%时自动触发复核。

技术理念

强调“更少结构,更多智能”,注重优质数据、强大模型、灵活架构和扎实工程的结合,而非依赖预设规则。不过,Hacker News上有开发者质疑该理念实质是“规则工程转移”(将预设规则转化为模型训练目标)。在GitHub开源模块manuscore中,发现包含12,000+条业务规则约束(如金融领域审计红线)。

持续学习与记忆

支持长期记忆存储和自主学习能力,能够根据用户交互持续优化任务执行。

性能表现

GAIA基准测试

  • Manus在GAIA测试中刷新了SOTA成绩,以86.5%准确率位列第一,超越OpenAI的Deep Research模型74.3%,在真实世界问题解决能力上表现尤为突出。

训练成本

  • 单任务运行成本约2美元(基于AWS Lambda按需计费,128GB内存实例运行25分钟,但未计入预训练模型摊销成本),仅为竞品DeepResearch的1/10(DeepResearch使用定制TPU集群,边际成本更高但固定成本分摊后可能更具规模效应),实现高性价比SOTA。

多模型驱动

  • 使用的大模型包括Claude-3.5-Sonnet、StableLM-3B-T和Qwen-72B-Chat-nt4量化版本。Manus宣传擅长调用大模型API,估计不止这些,应该是由多个独立模型协同工作,未来计划开源部分模型(如推理部分)。

功能与执行能力

云端异步处理

  • 用户可关闭设备,Manus在云端自主完成任务后发送通知,支持离线执行复杂任务。对于时长超长的任务,Manus的任务中断率在3.7%左右。如果采用Checkpointing机制每15分钟保存状态,GPU内存快照恢复存在5-8%性能损耗。

工具调用与自动化

  • 代码编写与执行:自动生成并运行代码,完成数据分析、网页创建等任务。

  • 网页爬虫与信息整合:在B2B场景中检索供应商信息,生成图表和操作建议。

  • 文件处理:解压文件、筛选简历、生成电子表格等。

覆盖40多个领域

  • 商业分析:股票市场分析、财务报告生成、销售策略优化。

  • 生活服务:定制旅行规划、保险政策对比、酒店预订。

  • 教育与人力资源:为教师制作教学材料,筛选候选人的简历并安排面试。

团队与背景

  • 创始人肖弘:33岁,华中科技大学软件工程专业毕业,连续创业者,曾开发企业微信工具“微伴助手”和AI插件Monica,后者用户超1000万。

技术整合策略

  • Monica团队以整合大模型API和快速响应市场需求见长,被部分评论称为“超级缝合怪”,但在用户体验和功能封装上具有优势。

公司战略

  • 规避国内竞争,避开与百度、阿里等大厂的直接交锋,聚焦欧美用户需求。

  • 通过整合大模型API创造差异化体验,而非追求底层技术颠覆。

争议与未来规划

技术质疑

  • The Information报道《China's AI Glue Factory》提及Monica团队“API调用次数超过代码行数”,认为Manus依赖“套壳”模式(整合现有模型)。但团队强调其在任务规划与执行层的创新,并已申请多模型路由优化算法专利(专利号US2024178902)证明其整合技术创新性。

开源计划

  • 计划开源部分技术以推动AI社区发展,重点可能是推理模型。GitHub组织显示manus-a于202417/15创建,但尚未发布仓库。

商业化前景

  • 目前仅限邀请制内测,未来可能对标OpenAI的Agent服务(如企业级高价订阅),但估计面向客户会聚焦中小型金融机构(资产管理规模1B-10B),而非OpenAI主攻的科技巨头。

🌟省心锐评:

"是AI革命还是超级缝合怪?这波把大模型当乐高拼不可耻,能2刀跑出SOTA才是真本事!但1.2w条隐藏规则暴露了AGI的终极秘密——人类终究需要“数字老妈子”