来源:智慧零售 发布时间:2025-04-23 22:01:48
几乎在昨晚苹果发布新品的同时,整个科技圈却被一个名为 Manus 的产品刷屏了。
这是全球首款真正意义上的通用 AI Agent,从官网展示的案例能够正常的看到,它能够独立思考、规划并执行复杂任务,直接交付完整成果。
比起 Claude 的 Computer use 等同样能操作多任务,或者能帮你点外卖订酒店的 Agent, Manus 可以覆盖更多领域和达成更高的执行质量。
Manus 在权威的 GAIA 基准测试中创下新纪录, 性能远超 OpenAI 的同类产品。
而 Manus 这一个名字来自拉丁语,Mens et Manus,就是 mind and hand,即手脑并用。这也是麻省理工学院的校训,以此鼓励学生将创意落地为实际成果。
创始人肖弘在 Manus 发布的前几个小时,在即刻平台上发文「高潮来临」,并分享了莎士比亚的一段书摘:
很难现在就判定 Manus 的诞生就是 AGI 的里程碑,但它有很大的可能性将让 Agent (智能体)时代真的进入「高潮时刻」。
官方宣称,Manus 不单单是一个只会聊天的对话式 AI 工具,而是一个真正的自主智能体(Agent)。
当其他 AI 可能只停留在生成想法的阶段,而 Manus 能够独立思考并采取行动。官方将其视为人机协作的新范式,甚至有可能是通向 AGI 的一个窗口。
与 Manus 同步出圈的还有一段长达四分钟的演示 demo。在这些案例中,Manus 完全自主地完成从规划到执行的全流程,展示了真正的 Agent 能力,而非简单的助手功能。
演示一开始就放了个大招,官方向 Manus 发送了一个包含 10 份简历的压缩文件,Manus 能像专业招聘人员一样高效工作。
它会先解压文件,然后逐页浏览每份简历,并记录重要信息。Manus 还能异步处理文件,这在某种程度上预示着你可以每时每刻关闭电脑,等任务完成后,它会通知你。
接着,继续向 Manus 上传 5 份简历。在认线 份简历后,Manus 给出了排名建议,并提供了候选人资料和评估标准作为参考。
由于 Manus 具有知识和记忆能力,所以下次执行类似任务时,它会直接以电子表格的形式交付结果。
另一个演示案例中,结合家庭收入情况和孩子的上学要求,让 Manus 在纽约筛选一个安全、犯罪率低的社区,并购买符合规定标准的房产。
面对这类复杂任务,Manus 同样是有条不紊地将其拆解为多个步骤,并创建详细的待办清单。
让其分析英伟达、迈威尔科技,以及台积电在过去 3 年的股票在市场上买卖的金额之间的相关性,Manus 能够最终靠 API 访问权威数据源。在验证数据后,它开始编写用于数据分析和可视化的代码。
在完成数据分析和可视化后,Manus 也能基于这一些数据创建一个网站。经用户的授权后,还能将网站部署至线上,并提供了一个可供分享的链接。
X 网友 @DavidAIinchina 也体验到了 Manus,并给出了极高的评价——「令人难以置信的用例」。
在用于评估通用 AI 助手在解决现实世界问题方面的能力的 GAIA 基准测试中,Manus 在所有三个难度级别上都达到了 SOTA 水平。
为了确保结果的可重复性,Manus 使用与其正式版本完全一致的配置进行评测。
除了基准测试,Manus 还在 Upwork 和 Fiverr 等平台上解决真实世界的问题,并在 Kaggle 竞赛中证明了自己的实力。
Manus 采用多重签名(multisig)系统,由多个独立模型驱动。今年晚些时候,官方将计划开源其中的一些模型,特别是 Manus的推理(postering)部分。
据悉,Manus AI 背后的创始人肖弘是是华中科技大学软件工程专业 2015 届校友。
毕业后,他连续创业,2015 年创立夜莺科技,推出「壹伴助手」和「微伴助手」,服务超 200 万 B 端用户,获腾讯、真格基金等投资。
这是一款号称 All-in-One 的 AI 助手,最初以浏览器插件的形式推出。
通过集成主流大模型(如 Claude 3.5、DeepSeek 等),Monica 提供聊天、翻译、文案处理等功能,用户可通过自然语言创建定制化工具,并共享至工具广场。
Monica 同样是早期以海外市场为主,用户规模破百万,成为 AI 插件领域头部产品。
今年 2 月份,Monica 的中文版(已开启内测,目前免费向国内用户开放。该版本基于DeepSeek R1 和 V3 模型打造,具备深度推理思考能力,并支持记忆功能和实时联网搜索。
他们认为,当数据足够优质、模型足够强大、架构足够灵活、工程足够扎实时,computer use、deep research、coding agent 等能力会自然涌现,无需被设计为特定的产品功能。
作为大力出奇迹的代表之一,GPT-4-Turbo 在 GAIA 公开排行榜上的平均成绩不到 7%,即使是使用复杂多智能体系统的解决方案也仅达到 40%。Manus 的表现可以说是「遥遥领先」。
创始人肖弘在最近在和张小珺的访谈中,他也提前谈到了当时还未发布的 Agent 产品 Manus 。
「看上去它确实应该就是一个 chatbot,这是很符合大家想象的,同时在应用侧却很复杂,和 Monica 不一样,光用好不同模型就挺复杂。」
肖弘还将目前 AI 应用分为两类:一是填补主要应用产品的空档的不足,二是为特定场景提供独特解决方案的应用,比如 Perplexity (提供联网搜索功能) 和 Monica (浏览器插件形态) 都属于此类,它们填补了现有产品留下的空白。
而模型驱动的新场景这类应用,主要出现在图片和视频领域,直接由模型技术的进步驱动。像 Pika 和 Runway 等产品利用模型能力创造了新的应用场景。
有用户调侃 Manus 是「极致的套壳就是牛逼」,实际上肖弘并不忌讳让用户清楚自己的产品用的是别人的模型。早在去年,他就把 Monica 比作消费电子科技类产品,并把 ChatGPT 的 Logo 打在官网。
APPSO 在 2024 年年初曾作出一个预测:大模型将成为智能手机新的操作系统,自然用户界面(Natural user interface, NUI )将逐步替代现有的图形用户界面(GUI)。
去年我们在很多手机的发布会上都看到类似的案例。 vivo 发布会展示可以 AI 订餐的 「Phone GPT」,华为鸿蒙的小艺和意图框架,还是荣耀的 YOYO 智能体,以及智谱的 AutoGLM,核心都是一样的:
让 AI 模仿人类的 Plan-Do-Check-Act(计划-执行-检查-行动)循环 ,从而像人类那样去操作设备。
智谱 AI CEO 张鹏之前提到,目前的 Agent 能力更像是在用户和应用之间,增加一个智能的调度层,链接所有应用甚至是所有设备。
这可以看做是大模型通用操作系统 LLM-OS的一种雏形,将对人机交互形式产生极大的影响。OpenAI 创始成员、AI 技术大牛 Andrej Karpathy 也曾多次谈到大语言模型操作系统(LLM OS)。
他认为大模型某一些程度来说就是一种新的计算机和操作系统,它可以连接各种软件和硬件,以及所有模态信息组成的外设,并通过函数调用执行各种任务。
传统操作系统中,你需要围绕 CPU 构建一堆外设,比如鼠标和键盘、磁盘存储、以及缓存空间等。
而在 LLM OS 中,大模型本身就是中央处理器。I/O 外设也不再是鼠标和键盘,因为 LLM 可以兼容更多模态的数据输入和输出。同时大模型调用的外部工具也将从传统软件升级为智能体工具。
其中跨应用的操作是最重要的一环,这在某种程度上预示着 Agent 能实现更复杂的自主连贯操作,也可能走向真正的商业化落地。至于各家网络公司提供的服务能否打通,可能是未来实现这种交互最大的障碍。
不过现在很多 AI 助手实现代操作的方式,其实就是调用手机的无障碍功能 (accessibility features) 的权限,来控制屏幕点击。
Manus 的出现,意味着 Agent 模式下的 AI 能够理解需求后独立工作,直到任务完成。这无疑是人机交互领域的一大步,它让我们正真看到了 AI 从工具向伙伴转变的潜力。
但要说我们已一只脚迈入了 AGI 大门,也还为时尚早。肖弘自己也提到,早期的 Agent 更像是「功能机」,要一直迭代和完善。目前的 Agent 仍需依赖于模型能力的提升,以及更完善的虚拟环境支持,才能真正胜任各种长尾任务。
如果类比智能驾驶,大概也相当于从 L2 级升级到 L3 级的辅助驾驶。虽然 Manus 在 GAIA 基准测试中表现出色,但这并不代表它已具备通用AI的全部特征。通往 AGI 的道路依然漫长,要解决模型能力、自主学习、任务泛化等多重挑战。
但因为有了 Manus 在自主性与通用性上的突破,通往 AGI 的大航海中,又多了一颗照亮我们的星。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更精彩内容第一时间为您奉上。
Manus的“真正”优势,参考如下: 功能: Manus自称解放双手,结果生成PPT模板像半成品盲盒——用户开箱后还得手工打磨,说好的全自动变全自助。DeepSeek虽不直接甩文件,但大纲逻辑缜密能直接给老板汇报,实习生和总监的差距一目了然。 营销: GAIA榜单刷榜时Manus重拳出击,实际落地时官网访问堪比春运抢票。反观DeepSeek开源生态,数学解题丝滑如德芙,用户疑惑:到底谁在深度求索? 格局: Manus高喊颠覆办公却暗搓搓卖邀请码,像极了健身房推销年卡的私教。DeepSeek直接开源大模型底层代码:当Manus还在PPT里造梦,DeepSeek已把论文写成行业标准。
随着中美贸易冲突的升级,两国之间大宗商品的贸易流向正逐渐发生明显的变化:以大豆为例,分析人士指出,巴西有望进一步巩固中国最大大豆进口来源国的地位。美国大豆种植户警告,美国大豆可能将永远失去中国市场。
有记者问:据多家报道,消息的人偷偷表示,特朗普政府正准备在关税谈判中向其他几个国家施压,要求其他几个国家限制与中国的贸易往来,以换取美方关税豁免。请问发言人对此有何评论?答:我们注意到有关报道。
玩具业是美国遭受关税冲击最严重的行业之一。美国有线电视新闻网(CNN)指出,对中国生产的玩具加征高额关税,意味着曾经物美价廉的玩具将变成“奢侈品”。美国商务部多个方面数据显示,2024年美国进口了价值177亿美元的玩具,其中75%来自中国。
近日,世贸组织总干事恩戈齐·奥孔乔-伊维拉被问到有关美国和世贸组织关系的问题时,笑谈这是一个“五年来一次”的问题。记者:“(美国)共和党众议员提出动议,要求特朗普政府让美国退出世贸组织,美国现在还在“船上”吗?如果美国退出,世贸组织如何继续运作?
(央视财经《第一时间》)始于1900年的美国纽约国际车展,每年都吸引着来自世界各地的大量客商。但今年车展前夕,美国政府的关税政策引发业内震荡。在16日车展开幕的当天,记者来到了车展现场,发现在“关税阴影”下,整个汽车行业似乎弥漫着焦虑情绪。
浙江宁波慈溪是我国三大家电生产基地之一,其中出口美国的占比约16%。慈溪一家家电企业负责人和记者说,他们跟美国客户签署协议时,对方支付了30%的定金;而同规格洗衣机、冰箱的零部件通用性很强,能达到70%。因此,即便美国客户违约,他们也可将产品重新翻包后再次销售。
京东:有平台强迫外卖员“二选一”,接京东平台秒送订单将被封杀,奉劝某平台好自为之,京东将给予被封杀骑手足够单量,对超时20分钟以上的外卖全免单,优先为骑手的对象安排工作。(剪辑:鲲鹏)
美国以关税手段胁迫其他几个国家限制对华经贸合作?商务部回应: 绥靖换不来和平,若任何一方牺牲中方利益达成交易,将坚决对等反制
然而在日常使用中,个别人员由于保密意识缺乏、风险感知不足,使得这一快捷助手变成了泄露国家秘密、突破保密防线的“推手”。
△美国加州州长纽森(资料图)美国人口和经济规模第一大州加利福尼亚州州长纽森当地时间16日宣布就关税问题起诉特朗普政府。他批评特朗普政府滥用关税政策的行为“违法”,给美国经济导致非常严重混乱和破坏。加州成为全美第一个就关税问题起诉特朗普政府的州。