GAIA是一个用于评估通用AI助手解决问题能力的基准测试。
例如,科技博主TechCrunch记者让Manus到附近餐馆订一份炸鸡三明治和订购飞往日本的机票,但均以系统崩溃告终,甚至无法给出有效的订购和付款链接。
不过,Manus虽在DeepSeek的光环下获得泼天的流量,但这场流量的狂欢仅持续24小时,就迎来铺天盖地的质疑和争议。
目前大多数AI代理仍需一定程度的人工干预和监督,但季逸超说,Manus“是一个完全自主的代理,弥合了构思与执行之间的鸿沟,是人机协作的下一个范例”。
首先,Manus并不完全是从零打造出来的“颠覆性产品”。有网民在测试时发现,Manus的基础结构使用的是美国企业Anthropic的Claude及阿里巴巴的通义千问等现有模型。
还有网民在实测后发现,Manus可同时管理50多个社交媒体账号,并能实时创建一系列互动内容。

有评论认为,除了性能卓越,Manus的爆火,或多或少也沾了DeepSeek崛起的光芒。

Manus联合创始人季逸超3月5日在演示视频中介绍,Manus的功能不限于提供解决方案,还能自主完成用户下达的复杂指令,如生成报告、分析财经数据等。
因此,当Manus被视为DeepSeek崛起后的又一个后起之秀,自然引来中国媒体和网民集体为它起立欢呼。
TechCrunch总结,诸如此类的自媒体错误炒作,以及邀请码稀缺造成的排他性,或许就是造就Manus获得不寻常关注的原因。从实测表现来看,Manus并没有兑现技术承诺,“似乎是一个炒作领先于技术创新的案例”。
季逸超宣称,作为全球首款通用AI代理,Manus的性能优于美国OpenAI新发布的代理应用DeepResearch和Operator,并在GAIA基准测试的比分高于DeepResearch。
更为关键的是,Manus似乎并不如宣传般的那么好用,指令无法执行、执行时间长、信息不准确等吐嘈声不曾间断。
Rowan还测试Manus进行长时间研究的能力,要求它设计一门关于AI培训的课程。花费近两小时,Manus就设计出一门涵盖八个章节的课程,包含如何使用AI工具、应用场景及提示词等。
美国AI企业Hugging Face产品负责人维特则利用Manus的代码生成功能,编写出一款飞机小游戏。他形容,这是他用过“最令人印象深刻的AI工具”。
今年1月中旬发布的AI模型DeepSeek-R1,凭借低成本和高性能重创美国科技股,还颠覆了外界对中美科技实力差距的想象,即美国AI霸主的地位不再是中国无法企及的。
AI媒体《The Rundown AI》创始人Rowan Cheung 3月8日在社交媒体X发文说,Manus基本能完美地创建一个关于他个人传记的网站,且内容100%准确。
季逸超星期一(3月10日)发视频承认,Manus调用了Claude和微调后的通义千问模型。
为了展现Manus的性能,视频还演示了三个案例:求职简历筛选、房产研究和股票分析。
从神坛跌落
有网民称:“一夜之间,Manus让硅谷无眠,让ChatGPT沉默,让DeepSeek流泪。”还有自媒体情绪激动地写道:“这是DeepSeek之后的又一个王炸”“超越DeepSeek”“炸醒了整个AI圈”“中国团队造,宇宙为我们闪烁”等。
对于市场的批评,Manus合伙人张涛曾两度发文道歉,并称目前Manus仍处于初期阶段,很多功能尚未完善。
他形容Manus是实实在在的产品,甚至宣称“中国第二个DeepSeek时刻来了”。
此外,与DeepSeek发布后立即开源不同,Manus每天只限量发放500个邀请码供外界测试。尽管Manus官方解释这是因为他们“完全低估大家的热情”、设计服务器容量有限,但不少网民质疑这是在刻意营造“饥饿营销”。
延伸阅读
以简历筛选为例,Manus能自主理解用户的要求解压文件包,并为文件包中的10份简历进行重点内容标注和候选人排序推荐;在房产研究的案例中,Manus还能结合家庭收入和孩子上学要求,在纽约筛选出安全、犯罪率低的社区,并推荐符合标准、适合购买的房产。
不用睡觉的随身秘书
还有不少券商急着开会评估Manus的影响,其中华泰证券更将Manus形容为AI代理的ChatGPT时刻。
但这则推文发出仅一天,季逸超就出面辟谣“这个视频绝对不是Manus的”。他说:“Manus是一个基于网络的AI代理,类似于OpenAI Operator/DeepResearch,而不是智能手机的VNC(虚拟网络控制台)。”
此外,由于Manus母公司北京红色蝴蝶科技公司的联合创始人肖弘和季逸超,都是90后创业家,且都没有在海外留学的经验,不少中国自媒体就将上述两人与背景相似的80后DeepSeek创始人梁文峰作对照。
甚至有团队仅用五个人三个小时,就通过拼接GPT等不同技术开发出Manus“山寨版”。搜狐科技认为,这意味着Manus的技术门槛并不高,本质仍是工具链的拼接,并非底层技术的突破。

DeepSeek突破式进展所激起的AI热情及民族主义情绪,已让市场和民间对中国科技产业的预期不断膨胀。或许,正是在这股情绪下,Manus又不断地抬高社会预期,加上产品本身的低透明度,才催生出这股有点像“狼来了”的轰动效应。
在X上还有一个戏剧性事件,知名AI网红Barsee在3月8日上传一段视频,声称Manus能同时执行50个任务,且比DeepSeek更准确,能同时处理金融交易、研究、采购等任务。
根据官网,Manus甚至能制作电子游戏,以及构思“日本七天旅行并求婚”的攻略。
还有用户发现,Manus输出的结果并不可靠。如Manus在进行游戏机市场分析时,竟遗漏了日本游戏巨头任天堂的游戏机,这是一个显而易见的错误。
有网民形容,Manus就像一名万能的随身秘书,能替你安排好所有事情,而且完全不需要睡觉。
据报道,由于Manus邀请码的稀缺性,该邀请码一度在中国的二手交易平台“闲鱼”被炒至高达10万元人民币(1万8000新元)。
测试失败后,该记者还让Manus制作一款以《火影忍者》为灵感的格斗游戏,但半小时后,系统再次报错。
一家神秘的中国初创公司凭借一款颠覆性的人工智能(AI)应用,正在全球科技圈掀起巨浪。这里说的并非今年1月震慑四方的深度求索(DeepSeek)AI大模型R1,而是一款多功能AI代理Manus。