
上周,Anthropic推出了他们的最新Agent产品ClaudeCowork。刚上线就被大伙儿一通狂吹,什么AGI真神降临,打工人的末日要来了。。。上次见到此等盛况,还是在Manus。

世超赶紧去官网翻了翻,发现这ClaudeCowork好像是有点东西。
什么归纳桌面文件,总结会议记录,还能深度研究直出报告,整理数据资料做PPT。。。总之就是啥活儿都能干,难搞的办公杂活儿它都能搞。

各种社交平台上,更是清一色的好评买家秀:
“ClaudeCowork两分钟改变了我的人生。”
“我快哭了,ClaudeCowork爱你哟!”

更绝的是,Anthropic还自爆Cowork内含100%AI代码,没有一点人工,只用10天就搓出来了。
你说这谁不想看看,一致好评的纯血AIAgent到底有多神?
所以,这回世超斥巨资100刀深度了体验一波ClaudeCowork,顺手和付费版Manus做了个对比。用完我只想说,贵有贵的道理,但真不至于这么贵。。。
先夸一波ClaudeCowork的界面设计,还是很简洁舒适的。右侧边栏会显示任务进行到哪一步,任务过程中生成的工作文件也可以随时访问。不像一些Agent只能慢悠悠出个结果,AI在后台摸了半天鱼都不知道。

吹完界面,世超要上点真东西了。我们准备测一测它官网给出的四大示例,包括数据分析、文档创建、研究分析、文件和文档管理。
先是数据分析和文档创建,这俩功能放年末有啥用处,大伙儿懂得都懂。每年这个时候,估计不少差友都得来点年终总结,这玩意儿简直是对记忆力、语言组织和Excel熟练度的三重考核。
但现在,ClaudeCowork就擅长干这类数据收集整理,技术含量极低,纯纯麻烦浪费时间的活儿。

比如世超让它统计总结一下2025年差评君B站的视频数据,再把Excel直接喂我嘴里。
Cowork先向我申请了浏览器操作权限,然后就像咱平常收集资料一样,通过MCP浏览了一会儿差评君首页。

十五分钟后,它默默返回了一个Excel,里面的数据不仅包含一整年的所有83个作品,而且每条播放量、点赞、弹幕数、评论、投币、收藏、转发,全对。
世超截一部分给大伙儿看看:

这种长程、多条目的任务,其实正是大多数Agent最容易翻车的地方。因为这种任务考验的不是Agent聪不聪明,而是它能不能在长时间里记得住目标、对得齐细节、还一次都不出错。
我们又用Manus1.6Max试了试同样的任务,结果Manus只统计出了75个视频的相关数据,总数都对不上,别的更别提了。

接下来,世超体验了一下大伙儿强推的文件文档管理。不少人都说用它一口气删了几千个截图,清理了桌面一堆乱麻,救大命了。
作为一个究极J人,世超的桌面本来是相当干净的。只不过今天为了测评Cowork多出来不少录屏,系统默认按时间命名,堆一起实在有点难绷。

这回,我先让Cowork把三分钟以下的废片删掉,初筛一下。这里向系统申请删除权限花了两分钟,全程三分钟左右。

再把录屏按任务内容重命名,只要一分半,素材立刻拥有姓名。

说实话,录屏一多,一个个打开辨认重命名,是相当麻烦的事儿,这活儿世超平常十分钟都整理不完。
在这里和Anthropic商量一下,如果一个月10块,我愿意专门为了Cowork这个功能开连续订阅嗷。
最后,世超又测了测Cowork的研究分析,掏出经典旅游规划问题,指定时间地点,让它推荐机酒和路线。
八分钟不到,Cowork把结果整理出了一份docx文档。总的来说,行程规划没啥问题,比Manus要更细一点。

但不幸的是,在机酒价格上Cowork还是翻车了。
它的信源出现了问题,价格全是按日常价算的。而实际上春节的机票已经涨到了4000以上,酒店也普遍标低了200到400。

相比起来,Manus的行程预算偏高,但更接近春节出行的真实价格。


世超又测了一些其它的例子,比如生成30页PPT,写个三维弹球游戏,或者总结最近AI领域的新闻,只能说偶尔有错误,但大部分任务中规中矩地完成了,没有很惊艳。
不过,放在今天这个整体还不太成熟的Agent赛道里,它确实已经算是完成度靠前的那一档了。

说到这里,其实一个所有Agent都绕不开的尴尬问题已经初现端倪了——不是它能不能干活,而是你敢不敢信它的结果。
哪怕ClaudeCowork在同行里已经算很优秀的产品,世超用起来依然提心吊胆,因为你很难信任一个神一刀鬼一刀Agent。
尤其是Agent和普通大模型还不太一样。我们期待它交付的,不是原始材料,而是已经被高度整理、压缩,甚至直接给出结论的成品。一旦中间某个环节出了问题,用户往往很难逐条核验,我甚至不知道该从哪一步开始怀疑。
于是就出现了一个很微妙的状态,Agent的确帮你省了做任务的时间,但你又不得不花更多精力去检查和验证。

那么问题来了,Agent炒了这么久,为什么一直做不好?
原因其实也不复杂。今天的大多数通用Agent,本质上做的事情都差不多:调用工具、执行步骤、读取结果,再把这一切包装成一份看起来很完整的交付物。这件事,对AI来说并不算难。
真正困难的,是AI能不能在长任务、复杂分支和大量细节中,始终对齐目标、不丢状态、不出幻觉,这也是为什么很多Agent看着很忙,结果却总差一口气。
而Cowork能比其他Agent稍微稳一点,核心原因也不神秘。它底层用的是自家专门为写代码、跑流程、盯细节打磨过的ClaudeCode。这种模型本身就更擅长处理长上下文、明确约束和多步骤执行,Agent只是把这点优势放大了而已。

所以你会发现,Agent的门槛并不高,大家都能做;但Agent的上限也不高,大家也都做得不太好。
在这样一个背景下,Anthropic把Cowork卖这么贵,多少有点犯罪了。
很快啊,开源社区给出了回应,专治各种漫天要价。GitHub上先是冒出了一个Openwork,目标很明确,要做一个开源、可扩展的Cowork风格系统,刚开源就冲上了HackerNews热榜第一。紧接着又来了AionUI,免费、开源、支持多模型,功能差不多,还不要钱。

结果最先扛不住的反而是Anthropic自己。Cowork上线不过一周,就从100美元Max会员独占,下放到20美元Pro也能用,狠狠背刺了一波世超。
所以接下来,世超也会继续把这些开源方案跑一遍,给大家做一轮横向对比。看看在Agent这条路上,这钱花得到底值不值,又有多少是真的冤。
撰文:莫莫莫甜甜