软肌肉、DNA驱动和AI大脑：新技术能颠覆机器人的“恐怖谷”吗？

知新了了 2天前阅读数 1 #科技

随着软机器人、基因记忆库和人工智能认知的出现，制造类生命机器的全球军备竞赛正在加速。

半个世纪以来，类人机器人在科技地平线上熠熠生辉，但每一个新的原型仍然会引发森正弘的“恐怖谷”。当一台机器看起来很像人类，但又不完全像人类时，我们的大脑会感到威胁，很不舒服。制造商们知道，打败这种本能是进入巨大市场的代价：工厂里有24小时的机器人工人，酒店大堂里有不知疲倦的迎宾员，老年护理病房里有温柔的机械护士。

然而，美学只是四大工程挑战之一。一波新的研究 —— 从硅胶面部马达和柔软的气动“肌肉”到基于DNA的记忆和多模态人工智能 —— 旨在缩小硅和生物学之间的每一个差距。问题不再是机器人是否会到来，而是它们的高科技肢体需要多长时间才能同步。

为什么复制一个微笑比制造一枚火箭还难

Realbotics在CES上公布的Arya和Melody展示了脖子以上的16个微型伺服器。它们一起执行“微表情”，非常微妙，你几乎不会注意到：眉毛抬起半毫米，眼睛盯着房间另一边的行人看40毫秒。每个虹膜中嵌入的摄像头提供计算机视觉软件，该软件可以将图像直接传输到开源的大型语言模型中，今天是ChatGPT，明天可能是另一个提供商，因此机器人可以用特定品牌的脚本回答问题。

现实机器人的首席设计师约翰·伯洛尼坚持认为克制是秘密：“大多数建造者过度活跃。真正的人类几乎不会移动他们的脸，除非情绪飙升。”通过在狭窄的生理范围内保持动作，Arya避开了恐怖谷，每次都能保持几分钟平易近人的眼神交流。

热情好客，魅力四射

到目前为止，Realbotics公司将其逼真的头部展示给了展览厅、游轮大厅和豪华酒店。租来的机器人可以站在展台上，与参观者目光相接，用任何语言进行技术上完美的推销。这听起来可能很无聊，但营销机构已经每周支付2万美元，在大型贸易展上聘请“品牌大使”。

如果一个价值6万美元的机器人能在几年时间里吸引相当多的人群，而且从不要求加班，那么在清洁或仓库工作变得经济之前，它可能会比人类在耀眼、高流量的利基市场上更便宜。

后Furby时代的小玩意和与孩子相处的道德观

大型电子产品公司也在为儿童调整同样的配方，不过采用了更安全的卡通造型。LG的Storyteller和TCL的Amy就像巨型的furby。他们使用LLaMA或GPT衍生物，在睡前大声朗读、拼写测验或闲聊。隐私专家退缩了：托儿所里总是监听的摄像头会带来明显的监控风险。

发展心理学家警告说，教幼儿向云服务倾诉会引发更深层次的社会问题。业内人士猜测，更大的早期市场是渴望新鲜事物的成年人，而不是代父母，这将引导未来的“拥抱机器人”从托儿所转向老年人陪伴或互动博物馆导游。

软机器人：用“肌纤维”取代活塞

即使完美的皮肤也掩盖不了笨拙的身体机能。大多数人形框架依靠电动马达或液压活塞 —— 耗电量大、重量重、在人周围很危险。软机器人将金属替换为充气波纹管和凝胶填充管，模拟肌肉组织。德国的Festo在这一领域处于领先地位。它的BionicMotion手臂重量只有传统协作机器人的四分之一，但使用加压空气可以摆动3公斤的有效载荷。

夹上触手夹持器，手臂就可以拿起鸡蛋；换一个五指仿生软手，它就能打开瓶盖或敲击键盘键。在医院里，同样的顺应性可以让机器人在不产生擦伤的情况下重新安置病人，这是现代钢铁外骨骼无法安全地完成的工作。

波兰的克隆机器人公司将这一概念推向了全身“原型克隆”。透明的硅胶皮肤暴露出一个MyoFiber致动器网络，由一个500瓦的泵加压，像人类心脏一样小，通过人工动脉推动100 psi的液体。

病毒实验室录像显示，无实体的机器臂在天花板上不祥地抽搐。无论是否令人不安，该演示突出了亚毫米级手指的灵巧性，这是刚性伺服系统仍然难以匹敌的。分析人士预计，到2033年，软机器人市场将达到140亿美元，这主要是由结合了精细触摸和人类级别触摸的任务推动的。

DNA是终极固态驱动器

所有这些细微差别都需要数据，TB级的触觉地图、视觉体验和语言模式。板载固态硬盘增加了重量；远程云增加了延迟并消耗了无线电源。微软和华盛顿大学分子信息系统实验室认为，DNA可以解决这两个问题。

将二进制编码为基数A-T-C-G，理论上一克可以存储215 PB。这意味着一个方糖大小的小瓶可以容纳比当今最大的服务器场更多的数据。读取和写入DNA的成本仍然是每TB 8亿美元，需要几天的时间，而不是几毫秒，但长期的激励是巨大的：机器人胸部内置的轻量级室温数据库。

多模式人工智能与通用智能之路

硬件本身不能产生流畅的行为。今天的大型语言模型可以开玩笑，但在空间推理方面却失败了；视觉模型标记对象，但不能讨论意图。下一个飞跃是多模态人工智能，这种软件可以将文本、图像、声音和本体感觉信号一起吸收，形成一个统一的世界地图。Meta的Ray - Ban智能眼镜提供了一种一瞥：指着一个不熟悉的纪念碑，问“这是什么？”，这款眼镜会拍下照片，对其进行分析，运行LLM程序，然后说出答案。

将这条管道扩展到一个完整的人形，跟踪每个手指上的数十个关节、麦克风和扭矩传感器，朝着通用人工智能（AGI）的方向发展，但电力需求飙升。OpenAI的山姆·奥特曼认为AGI将在2028年实现；批评人士指出，人脑在20瓦的功率下就能实现百亿亿次的计算，而美国的El Capitan超级计算机需要40兆瓦的功率才能完成同样的计算。

经济学：机器人什么时候能收回成本？

特斯拉承诺其擎天柱机器人“很快”将以3万美元的价格上市。一名深圳装配线工人每年的成本为4000美元，而且从不需要更新固件。除非机器人在速度和可靠性上超过人类，或者一些国家面临严重的劳动力短缺，否则首席财务官们将会停滞不前。因此，早期采用者的目标是危险或偏远的任务，如石油钻井平台泄漏巡逻、空间站维护和矿山救援。

酒店迎宾员和豪华礼宾员的角色可能会随之而来，因为魅力会带来额外的好处。如果小型模块化反应堆（SMR）的燃料循环瓶颈得到解决，数据中心的电力可以相应地扩展，那么工厂或物流的大规模替代将等待更便宜的执行器、紧凑型动力系统和完全本地化的人工智能推理，这可能会在本世纪30年代初实现。

挥之不去的山谷和穿越它的策略

进化让我们有能力探测异常。对我们来说，陌生人僵硬的步态或毫无生气的目光可能是疾病的信号。现实机器人用高帧率的眼睑延迟和微小的扫视来对抗；汉森机器人公司雕刻半透明的“橡胶”皮肤，伸展在伺服阵列上，模仿脸颊脂肪。

一些研究人员建议完全跳过山谷，采用程式化的美学，就像皮克斯一样，依靠表演而不是模仿来赢得信任。实地研究表明，医院病人接受柔软的塑料机器人，只要它们说话温和，小心地处理四肢，即使“脸”只不过是动画的LED圆圈。

从筒仓到合成

生物灵感正在重塑每一层：肌肉般的驱动器、神经式的计算、基因组大小的存储。然而，每个项目的进展都是孤立的。当软体实验室、DNA档案保管员和多模态编码员合并成一个集成堆栈时，真正的突破将会到来，一个公司或联盟能够大规模地提供轻量级、数据密集、感知灵敏的类人机器人。这种融合可能首先出现在渴望制造业回流的高工资国家或面临长期护理人员短缺的老龄化社会。

一个生物和机器混合的未来

清洁公园和照顾老人的机器人还需要10年甚至更长时间，但中间步骤很快就会到来：气动手臂将生菜分拣得没有伤痕；仓库警犬嗅探气体泄漏；栩栩如生的亭子用20种语言为游客提供指导。随着DNA存储空间缩小数据库，随着软肌肉用更少的力量举起更重的负荷，随着多模态大脑将感官融合为流体行为，山谷缩小了。

社会是否接受这些机器将取决于透明度、道德规范，以及机器人能够提高而不是取代人类尊严的日常证据。矛盾的是，模仿自然的动力可能会让我们比以往任何时候都更重视自己的有机智能，就像我们最终弄清楚如何设计它一样。

如果朋友们喜欢，敬请关注“知新了了”！

发表评论:取消回复

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。