云霞资讯网

“小脑大模型”突破:具身智能从“表演”走向“上岗”

春晚舞台上面,机器人Galbot在沈腾手里稳稳地转着核桃不规则物体的实时受力调整,是灵巧操作领域的顶尖难题,当全世界还在

春晚舞台上面,机器人Galbot在沈腾手里稳稳地转着核桃不规则物体的实时受力调整,是灵巧操作领域的顶尖难题,当全世界还在争论VLA模型的时候,中国团队靠着小脑大模型的突破, 让机器人真的开始做事了。

大小脑协同,给机器人装上神经动力学

传统机器人是一个大脑什么都管,可是在转核桃这类精细操作中很快就碰到瓶颈了,银河通用的「银河星脑AstraBrain」给出了新办法, 大脑负责全局认知,小脑专门处理实时力觉反馈,这就好像人类写字的时候不用考虑每根手指怎么用力大脑专注内容,小脑自己就把肌肉协同给解决了。

训练模式也有了突破,在虚拟世界里盘过亿万次虚拟核桃,练成了基础盘法,然后结合真实世界的物理手感来进行在线微调, 让「虚拟练招式、现实找手感」变成了现实。

场景落地方面,从我能做些什么变成了你让我做些什么

家庭服务这一块儿,叠衣服曾经是机器人最大的难题,以前面对随机的T恤毫无办法,现在它能实时判断布料褶皱情况,自己规划折叠动作不是事先设定好的程序, 而是实时做决定。

商业零售领域,在密集货架场景中,机器人在虚拟世界经历亿万次取货改错, 最后懂出最优取货路线,这套本事已经帮助银河通用在100多座城市实现7×24小时自主售货。

工业生产这一块,捡拾玻璃碎片可是在考验感知极限,通过仿真生成海量透明碎片数据, 机器人便能从微弱反光中看到玻璃的存在,再配合力觉感知精准把它捏起来,宁德时代这些企业的千台级订单,便验证了这套能力的可靠性。

尚未跨越的三道坎

在泛化边界方面,英伟达称,当前模型本质就是一个插值器, 要是物理形态超出训练集,性能就会断崖式下降,

在算力和成本这块,要是想要机器人走进家庭,硬件成本要再降低一个数量级才行,

在安全跟信任方面

北京智源研究院院长王仲远表示, 行业距离大规模应用还有较大差距,可靠性要再提升提升~

当机器人学会手感

未来3到5年,大脑和小脑的分工将会更加清楚, 我认同一个非正统的判断,具身智能的ChatGPT时刻也许就出现在小脑打破临界点的那个时候当机器人第一次依靠触觉知道什么是轻重缓急的时候。

当机器人的手指开始具有手感,人类或许得重新学习怎样和一个有手感的硅基伙伴一起生活,

思考问题:

如果家庭机器人能在递水瞬间感知你手指的位置避免烫伤,你会把它看作工具还是伙伴?

“小脑大模型”的突破意味着机器人正从“视觉动物”进化为“触觉动物”,下一个被突破的感官会是什么?

延伸阅读:

英伟达《DreamZero: World Action Models are Zero-shot Policies》论文解读

银河通用官方技术博客:AstraBrain虚实融合训练管线的详细拆解

声明:本文内容超过90%为原创,少部分借助AI进行辅助,但所有内容均经过本人严格审核与核对。所用图片均为真实拍摄或AI生成的原创素材。全文旨在传递积极健康的价值观,不含任何低俗或不良导向。特此说明,敬请读者知悉。