上周五,知名科技博主稚晖君在微博上预告了一个“好东西”。这周一,智元机器人就迫不及待地公布了这款新产品。这次的亮点不仅在于机器人能够端茶倒水、煮咖啡,甚至还能把面包放进烤箱、涂抹果酱,最后送到你面前,整个过程行云流水。此外,它还可以担任前台迎宾的角色。

基于 GO-1 大模型的机器人做咖啡

基于 GO-1 大模型的机器人做面包涂果酱

基于 GO-1 大模型的机器人做迎宾

但这些都不是最令人兴奋的部分。真正值得说一说的是智元推出的基座大模型 GO-1(Genie Operator-1),它解决了人形机器人长期以来面临的两大难题:高质量数据缺乏和泛化能力弱。

为了解决这个问题,去年底,智元已经开源了百万级真实世界数据集 AgiBot World。但是,即使有这么多数据,对于训练复杂的机器人来说还是远远不够。于是,他们提出了新的 ViLLA 架构,作为 GO-1 的核心。

ViLLA 架构的最大特点是它可以利用互联网上的视频资料来训练机器人。这意味着,只要机器人看过相关的视频,就能学会相应的动作!相比传统方法需要大量标注的数据,这种方法大大降低了成本,并提高了效率。更重要的是,ViLLA 生成的动作指令是通用的,可以适用于不同类型的机器人,进一步增强了其适用性和灵活性。

AA1AECMQ.webp

一句话总结:GO-1 让机器人可以通过观看网络视频学习新技能,同时提升了完成复杂任务的能力和适应性。

🌟省心评论:

"这波操作直接捅破数据天花板!以前训练机器人像教幼儿园,现在直接给它们看《人类迷惑行为大赏》就能自学成才,要是真能跨平台通用,波士顿动力都得连夜改PPT。“