快捷搜索:  

斯坦福为机械人提了个醒

"斯坦福为机械人提了个醒,这篇新闻报道详尽,内容丰富,非常值得一读。 这篇报道的内容很有深度,让人看了之后有很多的感悟。 作者对于这个话题做了深入的调查和研究,呈现了很多有价值的信息。 " 账号设置我的关注我的收藏申请的报道退出登录登录搜索36氪Auto数字时氪将来消费智能涌现将来城市启动Power on36氪出海36氪研究院潮生TIDE36氪企服点评36氪财经(Finance)职场bonus36碳后浪研究所暗涌Waves硬氪媒体品牌企业号企服点评36Kr研究院36Kr创新咨询企业服务核心服务城市之窗行政部门服务创投发布LP源计划VClubVClub投资机构库投资机构职位推介投资人认证投资人服务寻求报道36氪Pro创投氪堂企业入驻创业者服务创投平台 首页快讯资讯推荐财经(Finance)科技(Technology)创新城市最新创投汽车(Car)企服专精特新直播视频专题活动搜索寻求报道我要入驻城市合作斯坦福为机器人提了个醒锌产业·2024-01-08 10:08关注大模型再如何被神话,模仿学习对于机器人依然重要。

傅盛说,“2023年是人类历史(History)上第三个奇迹年。”  

这一年,大模型盛行,人工智能爆发,尤其是在具身智能领域的突破,让机器人有了更大的想象空间。 

整个机器人产业都在摩拳擦掌,希望(Hope)能在这样的利好背景下做些什么,才不至于错失良机。  

迈过2023年,也就是在刚刚进入2024年的第一周,斯坦福大学(University)的研究团队又对外公开了一个开源项目,一个名为「Mobile ALOHA」的机器人开源项目。  

在这个开源项目中,一台配备了双臂的“机器人”能够叠被子、做家务,甚至还学会了烹饪。 

尤其是在其公布出的几个忙起来像模像样的视频,一经各种短视频(Short Video)大肆传播,让不少人惊叹,这不妥妥就是我们(We)梦寐以求的保姆机器人吗? 

然而,和当年跑酷、蹦迪的波士顿动力超能机器人一样,在如今失焦的媒体视角下,斯坦福研究团队的这一项目的魔力再次被神话。 

面对大家如此始料未及的反响,就连Mobile ALOHA项目联合负责人Tony Z. Zhao都亲自在Twitter上放出Mobile ALOHA执行任务失败(Failure)的视频,并称,“机器人还没有准备好接管世界!” 

一波热度将Mobile ALOHA推上风口,一番闹剧让这一项目又面临质疑。 

实则,如果花些时间看完这篇论文,就会发现,Mobile ALOHA是一个不错的开源项目,也是一个和现在主流视野中的具身智能略有不同的机器人项目。 

01 Mobile ALOHA是什么?

从短视频(Short Video)中看到过它的人都知道:

Mobile ALOHA是一个会收拾家务,又会煎蛋煮饭的机器人,而这台机器人能完成的这些工作,正是家庭保姆机器人所需要的技能。

正因如此,Mobile ALOHA一度被认为是保姆机器人的原型机,甚至被人认为是将来几年内推动保姆机器人出现的关键。

实际上,论文的作者们,并没有想这么多。

在这篇论文中,Mobile ALOHA在硬件上被定义为「一种用于收集双臂运动数据的低成本全身远程操作系统」。 

这台机器人,也就是这套系统,主要由以下几个部分组成: 

移动底座——一台AGV机器人;

供电系统——一块1.26kW·h、14kg重的电池;

控制系统——一台配备英伟达3070显卡和英特尔i7-12800H的笔记本电脑(Computer);

运动系统——两个机械臂;

视觉系统——3个分辨率为480x640、频率为50Hz的摄像头。

如此硬件配置打造出一台如前文所述能在家庭环境下达成诸多功能的机器人,最为关键的其实是两点:

第一,机器人移动能力。

看过锌产业此前文章的人应该都了解,在机器人领域,除去工业机械臂外,还有两类机器人已经相当成熟:

一类是用在家庭地面清洁场景中的扫地机器人,另一类是用在仓储搬运场景下的AGV。 

实际上,正是关乎机器人移动能力的定位导航、路径规划等技术的成熟,推动了这两类产品在上一个十年逐渐普及。

就移动底盘而言,Mobile ALOHA直接选用了市面上成熟的AGV产品,解决了机器人在家庭环境下的移动能力。

第二,机器人的运动控制能力。

这里主要是指机械手臂的运动控制,也是Mobile ALOHA这一开源项目的独特性和技术含量所在。

和现在通过强化学习模型、大模型等驱动机器人自主认识(感知)环境、执行(决策)任务不同的是:

Mobile ALOHA采用的依然是更直接的「模仿学习」——通过人类操作机器人,机器人学习模仿人类行为,构成机器人的行为逻辑。

在这一项目发布的视频中,我们(We)看到的人类操作机械臂运动的场景,其实就是模仿学习中人类示教的过程,也是机器人模仿学习中最为关键的一步。

正是凭借这样一套方法论,Mobile ALOHA仅需要人类通过50次演示的训练,在处理日常家务时,就能够达到80%以上的成功(Success)率。

02 令人挠头的“虾仁炒蛋”

在这篇论文中,作者一共对Mobile ALOHA进行(Carry Out)了7项任务的训练和研究,分别是擦红酒、炒虾仁、冲洗平底锅、收纳平底锅、呼叫电梯、推椅子、击掌。

在最终呈现出来的演示视频中,最让人惊讶(Surprised)的是,Mobile ALOHA竟然能很好地做出让不少猛男少女都挠头的滑蛋虾仁。

然而,要让机器人做出这样一道菜,其实并没有想象中的那般容易。

除了需要人类示教,让机器人模仿学习外,作者还为Mobile ALOHA导入了一个静态数据集,这个数据集包含了825个任务的双臂执行数据。

不过,这825个任务的双臂执行数据与Mobile ALOHA要执行的任务不同,甚至产生这些数据的机器人原型与Mobile ALOHA双臂安装位置也不同。

科研是一条漫长的道路,所有成熟的技术最终能够顺利应用,都是众多科学家不断积累,一代代不断基于前人研究成果推陈出新的结果(Result)。

而基于已有数据集,再加上模仿学习,能否让Mobile ALOHA掌握更好的操作能力,也是这篇论文尝试解释的一个重要问题。

在实际实验过程中,通过为原有数据集加入模仿学习的方法,在执行「推椅子」、「擦红酒」任务时,明显有很好的能力提升,有更强的泛化能力。 

具体而言,在将一排5把椅子收到桌子下时,当推到第4、第5把椅子时,这一方法的成功(Success)率分别提高了15%和89%。‍ 

‍从实验中整体任务执行成功(Success)率来看,在进行(Carry Out)50次示教(击掌20次)后,擦红酒、呼叫电梯、击掌、收纳平底锅、冲洗平底锅、推椅子6项任务的成功(Success)率分别达到了95%、95%、85%、85%、80%、80%。 

然而,最惊艳的制作滑蛋虾仁这项长达75秒的的艰巨烹饪任务,实际上,Mobile ALOHA的任务执行成功(Success)率只有40%。

也就是说,我们(We)看到的Mobile ALOHA完美地做好一道滑蛋虾仁,同样是一个概率没有那么大的事件。

‍看来,“虾仁炒蛋”,不仅让人类挠头,如今也还是让机器人挠头。

03 斯坦福为机器人提了个醒

“虾仁炒蛋”做不好没关系,毕竟,这也不是斯坦福这一个研究团队,以一己之力能够完美解决的问题。

实际上,他们(They)想要解决的也并不是这个问题。

他们(They)想要解决的是,能否将现在双臂机器人运动控制的研究方法再往前推一步——验证静态数据集与不同模仿学习算法联合训练的可行性。

从这一点上来看,他们(They)做到了。

在一系列实验中,他们(They)验证了ACT、Diffusion Policy(扩散策略)、VINN三类重要的模仿学习算法在Mobile ALOHA上任务执行的成功(Success)率都得到了明显的提高。 

更重要的是,他们(They)打造的这套平台,成本只有3.2万美元(约合22.7万元)。

在此之前,类似Mobile ALOHA的双臂机器人平台PR2、TIAGo,价格普遍在20万美元(约合142万元)以上。 

也就是说,斯坦福这一研究团队,为机器人双臂运动控制的研究验证了一个思路、提供了一套更便宜的研究平台。

虽然没有大家想象的直接搞出一个厨师机器人,甚至保姆机器人来得炫酷,但这样一套开源平台和算法展现出来的效果,尤其是在大模型被神话了的现在,让大家再次意识到了模仿学习对于机器人的重要性。

同时也为接下来机器人,乃至人形机器人的上肢运动控制研究,提供了一个新的思路。

而且,这又是一个由华人科学家团队开源的项目。

本文来自微信公众号“锌产业”(ID:xinchanye2021),作者:山竹,36氪经授权发布。

该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。

+15

好文章,需要你的鼓励

锌产业特邀作者0收  藏+11评  论打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮微  博沉浸阅读返回顶部参与评论评论千万条,友善第一条登录后参与讨论(Discuss)提交评论0/1000你可能也喜欢这些文章从贝索斯、英伟达们手里又融了7000万美元,Perplexity还真奔着取代Google去了更安危的AI,更容易被用户抛弃?|产品体坛斯坦福家务机器人,看似全能,实际靠遥控OpenAI 们的将来,可能得靠《哈利·波特》来「拯救」AI的星星之火必将燎原大翻车,斯坦福超火机器人自曝内幕,研究者救场还受伤了,网友:放心了AI测出你几岁死亡?Transformer「算命」登Nature子刊,成功(Success)预测意外死亡2024 CSRankings全球计算机科学排名发布,AI领域祖国高校霸榜,清华排名第一AI会让人类失去人性么?最新文章推荐单场1000万降到20万,无人机表演生意凉了?点燃“尔滨”的第一把火:我在冰雪大世界做冰雕演唱会“越来越卷了”:超大屏幕、TikTok化、全景科技(Technology)化2024年,国产JAK抑制剂爆发元年?投前做的好,DPI才不会是机构的心魔“为了找AI项目,我掏钱搞了个大赛,结果(Result)来的都是投资人”智能驾驶五大关键认知,治好车企的画饼焦虑精品咖啡,被9块9逼到角落说真相,穷人是不是天生的?数读「三元饮料消失」风波:先从舆论与流量中消失锌产业特邀作者

用技术范式,给将来一个解释。

发表文章58篇最近内容斯坦福为机器人提了个醒1小时前年度话题:大模型落地的十大难题2023-12-29优必选的关键时刻2023-12-22阅读更多内容,狠戳这里下一篇价格战后再无波澜,2024年微波炉借“菜”消愁

2024年微波炉能成为厨电市场的“宠儿”吗?

1小时前

热门标签需求调研压榨人生规划职业发展偷票房奔驰金融奔驰c级廖信忠肖芳王红李思廉复仇者联盟2路演活动速度与激情7忍者神龟2投资资本回报率互联网自由小鱼办公sex自我评价张艳特斯拉国产xbox one游戏(Game)xbox one国行陈思诺泰国历史(History)天风默克棕榈生态破坏关于36氪城市合作寻求报道我要入驻投资者关系商务合作关于我们(We)联系我们(We)加入我们(We)网站谣言信息举报入口热门推荐热门资讯热门产品文章标签快讯标签合作伙伴鲸准氪空间富途牛牛企服点评人人都是产品经理领氪36氪APP下载iOS Android本站由 阿里云 提供计算与安危服务 违法和不良信息、未成年人保护举报电话:010-89650707 举报邮箱:jubao@36kr.com 网上有害信息举报© 2011~2024 首都多氪信息科技(Technology)有限公司 | 京ICP备12031756号-6 | 京ICP证150143号 | 京公网安备11010502036099号意见反馈36氪APP让一部分人先看到将来36氪鲸准氪空间

推送和解读前沿、有料的科技(Technology)创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业

斯坦福为机器人提了个醒

您可能还会对下面的文章感兴趣:

赞(217) 踩(4) 阅读数(8092) 最新评论 查看所有评论
加载中......
发表评论