首页 >滚动 >正文

斯坦福大学Aloha团队出新作:“吼你牌”系统让机器人洗盘子更干净

作者:喻琰 方卉 来源:澎湃新闻2024年04月10日

继家务机器人火爆全网后,近日,斯坦福大学研发Mobile Aloha团队又出新作——一款名为“Yell At Your Robot”(简称YAY Robot)的系统。有了这个系统,可以通过“喊话”来训练机器人。

利用YAY技术调教训练后,机器人在完成每个阶段的成功率都有显著提高。

目前,YAY Robot系统作为研究成果,已经在社交平台上公开,系统也已开源。

通过喊话训练机器人

根据论文介绍,YAY Robot系统是一个通过自然语言反馈,来改善机器人后期训练的系统。在传统方法训练机器人的过程中,研究人员需要观看机器人视频,并且要为每个技能片段、事后动作,进行重新标注或一次性纠正,过程非常费力费时。

为了简化这一过程,YAY Robot研发团队采用了一种更有效的数据收集方法:现场解说。通过在机器人附近放置麦克风,操作人员可以先用语言说出机器人需要掌握的技能,然后遥控机器人进行同步操作,录制的音频可以与机器人的轨迹同步。

经过训练后的YAY Robot可以在与用户的互动中不断改进,提升动作水平,即时调整策略,将语言更有机地融入机器人的学习过程中。研究人员表示,利用YAY技术调教训练后,机器人在完成每个阶段的成功率都有显著提高。比如,在“准备混合食物”这一任务中,经过喊话训练的机器人动作准确性提高了30%-45%、在“清洗盘子”任务中提高了15%-25%。尤其是在清洗盘子这项任务中,研究人员可以直观地看到整个盘子表面的清洁效果,通过人类的口头反馈经过微调之后的机器人清洁力度更强,范围也变大了。

通过人类的口头反馈经过微调之后的机器人清洁力度更强

YAY Robot还引入了实时语言纠正机制

YAY Robot系统是怎么做到的呢?

研发人员透露,整个YAY系统在架构上主要由高级策略和低级策略两个部分组成。其中高级策略负责通过自然语言指令控制低级策略,低级策略则用于执行具体动作。

YAYRobot系统工作机制

此外,YAY系统引入了实时的语言纠正机制。当机器人的操作行为不理想时,操作人员会对YAY Robot系统说,“我想让机器人稍微调整一下”,这些修正语言就会被记录包含在未来的训练数据收集中。

研究人员表明,YAY Robot的目标是通过不断学习,最大可能的减少修正的需要,并随着时间的推移,能与用户的偏好保持一致。

为了提高机器人操作任务的性能,研究人员透露,YAY Robot系统每次要进行 20 次试验,还对子任务的成功率进行测量。“我们的代码实现了采集数据与处理这一过程的自动化,并且已经开源。”研究人员在论文中称。

研究人员施露西在论文中展望,希望未来的研究能进一步让机器人在人类的监督下不断进步,最终让任何人都能帮助教育机器人。

YAY Robot研究成果第一作者施露西本科毕业于大学计算机科学专业,曾在英伟达研究院与朱玉珂教授和 Jim Fan 博士合作,2023年3月加入斯坦福大学切尔西·费恩(Chelsea Finn)实验室,同年8月受邀在谷歌DeepMind就AWE发表演讲。

【责任编辑:陈戈辉】

星海故里,千人唱响《黄河大合唱》

中国青年报客户端2024-04-05 18:02:38

青年水电建设者创作歌曲《青春无悔》

中国青年报客户端2024-04-02 23:31:57

当紫禁城遇上凡尔赛宫,200件文物追寻中法交往历史

中国青年报客户端2024-04-02 15:39:49

当事人说 | 游本昌:向下扎根往上长,笑看万树繁花开

中国青年报客户端2024-04-02 10:40:41

网络视听用户10.74亿人,短视频人均单日使用151分钟

中国青年报客户端2024-03-27 17:02:27

《人类命运共同体研究年鉴》新书发布会在北京举行

中国青年报客户端2024-03-25 11:48:39

马慧娟《飞起来的村庄》:文学助力乡村振兴

中国青年报客户端2024-03-24 20:11:08