谷歌AI教机器人如何看狗运动
谷歌研究人员已经开发出一种人工智能系统,从动物的动作学会给机器人更大的灵活性,根据预印纸和博客文章本周公布。共同作者认为,他们的方法可以促进机器人的发展,这些机器人可以完成现实世界中的任务,例如在多层仓库和履行中心之间运输物料。
团队的框架捕获了动物(在本例中为狗)的运动捕捉片段,并使用强化学习(一种训练技术,刺激软件代理通过奖励来完成目标)来训练控制策略。他们说,为系统提供不同的参考动作,使研究人员能够“教”四腿的Unitree Laikago机器人执行一系列行为,从快速行走(每小时最高2.6英里的速度)到跳跃。
但是模拟器通常仅提供真实世界的粗略近似。为了解决这个问题,研究人员采用了一种自适应技术,该技术可以通过例如改变机器人的质量和摩擦等物理量来随机化仿真中的动力学。这些值使用编码器映射到数字表示形式(即编码),该数字表示形式作为输入传递给机器人控制策略。在将策略部署到实际的机器人时,研究人员删除了编码器,并直接搜索了一组变量,这些变量使机器人能够成功执行技能。
研究小组表示,他们能够在大约50次试验中使用不到8分钟的真实数据来使政策适应真实世界。此外,他们证明了真实世界的机器人学会了模仿狗的各种动作,包括起搏和小跑,以及艺术家动画的关键帧动作,例如动态的跳转。
“我们证明,通过利用参考运动数据,一种基于学习的方法能够自动合成控制器,以实现腿式机器人的各种行为。”该论文的合著者写道。“通过将有效的领域自适应样本技术整合到培训过程中,我们的系统能够学习模拟中的自适应策略,然后可以快速将其应用于实际部署中。”
控制策略不是完美的-由于算法和硬件的限制,它无法学习高度动态的行为(例如大的跳跃和奔跑),并且不如最佳的手动设计控制器那样稳定。(在每种方法中总共进行15次试验的5集中,实际机器人平均在调速起搏6秒后摔倒;在向后小跑5秒后摔倒;在旋转时9秒;在转弯时摔倒10秒。)研究人员留给未来的工作来提高控制器的鲁棒性,并开发可从其他运动数据源(例如视频剪辑)中学习的框架。
谷歌AI教机器人如何看狗运动:等您坐沙发呢!