当机器人遇上强化学习:看Cassie如何舞动双足
近日,一位名叫Cassie的机器人引起了广泛关注。在南昌小伙李钟毓及其团队的努力下,Cassie通过强化学习成功学会了走路。这项研究不仅为机器人控制领域带来了新的突破,也为机器人与人类社会的交互提供了新的可能。
Cassie是一个双足机器人,它的行走方式模拟了人类的行走模式。最近,李钟毓和他的团队利用强化学习技术,让Cassie学会了蹲伏走路、载重走路等复杂动作。相关论文已被机器人国际学术顶会ICRA收录。
强化学习是人工智能领域的一种重要技术,通过让机器在仿真环境中反复试验,获取与环境交互的数据,从而学会稳定的步态。李钟毓团队使用了两种仿真环境:一个用于数据收集,另一个用于验证学习到的步态控制器。通过这种技术,Cassie无需进行任何额外微调就能非常平稳地行走。
那么,Cassie是如何做到的呢?它的内部拥有十个电机和二十个自由度,这使得它拥有很高的灵活性。李钟毓团队主要使用Python进行编程,使用控制算法和导航控制算法来指导Cassie的行动。
该研究的一大亮点在于其创新性的控制算法。与传统基于模型的方法不同,该研究采用强化学习技术,获得控制二足机器人步态的算法。这使得Cassie具有更强的鲁棒性,即使在遭受意外干扰或环境变化时也能迅速恢复稳定状态。这也是业内首次展示出二足机器人如此稳定的性能。
该研究还有两大创新点。首先是步态库的引入,为机器人提供了模仿各种步态的能力。这不仅让Cassie能够执行复杂的动作,还让它能在各种动作下保持平衡。另一个创新点在于结合机器人的历史输入和输出,实现对Cassie及其环境的在线系统辨识。这使得控制器能够适应不同的环境,如不同地面的摩擦力变化。
这项研究的应用前景广阔。例如,在灾后搜救中,Cassie能在复杂环境中进行救援工作。在快递“最后一公里”配送中,Cassie能够替代快递小哥将快递送到用户手中。由于其形态上与人类相似,Cassie还可以用于人机交互,为人们提供更为温暖的服务体验。
李钟毓本人是一位才华横溢的科研人员。他在研究中遇到了许多困难,如仿真训练模型的部署难题,但他始终坚持“坚持才有希望”的信念,最终取得了成功。他出生于江西南昌,本科就读于浙江大学竺可桢学院,之后在卡内基梅隆大学实习,现在正攻读伯克利大学的博士学位。
谈及未来计划,李钟毓表示看好机器人发展态势,博士毕业后或将回国发展。他认为现在有非常成熟的机器人平台,两足机器人也有着很好的发展空间。此外他还计划将相关技术进行局部开源,以推动足式机器人的进步。
通过强化学习技术,Cassie已经展现出了强大的能力。我们有理由相信,随着技术的不断进步和研究的深入,机器人将在更多领域发挥重要作用。期待未来机器人在人类社会中发挥更大的价值。