Hybrid读起来超简单，跟海布里德发音一样，超容易学！

当机器人遇上强化学习：看Cassie如何舞动双足

近日，一位名叫Cassie的机器人引起了广泛关注。在南昌小伙李钟毓及其团队的努力下，Cassie通过强化学习成功学会了走路。这项研究不仅为机器人控制领域带来了新的突破，也为机器人与人类社会的交互提供了新的可能。

Cassie是一个双足机器人，它的行走方式模拟了人类的行走模式。最近，李钟毓和他的团队利用强化学习技术，让Cassie学会了蹲伏走路、载重走路等复杂动作。相关论文已被机器人国际学术顶会ICRA收录。

强化学习是人工智能领域的一种重要技术，通过让机器在仿真环境中反复试验，获取与环境交互的数据，从而学会稳定的步态。李钟毓团队使用了两种仿真环境：一个用于数据收集，另一个用于验证学习到的步态控制器。通过这种技术，Cassie无需进行任何额外微调就能非常平稳地行走。

那么，Cassie是如何做到的呢？它的内部拥有十个电机和二十个自由度，这使得它拥有很高的灵活性。李钟毓团队主要使用Python进行编程，使用控制算法和导航控制算法来指导Cassie的行动。

该研究的一大亮点在于其创新性的控制算法。与传统基于模型的方法不同，该研究采用强化学习技术，获得控制二足机器人步态的算法。这使得Cassie具有更强的鲁棒性，即使在遭受意外干扰或环境变化时也能迅速恢复稳定状态。这也是业内首次展示出二足机器人如此稳定的性能。

该研究还有两大创新点。首先是步态库的引入，为机器人提供了模仿各种步态的能力。这不仅让Cassie能够执行复杂的动作，还让它能在各种动作下保持平衡。另一个创新点在于结合机器人的历史输入和输出，实现对Cassie及其环境的在线系统辨识。这使得控制器能够适应不同的环境，如不同地面的摩擦力变化。

这项研究的应用前景广阔。例如，在灾后搜救中，Cassie能在复杂环境中进行救援工作。在快递“最后一公里”配送中，Cassie能够替代快递小哥将快递送到用户手中。由于其形态上与人类相似，Cassie还可以用于人机交互，为人们提供更为温暖的服务体验。

李钟毓本人是一位才华横溢的科研人员。他在研究中遇到了许多困难，如仿真训练模型的部署难题，但他始终坚持“坚持才有希望”的信念，最终取得了成功。他出生于江西南昌，本科就读于浙江大学竺可桢学院，之后在卡内基梅隆大学实习，现在正攻读伯克利大学的博士学位。

谈及未来计划，李钟毓表示看好机器人发展态势，博士毕业后或将回国发展。他认为现在有非常成熟的机器人平台，两足机器人也有着很好的发展空间。此外他还计划将相关技术进行局部开源，以推动足式机器人的进步。

通过强化学习技术，Cassie已经展现出了强大的能力。我们有理由相信，随着技术的不断进步和研究的深入，机器人将在更多领域发挥重要作用。期待未来机器人在人类社会中发挥更大的价值。