カリフォルニア大学バークレー校の研究者たちは、AI技術である強化学習を用いて、二足歩行ロボット「Cassie」に400メートル走、様々な地形での走行、立ち幅跳び、高跳びを行わせる方法を開発しました。この技術は、ロボットが以前に経験したことのない新しいタスクに対処するのを助けることができます。
強化学習は、目標を達成しようとするAIに対して報酬やペナルティを与えることで機能します。このアプローチにより、ロボットは新しいシナリオに一般化して対応することを学び、以前のモデルが可能性がある停止を克服しました。「ロボットの敏捷性の限界を押し上げたい」と述べるZhongyu Li氏(プロジェクトに取り組んだカリフォルニア大学バークレー校の博士課程の学生)は、人間のように様々な動的な動作をロボットに学習させることを高い目標としています。
チームは、Cassieを訓練するためにシミュレーションを使用し、これにより学習時間を数年から数週間に短縮し、ロボットがさらなる微調整なしに実世界で同じスキルを実行できるようにしました。最初に、Cassieを制御するニューラルネットワークが、跳ねる、前に歩く、転倒せずに前に走るなどの単純なスキルをゼロから習得するよう訓練されました。これは、人間から収集されたモーションキャプチャデータや所望の動きを示すアニメーションを模倣するように促すことで教えられました。
その後、モデルに新しいコマンドを提示し、ロボットが新しい動きスキルを使用してタスクを実行するよう促しました。シミュレーション環境で新しいタスクを熟練して実行できるようになった後、タスクのランダム化という方法を通じて訓練されたタスクを多様化しました。これにより、ロボットは予期せぬシナリオに対してより準備が整います。例えば、ロボットはリーシュで横に引っ張られても安定した走行ゲイトを維持できました。
Cassieは追加の訓練なしで400メートル走を2分34秒で完了し、立ち幅跳びで1.4メートルを跳びました。研究者たちは現在、オンボードカメラを搭載したロボットを訓練するためにこの種の技術をどのように使用できるかを研究する計画を立てています。これは、目隠しで行動を完了するよりも難しい課題になるとAlan Fern教授(オレゴン州立大学のコンピュータサイエンス教授で、Cassieの開発に協力したが、このプロジェクトには関与していない)は付け加えています。
【ニュース解説】
カリフォルニア大学バークレー校の研究チームが、AI技術の一つである強化学習を用いて、二足歩行ロボット「Cassie」に400メートル走や様々な地形での走行、立ち幅跳び、高跳びなどの動作を行わせることに成功しました。この技術は、ロボットが未知のタスクやシナリオに遭遇した際にも柔軟に対応できるようにするものです。
強化学習とは、AIが目標を達成する過程で、正しい行動を取った際に報酬を与え、誤った行動を取った際にペナルティを与えることで、最適な行動パターンを学習していく方法です。この手法により、Cassieは特定の動作を事前に詳細にプログラムされることなく、新しい状況にも対応できるようになりました。
研究チームは、Cassieの学習プロセスを加速するためにシミュレーションを活用しました。これにより、実際の環境での試行錯誤による学習に比べて、学習時間を大幅に短縮することができました。初期段階では、Cassieはジャンプや前進歩行などの基本的な動作を学習し、その後、より複雑なタスクへとステップアップしていきました。
この技術の応用により、ロボットは予期せぬ障害物に遭遇しても、過去の経験を活かして迅速に適応することが可能になります。例えば、Cassieは横から引っ張られる力に対しても、安定した走行を維持することができました。
今後、研究チームは、オンボードカメラを搭載したロボットの訓練にこの技術を応用することを計画しています。これにより、ロボットが周囲の環境を認識し、より複雑なタスクや人間とのインタラクションに対応できるようになることが期待されます。しかし、視覚情報を取り入れることは、単純な物理的動作の学習よりも高度な課題であり、この分野の研究はまだ始まったばかりです。
この技術の発展は、災害救助や高齢者支援、工場作業など、人間が行うのが困難または危険な作業をロボットが担う未来への大きな一歩となります。しかし、ロボットの自律性が高まるにつれて、倫理的な問題や安全性の確保など、新たな課題も浮かび上がってきます。これらの課題に対処しながら、ロボット技術の健全な発展を目指すことが、今後の研究者や技術者に求められるでしょう。
from How AI taught Cassie the two-legged robot to run and jump.