少数の動画でフィジカルAIが人間の望む行動を学ぶ技術を開発 韓国KAIST – Science Portal Asia Pacific


韓国科学技術院(KAIST)は6月10日、同院の研究者らが数千~数万件の行動データに対する人間の評価の代わりに、少数の動画だけで人工知能(AI)が人間の意図と判断基準を学習できる、フィジカルAIの商用化における核心課題の解決につながる新技術を開発したと発表した。
チャン・D・ユ(Chang D. Yoo) 教授(左)と研究チームメンバー
開発されたのは、動画ベースの最適輸送選好(VOTP)と名付けられた新技術である。KAIST電気工学部のチャン・D・ユ(Chang D. Yoo)教授が率いる研究チームによる成果で、博士課程のトゥン・M・ルー(Tung M. Luu)氏が筆頭著者として参加した。論文は、7月にソウルのコエックス(COEX)で開催される国際機械学習会議(ICML)2026に採択され、投稿論文23918本のうち上位0.7%に当たる168本だけが選ばれる口頭発表にも選定された。
VOTP概要図
AI技術は、文章や画像を生成するAIを超え、ロボットや自動運転車、医療ロボットなど、実際の機械を動かし現実世界で行動するフィジカルAIへ進化している。一方、手術ロボットが縫合したり、自動運転車が複雑な交差点を通過したりする場合、AIは多数の選択肢から適切な行動を選ぶ必要がある。そのためには、人間の選好と判断基準を反映した報酬関数が必要となるが、従来は構築のために、人間が数千~数万件の行動データを見て、望ましい行動を直接評価する必要があり、膨大な時間と費用がかかっていた。
研究チームは、人間が少数の手本を見るだけで新しい課題を学ぶ方法に着目した。VOTPは、良い例と悪い例を示す少数の動画だけで、AIが人間の好む行動パターンを自ら理解できるようにする。多様な環境と課題での広範な実験により、有効性と汎化性能も確認した。この方法により、フィジカルAIの開発に必要な人間からのフィードバックとデータ構築のコストを大幅に減らし、ロボット、自動運転車、産業機械の開発期間と費用の短縮につながると期待される。ロボットアーム制御、ヒューマノイドロボット、自動運転車、スマート工場、ドローン、手術ロボット、コンピューターを操作するAIエージェントへの応用も見込まれる。
VOTP研究イメージ(AI生成)
(出典:いずれもKAIST)
同教授は「フィジカルAIの核心は、機械に人間の意図を理解させ、正しい行動を選ばせることです」とし、「VOTPは少数の動画だけで人間の判断基準を学習できるため、ロボットが人間のように判断する時代を加速させる技術です」と述べた。
サイエンスポータルアジアパシフィック編集部
発表論文: Luu et al. (2026) Video-Based Optimal Transport for Feedback-Efficient Offline Preference-Based Reinforcement Learning
参考サイト(外部サイト):
JST
Copyright © Japan Science and Technology Agency

source