グーグルのAI卓球ロボットが選手を圧倒 ネットユーザー:アメリカ代表として五輪出場の可能性も

45%の勝率を獲得することは、安定したプロレベルの技量を示しています。

DeepMindの研究者たちが、人間のアマチュア卓球選手と競争できる初のAIロボットを発表しました。このシステムは、ABB IRB 1100産業用ロボットアームとDeepMindの独自AIソフトウェアを組み合わせています。人間のプロ選手にはまだ及びませんが、このシステムは複雑な物理的タスクにおいて、機械が瞬時の判断と適応を行う能力を示しています。

卓球は、スピード、反射神経、戦略が要求されるため、10年にわたってロボットアームのベンチマークとして重要な役割を果たしてきました。

研究者たちはarXivのプレプリント論文で次のように述べています:「これは物理的スポーツで人間レベルで競争できる初のロボットエージェントであり、ロボット学習と制御におけるもう一つのマイルストーンを表しています。」

プレプリント論文へのリンク

名称未定の卓球ロボットエージェント(「AlphaPong」という名前が提案されています)は、David B. D'Ambrosio、Saminda Abeyruwan、Laura Graesserらの研究チームによって開発されました。様々な技能レベルのプレイヤーに対して良好な成績を収めました。29人の参加者を対象とした研究では、AIロボットは45%の勝率を達成し、しっかりとしたアマチュアレベルのスキルを示しました。

特筆すべきは、初心者に対しては100%、中級者に対しては55%の勝率を達成したことです。しかし、上級者に対してはすべての試合で敗北しました。

ロボットの物理的構成には、2次元平面移動のために2本のリニアトラックに取り付けられた6自由度のロボットアームIRB 1100が含まれます。高速カメラがボールの位置を追跡し、モーションキャプチャシステムが人間の対戦相手のラケットの動きを観察します。

DeepMindの研究者たちは、ロボットアームを駆動するために二層アプローチを開発しました。これにより、特定の卓球戦術を実行しながら、各対戦相手のプレイスタイルに基づいてリアルタイムで戦略を調整することができます。この適応性により、異なる対戦相手に対する特別なトレーニングなしに、どのアマチュアレベルのプレイヤーとも競争することができます。

システムのアーキテクチャは、低レベルのスキルコントローラー(特定の卓球技術を実行するようトレーニングされたもの)と高レベルの戦略的意思決定者(ゲームの状態を分析し、対戦相手のスタイルに適応し、各incoming ballに適切な低レベルのスキル戦略を選択するより複雑なAIシステム)を組み合わせています。

重要な革新は、AIモデルのトレーニング方法です。シミュレートされた物理環境で強化学習を使用しながら、実世界の例をトレーニングデータとして取り入れています。この技術により、ロボットは約17,500の実際の卓球ボール軌道から学習することができました。

研究者たちは、ロボットのスキルを洗練させるために反復プロセスを使用しました。人間とロボットの対戦の小さなデータセットから始め、その後AIを実際の対戦相手と競わせました。各試合は、ボールの軌道と人間の戦略に関する新しいデータを生成し、それがさらなるトレーニングのためにシミュレーションにフィードバックされました。

このプロセスは7サイクル繰り返され、ロボットはますます熟練した対戦相手と多様なプレイスタイルに継続的に適応することができました。最終ラウンドまでに、AIは14,000回以上のラリーと3,000回のサーブから学習し、広範な卓球知識を蓄積し、シミュレーションと現実のギャップを埋めました。

興味深いことに、Nvidiaも同様のシミュレートされた物理システムを実験しています。彼らのEurekaシステムは、AIモデルが実世界ではなくシミュレートされた空間でロボットアームの制御を迅速に学習することを可能にします。

技術的な成果を超えて、Googleの研究はAI対戦相手と競争する人間プレイヤーの経験を探求しました。驚くべきことに、卓球ロボットエージェントに負けた場合でも、人間のプレイヤーはその経験を楽しんだと報告しました。

研究者たちは次のように述べています:「人間のプレイヤーは、すべての技能グループと勝率において、ロボットとの対戦が『楽しく魅力的だった』と報告しました。」この肯定的な反応は、スポーツトレーニングやエンターテイメントにおけるAIの潜在的な応用を示唆しています。

しかし、このシステムには制限があり、非常に速くて高いボールに対しては性能が低下し、激しいボールの回転の検出に苦労し、バックハンドプレイに弱点を示しています。

Google DeepMindの研究チームは、これらの欠点に対処するために取り組んでいます。彼らは、高度な制御アルゴリズムとハードウェアの最適化を研究することを提案しており、ボールの軌道の予測モデルやロボットのセンサーとアクチュエーター間のより高速な通信プロトコルを含む可能性があります。

研究者たちは、結果がさらに洗練されれば、将来的にはシステムが高レベルの卓球選手と競争できる可能性があると強調しています。DeepMindは、AlphaZeroやAlphaGoなど、囲碁で人間のプレイヤーを打ち負かすAIモデルの開発に豊富な経験を持っています。

研究者たちはまた、この卓球ロボットの「神童」の影響は卓球を超えて広がると述べています。このプロジェクトで開発された技術は、製造業や医療を含む、素早い反応と予測不可能な人間の行動への適応を必要とする様々なロボットタスクに応用できる可能性があります。