グーグルのAIがIMO金メダルを逃す：19秒で問題を解き評価委員を驚かせ、幾何学能力が人間を超える

AlphaProofは、形式言語Leanで数学的命題を証明できるシステムです。事前学習済みの大規模言語モデルとAlphaZero強化学習アルゴリズムを組み合わせています。

機械学習における形式言語の限界（人間が書いたデータが限られている）を克服するため、研究者たちは自然言語と形式的な文の間のギャップを以下の方法で埋めました：

問題を解く際、AlphaProofは候補となる解を生成し、Leanで可能な証明ステップを探索することでそれらを証明または反証します。

AlphaGeometry 2は、Geminiの言語モデルを使用してゼロから学習したニューラル-シンボリックハイブリッドシステムです。前身よりも難しい幾何学の問題を解くことができ、物体の動き、角度、比率、距離の方程式を含む問題にも対応します。

主な改良点は以下の通りです：

AlphaGeometry 2は印象的な能力を示し、過去25年間のIMO幾何学問題の83%を解決しました（前身は53%）。今年のIMOでは、形式化された問題を受け取ってからわずか19秒で問題4を解きました。

IMOにおけるAIの性能は、数学的推論能力の大きな進歩を示しており、高度な数学における人間レベルの問題解決能力にAIを近づけています。