OpenAI「ストロベリー」リーカーはAIの疑い:スタンフォード発のスタートアップAgentQが物議を醸す

*"人工知能エージェントAgentQに進化する。

*「ストロベリー」というコードネームのプロジェクトが最近広く注目を集めています。「ストロベリー兄貴」というアカウントが関連情報を継続的に宣伝し、期待と失望を引き起こしています。

最近、AI エージェントのスタートアップ企業 MultiOn の創業者が、「ストロベリー兄貴」アカウントを操作する新しいインテリジェント エージェント Agent Q をリリースし、ユーザーにオンライン体験を招待したと主張しました。この マーケティング戦術は多くの人々を混乱させました。多くの人々が OpenAI からの重要なニュースを待っていたからです。

MultiOn は、Agent Q がモンテカルロ木探索(MCTS)や自己批評などの技術を組み合わせた画期的な AI エージェントだと主張しています。その性能は LLama 3 ベースラインのゼロショット性能の 3.4 倍で、実世界のタスク評価での成功率は 95.4% に達すると言われています。

Agent Q はレストランの予約や航空券の予約などのタスクを実行できます。しかし、ネットユーザーはこれを信じておらず、MultiOn が「ストロベリー兄貴」アカウントを利用して宣伝しているのではないかと懸念しています。

Agent Q に関する論文が公開され、主要なコンポーネントは以下の通りです:

  1. MCTS を使用したガイド付き探索
  2. AI の自己批評
  3. 直接選好最適化(DPO)

研究者たちは、MCTS を通じてエージェントに追加の探索能力を与える方法を探り、ウェブエージェントの実行をウェブツリー探索として定式化しました。

実験結果によると、MCTS を適用した後、基本モデルの成功率は 28.6% から 48.4% に向上しました。さらなる微調整後、Agent Q の性能は 50.5% に達し、人間の平均パフォーマンスをわずかに上回りました。

技術的な詳細は注目を集めていますが、MultiOn のマーケティング手法は論争を引き起こし、一部のネットユーザーは彼らを「恥知らずな詐欺師」と呼んでいます。