OpenAI「草莓」爆料者疑為AI:史丹佛創企AgentQ引爭議

*"演變為人工智能智能體Agent Q。

*"和代號為「草莓」的專案近期受到廣泛關注。一個名為「草莓哥」的帳號不斷宣傳相關資訊,引發期待和失望。

最近,AI智慧體初創公司MultiOn的創辦人聲稱他們發布了操控「草莓哥」帳號的全新智慧體Agent Q,邀請使用者線上體驗。這一行銷操作讓許多人感到困惑,因為很多人一直在等待OpenAI的重大消息。

MultiOn宣稱Agent Q是一款突破性的AI智慧體,結合了蒙特卡羅樹搜尋(MCTS)和自我批評等技術。據稱其性能是LLama 3基線零樣本性能的3.4倍,在真實場景任務評估中成功率達95.4%。

Agent Q可以執行預訂餐廳座位、預訂航班等任務。然而,網友對此並不買帳,更關心MultiOn是否藉「草莓哥」帳號炒作。

Agent Q的相關論文已發布,主要組件包括:

  1. 使用MCTS進行引導式搜尋
  2. AI自我批評
  3. 直接偏好最佳化(DPO)

研究者探索了如何透過MCTS賦予智慧體額外的搜尋能力,將網頁智慧體執行公式化為網頁樹搜尋。

實驗結果顯示,應用MCTS後,基礎模型的成功率從28.6%提升到48.4%。進一步微調後,Agent Q的性能達到50.5%,略微超過人類平均表現。

儘管技術細節引人關注,但MultiOn的行銷手法引發爭議,部分網友稱其為「無恥的騙子」。