最近有一個匿名模型代號sus-column-r在大型模型競技場上表現出色,引發了不少猜測。昨天馬斯克終於揭曉了謎底 - 這就是xAI即將推出的新模型Grok2。
Grok2在官方公布的對戰數據中表現不俗,除了Google的Gemini 1.5 Pro外,對其他主流模型如GPT-4o和Claude 3.5 Sonnet都取得了較高勝率。在各項基準測試中,Grok2的能力也與頂級AI模型相當。
Grok2的一大升級是新增了圖像功能,通過與FLUX.1合作實現。測試發現Grok2在圖像生成方面尺度更大膽,能生成一些有爭議的內容,如惡搞公眾人物等。這可能會帶來一些法律風險。
在實際使用中,Grok2在一些基礎問題上表現不錯,如小數比較、數數等常見AI易錯題目。它的回答通常比較詳細。不過在一些需要深入理解的問題上,GPT-4o仍有優勢。
總的來說,Grok2確實展現出了明顯的能力提升,尤其是在數學等領域。但它與其他頂級AI模型相比仍有差距,還需要進一步改進。這次發布顯示了xAI在AI領域的野心和進展。