歐洲AI新秀挑戰Llama:開源模型Large 2問世

開源大語言模型競爭升溫,Llama 3.1剛發布即遇強勁對手,揭開夏季AI角逐序幕。

法國AI初創公司Mistral於7月24日發布了全新的旗艦模型Large 2,緊隨Meta發布Llama 3.1之後。

Mistral AI成立於2023年6月,是歐洲資金最充足、最具競爭力的AI公司之一。其核心成員來自Google DeepMind等頂尖AI機構,聯創Mensch是Chinchilla等大模型論文的作者,提出了包括Scaling Laws在內的核心技術。

公司成立僅4週便獲得1.05億歐元融資,專注於開源大模型研發。2023年12月,Mistral發布了Mistral 8x7B開源大模型,擁有560億參數,效率和表現與LLaMA-65B相當。公司還推出了名為Le Chat的多語言對話助手。

Large 2模型使用1230億個參數,約為Llama 3.1 405B參數的三分之一,但在代碼生成、數學和推理能力方面超過了後者。Large 2在生成響應時更簡潔,避免了冗長描述,具有成本優勢和更快的本地運行速度。

Large 2雖然沒有多模態能力,但在對話回應的準確度和可靠性上可與Llama相媲美。模型訓練過程重點解決幻覺問題,並在指令遵循、多輪對話等方面有所提升。

Large 2擁有128k上下文長度,支持多種語言和80種代碼語言。該模型已進駐Google、Amazon、Azure和IBM平台,用戶可在Mistral的La Plateforme上體驗或在Le Chat上免費測試。

Mistral於今年6月完成B輪融資,籌集6.4億美元,估值達60億美元。公司目前有約60名員工,其中大部分從事產品開發和研究工作。

Mistral官網