歐洲AI新秀挑戰Llama：開源模型Large 2問世

法國AI初創公司Mistral於7月24日發布了全新的旗艦模型Large 2，緊隨Meta發布Llama 3.1之後。

Mistral AI成立於2023年6月，是歐洲資金最充足、最具競爭力的AI公司之一。其核心成員來自Google DeepMind等頂尖AI機構，聯創Mensch是Chinchilla等大模型論文的作者，提出了包括Scaling Laws在內的核心技術。

公司成立僅4週便獲得1.05億歐元融資，專注於開源大模型研發。2023年12月，Mistral發布了Mistral 8x7B開源大模型，擁有560億參數，效率和表現與LLaMA-65B相當。公司還推出了名為Le Chat的多語言對話助手。

Large 2模型使用1230億個參數，約為Llama 3.1 405B參數的三分之一，但在代碼生成、數學和推理能力方面超過了後者。Large 2在生成響應時更簡潔，避免了冗長描述，具有成本優勢和更快的本地運行速度。

Large 2雖然沒有多模態能力，但在對話回應的準確度和可靠性上可與Llama相媲美。模型訓練過程重點解決幻覺問題，並在指令遵循、多輪對話等方面有所提升。

Large 2擁有128k上下文長度，支持多種語言和80種代碼語言。該模型已進駐Google、Amazon、Azure和IBM平台，用戶可在Mistral的La Plateforme上體驗或在Le Chat上免費測試。

Mistral於今年6月完成B輪融資，籌集6.4億美元，估值達60億美元。公司目前有約60名員工，其中大部分從事產品開發和研究工作。

開源大語言模型競爭升溫，Llama 3.1剛發布即遇強勁對手，揭開夏季AI角逐序幕。