欧洲AI新秀挑战Llama：开源模型Large 2问世

法国AI初创公司Mistral于7月24日发布了全新的旗舰模型Large 2，紧随Meta发布Llama 3.1之后。

Mistral AI成立于2023年6月，是欧洲资金最充足、最具竞争力的AI公司之一。其核心成员来自Google DeepMind等顶尖AI机构，联创Mensch是Chinchilla等大模型论文的作者，提出了包括Scaling Laws在内的核心技术。

公司成立仅4周便获得1.05亿欧元融资，专注于开源大模型研发。2023年12月，Mistral发布了Mistral 8x7B开源大模型，拥有560亿参数，效率和表现与LLaMA-65B相当。公司还推出了名为Le Chat的多语言对话助手。

Large 2模型使用1230亿个参数，约为Llama 3.1 405B参数的三分之一，但在代码生成、数学和推理能力方面超过了后者。Large 2在生成响应时更简洁，避免了冗长描述，具有成本优势和更快的本地运行速度。

Large 2虽然没有多模态能力，但在对话回应的准确度和可靠性上可与Llama相媲美。模型训练过程重点解决幻觉问题，并在指令遵循、多轮对话等方面有所提升。

Large 2拥有128k上下文长度，支持多种语言和80种代码语言。该模型已进驻Google、Amazon、Azure和IBM平台，用户可在Mistral的La Plateforme上体验或在Le Chat上免费测试。

Mistral于今年6月完成B轮融资，筹集6.4亿美元，估值达60亿美元。公司目前有约60名员工，其中大部分从事产品开发和研究工作。

开源大语言模型竞争升温，Llama 3.1刚发布就遇到了强劲对手，拉开了夏季人工智能角逐的序幕。