欧洲AI新秀挑战Llama:开源模型Large 2问世

开源大语言模型竞争升温,Llama 3.1刚发布就遇到了强劲对手,拉开了夏季人工智能角逐的序幕。

法国AI初创公司Mistral于7月24日发布了全新的旗舰模型Large 2,紧随Meta发布Llama 3.1之后。

Mistral AI成立于2023年6月,是欧洲资金最充足、最具竞争力的AI公司之一。其核心成员来自Google DeepMind等顶尖AI机构,联创Mensch是Chinchilla等大模型论文的作者,提出了包括Scaling Laws在内的核心技术。

公司成立仅4周便获得1.05亿欧元融资,专注于开源大模型研发。2023年12月,Mistral发布了Mistral 8x7B开源大模型,拥有560亿参数,效率和表现与LLaMA-65B相当。公司还推出了名为Le Chat的多语言对话助手。

Large 2模型使用1230亿个参数,约为Llama 3.1 405B参数的三分之一,但在代码生成、数学和推理能力方面超过了后者。Large 2在生成响应时更简洁,避免了冗长描述,具有成本优势和更快的本地运行速度。

Large 2虽然没有多模态能力,但在对话回应的准确度和可靠性上可与Llama相媲美。模型训练过程重点解决幻觉问题,并在指令遵循、多轮对话等方面有所提升。

Large 2拥有128k上下文长度,支持多种语言和80种代码语言。该模型已进驻Google、Amazon、Azure和IBM平台,用户可在Mistral的La Plateforme上体验或在Le Chat上免费测试。

Mistral于今年6月完成B轮融资,筹集6.4亿美元,估值达60亿美元。公司目前有约60名员工,其中大部分从事产品开发和研究工作。

Mistral官网