NVIDIA s'associe à Mistral AI pour lancer une nouvelle création puissante, un petit modèle de 12 milliards de paramètres fait ses débuts impressionnants, surpassant les performances de Llama 3, et peut fonctionner sur une seule carte graphique 4090

Mistral lance un nouveau modèle d'intelligence artificielle, NeMo 12B, qui surpasse ses concurrents dans sa catégorie.

Mistral AI et NVIDIA ont conjointement lancé Mistral NeMo, un nouveau petit modèle de langage de 12 milliards de paramètres qui surpasse Gemma 2 9B et Llama 3 8B dans plusieurs benchmarks.

Caractéristiques principales de Mistral NeMo :

  • 12 milliards de paramètres
  • Fenêtre de contexte de 128K
  • Entraîné sur la plateforme NVIDIA DGX Cloud AI
  • Optimisé avec NVIDIA TensorRT-LLM et le framework NeMo
  • Publié sous licence Apache 2.0
  • Utilise le format de données FP8 pour une inférence efficace
  • Conçu pour des cas d'utilisation en entreprise

Performance :

  • Dépasse Gemma 2 9B et Llama 3 8B dans les conversations à plusieurs tours, les mathématiques, le raisonnement de bon sens, les connaissances générales et les benchmarks de codage
  • Légèrement en retrait par rapport à Gemma 2 9B sur le benchmark MMLU

Capacités clés :

  • Support multilingue pour 11 langues
  • Nouveau tokenizer Tekken basé sur Tiktoken, plus efficace que SentencePiece
  • Ajustement avancé des instructions pour un meilleur suivi des instructions, raisonnement et génération de code

Déploiement :

  • Peut fonctionner sur un seul GPU NVIDIA L40S, GeForce RTX 4090 ou RTX 4500
  • Compatible avec les systèmes existants utilisant Mistral 7B
  • Facilement déployable en quelques minutes sur diverses plateformes

La collaboration tire parti de l'expertise de Mistral AI en matière de données d'entraînement et de l'écosystème matériel/logiciel optimisé de NVIDIA. Mistral NeMo vise à fournir aux entreprises une solution d'IA puissante mais pratique qui peut être facilement intégrée dans des applications commerciales.

Lien vers Mistral AI Lien vers NVIDIA