NVIDIA se une a Mistral AI para lanzar una potente nueva creación, un modelo pequeño de 12 mil millones de parámetros hace su impresionante debut, superando el rendimiento de Llama 3 y capaz de funcionar con una sola tarjeta gráfica 4090

Mistral lanza un nuevo modelo de inteligencia artificial, NeMo 12B, que supera a sus competidores.

Mistral AI y NVIDIA han lanzado conjuntamente Mistral NeMo, un nuevo modelo de lenguaje pequeño de 12B parámetros que supera a Gemma 2 9B y Llama 3 8B en varios puntos de referencia.

Características principales de Mistral NeMo:

  • 12 mil millones de parámetros
  • Ventana de contexto de 128K
  • Entrenado en la plataforma de IA NVIDIA DGX Cloud
  • Optimizado con NVIDIA TensorRT-LLM y el marco NeMo
  • Lanzado bajo licencia Apache 2.0
  • Utiliza el formato de datos FP8 para una inferencia eficiente
  • Diseñado para casos de uso empresarial

Rendimiento:

  • Supera a Gemma 2 9B y Llama 3 8B en conversaciones de múltiples turnos, matemáticas, razonamiento de sentido común, conocimiento del mundo y puntos de referencia de codificación
  • Ligeramente por detrás de Gemma 2 9B en el punto de referencia MMLU

Capacidades clave:

  • Soporte multilingüe para 11 idiomas
  • Nuevo tokenizador Tekken basado en Tiktoken, más eficiente que SentencePiece
  • Ajuste avanzado de instrucciones para mejor seguimiento de instrucciones, razonamiento y generación de código

Implementación:

  • Puede ejecutarse en una sola GPU NVIDIA L40S, GeForce RTX 4090 o RTX 4500
  • Compatible con sistemas existentes que utilizan Mistral 7B
  • Fácilmente implementable en minutos en varias plataformas

La colaboración aprovecha la experiencia de Mistral AI en datos de entrenamiento y el ecosistema optimizado de hardware/software de NVIDIA. Mistral NeMo tiene como objetivo proporcionar a las empresas una solución de IA potente pero práctica que pueda integrarse fácilmente en aplicaciones comerciales.

Enlace a Mistral AI Enlace a NVIDIA