Nuevo talento europeo en IA desafía a Llama: nace el modelo de código abierto Large 2

La competencia de los grandes modelos de lenguaje de código abierto se intensifica, Llama 3.1 se enfrenta a fuertes rivales justo después de su lanzamiento, marcando el comienzo de la contienda de IA este verano.

La empresa emergente francesa de IA Mistral lanzó su nuevo modelo insignia Large 2 el 24 de julio, poco después del lanzamiento de Llama 3.1 por parte de Meta.

Mistral AI, fundada en junio de 2023, es una de las empresas de IA europeas mejor financiadas y más competitivas. Sus miembros principales provienen de instituciones de IA de primer nivel como Google DeepMind, y el cofundador Mensch es autor de artículos sobre grandes modelos como Chinchilla, proponiendo tecnologías fundamentales como las Leyes de Escalado.

La empresa recibió una financiación de 105 millones de euros solo 4 semanas después de su fundación, centrándose en el desarrollo de grandes modelos de código abierto. En diciembre de 2023, Mistral lanzó el modelo de código abierto Mistral 8x7B, con 56 mil millones de parámetros, comparable en eficiencia y rendimiento a LLaMA-65B. La empresa también introdujo un asistente de conversación multilingüe llamado Le Chat.

El modelo Large 2 utiliza 123 mil millones de parámetros, aproximadamente un tercio de los 405 mil millones de parámetros de Llama 3.1, pero supera a este último en generación de código, matemáticas y capacidad de razonamiento. Large 2 genera respuestas más concisas, evitando descripciones extensas, lo que le da una ventaja en costos y una ejecución local más rápida.

Aunque Large 2 no tiene capacidades multimodales, es comparable a Llama en precisión y fiabilidad de las respuestas conversacionales. El proceso de entrenamiento del modelo se centró en resolver problemas de alucinaciones y mejoró en aspectos como el seguimiento de instrucciones y las conversaciones de múltiples turnos.

Large 2 tiene una longitud de contexto de 128k y admite múltiples idiomas y 80 lenguajes de programación. El modelo está disponible en las plataformas de Google, Amazon, Azure e IBM, y los usuarios pueden probarlo en La Plateforme de Mistral o gratuitamente en Le Chat.

Mistral completó una ronda de financiación Serie B en junio de este año, recaudando 640 millones de dólares con una valoración de 6 mil millones de dólares. La empresa cuenta actualmente con unos 60 empleados, la mayoría de los cuales se dedican al desarrollo de productos y la investigación.

Sitio web de Mistral