El nuevo rey del código abierto Llama 3.1 405B se lanza oficialmente, superando a modelos SOTA cerrados como GPT-4o y Claude 3.5 Sonnet en múltiples pruebas de referencia.
Puntos clave de la familia de modelos Llama 3.1:
- El modelo de 405B tiene un rendimiento comparable a los mejores modelos cerrados
- Pesos y código de código abierto/uso gratuito, permitiendo ajuste fino, destilación y despliegue
- Contexto de 128k, multilingüe, buena generación de código y capacidad de razonamiento complejo
- API Llama Stack fácil de integrar
Meta también publicó un detallado artículo técnico de más de 90 páginas, cubriendo diversos aspectos de la investigación de grandes modelos.
El CEO de Meta, Zuckerberg, publicó enfatizando la importancia de la IA de código abierto y relajó los términos de licencia, permitiendo a los desarrolladores usar la salida de Llama 3.1 para mejorar modelos de IA de terceros.
Los expertos de la industria generalmente consideran esto como un hito importante en el desarrollo de la IA:
- Karpathy lo llama la primera vez que un modelo de vanguardia a nivel de GPT-4 está abierto a todos
- Yann LeCun afirma que los LLM de código abierto ahora están a la par o incluso superan a los LLM cerrados
- Jim Fan lo llama un momento histórico, con el poder de GPT-4 ahora en nuestras manos
El lanzamiento de Llama 3.1 marca una nueva era para los modelos de IA de código abierto, con el potencial de acelerar el desarrollo de todo el ecosistema de IA.