O novo rei do código aberto, Llama 3.1 405B, foi oficialmente lançado, superando modelos SOTA fechados como GPT-4o e Claude 3.5 Sonnet em vários testes de referência.
Principais pontos da família de modelos Llama 3.1:
- O modelo de 405B tem desempenho comparável aos melhores modelos de código fechado
- Pesos e código de código aberto/uso gratuito, permitindo ajuste fino, destilação e implantação
- Contexto de 128k, multilíngue, boa geração de código e capacidade de raciocínio complexo
- API Llama Stack fácil de integrar
A Meta também lançou um artigo técnico detalhado de mais de 90 páginas, cobrindo vários aspectos da pesquisa de grandes modelos.
O CEO da Meta, Zuckerberg, postou enfatizando a importância da IA de código aberto e relaxou os termos de licença, permitindo que os desenvolvedores usem a saída do Llama 3.1 para melhorar modelos de IA de terceiros.
Especialistas do setor geralmente consideram isso um marco importante no desenvolvimento da IA:
- Karpathy chamou isso de primeira vez que um modelo de ponta de nível GPT-4 é aberto a todos
- Yann LeCun afirmou que os LLMs de código aberto agora estão no mesmo nível ou até melhores que os LLMs de código fechado
- Jim Fan chamou isso de momento histórico, com o poder do GPT-4 agora em nossas mãos
O lançamento do Llama 3.1 marca uma nova era para modelos de IA de código aberto, com potencial para acelerar o desenvolvimento de todo o ecossistema de IA.