Modelo de código aberto Llama 3.1 é lançado: Desafiando o domínio da IA proprietária

O novo rei do código aberto, Llama 3.1 405B, foi oficialmente lançado, superando modelos SOTA fechados como GPT-4o e Claude 3.5 Sonnet em vários testes de referência.

Principais pontos da família de modelos Llama 3.1:

O modelo de 405B tem desempenho comparável aos melhores modelos de código fechado
Pesos e código de código aberto/uso gratuito, permitindo ajuste fino, destilação e implantação
Contexto de 128k, multilíngue, boa geração de código e capacidade de raciocínio complexo
API Llama Stack fácil de integrar

A Meta também lançou um artigo técnico detalhado de mais de 90 páginas, cobrindo vários aspectos da pesquisa de grandes modelos.

O CEO da Meta, Zuckerberg, postou enfatizando a importância da IA de código aberto e relaxou os termos de licença, permitindo que os desenvolvedores usem a saída do Llama 3.1 para melhorar modelos de IA de terceiros.

Especialistas do setor geralmente consideram isso um marco importante no desenvolvimento da IA:

Karpathy chamou isso de primeira vez que um modelo de ponta de nível GPT-4 é aberto a todos
Yann LeCun afirmou que os LLMs de código aberto agora estão no mesmo nível ou até melhores que os LLMs de código fechado
Jim Fan chamou isso de momento histórico, com o poder do GPT-4 agora em nossas mãos

O lançamento do Llama 3.1 marca uma nova era para modelos de IA de código aberto, com potencial para acelerar o desenvolvimento de todo o ecossistema de IA.

Link