Modelo de código aberto Llama 3.1 é lançado: Desafiando o domínio da IA proprietária

Os modelos de linguagem de grande escala passam por outra mudança dramática. O modelo Llama 3.1 405B surgiu do nada, superando o GPT-4 e o Claude 3.5 Sonnet em várias avaliações, tornando-se a primeira IA de código aberto a derrotar os principais modelos de código fechado. Zuckerberg declarou com confiança que a IA de código aberto acabará por prevalecer, assim como o sucesso do Linux.

O novo rei do código aberto, Llama 3.1 405B, foi oficialmente lançado, superando modelos SOTA fechados como GPT-4o e Claude 3.5 Sonnet em vários testes de referência.

Principais pontos da família de modelos Llama 3.1:

  • O modelo de 405B tem desempenho comparável aos melhores modelos de código fechado
  • Pesos e código de código aberto/uso gratuito, permitindo ajuste fino, destilação e implantação
  • Contexto de 128k, multilíngue, boa geração de código e capacidade de raciocínio complexo
  • API Llama Stack fácil de integrar

A Meta também lançou um artigo técnico detalhado de mais de 90 páginas, cobrindo vários aspectos da pesquisa de grandes modelos.

O CEO da Meta, Zuckerberg, postou enfatizando a importância da IA de código aberto e relaxou os termos de licença, permitindo que os desenvolvedores usem a saída do Llama 3.1 para melhorar modelos de IA de terceiros.

Especialistas do setor geralmente consideram isso um marco importante no desenvolvimento da IA:

  • Karpathy chamou isso de primeira vez que um modelo de ponta de nível GPT-4 é aberto a todos
  • Yann LeCun afirmou que os LLMs de código aberto agora estão no mesmo nível ou até melhores que os LLMs de código fechado
  • Jim Fan chamou isso de momento histórico, com o poder do GPT-4 agora em nossas mãos

O lançamento do Llama 3.1 marca uma nova era para modelos de IA de código aberto, com potencial para acelerar o desenvolvimento de todo o ecossistema de IA.

Link