Llama 3.1 open source : un défi à la domination de l'IA propriétaire

Le domaine des grands modèles de langage connaît à nouveau un bouleversement majeur. Le modèle Llama 3.1 405B est apparu soudainement, surpassant GPT-4 et Claude 3.5 Sonnet dans plusieurs évaluations, devenant ainsi la première IA open source à battre les modèles propriétaires de premier plan. Zuckerberg a déclaré avec confiance que l'IA open source finira par l'emporter, suivant le même chemin de réussite que Linux.

Le nouveau roi open source Llama 3.1 405B est officiellement en ligne, surpassant les modèles SOTA fermés comme GPT-4o et Claude 3.5 Sonnet dans plusieurs tests de référence.

Points clés de la famille de modèles Llama 3.1 :

  • Le modèle 405B a des performances comparables aux meilleurs modèles fermés
  • Poids et code open source/gratuits, permettant le fine-tuning, la distillation et le déploiement
  • Contexte de 128k, multilingue, bonnes capacités de génération de code et de raisonnement complexe
  • API Llama Stack facile à intégrer

Meta a également publié un article technique détaillé de plus de 90 pages, couvrant tous les aspects de la recherche sur les grands modèles.

Le PDG de Meta, Zuckerberg, a souligné l'importance de l'IA open source dans un post et a assoupli les conditions de licence, permettant aux développeurs d'utiliser les sorties de Llama 3.1 pour améliorer les modèles d'IA tiers.

Les experts du secteur considèrent généralement cela comme une étape importante dans le développement de l'IA :

  • Karpathy affirme que c'est la première fois qu'un grand modèle de pointe de niveau GPT-4 est ouvert à tous
  • Yann LeCun déclare que les LLM open source sont maintenant à égalité ou même meilleurs que les LLM fermés
  • Jim Fan qualifie ce moment d'historique, la puissance de GPT-4 étant désormais entre nos mains

La sortie de Llama 3.1 marque l'entrée des modèles d'IA open source dans une nouvelle ère, promettant d'accélérer le développement de l'ensemble de l'écosystème de l'IA.

Lien