Llama 3.1: Open-Source-Modell fordert geschlossene KI-Giganten heraus

Die Welt der großen Sprachmodelle erlebt erneut einen dramatischen Wandel. Das Llama 3.1 405B-Modell ist unerwartet aufgetaucht und hat in mehreren Bewertungen GPT-4 und Claude 3.5 Sonnet übertroffen. Es ist damit die erste Open-Source-KI, die führende proprietäre Modelle schlägt. Zuckerberg verkündet selbstbewusst, dass Open-Source-KI letztendlich siegen wird, ähnlich wie Linux seinen Erfolgsweg ging.

Das Open-Source-Modell Llama 3.1 405B ist offiziell online und übertrifft in mehreren Benchmark-Tests geschlossene SOTA-Modelle wie GPT-4o und Claude 3.5 Sonnet.

Hauptpunkte der Llama 3.1 Modellfamilie:

  • Das 405B-Modell ist leistungsmäßig mit den besten geschlossenen Modellen vergleichbar
  • Open-Source/kostenlose Nutzung von Gewichten und Code, erlaubt Feinabstimmung, Destillation und Deployment
  • 128k Kontext, mehrsprachig, gute Code-Generierung und komplexe Schlussfolgerungsfähigkeiten
  • Einfach zu integrierende Llama Stack API

Meta veröffentlichte gleichzeitig ein über 90-seitiges detailliertes technisches Papier, das verschiedene Aspekte der Forschung zu großen Modellen abdeckt.

Meta-CEO Zuckerberg betonte in einem Beitrag die Bedeutung von Open-Source-KI und lockerte die Lizenzbedingungen, sodass Entwickler die Ausgabe von Llama 3.1 zur Verbesserung von KI-Modellen Dritter verwenden können.

Branchenexperten sehen dies allgemein als wichtigen Meilenstein in der KI-Entwicklung:

  • Karpathy bezeichnet es als erste Öffnung eines GPT-4-Niveau-Modells für alle
  • Yann LeCun erklärt, dass Open-Source-LLMs jetzt gleichauf oder besser als geschlossene LLMs sind
  • Jim Fan nennt es einen historischen Moment, mit der Kraft von GPT-4 in unseren Händen

Die Veröffentlichung von Llama 3.1 markiert eine neue Ära für Open-Source-KI-Modelle und dürfte die Entwicklung des gesamten KI-Ökosystems beschleunigen.

Link