Llama 3.1: Open-Source-Modell fordert geschlossene KI-Giganten heraus

Das Open-Source-Modell Llama 3.1 405B ist offiziell online und übertrifft in mehreren Benchmark-Tests geschlossene SOTA-Modelle wie GPT-4o und Claude 3.5 Sonnet.

Hauptpunkte der Llama 3.1 Modellfamilie:

Das 405B-Modell ist leistungsmäßig mit den besten geschlossenen Modellen vergleichbar
Open-Source/kostenlose Nutzung von Gewichten und Code, erlaubt Feinabstimmung, Destillation und Deployment
128k Kontext, mehrsprachig, gute Code-Generierung und komplexe Schlussfolgerungsfähigkeiten
Einfach zu integrierende Llama Stack API

Meta veröffentlichte gleichzeitig ein über 90-seitiges detailliertes technisches Papier, das verschiedene Aspekte der Forschung zu großen Modellen abdeckt.

Meta-CEO Zuckerberg betonte in einem Beitrag die Bedeutung von Open-Source-KI und lockerte die Lizenzbedingungen, sodass Entwickler die Ausgabe von Llama 3.1 zur Verbesserung von KI-Modellen Dritter verwenden können.

Branchenexperten sehen dies allgemein als wichtigen Meilenstein in der KI-Entwicklung:

Karpathy bezeichnet es als erste Öffnung eines GPT-4-Niveau-Modells für alle
Yann LeCun erklärt, dass Open-Source-LLMs jetzt gleichauf oder besser als geschlossene LLMs sind
Jim Fan nennt es einen historischen Moment, mit der Kraft von GPT-4 in unseren Händen

Die Veröffentlichung von Llama 3.1 markiert eine neue Ära für Open-Source-KI-Modelle und dürfte die Entwicklung des gesamten KI-Ökosystems beschleunigen.

Link