Das Open-Source-Modell Llama 3.1 405B ist offiziell online und übertrifft in mehreren Benchmark-Tests geschlossene SOTA-Modelle wie GPT-4o und Claude 3.5 Sonnet.
Hauptpunkte der Llama 3.1 Modellfamilie:
- Das 405B-Modell ist leistungsmäßig mit den besten geschlossenen Modellen vergleichbar
- Open-Source/kostenlose Nutzung von Gewichten und Code, erlaubt Feinabstimmung, Destillation und Deployment
- 128k Kontext, mehrsprachig, gute Code-Generierung und komplexe Schlussfolgerungsfähigkeiten
- Einfach zu integrierende Llama Stack API
Meta veröffentlichte gleichzeitig ein über 90-seitiges detailliertes technisches Papier, das verschiedene Aspekte der Forschung zu großen Modellen abdeckt.
Meta-CEO Zuckerberg betonte in einem Beitrag die Bedeutung von Open-Source-KI und lockerte die Lizenzbedingungen, sodass Entwickler die Ausgabe von Llama 3.1 zur Verbesserung von KI-Modellen Dritter verwenden können.
Branchenexperten sehen dies allgemein als wichtigen Meilenstein in der KI-Entwicklung:
- Karpathy bezeichnet es als erste Öffnung eines GPT-4-Niveau-Modells für alle
- Yann LeCun erklärt, dass Open-Source-LLMs jetzt gleichauf oder besser als geschlossene LLMs sind
- Jim Fan nennt es einen historischen Moment, mit der Kraft von GPT-4 in unseren Händen
Die Veröffentlichung von Llama 3.1 markiert eine neue Ära für Open-Source-KI-Modelle und dürfte die Entwicklung des gesamten KI-Ökosystems beschleunigen.