Musk's xAI stellt neues Modell vor: Deutliche Fortschritte, aber noch nicht führend

"Groks Fortschritt ist raketenhaft." So begeistert kündigte Musk auf X die Ankunft von Grok-2 an.

Am 14. August Ortszeit veröffentlichte xAI Betaversionen von zwei KI-Modellen: Grok-2 und Grok-2mini. Grok-2 ist das leistungsstärkste Sprachmodell des Unternehmens, während das leichtgewichtige Modell Grok-2mini ein "Geschwisterprodukt" von Grok-2 ist und versucht, starke Funktionen mit einer geringen Parameterzahl zu erreichen.

xAI erklärte in einem Blogbeitrag, dass die frühe Vorschau von Grok-2 gegenüber Grok-1.5 erhebliche Fortschritte gemacht hat und über fortschrittliche Funktionen in den Bereichen Chat, Codierung und Reasoning verfügt.

Das Unternehmen behauptet, dass eine frühe Version von Grok-2 unter dem Namen "sus-column-r" getestet wurde und in der LMSYS-Rangliste besser abschnitt als Claude 3.5 Sonnet von Anthropic und GPT-4-Turbo von OpenAI. Die LMSYS-Rangliste ermittelt die Platzierungen durch zufällige anonyme Eins-gegen-eins-"Duelle" zwischen großen Sprachmodellen und basiert auf dem ELO-Bewertungssystem.

Sus-column-r (frühe Version von Grok 2) ist jetzt öffentlich zugänglich und hat mit über 12.000 Community-Stimmen den 3. Platz in der Gesamtrangliste erreicht, gleichauf mit GPT-4o. Es erreichte den 2. Platz im Coding, den 4. Platz bei schwierigen Prompts und den 2. Platz in Mathematik.

xAI testete auch die Interaktion von Grok mit neuen Modellen durch ein KI-Tutorsystem. Grok-2 konzentrierte sich auf die Bewertung der Fähigkeiten des Modells in zwei Schlüsselbereichen: Befolgen von Anweisungen und Bereitstellung genauer, wahrheitsgemäßer Informationen. Grok-2 zeigte deutliche Verbesserungen in der Fähigkeit, abgerufene Inhalte zu interpretieren und Werkzeuge zu nutzen, wie z.B. die korrekte Identifizierung fehlender Informationen, das Schlussfolgern durch Ereignissequenzen und das Verwerfen irrelevanter Beiträge.

Darüber hinaus bewertete xAI das Grok-2-Modell anhand einer Reihe akademischer Benchmarks, darunter Reasoning, Leseverständnis, Mathematik, Wissenschaft und Coding. Das Unternehmen erklärte: "Die Leistung in Bereichen wie Wissenschaftswissen auf Graduiertenniveau, gesunder Menschenverstand und mathematische Wettbewerbsprobleme ist mit anderen führenden Modellen vergleichbar."

Musk bindet xAI eng an das von ihm übernommene soziale Netzwerk "X" - Grok-2 und Grok-2mini werden die erweiterte Suchfunktion von X, tiefere Einblicke in Beiträge und verbesserte Antwortfunktionen unterstützen, obwohl xAI zuvor für die Verwendung von X-Nutzerdaten zum Training kritisiert wurde.

Ein Highlight dieses Updates ist, dass das Grok-2-Modell Bilder auf X generieren kann. Es verwendet das kürzlich populär gewordene Flux.1-Modell für die Bildgenerierung, ist aber derzeit auf Premium- und Premium+-Nutzer auf X beschränkt.

Da Groks Bildgenerierungsfunktion keine Einschränkungen hat, haben bereits viele Nutzer damit Bilder von politischen Persönlichkeiten erstellt. Ein Nutzer generierte beispielsweise ein Bild des ersten US-Präsidenten Washington, das von Musk geteilt wurde. OpenAIs ChatGPT würde die Erstellung solcher Bilder ablehnen, um politische Risiken zu vermeiden.

Es ist zu beachten, dass Grok-2 und Grok-2mini sich noch in der Testphase befinden. Das Unternehmen plant, beide Modelle später in diesem Monat über seine Enterprise-API für Entwickler verfügbar zu machen. Die kommende API basiert auf einem neuen, maßgeschneiderten Technologie-Stack, der Multi-Region-Inferenz-Deployments für globalen Zugriff mit geringer Latenz ermöglicht und erweiterte Sicherheitsfunktionen wie obligatorische Zwei-Faktor-Authentifizierung, Traffic-Statistiken und erweiterte Abrechnungsanalysen bietet.

Nach der Trennung von OpenAI prognostizierte Musk, dass bis 2029 eine allgemeine künstliche Intelligenz erreicht werden würde. Das von ihm gegründete xAI hat das ultimative Ziel, KI-Produkte für Verbraucher, Unternehmen und letztlich jeden zugänglich zu machen und sie in nützliche Werkzeuge zu verwandeln. Es hofft, durch KI Menschen bei der Lösung komplexer wissenschaftlicher und mathematischer Probleme zu helfen und das Universum zu "verstehen".

xAI beschleunigt seine Aktivitäten kontinuierlich. Das Unternehmen führte im Januar 2024 seine erste Finanzierungsrunde in Höhe von 135 Millionen US-Dollar durch; im Mai schloss es eine Serie-B-Finanzierung in Höhe von 6 Milliarden US-Dollar ab, wodurch die Unternehmensbewertung von zuvor 18 Milliarden US-Dollar auf 25 Milliarden US-Dollar stieg und es zu einem weiteren KI-Einhorn in den USA wurde.

Im Juli erklärte Musk, dass das xAI-Team mit dem Training auf dem "Memphis Supercluster" begonnen hat. Dieser Cluster besteht aus 100.000 flüssigkeitsgekühlten H100 GPUs und zielt darauf ab, bis Dezember dieses Jahres "die nach jedem Maßstab leistungsfähigste KI der Welt" zu trainieren.

Seine Ambitionen gehen noch weiter: Er enthüllte Pläne für xAI, einen Supercomputer zu bauen, eine "Superfabrik der Rechenleistung", die voraussichtlich viermal so groß sein wird wie die des stärksten Konkurrenten auf dem Markt.

Als "Nachzügler" im Bereich der großen Modelle glaubt Musk, dass xAI neue Durchbrüche und Innovationen in der künstlichen Intelligenz bringen kann. Er betont, dass Wettbewerb den Fortschritt der gesamten Branche fördert und eine unipolare Welt verhindert, in der ein einziges Unternehmen den KI-Bereich dominiert.

Allerdings zeigen die beiden neuesten Modelle keine bahnbrechenden Innovationen, die die Branche übertreffen, und bleiben in der Rolle des Aufholenden. Damit Grok-2 im Wettbewerb mit OpenAI, Google und anderen Technologieunternehmen hervorstechen kann, muss es stärkere Produkte liefern.

Musk's xAI stellt neues Modell vor: Deutliche Fortschritte, aber noch nicht führend

Groks Bilderzeugungsfunktion hat keine Einschränkungen, was es Benutzern ermöglicht, frei Bilder von politischen Persönlichkeiten zu erstellen, während ChatGPT sich weigert, solche Inhalte zu generieren.