Ein anonymes Modell mit dem Codenamen sus-column-r hat kürzlich in der Arena der großen Sprachmodelle beeindruckende Leistungen gezeigt und viele Spekulationen ausgelöst. Gestern lüftete Musk endlich das Geheimnis - es handelt sich um Grok2, das neue Modell von xAI, das bald veröffentlicht wird.
Grok2 zeigte in den offiziell veröffentlichten Vergleichsdaten eine beachtliche Leistung. Abgesehen von Googles Gemini 1.5 Pro erzielte es gegen andere Mainstream-Modelle wie GPT-4o und Claude 3.5 Sonnet hohe Gewinnraten. In verschiedenen Benchmark-Tests waren Grok2s Fähigkeiten mit denen der Top-KI-Modelle vergleichbar.
Eine große Verbesserung von Grok2 ist die Hinzufügung von Bildfunktionen, die durch die Zusammenarbeit mit FLUX.1 realisiert wurde. Tests zeigten, dass Grok2 bei der Bilderzeugung mutiger ist und einige kontroverse Inhalte generieren kann, wie zum Beispiel Parodien von öffentlichen Personen. Dies könnte einige rechtliche Risiken mit sich bringen.
In der praktischen Anwendung zeigte Grok2 gute Leistungen bei einigen grundlegenden Fragen, wie dem Vergleich von Dezimalzahlen und Zählen, die für KI typischerweise schwierig sind. Seine Antworten sind in der Regel detailliert. Bei einigen Fragen, die ein tieferes Verständnis erfordern, hat GPT-4o jedoch noch einen Vorteil.
Insgesamt zeigt Grok2 deutliche Verbesserungen in seinen Fähigkeiten, insbesondere in Bereichen wie Mathematik. Im Vergleich zu anderen Top-KI-Modellen gibt es jedoch noch Lücken, die weitere Verbesserungen erfordern. Diese Veröffentlichung demonstriert xAIs Ambitionen und Fortschritte im KI-Bereich.