OpenAI beendet ChatGPT-3.5-Dienst

GPT-4-Preise stark gesunken! Zehn führende KI-Unternehmen in heftigem Wettbewerb - wer hat das Potenzial, OpenAIs Position herauszufordern?

Die neue Version von GPT-4o mini senkt den Preis auf 1 Yuan pro Million Tokens, ein Schritt, der OpenAI im Wettbewerb mit anderen KI-Unternehmen erneut in Führung bringt.

OpenAI führte am Abend des 18. Juli sein kostengünstigstes Modell GPT-4o mini ein. Die API-Eingabepreise für dieses Modell betragen 15 Cent (etwa 1,09 Yuan) pro Million Tokens, während die Ausgabepreise 60 Cent (etwa 4,36 Yuan) pro Million Tokens betragen, was über 60% günstiger ist als GPT-3.5 Turbo. Trotz der Preissenkung wurden die Fähigkeiten von GPT-4o mini erheblich verbessert, mit einem guten Ergebnis von 82% im MMLU-Test und einer Überlegenheit gegenüber GPT-4 in Bezug auf Chat-Präferenzen in der LMSYS-Rangliste.

Im Vergleich zu kleineren Modellen anderer Unternehmen zeigt GPT-4o mini ein ausgezeichnetes Preis-Leistungs-Verhältnis:

  • Google's Gemini 1.5 Flash: Eingabepreis 2,5 Yuan/Million Tokens, Ausgabepreis 7,6 Yuan/Million Tokens
  • Anthropic's Claude 3 Haiku: Eingabepreis 1,8 Yuan/Million Tokens, Ausgabepreis 9 Yuan/Million Tokens

GPT-4o mini übertrifft diese Konkurrenten in allen Leistungsaspekten.

Inländische KI-Unternehmen wie Deep Exploration, Zhipu AI, ByteDance, Alibaba Cloud, Baidu, Tencent Cloud und iFlytek haben im Juni ebenfalls erhebliche Preissenkungen vorgenommen, aber ihr Preisvorteil wurde nun geschwächt. Zum Beispiel:

  • Alibaba Cloud Qwen-Turbo: Eingabepreis 2 Yuan/Million Tokens, Ausgabepreis 6 Yuan/Million Tokens
  • Baidu ERNIE 3.5 Serie: Eingabe- und Ausgabepreis jeweils 12 Yuan/Million Tokens
  • ByteDance Doubao-pro-128k: Eingabepreis 5 Yuan/Million Tokens, Ausgabepreis 9 Yuan/Million Tokens

OpenAI CEO Sam Altman sagte, GPT-4o mini bewege sich "in Richtung einer Intelligenz, die so billig ist, dass sie nicht mehr messbar ist". Im Vergleich zum GPT-3 text-davinci-003 Modell von 2022 sind die Token-Kosten von GPT-4o mini um 99% gesunken.

GPT-4o mini hat folgende Eigenschaften:

  1. 128k Tokens Kontextverarbeitungsfähigkeit
  2. Unterstützung für Text- und visuelle Eingaben
  3. Unterstützung für 16k Ausgabe-Tokens
  4. Zukünftige Erweiterung auf Video- und Audio-Ein-/Ausgabe

In mehreren globalen Benchmark-Tests übertrifft GPT-4o mini GPT-3.5 Turbo und andere kleine Modelle:

  • MMLU Textintelligenz- und Reasoning-Test: 82,0%
  • MGSM Mathematisches Reasoning-Test: 87,0%
  • HumanEval Coding-Performance-Test: 87,2%
  • MMMU Multimodaler Reasoning-Bewertung: 59,4%

GPT-4o mini ist bereits kostenlos auf ChatGPT verfügbar und wird voraussichtlich schrittweise GPT-3.5 ersetzen. OpenAI plant, in den nächsten Tagen Fine-Tuning-Funktionen für GPT-4o mini einzuführen.

KI-Experte Andrej Karpathy glaubt, dass der Wettbewerb um die Größe von großen Sprachmodellen sich intensiviert, aber einen rückläufigen Trend zeigt. Er prognostiziert das Aufkommen sehr kleiner, aber leistungsstarker Modelle in der Zukunft.

OpenAI erklärt, dass GPT-4o mini die gleichen strengen Sicherheitsmechanismen wie GPT-4o geerbt hat und das erste Modell ist, das OpenAIs Ansatz der Anweisungshierarchie anwendet, was in der API stärkere Verteidigungsfähigkeiten zeigt.

Die Intensivierung des Preiskriegs bei großen Modellen und das Aufkommen kleiner, leistungsstarker Modelle werden die breitere Integration von KI in alltägliche Szenarien vorantreiben und gleichzeitig die Industrie dazu anregen, die Art und Weise der KI-Implementierung zu überdenken.