KI-Großmodelle: Richtungen und Unterscheidungen
Derzeit nutzen die meisten Unternehmen KI durch den Einsatz allgemeiner Sprachmodelle, die mit branchenspezifischen Daten trainiert werden, um differenzierte Anwendungen zu schaffen. Dies könnte jedoch ein Trick sein. Mike Knoop, Mitbegründer von Zapier, glaubt, dass die Erweiterung von Sprachmodellen im Wesentlichen nur die Entwicklung der "Erinnerung" als Form der Intelligenz vorantreibt, was sich von echter Intelligenz unterscheidet. Es kann die Szenarien und Bedürfnisse von Unternehmen nicht verstehen und daher den Wert von KI nicht voll ausschöpfen.
Darüber hinaus könnte die Kurve zwischen dem Anstieg der GPU-Rechenleistung und der Verbesserung der Fähigkeiten von Sprachmodellen abnehmende Grenzerträge aufweisen. Sobald die öffentlich verfügbaren einfachen Daten erschöpft sind, wird es eine Illusion sein, durch allgemeine Sprachmodelle im KI-Bereich aufzuholen.
Für Unternehmen ist dies noch ungünstiger. Bei der Verfolgung neuer Technologien setzen Unternehmen oft die falschen Prioritäten. Ursprünglich wollten sie spezifische Probleme lösen, aber es wird zu einem Konzeptwettlauf, bei dem die grundlegendsten Probleme vergessen werden.
Die Lösung für dieses Problem liegt in den Händen von KI-Unternehmen. Sarah Tavel, Partnerin bei Benchmark, glaubt, dass die beste Entwicklungsrichtung darin besteht, Großmodelle basierend auf spezifischen Kundenbedürfnissen zu entwickeln. Alex Wang, Mitbegründer von Scale AI, ist der Meinung, dass Daten der Engpass für die Leistung von KI-Modellen sind, nicht Algorithmen oder Berechnungen. Da Daten letztendlich aus verschiedenen vertikalen Branchen stammen, bedeutet dies, dass KI-Unternehmen tief in Branchenbereiche eindringen und Branchenmodelle entwickeln sollten, die den Unternehmensbedürfnissen entsprechen.
Dieser Prozess hat zwei Schlüsselpunkte:
-
Datenproblem: KI-Unternehmen müssen Benutzer und Branchen "verstehen". Viele Unternehmen verfügen über große Mengen unzureichend genutzter Daten.
-
Management- und Iterationsproblem: Aufgrund der Vielfalt von Branchen und Szenarien ist es derzeit schwierig für ein einzelnes Unternehmen, Großmodelle für alle Bereiche zu erstellen.
Sowohl Fourth Paradigm als auch Mike Knoop von Zapier weisen auf Automatisierung als Schlüssel hin. In technischer Hinsicht beinhalten AutoML, Programmsynthese und neuronale Architektursuche automatisierte und optimierte Prozesse zur Reduzierung manueller Eingriffe und zur Verbesserung von Effizienz und Effektivität. Mike Knoop glaubt, dass AGI-Erforschung auf Programmsynthese und neuronaler Architektursuche basieren sollte, während Dai Wenyuan, Gründer von Fourth Paradigm, erwähnt, dass AutoML die Grundlagentechnologie für den Aufbau zahlreicher Branchenmodelle ist.
Dai Wenyuan bezeichnet AutoML als "Kunst des Scheiterns". Es kann einen größeren Wert entfalten, weil Fourth Paradigm viele Szenarien durchlaufen hat und weiß, wie man Daten und Modelle an die Anforderungen spezifischer Szenarien anpasst. Erfolge werden in Ergebnisse umgewandelt, Misserfolge werden zu Nährstoffen, basierend auf automatisierter beschleunigter Iteration. Wie Alex Wang sagt: "Maschinelles Lernen ist ein Rahmenwerk für Müll rein, Müll raus." Aber mit hochwertigen Branchendaten und der Fähigkeit zur kontinuierlichen Fehlerkorrektur wird letztendlich eine zuverlässige Implementierung von Branchenmodellen erreicht.
Verschiedene KI-Modelle: Ideen, Ansätze und Perspektiven
Einige Unternehmen wie OpenAI, die sich auf allgemeine Großmodelle konzentrieren, entwickeln sich horizontal, wobei das Großmodell alles ist. Ihr Geschäftsmodell besteht einfach darin, die Fähigkeiten des Großmodells zu verkaufen. Im Gegensatz dazu gehen Unternehmen wie Fourth Paradigm und Glean einen anderen Weg, indem sie KI-Technologie nutzen, um Unternehmen bei bestimmten Entscheidungen zu unterstützen und die Gesamtarbeitsleistung zu verbessern. Ihre Geschäftsmodelle unterscheiden sich ebenfalls.
Glean bietet eine KI-gestützte Unternehmenssuche und Wissensmanagementplattform, die Funktionen mehrerer Drittanbieteranwendungen integriert und Teil des Arbeitsflusses wird. Es kann Unternehmen auch dabei helfen, eigene KI-Modelle mit ihren eigenen Daten zu trainieren, basierend auf Gleans selbst entwickeltem "vertrauenswürdigen Wissensmodell".
Fourth Paradigm geht tiefer in die Vorhersage und Verwaltung von Kerngeschäftsproblemen in verschiedenen Branchen. Seine Branchenmodellplattform AIOS 5.0 baut auf X-modalen Daten aus verschiedenen Branchen und Szenarien auf, um Basis-Großmodelle für die Industrie zu erstellen. In Bezug auf die Fähigkeiten konzentriert es sich auf "Predict the Next X", wobei X für die Logik und Ergebnisse verschiedener Branchen steht. Auf der Anwendungsebene bietet es Modellierungstools mit niedriger Einstiegshürde, ein Innovationsdienstsystem für Wissenschaftler und andere Fähigkeiten, um einen End-to-End-Aufbau, -Einsatz und -Verwaltungsservice für Branchenmodelle zu realisieren.
Dies ist ein typisches Beispiel für die Entwicklung chinesischer KI-Unternehmen basierend auf dem industriellen Hintergrund. Dai Wenyuan glaubt, dass China einen großen Vorteil in Bezug auf Szenarien und Daten hat. Nachdem genügend Szenarien abgedeckt sind, könnte die Verknüpfung dieser Modelle auch AGI erreichen. Im Vergleich dazu sind viele populäre Branchenmodelle immer noch große Sprachmodelle für die Branche, groß, aber nicht präzise. Nach der Unterteilung in präzisere Szenarien scheint es oberflächlich betrachtet, dass viele Großmodelle aufgebaut werden müssen, aber die Datenlast für jedes präzise Szenario ist begrenzt. Mit Hilfe von Automatisierungstechnologien wird stattdessen ein alternativer Weg zur Entwicklung von AGI auf Anwendungsebene eröffnet.
Mike Knoop glaubt, dass AGI nach einem rasanten Fortschritt auf Hindernisse stößt, weil es zu sehr auf Sprachmodelle angewiesen ist und AGI als System definiert wird, das die meisten Aufgaben erledigen kann. Tatsächlich sollte AGI sich mehr darauf konzentrieren, effizient neue Fähigkeiten zu erwerben und offene Probleme in verschiedenen Szenarien zu lösen.
NVIDIA CEO Jensen Huang erwähnte, dass sich Computer mit der Entwicklung von Großmodellen von befehlsgesteuert zu absichtsgesteuert entwickeln: "Zukünftige Anwendungen werden ähnlich wie wir arbeiten und ausführen, indem sie Expertenteams zusammenstellen, Werkzeuge verwenden, Schlussfolgerungen ziehen, planen und unsere Aufgaben ausführen." Diese Logik impliziert Universalität an sich, da Großmodelle in die physische Welt eintreten, weil Entscheidungen in der physischen Welt ebenfalls nachvollziehbar sind.
Ein ähnliches Beispiel ist Palantir, ursprünglich ein To-G-Big-Data-Unternehmen, das auf Datenanalyse und Modellsimulation zur Entscheidungsunterstützung basierte. Generative KI-Technologie hat seine Datenverarbeitungsmethoden verändert, mit bedeutenden Fortschritten in Automatisierung und datengestützter Entscheidungsfindung, was die Entwicklung des KI-To-B-Geschäfts beschleunigt hat. Fourth Paradigm baut in jedem deterministischen Szenario Branchenmodelle auf, um Unternehmen dabei zu helfen, ihre eigenen Anwendungen zu beherrschen und effektive Entscheidungen zu treffen.