Künstliche Intelligenz: Gibt es eine Chance, ein neues ByteDance oder Pinduoduo zu erschaffen?
Im Vergleich zu den Vorjahren zeichnete sich die diesjährige WAIC dadurch aus, dass die Praktiker sich nicht mehr auf die Diskussion über grundlegende große Modelle beschränkten, sondern mehr anwendungsorientierte Produkte für vertikale Szenarien präsentierten. Dies zeigt, dass die Denkweise der technischen Entwickler immer klarer wird und KI dem Leben der gewöhnlichen Menschen immer näher kommt.
Seit der Veröffentlichung von ChatGPT Ende 2022 ist erst eineinhalb Jahre vergangen. Zhuang Minghao, Vizepräsident und Chief Strategy Officer von Quhuan Technology, erinnert sich, dass sich die Diskussionen vor einem Jahr noch auf die Anwendung von KI in Sprache und Text beschränkten. Heute jedoch beweisen die häufigen Hits in den Bereichen Bilder, Videos, Audio und Musik die Vitalität der neuen Welle.
In dieser Welle des KI-Wettbewerbs haben sowohl Start-ups als auch kleine und mittlere Unternehmen erneut die Chance erhalten, mit Giganten zu konkurrieren - ähnlich wie auf der Bühne, die das mobile Internet vor über einem Jahrzehnt geschaffen hat.
Zhuang Minghao fasst die aktuelle Situation des Kampfes mit den Worten zusammen: "KI ist für Unternehmer eine verdeckte Karte, für große Unternehmen eine offene Karte."
Mit "offene Karte für große Unternehmen" meint er, dass es für alle großen Unternehmen heute selbstverständlich ist, KI zu entwickeln, um bestehende Geschäfte zu stärken, und dass dies geplant und rhythmisch geschieht. "Verdeckte Karte für Unternehmer" bedeutet, dass Start-ups die Richtung der KI-Gründung erraten und spekulieren müssen.
Aber die neue Generation von Giganten verbirgt sich oft in den Chancen der verdeckten Karten. "2010, als große Unternehmen ihre Geschäfte drahtlos umstellten, hätte niemand gedacht, dass es ein paar Jahre später Unternehmen wie Pinduoduo oder Douyin geben würde", sagt Zhuang Minghao. "Nur mit offenen Karten gibt es kein Kartenspiel, erst mit einem Wald gibt es Bäume, die in den Himmel wachsen, und erst mit einem komplexen Ökosystem gibt es herausragende Unternehmen."
Vor zehn Jahren ergriff Quhuan Technology diese "verdeckte Karte" und führte TT Voice ein, das den Markt für mobile Sprachkommunikation aufbrach. Warum hat Quhuan Technology zehn Jahre später, in einem neuen Moment, in dem sich offene und verdeckte Karten überschneiden, das Recht, am Kartentisch zu sitzen? Zhuang Minghao nennt drei Gründe.
Erstens hat Quhuan seit zehn Jahren in vertikalen Bereichen wie Unterhaltung tief verwurzelt gearbeitet und ein tiefes Verständnis für das Ökosystem und die Nutzer in diesem Bereich. "Wir Unternehmen, die Geschäfte betreiben, sind im Wesentlichen darauf ausgerichtet, Nutzerszenarien zu erfüllen, Nutzerbedürfnisse zu befriedigen und immer nah an den Nutzerbedürfnissen zu bleiben. Das ist schon immer die Mission von Start-ups und Geschäftsunternehmen gewesen", sagt Zhuang Minghao.
Zweitens hat Quhuan bei der Entwicklung vertikaler Modelle langfristig in die Akkumulation selbst entwickelter Technologie und in die Akkumulation hochwertiger Daten investiert, die andere nicht haben. Im Bereich der KI ist die Bedeutung von Daten weitaus höher als die von Modellen, und Unternehmen mit einzigartigen Daten werden wettbewerbsfähiger sein.
Schließlich verfügt Quhuan über hochgradig klebrige und aktive Testszenarien. Wie bereits erwähnt, können Quhuhans innovative Technologien dank beliebter solider Produkte schnell aus dem Labor herauskommen, von Nutzern und dem Markt getestet und verfeinert werden und frühzeitig in den positiven Entwicklungszyklus von "Forschung und Entwicklung - Effizienzsteigerung - Umsatzsteigerung" eintreten.
Zuerst ein Spezialist werden und in Ihrem Fachgebiet neue Möglichkeiten finden
Als das mobile Internet 2011 aufkam, prägte John Doerr, Partner einer berühmten Risikokapitalfirma, das Konzept "SoLoMo", das für Social (sozial), Local (lokal) und Mobile (mobil) steht. Als dieses Konzept vorgestellt wurde, wurde es von vielen als zukünftiger Trend des Internets anerkannt und wurde zur Standardantwort, die viele Unternehmen leitete.
Zurück zum jetzigen Zeitpunkt befindet sich KI noch in einem frühen Entwicklungsstadium, und die von allen erwartete Standardantwort ist noch nicht erschienen. Sowohl große Unternehmen als auch Start-ups experimentieren und erkunden ständig, wägen ab und spielen, und vieles ist noch unklar und chaotisch. Aber für einige Unternehmen ist dieses "Chaos" kein Abgrund, sondern gerade eine Treppe.
Im Vergleich zu großen Unternehmen, die sich auf allgemeine große Modelle und Großkunden konzentrieren, ist Quhuan Technology eher ein "Spezialist mit generalistischem Denken", der besser darin ist, in vertikalen Szenarien Probleme zu lösen und neue Wege zu finden. Dies ist Quhuhans angeborener Vorteil und Selbstvertrauen, und es hat seine Fähigkeiten bereits unter Beweis gestellt.
"Der sich schnell entwickelnde Branchenzustand und die rasche Iteration der Fähigkeiten grundlegender großer Modelle stellen Unternehmen, die sich auf Engineering und Anwendungen konzentrieren, vor Herausforderungen", sagt Zhuang Minghao. Dies führt dazu, dass Unternehmen, die Produkte auf der Grundlage großer Modelle gestalten, oft "mitgezogen" werden. Oft haben sie gerade etwas angepasst, und das zugrunde liegende Modell ändert sich wieder, was es schwierig macht, die Stabilität des Dienstes zu gewährleisten.
Quhuan Technologys Ansatz besteht darin, basierend auf seinen tief verwurzelten Sprach- und Unterhaltungsszenarien, vertikale "kleine" Modelle selbst zu entwickeln, selbst zu trainieren und einen Entwicklungspfad der "parallelen Produkt- und Modellentwicklung" zu bilden. "In diesem Bereich können wir sicherstellen, dass dieses Modell relativ stabil ist und nicht besonders von den Auswirkungen der schnellen Iteration der zugrunde liegenden allgemeinen großen Modelle betroffen ist", sagt Zhuang Minghao.
Bis jetzt decken die selbst entwickelten vertikalen großen Modelle von Quhuan Technology Bereiche wie Audio, Musik und Dialog ab und sind in multimodalem Verständnis, Generierung und Interaktion spezialisierter und benutzerfreundlicher. In dem zuvor veröffentlichten "2024 China Artificial Intelligence Industry Large Model Enterprise Competitiveness Top 100 Research Report" rangierte das große Modell von Quhuan auch unter den Top 100.
Zum Beispiel hat Quhuan Technology im Bereich der KI-Musik das weltweit erste multimodale Musikbegleitungsmodell selbst entwickelt, das die Fähigkeit hat, Musik aus Text, Audio und sogar Video zu generieren, KI-Liedtexte zu schreiben, automatisch zu komponieren, zu arrangieren und zu mischen. Es kann die Schwierigkeiten des gesamten Musikschaffensprozesses für Benutzer in einem Schritt lösen und es gewöhnlichen Musikliebhabern ermöglichen, wirklich ohne Eintrittsbarrieren Musik zu kreieren.
KI-Musik ist ein neues Feld ohne Standardantworten. Als Suno, das "ChatGPT der Musikwelt", auftauchte und die Aufmerksamkeit der ganzen Welt auf diesen kleinen Bereich lenkte, hatte Quhuan Technology bereits jahrelang daran gearbeitet. Man kann sagen, dass Quhuan Technology auch eines der ersten Unternehmen in der Branche ist, das große Musikmodelle und KI-native Anwendungsprodukte entwickelt hat.
Darüber hinaus hat Quhuan Technology basierend auf selbst entwickelten Technologien wie generativen Aktionsmodellen und Audio-Großmodellen One-Stop-Unternehmenslösungen wie digitale Menschen und mehrsprachige Übersetzungen entwickelt. Neben der Bedienung von Spieleherstellern und MCN-Institutionen in seiner Industriekette für Videoinhalterstellung und Auslandsexpansion wird es auch in Szenarien wie intelligenter Kundenservice, lokales Leben, Film und Tourismus eingesetzt und deckt einen Markt im Billionen-Yuan-Bereich ab. Zu den Kooperationspartnern gehören bekannte Unternehmen wie China Telecom.
Fast alle großen Produkte beginnen mit einer vertikalen Zielgruppe und werden dann kontinuierlich verallgemeinert, bis sie schließlich zu nationalen Produkten werden. KI wird die Benutzererfahrung und das Industrieökosystem strukturell verändern, und die breiten Geschäftsmöglichkeiten, die in vertikalen Anwendungsszenarien entstehen, sind offensichtlich.
Die "Demokratisierung" der KI gibt jedem die Chance, an der gleichen Startlinie zu stehen. Aber für Start-ups ist der Quhuan-Weg, in vertikalen Industrien "Produkte und Modelle parallel" zu entwickeln, vielleicht eine Referenz, aber nicht einfach zu kopieren, denn die Akkumulation von Daten und Branchenkenntnissen ist der Schlüssel, und je länger die Akkumulation, desto höher die Barriere.
Mit einer "einfachen Formel" den Anker der Gewissheit ergreifen
In der Ära der KI, in der die Wellen die Spreu vom Weizen trennen, wie können Unternehmen in der Ungewissheit Gewissheit ergreifen? Zhuang Minghao glaubt, dass der Erfolg immer von einem "korrekten Klischee" bestimmt wird, nämlich "nah an den Benutzerbedürfnissen zu bleiben".
"Unsere Mission war es schon immer, durch innovative Technologien und Produkte die unerfüllten Bedürfnisse der Benutzer zu befriedigen", sagt Zhuang Minghao. Unabhängig davon, wie sich die Technologie entwickelt, wie sich das Kapitalumfeld ändert, ob man X+KI oder KI Native macht, diese grundlegende Logik wird sich nie ändern.
Von der Entwicklung vertikaler großer Modelle bis zum Aufbau eines vollständigen KI-Interaktionstechnologie-Industrieökosystems. Quhuan Technology hält immer an der Ausrichtung auf Benutzerbedürfnisse fest, wählt vorrangig typische vertikale Szenarien als Pilotprojekte für Durchbrüche aus und repliziert dann erfolgreiche Erfahrungen auf andere Szenarien, um so die Unsicherheit in der KI-Transformation zu reduzieren. Durch dieses "ein bisschen mehr tun" wird erreicht, dass Benutzer und Kunden "ein bisschen stabiler" und "ein bisschen benutzerfreundlicher" werden. Mit dieser schrittweisen "dummen Methode" wurde allmählich eine "einfache Formel" von eins erzeugt zwei, zwei erzeugt drei abgeleitet.
Gleichzeitig betont Quhuan Technology angesichts der scheinbar allmächtigen KI auch das "Grenzbewusstsein" bei der Anwendung. Diese Grenze umfasst sowohl die Definition der Grenzen der Integration von KI und Geschäftsszenarien als auch das Verständnis der Grenzen dessen, was KI in der aktuellen Phase technisch leisten kann.
"Die diesjährige WAIC-Konferenz erinnerte mich an meine Gefühle, als ich vor über einem Jahrzehnt an Mobilinternet-Konferenzen teilnahm", sagt Zhuang Minghao. Die Atmosphäre in der riesigen Ausstellungshalle neben dem Vogelnest in Peking damals gleicht der Situation, die WAIC jetzt in Shanghai auslöst, wo die Straßen menschenleer sind.
Angesichts eines noch härteren Wettbewerbsumfelds hat Quhuan Technology bereits in vertikalen Bereichen erste Barrieren und Vorteile aufgebaut und sich vorrangig ein Ticket gesichert, um mit der großen Welle des KI-Zeitalters Schritt zu halten. Was werden die Vorreiter der KI-Branche nächstes Jahr Neues bringen? Wie können Unternehmen mehr "Munition" lagern?
Zhuang Minghao glaubt, dass die KI-Branche in ein oder zwei Jahren einen Moment erleben wird, der über Sieg oder Niederlage entscheidet. Jetzt sind wir wie in einem dunklen Wald unterwegs, wo man an einer Stelle eine Fackel entzündet und nur den umliegenden Bereich beleuchten kann. Aber wenn man langsam weitergeht, wird man sehen, dass es an einigen Stellen schwaches Licht gibt, mehr Gleichgesinnte entdecken, bis diese Lichter miteinander verbunden sind und gemeinsam eine brandneue Welt begrüßen.