So viele KI-Plugins, wo kommen die alle her?
"Es gibt zu viele KI-Anwendungen, ich komme nicht mehr hinterher." Dieses Gefühl der Überforderung ist nicht unbegründet. Auf der Angebotsseite gab es tatsächlich einen Boom: 2023 stieg die Anzahl der KI-Projekte auf Github um 59,3%; die Zahl der Entwickler in der KI-Open-Source-Community Hugging Face vervierfachte sich.
a16z analysierte die Nutzung von webbasierten KI-Produkten durch Benutzer. Von den Top 50 Produkten gehören 28% zur Kategorie Inhaltserstellung (einschließlich Text, Bild, Video, Musik), 22% zur Inhaltsbearbeitung, 14% sind Produktivitätswerkzeuge und 10% sind allgemeine intelligente Assistenten (wie ChatGPT, Claude usw.). Auf mobilen Geräten ist es anders, Benutzer bevorzugen hier allgemeine Assistenten (mit einer KI-Chat-Oberfläche beim Start).
Webprodukte eignen sich für komplexere, mehrstufige Arbeitsabläufe. In der Produktivitätskategorie bieten sechs von sieben Produkten Chrome-Browser-Erweiterungen an oder existieren sogar nur als Erweiterung. Die Logik hinter Erweiterungen liegt in der "synchronen Ausführung", bei der Benutzer die gerade verwendete Software nicht verlassen müssen, was die Reibung beim Wechseln zwischen mehreren Webseiten oder Anwendungen erheblich reduziert.
KI sollte so benutzerfreundlich wie möglich gestaltet sein und am besten in die Nutzungsumgebung eingebettet werden. Dies ist eine Voraussetzung dafür, dass KI gut genutzt werden kann.
Entwickler geben sich jedoch nicht damit zufrieden, die Technologie lediglich in Produktabläufe zu integrieren. KI-Anwendungen entwickeln sich schnell, haben aber kurze Lebenszyklen. Die Top-50-Liste von a16z hat innerhalb von sechs Monaten 40% neue Gesichter bekommen. QuestMobile weist darauf hin, dass die Aktivitätsrate von generativen KI-Anwendungen in China unter 20% liegt, die Drei-Tage-Bindungsrate unter 50% und die Deinstallationsrate einiger Apps über 50% beträgt.
Einige KI-Anwendungen haben sich von Webseiten, die geöffnet werden mussten, zu ständig verfügbaren Plugin-Produkten entwickelt, um auf leichtere Weise implementiert zu werden. Browser sind nach wie vor wichtige Verkehrseingänge, und Suche ist eine der universellsten und häufigsten Internetanforderungen. Diese Plugins versuchen, Territorium auf der Browseroberfläche zu erobern und möglichst nahe am "Eingang" zu sein, um das Problem des Benutzerwachstums zu lösen.
Plugins (waren) König
2008 war Chrome noch ein Neuling im Vergleich zum Internet Explorer, der 60% des globalen Marktanteils hatte. Aber es wuchs rasant - von 5% im Jahr 2009 über 15% im Jahr 2010 bis zu 31% im Jahr 2012... Das von Google geschaffene offene Ökosystem stand in starkem Kontrast zur damaligen geschlossenen Haltung von Microsoft. Erweiterungen (Plugins) spielten dabei eine wichtige Rolle.
Innerhalb des festgelegten Entwicklungsrahmens konnten Drittentwickler mit wenig Entwicklungsaufwand Funktionen implementieren. Immer mehr Entwickler wurden angezogen und schufen vielfältige Funktionen, die die "Grenzen" des Browsers öffneten. Benutzer surften im Internet, taten aber mehr als nur Webseiten zu durchsuchen - zum Beispiel ermöglichte ein Plugin namens "Netflix Party is now Teleparty" für Streaming-Dienste wie Netflix und Hulu den Nutzern, Inhalte gemeinsam anzusehen und zu diskutieren. Ein Nutzer kommentierte im Plugin-Bewertungsbereich, dass die Entwickler eine Fernbeziehung gerettet hätten.
Diese Plugins, ähnlich wie funktionale Mods in Spielen, bieten bessere Lesemodi, Dunkelmodi, automatische Zustimmung zu allen Cookie-Anfragen, verbesserte Videowiedergabemodi... Sie berücksichtigen wirklich die Perspektive der Benutzer.
Browser-Plugins begleiteten das PC-Internet durch seine Blütezeit. Das mobile Internet zog einen Großteil der Aufmerksamkeit der Nutzer auf sich, was einige leichtgewichtige Plugins dazu veranlasste, sich zu "Apps" zu entwickeln. Zum Beispiel war "SimpRead" ursprünglich nur ein Plugin zur "Erstellung von Layouts, die für das Lesen auf Chinesisch geeignet sind", entwickelte sich dann aber schrittweise zu einer umfangreicheren Anwendung mit integrierten Funktionen wie Anmerkungen, Lesezeichen und Export, bis schließlich eine eigenständige App eingeführt wurde.
Während mobile Anwendungen versuchten, möglichst viel Aufmerksamkeit der Nutzer zu gewinnen, errichteten sie auch hohe Mauern. Zu diesem Zeitpunkt wurde den Menschen klar, dass Plugins die beste Fußnote zum "Geist des Internets" und gleichzeitig dessen letztes Aufleuchten waren.
Das ist nicht so einfach wie Plakate an Strommasten zu kleben
2019 führte das Sicherheitsunternehmen Extension Monitor eine Statistik über 180.000 Erweiterungen im Chrome Store durch und stellte fest, dass die am häufigsten verwendeten Kategorien Werbeblocker, Kommunikation, Shopping, Sicherheit und Passwort-Manager waren, wobei funktionale Erweiterungen überwogen.
Bei der Entwicklung von generativen KI-Anwendungen für Endverbraucher gibt es eine anhaltende Diskussion: Angesichts der schnellen Iteration von großen Modellen stellt sich die Frage, ob stärkere zugrunde liegende Technologien die bestehenden "Verzierungen" auf der Anwendungsebene überdecken werden. Dies stellt eine Herausforderung für die Softwareentwicklung dar: Kann man den "App-Entwicklungs"-Ballast abwerfen und die tatsächlichen Probleme der Benutzer lösen - indem man herausfindet, wo und wie KI den Menschen "zur Hand gehen" sollte.
Die Situation unterscheidet sich etwas von früheren Zuständen. Diesmal müssen KI-Plugins gut mit Szenarien kombiniert werden, um Benutzerwert zu generieren.
Am Beispiel der "Suche": Während der GoogleI/O teilte der für die Google-Suche zuständige Vizepräsident seine Beobachtungen zum Nutzerverhalten mit: "Wenn Benutzer nicht genau wissen, wonach sie suchen wollen, beginnen sie normalerweise mit einer breiten Frage, lassen sich von den Suchergebnissen inspirieren, graben tiefer und stellen weitere Fragen."
Gleichzeitig steht hinter jeder Anfrage eine Absicht: Was soll mit den gefundenen Informationen als nächstes geschehen? Sollen sie zu einer Gliederung zusammengefasst, in eine PowerPoint-Präsentation umgewandelt werden? Oder soll der Sprachstil geändert und zu einer Pressemitteilung zusammengefasst werden? Und so weiter (dies kann auch als die heutige Umwälzung der traditionellen Suchmaschinen durch KI-Suche betrachtet werden).
Diese Plugins, die nach dem Markieren von Text hervorspringen, haben als Kernnutzungsszenario das "Begleitende Lesen". Während Benutzer Webseiten durchsuchen, können sie selektiv Erklärungen, Suchen, Übersetzungen, Zusammenfassungen, Erweiterungen und Umwandlungen in Xiaohongshu-Beiträge vom Plugin durchführen lassen - Neuorganisation und Bereitstellung von Informationen, die sich um die Kernsuche drehen.
Im Produktdesign platzieren einige Plugins die am häufigsten verwendeten Funktionen in einer schwebenden Werkzeugleiste an der markierten Stelle. Douban ermöglicht es Benutzern sogar, eigene "Fähigkeiten" zu definieren (ähnlich wie das Erstellen eines Bots oder GPTs) und diese hinzuzufügen. Weitere Funktionen sind in der Seitenleiste aufgeführt.
Einige folgen den "Designprinzipien" von Plugins, wie Kimi, das einfacher und "radikaler" ist. KI "erkennt automatisch die Benutzerabsicht" und "versteht den Kontext". Ein Nutzer testete es: Mit einem schwebenden Button und einem Fenster kann es nicht nur erklären und übersetzen, sondern auch mathematische Probleme lösen. Kimi hat zusätzlich eingerichtet, dass man durch Aufrufen des rechten schwebenden Buttons die Seite zusammenfassen und Fragen im Dialog stellen kann.