Tant de plugins d'IA, d'où sortent-ils tous ?
"Il y a trop d'IA, je n'arrive pas à suivre." Cette anxiété n'est pas sans fondement. L'offre a effectivement explosé, avec une augmentation de 59,3% du nombre de projets d'IA sur Github en 2023 ; le nombre de développeurs sur la communauté open source d'IA Hugging Face a quadruplé.
a16z a analysé l'utilisation des produits d'IA sur le web par les utilisateurs. Parmi les 50 premiers produits, 28% appartiennent à la catégorie de génération de contenu (y compris texte, image, vidéo, musique), 22% à l'édition de contenu, 14% aux outils de productivité, et 10% sont des assistants intelligents généraux (comme ChatGPT, Claude, etc.). Sur mobile, c'est différent, les utilisateurs préfèrent utiliser des assistants généraux (avec une interface de chat IA dès l'ouverture).
Les produits web sont adaptés à des flux de travail plus complexes et en plusieurs étapes. Dans la catégorie productivité, six produits sur sept proposent des extensions pour le navigateur Chrome, ou n'existent même qu'en version extension. La pertinence des extensions réside dans leur "exécution synchrone", ne nécessitant pas que l'utilisateur quitte le logiciel qu'il utilise, réduisant considérablement la friction entre plusieurs pages web ou applications.
L'IA devrait être conçue pour être aussi proche que possible de l'utilisateur, idéalement intégrée dans l'environnement d'utilisation. C'est une condition préalable pour que l'IA soit bien utilisée.
Cependant, les développeurs ne se contentent pas simplement d'intégrer la technologie dans le processus du produit. Les applications d'IA évoluent rapidement, mais ont un cycle de vie court. Le Top 50 d'a16z a changé 40% de ses visages en six mois. QuestMobile indique que le taux d'activité des applications d'IA générative nationales est inférieur à 20%, la rétention sur trois jours est inférieure à 50%, et le taux de désinstallation de certaines applications dépasse 50%.
Certaines applications d'IA sont passées d'applications web à des extensions toujours disponibles, afin de se concrétiser de manière plus légère. Le navigateur reste une porte d'entrée importante pour le trafic, et la recherche est l'un des besoins Internet les plus universels et fréquents. Ces extensions s'emparent de territoire sur l'interface du navigateur, essayant de se rapprocher de la "porte d'entrée", pour résoudre le problème de croissance des utilisateurs.
Les extensions (étaient) reines
En 2008, Chrome n'était qu'un nouveau venu par rapport à Internet Explorer qui détenait 60% des parts de marché mondiales. Mais sa croissance était fulgurante - passant de 5% en 2009, à 15% en 2010, puis à 31% en 2012... L'écosystème ouvert créé par Google contrastait fortement avec l'approche fermée de Microsoft à l'époque. Les extensions y ont joué un rôle crucial.
Dans un cadre de développement établi, les développeurs tiers pouvaient réaliser des fonctionnalités avec un minimum de travail. De plus en plus de développeurs ont été attirés, créant des fonctionnalités riches qui ont ouvert les "limites" du navigateur. Les utilisateurs naviguaient sur Internet, mais pas seulement pour consulter des pages web - par exemple, une extension conçue pour Netflix, Hulu et autres services de streaming, "Netflix Party is now Teleparty", permettait aux gens de discuter tout en regardant grâce à une fenêtre flottante. Dans la section commentaires de l'extension, quelqu'un a remercié les développeurs pour avoir sauvé un couple à distance.
Ces extensions, semblables à des mods fonctionnels dans les jeux, peuvent offrir un meilleur mode de lecture, un mode sombre, accepter automatiquement toutes les demandes de cookies, un meilleur mode de lecture vidéo... Elles prennent vraiment en compte le point de vue de l'utilisateur.
Les extensions de navigateur ont accompagné l'Internet sur PC pendant sa période de prospérité. L'Internet mobile a accaparé la majeure partie de l'attention des utilisateurs, incitant certaines extensions légères à se transformer en "applications". Par exemple, "SimpRead" n'était au départ qu'une extension pour "générer des pages formatées adaptées à la lecture en chinois", puis elle s'est progressivement étoffée, intégrant des fonctionnalités telles que l'annotation, la lecture différée, l'exportation, etc., avant de lancer sa propre application indépendante.
Alors que les applications mobiles tentent d'accaparer l'attention des utilisateurs tout en érigeant des murs, les gens réalisent que les extensions sont la meilleure illustration de "l'esprit d'Internet", et peut-être son dernier vestige.
Ce n'est pas aussi simple que de coller des affiches sur un poteau électrique
En 2019, la société de sécurité Extension Monitor a analysé 180 000 extensions sur le Chrome Store et a constaté que les types les plus couramment utilisés étaient : bloqueurs de publicités, communication, shopping, sécurité, gestionnaires de mots de passe, etc., principalement axés sur la fonctionnalité.
Concernant le développement d'applications grand public basées sur l'IA générative, il y a toujours eu un débat : avec l'itération si rapide des grands modèles, une technologie sous-jacente plus puissante pourrait-elle remplacer les "fioritures" existantes au niveau des applications ? C'est un défi pour le développement logiciel : peut-on se débarrasser du fardeau du "développement d'applications" et résoudre les problèmes concrets des utilisateurs - comprendre où et comment l'IA devrait "assister" les gens.
La situation est légèrement différente cette fois-ci. Ces extensions d'IA doivent bien s'intégrer au contexte pour générer de la valeur pour l'utilisateur.
Prenons l'exemple de la "recherche". Lors de Google I/O, le vice-président en charge de la recherche Google a partagé ses observations sur les habitudes des utilisateurs : "Quand les utilisateurs ne savent pas exactement quoi chercher, ils commencent généralement par une question large, s'inspirent des résultats de recherche, creusent, puis posent d'autres questions."
De plus, chaque requête a une intention sous-jacente. Que faire ensuite avec les informations trouvées ? Les résumer en un plan, les transformer en présentation PowerPoint ? Ou changer le style de langage pour en faire un communiqué de presse ? Etc. (Cela peut être considéré comme la révolution de la recherche IA par rapport aux moteurs de recherche traditionnels).
Ces extensions qui apparaissent après avoir souligné du texte ont pour scénario d'utilisation principal l'accompagnement à la lecture. Lorsque les utilisateurs naviguent sur une page web, ils peuvent demander à l'extension d'expliquer, rechercher, traduire, résumer, développer sélectivement le contenu, ou le convertir en un post pour Xiaohongshu en un clic - réorganisant et livrant l'information autour de la demande de recherche principale.
En termes de conception de produit, certaines extensions affichent les fonctions les plus courantes dans une barre d'outils flottante à l'endroit souligné. Par exemple, Doubao permet même aux utilisateurs de personnaliser des "compétences" (équivalent à créer un bot ou des GPTs) et de les ajouter. D'autres fonctionnalités sont listées dans la barre latérale.
Certaines extensions respectent les "principes de conception" des plugins, comme Kimi, qui est plus concise et "radicale". L'IA "identifie automatiquement l'intention de l'utilisateur" et "comprend le contexte". Un utilisateur a testé : avec un seul bouton flottant et une fenêtre, elle peut non seulement expliquer et traduire, mais aussi résoudre des problèmes mathématiques. Kimi a également mis en place un bouton flottant sur la droite pour résumer la page et poser des questions en dialogue.