AI plugins en auge: los navegadores se convierten en el nuevo campo de batalla de la inteligencia artificial

Sin embargo, esto no es necesariamente algo negativo.

¿De dónde salieron tantos plugins de IA?

"Hay demasiada IA, no puedo seguir el ritmo". Esta sensación de ansiedad no carece de fundamento. El lado de la oferta ha experimentado realmente una explosión, con un aumento del 59,3% en el número de proyectos de IA en Github en 2023; el número de desarrolladores en la comunidad de IA de código abierto Hugging Face se ha cuadruplicado.

a16z recopiló estadísticas sobre el uso de productos de IA basados en web por parte de los usuarios. Entre los 50 principales productos, el 28% pertenece a la categoría de generación de contenido (incluyendo texto, imágenes, vídeo y música), el 22% a edición de contenido, el 14% a herramientas de productividad y el 10% a asistentes de inteligencia general (como ChatGPT y Claude). En dispositivos móviles es diferente, los usuarios tienden a utilizar asistentes generales (una interfaz de chat de IA que aparece al abrir la pantalla).

Los productos web son adecuados para flujos de trabajo más complejos y de varios pasos. En la categoría de productividad, seis de los siete productos ofrecen extensiones para el navegador Chrome, o incluso sólo versiones de extensión. La lógica de las extensiones es la "ejecución sincrónica", que no requiere que los usuarios abandonen el software que están utilizando, reduciendo en gran medida la fricción de cambiar entre múltiples páginas web o aplicaciones.

La IA debe diseñarse para estar lo más cerca posible del usuario, preferiblemente integrada en el entorno de uso. Esta es una premisa para que la IA pueda utilizarse bien.

Sin embargo, los desarrolladores no se conforman con simplemente integrar la tecnología en los procesos de los productos. Las aplicaciones de IA se iteran rápidamente, pero tienen ciclos de vida cortos. El 40% de la lista de los 50 mejores de a16z cambió en seis meses. QuestMobile señala que las tasas de actividad de las aplicaciones de IA generativa nacionales están todas por debajo del 20%, la retención a tres días está por debajo del 50%, y las tasas de desinstalación de algunas aplicaciones están por encima del 50%.

Algunas aplicaciones de IA han pasado de requerir la apertura de una página web para su uso a convertirse en productos de extensión que acompañan constantemente, como una forma más ligera de implementación. Los navegadores siguen siendo una importante puerta de entrada al tráfico, y la búsqueda es una de las demandas de Internet más universales y frecuentes. Estas extensiones compiten por territorio en la interfaz del navegador, tratando de acercarse lo más posible a la "entrada", para resolver el problema del crecimiento de usuarios.

Las extensiones (alguna vez) fueron rey

En 2008, Chrome era sólo un novato en comparación con Internet Explorer, que tenía el 60% de la cuota de mercado mundial. Pero su crecimiento fue fuerte - del 5% en 2009, al 15% en 2010, al 31% en 2012... El ecosistema abierto creado por Google contrastaba fuertemente con el enfoque cerrado de Microsoft en ese momento. Las extensiones jugaron un papel crucial en esto.

Dentro del marco de desarrollo establecido, los desarrolladores de terceros podían implementar funcionalidades con un mínimo esfuerzo de desarrollo. Cada vez más desarrolladores se sintieron atraídos, creando ricas funcionalidades que abrieron las "limitaciones" del navegador. La gente navegaba por Internet, pero no sólo para ver páginas web - por ejemplo, una extensión diseñada para servicios de streaming como Netflix y Hulu, "Netflix Party is now Teleparty", permitía a la gente ver y discutir en una ventana flotante. Alguien en la sección de comentarios de la extensión dijo que gracias al desarrollador, se salvó una relación a larga distancia.

Estas extensiones, como mods funcionales en los juegos, pueden proporcionar mejores modos de lectura, modos oscuros, aceptar automáticamente todas las solicitudes de cookies, mejores modos de reproducción de vídeo... Realmente consideran las cosas desde la perspectiva del usuario.

Las extensiones del navegador acompañaron a Internet de escritorio a través de su prosperidad. El Internet móvil se llevó la mayor parte de la atención de los usuarios, afectando a algunas extensiones ligeras que luego se "aplicaron". Por ejemplo, "Simpread" comenzó sólo como una extensión para "generar páginas con diseño adecuado para la lectura en chino", pero gradualmente se hizo más pesada, integrando funciones como anotación, lectura posterior y exportación, y luego lanzó una aplicación independiente.

Mientras las aplicaciones móviles intentaban acaparar la atención de los usuarios, también levantaban altos muros. En este punto, la gente se dio cuenta de que las extensiones eran la mejor nota al pie del "espíritu de Internet", y también el último resplandor.

Esto no es tan simple como pegar carteles en postes de electricidad

En 2019, la empresa de seguridad Extension Monitor realizó estadísticas sobre 180.000 extensiones en la Chrome Web Store y descubrió que las categorías más comúnmente utilizadas por la gente incluían: bloqueo de anuncios, comunicación, compras, seguridad, gestores de contraseñas, etc., con un enfoque principalmente funcional.

Sobre el desarrollo de aplicaciones de IA generativa para el lado del consumidor, siempre ha habido una discusión: con la rápida iteración de los grandes modelos, ¿cubrirán las tecnologías subyacentes más fuertes los "adornos" existentes en las aplicaciones de nivel superior? Es un desafío para el desarrollo de software, si se puede dejar de lado la carga del "desarrollo de aplicaciones" y resolver los problemas reales de los usuarios - averiguar dónde y cómo la IA debería "echar una mano" a las personas.

La situación es ligeramente diferente a la anterior. Esta vez, las extensiones de IA necesitan integrarse bien con los escenarios para generar valor para el usuario.

Tomando "búsqueda" como ejemplo. Durante Google I/O, el vicepresidente a cargo de la búsqueda de Google compartió los hábitos de comportamiento de los usuarios que había observado, "Cuando los usuarios no están seguros de qué buscar, generalmente comienzan con una pregunta amplia, se inspiran en los resultados de búsqueda, profundizan y hacen más preguntas".

Al mismo tiempo, detrás de cada consulta hay una intención, ¿qué se hará con la información encontrada? ¿Resumirla en un esquema, escribir una presentación? ¿O cambiar el estilo del lenguaje y compilarlo en un comunicado de prensa? Etc. (Esto también se ve como la disrupción de la búsqueda de IA de hoy en día a los motores de búsqueda tradicionales).

Estas extensiones que aparecen después de subrayar tienen como escenario de usuario principal "acompañar la lectura". Cuando los usuarios navegan por páginas web, pueden hacer que las extensiones expliquen, busquen, traduzcan, resuman, expandan selectivamente el contenido, conviertan con un clic en texto de Xiaohongshu y otras operaciones - reorganizando y entregando información, centrándose en la demanda de búsqueda principal.

En términos de diseño de producto, algunas extensiones colocarán varias funciones comúnmente utilizadas en una barra de herramientas flotante en el área subrayada. Por ejemplo, Dou Bao incluso permite a los usuarios personalizar "habilidades" (equivalente a crear un bot o GPTs) y agregarlas. Otras funciones más se enumeran en la barra lateral.

Algunas siguen los "principios de diseño" de las extensiones, como Kimi, que es más concisa y "radical". La IA "identificará automáticamente la intención del usuario" y "entenderá el contexto". Un usuario probó que con un botón flotante y una ventana, no sólo puede explicar, sino también traducir e incluso resolver problemas matemáticos. Kimi también ha configurado que al invocar el botón flotante de la derecha, se puede resumir la página y hacer preguntas en un diálogo.