AI-плагины множатся: браузеры становятся новым полем битвы для искусственного интеллекта

Однако это не обязательно полностью негативно.

Откуда взялось столько AI-плагинов?

"AI слишком много, не успеваю использовать все". Это чувство тревоги не беспочвенно. Предложение действительно взорвалось: в 2023 году количество AI-проектов на GitHub выросло на 59,3%; число разработчиков на AI-платформе Hugging Face увеличилось в четыре раза.

a16z проанализировала использование веб-продуктов AI пользователями. Среди топ-50 продуктов 28% относятся к генерации контента (включая текст, изображения, видео, музыку), 22% - к редактированию контента, 14% - к инструментам повышения продуктивности, 10% - к универсальным интеллектуальным помощникам (таким как ChatGPT, Claude и др.). На мобильных устройствах ситуация иная: пользователи предпочитают универсальных помощников (интерфейс AI-чата сразу при запуске).

Веб-продукты подходят для более сложных, многоэтапных рабочих процессов. В категории продуктивности шесть из семи продуктов предлагают расширения для браузера Chrome или даже существуют только в виде расширений. Логика расширений заключается в "синхронном выполнении" - пользователю не нужно покидать используемое программное обеспечение, что значительно снижает трение при переключении между несколькими веб-страницами или приложениями.

AI должен быть разработан максимально близко к пользователю, лучше всего встроенным в среду использования. Это предпосылка для эффективного использования AI.

Однако разработчики не удовлетворены простым внедрением технологии в процесс продукта. AI-приложения быстро развиваются, но имеют короткий жизненный цикл. Топ-50 список a16z обновился на 40% за полгода. QuestMobile отмечает, что активность генеративных AI-приложений в Китае не превышает 20%, трехдневное удержание ниже 50%, а уровень удаления некоторых приложений превышает 50%.

Некоторые AI-приложения перешли от необходимости открывать веб-страницу к постоянно сопровождающим плагинам - это способ более легкого внедрения. Браузер остается важным входом трафика, а поиск - одной из самых универсальных и частых интернет-потребностей. Эти плагины захватывают территорию в интерфейсе браузера, стремясь стать "входом", чтобы решить проблему роста пользователей.

Плагины (когда-то) были королями

В 2008 году Chrome был еще новичком по сравнению с IE, занимавшим 60% мирового рынка. Но его рост был стремительным - от 5% в 2009 году до 15% в 2010 году и 31% в 2012 году... Открытая экосистема Google резко контрастировала с закрытостью Microsoft того времени. Расширения (плагины) сыграли в этом важную роль.

В рамках установленной структуры разработки сторонние разработчики могли реализовать функции с минимальными усилиями. Все больше разработчиков привлекались, создавая богатую функциональность, преодолевающую "ограничения" браузера. Люди использовали интернет не только для просмотра веб-страниц - например, плагин "Netflix Party is now Teleparty" для стриминговых сервисов позволял людям обсуждать во время просмотра. В комментариях к плагину кто-то благодарил разработчиков за спасение отношений на расстоянии.

Эти плагины, подобные функциональным модам в играх, предлагали улучшенный режим чтения, темный режим, автоматическое согласие на все запросы cookies, улучшенный режим воспроизведения видео... Они действительно учитывали интересы пользователей.

Расширения браузера сопровождали расцвет ПК-интернета. Мобильный интернет отвлек большую часть внимания пользователей, что повлияло на некоторые легкие плагины, превратив их в "приложения". Например, "SimpRead" начинался как плагин для "создания страниц с макетом, подходящим для чтения на китайском языке", затем постепенно расширялся, интегрируя функции аннотации, отложенного чтения, экспорта и т.д., а позже выпустил отдельное приложение.

Мобильные приложения стремятся захватить внимание пользователей, одновременно возводя высокие стены. В этот момент люди осознали, что плагины являются лучшим воплощением "духа интернета" и его последним отблеском.

Это гораздо сложнее, чем просто расклеивать объявления на столбах

В 2019 году компания по безопасности Extension Monitor проанализировала 180 000 расширений в магазине Chrome и обнаружила, что наиболее часто используемые категории включают: блокировку рекламы, коммуникации, покупки, безопасность, менеджеры паролей и т.д., в основном функциональные.

Относительно разработки потребительских приложений для генеративного AI всегда ведется дискуссия: учитывая быстрое развитие крупных моделей, не перекроют ли более мощные базовые технологии существующие "украшения" на уровне приложений? Это вызов для разработки программного обеспечения - можно ли отбросить бремя "разработки приложений" и решать реальные проблемы пользователей, выясняя, где и как AI должен "помогать" людям.

Ситуация несколько отличается от предыдущей. На этот раз AI-плагины должны хорошо сочетаться со сценариями использования, чтобы создавать ценность для пользователей.

Возьмем "поиск" в качестве примера. Во время GoogleI/O вице-президент, отвечающий за поиск Google, поделился своими наблюдениями за поведением пользователей: "Когда пользователи не знают точно, что искать, они обычно начинают с широкого вопроса, получают вдохновение из результатов поиска, копают глубже и задают новые вопросы".

В то же время за каждым запросом стоит намерение: что делать с найденной информацией? Составить план, сделать презентацию? Или изменить стиль языка и составить пресс-релиз? И так далее (это также рассматривается как революция AI-поиска по отношению к традиционным поисковым системам).

Эти плагины, которые выскакивают после выделения текста, имеют основной пользовательский сценарий "сопровождение чтения". Пользователи при просмотре веб-страниц могут выборочно попросить плагин объяснить, искать, переводить, обобщать, расширять, преобразовывать в посты для Xiaohongshu и выполнять другие операции - реорганизовывать и доставлять информацию вокруг основного поискового запроса.

В дизайне продукта некоторые плагины размещают несколько часто используемых функций в плавающей панели инструментов при выделении текста. Например, Doubao даже позволяет пользователям настраивать "навыки" (эквивалент создания бота или GPTs) и добавлять их. Другие функции перечислены в боковой панели.

Некоторые следуют "принципам дизайна" плагинов, например, Kimi, более лаконичный и "радикальный". AI автоматически "распознает намерения пользователя" и "понимает контекст". Пользователи тестировали: одна плавающая кнопка, одно окно - не только объясняет, переводит, но и решает математические задачи. Kimi также настроен так, что вызов плавающей кнопки справа позволяет обобщать страницу и вести диалог с вопросами.