这么多AI插件,都是从哪儿蹦出来的?
"AI太多,用不过来了。"这种焦虑感并非没有根据。供给端确实迎来爆发,2023年Github上AI项目数量增长59.3%;AI开源社区Hugging Face上开发者数量涨了四倍。
a16z统计了用户对网页端AI产品的使用情况。在Top50产品中,28%属于内容生成类(包括文字、图片、视频、音乐),22%是内容编辑,14%是生产力工具,10%是通用智能助手(如ChatGPT、Claude等)。移动端则不同,用户更偏向使用通用助理(开屏就是一个AI Chat的聊天界面)。
网页产品适合做更复杂的、多步骤的工作流。在生产力类别中,七款产品中有六款提供了Chrome浏览器插件,或甚至只有插件版。插件的合理性在于"同步运行",不需要用户离开正在使用的软件,大大减少了在多个网页或应用之间跳转的摩擦感。
AI应该设计得尽量贴近用户,最好能嵌入使用环境。这是AI能否被用好的一个前提。
然而,开发者并不满足于仅仅将技术融入产品流程。AI应用迭代快,但生命周期短。a16z的Top50榜单半年内就换了40%的新面孔。QuestMobile指出,国内生成式AI应用活跃率均在20%以下、三日留存均在50%以下、部分app的卸载率在50%以上。
一些AI应用从需要打开网页才能使用,变成随时陪伴的插件产品,这是为了以一种更轻巧的方式实现落地。浏览器仍然是重要的流量入口,搜索又是最通用和高频的互联网需求之一。这些插件在浏览器界面上抢占地盘,尽量往"入口"做,是为了解决用户增长的问题。
插件(曾经)为王
2008年,Chrome还只是一个稚嫩的后辈,相比拥有60%全球份额的IE浏览器。但它增长势头很猛——从2009年的5%,2010年的15%,到2012年的31%……谷歌打造的开放生态,与当时微软保持封闭形成鲜明对比。其中,扩展程序(插件)功不可没。
在既定的开发框架下,第三方开发者用少量开发工作就能实现功能。越来越多的开发者被吸引而来,创造丰富的功能打开了浏览器的"局限"。用户在上网,但不仅是浏览网页——例如,一个为Netflix、Hulu等流媒体设计的插件"Netflix Party is now Teleparty",以浮窗形态让人们边看边讨论。有人在插件评论区说,感谢开发者,挽救了一对异地情侣。
这些像游戏里功能性mod的插件,能提供更好的阅读模式、暗黑模式,自动同意所有的cookies请求、更好的视频播放模式……真的站在用户角度考虑。
浏览器插件伴随PC互联网走过繁荣。移动互联网分走了用户大部分精力,影响了一些轻巧插件进而"App化"。例如,"简悦"一开始只是一个"生成适合中文阅读的排版页面"的插件,后来它逐渐厚重,功能集成了标注、稍后读、导出等,再后来它推出了独立应用。
移动端应用尽量抢占用户精力的同时,也竖起高墙。这时候人们反应过来,插件才是"互联网精神"的最好注脚,也是最后的余晖。
这绝不是电线杆上贴海报那么简单的事情
2019年,安全公司Extension Monitor对Chrome商店18万个扩展插件进行了统计,发现人们常用的有这几类:广告拦截、通讯、购物、安全、密码管理器等,偏功能性的居多。
关于生成式AI的C端应用开发,一直有一个讨论:大模型迭代如此之快,更强的底层技术出现之后,是否会覆盖现有在上层应用上的"雕花"?对于软件开发是一个挑战,能否抛开"App开发"的包袱,解决用户的实际问题——搞清楚AI应该在哪里、怎么给人"打下手"。
与之前的状况略有不同。这一次AI插件,需要与场景做好结合,才能产生用户价值。
以"搜索"为例。GoogleI/O期间,负责Google搜索的副总裁分享他所观察到的用户行为习惯,"用户不明确要搜什么的时候,通常从一个宽泛问题开始,从搜索结果中得到启发,挖掘,再提问。"
同时,每一次查询背后都有意图,下一步用找来的信息做什么?是总结成大纲,写成PPT?或者改变语言风格,汇成新闻稿?等等(这也看作今天AI搜索对传统搜索引擎的颠覆)。
这些划线后就会争相跳出的插件,核心用户场景就是"伴读"。用户在浏览网页时,能对内容有选择性地让插件做解释、搜索、翻译、总结、扩写,一键转小红书文案等操作——重新组织和交付信息,围绕核心搜索诉求展开。
在产品设计上,一些插件会把常用的几个功能摆出来,放入划线处悬浮工具条里。比如豆包,甚至还能让用户自定义"技能"(相当于创建一个bot,或GPTs)并添加进去。而其他更多功能则列入侧边栏里。
一些遵从了插件的"设计原则",比如Kimi,更为简洁和"激进"。AI会自动"识别用户意图"和"理解上下文",有网友测了,一个悬浮按钮一个窗口,不仅能做解释,能翻译,还能解数学题。Kimi另外设置了,呼出右边的悬浮按钮,对页面进行总结和提问对话。