AI プラグイン乱立:ブラウザが人工知能の新たな戦場に

しかし、これは必ずしも全て悪いことではありません。

これほど多くのAIプラグインは、どこから出てきたのか?

「AIが多すぎて、使いこなせない。」このような不安感は根拠のないものではありません。供給側は確かに爆発的な成長を迎えており、2023年にはGithub上のAIプロジェクト数が59.3%増加し、AIオープンソースコミュニティHugging Face上の開発者数は4倍に増加しました。

a16zはユーザーのウェブベースAI製品の使用状況を統計しました。トップ50製品のうち、28%がコンテンツ生成(テキスト、画像、動画、音楽を含む)、22%がコンテンツ編集、14%が生産性ツール、10%が汎用インテリジェントアシスタント(ChatGPT、Claudeなど)でした。モバイル端末では異なり、ユーザーは汎用アシスタント(起動画面がAIチャットのインターフェース)を使用する傾向が強くなっています。

ウェブ製品は、より複雑な多段階のワークフローに適しています。生産性カテゴリーでは、7つの製品のうち6つがChromeブラウザ拡張機能を提供しており、中には拡張機能版のみのものもあります。プラグインの合理性は「同期実行」にあり、ユーザーが現在使用しているソフトウェアを離れる必要がなく、複数のウェブページやアプリケーション間の切り替えの摩擦を大幅に減らします。

AIはユーザーにできるだけ近づくように設計され、使用環境に組み込まれることが理想的です。これはAIが適切に使用されるための前提条件の一つです。

しかし、開発者は技術を製品プロセスに統合するだけでは満足していません。AIアプリケーションの反復は速いですが、ライフサイクルは短いです。a16zのトップ50リストは半年で40%の新顔に入れ替わりました。QuestMobileによると、中国国内の生成型AIアプリケーションのアクティブ率はすべて20%以下、3日間の保持率は50%以下、一部のアプリのアンインストール率は50%以上となっています。

一部のAIアプリケーションは、ウェブページを開く必要があったものから、常に付き添うプラグイン製品に変わりました。これは、より軽量な方法で実装するためです。ブラウザは依然として重要なトラフィック入口であり、検索はインターネットの最も一般的で頻繁なニーズの一つです。これらのプラグインがブラウザインターフェース上で領域を確保し、できるだけ「入口」に近づこうとしているのは、ユーザー成長の問題を解決するためです。

プラグインが(かつて)王者だった

2008年、Chromeはまだ未熟な後発ブラウザで、世界シェア60%を持つIEブラウザと比べると小さな存在でした。しかし、その成長は急速でした - 2009年の5%から2010年の15%、2012年には31%に...。Googleが構築したオープンエコシステムは、当時のMicrosoftの閉鎖的なアプローチと鮮明な対比を成しました。その中で、拡張機能(プラグイン)が大きな役割を果たしました。

既定の開発フレームワークの下で、サードパーティ開発者は少ない開発作業で機能を実現できました。より多くの開発者が引き寄せられ、豊富な機能がブラウザの「制限」を打ち破りました。ユーザーはウェブサーフィンをしていましたが、単にウェブページを閲覧するだけではありませんでした - 例えば、Netflix、Huluなどのストリーミングサービス向けに設計されたプラグイン「Netflix Party is now Teleparty」は、フローティングウィンドウ形式で人々が視聴しながら議論することを可能にしました。プラグインのレビュー欄で、ある人は開発者に感謝し、遠距離恋愛カップルを救ったと述べています。

これらのゲームの機能性MODのようなプラグインは、より良い読書モード、ダークモード、すべてのクッキーリクエストの自動承認、より良いビデオ再生モードなどを提供し...本当にユーザーの視点に立って考えられています。

ブラウザプラグインはPC向けインターネットの繁栄期を共に歩みました。モバイルインターネットがユーザーの大部分の注意を奪い、一部の軽量プラグインが「アプリ化」する影響を与えました。例えば、「Simpread」は最初、「中国語の読書に適したレイアウトページを生成する」だけのプラグインでしたが、徐々に機能が豊富になり、注釈、後で読む、エクスポートなどの機能が統合され、その後独立したアプリケーションをリリースしました。

モバイルアプリケーションがユーザーの注意を奪おうとする一方で、高い壁を築きました。この時、人々は気づきました。プラグインこそが「インターネットの精神」を最もよく体現するものであり、最後の輝きでもあると。

これは電柱にポスターを貼るような単純なことではない

2019年、セキュリティ会社Extension MonitorがChromeストアの18万の拡張機能プラグインを統計分析したところ、人々が頻繁に使用するのは以下のカテゴリーであることがわかりました:広告ブロック、通信、ショッピング、セキュリティ、パスワードマネージャーなど、機能性の高いものが多くを占めています。

生成型AIのコンシューマー向けアプリケーション開発については、常に議論がありました:大規模モデルの反復が非常に速い中、より強力な基盤技術が登場した後、既存の上層アプリケーションの「装飾」を覆すことになるのでしょうか?ソフトウェア開発にとっては課題であり、「アプリ開発」の負担を捨てて、ユーザーの実際の問題を解決できるか - AIがどこで、どのように人を「補助」すべきかを明確にすることです。

以前の状況とは少し異なります。今回のAIプラグインは、シーンとうまく組み合わせてこそ、ユーザー価値を生み出すことができます。

「検索」を例に取ると、GoogleI/O期間中、Google検索担当の副社長が観察したユーザーの行動習慣を共有しました。「ユーザーが何を検索したいかはっきりしない場合、通常は広範な質問から始まり、検索結果からインスピレーションを得て、掘り下げ、さらに質問します。」

同時に、各クエリの背後には意図があります。次に、見つけた情報で何をするのか?アウトラインにまとめるのか、PPTを作成するのか?あるいは言語スタイルを変更して、ニュースリリースにまとめるのか?など(これも今日のAI検索が従来の検索エンジンに対して革新的であることを示しています)。

これらの下線を引いた後に競って現れるプラグインの核心的なユーザーシーンは「読書の伴侶」です。ユーザーがウェブページを閲覧する際、コンテンツを選択的にプラグインに解説、検索、翻訳、要約、拡張、ワンクリックで小紅書(中国のSNS)の文章に変換するなどの操作ができます - 情報を再構成して提供し、核心的な検索ニーズを中心に展開します。

製品設計において、一部のプラグインは頻繁に使用される機能をいくつか表示し、下線部分のフローティングツールバーに配置します。例えば、豆包(Doubaobao)は、ユーザーが「スキル」(ボットやGPTsの作成に相当)をカスタマイズして追加することさえできます。その他の多くの機能はサイドバーにリストアップされています。

Kimiのように、プラグインの「設計原則」に従ったものもあり、よりシンプルで「急進的」です。AIは自動的に「ユーザーの意図を識別」し「コンテキストを理解」します。ネットユーザーのテストによると、1つのフローティングボタンと1つのウィンドウで、説明だけでなく、翻訳や数学の問題解決もできます。Kimiはさらに、右側のフローティングボタンを呼び出して、ページの要約や質問対話を行うように設定しています。