AI大規模モデルの方向性の区分
現在、多くの企業がAIを活用する方法は、汎用言語大規模モデルを使用し、自社の業界データで訓練した後、差別化されたアプリケーションと呼ぶことです。しかし、これは近道かもしれません。Zapierの共同創業者Mike Knoopは、言語大規模モデルを拡大することは本質的に「記憶」という形の知性の発展を促進するだけであり、知能とは区別されると考えています。企業のシナリオやニーズを理解できないため、AIの価値を十分に発揮することもできません。
また、GPU計算能力の投入増加と言語大規模モデルの能力向上の曲線には、限界収益逓減の可能性があります。公開された簡単なデータが使い果たされた後、汎用言語大規模モデルに依存してAI分野で追い越すことは幻想となるでしょう。
企業にとってはさらに不利です。企業は新技術を追求する過程で、しばしば本末転倒になります。最初は具体的な問題を解決しようとしますが、結果的に概念追跡戦になり、最も根本的な問題を忘れてしまいます。
この問題を解決する方法はAI企業の手中にあります。Benchmarkのパートナーであるサラ・タベルは、最適な発展方向は顧客の具体的なニーズに基づいて大規模モデルの起業を行うことだと考えています。Scale AIの共同創業者Alex Wangは、データがAIモデルのパフォーマンスのボトルネックであり、アルゴリズムや計算ではないと考えています。データは最終的に複数の垂直産業から来るため、AI企業は業界分野に深く入り込み、企業のニーズに合った業界大規模モデルを開発すべきです。
このプロセスには2つの重要なポイントがあります:
-
データの問題:AI企業はユーザーと業界を「理解」する必要があります。多くの企業が十分に活用されていない大量のデータコーパスを持っています。
-
管理と反復の問題:業界とシナリオの多様性のため、現在は1つの企業がすべての分野にまたがって大規模モデルを構築することは難しいです。
第四パラダイムとZapierのMike Knoopは、自動化を重要なポイントとして指摘しています。技術面では、AutoML、プログラム合成、ニューラルアーキテクチャ検索はすべて自動化と最適化プロセスに関わり、人間の介入を減らし、効率と効果を向上させます。Mike Knoopは、AGIの探求はプログラム合成とニューラルアーキテクチャ検索に基づく必要があると考え、第四パラダイムの創業者戴文渊は、無数の業界大規模モデルを構築する基盤技術はAutoMLであると述べています。
戴文渊はAutoMLを「失敗のアート」と呼び、第四パラダイムが多くのシナリオを経験し、データとモデルを特定のシナリオのニーズに近づける方法を理解しているため、より大きな価値を発揮できると述べています。成功は成果に転換され、失敗は養分となり、自動化に基づいて反復を加速します。Alex Wangが言うように、「機械学習はガベージイン・ガベージアウトのフレームワークです。」しかし、高品質の業界データと継続的な誤り修正能力があれば、最終的に業界大規模モデルの信頼できる実装が実現されるでしょう。
異なるAIモデルを作る:アイデア、アプローチ、展望
OpenAIに代表される一部の汎用大規模モデルに専念する企業は、横方向に発展する傾向があり、大規模モデルがすべてです。ビジネスモデルでは、単純に大規模モデルの能力を販売しています。これに対し、第四パラダイム、Gleanなどの企業は別の道を歩んでおり、AI技術を利用して企業の特定の側面での意思決定を支援し、全体的な作業効果を向上させています。彼らのビジネスモデルも異なります。
Gleanは、AI技術に基づいて構築された企業検索と知識管理プラットフォームを提供し、複数のサードパーティアプリケーション機能を統合して、ワークフローの一部となっています。また、企業が自社のデータを使用して専用のAIモデルを訓練することも可能で、Gleanが独自に開発した「信頼できる知識モデル」に基づいています。
第四パラダイムは、業界のコアビジネス問題の予測管理にさらに深く関与しています。その業界大規模モデルプラットフォーム「先知AIOS 5.0」は、各業界のシナリオのXモーダルデータに基づいて、業界の基盤大規模モデルを構築します。能力面では「Predict the Next X」に重点を置いており、Xは各主要業界のロジックと結果を表します。使用面では、低いハードルのモデリングツール、科学者イノベーションサービスシステムなどの能力を提供し、エンドツーエンドの業界大規模モデル構築、展開、管理サービスを実現します。
これは中国のAI企業が産業背景に基づいて発展した典型的な例です。戴文渊は、中国には大量のシナリオとデータの優位性があり、十分な数のシナリオをカバーした後、これらのモデルを組み合わせることでAGIも実現できる可能性があると考えています。これに対し、多くの人気のある業界大規模モデルはまだ業界大規模言語モデルであり、大きいが精密ではありません。より正確なシナリオに分割すると、表面上は多くの大規模モデルを構築する必要がありますが、各正確なシナリオのデータ量負荷は限られており、自動化技術の助けを借りて、むしろ別の道を開いてAGIのアプリケーションレベルでの発展を実現しました。
Mike Knoopは、AGIが急速な進歩の後に上昇の障害に遭遇したのは、言語大規模モデルに過度に依存し、AGIを大部分の作業を完了できるシステムと定義したためだと考えています。しかし、AGIは実際には新しい能力を効率的に獲得し、様々なシナリオでのオープンな問題を解決することに重点を置くべきです。
NVIDIAのCEOジェンスン・ファンは、大規模モデルの発展に伴い、コンピューターが指示駆動から意図駆動に移行し、「将来のアプリケーションが行うことと実行することは、私たちが物事を行う方法と似ており、専門家チームを組織し、ツールを使用し、推論し、計画し、タスクを実行する」と述べています。この論理自体が普遍性を意味し、大規模モデルは物理的な世界に入りつつあります。なぜなら、物理的な世界の意思決定も同様に追跡可能だからです。
Palantirのような類似の例があります。元々はTo Gの大データ企業で、データ分析とモデリングシミュレーションに基づいて意思決定を支援していました。生成型AI技術により、データ処理方法が変化し、自動化とデータ駆動の意思決定において顕著な進歩を遂げ、AI To Bビジネスの開拓を加速しました。第四パラダイムは、確定性のある各シナリオで業界大規模モデルを構築し、企業が自社のアプリケーションを把握し、効果的な意思決定を行うのを支援しています。