AgentとChatbotの主な違い:
-
Agentは技術的なソリューションであり、Chatbotはより製品形態に近い。
-
Agentは環境を観察し、計画を立て、出力することができるが、Chatbotは主に対話に基づいている。
-
Agentはより複雑なタスクを処理でき、記憶と推論能力を持つが、Chatbotの機能は比較的シンプル。
-
Agentは必ずしも人間の行動を模倣する必要はなく、大規模言語モデルに基づく補助ツールとなりうる。
-
Agentはツールを使用し、多段階の推論を行えるが、Chatbotは主に単一ターンの対話に依存している。
Agentの主な研究方向:
-
記憶:人間のような短期・長期記憶の実現方法。
-
多段階推論:Agentによる解決か、大規模言語モデルに含めるか。
-
データ合成:十分に豊富で現実的なトレーニングデータの取得方法。
-
汎用能力:人間の能力範囲内のほとんどの作業を理解し実行する。
-
心的モデル:大規模言語モデルとは異なる推論能力の構築。
将来登場する可能性のあるFoundation Agent:
-
ほとんどのアプリケーションを理解し、人間の能力範囲内の作業を実行できる。
-
大規模言語モデルとは異なる心的モデルを持つ。
-
重み付けに基づいて現実世界のタスクについて推論できる。
-
ツールを内蔵している。
-
複雑なAgent構造ではなく、非常に強力なマルチモーダルモデルである可能性がある。
Agent技術の発展における主な課題はデータの問題:
-
現実世界は極めて複雑で、囲碁のような明確なルールがない。
-
大量の高品質で複雑な推論を含むサンプルデータが必要。
-
合成データには膨大なコストがかかり、データ量とコストのバランスをとることが課題。
-
より良いデータ取得・活用方法の探索が必要。例えば、Agentにシミュレーター内で自律学習させるなど。