AIアシスタントGeminiがグーグルのエコシステムに登場:52億台のデバイスにスマート革命が到来

グーグルがGemini Live音声モデルを発表し、OpenAI製品と直接競合する。

グーグルは音声モード「Gemini Live」を正式に発表し、Geminiモバイルアプリケーションで近日中に提供開始すると発表しました。これは、グーグルとOpenAIのAI音声アシスタント分野における競争が再び激化したことを示しています。

Gemini Liveは、自然言語での対話をサポートし、人間のような声とリズムで応答する全く新しいモバイル対話体験です。10種類の音声から選択でき、ハンズフリー機能をサポートし、いつでも会話を中断したり話題を変更したりできます。現在、英語版がAndroidデバイスで提供されており、iOS版と他の言語サポートは今後数週間以内に提供される予定です。

OpenAIと比較して、グーグルは提供速度と潜在的なユーザー規模の両面で優位に立っています。Gemini Liveは、世界中の30億以上のAndroidユーザーと22億のiOSユーザーを対象としています。ただし、ライブデモンストレーション中に2回の小さなトラブルが発生し、機能にはまだ改善の余地があることが示されました。

グーグルは、GeminiがAIアシスタントを再定義し、複数のグーグルアプリケーションやツールと統合して様々なタスクを完了できると述べています。将来的には、KeepやTasksなど、さらに多くの拡張機能が提供される予定です。

Androidシステムでは、ユーザーは電源ボタンを長押しするか、音声でGeminiを起動できます。画面の内容を理解し、現在使用中のアプリケーションと対話することができます。グーグルはまた、応答速度と品質を向上させるために新モデル「Gemini 1.5 Flash」を導入しました。

さらに、グーグルはImagen 3ベースのAI画像生成アプリ「Pixel Studio」も発表しました。

総じて、グーグルはAIアシスタントの開発を全力で推進し、OpenAIやアップルとの競争で先手を打とうとしています。