グーグルが大規模言語モデルを全面的に展開:オープンソース、多様性、商業化を同時に推進

グーグルは自社の戦略をさらに強力に推進する準備をしています。

Googleの2024年I/O Connect China開発者会議では、AI大規模言語モデルの多様化が重要な焦点となりました。

Googleはアプリ開発向けに3つの異なるGeminiモデルバリアントを紹介しました:

  • Gemini Nano:デバイス上のタスクに最も効率的なモデル
  • Gemini 1.5 Flash:大量のタスクに最速かつ最も経済的なモデル
  • Gemini 1.5 Pro:全開発者に開放、200万トークンのコンテキストウィンドウをサポート

Gemini 1.5 ProとGemini 1.5 Flashは、計算要件を削減するためのコンテキストキャッシングを導入しました。

GoogleはまたGeminiの姉妹モデルであるGemmaを、新しい9Bと27Bパラメーターバージョンで発表しました。27Bバージョンは、Google Cloud上の単一NVIDIA GPUまたはVertex AI上の単一TPUで実行できるように最適化されています。

Geminiモデルは現在、Android Studio、Chrome DevTools、Project IDX、Colab、VS Code、IntelliJ、Firebaseなどの開発ツールに統合され、コーディング、デバッグ、テスト、ドキュメント作成、コード理解を支援します。

Flutterについては、Google はFlutter 3.24とDart 3.5をリリースし、新しい「Flutter GPU」APIの早期プレビューを提供しています。これにより、開発者はDartコードを使用してGPUにアクセスし、グラフィックスレンダリングを改善できます。

GoogleはFlutter_Sceneなど、3Dプロジェクトをインポートするための新しいパッケージもいくつかリリースしました。

ブラウザ上で完全に動作するAndroid Studio ON IDXの早期プレビューが紹介されました。Firebase AI MonitoringやChecks AI Safetyなどの新コンポーネントがリリースされ、AI搭載アプリの構築時の信頼性、コンプライアンス、セキュリティを確保します。

オープンソースLLMについては、Googleはプロジェクト Oscarを立ち上げ、初期段階では93,000のコード提出と2,000人の開発者を持つGoプロジェクトをサポートします。

ウェブ開発については、Googleは以下を紹介しました:

  • 即時ナビゲーションのためのSpeculation Rules API
  • ページ遷移を改善するView Transitions API
  • 開発効率を高めるGemini統合Chrome DevTools

Android ネイティブアプリ開発については、新しい提供内容に以下が含まれます:

  • オンデバイスのGemini Nanoモデルと AI Core システムサービス
  • クロスプラットフォームのコード共有のためのKotlin Multiplatform
  • Jetpackライブラリにマルチプラットフォームサポートを追加
  • リモートデバイステスト用のAndroid Device Streamingベータ版
  • Android Studioの安定版へのGemini統合

クラウド開発については、Googleは新しいアプローチを概説しました:

  • コンテキストキャッシングなどの新しいVertex AI機能
  • Gemini、Gemma、Anthropic Claude、Meta Llama、Hugging Faceモデルを含む150以上の新モデル
  • 最適化されたPostgreSQLとBigQuery Omniによるクロスクラウド機能
  • 45分でのインフラ自動セットアップ
  • Gemini Code Assist IDEプラグインとデータベース統合

Googleは自社のLLMの商業化を推進していますが、出力品質と検索能力にはまだ改善の余地があります。最近のテストでは、論理的推論や数学問題解決に問題があることが示されています。

さらに、AIの急速な成長により、データセンターの電力消費と炭素排出量が増加しており、対処が必要な環境課題をもたらしています。