プロジェクトの概要
Google AI Edge Galleryは、モバイルデバイス上(オンデバイス)で動作する最新の機械学習(ML)および生成AIのユースケースを紹介するデモンストレーション・アプリです。ユーザーはクラウドにデータを送信することなく、ローカル環境で直接AIモデルの性能やプライバシー保護機能を体験することができます。
機能・できること
- Agent Skills: Wikipediaの参照やマップ表示など、LLMにツールを利用させるデモ。
- Thinking Mode: モデルが答えを出すまでの推論ステップを可視化。
- Multimodal Ask Image: カメラやギャラリーの画像についてAIに質問。
- Audio Scribe: リアルタイムでの音声文字起こしと要約。
- Prompt Lab: Temperatureなどのパラメータを調整しながらプロンプトをテスト。
リポジトリの構成・注目すべき機能
Google AI Edge (Core API) や LiteRT (旧TensorFlow Lite) をベースにしており、Hugging Faceで公開されているモデルをオンデバイスで効率的に動かすための実装が豊富に含まれています。Android (Kotlin) および iOS (Swift) の両プラットフォーム向けのサンプルが提供されています。
セットアップ・導入のイメージ
リポジトリをクローンし、Android StudioやXcodeでビルドすることで、手元の実機で最新のオンデバイスAIを試すことができます。また、特定のモデル(Gemmaファミリーなど)をダウンロードしてローカル環境に配置する手順が含まれています。
ターゲット層 / 注目ポイント
オンデバイスAIの実装を検討しているモバイル開発者や、プライバシーを最優先するアプリケーションを設計したいエンジニアに最適です。クラウドコストを削減し、オフラインでも動作する次世代AIアプリの可能性を提示しています。
制約とリスク
現在は実験的なベータ版であり、一部の機能(Thinking Modeなど)は特定の最新モデルに限定されています。また、動作にはAndroid 12以上やiOS 17以上の比較的新しいデバイスが必要です。
まとめ
Google AI Edge Galleryは、AIがクラウドからデバイスへとシフトする流れを象徴するプロジェクトです。オンデバイスならではの低遅延・高プライバシーなAI体験を具体的に示す、開発者にとって非常に価値の高いリソースです。