Googleの新モデル「Gemma 3」:デバイス単体で最先端AIが動く時代に

gemma 3

Google DeepMindが新たに公開したモデル「Gemma 3」は、AI開発における新たな革命です。従来、高性能なAIモデルを利用するためには、多くの計算資源と専門的なインフラが必須でした。Gemma 3は軽量ながらも高い性能を備えており、一般的なスマートフォンやPCに搭載されている単一のGPUやTPUでも簡単に動作します。これにより、個人の開発者から小規模な企業まで、より幅広いユーザーが高度なAI技術を手軽に利用できる時代が訪れようとしています。

目次

Gemma 3とは

ここ数年でAIモデルは急速に進化しましたが、高性能なモデルほど膨大なハードウェア資源を必要とするため、実行環境に制約があり、実用化の障壁になっていました。そこでGoogle DeepMindは、軽量でありながら高性能を発揮するGemmaシリーズを開発しました。Gemma 3はその最新バージョンとして登場し、少ないリソースで動作可能なAIモデルという課題を解決しています。

Gemma 3は、モデルサイズが1B、4B、12B、27Bと複数用意されており、用途や環境に応じて最適なモデルを選択できます。また、最大128Kトークンという非常に長いコンテキストウィンドウに対応しており、長文の文書や複雑なタスクを処理できるのが大きな強みです。さらに、140以上の言語に対応しているため、グローバルなアプリケーションの開発にも非常に有効です。

特に、画像やテキストだけでなく短い動画まで分析可能なマルチモーダルな推論能力を備えており、インタラクティブで直感的なアプリケーションの開発が可能になりました。また、関数呼び出しや構造化出力のサポートによって、シンプルなチャットボットだけでなく、複雑なワークフローの自動化やAIエージェントの構築にも対応できるようになっています。

gemma 3のELOスコア
Gemma 3のELOスコア

開発者視点では、Gemma 3は極めて使いやすい環境を提供しています。Hugging Face、Ollama、PyTorchといった一般的な開発ツールとの高い互換性を持ち、既存の開発フローへの統合も容易です。量子化モデルに対応しており、限られた環境でも迅速かつ効率的に動作します。また、NVIDIAがモデルの最適化をサポートしており、GPUでの性能を最大限に引き出せるようになっています。これにより、迅速なプロトタイピングや製品開発が可能になります。

Gemma 3のリリースと同時に、安全性に配慮されたShieldGemma 2も発表されました。ShieldGemma 2は、画像生成における安全性を担保するためのモデルです。暴力的、性的、危険なコンテンツを自動で検出して安全性を確保します。オープンモデルとして提供されており、開発者側でのカスタマイズも可能です。Gemma 3を利用したアプリケーション開発において安全性の基盤となる重要な役割を果たしています。

「Gemma 3」について一言

言語モデルはパラメーター数の違いから大規模言語モデル(LLM)と小規模言語モデル(SLM)に大別できますが、Gemma 3は後者のSLMです。SLMはコードなどのリソースが軽量なので、PC、モバイルといったデバイスに保存でき、インターネット通信がない場所でも利用できるメリットがあります。同時に計算リソースも節約できるため、GPUやTPUといったハードウェアの確保も少なく済みます。

SLMにはAlibabaのQwen、MicrosoftのPhiなどがあり、LLMと並行して開発が進められています。また、LLMで出遅れている日本勢もいくつかのSLMモデルを提供しています。SLMの普及および市民権を得るモデルの動向について、引き続き注目していく必要がありそうです。

出所:Introducing Gemma 3: The most capable model you can run on a single GPU or TPU

ProFabサービス資料
シェアをお願いします!

執筆者

慶應義塾大学卒業後、総合化学メーカーを経てデロイトトーマツコンサルティングに在籍。新規事業立ち上げ、M&A、経営管理、業務改善などのプロジェクトに関与。マーケティング企業を経て、株式会社ProFabを設立。ProFabでは経営コンサルティングと生成導入支援事業を運営。

TechTechでは、技術、ビジネス、サービス、規制に関する最新ニュースと、各種ツールの実務的な活用方法について、初心者でも理解できる明瞭な発信を心掛ける。日本ディープラーニング協会の実施するG検定資格を保有。

目次