Googleは最新AIモデル「Gemini 2.0」を含む複数の革新的な開発を発表しました。高性能かつ高速なGemini 2.0に加え、より自律的な検索とレポート作成まで行うDeep Researchのほか、リアルタイム音声会話AIの「Project Astra」とエージェント「Project Mariner」が実現する未来についても言及しています。
Gemini 2.0とは
Gemini 2.0は、Google開発の最先端AIモデルです。このモデルは、マルチモーダル機能を備え、テキスト、画像、音声、動画、コードといった多様なデータ形式をシームレスに理解・生成することが可能です。これにより、さまざまなタスクや応用分野での柔軟な対応が実現します。全ユーザーに試験的に提供されています。
- ネイティブなマルチモーダル対応: Gemini 2.0は、テキストだけでなく、音声や画像の出力をネイティブにサポートしており、ユーザーインターフェースとのインタラクションがさらに自然になっています。
- 高度な推論能力: ロングコンテキストの理解や複雑な指示への対応能力が大幅に向上し、ユーザーが抱える多段階の課題を効率的に解決します。
- リアルタイム処理: 新開発の「Multimodal Live API」により、リアルタイムでの音声や動画ストリーミング入力が可能となり、動的なアプリケーション構築が加速します。
- トレーニング基盤: 第6世代TPU「Trillium」によるトレーニングと推論が可能で、処理速度と効率が飛躍的に向上しています。
Deep Researchについて
Deep Researchは、Gemini Advancedで提供されるAIリサーチアシスタント機能です。この機能は、複雑なトピックを調査し、包括的で整理されたレポートを生成することで、ユーザーの時間を大幅に節約します。
入力された質問を基に複数ステップの調査プランを自ら作成し、ユーザーの承認後に詳細なリサーチを開始します。Web全体から関連情報を収集し、複数回の分析サイクルを経て包括的なレポートを作成します。レポートには、元の情報源へのリンクが付属しており、さらに詳細を調べることができます。
Deep Researchは、デスクトップおよびモバイルウェブ版のGemini Advanced(有料ユーザー)で提供が開始されており、2025年初頭にはモバイルアプリでも利用可能になる予定です。
Project Astraとは
Project Astraは、普遍的なAIアシスタントの可能性を探るリサーチプロトタイプです。Gemini 2.0を基盤に開発されており、日常生活のタスクを支援するための新機能が多数導入されています。
複数言語や混合言語での会話が可能で、Google検索、レンズ、マップとも連携します。セッション中の記憶は保持し過去の会話履歴を基に、ユーザーに最適化された応答を提供します。
Project Marinerとは
Project Marinerは、ブラウザを起点としたエージェントのプロトタイプです。Web上での複雑なタスクを自動化・支援することを目指しています。ブラウザ画面上の情報(テキスト、画像、コード、フォームなど)を解析し、人間に変わってブラウザを操作します。Chrome拡張機能を通じたエージェント操作で、ユーザーのタスク完了を支援します。
WebVoyagerベンチマークでは、エンドツーエンドのタスク性能で83.5%という高い成功率を記録。しかし、精度やタスク速度にはさらなる改善が必要です。
ユーザー操作を必須とするプロセス設計や外部リスクへの対策が進められています。テスターによる初期運用が開始され、ブラウザ操作の実用性向上が期待されています。
「Gemini 2.0」について一言
OpenAIが12日連続で開発成果を発表していますが、それを吹き飛ばすようなインパクトのプレスを1発で盛りだくさんやってきました、さすがGoogleです。
Gemini 2.0flashは、めちゃくちゃ回答速度が速いです。しかし目玉はDeep Researchでしょう。AI検索の分野ではPerplexityが先行しています。PerplexityはProモードという自律的に幾つもの情報ソースを取りに行く仕組みが実装されていましたが、Googleでも同じことができるようになりそうです。しかもレポート作成&出所付きときたら、かなり可能性を感じます。
加えて、Project Astraです。これはChatGPTのVoice Engineのようなもので、リアルタイムに異なる言語でも会話が可能なものです。どちらかというと期待が持てるのがProject Marinerで、かなり自律的にウェブ上を回遊して指示した作業を遂行できるようです。エージェントの可能性を感じさせます。
出所:Gemini 2.0: エージェント時代に向けた新しい AI モデル、Try Deep Research and our new experimental model in Gemini, your AI assistant