Gemini 2.5 Proリリース:最先端の推論モデル

gemini 2.5 pro

Googleは最先端の推論モデル「Gemini 2.5 Pro」をリリースしました。高い推論力や卓越したコーディング能力を持ち、さまざまなベンチマークでトップクラスの性能を示しています。マルチモーダル対応や長大なコンテキストウィンドウなどGeminiが強みとする特徴はそのままにモデルのパフォーマンスが向上しました。

目次

Gemini 2.5 Proとは

Googleが新たにリリースした「Gemini 2.5 Pro」は、非常に高度な推論能力とコード生成能力を持った最新のAIモデルです。従来モデルと比べて、より複雑で深い思考プロセスを経ることで正確で高品質なアウトプットを生み出します。

特に注目される特徴の一つが、膨大な量の情報を処理可能な最大100万トークンのコンテキストウィンドウです。これまでのAIモデルでは難しかった大量の文脈情報を考慮した深い分析や意思決定が可能です。また、テキスト、音声、画像、動画、コードなど多様な形式のデータを統合的に処理するマルチモーダル性能も備えており、複雑で多様な情報処理を高度に効率化します。

Gemini 2.5 Proは、Google AI StudioやGeminiアプリを通じて利用可能であり、近々Vertex AIにも展開予定です。

Gemini 2.5 Proの性能

Gemini 2.5 Proは、さまざまなベンチマーク(AIの性能を客観的に評価するためのテスト)で優れた成果をあげています。特に注目すべきは推論、数学、科学分野だけでなく、エージェント性能やコーディング分野でのパフォーマンスです。

推論能力を評価する難関ベンチマーク「Humanity’s Last Exam」では18.8%という高い成績を記録し、従来のAIモデルを大幅に上回りました。また、数学・科学領域では、AIME 2024で92%、GPQA diamondで84%という高得点をマークしています。コーディング性能については、コード生成のベンチマーク「LiveCodeBench v5」で70.4%、高度なコード編集性能を評価する「Aider Polyglot」で74.0%という優秀な結果を残しています。さらに、エージェントのコード生成能力を評価する「SWE-bench verified」で63.8%というスコアを達成し、自律的に動作するAIエージェント開発にも大きく貢献しています。マルチモーダルな視覚的推論評価「MMMU」で81.7%、長文脈処理能力を測定する「MRCR」で94.5%を記録するなど、さまざまなタスクで高い汎用性を発揮しています。

Gemini 2.5Proのベンチマーク比較
Gemini 2.5Proのベンチマーク比較

「Gemini 2.5 Pro」について一言

Googleからさらなるハイパフォーマンスな推論モデルGemini 2.5 Proがリリースされました。実際に試してみると、その性能があまりにも高すぎて他のハイエンドモデルとの差が直感的には掴みにくいというのが率直な感想です。モダリティや自律性についてはまだ衝撃を受けますが、頭がよくなるベクトルの性能アップは日頃のタスクのレベルを追い越しているせいかあまり実感が湧かない気がしています。

Geminiの特徴としては圧倒的なコンテキストウィンドウの大きさです。OpenAIのGPTシリーズやClaudeモデルの最大コンテキストウィンドウが約20万トークンであるのに対して、Gemini 2.5 Proは現段階で100万トークンという桁違いの性能を備えています。長いコンテキストを処理する必要があるユースケースにおいては、この高いパフォーマンスと相まって、非常に有用となると思います。

出所:Gemini 2.5: Our most intelligent AI model

ProFabサービス資料
シェアをお願いします!

執筆者

慶應義塾大学卒業後、総合化学メーカーを経てデロイトトーマツコンサルティングに在籍。新規事業立ち上げ、M&A、経営管理、業務改善などのプロジェクトに関与。マーケティング企業を経て、株式会社ProFabを設立。ProFabでは経営コンサルティングと生成導入支援事業を運営。

TechTechでは、技術、ビジネス、サービス、規制に関する最新ニュースと、各種ツールの実務的な活用方法について、初心者でも理解できる明瞭な発信を心掛ける。日本ディープラーニング協会の実施するG検定資格を保有。

目次