OpenAIが新型推論モデル「o3-mini」をリリース:STEM分野で進化する小型AIの可能性

o3-mini

OpenAIがコストパフォーマンスに優れた新しい推論モデル「o3-mini」をリリースしました。数学や科学、コーディングといったSTEM分野での推論性能をさらに高めながら、低コストと低レイテンシを保つこのモデルは、小規模AIの限界を押し広げる存在として注目を集めています。ChatGPTはもちろん、開発者向けのAPIとしても利用可能になっており、無料プランのユーザーでも特定の操作を行うことで試せる点が特徴です。チャット制限の緩和や応答速度の向上も相まって、従来の軽量型推論モデル「o1-mini」を大きく上回るスペックが期待されています。

2024年AIニュース完全ガイド
目次

o3-miniの概要

o3-miniは、STEM領域への高い適性を重視して設計されながら、コストと応答速度の両立を追求した新型モデルです。推論時の負荷を低・中・高の三段階で切り替えられるため、用途や状況に合わせた柔軟な運用が可能です。

また、o3-miniは開発者向けのストリーミング出力にも対応しており(データのリアルタイム出力)、一部のAPI利用者を対象に、Chat Completions APIやAssistants API、Batch APIといった仕様が展開される予定です。低コストかつ低レイテンシで優れたSTEM推論を目指す開発者にとっては、魅力的な選択肢となるでしょう。

さらに、ChatGPT内で一般ユーザー向けの提供もあり、o1-miniでは日あたりのメッセージ制限が50だったPlusやTeamユーザーでも、o3-miniでは150に拡張されたことで作業効率が高まりそうです。無料プランのユーザーも、特定の操作手順を踏むことでo3-miniを試用できるため、高度なSTEMタスクを誰もが気軽に体験しやすくなりました。

o3-miniのパフォーマンス

o3-miniは、競技数学のAIMEや博士レベルの科学問題に対応するGPQA Diamond、コーディングを対象としたCodeforcesなどで優れた成績を示しています。低い推論負荷でもo1-miniと同等の性能を発揮し、中推論レベルでo1並みに匹敵し、高推論レベルではそれを超えるケースさえあることが報告されています。難易度の高い数学や科学の問題を正確に解き、コーディングの複雑な課題にもスムーズに対応する様子が評価されており、これまでの小型モデルよりもさらに一歩進んだ推論能力を備えている点が注目されています。

o3-mini AIME 2024
競技数学のスコア
o3-mini Codeforces
コーディングのスコア

速度面では、o1-miniよりも24%ほど速く応答できるという検証結果があり、最初のトークンが返ってくるまでの時間も大幅に短縮されました。平均で2.5秒程度のレイテンシ削減が確認されており、ユーザーとモデルのやり取りを連続的に行うケースでも快適さが増しています。こうした応答速度の向上によって、複数のやり取りが必要なSTEMタスクや高速な試行錯誤が求められるプログラミング環境において、操作感や生産性がさらに高まると期待されています。実際の使用感に関するテスターやユーザーからの意見でも、難易度の高い質問に対して正確な回答をすばやく提示する点が高く評価されており、今後は小型モデルの可能性をさらに広げる存在として、多彩なユースケースでの活躍が見込まれています。

o3-mini latency
平均出力速度

「o3-mini」について一言

昨年末にOpenAIから発表されていたo3シリーズの中でまずはo3-miniがリリースされました。単純なクオリティで言うとo3が高いのでそこに驚きはありませんでしたが、o3-miniで特筆すべきはそのスピードだと思います。推論系のモデルで先行しているo1が出力するのに5-6秒要するのに対し、o3-miniは体感その半分くらいです。しかもクオリティも同等以上とのこと。o1の出力速度にはストレスを感じていたので、即o3-miniに乗り換え決定です。

あとは、今回のo3-miniがChatGPTの無料ユーザーに提供された、初めての推論系モデルということで、高い精度を誇る推論モデルの民主化という意味においては象徴的な出来事として捉えることができます。今後も更なる高精度モデルo3、コンピューターエージェントOperatorの日本地域でのリリースといったイベントを楽しみにしたいと思います。

出所:OpenAI o3-mini

2024年AIニュース完全ガイド
ProFabサービス資料
シェアをお願いします!

執筆者

慶應義塾大学卒業後、総合化学メーカーを経てデロイトトーマツコンサルティングに在籍。新規事業立ち上げ、M&A、経営管理、業務改善などのプロジェクトに関与。マーケティング企業を経て、株式会社ProFabを設立。ProFabでは経営コンサルティングと生成導入支援事業を運営。

TechTechでは、技術、ビジネス、サービス、規制に関する最新ニュースと、各種ツールの実務的な活用方法について、初心者でも理解できる明瞭な発信を心掛ける。日本ディープラーニング協会の実施するG検定資格を保有。

目次