OpenAIは、複雑な問題に対して強力な推論能力を発揮する新しいAIモデルシリーズ「OpenAI o1-preview」を発表しました。9月12日より、ChatGPTおよびAPIユーザー向けにプレビュー版がリリースされ、定期的な更新と機能拡張が予定されています。
【無料配布中】「企業版AIの導入アプローチ」
ChatGPT、Copilot、ExabaseといったAI関連ツールが多くサービス提供される中で、企業におけるAI導入アプローチを俯瞰的に整理しています。どのようなタイプのツールがあり、結局何を使ったら良いのか、シンプルかつ感覚的に、かつ短時間で理解されたい方におすすめです。
OpenAI o1の概要
OpenAIは、難しい問題を解決するための次世代推論モデルシリーズ「OpenAI o1-preview」をリリースしました。既存のGPTシリーズよりも複雑なタスクに対応できるモデルが登場し、科学、コーディング、数学分野で特に効果を発揮します。さらに、OpenAIは「o1-mini」という、より高速で安価なバージョンも同時にリリースし、幅広い開発者が利用可能です。
現時点では、GPT-4oまでで実装されていたウェブ検索やコードインタープリターといった機能はありませんが、随時実装されていきます。
この新しいAIモデルは、ChatGPTとAPI経由で9月12日より利用可能となり、プレビュー版として提供される予定です。「o1-preview」および「o1-mini」は、ChatGPT PlusおよびTeamユーザーがすぐに利用できるようになり、ChatGPT EnterpriseやEduユーザーには翌週からアクセスが提供される予定です。また、API経由では開発者がプロトタイプを作成することが可能で、さらなるテストを通じて制限が緩和されていく見込みです。
OpenAI o1の特徴
「OpenAI o1-preview」は、従来のモデルに比べて大幅に改善された推論能力を持ち、特に複雑な科学や数学の問題に対して優れたパフォーマンスを発揮します。例えば、国際数学オリンピックの予選試験では、GPT-4oが13%の正答率にとどまった一方で、新しい推論モデルは83%のスコアを記録しました。また、コーディング能力においても、Codeforcesコンテストで89パーセンタイルを達成するなど、実際のプログラム作成においても高い成果を示しています。
さらに、安全性の観点からも大幅な進展が見られます。「OpenAI o1-preview」は、モデルが適切な推論を行い、安全ルールを遵守するように設計されており、最も厳しい「ジェイルブレイク」テストでは84点を獲得しました(ユーザーが危険な出力をさせようとした場合、どこまでチャットが安全ルールに従い続けるか)。この点数は従来のGPT-4oの22点を大きく上回っており、新しいモデルが安全性の面でも高い信頼性を持っていることが示されています。
OpenAIは、安全対策の強化にも力を入れており、米国および英国のAI安全研究所とのパートナーシップを通じて、モデルの事前評価やテストを徹底しています。これにより、AIの安全性と信頼性の向上が図られています。
「OpenAI o1」について一言
「Q*」や「Strawberry」といったコードネームで呼ばれていたOpenAIの新型モデルが発表されました。
使ってみると、これまでのChatGPTと比較して応答時間が長く取られており、筋道立てて思考が行われている様子が伺えました。プロンプトのテクニックとして推奨されていたChain of Thought(依頼に対して、考える道筋を明示することで出力の精度を向上させること)が、モデル内に内蔵されたようにも見えます。
パフォーマンスが向上されたとのことですが、文章作成のような日常のタスクではあまり差を実感できませんでした。数学や化学といった複雑かつ高度なレベルのタスクでは定量的な優位性が示されているので、おそらく高度なホワイトカラー業務に従事する人により恩恵を与えるモデルなのだと思います。知能レベルの高度化がある一定水準に達しつつあると仮定すると、今後のモデル開発では、独自性(自分ならではの表現)、経済性(安く、早い出力)といった方向性が重視されるかもしれません。