AIモデル開発の現状。OpenAIエージェントは年明け発表!?

ai

AI開発の最前線では、モデル性能向上に向けた研究が進められています。モデル開発という面では大規模化に限界が見え始め、多段階の推論による性能向上が研究されています。同時に、AIの次のステップとして話題になっているエージェント(より抽象的な指示で多段階のアクションを自動実行する仕組み)も開発されており、2025年1月にはOpenAIから「Operator」のリリースが予定されているようです。

document ai strategy

【無料配布中】「企業版AIの導入アプローチ」

ChatGPT、Copilot、ExabaseといったAI関連ツールが多くサービス提供される中で、企業におけるAI導入アプローチを俯瞰的に整理しています。どのようなタイプのツールがあり、結局何を使ったら良いのか、シンプルかつ感覚的に、かつ短時間で理解されたい方におすすめです。

目次

モデル性能改善の現状

Bloombergによると、OpenAI、Google、Anthropicはより良いモデルを作ることに苦労しており、コストが上昇しているにもかかわらず進歩が遅れている状況のようです。OpenAIのOrionプロジェクトに関して、2024年9月のモデルは訓練を受けていないコーディングの質問に対して十分な回答ができず、何ヶ月もかけた訓練後の調整にもかかわらず、来年初めまでにユーザーにリリースしたいレベルにはまだ達していないと報告されています。また、Googleの次期Geminiは、社内の期待に応えられておらず、基本的なモデルの改善ではなく画像生成などの機能に重点が置かれています。さらに、Anthropicはモデルのパフォーマンス向上がサイズと運用コストの増加を正当化しないと判断し、Claude 3.5 Opusのリリースを延期し、「近日公開」の記載を削除しました。

これらの企業はAIの進歩について依然として楽観的であり、モデルサイズの拡大だけでなく、AIエージェントや推論の改善といった新しいアプローチに焦点を移しています。OpenAIのCEOであるサム・アルトマン氏は、今年後半に「非常に良いリリース」を行うことを約束しており、これまでのスケーリングに依存しない新たな方向性を模索しています。

参考:OpenAI Nears Launch of AI Agent Tool to Automate Tasks for Users

モデルサイズの限界(スケーリング)について言及する別のソースもご紹介します。これまでは大規模言語モデルの「スケーリング」、すなわちモデルのサイズを拡大することで性能を向上させることが主流でした。しかし、OpenAIの共同創業者であるイリヤ・サツキバー氏をはじめとする著名なAI科学者たちは、この手法の限界に言及し始めています。

サツキバー氏は、膨大なデータを使った「事前訓練」の規模拡大による成果が頭打ちになっていると述べ、AIモデルの訓練方法に再び新たな発見と創造性が必要な時代に突入したと強調しています。この新しいアプローチとして、リアルタイムで複数の答えを生成・評価する「テストタイム・コンピュート」という技術が注目されています。この手法により、AIモデルは従来よりも高度な推論や複雑な意思決定を行う能力を向上させることが可能となり、例えば数学の問題やコード生成といった難易度の高い課題においても優れた性能を発揮します。

参考:オープンAIなど、生成AI開発で人間に近い訓練技術を採用 遅れや課題の克服で

OpenAIが1月にエージェント発表!?

エージェントは、従来のAIチャットボットとは異なり、複数ステップにわたるタスクをユーザーの監督なしに実行することができる点が特徴です。このようなAIエージェントは、AnthropicやGoogleをはじめとする他の企業でも開発が進んでおり、AIがより直接的に人間の生活や業務をサポートする次のフェーズへの進化を象徴しています。

Bloombergのシリン・ガファリー氏とレイチェル・メッツ氏は、2025年1月にOpenAIから「Operator」というコードネームの画期的なAIを発表すると報じました。OpenAIの内部会議で発表された「Operator」は、研究プレビューとして提供される予定で、同社のAPIを通じて開発者にも利用可能になるとされています。

OpenAIのCEOであるサム・アルトマン氏も、RedditでのAMAセッションで「次の大きなブレイクスルーはエージェントになるだろう」と述べており、AIモデルの進化がエージェントという形で具現化することに期待を寄せています。また、今回の「Operator」のリリースは、OpenAIが単なるスケーリングから脱却し、より実用的で影響力のあるAI技術の開発に注力していることを示しています。

参考:OpenAI set to launch ‘Operator’ in January — AI agents that can do tasks for you

「AIモデルの今後」について一言

10月はOpenAI、Google、Anthropicといった業界大手の動きが活発でしたが、足元は少し落ち着いており、わかりやすいニュースも少ないので、少し技術的ですが、まとめ記事をお送りします。内容を補いつつ、思ったことを徒然に書きます。「Operator」については飛ばし記事だったらごめんなさい(必ずくる未来で、時期の違いだとは思いますが)。

スケーリングやテストタイム・コンピュートなど少し専門的なキーワードが登場しました。個人的な解釈になりますが、いずれも「優秀になること」を目指しています。スケーリングは「スケーリング則」というモデルサイズを大きくすると性能が向上するという法則に基づいています。つまり「優秀になるためには知識をたくさんインプットしよう」という思想に近いです。一方の、テストタイム・コンピュートは「優秀になるためには限られた知識でストイックに考えよう」です。極端な対比としては「勉強」と「実践」のようなイメージかもしれません。

なので「勉強はある程度やりきったので、ゴリゴリに実践しよう」というフェーズになったような感じでしょうか。AIモデルの可能性を感じさせるとともに、このように俯瞰することで、我々人間のレベルアップのために必要なアプローチについても示唆深いものがある気がします。一方で、エージェントが進化するとに人間の役割も大きく変わってしまうかもしれませんが。

シェアをお願いします!

執筆者

慶應義塾大学卒業後、総合化学メーカーを経てデロイトトーマツコンサルティングに在籍。新規事業立ち上げ、M&A、経営管理、業務改善などのプロジェクトに関与。マーケティング企業を経て、株式会社ProFabを設立。ProFabでは経営コンサルティングと生成導入支援事業を運営。

TechTechでは、技術、ビジネス、サービス、規制に関する最新ニュースと、各種ツールの実務的な活用方法について、初心者でも理解できる明瞭な発信を心掛ける。日本ディープラーニング協会の実施するG検定資格を保有。

目次