OpenAIが調査特化型エージェント「Deep Research」をリリース:Web上の情報を多段階で調査

openai deep research

OpenAIは、調査に特化したAIエージェント「Deep Research」をリリースしました。「Deep Research」は、自律的にリサーチを行うエージェントとして機能し、プロンプトを与えると、AIが何百ものオンラインソースを検索し、情報を統合して包括的なレポートを生成します。人間が何時間もかかる作業をわずか数十分で完了することができます。ChatGPTのProプランから利用可能となっていますが、今後はより多くのプランで利用可能となり、専門的なデータベースとの連携も計画されています。

2024年AIニュース完全ガイド
目次

Deep Researchとは

Deep Researchは、OpenAIの次世代エージェント技術を活用した、インターネット上の多段階リサーチを可能にする機能です。自律的にリサーチを行うエージェントとして機能し、プロンプトを与えると、AIが何百ものオンラインソースを検索し、情報を統合して包括的なレポートを生成します。また、OpenAIの新モデル「o3」を搭載し、テキスト、画像、PDFなどの情報を収集・解析することが可能です。収集した情報を分析し、必要に応じて方向転換しながら最適な結果を提供するため、金融、科学、政策、エンジニアリングなどの分野での調査業務を大幅に効率化できます。

従来の検索エンジンでは、ユーザー自身が多くの情報源を確認し、それを統合する必要がありました。しかし、Deep Researchは、特定の分野で深い知識を必要とする研究者やアナリスト向けに、高度な推論と文書化を伴うリサーチを提供することで、このプロセスを大幅に簡略化します。また、すべての出力には明確な引用が含まれており、情報の信頼性と検証可能性が担保されている点も特徴です。

現在、Deep Researchは計算コストが高いため、Proユーザー限定で月最大100クエリまで利用可能となっています。今後、PlusおよびTeamユーザーへの拡大が予定されており、Enterprise向けの提供も計画されています。また、モバイル・デスクトップ対応が今月中に展開される予定であり、より高速でコスト効率の良いバージョンの開発も進められています。さらに、専門的なデータソースとの連携が強化され、サブスクリプションベースのデータアクセスが可能になる見込みです。

Deep Researchの使い方

Deep Researchは、ChatGPTで調査したいテーマを指定してクエリを入力するだけでリサーチを開始できます。例えば、「ストリーミングプラットフォームの競合分析」や「最高の通勤用自転車」などのテーマを選び、必要に応じてファイルやスプレッドシートを添付することで、より正確な調査が可能になります。実行が開始されると、AIは5〜30分ほどで結果を生成し、サイドバーには実行手順や参照したソースが表示されます。最終的なレポートはチャット内に表示され、今後は画像やデータビジュアライゼーションの埋め込みも可能になる予定です。この非同期的なリサーチ機能により、ユーザーは待ち時間を他の業務に充てることができます。

ChatGPTのチャット欄にクエリを入力
ChatGPTのチャット欄にクエリを入力
ChatGPTが調査内容を提案してくれる
ChatGPTが調査内容を提案してくれる
必要に応じて追加の要望を伝え、最終的な調査内容を確定させる
必要に応じて追加の要望を伝え、最終的な調査内容を確定させる
調査開始。「設計→調査→理解→調査」を繰り返す
調査開始。「設計→調査→理解→調査」を繰り返す

Deep Researchの技術的背景と評価

Deep Researchは、OpenAIの推論モデル「o1」を基に開発され、Webブラウジングやデータ分析に適した強化学習を活用しています。複雑な推論を実行し、複数のオンライン情報を統合しながら適切な方向に調査を進めることができるのが特徴です。収集した情報に応じて適宜方針を変更するリアルタイム対応が可能であり、テキストだけでなく、画像やグラフの解析・生成も行えます。

さらに、ベンチマークの一つである「人類最後の試験(HFE)」では、100以上の分野にわたる専門家レベルの問題に挑戦し、過去最高の26.6%の精度を達成しました。特に、化学、人文科学、社会科学、数学分野で大きな進歩が見られたと報告されています。

ベンチマークでの評価結果(人類最後の試験)
ベンチマークでの評価結果(人類最後の試験)

また、AIの評価ベンチマーク「GAIA」でもDeep Researchを支えるモデルが新たな最先端技術(SOTA)に到達し、外部リーダーボードでトップの成績を記録しました。この評価では、推論能力、マルチモーダル流暢性、Webブラウジングの熟練度などが試され、Deep Researchがそのすべての側面で高い性能を発揮しました。

ベンチマークでの評価結果(GAIA)
ベンチマークでの評価結果(GAIA)

「Deep Research」について一言

進撃のOpenAI、また新たなプロダクトをリリースしました、「Deep Research」です。使ってみるとわかりますが、精度が段違いです。例えば、過去の論文検索の際に「1960年以降の」や「xxという論文のxxページ以降の」のような詳細な指定に対しても高い精度で応答してきます。OpenAIが2025年中にリリース予定としている次世代モデルo3を使っているそうで、非常に高い精度を実現しています。外部情報の調査だけでなく、今後は専用のデータベースとの連携も計画しているということで社内などの内部情報検索に対しても期待が持てます。

「Deep Research」単体で見ても当然使う価値が高いプロダクトだと思っています。現在調査特化型AIエージェント領域に存在する競合はGoogle Geminiの「Deep Research」です(同名で良いのか?OpenAIの方が後発なのでOpenAIが、ということになります)。Googleのプロダクトにもかなりの衝撃を受けましたが、重箱の隅をつつくレベルでOpenAIのプロダクトの方が優秀で、現時点使うとしたらOpenAIの「Deep Research」になります。とはいえ、いずれも共通して調査時間は10分程度はかかるので、単純な調査(いわゆるググるレベルのもの)ではなく、全体の方向性を知りたい場合、ちょっと調べても見つからない情報を探す場合、が「Deep Research」の主なユースケースで、使い所は限定されるイメージを持っています。いずれにせよ、非常に可能性を感じるプロダクトで、今後のOpenAIのリリースにも期待です。

出所:Introducing deep research

2024年AIニュース完全ガイド
ProFabサービス資料
シェアをお願いします!

執筆者

慶應義塾大学卒業後、総合化学メーカーを経てデロイトトーマツコンサルティングに在籍。新規事業立ち上げ、M&A、経営管理、業務改善などのプロジェクトに関与。マーケティング企業を経て、株式会社ProFabを設立。ProFabでは経営コンサルティングと生成導入支援事業を運営。

TechTechでは、技術、ビジネス、サービス、規制に関する最新ニュースと、各種ツールの実務的な活用方法について、初心者でも理解できる明瞭な発信を心掛ける。日本ディープラーニング協会の実施するG検定資格を保有。

目次