2024年8月20日、OpenAIはGPT-4oのファインチューニング機能を開発者向けにリリースしました。これにより、カスタムデータセットを使用してモデルを特定のユースケースに最適化し、より高いパフォーマンスと精度を実現することが可能になりました。
【無料配布中】「企業版AIの導入アプローチ」
ChatGPT、Copilot、ExabaseといったAI関連ツールが多くサービス提供される中で、企業におけるAI導入アプローチを俯瞰的に整理しています。どのようなタイプのツールがあり、結局何を使ったら良いのか、シンプルかつ感覚的に、かつ短時間で理解されたい方におすすめです。
GPT-4oファインチューニングの概要
2024年8月20日、OpenAIは開発者向けにGPT-4oのファインチューニング機能をリリースしました。この機能は、開発者が特定のユースケースに合わせて基盤モデルを調整し、より高いパフォーマンスと精度を達成するためのものです。任意のデータセットを使用して、モデルが特定の状況で最適な返答を返すようにトレーニングすることが可能です。わずか数十の例を含むデータセットでも優れた結果を得ることができるため、さまざまなドメインでの応用が期待されています。
GPT-4oのファインチューニングは、すべての有料ユーザーに提供されます。ファインチューニングのダッシュボードからベースモデルを選択し(gpt-4o-2024-08-06)、カスタムデータをアップロードするだけで始めることができます。
価格はトレーニングで$25/100万トークン。推論で利用する場合は、入力:$3.75/100万トークン、出力:$15/100万トークンとなっています。また、GPT-4o miniのファインチューニングも同様に提供されており、9月23日まで1日200万トークンの無料トレーニングが可能です。
ファインチューニングされたモデルは完全に開発者の管理下にあり、ビジネスデータを含むすべての入力および出力の所有権が開発者に帰属します。さらに、モデルが不正に利用されないように、継続的な安全評価やポリシーの遵守状況の監視などの安全対策が講じられています。
GPT-4oファインチューニングの事例
OpenAIは、GPT-4oのファインチューニングを利用している企業の成功事例も公開しています。AIによるコードアシスタントを開発するCosine社では、GPT-4oをファインチューニングすることで、SWE-benchというソフトウェア開発に関連するタスクにおける性能を評価する指標で最高のスコアを達成しました。
さらに、Distyl社は、BIRD-SQLというテキストからSQLクエリ(データベースの操作、検索を行うプログラミング言語)を生成するベンチマークで1位を獲得しました。
ファインチューニングされたモデルは、特定の業務や要件に応じてパフォーマンスを最適化することで、企業がより高い生産性と効率を実現することが期待されています。
「GPT-4oファインチューニング」について一言
そもそもファインチューニングとは、基盤モデル(GPTやGemini)にカスタムデータを加え、特定のシチュエーションに特化したモデルを作成することです。類似の専門用語に転移学習がありますが、ファインチューニングがカスタムデータをもとに基盤モデル全体を再学習させるのに対し、転移学習は基盤モデルはそのままにカスタムデータの処理層のみを学習ということで、学習の対象に違いがあります。結果としてファインチューニングの方が性能が高い反面、転移学習の方がコストメリットがあり、性能とコストのトレードオフの関係にもあります。
汎用化されている基盤モデルをカスタマイズする方法としてはこのほかにもRAG(検索拡張生成:Retrieval-augmented generation)と呼ばれる生成時に都度参照元を検索する手法もあり、こちらは取り扱いのハードルが低いことから既に多くの現場で利用されていました。今回、ファインチューニングもダッシュボードから簡単に開発できるようになるということで、今後のモデル活用の有力な選択肢となるでしょう。