Anthropicが推論モデル「Claude 3.7 Sonnet」とコードエージェント「Claude Code」を発表

Claude 3.7 Sonnet

Anthropicが発表した最新のAIモデル「Claude 3.7 Sonnet」は、人間のように迅速な直感的判断と、じっくり深く考える熟考能力を一つのモデルに統合した画期的なAIです。また、同時に発表されたエージェント型開発ツール「Claude Code」は、ソフトウェア開発のさまざまなタスクをAIに任せることができる画期的なツールであり、開発効率を大幅に向上させることが期待されています。

2024年AIニュース完全ガイド
目次

Claude 3.7 Sonnetとは

Anthropicが新たに提供を開始した「Claude 3.7 Sonnet」は、単なる大規模言語モデル(LLM)に留まらず、直感的な即答力と、問題を段階的に深く分析する「拡張思考モード」を備えた「ハイブリッド推論モデル」です。このモデルは、人間が一つの脳で直感的判断と熟考を使い分けるように、利用シーンに応じてモードを切り替えられる設計が特徴です。

ユーザーは、「Claude 3.7 Sonnet」を用途に応じて標準モードまたは拡張思考モードに切り替えて使用できます。また、推論プロセスを視覚的に確認できるため、どのくらいのリソースを問題解決に使うかを細かく調整可能です。迅速な回答が求められる場合は標準モード、より正確で深い分析が必要な場面では拡張思考モードといった使い分けができます。

AIモデルの実用的な性能を評価するベンチマークにおいて、「Claude 3.7 Sonnet」は突出した結果を示しています。

特に、ソフトウェア開発能力を測るSWE-benchの評価では、62.3%(基本スコア)、さらに専用の支援環境を活用したスコアは70.3%を記録しました。これは、競合のOpenAI(49.3%)、DeepSeek(49.2%)といった他の有力モデルと比較しても明らかに優れており、実際のソフトウェアエンジニアリング業務において、「Claude 3.7 Sonnet」が非常に実用的なツールであることを示しています。

Software engineering

また、複雑な現実的タスクへの対応能力を評価するTAU-benchにおいても、特に小売業界におけるエージェント的なツール利用で81.2%とトップスコアを記録しました。この評価でも、モデルの高度な推論力と問題解決能力が裏付けられています。

Agentic tool use

Claude Codeとは

さらにAnthropicは、「Claude 3.7 Sonnet」と連携して利用可能なエージェント型の開発ツール「Claude Code」を発表しました。これは、開発者がコマンドライン(端末)から直接AIにコーディング業務を委託できる画期的な仕組みです。

「Claude Code」は単にコードを生成するだけでなく、既存のプログラムコードを探して編集したり、プログラムのテストを作成・実行したり、さらには開発したコードをバージョン管理システム(GitHub)に自動で保存(コミット)するなど、開発業務全般をAIが支援します。Anthropicの社内テストでは、通常45分以上かかるようなタスクを一度の操作で完了するなど、開発現場の効率性向上にすでに実績をあげています。

今後も「Claude Code」は継続的にアップデートが行われ、さらなる開発効率の改善が期待されています。Anthropicのこれらの取り組みは、AIモデルが単なる支援ツールから、開発プロセスの中核を担う存在へと進化する未来を予見させています。

「Claude 3.7 Sonnet」について一言

OpenAI、Googleらが相次いで推論モデルをリリースしてきた年末・年始でしたが、満を持して、Anthropicからも推論モデルであるClaude 3.7 Sonnetがリリースされました。回答は変わらず的確ですが、推論を挟んでいるにも関わらず、数秒でレスポンスが返ってくるのが特徴的かと思います。長時間熟考タイプのOpenAIのモデルとは異なり、素早く的確なレスポンスを返すGoogleの推論モデルに近い印象です。

Claude 3.7 Sonnet自体よりも衝撃を受けたのがClaude Codeでした。こちらは開発者がターゲットのツールです。使ってみましたが、かなり使いやすいです。私自身エンジニアではありませんが、Cursorなどのコードエディターさえあれば、チャット形式でコードの修正、プレビューなどを確認しつつ、ウェブサイトやゲームの開発ができてしまいます。これまでもコードエージェントツールはありましたが、推論モデルと組み合わせており精度が高いので、かなり抽象的な指示でかなりのステップを一気に作業してくれる気の利き様です。コードはエージェントのユースケースの中でも最もホットな領域ですが、新たな手段となるかもしれません。

出所:Claude 3.7 Sonnet and Claude Code

2024年AIニュース完全ガイド
ProFabサービス資料
シェアをお願いします!

執筆者

慶應義塾大学卒業後、総合化学メーカーを経てデロイトトーマツコンサルティングに在籍。新規事業立ち上げ、M&A、経営管理、業務改善などのプロジェクトに関与。マーケティング企業を経て、株式会社ProFabを設立。ProFabでは経営コンサルティングと生成導入支援事業を運営。

TechTechでは、技術、ビジネス、サービス、規制に関する最新ニュースと、各種ツールの実務的な活用方法について、初心者でも理解できる明瞭な発信を心掛ける。日本ディープラーニング協会の実施するG検定資格を保有。

目次