Anthropic:Claude 3.5 SonnetとClaude 3 Haiku、Computer Useを発表

anthropic new claude model and computer use

Anthropicは最新のAIモデルを発表しました。Claude 3.5 Sonnetは既に、Claude 3.5 Haikuは10月後半にリリースされる予定です。これらのモデルはコーディングの分野で大幅に向上し、最先端技術と手頃な価格の融合を実現しています。また、開発者にとって注目の「Computer Use」機能がパブリックベータ版として既にリリースされており、人間のようにPCを操作することが想定されています。

document ai strategy

【無料配布中】「企業版AIの導入アプローチ」

ChatGPT、Copilot、ExabaseといったAI関連ツールが多くサービス提供される中で、企業におけるAI導入アプローチを俯瞰的に整理しています。どのようなタイプのツールがあり、結局何を使ったら良いのか、シンプルかつ感覚的に、かつ短時間で理解されたい方におすすめです。

目次

新モデルリリース:Claude 3.5 SonnetとClaude 3.5 Haiku

Anthropicは新たにアップグレードされたClaude 3.5 Sonnetと、最新モデルClaude 3.5 Haikuを発表しました。Claude 3.5 Sonnetは、前モデルに比べてコーディング性能が大幅に向上し、特にエージェントコーディングやツール使用の分野でリードしています。ベンチマークであるSWE-bench Verifiedのスコアは33.4%から49.0%へと向上し、業界内の他のAIモデルを凌駕する成果を収めました。

一方、新しいClaude 3.5 Haikuは、前世代の最大モデルClaude 3 Opusに匹敵する性能を持ち、同じコストと速度で提供されます。特にコーディングタスクにおいて優れたスコアを記録し、低レイテンシと高い指示の追従性を誇ります。このモデルは、大量のデータを処理し、パーソナライズされたエクスペリエンスを生成するタスクにも最適です。

Claude 3.5 SonnetとClaude 3.5 Haikuのモデル比較
Claude 3.5 SonnetとClaude 3.5 Haikuのモデル比較

Computer Useのリリース

パブリックベータ版では、画期的な新機能「Computer Use」もリリースされました。この機能により、開発者はClaudeに画面を見たり、カーソルを操作したり、テキストを入力したりするよう指示できるようになります。Anthropic API、Amazon Bedrock、Google CloudのVertex AIを通じて、開発者はこの機能を使用して反復的なプロセスの自動化やソフトウェアの構築、テストを行うことが可能です。

まだベータ版であり、課題も残っていますが、開発者からのフィードバックを基に急速に改善されることが期待されています。Replitなどの企業は既にこの機能を活用し、複雑なタスクを効率的に遂行する手助けをしています。

「Anthropicの新モデルとComputer Use」について一言

まずは新モデルリリースに関する発表です。コーディングに優れていることも評価されることですが、最近発表され、推論能力の高さで賞賛されているOpenAI o1-previewを上回る点も見逃せません。推論能力はまだまだ成長の途上にあることが伺えます。

Computer Useは我々がPCを触るときのクリック、ドラッグ、ズームといったいわゆるGUI(Graphical User Interface)を自然言語で操作することを目指した試みです。我々は基本キーボードやマウスを使ってPC操作をしますが、根源的にはコマンドプロンプトと呼ばれるコードが定義されており、GUIの裏側で動いています。

Computer UseはこのGUIの働きを自然言語で置換するという考え方になります。既にMicrosoft系のPCでは「Copilot」というブランド名で部分的に実装され始めていますが、仮に自然言語が使えるようになり、音声認識ができれば、キーボードやマウスをはじめとする現在のインターフェースがガラッと変わることになるでしょう。ハードデバイス側の進化もとても興味深いトピックではあります。

出所:Introducing computer use, a new Claude 3.5 Sonnet, and Claude 3.5 Haiku

シェアをお願いします!

執筆者

慶應義塾大学卒業後、総合化学メーカーを経てデロイトトーマツコンサルティングに在籍。新規事業立ち上げ、M&A、経営管理、業務改善などのプロジェクトに関与。マーケティング企業を経て、株式会社ProFabを設立。ProFabでは経営コンサルティングと生成導入支援事業を運営。

TechTechでは、技術、ビジネス、サービス、規制に関する最新ニュースと、各種ツールの実務的な活用方法について、初心者でも理解できる明瞭な発信を心掛ける。日本ディープラーニング協会の実施するG検定資格を保有。

目次