Grok-2:イーロン・マスクが仕掛ける次世代AIモデルがアップデート

Grok-2

2024年8月13日、最先端のAI言語モデル「Grok-2」がベータ版としてリリースされました。Grok-2は、チャット、コード生成、画像生成といった機能がアップデートされた最新モデルで、高い画像生成の精度が特徴です。Xプラットフォームのプレミアム会員に提供されています。

目次

Grok-2とは

Grok-2は、最新の推論能力を備えた言語モデルで、Xプラットフォーム上で利用可能です。今回のアップデートにはGrok-2およびその小型版であるGrok-2 miniが含まれています。Xプラットフォームのプレミアム会員向けにベータ版が提供されています。プレミアム会員になるには、月額980円程度の費用がかかります。また、法人向けにはエンタープライズAPIを通じて提供される予定で、さまざまな業務での活用が期待されています。

Grok-2でできること
Grok-2でできること

Grok-2の性能

Grok-2は、さまざまな基盤モデルの性能評価のために使用されるLMSYSチャットボットアリーナの評価指標において、競合他社のモデルを凌駕する性能を示しています。このアリーナでは、Grok-2がClaude 3.5 SonnetやGPT-4-Turboを上回るEloスコアを記録しており、その優れた対話能力が証明されています。

ELOスコアの競合比較
ELOスコアの競合比較

また、Grok-2は学術的なベンチマークテストにおいても優れた結果を出しています。特に、科学知識や一般知識、数学、ビジュアル推論といった幅広い分野で、他のフロンティアモデルを凌ぐ性能を発揮しています。これにより、Grok-2は業界内での競争力を大幅に向上させています。

ベンチマークスコアの競合比較
ベンチマークスコアの競合比較

Grok-2の使い方

Grok-2は、個人から法人まで幅広いユーザーに利用されています。

個人ユーザーは、Xプラットフォーム上で、プレミアム会員(月額980円)になることでGrok-2を簡単に利用できます。

法人向けには、8月下旬にもGrok-2とGrok-2 miniを利用したエンタープライズAPIが提供される予定です。多要素認証(Yubikey、Apple TouchID、TOTPなど)も合わせて提供することで、高いセキュリティを実現します。また、低遅延アクセスや詳細なトラフィック統計、請求管理のための高度な分析ツールも提供されており、企業のさまざまなニーズに応えます。

今後は、Xプラットフォーム上でのテキスト、言語、コードといった情報処理を連携させる、マルチモーダルの導入が予定されています。結果として、Xプラットフォーム上の検索・返信機能の強化が図られ、AIの活用範囲がさらに広がることが期待されています。

「Grok-2」について一言

基盤モデルの開発競争が激化しています。OpenAI、Google、Meta、Anthropicなど。モデルアップデートのたびに基盤モデル提供企業が他社比較を出し、「わずかに自社モデルが競り勝っている」ように見せるので正直どこが秀でているのかの判断が難しいですが、現状Grokが日本において競り負けているのは確かでしょう。

Grokの特徴としてはXと連携しているため(Xのデータソースにアクセスできる)、リアルタイム性が高いことが言われますが、Grok-2を試してみて感じたのは画像生成の精度の高さです。試しにニューヨークの夜景について出力してみました。まだルール形成の未熟なサービスだと感じますが、かなり高い精度でルフィの絵を生成することも可能でした。ルールの部分の今後だと思いますが、とても可能性のあるモデルであると感じています。

New York
New York(Grok-2に生成)

出所:Grok-2 Beta Release

シェアをお願いします!

執筆者

慶應義塾大学卒業後、総合化学メーカーを経てデロイトトーマツコンサルティングに在籍。新規事業立ち上げ、M&A、経営管理、業務改善などのプロジェクトに関与。マーケティング企業を経て、株式会社ProFabを設立。ProFabでは経営コンサルティングと生成導入支援事業を運営。

TechTechでは、技術、ビジネス、サービス、規制に関する最新ニュースと、各種ツールの実務的な活用方法について、初心者でも理解できる明瞭な発信を心掛ける。日本ディープラーニング協会の実施するG検定資格を保有。

目次