2024年8月13日、最先端のAI言語モデル「Grok-2」がベータ版としてリリースされました。Grok-2は、チャット、コード生成、画像生成といった機能がアップデートされた最新モデルで、高い画像生成の精度が特徴です。Xプラットフォームのプレミアム会員に提供されています。
Grok-2とは
Grok-2は、最新の推論能力を備えた言語モデルで、Xプラットフォーム上で利用可能です。今回のアップデートにはGrok-2およびその小型版であるGrok-2 miniが含まれています。Xプラットフォームのプレミアム会員向けにベータ版が提供されています。プレミアム会員になるには、月額980円程度の費用がかかります。また、法人向けにはエンタープライズAPIを通じて提供される予定で、さまざまな業務での活用が期待されています。
Grok-2の性能
Grok-2は、さまざまな基盤モデルの性能評価のために使用されるLMSYSチャットボットアリーナの評価指標において、競合他社のモデルを凌駕する性能を示しています。このアリーナでは、Grok-2がClaude 3.5 SonnetやGPT-4-Turboを上回るEloスコアを記録しており、その優れた対話能力が証明されています。
また、Grok-2は学術的なベンチマークテストにおいても優れた結果を出しています。特に、科学知識や一般知識、数学、ビジュアル推論といった幅広い分野で、他のフロンティアモデルを凌ぐ性能を発揮しています。これにより、Grok-2は業界内での競争力を大幅に向上させています。
Grok-2の使い方
Grok-2は、個人から法人まで幅広いユーザーに利用されています。
個人ユーザーは、Xプラットフォーム上で、プレミアム会員(月額980円)になることでGrok-2を簡単に利用できます。
法人向けには、8月下旬にもGrok-2とGrok-2 miniを利用したエンタープライズAPIが提供される予定です。多要素認証(Yubikey、Apple TouchID、TOTPなど)も合わせて提供することで、高いセキュリティを実現します。また、低遅延アクセスや詳細なトラフィック統計、請求管理のための高度な分析ツールも提供されており、企業のさまざまなニーズに応えます。
今後は、Xプラットフォーム上でのテキスト、言語、コードといった情報処理を連携させる、マルチモーダルの導入が予定されています。結果として、Xプラットフォーム上の検索・返信機能の強化が図られ、AIの活用範囲がさらに広がることが期待されています。
「Grok-2」について一言
基盤モデルの開発競争が激化しています。OpenAI、Google、Meta、Anthropicなど。モデルアップデートのたびに基盤モデル提供企業が他社比較を出し、「わずかに自社モデルが競り勝っている」ように見せるので正直どこが秀でているのかの判断が難しいですが、現状Grokが日本において競り負けているのは確かでしょう。
Grokの特徴としてはXと連携しているため(Xのデータソースにアクセスできる)、リアルタイム性が高いことが言われますが、Grok-2を試してみて感じたのは画像生成の精度の高さです。試しにニューヨークの夜景について出力してみました。まだルール形成の未熟なサービスだと感じますが、かなり高い精度でルフィの絵を生成することも可能でした。ルールの部分の今後だと思いますが、とても可能性のあるモデルであると感じています。