Metaは人工知能の限界を押し広げ続けており、最新かつ最も高度な大規模言語モデル「Llama 3.1」を発表しました。MetaのコミットメントはAIをオープンにすることであり、今回のリリースではコンテキストの長さを拡大し、多言語対応を追加したバージョンを提供しています。このモデルは、最高のクローズドソースモデルに匹敵する性能を持ち、AI開発の民主化を目指しています。
Llama 3.1の概要
Llama 3.1 405Bは、ソースコードの公開されたオープンソースでありながら、高い水準のクオリティを実現した基盤モデルです。一般知識、操作性、数学、ツール活用、多言語翻訳など、さまざまな観点において圧倒的な柔軟性と制御性を確保しています。
オープンソースは、仕様を固定化したモデルをAPIで展開するクローズドモデルと比較して、カスタマイズ性や初期コストにおいて優位となるコンセプトです。
Metaのオープンソースアプローチは、世界中の開発者が基盤モデルを活用するハードルを限りなく下げることで、イノベーションと新しいエコシステムの創造を促す狙いがあります。
Llama 3.1もモデルはこちらからダウンロードすることができます。
モデル品質
MetaはLlama 3.1を150以上のベンチマークデータセットで評価し、多言語にわたる広範なテストを行いました。これに加えて、実際のシナリオでLlama 3.1を競合モデル(GPT-4やClaude 3.5 Sonnetなど)と比較する人間による評価も実施しました。
結果として、Llama 3.1はこれらのタスクにおいてトップモデルと競り合う性能を示しました。また、今回Llama 3.1リリースとしてアップデートしたLlama 3.1 8B / 70Bの小型モデルも同様に優れた性能を持つことが確認されています。
Llama Systemとは
Llama Systemは、言語モデルを超えた複数のコンポーネントを統合する包括的なシステムとして基盤モデルに付加して開発されています。
このシステムの意義は、開発者がAIモデルだけでなく、さまざまなツールやアプリケーションを統合し、より高度なAIソリューションを構築できるようにすることです。
ユーザーが入力するプロンプトの安全性をチェックする「Prompt Guard」、AIによる出力の有害性をチェックする「Llama Guard 3」、さまざまな開発ツールやサービスとの統合を助ける「Llama Stack API」などがあります。
Llama 3.1を使用するには相当の計算リソースと専門知識が必要ですが、このLlama Systemを利用することで、初日から405Bモデルの高度な機能をすべて活用し、すぐに構築を開始できます。AWS、Dell、NVIDIA、IBM、Microsoftなどの提供するクラウド基盤で利用することができます。
「Llama 3.1」について一言
オープンソースの狙いとしては、カスタマイズ可能で、無料で使うことができるため、初期ユーザーを惹きつけることで、スタンダードとしての地位を確立することができる(だろう)ということです。
マークザッカーバーグのメッセージにも記載があるように、これはPCのOS(オペレーティングシステム)の歴史のことが頭にあるようです。
1960年代後半にUNIXというクローズドソースのOSが開発されましたが、現在は1990年代に開発されたオープンソースであるLinuxが人気を博しているということです。発展著しい言語モデルについても同じ歴史の経過を辿るのか、見ていきましょう。