国産LLM「PLaMo 2 8B」が条件付き商用ライセンスで公開:小型モデルでも高い性能を実現

plamo 2 8B

Preferred Networks(PFN)が日本語に特化した最新の大規模言語モデル(LLM)「PLaMo 2 8B」を公開しました。このモデルは従来の10分の1という小規模ながら、圧倒的な日本語性能を備え、大規模モデルを超える能力を実現しています。また、条件付きの商用ライセンスにより、中小企業を中心に幅広い層の商用利用を促進し、日本の生成AI産業の発展を後押しすることが期待されています。

2024年AIニュース完全ガイド
目次

PLaMo 2 8Bとは

「PLaMo 2 8B」は、PFNとグループ会社のPreferred Elementsが開発した大規模言語モデルです。昨年開発された100Bサイズの大型モデル『PLaMo 100B』と比べて、約10分の1の規模でありながら、同等かそれ以上の性能を発揮します。

今回の公開にあたり採用された「PLaMo Community License」は、個人や年間売上が10億円以下の中小企業が自由に利用できるよう設計されています。これにより、自社製品への統合やキャラクターとの対話を可能にするモデル開発など、多様な商用利用が容易になります。一方、大企業での使用には別途契約が必要ですが、柔軟に対応できる仕組みが整えられています。また、作成したデータセットをApache Licenseなどのオープンライセンスに切り替えることも可能です。商用利用の場合はこちらのフォームからの申請が必要です。

PFNが国産の大規模言語モデル開発にこだわる理由として、海外製モデルの日本語や文化への最適化が不十分なことが挙げられます。文化的・政治的背景を反映した安全で信頼できる国内モデルを提供することで、安心してAIを活用できる環境整備を目指しています。

世界のLLM開発競争は熾烈を極め、多額の資金投入が行われています。PFNは効率的な開発手法を用いて、小規模でありながら世界的競争力を持つモデルを実現しました。これにより日本企業が世界市場での競争力を高めるサポートを行っています。

PLaMo 2 8Bの性能

「PLaMo 2 8B」は、その小さなサイズにもかかわらず、幅広い分野で非常に優れた性能を発揮しています。知識ベンチマーク(MMLU/JMMLU)においては、大型のPLaMo 100Bと同等のスコアを記録しました。コーディング能力を測定するHumanEval+/JHumanEvalでは、課題だった従来モデルの性能を超え、技術的問題への対応力を大幅に改善しています。

知識ベンチマーク
知識ベンチマーク
コーディング能力
コーディング能力

また、翻訳能力を評価するWMT20ベンチマークにおいても、高い翻訳精度を記録しました。日本語文章生成能力を評価するpfgen-benchでも、大型モデルを上回る結果を出しており、非常に自然で質の高い日本語文章の生成が可能であることを証明しました。これらの評価結果から、小型でありながら高性能なPLaMo 2 8Bは、実用性においても競争力を備えています。

翻訳能力
翻訳能力
日本語文章生成能力
日本語文章生成能力

「PLaMo 2 8B」が特に日本語に強い理由は、その独自のデータセット構成にあります。学術的なテキストに限定せず、日常的な表現を含む幅広いテキストを使用することで、実際の利用シーンに即した高い対応力を実現しました。海外製モデルと異なり、日本語の文脈や文化的背景を深く理解するよう設計されているため、日本特有の課題にも柔軟に対応できます。

「PLaMo 2 8B」について一言

基本的に基盤モデルの開発において日本は圧倒的に出遅れており、資金力のある米国企業OpenAI、Google、Anthropic、Amazon、xAIなどが先行しています。こうした外資企業の提供する基盤モデルは性能という意味で価値が高い一方で、地政学的な観点などを考慮すると国産モデルの開発にも大きな意義があり、今回のPFNの取り組みにも繋がっています。

今回発表された「PLaMo 2 8B」も小規模でありながら高い性能を実現しているモデルとして可能性はありますが、その性能がGPT-3.5といった水準なので、これがGPT-4o水準くらいまでくれば日本語性能やコストパフォーマンス、国産LLMといったブランディングの総合評価で、中小企業であっても導入していくインセンティブが働くのではないかと思っています。

出所:PLaMo 2の8Bモデルをオープンなライセンスで公開: 条件付きで商用利用可能なPLaMo Community Licenseについて大規模言語モデルの次期バージョン PLaMo 2 8Bによる検証

2024年AIニュース完全ガイド
ProFabサービス資料
シェアをお願いします!

執筆者

慶應義塾大学卒業後、総合化学メーカーを経てデロイトトーマツコンサルティングに在籍。新規事業立ち上げ、M&A、経営管理、業務改善などのプロジェクトに関与。マーケティング企業を経て、株式会社ProFabを設立。ProFabでは経営コンサルティングと生成導入支援事業を運営。

TechTechでは、技術、ビジネス、サービス、規制に関する最新ニュースと、各種ツールの実務的な活用方法について、初心者でも理解できる明瞭な発信を心掛ける。日本ディープラーニング協会の実施するG検定資格を保有。

目次