ELYZA:Metaの新型モデルを利用した日本語LLM「Llama-3.1-ELYZA-JP-70B」を公開

Llama-3.1-ELYZA-JP-70B

株式会社ELYZAは2024年10月25日、Meta社の「Llama 3.1」を基盤とした日本語モデル「Llama-3.1-ELYZA-JP-70B」を開発し、「ELYZA LLM for JP」シリーズの最新モデルとして公開しました。ベースモデルとなる「Llama」のアップデートにより、日本語性能の大幅な向上と長文処理能力の改善を実現しました。

document ai strategy

【無料配布中】「企業版AIの導入アプローチ」

ChatGPT、Copilot、ExabaseといったAI関連ツールが多くサービス提供される中で、企業におけるAI導入アプローチを俯瞰的に整理しています。どのようなタイプのツールがあり、結局何を使ったら良いのか、シンプルかつ感覚的に、かつ短時間で理解されたい方におすすめです。

目次

Llama-3.1-ELYZA-JP-70Bの概要

株式会社ELYZAは、Meta社の新型モデル「Llama-3.1」を基盤とし、日本語に関する学習を実施した700億パラメータモデル「Llama-3.1-ELYZA-JP-70B」を公開しました。このモデルは、先行の「Llama-3-ELYZA-JP-70B」のベースを新たに「Llama-3.1」にすることで、長文の処理能力を向上させました。また、日本語での事後学習プロセスを改善し、指示追従能力も改善されました。

ELYZAは『ELYZA LLM for JPシリーズ』というブランドで、グローバルモデル(ChatGPTなど)とは異なる、主にセキュリティやカスタマイズ性を重視する企業向けの大規模言語モデルを提供しており、Llama-3.1-ELYZA-JP-70Bはその最新モデルとなります。デモサイトでチャット形式のモデルを体験することができます。

Llama-3.1-ELYZA-JP-70Bのデモサイト
Llama-3.1-ELYZA-JP-70Bのデモサイト

「Llama-3.1-ELYZA-JP-70B」について一言

大規模言語モデルというとOpenAIやGoogleといった外資企業が覇権を握っていますが、ELYZAは日本企業の希望です。6月時点ではMetaのLlama-3ベースの日本語モデルを構築し、OpenAIのGPT-4を日本語性能で上回っていました。その後、OpenAIは4oやo1-previewといったモデルを出しているので、最新のモデルと比較してどうかは現状わかっていません(おそらく引き続き追いかける側なのかと想像します)。

大規模言語モデル開発は半導体などの計算資源が豊富に求められ、かなりコストのかかるビジネスなので、数少ない国内プレイヤーとして陰ながら応援しています。

出所:ELYZA、Llama 3.1ベースの日本語モデルを開発(PR TIMES)

シェアをお願いします!

執筆者

慶應義塾大学卒業後、総合化学メーカーを経てデロイトトーマツコンサルティングに在籍。新規事業立ち上げ、M&A、経営管理、業務改善などのプロジェクトに関与。マーケティング企業を経て、株式会社ProFabを設立。ProFabでは経営コンサルティングと生成導入支援事業を運営。

TechTechでは、技術、ビジネス、サービス、規制に関する最新ニュースと、各種ツールの実務的な活用方法について、初心者でも理解できる明瞭な発信を心掛ける。日本ディープラーニング協会の実施するG検定資格を保有。

目次