日立が開発した多重電子透かし技術:AI生成文章を識別する新たな一歩

日立製作所が発表した新技術「多重電子透かし」は、AIが生成した文章を特定するための画期的な方法です。この技術により、人間が書いた文章とAI生成の文章を識別する精度が飛躍的に向上し、AIの不正利用防止に大きく貢献すると期待されています。

目次

多重電子透かしの概要

日立製作所は、AIが生成した文章に多重電子透かしを埋め込む技術を開発したと発表しました。電子透かしとは、AIによる生成物を識別するために文章、画像、音声などに埋め込まれた情報のことを指しウォーターマークとも呼ばれます。目に見える可視性の情報と今回の事例のように目に見えない非可視性の情報があります。

文字一つ変えるだけでも意味が変わってしまう文章に電子透かしを入れることは、画像などと比較して難易度が高いとされてきました。これまでの研究結果である単一の電子透かしの事例をもとに、日立は複数の透かしを文章に組み込むことに成功しました。

生成元の識別精度を高めることで、人間が書いた文章とAIが生成した文章を見分けることができるため、AIの不正利用防止に役立つと期待されています。

多重電子透かしのメカニズム

多重電子透かしは、単語をグループ分けすることから始まります。具体的には、AIが生成する単語をランダムに2つのグループに分けます。文章を作成する際には特定のグループの単語をできるだけ多く含めるようにします。生成された文章について、特定のグループの単語の割合の高さをもとに、AI生成文章を識別します。

グループ分けを行う際には事前に決めた“鍵(パスワード)”を使用し、それぞれの単語がどのグループに入っているかを識別します。この鍵によって、どのAIが生成した文章なのかも区別することができます。

電子透かしのメカニズム
電子透かしの検証結果

日立は、米メリーランド大学の研究チームが発表した技術をさらに進化させ、三重以上の透かしを入れる技術を世界で初めて開発しました。

2重透かしのメカニズム

多重電子透かしの課題

多重電子透かしにはいくつかの課題があります。まず、鍵を持っている人物のみが透かしを作成・検出できるため、鍵が漏洩した場合、不特定多数の人物が透かしを再現できる恐れがあります。この点については、複数の透かしを入れることが対策の一部になっています。

また、短い文章では十分な数のグループ分けができないため、検出精度が低下します。現状では、300単語程度の文章ならば二重透かしを入れることができますが、それ以下の文章では難しいとされています。

今後、日立はこの技術をさらに研究し、事業化を目指す方針です。投稿がAI製であるかの判断や、教育現場での学生レポートのAI生成の識別など、多岐にわたる用途での利用が期待されています。

「多重電子透かし」について一言

注意すべきなのは、「一般にChatGPTで生成した文章が生成AI製であるかどうかを判定できる」ということではなく、「電子透かしを入れることを前提として意図的に生成された文章について事後的に生成AI製であるかどうかを判別できる」という旨の研究発表かと思います。なので、一般的な生成物を識別するためには「鍵」と呼ばれる識別子を検出する必要があるということかと思います。

ディープフェイクなどAIのマイナス面をフォローする上で、一般的な文章に対しての識別ができるようになることは理想ですが、現在の技術でも十分に有用かと思います。今後は多言語対応や楽譜などへの適応も見据えられているようです。生成AI領域全般では日本勢は出遅れているので、今回のようなリスク管理領域でグローバルに挑戦できるサービスにつながることを期待したいと思います。

出所:文章に“多重電子透かし”を入れる技術、日立が開発 書き手が「人間」or「AI」か区別可能に その仕組みとは?(ITメディア)

シェアをお願いします!

執筆者

慶應義塾大学卒業後、総合化学メーカーを経てデロイトトーマツコンサルティングに在籍。新規事業立ち上げ、M&A、経営管理、業務改善などのプロジェクトに関与。マーケティング企業を経て、株式会社ProFabを設立。ProFabでは経営コンサルティングと生成導入支援事業を運営。

TechTechでは、技術、ビジネス、サービス、規制に関する最新ニュースと、各種ツールの実務的な活用方法について、初心者でも理解できる明瞭な発信を心掛ける。日本ディープラーニング協会の実施するG検定資格を保有。

目次