Metaは本日、画像、動画、音声といったメディアを網羅する画期的な生成AIの研究結果—Meta Movie Gen—を公開しました。シンプルなテキスト入力でカスタム動画やサウンドを生成したり、既存の動画を編集したり、個人の画像を独自の動画に変換するなど、クリエイティビティの可能性を広げます。Movie Genは、映画製作者から動画クリエイターまで、すべての人に新たな表現のチャンスを提供します。
【無料配布中】「企業版AIの導入アプローチ」
ChatGPT、Copilot、ExabaseといったAI関連ツールが多くサービス提供される中で、企業におけるAI導入アプローチを俯瞰的に整理しています。どのようなタイプのツールがあり、結局何を使ったら良いのか、シンプルかつ感覚的に、かつ短時間で理解されたい方におすすめです。
Meta Movie Genとは
Meta Movie Genは、次世代のメディア生成ツールとして、ビデオ生成、パーソナライズされたビデオ生成、ビデオ編集、オーディオ生成の4つの主要機能を提供します。この技術は、ライセンス済みおよび公開データセットを使用してトレーニングされ、独自の生成AI技術によって高品質なビデオやオーディオを生成します。Meta Movie Genは、あらゆるコンテンツクリエイターにとって強力なパートナーとなるでしょう。
Meta Movie Genの4つの機能に関する人間による評価結果を示します。正のスコアは競合のモデルを比較して、Meta Movie Genの生成結果を人間が好んでいることを示しています。
Meta Movie Genの主な機能
ビデオ生成:Meta Movie Genは、シンプルなテキストプロンプトを用いて、高品質かつ高解像度の画像と動画を生成することができます。このモデルは30Bパラメータ(300億)を持つトランスフォーマーモデルで、最大16秒の動画を1秒あたり16フレーム(16カット/秒)の速度で生成可能です。オブジェクトの動きや被写体との相互作用、カメラの動きなど、リアルな動作を学習しており、これにより精度の高い動画生成が実現されています。
パーソナライズされたビデオ生成:ユーザーの画像を入力し、テキストプロンプトと組み合わせてユニークなビデオを生成する機能も搭載しています。これにより、パーソナライズされたオリジナルビデオを作成することが可能です。人間の動作を忠実に再現しながら、個々の特徴を活かした表現ができるのが特長です。
ビデオ編集:動画編集機能では、既存のビデオとテキストプロンプトを入力し、必要な変更を施します。ビデオ生成と画像編集を組み合わせ、背景やスタイルの変更、要素の追加・削除といった細やかな編集が可能です。精度を追求し、元のコンテンツを壊すことなく、求められる箇所のみを編集するのが特徴です。
オーディオ生成:Meta Movie Genは、ビデオに合わせた環境音や効果音、音楽などを生成する機能も備えています。13Bパラメータを持つオーディオ生成モデルを使い、最大45秒の高品質な音声を生成可能です。これにより、映像とオーディオのシンクロが取れた、没入感のあるメディア体験が提供されます。
「Meta Movie Gen」について一言
動画生成領域のAIはOpenAIの「Sora」、Runway「Gen-3」が競合サービスの代表格になります。再生時間で言えば、「Sora」は1分、Gen-3が10秒なので、特段秀でているわけではありません。一方で、16秒と短尺ながらクオリティではこれらの競合を上回る評価を得ているので短尺動画でかなり実用的な選択肢となることを示しています。とりわけ、Metaが運営するSNS媒体であるFacebookやInstagramではTikTokのような短尺動画が好まれることから、これらのサービスの付加価値を高めていくという意味でもとても親和性のあるサービスとなることが予想されます。
参照:How Meta Movie Gen could usher in a new AI-enabled era for content creators