今年2月に世界に驚きを与えた動画生成AIのプレビュー版であるSoraが一般公開されました。また、その進化版である「Sora Turbo」がついにリリースされ、誰もが簡単に動画制作の新しい可能性を体験できる時代が到来しました。シンプルな画像生成だけでなく、リミックス、独自アセット活用、リカットなど動画編集の一般的な設定項目まで網羅されており、一般ユーザーからプロのクリエイターまで幅広い層での活用が見込まれます。
新しくなったSora
Soraは、テキストをもとにリアルな動画を生成できる画期的なAI技術として登場し、短期間で注目を集めました。その最新バージョンであるSora Turboは、従来のモデルと比べ大幅に高速化され、ユーザーによりスムーズで直感的な操作性を提供します。
Soraでは、解像度:最大1080p、動画の長さ:最大20秒、アスペクト比:ワイドスクリーン、縦長、正方形といった設定に加え、次の機能も含まれており、動画制作の多くのシーンに有効なツールとなることが期待されています。
- ストーリーボードツール:フレームごとに詳細な指示が可能
- カスタマイズ:独自アセットのアップロード、リミックス、ブレンド
- リミックス:ビデオ内の要素を置き換えたり、削除したり、作り直したりできます。
- 再カット:最適なフレームを見つけて分離し、いずれかの方向に拡張してシーンを完成させます。
- タイムライン編集:個人のタイムライン上でビデオの独自のシーケンスを整理および編集できます。
- ループ:ループでトリミングしてシームレスな繰り返し動画を作成できます。
- シームレス結合:2つのビデオを1つのシームレスなクリップに結合します。
- プリセット:想像力をかき立てるスタイルを作成して共有するプリセット機能も搭載されています。
コミュニティの作品を閲覧できるフィードページもあり他のユーザーの創造性を楽しむことができます。
SoraはChatGPT Plus、Proアカウントに追加料金なしで含まれています。Plusユーザーは、480pまたは720p解像度の動画を毎月最大50本生成可能です。また、Proプランでは10倍の使用量、高解像度、長時間再生の動画が利用できるなど、より柔軟なプランが用意されています。
Soraの技術的背景
Sora Turboの技術はまだ発展途上であり、物理的に不可能な現象の生成や複雑なアクションの長時間再生には現時点対応しきれていません。
すべての動画にはC2PAメタデータが付与され(電子透かし)、生成元が明確に識別される仕組みを採用しています。さらに、デフォルトで透かしを挿入し、不正使用を防ぐための安全策を実装しています。
また、特に有害なコンテンツ(例:児童虐待素材や性的ディープフェイク)をブロックする機能を備えています。リリース時点では、人物のアップロードに制限を設けていますが、今後はより多くのユーザーに向けた機能展開を計画中です。
「Sora」について一言
Soraが始めてリリースされてから10ヶ月ほど経過し、ようやく一般ユーザーの手元に届くことになりました。本稿執筆時には新規アカウント作成がストップしておりまだトライできていませんが、とても期待感を持っています。
インターフェースとしては非常に優秀で、テキストを元にした単純生成のみならず、画像をもとにした生成、トーンの維持など動画編集をされる方にとっても一般的な設定項目まで網羅されています。
動画生成AIでいうと、Google DeepMindのVeo(1分程度)、MetaのMovie Gen(最大16秒)といった選択肢もありますが、いずれもまだ一般ユーザーには開放されておらず、Soraのリリースは動画分野においても大きな一歩となると思います。本稿には織り込まれていませんが、今回のリリースにあたりクリエイターの活用事例なども含まれており、OpenAIの発信に対する念入りさが伺えます。以後の反響を見守っていきましょう。
出所:Sora is here