Amazonが新たに発表した次世代基盤モデル「Amazon Nova」。テキスト生成に加え、画像・動画生成、軽量、高品質モデルなど、全方位の6つのラインナップを発表しており、年明けにはこれらを統合したラインナップの発表も計画しています。Amazon NovaはAmazonの提供するLLMのフルマネージドサービスであるAmazon Bedrockから簡単にアクセスでき、AWSなどAmazonのクラウドサービスを利用しているユーザーを中心に新たな選択肢と見られています。
Amazon Novaのラインナップ
Amazon Novaは、多様なニーズに対応するために複数のモデルを提供しています。
- Amazon Nova Micro テキスト専用モデルで、非常に低コストかつ最低のレイテンシー応答を実現。
- Amazon Nova Lite 画像、ビデオ、テキストを超高速で処理するマルチモーダルモデル。
- Amazon Nova Pro 精度、速度、コストのバランスが取れた高性能マルチモーダルモデル。
- Amazon Nova Premier 複雑なタスクに対応する最高性能モデル。2025年第1四半期リリース予定。
- Amazon Nova Canvas 画像生成に特化し、高品質なクリエイティブコンテンツを生成。
- Amazon Nova Reel 最先端のビデオ生成モデル。静止画から短い動画を生成。
Amazonは、2025年に音声対音声モデルや「any-to-any」マルチモーダルモデルなど、さらに高度なモデルを導入予定です。これにより、すべてのモダリティ間でシームレスなAIエージェントを実現することを目指しています。
動画処理のクオリティ
Amazon Novaは、動画生成および理解の分野で革新的な進歩を遂げています。Amazon Nova Reelは、単一の画像から短い動画を生成可能です。たとえば、「”ドリーで前進”」というプロンプトを使用すると、静止画がモーショングラフィックに変換されます。これにより、広告主は商品やブランドをより魅力的に表現する新しい方法を手に入れることができます。
架空のパスタブランドの例では、パスタでできた街並みを舞台にした動画広告を生成しました。このようなクリエイティブコンテンツは、視聴者に強い印象を与え、商品の魅力を最大限に引き出します。
Amazon Nova Proは、無音のフットボール試合の短い動画クリップをレビューし、試合の設定やプレイヤーの行動を詳細に説明することができます。たとえば、以下のような出力が得られます。
プロンプト: 「ビデオについて説明してください。」
出力: 「このビデオは、緑のフィールドで進行中のフットボールの試合を描いています。2つのチームの選手、1つは黄色のユニフォーム、もう1つは白のユニフォームを着て、プレーを行っています。黄色チームのクォーターバックがレシーバーにパスを投げ、レシーバーはボールをキャッチしてフィールドを走り始めます。白チームのディフェンダーがレシーバーを追いかけ、タックルしようとします。プレーはタックルで終わり、レシーバーはフィールドに倒されます。」
「Amazon Nova」について一言
LLMは生成AIの基盤となる技術ですが、これまでGAFAMの中でLLMに関する動きが顕在化していないのがAmazonとAppleでした。GoogleはGemini、FacebookはLlama、MicrosoftはPhiを発表しています。ということで、2024年も暮れとなり、ついにAmazonがLLMに関する発表を出しました。しかも全方位のラインナップで。
これまでの報道ではなかなか先行するGAFAMやOpenAI、Anthropicと同水準の性能を出すことができず苦労していたようですが、性能はどの程度のものなのでしょうか。仮に一定のパフォーマンスが出るのであれば、すでにAWSやAmazon Bedrockといった基盤部分での企業に対する結びつきは強化なので、シェアとしてはかなり期待できるのではないかと見ています。
出所:Introducing Amazon Nova, our new generation of foundation models