Metaが発表した新技術「Meta 3D Gen」が、3Dコンテンツ制作の世界に革命を起こそうとしています。テキスト入力だけで高品質な3Dモデルを1分以内に生成するこの技術は、メタバースの実現に向けた大きな一歩となる可能性を秘めています。
Meta 3D Genの概要
Metaは、テキストから3Dアセットを生成する最新の技術「Meta 3D Gen(3DGen)」を発表しました。この技術は、人工知能(AI)を活用して、テキストをインプットに高品質な3Dモデル(骨格)とテクスチャ(表皮)を、わずか1分以内という驚異的な速さで生成します。
3DGenは物理ベースレンダリング(PBR:Physical Base Rendering)という「光の振る舞いをできるだけ正確にシミュレートし本物らしく見えるようにする方法」に対応しており、生成された3Dモデルは様々な照明条件下でリアルな外観を実現します。
さらに、既存の3D素材に対して、新しいテキストプロンプトを使用して、柔軟に編集することが可能です。テクスチャは4K解像度まで拡大することができ、高品質な3Dアセットの生成につながります。
3D生成の流れ
3D生成のフローは図に示されている通り2つのステージで構成されています。
まずはSTAGEIでテキストから3Dモデルを生成します。例えば、「緑色のウールのセーターを着たティラノサウルス」というプロンプトから、ティラノサウルスの3Dメッシュが作成されます。
そしてSTAGEIIでは、テクスチャの生成と改良が行われます。この過程で、緑色のウールのセーターを着たティラノサウルスの詳細なテクスチャが適用され、最終的な3Dアセットが完成します。
また、既存の3D素材に対して、新しいテキストプロンプトを用いて再テクスチャリングを行うこともできます。図の例では、ティラノサウルスのメッシュに「パンダのような見た目のティラノサウルス」というプロンプトを適用し、全く新しい外観の3Dモデルが生成されています。
Meta 3D Genの技術
3DGenの中核を成すのは、主に2つの革新的な技術コンポーネント、「Meta 3D AssetGen」と「Meta 3D TextureGen」です。
Meta 3D Genのコアとなる「Meta 3D AssetGen」は、約30秒で初期の3Dアセットを作成し、様々な角度から見ても自然に見える3Dモデルを生成します。「Meta 3D TextureGen」は20秒未満で複雑な3D骨格に高品質なテクスチャを生成します。
これらを統合することで、単一段階のモデルと比較して68%の優位性を達成し、業界のベースラインを上回るプロンプト忠実度と視覚的品質を実現しています。
「Meta 3D Gen」について一言
また違った角度からのニュースですね。不勉強ながら動画生成AIがあるなかで、3D生成AIが存在する意味について気になってしまったので調べました。すると、動画はそもそも2次元で表現されるもので(テレビやPC)、3DはそもそもVRやリアル空間など360度から見ることのできるものなので、全く異なるものでした。当たり前ですね・・・。
そういった意味で、Meta 3D Genの登場は、3Dコンテンツ制作の民主化を加速させる画期的な出来事ということになります。メタバースやVR/ARという領域は研究が進められているものの、普及しているとは言えません。3Dコンテンツが民主化されることにより、Web3の世界観が思ったより早く来るかもしれません。