公開日:2024.04.08

Stable Video Diffusionとは？テキストや画像から動画を作成する方法を簡単に紹介

TOP / 記事一覧 / ビジネス / Stable Video Diffusionとは？テキストや画像から動画を作成する方法を簡単に紹介

静止画の世界に命を吹き込み、手軽に動画を作成できる「Stable Video Diffusion」をご存知でしょうか？

これは、テキストや画像から動画を作るAI技術で、今まで表現できなかった夢のような風景やアイデアを、鮮やかに表現させてくれる技術です。

本記事では、この技術の仕組みと使い方をわかりやすく解説します。

動画生成の可能性を体感し、あなただけの作品を生み出してみませんか？

1 |Stable Video Diffusionとは
2 |Stable Video Diffusionの特徴
3 |Stable Video Diffusionの使い方
- 3.1 Google Colaboratoryを使用する場合
  - 3.1.1 動画の調整方法
- 3.2 ローカル環境で使用する場合
4 |Stable Video Diffusionの必要環境
5 |動画生成AIの活用事例
6 |まとめ

|Stable Video Diffusionとは

Stability AI社が新たに開発した「Stable Video Diffusion」は、2023年11月21日にリサーチプレビュー版として公開されました。

これは、同社が以前に発表した画像生成AI「Stable Diffusion」を基盤としており、そのコードはGitHub（ソフトウェア開発プロジェクトのためのプラットフォーム）でオープンソースとして提供されています。

応用範囲はメディア、エンターテイメント、教育、マーケティングなど多岐にわたります。

具体的には、テキストや静止画を入力として受け取り、それらを実写の映画のような高品質な動画作品に変換することが可能となります。

|Stable Video Diffusionの特徴

Stable Video Diffusionは動画生成モデルとして、14フレームおよび25フレームの2つの異なるフレーム数で動画を生成する能力を持っています。

また、本ツールの性能においては、従来の主要なクローズドモデルを上回るという調査結果も発表されています。

これにより、ユーザーは高品質な動画を短時間で生成することができます。

具体的には、動画の再生時間は2～5秒、最大フレームレートは30FPS（フレーム/秒）で、処理時間も2分以下となっています。

以上のような特長があり、多様なニーズに応えることができるAIとして注目を集めています。

|Stable Video Diffusionの使い方

「動画を作ってみたい！」という初心者の方にも分かりやすいように、本項ではStable Video Diffusionの使い方について解説していきます。

使用するには、以下の2通りの方法があります。

Google Colaboratoryを使用する場合

一つ目は、Webブラウザ上でPythonコードを実行することができる無料のサービス「Google Colaboratory（Colab）」を利用する方法です。

まずは、Colab画面で「ドライブにコピーを保存」を選択。

これでGoogle ドライブ内にStable Video Diffusionのコピーが作成されます。

次に、コピーを開いたら「Set up」から順に実行ボタンを押してコードを実行します。

途中で使用するモデルを選択する画面が表示されるので、今回は「svd-xt」を選択します。

手順を進めて最後に「Do the Run!」を実行します。

表示されたURLをクリックしてStable Video Diffusionの実行画面がブラウザ上に表示されるので、生成したい動画に使用する画像をアップロードし、「RUN」を選択すると、動画の生成が開始されます。

動画の調整方法

Colabを使用して完成した動画を調整する際には、いくつかの方法があります。

まず、生成する動画のフレーム数を指定したり、動画生成のステップ数を選択できます。

また、動画生成の際のシード値を指定し、これを固定することで同じ条件での再現が可能となります。

さらに、一度に処理するフレーム数を調整したり、1秒間に描画するフレーム数の設定、動きの変化量の調整が出来ます。

これらのパラメータを適切に調整することで、より高品質な動画生成が可能となるでしょう。

ローカル環境で使用する場合

二つ目の方法であるローカル環境で利用するためには、まず「Python」（3.10.6という特定のバージョン）と、「git」をそれぞれ公式サイトからインストールします。

次に、Stable Diffusion Web UIをインストールしましょう。

まず、適当な場所にインストール用のフォルダを作成し、右クリックしたら「Open Git Bash here」を選択します。

表示されたコマンドプロンプトに以下のコマンドをコピー＆ペーストします。

「git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git」

コマンドの実行が完了したら、インストールは成功です。

最後に、作成したフォルダ内から「webui-user.bat」を実行し、完了させます。

起動後は、ブラウザで「http://127.0.0.1:7860/」を開くことで、Stable Video Diffusionを使用することができます。

|Stable Video Diffusionの必要環境

まず、Google Colabの無料プランではT4 GPUが最低限必要です。

しかし、生成に時間がかかる場合やメモリが限界に達することも考えられるため、Google Colab ProのV100 GPUや高メモリ環境を利用することを推奨します。

ローカル環境の場合、WindowsのバージョンやPCのスペックの確認が必要です。

Windowsのバージョンは、RAM16GB以上、エディションはWindows10以上が推奨されます。

PCのスペックはNVIDIA製グラフィックボードと12GB以上のVRAMが推奨されています。

AMD製も動作可能ですが、サポートが限定的となる場合があります。

|動画生成AIの活用事例

それでは最後に、実際に動画生成AIを使用した企業の事例をご紹介しましょう。

コカ・コーラ

コカ・コーラは、Stable Diffusionを用いて動画広告を制作しています。

この取り組みでは、画像生成AIを基盤としていますが、動画生成AIの応用によっても広告映像の制作が可能となっています。

コカ・コーラのような大手企業がAI技術を活用することで、より効果的で魅力的な広告を効率的に生み出すことができることを示しています。

MARVEL

最近のトレンドとして、動画生成AIを活用して物語やストーリーを作成し、それをSNSで共有するという方法が注目されています。

MARVELでは、この生成AIを用いて制作したムービートレイラーを公開しており、高品質な動画を効率よく作成しています。

これにより、動画と文章を組み合わせた魅力的なストーリーテリングが可能となり、視聴者に対してより深い印象や感動を与えることができるようになっています。

草津温泉

草津温泉観光協会は、ChatGPTや動画生成AIを取り入れたPR動画をYouTubeで公開しています。

この動画制作には、Kaiberという動画生成AIが活用されています。

動画の途中からAIを駆使した独自のPR動画が展開されており、草津温泉の魅力を効果的に伝える内容となっています。

このようにAI技術を活用することで、草津温泉観光協会は観光地の魅力をより幅広く、効果的に伝える手段として動画を活用しています。

|まとめ

Stable Video Diffusionは、革新的な動画生成AI技術の一つです。

これにより、従来の手法では難しかった複雑な動画制作も容易に実現できるようになり、ビジネスやエンターテイメント、教育など多岐にわたる分野での利用が期待されています。

この技術は、あなたの想像力を形にするための強力なツールです。

ぜひ活用して、世界に一つだけの作品を生み出してみませんか？

メタバース相談室はmonoAI technology株式会社が運営するWEBメディアです。
メタバースを活用したビジネスやコミュニケーションについて、
事例やノウハウを掲載しています。

お役立ち資料はこちらお問い合わせはこちら

著者の紹介

山下真輝

monoAI technology株式会社取締役XRCLOUD事業本部長

1981年愛知に生まれ、20歳の時に起業。
広告代理業、店舗ビジネスなど複数事業を立ち上げ年商15億まで拡大させたのち売却。
その後、SBI証券にて資金調達業務などを行い、イーファクター株式会社（現metaps）に入社。
共同購入型クーポンサイト『tokupo』アプリリワードサービス『metaps』などを立ち上げ株式上場に貢献。2013年にライヴエイド株式会社を創業。スマートフォンのアドネットワーク事業「Aid」をリリース。配信システム設計、営業まですべてを担当し、半年で月商 1000 万を超え、上場企業、ベンチャーキャピタルから数億円の資金調達を実施。その後、SSP「スルーパス」をリリース。2015 年 9 月に上場企業に広告配信ビジネスすべてを事業売却。 2016 年からは量販店、飲食店の空調設備をネット上で管理するIOTビジネスや民泊の鍵受け渡しを店舗で実施できるシステム「keyport」をリリース。
2018年からはエンタメ系メディアなど複数立ち上げ、営業利益１億円を達成。
2021年３月に弊社取締役XRCLOUD事業本部長に就任。

前の記事へ