最近ブームになっている画像生成AIの中でも、2022年に登場した「DALL-E 2(ダリ・2)」は、その高い生成技術と直感的な操作によって注目されています。
広告やアート制作などにDALL-E2を使ってみたいという方も多いのではないでしょうか。
DALL-E 2は手軽に利用できますが、まだ使ったことのない方やAIについてよく知らない方は、同AIをどうやって使っていいか分からないと思います。
そこで当記事では、DALL-E 2の機能や使い方、そして活用できる分野について解説します。
目次
|DALL-E 2とは
DALL-E 2は、ChatGPTの開発企業でも有名なOpenAIによる画像生成AIです。
これは入力された言語を元にイメージや画像を生成するAIで、2022年4月に発表されたばかりの非常に新しいAIです。
DALL-E 2という名前は、抽象画家のサルバドール・ダリや、ピクサーのアニメーション映画「ウォーリー」に登場するキャラクターが由来になっています。
同AIの登場以来、画像生成AIがブームになり、その後Googleも文章から画像を生成できる「Parti」や「Imagen」などを発表しており、現在に至る生成AIブームの基礎を作りました。
|DALL-E 2の機能
DALL-E 2は発表以来多くの注目を集めており、特にその高い生成能力とプロンプト(指示文)の認識能力の高さが評価されています。
以下では、そんなDALL-E 2の具体的な機能について解説します。
Text to Image
DALL-E 2の最大の特徴は、画像生成AIの中でも非常にクリエイティブな画像を生み出す点にあると言えます。
例えば、”Riding a bike in space with a cat flying together(猫と一緒に自転車に乗って宇宙を飛ぶ)”と言ったような支離滅裂なプロンプトを入力しても、それを具体的な文脈レベルで認識して、その通りの画像を生成します。
この他にも「アボガドの椅子」や「バイクに乗るピカチュウ」といった人間でも想像力が要求される生成においても、DALL-E 2は正確な生成を実現しています。
Generation Variations
しかし、DALL-E 2の生成は基本的にすべてAIが自己完結的に行い、その生成プロセスには人間がタッチすることができません。
このため、一度のプロンプトの指示で、求めていた通りのイメージが必ずしも生成されるとは限りません。
このため、DALL-E 2では一度生成したイメージを基に、バリエーション機能を使って他の様々な構図やニュアンスを取り入れることで複数のイメージを生成することで、よりユーザーが求めていた画像に近づくことができます。
Inpainting
また、DALL-E 2のインペインティングという機能は、既に生成した画像の一部を消しゴムで消して、AIに再度プロンプトを入力すると、その消した部分をプロンプトの内容に基づいて描き変えます。
例えば、丸っこい耳の猫の画像の耳の部分だけを消して、「尖った形の耳を持つ猫」と入力すると、その耳の部分だけが修正されます。
これは画像の一部分だけを修正するのに有効ですが、この機能は有料で、下記で説明しますが1回の生成に1クレジットが必要です。
Outpainting
この他、アウトペインティングという機能では、生成した画像の外側をAIで描き足すことができます。
このような既存の画像から別の画像を生成する行為をi2i(イメージトゥイメージ)と呼んだりします。
DALL-E 2のアウトペインティングは1024 x 1024を1フレームとして描き足していきます。
1フレームの生成につき1クレジットが必要になり、1回のアウトペインティングで最大4つのバリエーションが生成できます。
|DALL-E 2の使い方
以下では、具体的なDALL-E 2の使い方について解説していきます。
まず、OpenAIのDALL-E 2の公式サイトにアクセスし、アカウントを作成します。
アカウント作成にはメールアドレス、Googleアカウント、Microsoftアカウントが利用できますが、電話番号の入力も必要になります。
DALL-E 2は基本的には無料ですが、利用回数に制限があり、無制限で利用したい場合は15ドルで115クレジットを購入できます。
使い方は簡単で、枠内に生成したいイメージの文章を入力するだけです。
できるだけ具体的な内容のプロンプトを入力した方が、求めているイメージ通りの画像が生成されやすくなります。
また、具体的な文章が思い浮かばない場合、既存の画像やイラストをベースにして生成することも可能です。
|DALL-E 2の注意点
DALL-E 2は非常に高性能ですが、使用に際して注意すべき点がいくつかあります。
AIが生成した画像は肖像権や著作権が発生する場合があるので、ビジネス活用などで利用する際には気をつけましょう。
肖像権
例えば、特定の人物の名前をプロンプトとして入力して、その人物そっくりの画像を生成すると肖像権の侵害になる可能性があります。
もしくは、企業のロゴなどを無断でDALL-E 2で編集を加えて生成し、それを使用すると著作権侵害になる可能性があるので注意しましょう。
このため、もし既存の画像を基に生成する場合、著作権や肖像権フリーの素材を使うようにしましょう。
クレジット表記
DALL-E 2で画像生成すると、画像の右下にクレジット表記が付されます。
このクレジット表記を削除すること自体は問題になりませんが、生成された画像をさも自分で作ったかのように見せることはポリシー違反になります。
生成された画像は商用利用することもできますが、誤解を招くような表現は避けるようにしましょう。
サイズ固定
DALL-E 2が生成した画像は基本的に1024 x 1024のサイズで固定されており、現時点では他のサイズでの生成に対応していません。
この他、DALL-E 2では暴力的・性的な表現はフィルタリングされているので、そうした表現をプロンプトに入力したり、元画像として使用することは禁止しています。
|DALL-E 2の活用方法
DALL-E 2を初めとした画像生成AIは既に多くのクリエイターやビジネスシーンで活用されています。
画像生成AIがどんな分野で役に立つか、以下で具体例を挙げていきます。
アート作品
「AIはクリエイティブになれるのか?」という問いは昔からされていますが、DALL-E 2はAIが創造性を有した初のケース、と言っても過言じゃないでしょう。
上記でも触れましたが、DALL-E 2はクリエイティブさがないと出来ないような想像力に溢れた画像やイメージを自律的に生み出します。
このため、DALL-E 2が活用される分野の一つがアート制作で、人間がアイデアを考えてAIがそれを実現する、といったイメージです。
現在では、AIをアート制作に用いることはアニメやイラストレーター業界ではほぼデフォルトになりつつあり、AIが従来のクリエイティブ業界を大きく変えつつあります。
宣伝画像
また、画像生成AIが役立つ分野として広報やマーケティングが挙げられます。
従来は完全に人手で行っていた商品イメージの画像や、POPやポスター制作などに画像生成AIが導入されることで、従来のクリエイティブなプロセスが変わりつつあります。
例えば、クライアントが制作したいもののイメージをデザイナーに伝える際、従来は主に言葉を使っていたため、クリエイターとクライアントの間にコミュニケーションの齟齬が発生しがちでした。
ですが、DALL-E 2で求めるもののイメージをクライアントが簡単に作れるようになることで、求めているもののイメージをクリエイターに具体的に伝えやすくなり、ミーティングの回数やコミュニケーションの齟齬を減らすことができます。
SNS用画像
現在ではSNSが広報に重要な役割を果たしていますが、DALL-E 2のような画像生成AIはSNS用の画像制作にも用いられています。
SNSは大量の情報が流れるため、希求度の高い投稿をこまめに行う必要があり、それに有効なのが画像ですが、著作権フリーの画像を探すのは大変です。
このため、現在では画像生成AIを用いたSNS投稿を見かけることがさほど珍しくなくなりました。
よく見る例として、例えばTwitterの投稿にやや不自然な感じの女性の画像が添付されている場合、それはAIが生成した画像である可能性が非常に高いです。
|まとめ
今回は、画像生成AIのパイオニア的存在のDALL-E 2の特徴や使い方、活用事例などをまとめました。
画像生成AIは既に様々な領域で利用されており、クリエイティブな作業にAIを用いることが当たり前になっています。
よく、生成AIが人間の仕事を奪うという懸念が話題になりますが、AIはあくまで人間のアイデアを実現するための優れたツールです。
クリエイティビティの根幹はあくまで人間に委ねられているので、AIを使いこなすクリエイターが主役になる時代が到来しています。