画像生成AIで問われるは「テキスト入力側の言語化力」
──最近はTwitterを中心に画像生成AI「Midjourney」「Stable Diffusion」「DALL・E2」が大きな話題となりました。テキスト入力によって画像を自動生成するという技術は、広告クリエイティブでも使われていくのでしょうか?
島田:実際にはまだほとんど広告には使われていないと思いますが、使われるのも時間の問題だと思います。広告については、単純に画像だけで成立するものは多くなく、ほとんどがテキストのコピーと合わせて使われます。今はコピーを生成するAIツールも出てきているので、これらをうまく組み合わせると、広告のクリエイティブを作る作業は半自動化に近づいていく可能性が高まっています。
中平:テキストを入れるだけで何でも作ってくれるなんて、すごい世界だと思うかもしれません。でも、まだまだそんなことはないんです。マーケターはクリエイティブ制作において、デザイナーと一緒に仕事をすることは多いと思いますが、必ずしもこちらのイメージ通りに制作してくれるデザイナーばかりではありませんよね。
AIもそれと同じで、「こんな感じで」と依頼するだけでこちらの意図をくみ取って制作してくれるデザイナーレベルになるにはまだまだ遠いです。入れたテキストに対して、思っていたものと全然違うクリエイティブがアウトプットされることも少なくない。今画像生成AIを使いこなすために問われているのは、テキストを入力する側の「言語化力」なのです。
島田:AIのアウトプットの質を高める技術を「プロンプトエンジニアリング」と言います。今のお絵描きAIの技術で、一番の起点になったと言われるのは「どのように依頼文を出すと自分の思い描いた通りに画像を生成してくれるか」という部分の開発です。今後もこのプロンプトエンジニアリングはどんどん発展していくだろうと思います。
──なるほど。現状では、AIが生成した画像をそのまま広告クリエイティブとして使えるケースは少ないのですね。では今こうした技術やツールを使うとすれば、クリエイティブのヒントを見つけるといった使い方になるのでしょうか?
島田:まだ人間の中でイメージが固まりきらない領域はAIにもまだ難しいのでヒントの1つとする方法はあります。ただ一方で、アニメの1シーンや、たとえばドラゴンなどの絵は学習データの中に多く含まれているので、かなり精度高く出してくれます。
このようなAIの得意領域に関しては、これまでデザイナーさんが行っていた、フォトストックサービスを使って画像検索する時間を削減できます。かつ、それは自分の意図した通りに非常にクオリティの高い画像が、著作権が自分にある状態で手に入るものとなるので、実用性という意味でも使いやすくなると思います。
