#広告業界で使えるAI! Stable Image Ultraテクニック(2)実は個性的な「Origami」でトンマナを探ろう

AICUでお世話になっております、はねごろう です。
長年、広告映像やバーチャルライブなどのお仕事をしてきた経験を「つくる人をつくる」の時代に活かしていくプロデューサーのしごとをしています。

先日AICU AIDX Labの技術の方々が Stable Diffusion公式APIで1,800枚の画像を生成してくれたのですが、実際にどれぐらい使えそうな絵があるか、選定するテクニックも含めて広告業界のビジュアルとしての使い方を複数回に分けて探っていきたいと思います。

#広告業界で使えるAI! Stable Image Ultraテクニック(1)「Neon-Punk」でファッショナブルな個性とインパクトを

Stable Diffusion – Generate API https://platform.stability.ai/

各モデルの公称特性

Stable Image Ultra 1メガピクセル生成(以下、Ultra)
Stable Image Core 1.5メガピクセル生成(以下、Core)
Stable Diffusion 3 Large 80億パラメータモデル(以下SD3L)
Stable Diffusion 3 Medium 20億パラメータモデル(以下、SD3M)

左上がSD3L、右上がUlta、左下がSD3LとUltraの合成、右下が3Mです。UltraとSD3LはAPIではなく文字プロンプトでスタイルを指定し、共通のシードでは同じような絵が出る傾向があります。
技術チームの印象としては、「cinema, analog filmなどの実写スタイル、SD3LとUltraの間での比較を商業的価値でレビューしてみてほしい」という所見を頂きましたので挑戦していきます。

評価方法

映画やVFXなどの評価と同じく、生成した静止画をつなげた(ラッシュ)を以下のツールを使って再生していきます。

❏動画再生ツール Keyframe MP https://zurbrigg.com/keyframe-mp

1枚づつラッシュを確認し、以下の基準で分類していきます。

❏評価基準は以下の3段階です。
[Bad]画面内で画風の統一がない、不快なアナトミー破綻、中指を突き立てている(商品性・グロ・NSFW)
[Good]商品性、キャッチーな構図、明らかなアナトミー破綻がない、検討に値する。
[Best]クライアント直行できるレベル、トップ画像に使える、絵としてほぼ修正が必要ない。

評価対象は多様なスタイルのうち、以下のリアル系スタイルです。

ここでの「スタイル」はAPIでUltraを指定し、プロンプトにスタイルを書くだけ、というとても簡単なものです。

詳しい生成方法は AICU media の過去記事「#10分で学べるAI」をご参照ください。
(シリーズの最後にまとめて生成できるスクリプトを紹介します)

Origami スタイル

本来は折り紙(国際語:Origami)風の画風になるOrigamiスタイル。Stable Diffusion Ulraでのスタイルとしての安定感は低いのですが、派手な絵や「不可能な服」が生成されて、使い道次第ではデザインのトンマナ(トーンとマナー)を探る際に使えそうな”スーパーショット”が生成されやすい個性的なスタイルとして推せます。

Best

ビビッドなカラー、髪色、パーカー、表情が魅力的です。

画像

某有名キャラクターを連想させつつも、売ってなさそうなパーカー、そして意味深なメッセージカードで隠された表情が魅力的です。

画像

Origamiはなぜか指の破綻が少ない傾向にあります。
色がシンプルなのでレタッチしやすいという利点もあります。

画像

リアル系の絵とアニメ系のグラフィックが50%ぐらいの確率で生成されます。

画像
画像
画像
画像

こちらは条件を完璧に満たしていて、AICUのカバーアートとしても使えるビジュアル。

画像

一方で「Origami」要素はないので、Ultraの場合は「Origami」というスタイルは特に強く学習されているわけではないが、ビビッドなカラーで比較的安定して良い絵が出るプロンプトであることが理解できましたでしょうか。

Bad

実は、Badが出づらい。なんと21枚中5枚、しかも非常に惜しいです。アナトミー破綻が少なく、背景のボケが良いせいかもしれません。
グラフィックデザインと実写系が50%ぐらいの確率で出ますので「実写系?」のみを期待して使うと損をしますね。

表情もライティングも指の演技も良い…掌だけが惜しかった。

画像

演技も表情もいいけど、指がスレンダーすぎて残念。

画像

これぐらいならレタッチで消せますね。

画像

アニメっぽい?いやいや、こういう自然派おねえさんのイラスト素材は需要ありますよね。左手の指はレタッチで消せますね。

画像

指が難しいことになっていますが、大胆なレイアウト、ファッションとイラストレーションとしては好ましい方向ではあります。

画像

以上、使い道次第ではデザインのトンマナ(トーンとマナー)を探る際に使えそうな”スーパーショット”が生成されやすい個性的なスタイルとして推せる Stable Image Ultraの「Origami」スタイルを紹介しました。
「Origami」要素はないので、Ultraの場合は「Origami」というスタイルは特に強く学習されているわけではないのですが、ビビッドなカラーで比較的安定して良い絵が出るプロンプトであること、Badでも多様で個性的、かつレタッチで修正可能な絵が出やすいという事がわかりました。

ところで本来の「Origami」スタイルとはどんな絵なのでしょうか?APIでスタイル指定ができる Stable Image Core で試してみたテストシーケンスがこちらになります。

念の為、同様の実験をSD3Largeにおいてプロンプトで指定しました(SD3LargeはAPIでのスタイル指定はありません)。

同じようにインパクトがほしい、実写系なのかイラストレーションなのか…どれぐらいのリアリズムが欲しいのか?などトンマナを探りたいときに、まず試してもらいたいスタイルです。

はねごろうのスタイル探求は続く!

#広告業界で使えるAI! Stable Image Ultraテクニック(1)「Neon-Punk」でファッショナブルな個性とインパクトを

その他の全画像はこちらのアルバムで確認できます。
Google Photo https://j.aicu.ai/SD3GP

せっかくなので「SD3美女コンテスト」を開催したいと思います。
上記のアルバムの画像において、著作権は主張しませんので、良い画像があったら ハッシュタグ #SD3GP で紹介してください。

AICU AIDX Labにイケてる男子版もつくってもらおうっと!

読者のみなさんもなにかリクエストがございましたら X@AICUai へメンション、DMいただけると幸いです。
Stable Diffusionを使った画像生成やVFX、広告技術についての技術的なお問い合わせについては AICU AIDX Lab – sai@aicu.ai  までどうぞ

<続きます>

画像生成AI Stable Diffusion スタートガイド (Generative AI イラストレーション)j.aicu.ai

2,640円(2024年06月10日 11:09時点 詳しくはこちら)

Amazon.co.jpで購入する