タグ: ai art

  • [ComfyMaster16] ComfyUIでImage-to-Image(i2i)を始めよう

    「写真の表情を変えたい」、「イラストをリアルな絵画風にしたい」…
    それ、i2iで実現できます!

    こんにちわ、AICU media編集部です。
    ComfyUI マスターガイド」、いよいよ今回から「Image-to-Image(i2i)編」に突入します。
    この記事では、ComfyUIを使用したi2iの基本から応用まで、実践的なステップを踏んで解説していきます。

    前回はこちら。初回はこちら

    1. Image-to-Image(i2i)とは

    Image-to-Image(i2i)とは、既存の画像を入力として使用し、新しい画像を生成する技術です。元の画像の構造や特徴を保持しながら、新しい要素を追加したり、スタイルを変更したりすることができます。

    ComfyUIでのi2iは、通常の画像生成と同じノードの多くを使用しますが、主な違いは入力に既存の画像を使用することです。この技術は、写真の編集や修正、アートスタイルの変換、キャラクターデザインの変更、風景画の変更や拡張など、幅広い用途に活用できます。

    今回は、インペインティングによる表情の変更と、アニメ調からリアル調へのスタイル変換を解説します。

    2. インペインティングによる表情の変更

    では、実際にComfyUIでi2iのワークフローを構築してみましょう。今回は、以下の画像の表情を変えたいと思います。

    画像
    • ワークフローが埋め込まれたPNG画像(webp形式ではなく)とGoogle Colabでの ComfyUI i2i編ノートブックは文末にて提供しています
    • メニューの「Load Default」をクリックし、標準のワークフローをロードした状態にします。モデルはstable-diffusion-xl-base-1.0を使用します。
    画像
    • 次に「Load Image」ノードを追加し、「choose file to upload」から対象の画像をアップロードします。
    画像
    • ウィジェット用で右クリックし、表示されたメニューから「Open in MaskEditor」をクリックします。
    画像
    • マスク範囲を指定するためのキャンバスが表示されます。
    画像
    • 今回は、表情を変更したいので、顔をブラシで塗りつぶします。
    • 「Thikness(ペンの太さ)」「Opacity(不透明度)」「Color(ペンの色)」は作業用のパラメータです。最終画像への影響はありません。
    • その後、「Save to node」をクリックします。
    • 以下のように顔がマスキングされます。
    画像
    • 次に、「VAE Encode (for inpainting)」ノードを追加します。
    • 「Load Image」の出力「IMAGE」「MASK」を、それぞれ「VAE Encode (for inpainting)」ノードの入力「pixels」「mask」に接続します。
    • 「Load Checkpoint」ノードの出力「VAE」「VAE Encode (for inpainting)」ノードの入力「vae」に接続します。
    画像
    • 「Empty Latent Image」ノードを削除します。
    画像
    • 「VAE Encode (for inpainting)」ノードの出力「LATENT」「KSampler」ノードの入力「latent_image」に接続します。
    画像
    • ポジティブプロンプトを「1girl, smile」に変更します。
    画像
    • これで「Queue Prompt」をクリックし、生成を実行します。以下が生成結果です。表情は変わりましたが、周囲との馴染みが若干悪いです。
    画像
    • 生成結果を調整する際は、「KSampler」ノードの「denoise」の値を調整してください。この値を 1.0から 0.9, 0.8,…と下げていくことで、変化の度合いを調整できます。
    画像

    denoise = 0.8

    画像

    denoise = 0.75

    画像

    ※このパラメーターを 0.8 以下にすると、破綻しやすくなるので段階を踏みながら設定していくことをおすすめします。

    細かな制御をしたい場合はVAE Encode (for Inpainting) のパラメータ「grow_mask_by」も操作するとよいでしょう。

    「grow_mask_by」を小さい値にすると、境界線が目立つようになります。

    画像
    画像

    逆に、「grow_mask_by」を大きな値にすると境界が曖昧になります。なお最大値は64です。大きくすると処理時間が長くなります。

    denoise = 0.9, grow_mask_by = 64, seed = 1

    画像

    バッチ生成してみましょう。
    denoise = 0.9, grow_mask_by = 64, seed = 5

    画像

    3. アニメ調からリアル調へのスタイル変換

    先ほどのワークフローを利用し、アニメ調からリアル調へのスタイル変換をします。ワークフローの変更点としては、以下になります。

    • 顔に掛けていたマスクを外します。今回はスタイルを変えるので、画像全体を対象とするためです。マスクの外し方は、「Open in MaskEditor」でマスク用のキャンバスを開き、左下の「Clear」をクリックし、マスクを削除後、「Save to node」をクリックします。
    画像
    • 「VAE Encode (for inpainting)」ノードを「VAE Encode」ノードに変更します。「VAE Encode」ノードは、「VAE Encode (for inpainting)」ノードからマスクの入力が削除されたバージョンです。
    画像
    • 使用するモデルをRealVisXL_V4.0.safetensorsに変更します。RealVisXLは、実写の描写が得意なモデルで、これを利用することでリアル調のスタイルに変換します。以下のリンクからRealVisXLをダウンロードし、「ComfyUI/models/checkpoints」フォルダに格納してください。

    ※ダウンロード済みの場合は選択するだけになります。

    https://huggingface.co/SG161222/RealVisXL_V4.0/blob/main/RealVisXL_V4.0.safetensors

    • ポジティブプロンプトを「1girl」にします。表情は変えないので、smileは削除します。
    画像
    • 「KSampler」ノードの「denoise」を0.55-0.70程度に設定します。ここは、生成結果を確認しながら調整してください。
    画像
    • ここまでの設定で画像生成してみましょう。以下が生成結果です。元画像からスタイルが変わっていることが確認できます。
    画像

    4. 倫理的考慮事項

    i2iの使用には倫理的な配慮が必要です:

    1. 著作権: 他者の作品を無断で使用しない。特にdenoiseを下げすぎると、依拠性や類似性を意図して侵害することになります。
    2. プライバシー: 個人を特定できる画像の使用に注意
    3. ミスインフォメーション: 偽の画像やディープフェイクなど、誤解を招く画像の作成を避ける
    4. 不適切なコンテンツ: 有害や攻撃的な画像の生成を控える

    画像生成AIの責任は生成者にあります。責任ある使用を心がけ、創造性と倫理のバランスを保つことが重要です。

    ▶画像生成AIクリエイター仕草(v.1.0)

    【参考】AUTOMATIC1111での i2i 関連情報はこちら

    https://note.com/aicu/n/n08ebe0637a41

    5. まとめ

    ComfyUIでのi2i技術は、あなたのクリエイティブな可能性を大きく広げるツールです。基本的なワークフローの構築から始まり、パラメータの微調整、高度なテクニックの適用まで、段階的に技術を磨いていくことで、より印象的で独創的な画像を生成できるようになります。

    最後に、AIを使用した創作活動には倫理的な配慮も必要です。著作権や個人情報の扱いには十分注意し、責任ある利用を心がけましょう。

    この記事を参考に、ComfyUIでのi2i探索を楽しんでください。新しい発見や素晴らしい創作の旅が、あなたを待っています!

    次回は、image-to-image編 第2回「Outpainting機能」を紹介します。
    乞うご期待!

    X(Twitter)@AICUai もフォローよろしくお願いいたします!

    画像生成AI「ComfyUI」マスターPlan

    画像生成AI「Stable Diffusion」特に「ComfyUI」を中心としたプロ向け映像制作・次世代の画像生成を学びたい方に向けたプランです。最新・実用的な記事を優先して、ゼロから学ぶ「ComfyUI」マガジンからまとめて購読できます。 メンバーシップ掲示板を使った質問も歓迎です。

    • メンバー限定の会員証が発行されます
    • 活動期間に応じたバッジを表示
    • メンバー限定掲示板を閲覧できます
    • メンバー特典記事を閲覧できます
    • メンバー特典マガジンを閲覧できます
    • 動画資料やworkflowといった資料への優先アクセスも予定

    ゼロから学ぶ「ComfyUI」マガジン

    https://note.com/aicu/m/md2f2e57c0f3c

    マガジン単体の販売は1件あたり500円を予定しております。
    2件以上読むのであればメンバーシップ参加のほうがお得です!というのもメンバーシップ参加者にはもれなく「AICU Creator Union」へのDiscordリンクをお伝えし、メンバーオンリー掲示板の利用が可能になります。

    https://note.com/aicu/membership/boards/61ab0aa9374e/posts/db2f06cd3487?from=self

    もちろん、初月は無料でお試しいただけます!
    毎日新鮮で確かな情報が配信されるAICUメンバーシップ。
    退会率はとても低く、みなさまにご満足いただいております。
    ✨️オトクなメンバーシップについての詳細はこちら

    お楽しみ、メンバー向けボーナストラックには、今回のi2iサンプルワークフローが埋め込まれたPNGファイルと、i2i編で便利な Google Colab用 ComfyUI ノートブック(新作)、さらに今回の内容で使った workflowファイルをお贈りします。もりだくさんです!


    この記事の続きはこちらから https://note.com/aicu/n/nfc8eb955e57b

    Originally published at https://note.com on Sept 15, 2024.

  • 結果発表!!「デルタもん4コマ漫画コンテスト」

    デルタもんの日常が炸裂!個性豊かな作品が集結!BlendAI特別協賛「デルタもん4コマ漫画コンテスト」応募作品と優秀賞の結果を紹介します。

    AIキャラクター「デルタもん」をテーマにした、「デルタもん4コマ漫画コンテスト」に、たくさんのご応募をいただきありがとうございました!

    個性豊かな作品、なんと 12 作品 も集まりました!
    審査員一同、AI技術を駆使した表現力と、デルタもんの魅力を引き出すユニークなストーリーに驚かされました。

    今回のコンテストは、デルタもんのLoRAを配布したクラウドファンディングの出資者の方々への感謝の気持ちから生まれた企画の第一弾なんです。
    #デルタもん4コマ のハッシュタグを追いかけて、このコンテストを知った方も多いのではないでしょうか?

    コンテストに応募した方も、そうでない方も、X(Twitter)のタイムラインがデルタもんで溢れる様子に、きっと笑顔になったはずです。出資者の方々も、自分の支援がこんなにも素敵な作品を生み出すきっかけになったことを、嬉しく思っていることでしょう。

    さて、話を戻して…今回は、デルタもん4コマ漫画コンテストの応募作品の中から入選した素敵な作品と、受賞作品をご紹介します。

    画像

    コンテストはXの投稿及び応募フォームを用いて実施されています。
    作者からのタイトル、作品解説とともに紹介していきます。

    以下、入選作品です。
    優秀賞は最後に発表します。

    【未来へのΔ(デルタ)コネクション ~衝撃の真実~】 by ともっち

    https://x.com/tomomaga358/status/1827783761502798049

    【概要】この4コマ漫画は、一見普通の日本の高校を舞台に、未来から来たAIアンドロイド「デルタモン」と、謎めいたギャル「ミライ」を中心に展開するSF途中です。の裏に隠された驚くべき真実と、人類とAIの未来を考慮した重大な選択を描いています。
    【コンセプト】ジャンルミックス:学園もの、SF、一時の要素を融合させ、読者を魅了する展開を提供しました。キャラクターの二面性:デルタモンの不安げな様子や、ミライの意味深い態度など、登場人物の顔と裏の顔のギャップを強調しました。テクノロジーと倫理:先進的なAI技術と、それが実現する倫理的ジレンマを探ります。視覚的なコントラスト:現代の学校と未来的な要素(デルタモンの外観、隠された実験室など)を対比させ、違和感と興味を喚起しました。緊迫感の演出:時計の表示や、最後のカウントダウンタイマーなど、時間の切迫感を視覚的に表現しました。内面の葛藤:心の中の冷静、キャラクターの内面の葛藤や緊張感を表現しました。オープンエンド:最後のコマで決断の瞬間を描き、続きへの関心を呼びかけるようにしました。
    【工夫した点】各キャラクターの表情やコマ割りの構図を工夫しました。特に4コマ目のキャラクターアップとカウントダウンタイマーを表示させたところ。ストーリープロンプトを詳細に出力させて描きました。
    オノマトペを入れてさらに臨場感あふれるようにしたところです。

    編集部注:「デルタモン」は「デルタもん」の誤りなのか、アンドロイドの名前なのか不明だったので、そのまま掲載しておりますが、正式名称は「デルタもん」でお願いしますね!


    一見普通の学園生活を送るデルタもん…しかし、その裏には衝撃の真実が隠されていました!
    未来から来たAIアンドロイドという設定を活かしたSF要素、そして謎めいたギャル「ミライ」との関係性など、続きが気になる展開に引き込まれます。

    【5分で大変身!デルタもんのAI漫画チャレンジ】 by ともっち

    画像
    https://x.com/tomomaga358/status/1831305259882606756

    【使用ツール】 •Anifusion: AI漫画生成ツール(4コマの基本ビジュアル、キャラクター、背景作成) •コミPo!: 漫画編集ソフト(吹き出し、テキスト、オノマトペの追加と配置調整) •Claude 3.5 Sonnet: AI言語モデル(ストーリー構成、キャラクター設定、カメラアングル提案、セリフ作成、コマ説明生成) 【概要】 絵が苦手なAIアンドロイド女子高生、デルタもんが、AIツール「Anifusion」を発見し、わずか5分で漫画を作成。絶望から希望、そして成功へと至る過程を、ユーモアたっぷりに描いた4コマ漫画。読者の「私もやってみたい!」を引き出す、AIの可能性を示す作品。 【コンセプト】 「誰でも簡単にAIで漫画が作れる」という現代テクノロジーの魅力を、親しみやすいキャラクターと分かりやすいストーリーで伝える。技術の進歩により変わる創作の形を示しつつ、読者の創作意欲を刺激し、AIツールへの興味を喚起する。 【工夫した点】 •AIツールの魅力を視覚的に表現: 1コマ目:絶望的な落書きから、4コマ目:絵心なしでも漫画完成を達成するまで、劇的な変化を描写 3コマ目:パソコンでAIが生成した漫画の画面をデルタもんのバックに描くことにより視覚的効果とセリフによる生成スピードを強調 •感情を強調するオノマトペ使用: 「ふぅ〜」(落胆)、「ガーン」(驚き)、「かぁぁぁ•••」(感動)、「ドーン」(決意)他あり。 各コマの雰囲気をさらに盛り上げ、読者の感情移入を促進 •キャラクターの一貫性維持: 全コマでデルタもんの特徴(白青の制服、緑の猫耳、青いしっぽ)を統一 感情変化を耳としっぽの動きで表現し、キャラクターの生き生きとした表情を演出 ストーリープロンプトにも反映しました。 •読者目線を考慮した構図: 右上から左下への自然な視線の流れを意識した吹き出しとセリフの配置 3、4コマ目でダイナミックなアングルを採用し、感情の高まりを表現 •ストーリーと視覚表現の調和: AIを活用して各コマの展開がスムーズにつながるよう調整 「絵心ゼロ→AI発見→驚き→成功」という明確な流れで読者の共感を獲得。

    絵を描くのが苦手なデルタもんがAIツール「Anifusion」を使って漫画制作に挑戦!
    わずか5分で完成する様子に、AI技術の進化を感じさせられます。
    読者も「自分も作ってみたい!」と思わせる、AIの可能性を感じさせる作品です。

    【つよつよメンタルデルタもん】 by いぬさわ・ばう@InsBow🐾

    画像
    https://x.com/InsBow/status/1832967748760277383

    あまりにも作品の投稿が少なすぎることに悩んでいるようで悩んでいないデルタもんの日常を描きました。

    応募作品の少なさに動じない、デルタもんのつよつよメンタルっぷりがコミカルに描かれています。Anifusionのみで作られたという点にも注目です。

    【自撮り投稿デルタもん】 by いぬさわ・ばう@InsBow🐾

    画像
    https://x.com/InsBow/status/1832992326006055078

    あまりに投稿が少なすぎるデルタもんが自分でコンテンツを作りはじめるまでの前日譚ですわ
    Anifusionだけで作ってます

    「つよつよメンタルデルタもん」の連作ですね。
    投稿が少ないことに悩み、自らコンテンツを作り始めるデルタもんの姿が描かれています。表情豊かなデルタもんの姿にクスッと笑ってしまう作品です。

    【洞窟探索 日和】 by mounero

    画像

    AniFusionを使っていくつかAIマンガ作品を制作した経験を活かして、 生成ガチャとプロンプトの工夫を頑張りました。LoRAがある デルタもんでのマンガ生成とても楽しかったです。キャラがいい。 クリップスタジオで文字入れするのも楽しかったです。

    AniFusionを使った経験を活かし、生成ガチャとプロンプトを駆使して制作された作品。
    LoRAを活用したデルタもんの表現や、クリップスタジオでの文字入れなど、細部までこだわられています。

    【悪酔いデルタもん】 by いぬさわ・ばう

    画像
    https://x.com/InsBow/status/1833144163258556627

    自分の漫画作品が少なすぎてやけ酒を飲んでいたら、気がつけば自分の漫画を制作しているデルタもんです。

    応募作品の少なさにやけ酒を飲むデルタもん…!?
    酔った勢いで漫画を制作する姿がユーモラスに描かれています。
    自分大好きなのですね!

    【変身せよ!デルタもん熟女】 by 小泉勝志郎

    画像
    画像
    画像
    画像
    https://x.com/koi_zoom1/status/1833509800241729912

    作品概要:デルタもんは現代の熟女出留田文に変身してもらうことで現代に来ようとするが、デルタもんより出留田文の方が視力が良かったために交渉は決裂。しかし、49歳の出留田文には老眼で会社の資料が読めず、デルタもんに変身して資料を読むのであった。
    使用モデル:DucHaitenPonyNoScoreV4
    こだわり:デルタもん、出留田文、変身後デルタもんそれぞれデザインに一貫性があるようにしている。デルタもん、出留田文は個別にLoRAを作成。変身後デルタもんは両方のLoRAを適用して作成。変身シーンは双方のLoRAの割合を調整して生成。 デルタもんはオリジナルデザインに忠実にした。出留田文は49歳に見えるように、アニメ系モデルが苦手な熟女表現をできるようにしている。変身後デルタもんは出留田文がちょっと若返ってデルタもんの服装になりながら出留田文の風味も出るようにしている。

    なんと、熟女 出留田文でるた あや がデルタもんに変身!?
    LoRAを駆使したキャラクターデザインと、細かな若返り制御にも注目です。

    【AIの心得】 by わら

    画像
    https://x.com/wara_hirono/status/1833425252023665148

    デルタもんにアシスタントAIロボ(あまり役に立たない)がくっついていたらおもしろいなと思って描きました

    デルタもんに、ちょっと頼りないアシスタントAIロボが!?
    二人の掛け合いが面白い作品です。
    しかもメイキングとオリジナルキャラクターまで!

    【恐怖のマニフェスト】 by 合同会社オフィスSATOU

    画像
    画像
    画像
    画像

    進次郎記者会見のパロディです。デルタもんならこう言うとおもいました。

    ご応募いただいたみなさま、ありがとうございました!

    優秀賞、作品発表!

    【審査基準】
    ・品質
    ・発想力
    ・物語性

    BlendAI特別協賛「デルタもん4コマ漫画コンテスト
    優秀賞は【AIの心得】 by わら さんです!

    画像

    小宮自由(BlendAI株式会社 代表)コメント:
    たくさんのご応募ありがとうございました。デルタもんをリリースしてから8ヶ月、様々な方々が様々なデルタもんを描いてくれるようになってありがたく思います。すごい尖った作品、技術的にも難度が高く、自分の好きを貫いた作品が出てきたりして、良いことだと思いました。優秀賞には わらさんの作品を選出させていただきましたが、品質、発想力、物語性に加えて「作家性」。手書きを組み合わせることで自分の作品とAIのテクニックを融合させた良いコラボレーションだと思いました。そして何より「ガンマミィ」について触れてくれているのが嬉しかったです!

    白井暁彦(AICU media編集長)コメント:
    たくさんのご応募ありがとうございました。複数の作品を投稿してくださった方や、こだわりのある作品を締め切りギリギリに投稿してくださった方、締切に間に合わなかったけど、Xへ共有してくださった方などAICUのファンと「デルタもん」ファンのコミュニティの温かさを感じるコラボイベントとなりました。優秀賞の作品にはAICUマガジンでの連載オファーが付くこともあり、プロのAIクリエイターとしての視点での評価としての視点も加えさせていただきました。わらさんは「AICUマガジン Vol.4」での掲載経験もありメイキングまで公開頂いていることからも「もっと読みたい…!」という気持ちにさせる作品が作れるクリエイターであることも評価のポイントになっております。

    【優秀賞】Amazonギフト券4444円分+デルタもん4コマ漫画連載オファー獲得となります。おめでとうございます!連載オファーについてはDMにてご相談させていただきます!


    今回ご特別協賛をいただいたBlendAIさんおよびデルタもん原作者・支援者のみなさまに改めまして感謝いたします。

    そして告知です。

    そしてさらに、BlendAIさんが現在開発中の新キャラクター「ガンマミィ」のクラウドファンディングも予定されています!
    クラウドファンディングへの参加を通して、あなたもAIキャラクターの誕生に貢献することができます。そして、完成したLoRAを使って、ガンマミィをテーマにしたコンテストにも参加できます!

    https://camp-fire.jp/profile/BlendAI

    そして、この熱気はまだまだ続きます!

    またAnifusionでのデルタもん公式LoRAの使用方法も紹介されております。

    AICU mediaも次なるAI漫画コンテストを企画中です!

    デルタもん4コマ漫画コンテストに続く第二弾として、AICU主催のコンテストを予定しております!

    AI技術と創造性が融合した、この exciting な流れに、ぜひあなたも参加してください!

    まずは X@AICUai をフォローよろしくお願いいたします!

    #デルタもん4コマ #AICU #BlendAI #AIart #AIマンガ #AniFusion #AImanga #デルタもんイラストコンテスト #DeltaMon

    Originally published at https://note.com on Sept 13, 2024.

  • [ComfyMaster14]ComfyUIでのTextToImageを極める!!(4)複数キャラを同時に制御する

    ComfyUIで「思い通りの画像を生成したい!けど思うようにいかない…」という方、TextToImage(t2i)を使いこなせていますか?
    Stable Diffusionの内部の仕組みを理解し、ComfyUIでのText to Imageテクニックを身につけて、思い通りの画像を生成できるようになりましょう!

    画像
    制御したいですよね

    こんにちわ、AICU media編集部です。
    ComfyUI マスターガイド」第14回目になります。

    前回「ComfyUIでのTextToImageを極める!! (3)Concatで複数CLIPをつなぐ」で
    は、Conditioning(Concat)ノードと複数CLIPを結合して「プロンプトの限界」を超え、その内部動作をソースコードから確認しました。
    今回は実験を通して確認していきたいと思います。

    長いプロンプトを使った実験

    前回、Concatをつかうことで、長いプロンプト中の「緑の森」「赤い城」といった背景/世界と建築物での「色分け」を紹介しました。

    CLIP1「a red castle on a hill」(1344×768, seed:13)
    CLIP2「A fantasy landscape, overlooking a vast green forest」

    画像

    さらに Conditioning(Concat)のToとFromはToがベースプロンプトで、Fromが追記であることを解説しました。でも短いプロンプトで入れ替えてみても絵に変化はなく、どちらがベースなのかは確認できなかったという結論になっていました。
    今回はキャラクターイラストを使って、ものすごく長いプロンプトで実験してみましょう。
    AICUで生成AIを使ってキャラクターデザインやイラストレーションを担当している犬沢某先生に相談して長めのプロンプトをいただきました。

    face focus, dog ears, 1boy, best quality, 16K, eating hair, dog nose, looking at looking at viewer, short hair, skinny, big eyes, dark skin, tall, naked overalls, 20-year-old,

    beautiful, bold black outline, pink, pastel colors, Light Pink, scowl, brown hair, golden eyes, simple line drawing, animal ears, solo, brown hair, overalls, cat ears, dark skin, short hair, dark-skinned female, simple background, choker, sweater, yellow shirt, long sleeves, pink choker, white background, closed mouth, extra ears, animal ear fluff

    これは2つのキャラクターを表現する2つのプロンプトを貼り付けたものです。途中に「髪を食べる(eating hair)」という謎の単語を含めて合計78ワードあります。

    画像

    Concatを使った実験:単純な結合

    まずは実験として、「Load Default」をつかって初期のワークフローにして、モデルをSDXL(sd_xl_base_1.0.safetensors)に変更し、, seed=13 fixed, 1344×768にして、CLIPひとつでそれぞれ生成してみます。

    「face focus, dog ears, 1boy, best quality, 16K, eating hair, dog nose, looking at looking at viewer, short hair, skinny, big eyes, dark skin, tall, naked overalls, 20-year-old, beautiful, bold black outline, pink, pastel colors, Light Pink, scowl, brown hair, golden eyes, simple line drawing, animal ears, solo, brown hair, overalls, cat ears, dark skin, short hair, dark-skinned female, simple background, choker, sweater, yellow shirt, long sleeves, pink choker, white background, closed mouth, extra ears, animal ear fluff」、ネガティブプロンプトは「text, watermark」(2トークン消費)で生成してみます。

    画像

    さすが!!かわいい!
    男性と女性が混ざった雰囲気ですね。長いプロンプトが結合できていることが確認できました。

    プロンプトの整理

    次にこの2人分のプロンプトを前半と後半に分けて生成してみます。

    画像

    前半「face focus, dog ears, 1boy, best quality, 16K, eating hair, dog nose, looking at looking at viewer, short hair, skinny, big eyes, dark skin, tall, naked overalls, 20-year-old」
    Negative 「text, watermark」, SDXL, 1344×768, seed=13

    (顔の焦点, 犬の耳, 1boy, 最高品質, 16K, 髪を食べる, 犬の鼻, 見る人を見ている, 短い髪, 痩せている, 大きな目, 浅黒い肌, 背が高い, 裸のオーバーオール, 20歳)

    画像

    顔に焦点を当てた半裸でオーバーオールを着た20歳の青年が生成されました。続いて後半です。

    後半「beautiful, bold black outline, pink, pastel colors, Light Pink, scowl, brown hair, golden eyes, simple line drawing, animal ears, solo, brown hair, overalls, cat ears, dark skin, short hair, dark-skinned female, simple background, choker, sweater, yellow shirt, long sleeves, pink choker, white background, closed mouth, extra ears, animal ear fluff」
    Negative 「text, watermark」, SDXL, 1344×768, seed=13

    (美しい, 太い黒の輪郭, ピンク, パステルカラー, ライトピンク, しかめっ面, 茶色の髪, 金色の目, シンプルな線画, 動物の耳, ソロ, 茶色の髪, オーバーオール, 猫耳, 浅黒い肌, 短い髪, 浅黒い肌の女性, シンプルな背景, チョーカー, セーター, 黄色のシャツ, 長袖, ピンクのチョーカー, 白背景, 閉じた口, 余分な耳, 動物の耳の綿毛)

    画像

    Concatを使った実験:整理と結合

    これらを Conditioning(Concat)を使って繋いでみます。

    画像

    CLIP1-Conditioning_to「face focus, dog ears, 1boy, best quality, 16K, eating hair, dog nose, looking at looking at viewer, short hair, skinny, big eyes, dark skin, tall, naked overalls, 20-year-old」
    CLIP2-Conditiong_from「beautiful, bold black outline, pink, pastel colors, Light Pink, scowl, brown hair, golden eyes, simple line drawing, animal ears, solo, brown hair, overalls, cat ears, dark skin, short hair, dark-skinned female, simple background, choker, sweater, yellow shirt, long sleeves, pink choker, white background, closed mouth, extra ears, animal ear fluff」
    Negative 「text, watermark」, SDXL, 1344×768, seed=13

    画像

    1boyとdark-skinned femaleが混ざっていますので、難しいと思います。中性的ではありますが、どちらかというと男性っぽいですね。
    まずはConcatで結合が機能していると考えられます。

    FromとToはどっちがベースなのか実験的に確認する

    さてFromとToはどっちがベースなのか実験的に確認していきましょう。
    さきほどの中性的なイラストの前後半を入れ替えてみます。

    画像

    CLIP1-Conditioning_to「beautiful, bold black outline, pink, pastel colors, Light Pink, scowl, brown hair, golden eyes, simple line drawing, animal ears, solo, brown hair, overalls, cat ears, dark skin, short hair, dark-skinned female, simple background, choker, sweater, yellow shirt, long sleeves, pink choker, white background, closed mouth, extra ears, animal ear fluff」
    CLIP2-Conditiong_from「face focus, dog ears, 1boy, best quality, 16K, eating hair, dog nose, looking at looking at viewer, short hair, skinny, big eyes, dark skin, tall, naked overalls, 20-year-old」
    Negative 「text, watermark」, SDXL, 1344×768, seed=13

    画像

    たしかに同じではなさそうです。toとfromは英語的な意味とは逆で、「toがベースでfromが追加条件」という説が実証できているようにも見えます。

    キャラクターの描き分け実験:空白CLIP、クオリティプロンプト

    実はこのプロンプト、2つのキャラクターが混ざっています。1boyとfemale、Dog earsと Cat ears、「髪の毛を食べる」と「口を閉じる」という破綻しやすそうなキーワードが混在していますので、これを整理してみます。

    混ざっているプロンプトをわかりやすく、キャラクター1,2と演技、画風やクオリティプロンプト、と分けて入れ替えてみます。

    キャラクター1「1girl, pink, pastel colors, Light Pink, scowl, golden eyes, animal ears, solo, overalls, cat ears, dark skin, short hair, dark-skinned female, choker, sweater, yellow shirt, long sleeves, pink choker, closed mouth, extra ears, animal ear fluff」(1girl、ピンク、パステルカラー、ライトピンク、しかめっ面、金色の目、動物の耳、ソロ、オーバーオール、猫耳、黒い肌、ショートヘア、肌の黒い女性、チョーカー、セーター、黄色のシャツ、長袖、ピンクのチョーカー、口を閉じた、余分な耳、動物の耳の綿毛)

    これをConditioning_toに設定して、Conditioning_fromを空白する例と、それを入れ替えた例、さらにクオリティプロンプトと背景設定を入れ替えた例を実験します。

    画像

    やはり空白のような極端に短いCLIPでは効果は確認できないようです。クオリティプロンプトを加えてみます。

    画像

    Conditioning_to「1girl, pink, pastel colors, Light Pink, scowl, golden eyes, animal ears, solo, overalls, cat ears, dark skin, short hair, dark-skinned female, choker, sweater, yellow shirt, long sleeves, pink choker, closed mouth, extra ears, animal ear fluff」
    Conditioning_From「beautiful, bold black outline, simple line drawing, simple background, white background, best quality, 16K」

    画像
    画像

    Conditioning_to「beautiful, bold black outline, simple line drawing, simple background, white background, best quality, 16K」
    Conditioning_from「1girl, pink, pastel colors, Light Pink, scowl, golden eyes, animal ears, solo, overalls, cat ears, dark skin, short hair, dark-skinned female, choker, sweater, yellow shirt, long sleeves, pink choker, closed mouth, extra ears, animal ear fluff」

    画像

    たしかに、ベースプロンプトがConditioning_toではありそうです。長いプロンプトでの実験は効果ありそうです。画風とキャラクターについての実験を続けます。

    続いてキャラクター2のプロンプトを設定します。もともと頂いたプロンプトからキャラクターとして一貫性がありそうな「1boy, dog ears, dog nose, short hair, skinny, big eyes, looking at viewer, dark skin, tall, naked overalls, 20-year-old, brown hair」(1boy、犬耳、犬鼻、短髪、痩せ型、大きな目、視聴者を見ている、黒い肌、背が高い、裸のオーバーオール、20歳、茶髪)として、先程のキャラクター1の代わりに入れてみます。

    画像

    Conditioning_to「1boy, dog ears, dog nose, short hair, skinny, big eyes, looking at viewer, dark skin, tall, naked overalls, 20-year-old, brown hair」
    Conditioning_from「beautiful, bold black outline, simple line drawing, simple background, white background, best quality, 16K」

    画像

    入れ替えてみます。

    画像

    Conditioning_to「beautiful, bold black outline, simple line drawing, simple background, white background, best quality, 16K」
    Conditioning_from「1boy, dog ears, dog nose, short hair, skinny, big eyes, looking at viewer, dark skin, tall, naked overalls, 20-year-old, brown hair」

    画像

    たしかに、ベースプロンプトがConditioning_toではありそうです。

    実験:多段Concat

    それではConcatを多段にするとどうなるでしょうか?
    接続としては以下のようになります。
    Concat1(To:画風 + From: キャラクター1boy)
    Concat2(To:Concat1の結果+Form:キャラクター2girl)

    画像
    画像

    多段Concatは問題なく接続されますし、結果も良好です。
    さて次は問題です。

    Concat1(To:画風 + From: キャラクター2girl)
    Concat2(To:Concat1の結果+Form:キャラクター1boy)

    このようなネットワークを組んだときに、boyが出るのかgirlが出るのか、皆さんはどう考えますか?

    画像
    画像

    結果は「入れ替えても変わらない」です。Conditioningの多段、特にFromを多段Concatで入れ替えても結果は変化ありませんでした。
    シードによって描かれる結果は変わりますが、Fromを入れ替えても変化はないのです。これは便利ですね。

    画像
    画像

    Concat1(To:キャラクター1boy+ From: 画風
    Concat2(To:Concat1の結果+Form: キャラクター2girl

    画像

    Concat1(To:キャラクター1boy+ From: キャラクター2girl
    Concat2(To:Concat1の結果+Form: 画風

    画像

    ComfyUIにおいて強調構文は平均ではなく、Fromは掛け算のように働くと覚えておくと良いのかもしれないですね。

    実験:Combineでの融合と入れ替え

    同じようにConditioning(Concat)ではなく、Conditioning(Combine)で融合と入れ替えをしてみます。こちらも全く変化なしです。

    画像
    画像
    画像
    画像
    画像
    画像

    複数の異なる特徴を持ったキャラクターを描くには?

    さて、Concatの理解は進みましたでしょうか?
    では複数の異なる特徴を持ったキャラクターを描くにはどうやったら良いのでしょうか?

    ポイントは、まず「大事なものはToに設定」そして「それぞれのCLIPにも設定」しましょう。
    複数のキャラクターの画風の統一を図りたい、同じ空間や世界に配置したいときはToに書きます。これをベースとして、このように2人の人物が出てくれば、あとは詳細を75トークン以内で表現するだけで2人以上のキャラクターの画像をそれぞれ生成することができるようになります。

    CLIPを2つでConcatだけで構成する場合にはこんな感じです。
    [CLIP1] best quality, beautiful, 1girl and 1boy,
    [CLIP2] best quality, beautiful, 1girl and 1boy,
    ここまでいれる、というテクニックが非常に重要です。
    こんな絵も作れるようになります。

    画像

    [CLIP1]
    best quality, beautiful, 1girl and 1boy, 1girl, female, 20-year-old, cat ears, pink choker, sweater, yellow shirt, long sleeves, white background, closed mouth, extra ears, animal ear fluff, solo, brown hair, overalls, pink, pastel colors, Light Pink, face focus,

    [CLIP2]
    best quality, beautiful, 1girl and 1boy, blue choker, eating hair, dog ears,16K, dog nose, looking at looking at viewer, short hair, skinny, big eyes, dark skin, tall, naked overalls, bold black outline, scowl, brown hair, golden eyes, simple line drawing, animal ears, simple background, dark skin, short hair, dark-skinned

    多段Concatを使った作例

    実際にはCLIP2つだけで複数キャラクターと世界や画風を設定するよりも、多段のConcatを使ったほうが楽かもしれません。
    一連の流れを出力例からおさらいします。

    画像

    ベースになる画風を1段目のConditiong_toに設定します。

    Conditiong_to「1boy and 1girl, beautiful, bold black outline, simple line drawing, simple background, white background, best quality, 16K」

    画像

    二人がどんな演技をしているか、共通で維持したいものはすべてのCLIPに入れておけば強調されます。

    画像

    conditioning_fromとconditioning_toに共通に「1girl and 1boy」を入れて、それぞれの特徴をCLIP1とCLIP2で詳細に描写していくことができます。

    画像

    このあたりで一度、シードをfixedからIncrementに変更して、Queue Prompt Extra Options▶Batch countを20として、20枚、シードを増やしながら一気に生成してみます。

    画像
    画像
    美しい結果はメンバーシップエリアに置いておきます…!

    肌の褐色をプロンプトで強調していくか、いろんな方向性があり得ると思いますが、ここまで制御性が高くなっていると、好きなテイストを選ぶことも難しくないと思います。

    この段階では画風、肌の色やレイアウトのほうが表情や指といった細かいところよりも重要です。画面比率を変えると大幅に変わってしまいますので今回は1344×760で固定しておいたほうが良いでしょう。
    SDXLの場合、テキスト以外にも画像解像度等の条件が加えられる場合はconditioning_toの方を使います。

    表情や指がおかしいところはImageToImageで修正できますが(次回以降)、今回はネガティブプロンプトやembeddingで仕上げていきます。

    プロンプトだけのSDXL、TextToImageで完成させた作品がこちらです。
    便宜上、CLIP0、CLIP1、CLIP2と呼んでいますが、いままでの2段構成のConditioning(Concat)によって実装しています。

    画像

    CLIP0(conditioning_to) : 1boy and 1girl looking each other, beautiful, bold black outline, simple line drawing, simple background, white background, best quality, 16K

    CLIP1(Conditiong_from) : 1boy and 1girl looking each other,1boy face focus, dog ears, 1boy, best quality, 16K,, dog nose, looking at looking at viewer, short hair, skinny, big eyes, dark skin, tall, naked overalls, 20-year-old

    CLIP2(Conditioning_from) : 1boy and 1girl looking each other, 1girl , pink, pastel colors, Light Pink, scowl, golden eyes, animal ears, solo, overalls, cat ears, dark skin, short hair, dark-skinned female, choker, sweater, yellow shirt, long sleeves, pink choker, closed mouth, extra ears, animal ear fluff

    Negative: text, watermark, embeddings:negativeXL_D

    まとめ:conditioning

    これまで4回にわたってComfyUIでSD1.5およびSDXLを使ってプロンプトの基本的な方法から、応用的なテクニックまでを紹介してきました。今回はイラストレーションで「複数のキャラクターを同時制御する」という実験を行いましたが、プロンプトだけでなく、CLIPの内部やConditioningを使ってComfyUIならではの絵作りを探求していくベースになったようであれば幸いです。実はconditioningにはたくさんあり、今回紹介したCombine、Concatの他にはAverage、 Set Areaなど複数存在します。例えばAverageは結合ではなく線形補間します。

    画像

    次回は、image-to-imageの方法を紹介します。乞うご期待!

    X(Twitter)@AICUai もフォローよろしくお願いいたします!

    画像生成AI「ComfyUI」マスターPlan

    画像生成AI「Stable Diffusion」特に「ComfyUI」を中心としたプロ向け映像制作・次世代の画像生成を学びたい方に向けたプランです。最新・実用的な記事を優先して、ゼロから学ぶ「ComfyUI」マガジンからまとめて購読できます。 メンバーシップ掲示板を使った質問も歓迎です。

    • メンバー限定の会員証が発行されます
    • 活動期間に応じたバッジを表示
    • メンバー限定掲示板を閲覧できます
    • メンバー特典記事を閲覧できます
    • メンバー特典マガジンを閲覧できます
    • 動画資料やworkflowといった資料への優先アクセスも予定

    ゼロから学ぶ「ComfyUI」マガジン

    https://note.com/aicu/m/md2f2e57c0f3c

    マガジン単体の販売は1件あたり500円を予定しております。
    2件以上読むのであればメンバーシップ参加のほうがお得です!というのもメンバーシップ参加者にはもれなく「AICU Creator Union」へのDiscordリンクをお伝えし、メンバーオンリー掲示板の利用が可能になります。

    https://note.com/aicu/membership/boards/61ab0aa9374e/posts/db2f06cd3487?from=self

    もちろん、初月は無料でお試しいただけます!
    毎日新鮮で確かな情報が配信されるAICUメンバーシップ。
    退会率はとても低く、みなさまにご満足いただいております。
    ✨️オトクなメンバーシップについての詳細はこちら

    本編で2人以上のキャラクターをそれぞれ描くことができるようになりましたね。ここではシードを変えた問のさまざまな中間生成画像を紹介します。


    この記事の続きはこちらから https://note.com/aicu/n/nacf66b92d2d5

    Originally published at https://note.com on Sept 4, 2024.

  • あなたの才能が、デルタもんの世界を動かす!「デルタもん4コマ漫画コンテスト」開催決定

    「デルタもん」の世界に、あなただけの作品を刻み込め!
    BlendAI特別協賛「デルタもん4コマ漫画コンテスト」を開催します!

    クリエイティブAI時代に「つくる人をつくる」をビジョンに活動するAICUは、このたび「デルタもん」などのAIキャラクターを開発するBlendAIさんに特別協賛いただき、第5回デルタもんイラストコンテストを4コマ漫画形式で開催する運びとなりました!

    https://note.com/aicu/n/ncd46ab0f3286

    画像

    【コンテスト概要】

    個性的なキャラクターとユニークな世界観を持つ「デルタもん」の4コマ漫画をあなたの想像力とユーモアで、新たな魅力を引き出し、多くの人の心を掴む作品を生み出してください!
    AICU media公式SNS、note、AICUマガジンで作品公開!
    さらに有力作品のクリエイターにはAICU編集部やパートナー企業からの連載のチャンスも!

    才能あふれるクリエイターの皆様、このコンテストで、あなたの才能を世にアピールしましょう!

    【募集テーマ】「デルタもんの日常」4コマ漫画

    デルタもんの世界観をモチーフにしたカジュアルな4コマ漫画作品を募集します。

    【デルタもんとは?】

    AI技術の進展を象徴する新たなキャラクターであり、科学の発展を支援するために生まれました。なんらかの形でAIを利用している場合、このキャラクターを商業利用することが出来ます。ただし、AIとは無関係な利用、たとえば、手描きなどの二次創作や商業利用は禁止とさせて頂きます。「デルタもん」という名称は、COVID-19変異株の「デルタ」に付けられたネガティブな印象を払拭し、よりポジティブなイメージを持っていただけるようこの名前が選ばれました。
    このキャラクターは「アルファパラダイスプロジェクト」と称する、ギリシャ文字の24文字をモチーフにしたキャラクターシリーズの第一弾です。将来的には、追加のイラスト、詳細設定、3Dモデル、LoRAモデルなど、幅広い商用版権フリー素材を提供する予定です。

    デルタもん公式ページ より

    【どうやってつくるの?】

    素材やコンテンツはBlendAI公式で提供しています

    https://blendai.jp/contents

    ・LoRAを自分で作る場合
    AICUの過去記事や「SD黄色本」を参考に、オリジナルのLoRAをつくるもよし…
    ▼キャラLoRA学習ガイド2024年5月版 #SD黄色本・公式LoRA

    https://note.com/aicu/n/n02de834e3d5c

    ・公式LoRA
    最近はデルタもん公式LoRAも配布されています

    https://blendai.booth.pm/items/5801621

    AICU編集部による作例「ようこそ!アイキュー部」※ちびデルタとして出演

    https://note.com/aicu/n/ne878b6d68004

    ・編集長による作例:AniFusionで作成したようです

    LoRAをURLで伝えるだけでデルタもん漫画が生成できます!

    画像

    AniFusionでデルタもんのLoRAを使う方法についてはこちらの記事をご参照ください。最近のアップデートがすごいです。

    そして、編集部の特別情報によると、次号の「AICUマガジン Vol.4」は「AniFusion特集」が予定されているとのこと!これは保存版になるかも!?

    【応募方法】

    1. 「デルタもん」をテーマにしたオリジナル漫画を作成する
    Anifusionを中心に、色々なAIツールを使用してあなたのイメージを自由に表現しましょう。

    2. 作品をX(Twitter)に投稿し、応募フォームへ記入します
    エントリーフォームのURL → https://j.aicu.ai/Delta4manga

    https://docs.google.com/forms/u/7/d/e/1FAIpQLSdjGGZ6Ze2Gr8Bl2183UAb2_26htkD3Y9vDfB7IR0imXTO1dw/viewform

    必須ハッシュタグ #デルタもん4コマ #AICU #BlendAI
    過去作参照タグ: #デルタもんイラストコンテスト

    コンテストへの応募であることを明記し、AICU公式Xアカウント X@AICUai をフォローしてください(コンテストの受賞者へのご連絡はXのDMを使用いたします)。

    【過去のコンテスト参加者さんの作例から…】

    「デルタもん4コマ漫画コンテスト」開催期間

    告知開始:2024年8月22日(木)
    エントリー期間:2024年8月23日(金)~2024年9月10日(火)23:59
    審査期間:2024年9月11日(水)~2024年9月13日(金)
    結果発表:2024年9月14日(土) AICU media公式noteにて発表(予定)!

    期間中、審査員、デルタもん公式 X@BlendAIjp と X@AICUai が各ハッシュタグを巡回してコミュニケーションを取ることがあります。
    早めの投稿、多数の投稿をお待ちしております!

    画像

    【審査基準】

    ・品質
    ・発想力
    ・物語性

    作品の応募においては日本の法令を遵守し、 画像生成AIクリエイター仕草(v.1.0) をご参照いただき、モラルに沿った生成AIのご使用をお願いいたします。また、BlendAIが設定する利用規約も遵守してください。
    AICU編集部では「全年齢向け」(映倫・G、CERO-A)およびKindle Direct Publishingコンテンツガイドラインを考慮して採択します。
    ■デルタもんを利用する際のルールの簡単なまとめ https://blendai.jp/guideline
    ■Kindle Direct Publishingコンテンツガイドライン https://kdp.amazon.co.jp/ja_JP/help/topic/G200672390

    【賞】

    ・優秀賞:AICU編集部よりAmazonギフト券4444円分+デルタもん4コマ漫画連載オファー獲得!
    ・BlendAI賞:BlendAI代表 小宮自由氏より特別賞を設定します
    ・入賞:AICUマガジン誌上および AICU media媒体上での紹介

    【コンテスト審査員より】

    BlendAI代表 小宮自由:コンテストにご興味を持っていただきありがとうございます。『デルタもん』は、AIと創作者の架け橋になることを目的に創られたキャラクターです。皆さん楽しんで創作していただければと思います。

    主催:AICU media編集部
    特別協賛:BlendAI

    【受賞作品の発表】

    AICU media公式note(https://note.com/aicu/)及び、AICUマガジン誌上にて発表いたします。

    さらに、優秀賞・入選作品でメイキング記事などをご寄稿いただける方には、AICUパートナークリエイターとして所定の原稿料を謝礼としてお贈りします。

    【応募に関するQ&A】

    ・Photoshopなどで加工・加筆したものを投稿できますか
    できます。AI生成のみで生成した画像も、加筆したものも、どちらも可能です。

    ・不正や不適切な行為があった場合はどうなりますか
    各種ツールの不正利用や利用規約に反する行為があった場合、その他、運営が不適切と判断した場合、予告なくエントリーの対象から外させて頂く場合がございます。

    ・応募作品のレギュレーションについて
    作品の公開はX(Twitter)および作者の管理によるものになりますが、「全年齢向け」(映倫・G、CERO-A相当)に反する作品はコンテストの評価対象外とさせていただきます。ご容赦ください。

    ・応募作品の著作権はどうなりますか
    X(Twitter)を経由したイベントのため、X利用規約および著作権に関するポリシーに従い「ユーザーは、ポストまたは共有する自身のコンテンツに対する所有権と権利を留保するとともに、自分のコンテンツを世界中で利用できるようにしたり、他のユーザーがポストまたは共有できるようにしたりするための非独占的ライセンスを当社に提供するものとします。」となります。
    他人の著作権を侵害しないこと、エントリーフォームからのエントリーによってエントリーの意思を表明していただき、AICU独自メディアでの掲載する際は、非独占ライセンスを提供頂く形となります。

    【本コンテストに関するお問い合わせ】

    本件に関するお問い合わせは X(Twitter)@AICUai まで

    AICU Inc. について https://corp.aicu.ai/
    BlendAI について https://blendai.jp/

    デルタもんと一緒に、あなたの才能を世界に広げませんか?

    たくさんのご応募お待ちしております!

    画像
    シェア歓迎です!

    #デルタもん4コマ
    #AICU
    #BlendAI

    Originally published at https://note.com on Aug 21, 2024.

  • [保存版] Animagine XL 3.1 生成比較レポート

    [保存版] Animagine XL 3.1 生成比較レポート

    つくる人をつくる!AICU media の知山ことねです。

    Animagine XL 3.1リリース

    2024年1月16日に公開された Stable Diffusion の画像生成モデル「Animagine XL 3.0」から、新バージョンとなる Animagine XL 3.1 がリリースされました!

    この記事では、Animagine XL 3.0 と比較して画風などに違いはあるか、また Animagine XL 3.1 から搭載された新たなタグについて紹介していきます。

    【関連記事】

    漫画制作に適したモデルは?Animagine 3.1 vs Animagine 3.0 徹底比較を行いました!

    XL 3.1 では、Animagine XL 3.0 で重要だったプロンプトも引き続き使用できます!

    https://note.com/aicu/n/n44085d702617

    Animagine XL 3.0 リリースノートはこちら。

    https://note.com/aicu/n/nd05f3a656dd8

    Hugging Face はこちら

    https://huggingface.co/cagliostrolab/animagine-xl-3.1

    公式リリース 和訳(一部抜粋)

    Animagine XL 3.1は、前バージョンのAnimagine XL 3.0を強化したもので、より高い品質でアニメスタイルの画像を生成できるように改良されています。有名なアニメシリーズからのより幅広いキャラクター、最適化されたデータセット、より良い画像作成のための新しいタグが含まれています。アニメキャラクターの正確で詳細な表現を生成することで、アニメファン、アーティスト、コンテンツクリエイターにとって価値あるリソースとなることを目指しています。

    Animagine XL 3.0 をより高品質にしたということですね!

    Animagine XL 3.0 との比較

    それでは、実際に生成して Animagine XL 3.0 と比較していきましょう。
    今回生成に使用した環境は、Windows10、NVIDIA GeForce RTX 3060 搭載の VRAM6GB の GALLERIA ノート PC に直接インストールした ComfyUI です。

    画風

    まずシンプルなプロンプトで生成し、Animagine XL 3.0 と比較してみます。

    プロンプト: best quality, 1girl
    ネガティブプロンプト: worst quality, low quality, nomal quality, bad anatomy, NSFW

    Animagine XL 3.0

    Animagine XL 3.1

    強い光源、耳の見える髪型、逆光感などの大きな特徴はそのまま残っていますが、Animagine XL 3.0 の特徴だった切れ長の目とピンクの頬が目立たなくなり、露出度も軽減されました。また Animagine XL 3.0 では肌がつやっとする雰囲気がありましたがそれも軽減され、全体的に落ち着いたように感じます。

    また Animagine XL 3.0 よりも Animagine XL 3.1 の方が線画が細くはっきり出ていて、厚塗り感、立体感が減り少し平面的になった印象を受けますね。

    タグ

    Animagine XL 3.0 には画風を指定する「年代タグ」やクオリティを指定する「クオリティタグ」がありましたが、Animagine XL 3.1 ではそれらがアップデートされたことに加え、「Aesthetic Tags」が追加されました。

    クオリティタグ

    Animagine XL 3.1 公式 Hugging Face より

    従来のクオリティタグから数値が少し調整され、タグ名が一部変更されました。よく使用する「masterpiece」「best / worst / low quality」は変わらないので、今まで通りの感覚で使えそうです。

    年代タグ

    Animagine XL 3.1 公式 Hugging Face より

    「2024」が追加され年が少しずつ調整されていること、「late」が「recent」に変更されたことが主な変更で、年代タグも大きくは変わっていません。

    実際の生成画像比較

    newest (2021–2024)

    Animagine XL 3.0 に似た絵柄です

    recent (2018–2020)

    newestを少し繊細にした雰囲気です。VTuber全盛期ですね。

    mid (2015–2017)

    退廃的な雰囲気が可愛いです
    明らかに画風がVTuber風ではなくなってきました。

    early (2011–2014)

    セピアな雰囲気が出ています

    https://j.aicu.ai/Mag2405

    Oldest (2005–2010)

    年代的には涼宮ハルヒや長門有希が流行った時期ですね。
    90年代風のテイストもありますが、明らかに描きわけができています。

    レーティングタグ(年齢制限タグ)

    Animagine XL 3.1 公式 Hugging Face より

    センシティブな表現を調節するレーティングタグも、Animagine XL 3.0 から大きく変化はありません。プロンプトとネガティブプロンプトを使い分けて露出度を調節しましょう。

    Aestheticタグ

    アニメデータに特化したViT(Vision Transformer)画像分類モデルと、コンテンツの美的価値を評価するモデルshadowlilac/aesthetic-shadow-v2を利用し、視覚的に魅力的であるものを生成するタグです。

    aesthetic

    プロンプト「best quality, 1girl, very aesthetic」

    カメラアングルやポーズがダイナミックになりました!

    「aesthetic」(イェステティック;美的)というプロンプトは Nijijourney や Novel AI でも有効なので、ぜひ試してみてください!

    推奨設定

    公式 Hugging Face で紹介されている推奨設定、プロンプトを紹介します。

    「Absurdres」とは造語で、absurd-res、ありえないぐらい高解像度、という意味のようです。

    プロンプト

    masterpiece, best quality, very aesthetic, absurdres

    ネガティブプロンプト

    nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

    CFG Scale

    低め(5–7)

    Sampling Steps

    30以下

    Sampler

    Euler a(Euler Ancestral)

    https://j.aicu.ai/Mag2404

    ギャラリー

    お気に入りの生成画像です!

    パステルカラー!

    抜け感

    kotoちゃん

    oldest

    newest

    アニメ風

    皆さんもお気に入りの画像が生成できたら、ぜひご共有ください!

    メンバーオンリー画像投稿コーナー https://note.com/aicu/membership/boards

    https://note.com/aicu/membership/boards/61ab0aa9374e/posts/17273820a798

    Animagine XL 3.0 おすすめのプロンプトはこちら

    ANIMAGINE XL 3.0 画風が変わる!おすすめプロンプト集
    https://note.com/aicu/n/n44085d702617

    Stable Diffusion — ControlNet入門はこちらから
    https://note.com/aicu/n/nde6fe41f077b

    img2img 入門シリーズはこちらから。
    https://note.com/aicu/n/n08ebe0637a41

    この下にGoogle Colabで動作する「AUTOMATIC1111/Stable Diffusion WebUI」へのリンクを紹介しています。

    https://note.com/aicu/membership/boards/61ab0aa9374e/posts/7cab00942b22?from=self

    メンバーシップ向けサポート掲示板はこちら!応援よろしくお願いします!

    AICU mediaによる新作書籍「画像生成AI Stable Diffusionスタートガイド」ついに予約開始です!(2024年3月29日リリース)

    詳細はこちらから https://ja.aicu.ai/sbxl/

    今回の記事の内容はAICUマガジンでもご覧いただけます

    AICU magazine Vol.1 2024年4月号 https://j.aicu.ai/Mag2404

    AICU magazine Vol.1 2024年5月号 https://j.aicu.ai/Mag2405

    AICU:AIクリエイターユニオンでは皆様のご質問をお待ちしております
    https://note.com/aicu/membership/boards

    Originally published at https://note.com on March 19, 2024.