【文字が描ける!?】Anima_pencil-XL-v5.0.0リリース。作者ぶるぺん氏「ここ数年で最高クラス」

本日はAICU編集部が開発した書籍「画像生成AI Stable Diffusionスタートガイド」についての話題をお送りします。「#SD黄色本」として親しまれ発売から3ヶ月が経過しました本書ですがおかげさまで好評で編集部も胸をなでおろしております。
ところで、書籍の中でイラストレーション生成用のモデルとして中心的に紹介している「blue_pencil-XL」の作者・ぶるぺんさんより新しいモデルの最新バージョンがリリースされたようです。

「ここ数年で最高クラスの出来、前作に匹敵する仕上がり」

とのことですので早速使ってみたいと思います。

ライセンスは Fair AI Public License 1.0-SD

Easy, Simple, High Quality (with a slight trade-off in variety)
blue_pencil-XL meets ANIMAGINE XL 3.0 / ANIMAGINE XL 3.1
License: Fair AI Public License 1.0-SD
You should share the merge recipe if you release a model merged with anima_pencil-XL.
This license does not add any restrictions on your generated images.
For more details, please see the license section of ANIMAGINE XL 3.0.
Please see the “About this Version” section for information on each version.
`No generation services` only apply to v2.0.0
HuggingFace: https://huggingface.co/bluepen5805/anima_pencil-XL
Why not merge ANIMAGINE XL 3.X into blue_pencil-XL?
I want to provide blue_pencil-XL under the CreativeML Open RAIL++-M license.

簡単、シンプル、高品質(バラエティは若干犠牲になりますが)
blue_pencil-XL は ANIMAGINE XL 3.0 / ANIMAGINE XL 3.1に出会った
(訳注:meetはどういう意味なんだろう?つまりマージではなく参考にした、とかブレンドした、という解釈ですが、作者さんにきいてみたい)

ライセンス Fair AI Public License 1.0-SD
anima_pencil-XLでマージしたモデルをリリースする場合は、マージレシピを共有する必要があります。
このライセンスは、あなたの生成した画像に制限を加えるものではありません。
詳細はANIMAGINE XL 3.0のライセンスの項をご覧ください。
各バージョンの情報は「このバージョンについて」をご覧ください。
「生成サービスへの利用は禁止」はv2.0.0にのみ適用されます。
HuggingFace: https://huggingface.co/bluepen5805/anima_pencil-XL
ANIMAGINE XL 3.Xをblue_pencil-XLにマージしないのはなぜ?
blue_pencil-XLをCreativeML Open RAIL++-Mライセンスで提供したいので

https://civitai.com/images/17129585 
AICU参考訳

AICU media編集部の解釈

このモデル「Anima_pencil-XL」は ANIMAGINE XL 3.0(CreativeML Open RAIL++-M)ではなく、ANIMAGINE XL 3.1と同じFair AI Public License 1.0-SD で配布されています。
つまりぶるぺん氏のオリジナル「blue_pencil-XL」をベースモデルであるSDXLと同じ「CreativeML Open RAIL++-M」で配布し続けつつ、その学習に使ったデータセットをANIMAGINE 3.0と3.1の表現能力を有した別モデルとして提供するという試みと理解します。

ぶるぺん氏によるサンプル画像とプロンプト

画像

1girl, solo, cute, white short hair, red eyes, wizard hat, close-up, dynamic angle, smug face, :3, (drooling:0.6), (“I AM RICH”:1.2) printed shirt, pleated long skirt, pantyhose, holding bills, hand on own hip, floating, scattered bills, gambling, crowd, light particles, sparkles, depth of field, masterpiece, best quality, masterpiece, best quality

画像

squid on the ground in the dark

ぶるぺん氏は、美少女だけでなく、このような愛らしいキャラクターを普段はよく生成されております。

画像

1girl, solo, armpits, belt, black background, black belt, black dress, blue background, blunt bangs, brown hair, buttons, closed mouth, dress, gun, hand up, handgun, holster, holstered, light smile, looking at viewer, one eye closed, red eyes, revolver, short hair, upper body, utility belt, v, v-shaped eyebrows, watch, masterpiece, best quality

画像

1girl, solo, indoors, black background, black hair, blue eyes, blunt bangs, bob cut, breath, brown coat, coat, duffel coat, eyelashes, fur trim, fur-trimmed hood, gradient hair, green hair, hood, looking at viewer, looking back, medium hair, multicolored eyes, multicolored hair, parted lips, pink eyes, streaked hair, upper body, winter clothes, winter coat, masterpiece, best quality

AICU media編集部による追従

Civitaiには「Remix」を選ぶことで詳細なパラメータを引き継いで再生成させる機能がありますが、モデルが「SDXL」しか選択できないので、今回は Stability Matrixを使ってローカルPCで生成を試みます。

画像

Stability Matrixの場合は [🧠Model Browser] から直接「anima_pencil」を検索することでダウンロードが簡単にできます。
(設定からCivitai APIキーの設定が必要です)

画像

「インポート」します

画像

カバーアートですが、胸に「I AM RICH」と描かれているのが気になります。
Civitai上で画像をクリックすると右側にGeneration Dataが表示されるので注目してみます。

画像

1girl, solo, cute, white short hair, red eyes, wizard hat, close-up, dynamic angle, smug face, :3, (drooling:0.6), (“I AM RICH”:1.2) printed shirt, pleated long skirt, pantyhose, holding bills, hand on own hip, floating, scattered bills, gambling, crowd, light particles, sparkles, depth of field, masterpiece, best quality, masterpiece, best quality
Steps: 30, CFG scale: 5, Sampler: DPM++ 2M SDE, Seed: 223644773, RNG: CPU, Size: 896×1344, Model: anima_pencil-XL-v5.0.0, Version: v1.9.4-180-ga65dd315, Emphasis: No norm, Pad conds: True, Model hash: 896faa18cd, Hires upscale: 2, Schedule type: Align Your Steps, Hires upscaler: SwinIR_4x, Denoising strength: 0.5, Discard penultimate sigma: True

1girl, ソロ, キュート, 白いショートヘア, 赤い目, 魔法使いの帽子, クローズアップ, ダイナミックアングル, ドヤ顔, :3, (よだれ:0.6), (“I AM RICH”:1.2) プリントシャツ, プリーツロングスカート, パンスト, お札を持つ, 自分の腰に手を当てる, 浮く, 散らばるお札, ギャンブル, 群衆, 光の粒子, きらめき, 被写界深度, 傑作, 最高品質, 傑作, 最高品質

以下の設定を変更します
(Stability Matrix 2.11.3/AUTOMATIC1111 version: v1.9.4)
Step:20→30
CFG Scale: 7→5
Sampling method: DPM++ 2M SDE
Hires upscaler: SwinIR_4x
Denoising strength: 0.5
Seed: 223644773

画像

animaPencilXL_v2.0.0の出力結果

参考まで、過去のv2.0.0ですが、こちらも十分素敵。

画像

animaPencilXL_v5.0.0 [896faa18cd]の出力結果

Seed:223644773
残念ながらサンプルの絵にはなりませんでしたが、確かにレイアウトや味わいが変わっていますね。胸の文字は描けていないようです(文字っぽい模様があります)。

画像

ここから先はSeedを-1(ランダム)にして
ネガティブプロンプト:worst quality, nsfw, normal quality, ugly
を設定して、何回か挑戦してみます。

(たぶん続きます、文字が出るまで…!)

まだ中間ですが出てるかも!?

画像
画像