2024年7月28日に、Stable Diffusion WebUI「AUTOMATIC1111」の最新版 v1.10.0 がリリースされました。
すでに7月6日にリリースされていた「v1.10.0-RC」でも公開されていましたが、最新の画像生成AIモデルの一つである Stable Diffusion 3 Medium (SD3M) が公式にサポートとなりました。
https://github.com/AUTOMATIC1111/stable-diffusion-webui/releases/tag/v1.10.0
他にもパフォーマンスの改善やモバイルでのコンテキストメニューの表示など、様々な機能があります。
リリースノートの日本語訳は文末に掲載します。
Stability Matrixでのサポートは?
ローカルPC/Mac等で画像生成を簡単にセットアップできる「Stability Matrix」では現状の最新版 v.2.11.4以降で AUTOMATIC1111 v.1.10.0 をサポートしています。
https://huggingface.co/stabilityai/stable-diffusion-3-medium
気になるGoogle Colab での対応状況は?
気になる #SD黄色本 「画像生成 AI Stable Diffusion スタートガイド」で中心的に利用している Google Colabでの対応状況ですが、現在は「対応済み・解決」になっております。
原作である TheLastBen版は更新が入り、動作確認できましたので、対応が進みました。
長期サポートを可能にするための解説についてはこちら
❏Google Colab での TheLastBen版「Fast Stable Diffusion – AUTOMATIC1111」を 長期間サポート(LTS)化を目指して完全解説
Google Drive内の古いバージョンは(outputフォルダなどをバックアップして)いったん移動/削除してから実施することをおすすめします。
スマホ上で Generateボタン を2本指タップするとコンテキストメニュー「Generate forever」(無限に生成)が表示できています。
※最新版の v1.10.1 がインストールされています。
Stable Diffusion 3 Medium はどうやってインストールするの?
さて、話題の「Stable Diffusion 3 Medium (SD3M)」ですが、こちらも 以下の手順で、Stability Matrixを使用して、NVIDIA GeForce RTX4050 Laptop GPU (VRAM5921MB)で動作確認ができています。
(Stability Matrixを最新の状態に更新)
sd3_medium.safetensors
→ Data/Models/StableDiffusion に配置します
sd3_medium_incl_clips_t5xxlfp8.safetensors
→ Data/Models/CLIP に配置します
Low VRAMモードでは起動できません(モデルのロード時にエラーになります)。
・Sampler を Euler にする
・出力解像度を 1024 x 1024 にする
・CFG Scale を 5
文字も描けてます!
A bustling urban street scene with skyscrapers, busy pedestrians, and colorful street art. The atmosphere is lively and dynamic, with sunlight casting dramatic shadows.
Negative prompt: Avoid elements like excessive clutter, overly dark shadows, or underexposed areas. Exclude dull or washed-out colors, empty or lifeless streets, graffiti with inappropriate content, and chaotic or confusing compositions.
Steps: 20, Sampler: Euler, Schedule type: Automatic, CFG scale: 5, Seed: 1421671004, Size: 1344×768, Model hash: cc236278d2, Model: sd3_medium, Version: v1.10.0
Time taken: 16 min. 3.3 sec.
その他の設定はこちらをご参照ください。
https://github.com/AUTOMATIC1111/stable-diffusion-webui/pull/16030
AUTOMATIC1111/stable-diffusion-webui バージョン 1.10.0 リリースノート
コミットハッシュ c19d044
新機能:
- パフォーマンスの大幅な向上 (詳細は後述)
- Stable Diffusion 3 のサポート (#16030, #16164, #16212)
- 推奨サンプラー: Euler
- DDIM およびその他のタイムスタンプサンプラーは現在サポートされていません
- テキストモデル T5 がデフォルトで無効化 (設定で有効化可能)
- 新しいスケジューラ:
- Align Your Steps (#15751)
- KL Optimal (#15608)
- Normal (#16149)
- DDIM (#16149)
- Simple (#16142)
- Beta (#16235)
- 新しいサンプラー: DDIM CFG++ (#16035)
細かい変更:
- 早期のステップで CFG をスキップするオプション (#15607)
- –models-dir オプションの追加 (#15742)
- モバイルユーザーが 2 本指プレスでコンテキストメニューを開けるようにする (#15682)
- 情報テキスト: バンドルされた Textual Inversion の Lora 名を TI ハッシュとして追加 (#15679)
- ダウンロード後にモデルのハッシュをチェックして、破損したダウンロードを防ぐ (#15602)
- 拡張タグのフィルタリングオプションの追加 (#15627)
- AVIF 保存時に JPEG の品質設定を使用 (#15610)
- ファイル名パターン [basename] の追加 (#15978)
- SDXL でCLIP L の CLIP Skip を有効にするオプション (#15992)
- 生成中に画面のスリープを防ぐオプション (#16001)
- 画像ビューアに ToggleLivePriview ボタンを追加 (#16065)
- リロード時と高速スクロール時の UI のちらつきを削除 (#16153)
- 保存ボタン log.csv を無効にするオプション (#16242)
拡張機能と API:
- process_before_every_sampling フックの追加 (#15984)
- 無効なサンプラーエラーで HTTP 404 の代わりに 400 を返す (#16140)
パフォーマンス:
- [パフォーマンス 1/6] use_checkpoint = False (#15803)
- [パフォーマンス 2/6] einops.rearrange を torch ネイティブオペレーションに置き換え (#15804)
- [パフォーマンス 4/6] is_sdxl_inpaint フラグの事前計算 (#15806)
- [パフォーマンス 5/6] 不要な追加ネットワークバイアスバックアップの防止 (#15816)
- [パフォーマンス 6/6] 推論中のキャストを回避する –precision half オプションの追加 (#15820)
- [パフォーマンス] LDM 最適化パッチ (#15824)
- [パフォーマンス] シグマを CPU に保持 (#15823)
- すべてのステップが完了した後、unet の nan を 1 回だけチェック
- 画像生成用の torch プロファイラを実行するオプションを追加
バグ修正:
- 包括的な情報テキストのないグリッドの修正 (#15958)
- feat: ローカルアップデートは完全アップデートに先行する (#15943)
- 特定の状況下でファイル拡張子に余分な ‘.’ が付くバグを修正 (#15893)
- 破損したモデルの初期ロードループを修正 (#15600)
- API で古いサンプラー名を使用できるようにする (#15656)
- 古いサンプラースケジューラの互換性の向上 (#15681)
- Hypertile xyz を修正 (#15831)
- XYZ CSV skipinitialspace (#15832)
- mps および xpu、torch_utils.float64 でのソフトインペイントを修正 (#15815)
- メインブランチにない場合の拡張機能の更新を修正 (#15797)
- pickle の安全なファイル名を更新
- webui-assets css に相対パスを使用 (#15757)
- 仮想環境の作成時に webui.bat/webui.sh の pip をアップグレード (#15750)
- AttributeError を修正 (#15738)
- launch_utils で webui ルートに script_path を使用 (#15705)
- バッチモードの P 透明度の追加を修正 (#15664)
- css で gradio テーマカラーを使用 (#15680)
- プロンプト入力内のテキストのドラッグを修正 (#15657)
- .mjs ファイルに正しい MIME タイプを追加 (#15654)
- QOL 項目 – SD モデル、Lora、埋め込みのメタデータの問題をよりクリーンに処理 (#15632)
- wsl-open を wslpath および explorer.exe に置き換え (#15968)
- SDXL インペイントを修正 (#15976)
- マルチサイズグリッド (#15988)
- プレビューの置換を修正 (#16118)
- 重み分解におけるスケールの誤りの修正 (#16151)
- Mac および Linux で venv からの python の使用を保証 (#16116)
- Linux および Mac で python3.10 と python3 の両方が利用可能な場合、python3.10 を優先 (フォールバックあり) (#16092)
- 生成エクストラの停止 (#16085)
- SD2 の読み込みを修正 (#16078, #16079)
- hires fix の異なる lora の情報テキスト Lora ハッシュを修正 (#16062)
- サンプラースケジューラの自動修正警告を修正 (#16054)
- リロード時と高速スクロール時の UI のちらつきを修正 (#16153)
- アップスケールロジックを修正 (#16239)
- [バグ] ジョブ以外の アクションでプログレスバーを壊さないようにする (wrap_gradio_call_no_job を追加) (#16202)
- OSError を修正: モード P を JPEG として書き込むことができません (#16194)
その他:
- changelog #15883 -> #15882 を修正 (#15907)
- ReloadUI の背景色 –background-fill-primary (#15864)
- Intel Mac と ARM Mac で異なる torch バージョンを使用 (#15851)
- XYZ オーバーライドのやり直し (#15836)
- オーバーフロー時に拡張機能テーブルをスクロール (#15830)
- img2img バッチアップロード方法 (#15817)
- chore: changelog に従って v1.8.0 パッケージを同期 (#15783)
- MIME タイプの定義に AVIF MIME タイプのサポートを追加 (#15739)
- imageviewer.js を更新 (#15730)
- no-referrer (#15641)
- .gitignore trace.json (#15980)
- spandrel を 0.3.4 にバンプ (#16144)
- 使われなくなった –max-batch-count (#16119)
- docs: bug_report.yml を更新 (#16102)
- アップグレードを必要とせずに Python 3.9 ユーザーのプロジェクトの互換性を維持 (#16088, #16169, #16192)
- ARM Mac の torch を 2.3.1 に更新 (#16059)
- 非推奨の設定 dont_fix_second_order_samplers_schedule を削除 (#16061)
- chore: タイプミスを修正 (#16060)
- コンソールログで shlex.join launch args を実行 (#16170)
- venv .bat をアクティブ化 (#16231)
- img2img のサイズ変更タブに ID を追加 (#16218)
- インストールガイド Linux を更新 (#16178)
- 堅牢な sysinfo (#16173)
- ペーストインペイントに画像サイズを送信しない (#16180)
- MacOS のノイズの多い DS_Store ファイルを修正 (#16166)
Originally published at https://note.com on July 28, 2024.