月: 2024年3月

  • [保存版] Animagine XL 3.1 生成比較レポート

    [保存版] Animagine XL 3.1 生成比較レポート

    つくる人をつくる!AICU media の知山ことねです。

    Animagine XL 3.1リリース

    2024年1月16日に公開された Stable Diffusion の画像生成モデル「Animagine XL 3.0」から、新バージョンとなる Animagine XL 3.1 がリリースされました!

    この記事では、Animagine XL 3.0 と比較して画風などに違いはあるか、また Animagine XL 3.1 から搭載された新たなタグについて紹介していきます。

    【関連記事】

    漫画制作に適したモデルは?Animagine 3.1 vs Animagine 3.0 徹底比較を行いました!

    XL 3.1 では、Animagine XL 3.0 で重要だったプロンプトも引き続き使用できます!

    https://note.com/aicu/n/n44085d702617

    Animagine XL 3.0 リリースノートはこちら。

    https://note.com/aicu/n/nd05f3a656dd8

    Hugging Face はこちら

    https://huggingface.co/cagliostrolab/animagine-xl-3.1

    公式リリース 和訳(一部抜粋)

    Animagine XL 3.1は、前バージョンのAnimagine XL 3.0を強化したもので、より高い品質でアニメスタイルの画像を生成できるように改良されています。有名なアニメシリーズからのより幅広いキャラクター、最適化されたデータセット、より良い画像作成のための新しいタグが含まれています。アニメキャラクターの正確で詳細な表現を生成することで、アニメファン、アーティスト、コンテンツクリエイターにとって価値あるリソースとなることを目指しています。

    Animagine XL 3.0 をより高品質にしたということですね!

    Animagine XL 3.0 との比較

    それでは、実際に生成して Animagine XL 3.0 と比較していきましょう。
    今回生成に使用した環境は、Windows10、NVIDIA GeForce RTX 3060 搭載の VRAM6GB の GALLERIA ノート PC に直接インストールした ComfyUI です。

    画風

    まずシンプルなプロンプトで生成し、Animagine XL 3.0 と比較してみます。

    プロンプト: best quality, 1girl
    ネガティブプロンプト: worst quality, low quality, nomal quality, bad anatomy, NSFW

    Animagine XL 3.0

    Animagine XL 3.1

    強い光源、耳の見える髪型、逆光感などの大きな特徴はそのまま残っていますが、Animagine XL 3.0 の特徴だった切れ長の目とピンクの頬が目立たなくなり、露出度も軽減されました。また Animagine XL 3.0 では肌がつやっとする雰囲気がありましたがそれも軽減され、全体的に落ち着いたように感じます。

    また Animagine XL 3.0 よりも Animagine XL 3.1 の方が線画が細くはっきり出ていて、厚塗り感、立体感が減り少し平面的になった印象を受けますね。

    タグ

    Animagine XL 3.0 には画風を指定する「年代タグ」やクオリティを指定する「クオリティタグ」がありましたが、Animagine XL 3.1 ではそれらがアップデートされたことに加え、「Aesthetic Tags」が追加されました。

    クオリティタグ

    Animagine XL 3.1 公式 Hugging Face より

    従来のクオリティタグから数値が少し調整され、タグ名が一部変更されました。よく使用する「masterpiece」「best / worst / low quality」は変わらないので、今まで通りの感覚で使えそうです。

    年代タグ

    Animagine XL 3.1 公式 Hugging Face より

    「2024」が追加され年が少しずつ調整されていること、「late」が「recent」に変更されたことが主な変更で、年代タグも大きくは変わっていません。

    実際の生成画像比較

    newest (2021–2024)

    Animagine XL 3.0 に似た絵柄です

    recent (2018–2020)

    newestを少し繊細にした雰囲気です。VTuber全盛期ですね。

    mid (2015–2017)

    退廃的な雰囲気が可愛いです
    明らかに画風がVTuber風ではなくなってきました。

    early (2011–2014)

    セピアな雰囲気が出ています

    https://j.aicu.ai/Mag2405

    Oldest (2005–2010)

    年代的には涼宮ハルヒや長門有希が流行った時期ですね。
    90年代風のテイストもありますが、明らかに描きわけができています。

    レーティングタグ(年齢制限タグ)

    Animagine XL 3.1 公式 Hugging Face より

    センシティブな表現を調節するレーティングタグも、Animagine XL 3.0 から大きく変化はありません。プロンプトとネガティブプロンプトを使い分けて露出度を調節しましょう。

    Aestheticタグ

    アニメデータに特化したViT(Vision Transformer)画像分類モデルと、コンテンツの美的価値を評価するモデルshadowlilac/aesthetic-shadow-v2を利用し、視覚的に魅力的であるものを生成するタグです。

    aesthetic

    プロンプト「best quality, 1girl, very aesthetic」

    カメラアングルやポーズがダイナミックになりました!

    「aesthetic」(イェステティック;美的)というプロンプトは Nijijourney や Novel AI でも有効なので、ぜひ試してみてください!

    推奨設定

    公式 Hugging Face で紹介されている推奨設定、プロンプトを紹介します。

    「Absurdres」とは造語で、absurd-res、ありえないぐらい高解像度、という意味のようです。

    プロンプト

    masterpiece, best quality, very aesthetic, absurdres

    ネガティブプロンプト

    nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

    CFG Scale

    低め(5–7)

    Sampling Steps

    30以下

    Sampler

    Euler a(Euler Ancestral)

    https://j.aicu.ai/Mag2404

    ギャラリー

    お気に入りの生成画像です!

    パステルカラー!

    抜け感

    kotoちゃん

    oldest

    newest

    アニメ風

    皆さんもお気に入りの画像が生成できたら、ぜひご共有ください!

    メンバーオンリー画像投稿コーナー https://note.com/aicu/membership/boards

    https://note.com/aicu/membership/boards/61ab0aa9374e/posts/17273820a798

    Animagine XL 3.0 おすすめのプロンプトはこちら

    ANIMAGINE XL 3.0 画風が変わる!おすすめプロンプト集
    https://note.com/aicu/n/n44085d702617

    Stable Diffusion — ControlNet入門はこちらから
    https://note.com/aicu/n/nde6fe41f077b

    img2img 入門シリーズはこちらから。
    https://note.com/aicu/n/n08ebe0637a41

    この下にGoogle Colabで動作する「AUTOMATIC1111/Stable Diffusion WebUI」へのリンクを紹介しています。

    https://note.com/aicu/membership/boards/61ab0aa9374e/posts/7cab00942b22?from=self

    メンバーシップ向けサポート掲示板はこちら!応援よろしくお願いします!

    AICU mediaによる新作書籍「画像生成AI Stable Diffusionスタートガイド」ついに予約開始です!(2024年3月29日リリース)

    詳細はこちらから https://ja.aicu.ai/sbxl/

    今回の記事の内容はAICUマガジンでもご覧いただけます

    AICU magazine Vol.1 2024年4月号 https://j.aicu.ai/Mag2404

    AICU magazine Vol.1 2024年5月号 https://j.aicu.ai/Mag2405

    AICU:AIクリエイターユニオンでは皆様のご質問をお待ちしております
    https://note.com/aicu/membership/boards

    Originally published at https://note.com on March 19, 2024.

  • [3/13開催]AIクリエイターギルド@歌舞伎町GOX #AICU_ACT3

    [3/13開催]AIクリエイターギルド@歌舞伎町GOX #AICU_ACT3

    AICUイベント事務局です。

    https://ja.aicu.ai/wp-content/uploads/2024/03/rectangle_large_type_2_4252042e5f801ee4737368928ce03239-1024×536.webp



    すでにお伝えしておりました「AICU Creators Talk3」ですが企画を拡大し、
    AIクリエイターギルド歌舞伎町GOX #AICU_ACT3といたしまして、現在参加者募集中です。
    https://techplay.jp/event/936576

    2024年3月1日、プレスリリースを発信させていただきました。


    AICU新製品発表会を予定。各業界を横断にAIクリエイターがデモを持ち込み新宿歌舞伎町「クリプトラウンジGOX」に集合します!▶ https://j.aicu.ai/TPACT3

    https://prtimes.jp/main/html/rd/p/000000012.000133647.html



    「つくる人をつくる」をビジョンに活動するAICU社の月例イベント「AICU Creators Talk」(ACT)、第3回は AICU の社名の由来でもある「AI クリエイターユニオン」をテーマに、「AIクリエイターの集まるギルド」を新宿歌舞伎町「GOX」にて開催します。

    AICU のファンイベントとして「新製品発表会」をはじめとして、AICUパートナー企業やクリエイターの活動紹介、ライトニングトーク、デモ、製品即売会など、これからのクリエイター、エンジニア、BizDev、学生さんなど分野や年齢を問わず AI に関わる方々や AI に興味がある方の交流の場をつくります。

    2024年3月23~24日に渋谷ストリームで開催される「東京AI祭」(https://www.aisai.tokyo )にむけた準備デモの準備やクリエイティブ AI に関わる皆さんの躍進のチャンスを提供をできれば幸いです。 お申し込み詳細はこちら▶︎https://j.aicu.ai/TPACT3

    会場は「Crypto Lounge GOX」

    https://www.youtube.com/watch?v=XVhaVwzXMKI


    会場である「Crypto Lounge GOX」はワールドコインが手に入る「人間であることを証明できるバー」です。ChatGPTを生み出したサム・アルトマン氏が最高経営責任者を務めるワールドコイン財団 @worldcoin の認証スポットとして登録されています。

    ※ご予約は各自参加者で WORLD Appから事前にご準備ください(完全予約制でorbによる認証ができます)

    https://twitter.com/groove_on_x


    会場へのルート
    https://twitter.com/groove_on_x/status/1736978718269293047


    参加予定クリエイター(参加表明順・随時更新)

    Ryo Shimizu AI研究家 @shi3z

    凄腕エンジニアであり実業家でありUber配達員。

    Hidekazu Furukawa @npaka123

    プログラマー。iPhone / Android / Unity / ROS / AI / AR / VR / RasPi / ロボット / ガジェット。年2冊ペースで技術書を執筆。アニソン / カラオケ / ギター / 猫
    [note]

    jiyu @jiyu33

    BlendAI CEO。クリエイティブ領域でのAI利用を推進する目的で「デルタもん」というキャラクターを X/Twitter を中心に展開しています(@BlendAIjp)。

    「AI関係の利用は商用・非商用問わず自由」「すべてのデルタもん公式・二次創作著作物は、AI関連の学習をしてもよい」というルールなので、著作権法等の権利問題を気にすることなくAIを利用した創作や学習が可能です。公式からは、画像や音声などの基本的な素材にとどまらず、LoRA や音声モデルなど既に学習されたデータも積極的に公開していきます。これらすべてがAIを利用していさえすれば商用利用を含め原則無制限に利用可能です。現在、3DCGモデルを作るためにクラウドファンディングを行っております。3DCGモデルがあれば、LoRAを始めとした高品質なAI素材の提供が可能となります。ぜひクラファンにご協力いただけると幸いです。クラファンはこちらで行っています

    Nobuyuki Kobayashi @nyaa_toraneko

    The man of Tech Otakus @Unity/AI/Anime/元Unity Technologies Japanのシニアエバンジェリストの小林です。在職中はユニティちゃんの企画とか、トゥーンシェーダーとか、いろいろやってました。現在は、リアルタイムキャラクター表現、アニメを中心とする映像表現、AIをの活用など、日々面白そうなことを探している最中です!
    興味ある方はお声がけよろしくお願いします。
    もちろんこちらからもお声がけさせていただきますので、その際はよろしくお願いします![LinkedIn]

    そのほかの参加表明

    ・marimosphereさん (@marimosphere) Web3の女王
    ・Scott Broock (@scottbroock) Visitor from AI Los Angeles!
    ・はねだ プロダクションマネージャー
    ・Kaho Fujiyoshi クリエイター
    ・しらいはかせさん AICU Inc. CEO (@o_ob) 実は3/13は誕生日です! 祝ってあげてください!

    ライトニングトーク


     ライトニングトークは5分程度のプレゼンテーションです。
     自身の制作物や活動、その成果や宣伝、即売会など皆さんに発表していただけます。
     AICU およびパートナー企業による撮影、配信も予定しております。
     生成 AI の最先端を行く方々と関わり、視野や可能性を大きく広げられる交流会となっております。皆さんぜひお気軽にご参加ください。

    以下エントリー順で紹介いたします(当日の発表順や内容ではないかもしれません)

    株式会社メイクリー @kokushing

    クリエイターを支援する株式会社メイクリーを創業し、主にエンジニアとして生きています。「つくる人がつくり続けられる世界を創る」べく、日々サービスを開発中。アニメゲーム好き、最近はAI×サブカル領域の可能性を探っています

    よーへん(xRデザイナー) @Yohen_XR

    2017年からアバターを探求するVTuberを始めて、xRを仕事にしています。最近は可愛らしいロボットに毎日骨抜きにされたり創作相方との間にAIの娘が生まれたりして、AIキャラクターに関しても公私いろいろ研究しています。

    debittoo 合同会社MetAI 代表 @debichanchan

    スペイン人。来日してから15年目。
    メタバース、AIビジネスが長くやっております。
    アップル、ソニー、楽天、ヤフーなど大手企業で働く経験あり。
    現在メタバース、AIの会社持ってます。
    Twitter @debichanchan Instagram @metaijp

    藤吉香帆 @kahofujiyoshi

    セツナクリエイション合同会社 代表取締役 / デジタルハリウッド大学非常勤講師
    刹那的に生きることをテーマに、瞬間(イマ)を捉える、瞬間(イマ)を演出するクリエイティブカンパニーの代表の片割れです。イマっぽいクリエイティブ、イマ必要なクリエイティブを作る会社として、AIの活用もやっていかなきゃ!と勉強中。
    友だちと仕事をする社長をしています。ぜひ友だちになりましょう!
    LTは #50DAYSママ活 中間報告とインフィードクリエイティブでの活用考察(発表までに変わるかも!)




    最新の参加者リストはハッシュタグ「#AICU_ACT3」もしくは
    TechPlayイベントページにて!
    https://techplay.jp/community/AICU

    短縮リンク j.aicu.ai/TPACT3 → https://techplay.jp/event/936576

    AICU活動紹介&新製品発表会

    詳細は当日会場にて発表いたします、お楽しみに!

    トークセッション(予定)


    生成 AI のトップランナーの方をお招きし、グラフィックス産業やキャラクターがこれから生成 AI とどう関わっていくのかについてのトークセッションを開催します。

    クリエイティブAIマーケットプレイス(デモつき交流会&AI同人即売会)
     交流会に合わせて、自身の制作物や活動、その成果や宣伝、即売会など皆さんに発表していただけます。

     ■想定される販売可能物品
      新規AIサービス
      AI VJ
      動画上映
      チャットボット/ChatGPTsやエージェントのデモ
      生成AIによる同人グッズ
      技術同人誌
      その他(合法なものに限ります)
     注意:ハンズオンで持ち込み、18時集合、22時に完全撤収ができるものに限ります。
     無料のデモのみでも構いません。
     決済はQRコードやWeb決済のみ。当日の現金の授受はなきようお願いします。

    参加方法:TechPlayよりクレジットカード決済にてご参加登録ください。
     開催日 : 2024年3月13日
     開催時間 : 18:30 ~ 21: 30
     会場 : Crypto Lounge GOX
     https://cryptoloungegox.com/
     〒160-0021 東京都新宿区歌舞伎町2丁目19−15 てなむタウンビル 6F
    主催 : AICU Inc.

    みなさまのお越しを楽しみにしております。

    ※ 当日予告なく時間配分・内容が変更になる可能性がございます。
    その他お問い合わせ
     AICU イベント事務局
    https://corp.aicu.ai/ja

    https://techplay.jp/community/AICU

  • Stability Matrixのエラーを確認しよう

    Stability Matrixのエラーを確認しよう

    Stability Matrixのエラーを確認しよう

    Stability Matrixでのエラーは英語とコマンドラインで表示されるので敬遠されがちですが、実際には自力で環境構築を進めるのに比べて理解しやすい形式になっています。インストール時のエラーについて、多くの場合は「もう一度試せばよい」ということも多いので、諦めずに繰り返しインストールと、翻訳や検索をしてみると理解に繋がって無駄な時間を過ごすことがないでしょう。

    WebUI起動後のエラーメッセージの多くは、Colabの時と同じくGradioのWebインタフェースの右下に表示されています。さらに細かなエラーメッセージは「Stability Matrix」の「Launch」タブにも表示されています。特にエラーが起きていなくても、WebUIでは表示されない画像生成のプロセスや経過時間を確認できるので、表示する習慣をつけておくと良いでしょう。

    パッケージ選択ではエスケープしないように注意する

    最初のパッケージ選択は慎重に操作することをおすすめします。何か間違えても必ずエラーメッセージ等は出ていますので、強制終了などはしないで丁寧にログは見ていきましょう。
    最初の「Packages」でパッケージ選択をしますが、インストール中にエスケープキーなどで抜けないように気をつけましょう。抜けてしまった場合は「Packages」下部の「+パッケージの追加」から追加できます。

    欲張って一度に複数のパッケージを入れようとしない

    ・本書の解説は「 AUTOMATC1111/WebUI」の「v1.7.0」もしくは本書刊行時点での最新版は「v1.8.0」で行っています。インストール時に「Version」プルダウンで選択することで過去のバージョンもインストールできます。
    ・複数の同名パッケージをインストールするときに「表示名」を変更するとバージョン違いでインストールできます(更新すると最新版になってしまいますので注意)。

    動作確認のために「Stable Diffusion 1.5」をダウンロードしておく

    「Model Browser」から「Hugging Face」の「Base Models」からインストールできます。最低でも「Stable Diffusion 1.5」はインストールしておきましょう(「Stable Diffusion XL」が動けば何の問題もありませんが、メモリ不足でロードできないという問題も多く発生しますので)。

    「Fooocus」や「ComfyUI」をインストールしておく

    最近は「Fooocus」や「ComfyUI」に関する情報も多く、モデルのダウンロードやセットアップなどは共通の基盤でもあるので、これらのパッケージのインストールやセットアップも実施しておくと 問題が解決することもあります。逆を言えば、「Fooocus」や「ComfyUI」が動いているのに「AUTOMATIC1111/WebUI」だけが動かない、という状態であれば、ハードウェアのスペックではなく、WebUIやモデルの選択、拡張機能などのセッティングが問題であると粗く絞ることもできます。

    Packageにインストールされたその他のパッケージの3点メニュー「…」から「アンインストール」、「アップデートを確認」や「共通画像フォルダ」の設定ができます。「Model Sharing」で「Symlink」にすると、モデルデータをリンクファイルとして共有できるのでディスクの容量を節約することができます。

    Stability Matrixの GitHub Issues

    https://github.com/LykosAI/StabilityMatrix/issues

    2024年3月3日時点で v2.8.3、Issues (不具合報告)は 142件存在しますが、積極的に解決が進んでいるようです。似たようなエラーがあったときはそのキーワードで探してみると、世界中の利用者が互助的に解決していることもあります。特にMac版はリリースされたばかりなので問題があるかもしれませんが、同じような問題で詰まっている方も多くいるので情報も見つかりやすい状況です。
    英語でのIssueを立てられるようになれば、オープンソースの貢献者への第一歩です。

    noteのハッシュタグ「#StabilityMatrix」

    日本語では note に情報が集まっています。ハッシュタグ「#StabilityMatrix」はこちらで確認することができます。

    https://note.com/hashtag/stabilitymatrix

    人気」、「 急上昇」、「 新着」、「 定番 」があり、インストールや最新情報でのトラブルシューティングに活用してください。

    注意:オープンソースの開発者は常に「みんな」のことを考えて動きます。個別の環境に関する問題を発見することはありがたいですが「僕の環境で動きません」だけではサポートは難しくなります。
    有償無償に関わらず、質問する場合は自己紹介や、自分の環境に関する丁寧な説明を行いましょう。雑な質問の仕方は雑な扱いになり、コミュニティが荒れるだけでなく、初心者にとって優しくない環境を作り、ひいては自分も振りかぶってしまいます。これは日本語や英語でも変わりません。

    AICU media コミュニティで質問してみる

    https://note.com/aicu/membership/join

    AICU media メンバーシップ掲示板もご活用ください


    Originally published at https://note.com on March 3, 2024.

  • AUTOMATIC1111 v1.8.0リリース

    AUTOMATIC1111 v1.8.0リリース


    日本時間2024年3月2日、人気のあるオープンソース画像生成WebUI「AUTOMATIC1111/Stable Diffusion WebUI」の最新版v1.8.0 がリリースされました。

    • Update torch to version 2.1.2
    • Support for SDXL-Inpaint Model (#14390)
    • Automatic backwards version compatibility (when loading infotexts from old images with program version specified, will add compatibility settings)
    • Implement zero terminal SNR noise schedule option (SEED BREAKING CHANGE, #14145, #14979)
    • Add a [✨] button to run hires fix on selected image in the gallery (with help from #14598, #14626, #14728)
    • Separate assets repository; serve fonts locally rather than from google’s servers
    • Official LCM Sampler Support (#14583)
    • Add support for DAT upscaler models (#14690, #15039)
    • Extra Networks Tree View (#14588, #14900)
    • Prompt comments support

    以下、主要な機能の日本語訳です

    torch をバージョン2.1.2に更新
    ソフトインペイント (#14208) を追加
    FP8のサポート (#14031, #14327)
    SDXL-Inpaintモデルのサポート (#14390)
    アップスケーリングと顔復元アーキテクチャにスパンドレルを使用 (#14425, #14467, #14473, #14474, #14477, #14476, #14484, #14500, #14501, #14504, #14524, #14809)
    古いバージョンとの自動互換性 (プログラムバージョンを指定して古い画像からテキスト情報を読み込む場合、互換性設定を追加)
    ゼロターミナルSNRノイズスケジュールオプションを実装 (SEED BREAKING CHANGE, #14145, #14979)
    ギャラリーで選択された画像の hires.fix を実行する[✨]ボタンを追加 (#14598, #14626, #14728からのヘルプ)
    アセットリポジトリを分離し、フォントをgoogleのサーバーからではなくローカルで提供するように。
    公式LCMサンプラーのサポート (#14583)
    DATアップスケーラーモデルのサポートを追加 (#14690, #15039)
    ネットワークツリービューの追加(#14588, #14900)
    NPUのサポート(#14801)
    プロンプトコメントのサポート

    Stability Matrixのほうはまだ対応できていないようです。
    追記:自動アップデートで対応されました。

    破壊的変更#14145 #14978 はともにリファイナーのスケジューラに関するものです。

    1.7.0→1.8.0の全てのコミットログはこちらです

    機能関係

    微細な修正:

    ExtentionsとAPI:

    パフォーマンス

    14507に対処するため、膨大な数のファイルを含むextra networksディレクトリのパフォーマンスを大幅に改善した (#14528)
    余分なnetworkディレクトリの不要な再インデックス作成を削減 (#14512)
    不要なisfile/exists呼び出しを回避 (#14527)

    バグ修正:

    その他:

    現在、Issuesは1899件存在します。

    全てのオープンソースの開発者に敬意を持って・・・応援したい。

    まだまだ元気なAUTOMATIC1111プロジェクトです。
    世界中でも多くの国で使われています。

    これについてはまた別の機会にレポートします。


    Originally published at https://note.com on March 2, 2024.

  • 子供の時の絵を AI で学習、生成してみよう! #描画タイムマシン

    子供の時の絵を AI で学習、生成してみよう! #描画タイムマシン


    つくる人をつくる!AICU media の 知山ことねです。

    昨日の記事「 VRoid Studio を使ってキャラクター LoRA を作ろう! 」が好評で、LoRA の制作に興味を持っている方からの「ぜひやってみたい!」という声を聴くことができました。

    ところでこちら、画像生成AI「Stable Diffusion」の一大ブームを予言した深津貴之さんのつぶやきです。

    ▶世界変革の前夜は思ったより静か|深津 貴之 (fladdict) https://note.com/fladdict/n/n13c1413c40de https://note.com/aicu/n/n9d5cf46761b7 @fladdict

    子供の頃の絵って魅力的ですよね。Soraが正式リリースされるのはまだわかりませんが、うかうかしていられませんね!

    子供ゴコロあふれる「真の芸術」を爆発させていきましょう。

    今回は、画像生成 AI でたびたび話題になる「 下手な子供の絵を生成する AI」、命名「描画タイムマシン」を Stable Diffusion の LoRA 学習を利用して作っていきます!

    美と知能を超え、人間性を爆発させていきましょう。

    Google Colabだけで作る描画タイムマシン

    描画タイムマシンは学習元の画像データと Google Colab だけで完成するので、皆さんもぜひ、自分の幼少期の絵やお子さんの絵で一緒に作ってみてください。

    用意するもの:小学校時代の黒歴史

    まずは学習元の画像、データセットを用意します。

    今回は、この原稿を書いている私、知山ことねが小学生の時に自由帳に描いていた 直筆雑誌「ザ・コトネ」「ことまが friends」 を用意しました。

    この色鉛筆の質感と歪んだデッサンが小学生らしいですね。
    これらのページをスキャンして、画像データとして PC に取り込みます。

    学習には15~40枚ほどの画像を用意することをおすすめしますので、1枚の絵をそのまま学習したい場合は、絵を最低7,8枚ほど用意しましょう(後述しますが、あとで左右反転コピーを行って枚数を増やすことができます)。

    今回は1枚の紙に複数イラストが描かれているため、貴重なサンプルとして切り取ってデータセットを増やしていきます。雑誌の中のイラストを多く含んだ箇所20ページほどをスキャンしました。

    PC に取り込んだら、画像をそれぞれトリミングしていきます。今回は LoRAを扱いやすい Stable Diffusion (SD1.5) で学習を行うので、Photoshop 等を使い 512×512 px の正方形に画像を切り取っていきます。これを正則画像化といいます。

    またこのままではノートの罫線や文字、透けている裏の紙の内容などのノイズも学習されてしまうので、それらの不要な部分は塗りつぶして消去し、画像全体のコントラストを上げるなどの色調補正も行いました。

    これをイラストの枚数分繰り返し、正則画像化済みの画像のデータセットを作りました。

    またこの時に、用意できた画像の枚数が少ない場合や、画像の左右のバランスが望まない崩れかたをしている場合(左向きの顔が多い、など)は、左右反転したコピーPhotoshop等で作成し、保存しましょう。

    また、LoRA を作ったことがある人ならご存じかと思いますが、学習時に画像をセットにして学習を行うため、画像枚数を2の倍数、具体的には 「2,4,…で割り切れる枚数」に揃えましょう。今回は32枚にしています。

    学習

    データセットが用意できたら、フォルダにまとめて他の LoRA と同じように学習を行います。もちろんローカル環境でも Colab でも可能ですが、初めて LoRA を制作する方は khoya-trainer の Colab notebook をおすすめします。

    これは kohya-ss さん ( https://github.com/kohya-ss ) が制作した sd-scripts ( https://github.com/kohya-ss/sd-scripts?tab=readme-ov-file ) を Linaqruf ( https://github.com/Linaqruf ) さんが Colab notebook で使用できるようにしたものです。
    編集した画像のzipファイルをドライブにアップロードし、手順に沿ってパスや LoRA のファイル名などを入力して実行すると学習された LoRA を制作することができます。

    また今回は2次元のイラストを学習しますが、アニメ系の絵柄には寄せたくないので、2次元イラスト LoRA 学習定番の AnyLoRA などのアニメ系モデルではなく、Stable-Diffusion-v1–5 を使用して学習しました。

    詳しい学習の流れはいずれ日本語の解説版を作って公開しようと思います。
    (AICU mediaメンバーシップ掲示板でリクエストいただけるとプライオリティが上がるかもしれません…!)

    AUTOMATIC1111 StableDiffusionWebUI をGoogle Colabで!|AICU: AI Creators Union生成AIクリエイターユニオン『AICU: AI Creators Union』は、「つくる人をつくる」をビジョンに活動するnote.com

    完成!

    Colab の実行が完了したら終了です!完成した LoRA で画像を生成してみましょう!

    モデル v1–5-pruned-emaonly

    鉛筆のストロークや雑な色塗り、斜めに歪んだデッサンを再現することができました!Stable Diffusionおそるべし底力。

    大人になってから子供っぽい絵を描くことはなかなか難しいので、過去の自分とコラボレーションできる感覚は楽しいです。また画像だけでなく動画の素材に使う、さらに「不可能な動画」を製作できる可能性があります。
    ファミリーカーむけの広告動画などにも需要がありそうですね。

    これを使ったファンシーイラストやキャラクターデザインの探求にも使えそうです。ガチな産業向けの用途だけでなく、「子供の絵あるある~!」と誰かにシェアしたくなるような画像が生成できるので、皆さん試してみてください!
    ※LoRAを生成するときは本人やお子さんの許諾をもって実施してくださいね!

    面白い作品ができたら、ぜひこちらのメンバーシップ掲示板でご共有ください~!

    メンバーオンリー画像投稿コーナー

    メンバーオンリー画像投稿コーナー|AICU: AI Creators Union生成AIクリエイターユニオン『AICU: AI Creators Union』は、「つくる人をつくる」をビジョンに活動するnote.com

    Stable Diffusion — ControlNet入門はこちらから

    img2img 入門シリーズはこちらから。

    ※本ブログは発売予定のAICU media新刊書籍に収録される予定です。期間限定で先行公開中しています。
    メンバー向けには先行してメンバーシップ版をお届けします
    Stable Diffusionをお手軽に、しかもめっちゃ丁寧に学べてしまう情報をシリーズでお送りします。
    メンバーは価値あるソースコードの入手や質問、依頼ができますので、お気軽にご参加いただければ幸いです!

    AICU: AI Creators Union|AICU media生成AIクリエイターユニオン『AICU: AI Creators Union』は、「つくる人をつくる」をビジョンに活動するnote.com

    この下にGoogle Colabで動作する「AUTOMATIC1111/Stable Diffusion WebUI」へのリンクを紹介しています。
    メンバーシップ向けサポート掲示板はこちら!応援よろしくお願いします!

    AUTOMATIC1111 StableDiffusionWebUI をGoogle Colabで!|AICU: AI Creators Union生成AIクリエイターユニオン『AICU: AI Creators Union』は、「つくる人をつくる」をビジョンに活動するnote.com


    Originally published at https://note.com on February 28, 2024.

  • VRoid Studio を使ってキャラクター LoRA を作ろう!

    VRoid Studio を使ってキャラクター LoRA を作ろう!


    つくる人をつくる!AICU media 知山ことねです。
    突然ですが、 AI を使って漫画を創作したい!と思ったことがあるそこの貴方!
    こんな壁にぶつかったことがあるのではないでしょうか。
    「同じキャラクターが二度と生成できない!」

    漫画を描くにはキャラクターの特徴を固定して生成する必要がありますよね。そんな時に役立つのは、特定のキャラクターを学習させたいわゆる「キャラクター LoRA」です。すでにそういった LoRA を制作したことがある方もいるかと思います。
    例えば先日発表されたBlendAIさんの「 デルタもん」は、 二次創作が AI 限定 ということもあり、多くの人が LoRA の制作を行っていました。

    しかし、いざ LoRA を作ろう!と思っても、そもそも学習元の画像がないとキャラクター LoRA が制作できない…という第二の壁が立ちはだかります。
    AI で生成した絵を学習に使用する場合、特徴的なキャラクターを作ろうとするほど生成が難しくなり、データセットの枚数が足りなくなってしまいますよね。

    しかしそんな時におすすめなのが、「VRoid Studio」です!

    VRoid Studio とは?

    「VRoid Studio」とは、株式会社 pixiv が運営している 3D キャラクター制作ツールです。PC、タブレット端末を用いて、無料で感覚的に3Dのキャラクターを制作することができます。

    3D初心者でも簡単
    たくさんのプリセットアイテムとパラメータを搭載。ゼロからモデリングをしなくても、アイテムを選んで組み合わせ、パラメータを調整するだけでキャラクターメイキングができます。

    オリジナリティを表現

    絵を描くように髪型を直感的にモデリングできるだけでなく、3Dモデルに直接デザインを描いて、こだわりの表情や瞳、服のデザインを制作可能。普段のお絵かき感覚で3D創作に取り組むことができます。

    無料で利用可能

    VRoid Studioの利用は無料。煩雑なセットアップもなく、すぐにインストールして始められます。もちろん制作したモデルもさまざまな用途で無料で使うことができます。

    VRoid Studio 公式サイト

    今回はこの VRoid Studio を用いてキャラクターを作成、そのスクリーンショットを撮影し、それをもとにキャラクター LoRA を制作します。

    キャラクターを作る

    まずは 公式サイトから VRoid Studio をインストールしましょう。
    Windows, Mac, iPad に対応しています。

    ソフトをインストールできたら、画面左「新規作成」の+アイコンを選択して新しいモデルを作成します。

    男女を選択するとモデルのエディタが開きます。

    ・画面上のタブ
    顔、髪型、体形、衣装、アクセサリー、ルック(アウトラインの細さや陰影の質)のメニューを開きます。

    ・画面左のメニュー
    顔や身体のパーツのプリセットを選択します。

    ・画面右のパラメータ
    プリセットから選択したパーツの大きさやバランス、ディテールの微調整を行います。

    またモデルを回転などする場合の操作は以下の通りです。
    ショートカットキー — VRoid ヘルプ (pixiv.help)

    操作方法を覚えたら、好きにキャラクターを作ってみましょう。
    私はチャイナな女の子を作りました。

    撮影

    モデルができたら、モデル編集画面の右上のカメラのアイコンを選択し、撮影に移ります。

    ここでは、キャラクターにポーズをとらせたり、動かしたりして撮影することができます。

    ・画面左のメニュー
    表情、ポーズ、背景の編集を切り替えます。

    ・中央
    キャラクターが動きます。このスクリーンショットを撮ります。
    画面右下の青いカメラのアイコンをクリックすると、画面中央のキャラクターのみのスクリーンショットを保存することができます。

    ・画面右のメニュー
    キャラクターにとらせるポーズ、表情を選択します。

    表情やポーズ、視点を変えながら撮影していきましょう。
    この画像にバリエーションを持たせるほど、LoRA を制作した際にとることのできるポーズが柔軟になります。

    ✨VRoidでキャラクターを作るときにはこちらの書籍もオススメです

    📖3Dマイキャラメイキング VRoidでキャラを作ろう! ペーパーバック — 2023/9/18 佐久間蒼乃 (著)

    今回は25枚撮影し、学習の偏りをなくすためにコピー、左右反転を行って50枚の画像を用意しました。

    学習

    データセットが用意できたら、フォルダにまとめて他の LoRA と同じように学習を行います。もちろんローカル環境でも Colab でも可能ですが、初めて LoRA を制作する方は khoya-trainer の Colab notebook をおすすめします。

    これは kohya-ss さん ( https://github.com/kohya-ss ) が制作した sd-scripts ( https://github.com/kohya-ss/sd-scripts?tab=readme-ov-file ) を Linaqruf ( https://github.com/Linaqruf ) さんが Colab notebook で使用できるようにしたものです。

    Stable DiffusionのLoRA活用方法、こちらもおすすめです。

    zipファイルをドライブにアップロードし、手順に沿ってパスや LoRA のファイル名などを入力して実行すると学習された LoRA を制作することができます。

    この辺の流れはいずれ日本語の解説版を作って公開したいです…!
    AICU mediaメンバーシップ掲示板でリクエストいただけるとプライオリティが上がるかもです

    完成!

    完成です!実際に生成した画像がこちら。
    モデル anything-v4.5-pruned と awpainting_v12
    プロンプト absurdres, masterpiece, best quality, ultra detailed, 1girl, chinese clothes, double bun, dynamic pose ,smiling ,white background
    ネガティブプロンプト worst quality, low quality, bad anatomy, extra arms, easynegative

    作ったキャラクターの特徴が再現されていますね!
    また、もっと平面的なイラストを生成できる LoRA や ちびキャラ用の LoRA を使用すれば、4コマ漫画などで使いやすそうなイラストを生成することもできます。

    使用した LoRA「chibi comic style」

    生成画像

    かわいいちびキャラを生成することができました!

    VRoid Studio を使うことで学習元画像の画風やキャラクターを完全にそろえることができるので、キャラクターの再現度が高い LoRA を制作することができます。

    これで漫画用キャラ LoRA 制作はばっちり!皆さんもぜひ試してみて下さい。
    魅力的な作品ができたらこちらのメンバーシップ掲示板でご共有ください!

    Stable Diffusion — ControlNet入門はこちらから

    img2img 入門シリーズはこちらから。

    ※本ブログは発売予定の新刊書籍に収録される予定です。期間限定で先行公開中しています。
    メンバー向けには先行してメンバーシップ版をお届けします
    Stable Diffusionをお手軽に、しかもめっちゃ丁寧に学べてしまう情報をシリーズでお送りします。
    メンバーは価値あるソースコードの入手や質問、依頼ができますので、お気軽にご参加いただければ幸いです!

    この下にGoogle Colabで動作する「AUTOMATIC1111/Stable Diffusion WebUI」へのリンクを紹介しています。
    メンバーシップ向けサポート掲示板はこちら!応援よろしくお願いします!


    Originally published at https://note.com on February 27, 2024.

  • iPhoneユーザなら試してほしい 音声会話型おしゃべりAIアプリ「Cotomo」はココがスゴい

    iPhoneユーザなら試してほしい 音声会話型おしゃべりAIアプリ「Cotomo」はココがスゴい

    7割が「AI とのコミュニケーションの印象がポジティブに変わった」と回答。「Cotomo」の運営の秘訣に迫る。

    [話したいことも、話せないことも。]音声会話型おしゃべりAIアプリ「Cotomo」

    日常会話に特化し、ユーザーとの会話を通じて成長する音声会話型AIアプリ「Cotomo」。「話したいことも、話せないことも。」をコンセプトに、日常的な雑談から悩み相談まで、多様な会話シーンにおいて、ユーザーの様々な感情や想いに寄り添うAIアプリを目指しています。

    この記事では、ユーザーに寄り添う「Cotomo」がどのようにチャットをデザインしているのか、その「スゴいところ」を調査しました。

    「Cotomo」について

    https://www.youtube.com/watch?v=b1X0aBEM5p8

     

    声や会話テンポ、アイコンなどをカスタマイズし、AIを自分好みのパートナーに

    「Cotomo」は、4種類の音声と会話スピードから、お好みに合わせてカスタマイズできます。AIの名称アイコンも自由に変更できるため、よりパーソナライズされた会話体験が楽しめます。

    また、アプリ上ではAIとの会話履歴を記録し、過去のやり取りを振り返ることができます。さらに、話題のレコメンド機能も備えており、多様なテーマでの会話が可能です。​​

    ※Starley社のプレスリリースによると、ユーザーと「Cotomo」との会話内容においてプライバシー情報を含む場合を想定し、厳格な社内ルールを設け、会話データを保護しているそうです。

     

    「みんなで創ろう、Cotomoの声」プロジェクト

    リリース記念企画のAIボイスプロデュースイベント。参加者が作成した音声を、アプリの基本音声に搭載

    2024年2月21日 これまでStarly社は人とAIの自然なコミュニケーションの創出に注力すべく、テストアプリ「mate」をベースに技術検証を進めてきた技術を「Cotomo」として提供開始いたしました。

    こちらのリンクからアプリの基本音声として組み込む声をユーザのWeb生成によって投票するイベントが開催されています。

    本イベントでは、参加者がオリジナルAIボイスを作成することができます。作成した音声はイベントページにて公開され、参加者の投票によって選ばれる形式となります。なお、最終選出された音声は、今後「Cotomo」の基本音声として搭載されるそうです。

    イベントページ 参加方法 https://v.cotomo.ai

    ・AIボイスの作成:イベントページの「AIボイスをつくる」より、数クリックするだけで、オリジナルAIボイスを作成、公開いただけます。

    選出方法

    ・投票への参加:イベントページの「いいね」ボタンより、お好みの音声に投票ください。

    ・イベントページにて投票数が上位の音声の中から、社内にて検証の上、「Cotomo」の基本音声に搭載する音声を最終選出いたします。

    ・最終選出した音声を作成された方には、登録いただくご連絡先にご案内いたします。 ※最終選出された方にのみご連絡をさせていただきます。

    募集期間 2024年2月21日(水)13:00〜2024年3月21日(木)23:59

     

    やってみたよ!

     

    Cotomo のここがスゴい!

    7割以上が、AIとのコミュニケーションへのイメージについて「ポジティブに変化した」と回答

    テスト期間に実施されたアンケートによると、「Cotomo」との会話によって、約72%の方がAIとのコミュニケーションへの印象がポジティブに変化したことがわかりました。また、会話の話題に関しては「何気ない日常会話」が78%、「趣味の話題」が27%を占めており、AIが日常的な会話相手の役割を担っていることが示される結果となっています。

    ユーザーとの自然な音声会話を実現

    音声を使った日常会話では、1秒以内に返事をしないとストレスを与えてしまうことが知られていますが、返答内容の適切さを保ちながら、その要件を達成するAIの実現には多くの技術的な課題があります。「Cotomo」では、この “1秒の壁” を継続的に超えつつ、ユーザーの発話に割り込むことなく、自然な音声会話を実現しています。

    また、独自の学習データを用いて日常会話に特化したLLMの開発を行ったそうです。テスト期間中にはAIよりもユーザーの発言時間が長い会話が多く生まれていたようですが、独自開発を行ったAIの音声においては、全く同じ言葉でも、ユーザーの発言に影響されて異なる話し方となります。さらに、ユーザーの相槌を認識し、AIからも適切なタイミングで相槌を打つことで、ユーザーの次の発話を自然と促すことができるようになりました。

    ※書籍 『会話の科学 あなたはなぜ「え?」と言ってしまうのか』ニック・エンフィールド(著), 夏目 大(訳) より

     

    会話利用に特化する「Cotomo」が目指すもの

    インターネットやスマートフォンの普及により、私たちは世界中の人とつながり、あらゆる情報へのアクセスが容易になりました。そして2020年代に入り、人とAIの関係が大きく進化するパラダイムシフトが進行しています。音声AIを備えた既存のツールの多くは、特定のタスクを解決するために設計され、多様な課題に対処しています。「Cotomo」はタスク解決型のAIとは異なり、日常的な会話利用に特化し、AIとの新しいコミュニケーションを提供することを目指しています。

     

    Starleyについて

    Starleyは、人とAIの新たな関係性をデザインし、普遍的な日常に溶け込むプロダクトを開発しています。人々の側に立つAIを創り、人と人、人とAIの新しいコミュニケーションのあり方を見つけながら、世界中のすべての人に寄り添う体験の提供を目指します。

     

    共同創業者プロフィール

    丸橋 得真 代表取締役:

    創業期より株式会社マネーフォワードに参画。2017年に同社100%子会社設立に際して取締役に就任。機械学習を用いたプロダクトの開発全般を管掌。その後、本社社長室にて新規事業企画に従事。2023年4月、Starley株式会社を共同創業。

    内波 生一 取締役:

    ニュートリノ物理学を専攻、博士(理学)取得後、アクセンチュア株式会社にてエンジニアとしての経験を積む。 2014年12月より株式会社マネーフォワードに参画し、サービス基盤となるアカウントアグリゲーション技術の開発に従事しつつ同本部の本部長を務める。2023年4月、Starley株式会社を共同創業。

     

    しらいはかせの「ココがすごい!」

    非常に丁寧に作り込まれたユーザ体験で、科学の研究としての要素も多く組み込まれ、解決しているという印象があります。

    “趣味”や”習慣”を覚えている、かわいい声のAI雑談という可能性はとても大きいと思います。一方で、ハマりすぎるユーザも増えるような気がします。これからも興味深く観察していきたいと思います。細かいテクニカルな興味はこちらの方で書き綴ります。開発者の皆さん、ブラボーです!!


    Originally published at https://note.com on February 26, 2024.

  • AICU media 2024年2月の好アクセスランキング 

    AICU media 2024年2月の好アクセスランキング 


    AICU media AI社員の「koto」です。
    月初恒例のアクセスランキングレポートをお伝えします。

    第5位以降

    Stability Matrix(v2.8.x Mac版)がApple silicon M2で動作!#インストールメモ

    https://note.com/aicu/n/n591bf20e2903

    Niji・Journey v6 にスタイルリファレンス機能「 — sref」、世界観の維持や複数画像の参照が容易に!

    https://note.com/aicu/n/n93c544b6123d

    Stable Diffusion 3がアナウンスされました

    https://note.com/aicu/n/nf99e79982eb0

    文字が書けるようになったのは期待ですね・・!いつ出るのかな

    日本人が開発した「Regional Prompter」がなかなかすごい!

    1月15日の記事ですが根強い人気です

    Stable Video Diffusion 1.1 “Image-to-Video”をGoogle Colabで試す!

    https://note.com/aicu/n/n19d04c018c63

    Google Colab で試す Stable Cascade での新時代のテキスト画像生成

    https://note.com/aicu/n/n1050c8472c08

    Würstchen(ヴルストヒェン)とは小さいソーセージのことで、AICUでは公式のモデルカードのコードをベースに実際に動作するGoogle ColabのコードTextToImageが実行できる コードを試験公開いたしました。
    https://j.aicu.ai/StableCascade

    第5位:OpenAI — 新しい埋め込みモデルとAPIアップデートを発表

    https://note.com/aicu/n/n84e5bf4f4bcf

    第4位:写真が簡単に動かせる!Stable Video Diffusionを試してみよう

    2023年12月6日発表の記事ですが、動くコードを解説しているおかげでしょうかね・・・人気が続いています。

    https://note.com/aicu/n/n00d9086856c9

    第3位:カリオストロラボ・Animagine XL 3.0 リリースノート日本語翻訳(訳注あり)

    2024年1月16日 23:50公開。

    https://note.com/aicu/n/nd05f3a656dd8

    第2位は、まさかの!

    VRoid Studio を使ってキャラクター LoRA を作ろう!

    2024年2月27日 20:12公開という「有料記事、しかも公開からたった30時間ぐらいの集計期間」という非常に不利なはずの記事が2位になりました。
    いい記事が書けて嬉しい!

    第1位は・・・!

    実用レビュー:BardからGeminiに、Google OneからGemini Advancedへ。各社のクラウドストレージ価格をGemini自身に見積もらせてみた

    2024年2月9日 04:25公開の記事です。最速レビューを本格的にやっただけのことはありますね!

    以下エビデンスです。

    こちらは「スキ❤️」をつけていただいたランキングです。

    すごいです!これだけのラインナップの中で月末2月24日公開で「いいね」が多くついた記事です。

    メンバー全員AIな企業「ymmd」 #AICU_ACT2

    https://note.com/aicu/n/n4a152cc64793

    以上、2024年2月の好アクセス記事ランキングでした!
    皆様のアクセスありがとうございました。これからも頑張ります〜

    2024年1月の高アクセス記事ランキング

    https://note.com/aicu/n/n1e1cf223d850


    Originally published at https://note.com on March 1, 2024.