Blog

  • AICU media 4月のカバーアートが決定しました!

    AICU media 4月のカバーアートが決定しました!

    note で展開している AICU media では、今年度からクリエイターページのトップに掲載されるカバーアートを募集する企画を開始しました!

    毎月の AICU mediaのカバーを飾っていただける
    カバーアートをメンバーシップ会員より募集します!

    こちらの一番上にある画像です https://note.com/aicu

    【仕様】
    ・AICUのマスコットキャラクター「Kotoちゃん」が描かれていること
     (召喚できそうなプロンプトは掲示板で訊いてください~)
    ・「AICU media」の文字が入っているとうれしいです
    ・季節感があること(12ヶ月分をまとめてカレンダーを作ります!)
    ・Photoshop等での加工もOK
    ・1920 × 1006 px

    詳細は noteのフォーマットをご参照ください

    ・投稿先はこちらの掲示板の返信にて
    一言メッセージなどもいただけると幸いです
    ・締切は毎月末日になります(4月分の締切は3月31日 23:59です!)

    ★採用作品には薄謝(Amazonギフト券5000円など季節のギフト)をお送りいたします!受領方法のご連絡はTwitterDMもしくはDiscordコミュニティにて

    note のメンバーシップに加入していただいた読者の皆様からカバーアートを募り、AICU 編集部がぜひこれをメディアの顔にしたい!と思った作品を1か月間掲載させていただく、という企画になっています。

    採用となった方には 5000 円相当の謝礼もご用意しております!

    4月のカバーアートは…?

    早速今月のカバーアートの発表です!

    4月 AICU media の顔として採用になったのは、はねごろう(hane56)さんの作品です!

    満開の桜と風になびく koto ちゃんの髪と花吹雪、華やかな振袖と儚い雰囲気が春の浮足立った雰囲気を演出していますね。

    「AICU media」の文字が腕に乗っているのもユニークで面白いです!

    早速掲載させていただきました。

    ご応募くださった皆様、ありがとうございました。

    採用されたカバーアートは来年度のカレンダーになる予定です。これからの応募作品にも期待が高まりますね!

    5月のカバーアートも募集中!

    AICU media では、4月に引き続き5月のカバーアートも募集しています。

    画像生成で作品を作ることが好きな方、興味があってやってみようかな…と思っている方、また #SD黄色本 を読んで「なにか応募してみたい!」と思った方など、どなたでも大歓迎です。ぜひご応募ください!

    応募用掲示板はこちら

    メンバーシップの加入はこちら

    「画像生成AI Stable Diffusion スタートガイド」通称「SD黄色本」はこちら

  • 最先端の画像生成AIを深掘りする教科書決定版『画像生成AI Stable Diffusion スタートガイド』3月29日発売 #SD黄色本

    最先端の画像生成AIを深掘りする教科書決定版『画像生成AI Stable Diffusion スタートガイド』3月29日発売 #SD黄色本

    Stability AI 公式パートナーによるAI時代のクリエイターのための教科書。東京AI祭での特別イベントも。Amazonでの購入は https://j.aicu.ai/SBXL

    Amazonでの購入は https://j.aicu.ai/SBXL

    『画像生成AI Stable Diffusion スタートガイド』白井暁彦& AICU media編集部 著。AIメイキング解説 フィナス/らけしで

    「つくる人をつくる」デジタルクリエーションの最前線をいく、デジタルハリウッド大学発の米国スタートアップ「AICU Inc.」は、この度、画像生成AIの革新的技術「Stable Diffusion」を徹底解説した教科書『画像生成AI Stable Diffusion スタートガイド』をリリースしました。2024年3月29日にSBクリエイティブより刊行される本書は、AIによる画像生成技術に関心を持つすべての人々に、基礎から応用までを段階的に学べる一冊として開発されました。

    書籍のハイライト:

    AICU Inc.紹介: 「つくる人をつくる」をビジョンに、生成AIクリエイティブの最新の話題やテクニックを楽しい雰囲気の日々のブログで紹介する「AICU media編集部」により執筆。Webデザインや映像、ゲーム、メタバース、VTuber、キャラクターイラストレーションなどに多様に活躍する30年の経験を持つ著者(白井暁彦博士/しらいはかせ)が中心に、教育の現場や、豊富な知見と実績を背景に、未来のクリエイター育成に貢献します。

    技術の解説: 話題の画像生成AI「Stable Diffusion」「Stable Diffusion XL」とオープンソースツール「AUTOMATIC1111」を中心に、画像生成AIの基本からプロフェッショナルな絵作りのための応用テクニック、最新のテクノロジー解説を網羅。

    イラストレーションが好きな人にこそ読んで欲しい: 美しく、楽しい誌面と優しい言葉での解説。スマホで使えるniji・journeyや、最新の簡単インストーラー「Stability Matrix」、プロのイラストレーターの作例、解説、プロンプトのテクニックや背景で動いている技術の仕組み、image2image、ControlNet、LoRAでオリジナルキャラをAIに覚えさせるだけでなく、自分の子供時代の画像を学習させて不可能なコラボレーションを実現する方法など、技術系だけでなく、今後の生成AI時代に大きな進化が期待されるイラストレーターや漫画制作、映像スタジオといった幅広い用途に応用できる技術を丁寧に解説しています。

    実践的学習: GPUや高度なプログラミング知識がなくても、Google Colaboratoryを使って手軽に実践できる内容を収録。学生のアクティブラーニング、集団で学ぶワークショップ、コンピュータサイエンスやコンピュータグラフィックスの研究に入って行くための基盤的な知識や、ニューラルネットワークに関する基礎知識、専門用語などを丁寧に解説。

    クリエイター視点での法律・ライセンス・倫理: 画像生成AIを用いる際の著作権や倫理面での注意点を解説。法律の解釈だけでなく、プロのクリエイターとして安全かつ責任ある使用における注意点やライセンス解説を随所に盛り込んでいます。

    最新情報: 2024年3月時点での最新情報に基づき、動画生成やデジタルイラストレーションの専門技術を長期にわたって理解できる歴史俯瞰や用語解説が満載。

    オープンソースとコミュニティによるアップデート: 書籍だけじゃ終わらない、GitHubやGoogle Colab によるオンラインでの最新ソースへのアクセス、AICU mediaによる楽しい画像生成コミュニティでのサポートやワークショップなどのイベント情報、お仕事情報など、長く、クリエイターとして成長していけるためのパスポートになっています。

    本書の目的と読者層:

    『画像生成AI Stable Diffusion スタートガイド』は、幅広い読者を想定し、中高生、美術・芸術・イラストレーションの学生、クリエイター、そしてAI技術に興味を持つ一般読者まで、幅広い層に向けています。本書を通じて、今後30年のクリエイティブ産業をリードする知識とスキルを身につけることができます。プロフェッショナルだけでなく、趣味で美しい絵を生成したい方や、ビジネスシーンでのプレゼンテーション資料作成に利用したい方にも最適なガイドブックです。

    「画像生成AI Stable Diffusion スタートガイド」出版社情報より:

    定価:2,640円(本体2,400円+10%税)
    発売日:2024年3月29日(金)
    ISBN:978-4-8156-2456-9 サイズ:B5判 ページ数:224
    著者:白井 暁彦、AICU media

    画像生成AIの1つであるStable Diffusionを導入・体験するための入門書です。
    プログラミングが分からない、ネットの情報を見てもうまく使えなかった、そんな悩みを抱えている人でもAIを使った画像生成体験ができるようにしっかりサポートします。

    本書籍では以下の環境で解説します。
    ・Google Colab Pro環境
    ・Windows10/11 NVIDIA GPU環境
    ・MacOS Apple silicon 環境

    本書籍では以下の内容を取り扱います。
    ・拡散モデルによる画像生成の原理
    ・Stable Diffusionを使用するためのWebUI環境構築
    ・テキスト/画像を元に画像を生成する(txt2img/img2img/ControlNet)
    ・Google Colab 上で追加学習を行う(LoRAの作成)

    本書ではソフトウェアの使い方解説だけではなく、自分で設定できるセッティングやパラメータが画像生成にどのように関わっているのかについても解説しているため、AI技術について知識を深めたい人にとってもおすすめです。
    また、既にAIを活用している方にもご満足いただけるように、よりAI画像制作を極めるヒントとなるようなStable Diffusionを含むAI画像生成を利用した作例のメイキング方法やプロンプト構成/生成パラメーターなどの情報を公開・解説しています。ハンズオン形式で最後まで取り組むことで、画像生成AIへの理解をより深めることができる1冊となっています。

    全ての目次とコラムを紹介します!

    Chapter 1 画像生成AI について知ろう

    1-1 AI で画像を生成してみよう
    1-2 画像生成AI の誕生と変遷
    1-3 2024 年での「AI の定義」を考えてみよう
    1-4 ニューラルネットワークについて知っておこう
    1-5 拡散モデルによる画像生成の原理を知っておこう

    Chapter 2 環境構築をしてはじめよう

    2-1 Stable Diffusion を使う環境を用意しよう
    2-2 Google Colab での環境構築
    2-3 Stability Matrix をローカル環境で構築する
    2-4 簡単な言葉で画像を生成する
    2-5 モデルをダウンロードする
    2-6 VAE をダウンロードする

    Chapter 3 プロンプトから画像を生成してみよう

    3-1 プロンプトで意のままの画像を作り出す
    3-2 ネガティブプロンプトを構築する
    3-3 思い通りの画像を生成する
    3-4 画像の解像度を上げよう
    3-5 様々なパラメータを調整しよう
    3-6 様々なプロンプトを試してみよう

    Chapter 4 画像を使って画像を生成してみよう

    4-1 img2img でできることを知ろう
    4-2 Sketch を使って画像を生成しよう
    4-3 Inpaint で画像を編集してみよう
    4-4 Inpaint を応用して画像を修正する
    4-5 Outpainting で画像を拡張する
    4-6 img2img で画像の解像度を上げる
    4-7 拡張機能でアップスケーリングをしてみよう

    Chapter 5 ControlNet を使ってみよう

    5-1 ControlNet について知っておこう
    5-2 ControlNet をダウンロード・準備する
    5-3 ControlNet を使って画像を生成する
    5-4 プリプロセッサの働きを理解しよう

    Chapter 6 LoRA を作って使ってみよう

    6-1 追加学習でできることを知ろう
    6-2 LoRA を使用して画像を生成しよう
    6-3 自分の画風LoRA をつくる
    6-4 様々な種類のLoRA をつくってみよう
    6-5 学習内容を出力させてみよう

    Chapter 7 画像生成AI をもっと活用しよう

    Interview Guest フィナス
    Interview Guest らけしで
    画像生成AI の活用と注意点
    AUTOMATIC1111/WebUI おすすめ拡張機能
    関連用語

    充実したコラム!

    ページ番号とともに紹介します

    使用するGoogle アカウントに注意しよう 14
    変わりゆく社会とAI の関係性 25
    利用しているプログラムについて 43
    Google Colab のエラーに対応しよう 45
    Google Colab の計算資源を有効に管理しよう 47
    パッケージ選択ではエスケープしないように注意しよう 57
    画像の保存場所を変更しよう 62
    コミュニティで質問してみる 63
    StableDiffusion シリーズとは 65
    CLIP のゼロショット転移性 78
    embedding とは 82
    デフォルメキャラ風の画像を生成してみよう 106
    色の変化を抑える設定をしておこう 111
    下書きから画像を生成してみよう 114
    Mask blur を調整して自然に見せる 118
    拡張機能とは 124
    オープンソースライセンスの確認 131
    複数のControlNet を使用する 141
    Openpose をもっと使いこなそう 144
    これからのLoRA の活用方法 149
    LoRA の学習データで気を付けるべきこと 154
    手元に保管しているモデルファイルをLoRA 学習に使う 158
    写真や写実的な画像を学習させる場合 161
    学習の全体像を把握しよう 167

    主著者紹介:
    白井暁彦(Akihiko Shirai, PhD /しらいはかせ )(X アカウント:@o_ob)

    エンタメ・メタバース技術の研究開発に関わる研究者、ホワイトハッカー作家、米国スタートアップ「AICU Inc.」「Hidden Pixel Technology Inc.」のCEO。東京工芸大学写真工学科卒、同画像工学専攻修了。キヤノン株式会社とグループの研究所より生まれた英国・Criterion Software にて世界初の産業用ゲームエンジン「RenderWare」の普及開発に参加、その後、東京工業大学知能システム科学専攻に復学。博士学位後、NHK エンジニアリングサービス・次世代コンテント研究室、フランスに渡りENSAM 客員研究員、国際公募展Laval Virtual ReVolution の立ち上げ、日本科学未来館科学コミュニケーター神奈川工科大学情報メディア学科准教授を経て、2018 年よりデジタルハリウッド大学 大学院客員教授 およびグリー株式会社GREE VR Studio Laboratory Director。スマートフォン向けメタバース「REALITY」を開発・運用するREALITY 株式会社の立ち上げを通して、Virtual YouTuber などXR ライブエンタメ技術のR&D、国際発信など、メタバースエンタテイメントの未来開発や知財創出を中心に、自らエンタテイメントのライブプレイヤーとして世界に向けた開発・発信活動方法論化しながら世界中のエンタテインメント技術業界に数百人の規模でクリエイターを育成している。2023 年よりデジタルハリウッド大学発米国スタートアップ企業「AICU Inc.」CEO。生成AI 時代に「つくる人をつくる」をビジョンに英語、日本語、フランス語、プログラミング言語などでオープンな作家活動を続けている。日本バーチャルリアリティ学会IVRC 実行委員会委員。芸術科学会副会長。著書に『WiiRemote プログラミング』(オーム社)、『白井博士の未来のゲームデザイン – エンターテインメントシステムの科学-』(ワークスコーポレーション)、『AI とコラボして神絵師になる 論文から読み解くStable Diffusion』(インプレスR&D)他。

    アシスタントクリエイター 知山ことね(X アカウント:@ChiyamaKotone)

    デジタルイラストレーション、テクニカルライター、チャットボット開発、Web メディア開発を担当するAICU Inc. 所属のクリエイター。AICU Inc. のAI 社員「koto」キャラクターデザインを担当している。小学校時代に自由帳に執筆していた手描きの雑誌「ザ・コトネ」「ことまがfriends」のLoRA が話題に。技術書典15「自分のLoRAを愛でる本」他。

    AICU Inc. について:Xアカウント@AICUai https://corp.aicu.ai/ja    info@aicu.ai

    「生成AI時代につくる人をつくる」をビジョンに活動する2023年に設立された米国シリコンバレーを本拠地にするデジタルハリウッド大学発のスタートアップ企業です。LINEアカウント「全力肯定彼氏くん」「AI確定申告さん」、Webに住むAIアイドル「AICuty」、クリエイティブAIレポーター「Koto」など楽しみのあるAI体験を開発する「AIDX Lab」、わかるAIを楽しく届ける AI総合メディア「AICU media」、AI人材教育コンテンツ開発、障害者向けワークショップ開発、AIキャラクター開発運用、某有名企業の新技術プロトタイプコンテンツ開発など「クリエイティブAI」ならではのコンテンツ技術開発・体験開発を世界的な企業に展開している価値開発企業。画像生成AI「Stable Diffusion」を開発公開した Stability AI 公式パートナーであり、Google for Startups認定スタートアップでもあります。1994年に杉山知之が創立したデジタルハリウッド大学(愛称「デジハリ」)はCGやデジタルクリエーションを専門に学ぶ学校ですが、開学のころからずっと変わらず伝えていることは『すべてをエンタテインメントにせよ!』 。エンタテイメント技術の研究開発で30年の経験を持つCEO白井暁彦とAI社員、少数精鋭の人間味あふれる多様なスタッフや協力クリエイターとともに、すべてをエンタテインメントにするまで追求する文化が AICUにも息づいています。

    AICU media 編集部   https://note.com/aicu media@aicu.ai

    「わかるAIを楽しく届ける」総合AI情報メディア。AIレポーター「Koto」がクリエイティブAIを中心に24時間365日最新情報をお届けしています。 活動メディアはnote、 X(Twitter)、 動画メディア、各種商用サイトへの記事提供、同人誌・商業書籍・電子書籍など書籍企画との開発、子ども向けからお年寄り向けまで「つくる人をつくる」をビジョンに幅広いワークショップやイベントを開発しています。AI先進企業の新サービスの普及展開のお手伝い、AI活用したい企業の技術検証や社内展開、学校・スクール等のコンテンツ開発についても案件をお待ちしております。

    ファンコミュニティは note.com/aicu/membership

    ご購入とお問い合わせ:

    『画像生成AI Stable Diffusion スタートガイド』は、全国の書店およびオンライン書店でお買い求めいただけます。

    Amazon購入ページ: https://j.aicu.ai/SBXL

    最新情報は AICU media note.com/aicu

    X(Twitter) @AICUai https://twitter.com/AICUai

    @PRTIMES_JP
    最先端の画像生成AIを深掘りする教科書決定版『画像生成AI Stable Diffusion スタートガイド』発売 https://j.aicu.ai/SBXL
    https://prtimes.jp/main/html/rd/p/000000013.000133647.html

  • [保存版] Animagine XL 3.1 生成比較レポート

    [保存版] Animagine XL 3.1 生成比較レポート

    つくる人をつくる!AICU media の知山ことねです。

    Animagine XL 3.1リリース

    2024年1月16日に公開された Stable Diffusion の画像生成モデル「Animagine XL 3.0」から、新バージョンとなる Animagine XL 3.1 がリリースされました!

    この記事では、Animagine XL 3.0 と比較して画風などに違いはあるか、また Animagine XL 3.1 から搭載された新たなタグについて紹介していきます。

    【関連記事】

    漫画制作に適したモデルは?Animagine 3.1 vs Animagine 3.0 徹底比較を行いました!

    XL 3.1 では、Animagine XL 3.0 で重要だったプロンプトも引き続き使用できます!

    https://note.com/aicu/n/n44085d702617

    Animagine XL 3.0 リリースノートはこちら。

    https://note.com/aicu/n/nd05f3a656dd8

    Hugging Face はこちら

    https://huggingface.co/cagliostrolab/animagine-xl-3.1

    公式リリース 和訳(一部抜粋)

    Animagine XL 3.1は、前バージョンのAnimagine XL 3.0を強化したもので、より高い品質でアニメスタイルの画像を生成できるように改良されています。有名なアニメシリーズからのより幅広いキャラクター、最適化されたデータセット、より良い画像作成のための新しいタグが含まれています。アニメキャラクターの正確で詳細な表現を生成することで、アニメファン、アーティスト、コンテンツクリエイターにとって価値あるリソースとなることを目指しています。

    Animagine XL 3.0 をより高品質にしたということですね!

    Animagine XL 3.0 との比較

    それでは、実際に生成して Animagine XL 3.0 と比較していきましょう。
    今回生成に使用した環境は、Windows10、NVIDIA GeForce RTX 3060 搭載の VRAM6GB の GALLERIA ノート PC に直接インストールした ComfyUI です。

    画風

    まずシンプルなプロンプトで生成し、Animagine XL 3.0 と比較してみます。

    プロンプト: best quality, 1girl
    ネガティブプロンプト: worst quality, low quality, nomal quality, bad anatomy, NSFW

    Animagine XL 3.0

    Animagine XL 3.1

    強い光源、耳の見える髪型、逆光感などの大きな特徴はそのまま残っていますが、Animagine XL 3.0 の特徴だった切れ長の目とピンクの頬が目立たなくなり、露出度も軽減されました。また Animagine XL 3.0 では肌がつやっとする雰囲気がありましたがそれも軽減され、全体的に落ち着いたように感じます。

    また Animagine XL 3.0 よりも Animagine XL 3.1 の方が線画が細くはっきり出ていて、厚塗り感、立体感が減り少し平面的になった印象を受けますね。

    タグ

    Animagine XL 3.0 には画風を指定する「年代タグ」やクオリティを指定する「クオリティタグ」がありましたが、Animagine XL 3.1 ではそれらがアップデートされたことに加え、「Aesthetic Tags」が追加されました。

    クオリティタグ

    Animagine XL 3.1 公式 Hugging Face より

    従来のクオリティタグから数値が少し調整され、タグ名が一部変更されました。よく使用する「masterpiece」「best / worst / low quality」は変わらないので、今まで通りの感覚で使えそうです。

    年代タグ

    Animagine XL 3.1 公式 Hugging Face より

    「2024」が追加され年が少しずつ調整されていること、「late」が「recent」に変更されたことが主な変更で、年代タグも大きくは変わっていません。

    実際の生成画像比較

    newest (2021–2024)

    Animagine XL 3.0 に似た絵柄です

    recent (2018–2020)

    newestを少し繊細にした雰囲気です。VTuber全盛期ですね。

    mid (2015–2017)

    退廃的な雰囲気が可愛いです
    明らかに画風がVTuber風ではなくなってきました。

    early (2011–2014)

    セピアな雰囲気が出ています

    https://j.aicu.ai/Mag2405

    Oldest (2005–2010)

    年代的には涼宮ハルヒや長門有希が流行った時期ですね。
    90年代風のテイストもありますが、明らかに描きわけができています。

    レーティングタグ(年齢制限タグ)

    Animagine XL 3.1 公式 Hugging Face より

    センシティブな表現を調節するレーティングタグも、Animagine XL 3.0 から大きく変化はありません。プロンプトとネガティブプロンプトを使い分けて露出度を調節しましょう。

    Aestheticタグ

    アニメデータに特化したViT(Vision Transformer)画像分類モデルと、コンテンツの美的価値を評価するモデルshadowlilac/aesthetic-shadow-v2を利用し、視覚的に魅力的であるものを生成するタグです。

    aesthetic

    プロンプト「best quality, 1girl, very aesthetic」

    カメラアングルやポーズがダイナミックになりました!

    「aesthetic」(イェステティック;美的)というプロンプトは Nijijourney や Novel AI でも有効なので、ぜひ試してみてください!

    推奨設定

    公式 Hugging Face で紹介されている推奨設定、プロンプトを紹介します。

    「Absurdres」とは造語で、absurd-res、ありえないぐらい高解像度、という意味のようです。

    プロンプト

    masterpiece, best quality, very aesthetic, absurdres

    ネガティブプロンプト

    nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

    CFG Scale

    低め(5–7)

    Sampling Steps

    30以下

    Sampler

    Euler a(Euler Ancestral)

    https://j.aicu.ai/Mag2404

    ギャラリー

    お気に入りの生成画像です!

    パステルカラー!

    抜け感

    kotoちゃん

    oldest

    newest

    アニメ風

    皆さんもお気に入りの画像が生成できたら、ぜひご共有ください!

    メンバーオンリー画像投稿コーナー https://note.com/aicu/membership/boards

    https://note.com/aicu/membership/boards/61ab0aa9374e/posts/17273820a798

    Animagine XL 3.0 おすすめのプロンプトはこちら

    ANIMAGINE XL 3.0 画風が変わる!おすすめプロンプト集
    https://note.com/aicu/n/n44085d702617

    Stable Diffusion — ControlNet入門はこちらから
    https://note.com/aicu/n/nde6fe41f077b

    img2img 入門シリーズはこちらから。
    https://note.com/aicu/n/n08ebe0637a41

    この下にGoogle Colabで動作する「AUTOMATIC1111/Stable Diffusion WebUI」へのリンクを紹介しています。

    https://note.com/aicu/membership/boards/61ab0aa9374e/posts/7cab00942b22?from=self

    メンバーシップ向けサポート掲示板はこちら!応援よろしくお願いします!

    AICU mediaによる新作書籍「画像生成AI Stable Diffusionスタートガイド」ついに予約開始です!(2024年3月29日リリース)

    詳細はこちらから https://ja.aicu.ai/sbxl/

    今回の記事の内容はAICUマガジンでもご覧いただけます

    AICU magazine Vol.1 2024年4月号 https://j.aicu.ai/Mag2404

    AICU magazine Vol.1 2024年5月号 https://j.aicu.ai/Mag2405

    AICU:AIクリエイターユニオンでは皆様のご質問をお待ちしております
    https://note.com/aicu/membership/boards

    Originally published at https://note.com on March 19, 2024.

  • [3/13開催]AIクリエイターギルド@歌舞伎町GOX #AICU_ACT3

    [3/13開催]AIクリエイターギルド@歌舞伎町GOX #AICU_ACT3

    AICUイベント事務局です。

    https://ja.aicu.ai/wp-content/uploads/2024/03/rectangle_large_type_2_4252042e5f801ee4737368928ce03239-1024×536.webp



    すでにお伝えしておりました「AICU Creators Talk3」ですが企画を拡大し、
    AIクリエイターギルド歌舞伎町GOX #AICU_ACT3といたしまして、現在参加者募集中です。
    https://techplay.jp/event/936576

    2024年3月1日、プレスリリースを発信させていただきました。


    AICU新製品発表会を予定。各業界を横断にAIクリエイターがデモを持ち込み新宿歌舞伎町「クリプトラウンジGOX」に集合します!▶ https://j.aicu.ai/TPACT3

    https://prtimes.jp/main/html/rd/p/000000012.000133647.html



    「つくる人をつくる」をビジョンに活動するAICU社の月例イベント「AICU Creators Talk」(ACT)、第3回は AICU の社名の由来でもある「AI クリエイターユニオン」をテーマに、「AIクリエイターの集まるギルド」を新宿歌舞伎町「GOX」にて開催します。

    AICU のファンイベントとして「新製品発表会」をはじめとして、AICUパートナー企業やクリエイターの活動紹介、ライトニングトーク、デモ、製品即売会など、これからのクリエイター、エンジニア、BizDev、学生さんなど分野や年齢を問わず AI に関わる方々や AI に興味がある方の交流の場をつくります。

    2024年3月23~24日に渋谷ストリームで開催される「東京AI祭」(https://www.aisai.tokyo )にむけた準備デモの準備やクリエイティブ AI に関わる皆さんの躍進のチャンスを提供をできれば幸いです。 お申し込み詳細はこちら▶︎https://j.aicu.ai/TPACT3

    会場は「Crypto Lounge GOX」

    https://www.youtube.com/watch?v=XVhaVwzXMKI


    会場である「Crypto Lounge GOX」はワールドコインが手に入る「人間であることを証明できるバー」です。ChatGPTを生み出したサム・アルトマン氏が最高経営責任者を務めるワールドコイン財団 @worldcoin の認証スポットとして登録されています。

    ※ご予約は各自参加者で WORLD Appから事前にご準備ください(完全予約制でorbによる認証ができます)

    https://twitter.com/groove_on_x


    会場へのルート
    https://twitter.com/groove_on_x/status/1736978718269293047


    参加予定クリエイター(参加表明順・随時更新)

    Ryo Shimizu AI研究家 @shi3z

    凄腕エンジニアであり実業家でありUber配達員。

    Hidekazu Furukawa @npaka123

    プログラマー。iPhone / Android / Unity / ROS / AI / AR / VR / RasPi / ロボット / ガジェット。年2冊ペースで技術書を執筆。アニソン / カラオケ / ギター / 猫
    [note]

    jiyu @jiyu33

    BlendAI CEO。クリエイティブ領域でのAI利用を推進する目的で「デルタもん」というキャラクターを X/Twitter を中心に展開しています(@BlendAIjp)。

    「AI関係の利用は商用・非商用問わず自由」「すべてのデルタもん公式・二次創作著作物は、AI関連の学習をしてもよい」というルールなので、著作権法等の権利問題を気にすることなくAIを利用した創作や学習が可能です。公式からは、画像や音声などの基本的な素材にとどまらず、LoRA や音声モデルなど既に学習されたデータも積極的に公開していきます。これらすべてがAIを利用していさえすれば商用利用を含め原則無制限に利用可能です。現在、3DCGモデルを作るためにクラウドファンディングを行っております。3DCGモデルがあれば、LoRAを始めとした高品質なAI素材の提供が可能となります。ぜひクラファンにご協力いただけると幸いです。クラファンはこちらで行っています

    Nobuyuki Kobayashi @nyaa_toraneko

    The man of Tech Otakus @Unity/AI/Anime/元Unity Technologies Japanのシニアエバンジェリストの小林です。在職中はユニティちゃんの企画とか、トゥーンシェーダーとか、いろいろやってました。現在は、リアルタイムキャラクター表現、アニメを中心とする映像表現、AIをの活用など、日々面白そうなことを探している最中です!
    興味ある方はお声がけよろしくお願いします。
    もちろんこちらからもお声がけさせていただきますので、その際はよろしくお願いします![LinkedIn]

    そのほかの参加表明

    ・marimosphereさん (@marimosphere) Web3の女王
    ・Scott Broock (@scottbroock) Visitor from AI Los Angeles!
    ・はねだ プロダクションマネージャー
    ・Kaho Fujiyoshi クリエイター
    ・しらいはかせさん AICU Inc. CEO (@o_ob) 実は3/13は誕生日です! 祝ってあげてください!

    ライトニングトーク


     ライトニングトークは5分程度のプレゼンテーションです。
     自身の制作物や活動、その成果や宣伝、即売会など皆さんに発表していただけます。
     AICU およびパートナー企業による撮影、配信も予定しております。
     生成 AI の最先端を行く方々と関わり、視野や可能性を大きく広げられる交流会となっております。皆さんぜひお気軽にご参加ください。

    以下エントリー順で紹介いたします(当日の発表順や内容ではないかもしれません)

    株式会社メイクリー @kokushing

    クリエイターを支援する株式会社メイクリーを創業し、主にエンジニアとして生きています。「つくる人がつくり続けられる世界を創る」べく、日々サービスを開発中。アニメゲーム好き、最近はAI×サブカル領域の可能性を探っています

    よーへん(xRデザイナー) @Yohen_XR

    2017年からアバターを探求するVTuberを始めて、xRを仕事にしています。最近は可愛らしいロボットに毎日骨抜きにされたり創作相方との間にAIの娘が生まれたりして、AIキャラクターに関しても公私いろいろ研究しています。

    debittoo 合同会社MetAI 代表 @debichanchan

    スペイン人。来日してから15年目。
    メタバース、AIビジネスが長くやっております。
    アップル、ソニー、楽天、ヤフーなど大手企業で働く経験あり。
    現在メタバース、AIの会社持ってます。
    Twitter @debichanchan Instagram @metaijp

    藤吉香帆 @kahofujiyoshi

    セツナクリエイション合同会社 代表取締役 / デジタルハリウッド大学非常勤講師
    刹那的に生きることをテーマに、瞬間(イマ)を捉える、瞬間(イマ)を演出するクリエイティブカンパニーの代表の片割れです。イマっぽいクリエイティブ、イマ必要なクリエイティブを作る会社として、AIの活用もやっていかなきゃ!と勉強中。
    友だちと仕事をする社長をしています。ぜひ友だちになりましょう!
    LTは #50DAYSママ活 中間報告とインフィードクリエイティブでの活用考察(発表までに変わるかも!)




    最新の参加者リストはハッシュタグ「#AICU_ACT3」もしくは
    TechPlayイベントページにて!
    https://techplay.jp/community/AICU

    短縮リンク j.aicu.ai/TPACT3 → https://techplay.jp/event/936576

    AICU活動紹介&新製品発表会

    詳細は当日会場にて発表いたします、お楽しみに!

    トークセッション(予定)


    生成 AI のトップランナーの方をお招きし、グラフィックス産業やキャラクターがこれから生成 AI とどう関わっていくのかについてのトークセッションを開催します。

    クリエイティブAIマーケットプレイス(デモつき交流会&AI同人即売会)
     交流会に合わせて、自身の制作物や活動、その成果や宣伝、即売会など皆さんに発表していただけます。

     ■想定される販売可能物品
      新規AIサービス
      AI VJ
      動画上映
      チャットボット/ChatGPTsやエージェントのデモ
      生成AIによる同人グッズ
      技術同人誌
      その他(合法なものに限ります)
     注意:ハンズオンで持ち込み、18時集合、22時に完全撤収ができるものに限ります。
     無料のデモのみでも構いません。
     決済はQRコードやWeb決済のみ。当日の現金の授受はなきようお願いします。

    参加方法:TechPlayよりクレジットカード決済にてご参加登録ください。
     開催日 : 2024年3月13日
     開催時間 : 18:30 ~ 21: 30
     会場 : Crypto Lounge GOX
     https://cryptoloungegox.com/
     〒160-0021 東京都新宿区歌舞伎町2丁目19−15 てなむタウンビル 6F
    主催 : AICU Inc.

    みなさまのお越しを楽しみにしております。

    ※ 当日予告なく時間配分・内容が変更になる可能性がございます。
    その他お問い合わせ
     AICU イベント事務局
    https://corp.aicu.ai/ja

    https://techplay.jp/community/AICU

  • Stability Matrixのエラーを確認しよう

    Stability Matrixのエラーを確認しよう

    Stability Matrixのエラーを確認しよう

    Stability Matrixでのエラーは英語とコマンドラインで表示されるので敬遠されがちですが、実際には自力で環境構築を進めるのに比べて理解しやすい形式になっています。インストール時のエラーについて、多くの場合は「もう一度試せばよい」ということも多いので、諦めずに繰り返しインストールと、翻訳や検索をしてみると理解に繋がって無駄な時間を過ごすことがないでしょう。

    WebUI起動後のエラーメッセージの多くは、Colabの時と同じくGradioのWebインタフェースの右下に表示されています。さらに細かなエラーメッセージは「Stability Matrix」の「Launch」タブにも表示されています。特にエラーが起きていなくても、WebUIでは表示されない画像生成のプロセスや経過時間を確認できるので、表示する習慣をつけておくと良いでしょう。

    パッケージ選択ではエスケープしないように注意する

    最初のパッケージ選択は慎重に操作することをおすすめします。何か間違えても必ずエラーメッセージ等は出ていますので、強制終了などはしないで丁寧にログは見ていきましょう。
    最初の「Packages」でパッケージ選択をしますが、インストール中にエスケープキーなどで抜けないように気をつけましょう。抜けてしまった場合は「Packages」下部の「+パッケージの追加」から追加できます。

    欲張って一度に複数のパッケージを入れようとしない

    ・本書の解説は「 AUTOMATC1111/WebUI」の「v1.7.0」もしくは本書刊行時点での最新版は「v1.8.0」で行っています。インストール時に「Version」プルダウンで選択することで過去のバージョンもインストールできます。
    ・複数の同名パッケージをインストールするときに「表示名」を変更するとバージョン違いでインストールできます(更新すると最新版になってしまいますので注意)。

    動作確認のために「Stable Diffusion 1.5」をダウンロードしておく

    「Model Browser」から「Hugging Face」の「Base Models」からインストールできます。最低でも「Stable Diffusion 1.5」はインストールしておきましょう(「Stable Diffusion XL」が動けば何の問題もありませんが、メモリ不足でロードできないという問題も多く発生しますので)。

    「Fooocus」や「ComfyUI」をインストールしておく

    最近は「Fooocus」や「ComfyUI」に関する情報も多く、モデルのダウンロードやセットアップなどは共通の基盤でもあるので、これらのパッケージのインストールやセットアップも実施しておくと 問題が解決することもあります。逆を言えば、「Fooocus」や「ComfyUI」が動いているのに「AUTOMATIC1111/WebUI」だけが動かない、という状態であれば、ハードウェアのスペックではなく、WebUIやモデルの選択、拡張機能などのセッティングが問題であると粗く絞ることもできます。

    Packageにインストールされたその他のパッケージの3点メニュー「…」から「アンインストール」、「アップデートを確認」や「共通画像フォルダ」の設定ができます。「Model Sharing」で「Symlink」にすると、モデルデータをリンクファイルとして共有できるのでディスクの容量を節約することができます。

    Stability Matrixの GitHub Issues

    https://github.com/LykosAI/StabilityMatrix/issues

    2024年3月3日時点で v2.8.3、Issues (不具合報告)は 142件存在しますが、積極的に解決が進んでいるようです。似たようなエラーがあったときはそのキーワードで探してみると、世界中の利用者が互助的に解決していることもあります。特にMac版はリリースされたばかりなので問題があるかもしれませんが、同じような問題で詰まっている方も多くいるので情報も見つかりやすい状況です。
    英語でのIssueを立てられるようになれば、オープンソースの貢献者への第一歩です。

    noteのハッシュタグ「#StabilityMatrix」

    日本語では note に情報が集まっています。ハッシュタグ「#StabilityMatrix」はこちらで確認することができます。

    https://note.com/hashtag/stabilitymatrix

    人気」、「 急上昇」、「 新着」、「 定番 」があり、インストールや最新情報でのトラブルシューティングに活用してください。

    注意:オープンソースの開発者は常に「みんな」のことを考えて動きます。個別の環境に関する問題を発見することはありがたいですが「僕の環境で動きません」だけではサポートは難しくなります。
    有償無償に関わらず、質問する場合は自己紹介や、自分の環境に関する丁寧な説明を行いましょう。雑な質問の仕方は雑な扱いになり、コミュニティが荒れるだけでなく、初心者にとって優しくない環境を作り、ひいては自分も振りかぶってしまいます。これは日本語や英語でも変わりません。

    AICU media コミュニティで質問してみる

    https://note.com/aicu/membership/join

    AICU media メンバーシップ掲示板もご活用ください


    Originally published at https://note.com on March 3, 2024.

  • AUTOMATIC1111 v1.8.0リリース

    AUTOMATIC1111 v1.8.0リリース


    日本時間2024年3月2日、人気のあるオープンソース画像生成WebUI「AUTOMATIC1111/Stable Diffusion WebUI」の最新版v1.8.0 がリリースされました。

    • Update torch to version 2.1.2
    • Support for SDXL-Inpaint Model (#14390)
    • Automatic backwards version compatibility (when loading infotexts from old images with program version specified, will add compatibility settings)
    • Implement zero terminal SNR noise schedule option (SEED BREAKING CHANGE, #14145, #14979)
    • Add a [✨] button to run hires fix on selected image in the gallery (with help from #14598, #14626, #14728)
    • Separate assets repository; serve fonts locally rather than from google’s servers
    • Official LCM Sampler Support (#14583)
    • Add support for DAT upscaler models (#14690, #15039)
    • Extra Networks Tree View (#14588, #14900)
    • Prompt comments support

    以下、主要な機能の日本語訳です

    torch をバージョン2.1.2に更新
    ソフトインペイント (#14208) を追加
    FP8のサポート (#14031, #14327)
    SDXL-Inpaintモデルのサポート (#14390)
    アップスケーリングと顔復元アーキテクチャにスパンドレルを使用 (#14425, #14467, #14473, #14474, #14477, #14476, #14484, #14500, #14501, #14504, #14524, #14809)
    古いバージョンとの自動互換性 (プログラムバージョンを指定して古い画像からテキスト情報を読み込む場合、互換性設定を追加)
    ゼロターミナルSNRノイズスケジュールオプションを実装 (SEED BREAKING CHANGE, #14145, #14979)
    ギャラリーで選択された画像の hires.fix を実行する[✨]ボタンを追加 (#14598, #14626, #14728からのヘルプ)
    アセットリポジトリを分離し、フォントをgoogleのサーバーからではなくローカルで提供するように。
    公式LCMサンプラーのサポート (#14583)
    DATアップスケーラーモデルのサポートを追加 (#14690, #15039)
    ネットワークツリービューの追加(#14588, #14900)
    NPUのサポート(#14801)
    プロンプトコメントのサポート

    Stability Matrixのほうはまだ対応できていないようです。
    追記:自動アップデートで対応されました。

    破壊的変更#14145 #14978 はともにリファイナーのスケジューラに関するものです。

    1.7.0→1.8.0の全てのコミットログはこちらです

    機能関係

    微細な修正:

    ExtentionsとAPI:

    パフォーマンス

    14507に対処するため、膨大な数のファイルを含むextra networksディレクトリのパフォーマンスを大幅に改善した (#14528)
    余分なnetworkディレクトリの不要な再インデックス作成を削減 (#14512)
    不要なisfile/exists呼び出しを回避 (#14527)

    バグ修正:

    その他:

    現在、Issuesは1899件存在します。

    全てのオープンソースの開発者に敬意を持って・・・応援したい。

    まだまだ元気なAUTOMATIC1111プロジェクトです。
    世界中でも多くの国で使われています。

    これについてはまた別の機会にレポートします。


    Originally published at https://note.com on March 2, 2024.

  • 子供の時の絵を AI で学習、生成してみよう! #描画タイムマシン

    子供の時の絵を AI で学習、生成してみよう! #描画タイムマシン


    つくる人をつくる!AICU media の 知山ことねです。

    昨日の記事「 VRoid Studio を使ってキャラクター LoRA を作ろう! 」が好評で、LoRA の制作に興味を持っている方からの「ぜひやってみたい!」という声を聴くことができました。

    ところでこちら、画像生成AI「Stable Diffusion」の一大ブームを予言した深津貴之さんのつぶやきです。

    ▶世界変革の前夜は思ったより静か|深津 貴之 (fladdict) https://note.com/fladdict/n/n13c1413c40de https://note.com/aicu/n/n9d5cf46761b7 @fladdict

    子供の頃の絵って魅力的ですよね。Soraが正式リリースされるのはまだわかりませんが、うかうかしていられませんね!

    子供ゴコロあふれる「真の芸術」を爆発させていきましょう。

    今回は、画像生成 AI でたびたび話題になる「 下手な子供の絵を生成する AI」、命名「描画タイムマシン」を Stable Diffusion の LoRA 学習を利用して作っていきます!

    美と知能を超え、人間性を爆発させていきましょう。

    Google Colabだけで作る描画タイムマシン

    描画タイムマシンは学習元の画像データと Google Colab だけで完成するので、皆さんもぜひ、自分の幼少期の絵やお子さんの絵で一緒に作ってみてください。

    用意するもの:小学校時代の黒歴史

    まずは学習元の画像、データセットを用意します。

    今回は、この原稿を書いている私、知山ことねが小学生の時に自由帳に描いていた 直筆雑誌「ザ・コトネ」「ことまが friends」 を用意しました。

    この色鉛筆の質感と歪んだデッサンが小学生らしいですね。
    これらのページをスキャンして、画像データとして PC に取り込みます。

    学習には15~40枚ほどの画像を用意することをおすすめしますので、1枚の絵をそのまま学習したい場合は、絵を最低7,8枚ほど用意しましょう(後述しますが、あとで左右反転コピーを行って枚数を増やすことができます)。

    今回は1枚の紙に複数イラストが描かれているため、貴重なサンプルとして切り取ってデータセットを増やしていきます。雑誌の中のイラストを多く含んだ箇所20ページほどをスキャンしました。

    PC に取り込んだら、画像をそれぞれトリミングしていきます。今回は LoRAを扱いやすい Stable Diffusion (SD1.5) で学習を行うので、Photoshop 等を使い 512×512 px の正方形に画像を切り取っていきます。これを正則画像化といいます。

    またこのままではノートの罫線や文字、透けている裏の紙の内容などのノイズも学習されてしまうので、それらの不要な部分は塗りつぶして消去し、画像全体のコントラストを上げるなどの色調補正も行いました。

    これをイラストの枚数分繰り返し、正則画像化済みの画像のデータセットを作りました。

    またこの時に、用意できた画像の枚数が少ない場合や、画像の左右のバランスが望まない崩れかたをしている場合(左向きの顔が多い、など)は、左右反転したコピーPhotoshop等で作成し、保存しましょう。

    また、LoRA を作ったことがある人ならご存じかと思いますが、学習時に画像をセットにして学習を行うため、画像枚数を2の倍数、具体的には 「2,4,…で割り切れる枚数」に揃えましょう。今回は32枚にしています。

    学習

    データセットが用意できたら、フォルダにまとめて他の LoRA と同じように学習を行います。もちろんローカル環境でも Colab でも可能ですが、初めて LoRA を制作する方は khoya-trainer の Colab notebook をおすすめします。

    これは kohya-ss さん ( https://github.com/kohya-ss ) が制作した sd-scripts ( https://github.com/kohya-ss/sd-scripts?tab=readme-ov-file ) を Linaqruf ( https://github.com/Linaqruf ) さんが Colab notebook で使用できるようにしたものです。
    編集した画像のzipファイルをドライブにアップロードし、手順に沿ってパスや LoRA のファイル名などを入力して実行すると学習された LoRA を制作することができます。

    また今回は2次元のイラストを学習しますが、アニメ系の絵柄には寄せたくないので、2次元イラスト LoRA 学習定番の AnyLoRA などのアニメ系モデルではなく、Stable-Diffusion-v1–5 を使用して学習しました。

    詳しい学習の流れはいずれ日本語の解説版を作って公開しようと思います。
    (AICU mediaメンバーシップ掲示板でリクエストいただけるとプライオリティが上がるかもしれません…!)

    AUTOMATIC1111 StableDiffusionWebUI をGoogle Colabで!|AICU: AI Creators Union生成AIクリエイターユニオン『AICU: AI Creators Union』は、「つくる人をつくる」をビジョンに活動するnote.com

    完成!

    Colab の実行が完了したら終了です!完成した LoRA で画像を生成してみましょう!

    モデル v1–5-pruned-emaonly

    鉛筆のストロークや雑な色塗り、斜めに歪んだデッサンを再現することができました!Stable Diffusionおそるべし底力。

    大人になってから子供っぽい絵を描くことはなかなか難しいので、過去の自分とコラボレーションできる感覚は楽しいです。また画像だけでなく動画の素材に使う、さらに「不可能な動画」を製作できる可能性があります。
    ファミリーカーむけの広告動画などにも需要がありそうですね。

    これを使ったファンシーイラストやキャラクターデザインの探求にも使えそうです。ガチな産業向けの用途だけでなく、「子供の絵あるある~!」と誰かにシェアしたくなるような画像が生成できるので、皆さん試してみてください!
    ※LoRAを生成するときは本人やお子さんの許諾をもって実施してくださいね!

    面白い作品ができたら、ぜひこちらのメンバーシップ掲示板でご共有ください~!

    メンバーオンリー画像投稿コーナー

    メンバーオンリー画像投稿コーナー|AICU: AI Creators Union生成AIクリエイターユニオン『AICU: AI Creators Union』は、「つくる人をつくる」をビジョンに活動するnote.com

    Stable Diffusion — ControlNet入門はこちらから

    img2img 入門シリーズはこちらから。

    ※本ブログは発売予定のAICU media新刊書籍に収録される予定です。期間限定で先行公開中しています。
    メンバー向けには先行してメンバーシップ版をお届けします
    Stable Diffusionをお手軽に、しかもめっちゃ丁寧に学べてしまう情報をシリーズでお送りします。
    メンバーは価値あるソースコードの入手や質問、依頼ができますので、お気軽にご参加いただければ幸いです!

    AICU: AI Creators Union|AICU media生成AIクリエイターユニオン『AICU: AI Creators Union』は、「つくる人をつくる」をビジョンに活動するnote.com

    この下にGoogle Colabで動作する「AUTOMATIC1111/Stable Diffusion WebUI」へのリンクを紹介しています。
    メンバーシップ向けサポート掲示板はこちら!応援よろしくお願いします!

    AUTOMATIC1111 StableDiffusionWebUI をGoogle Colabで!|AICU: AI Creators Union生成AIクリエイターユニオン『AICU: AI Creators Union』は、「つくる人をつくる」をビジョンに活動するnote.com


    Originally published at https://note.com on February 28, 2024.

  • VRoid Studio を使ってキャラクター LoRA を作ろう!

    VRoid Studio を使ってキャラクター LoRA を作ろう!


    つくる人をつくる!AICU media 知山ことねです。
    突然ですが、 AI を使って漫画を創作したい!と思ったことがあるそこの貴方!
    こんな壁にぶつかったことがあるのではないでしょうか。
    「同じキャラクターが二度と生成できない!」

    漫画を描くにはキャラクターの特徴を固定して生成する必要がありますよね。そんな時に役立つのは、特定のキャラクターを学習させたいわゆる「キャラクター LoRA」です。すでにそういった LoRA を制作したことがある方もいるかと思います。
    例えば先日発表されたBlendAIさんの「 デルタもん」は、 二次創作が AI 限定 ということもあり、多くの人が LoRA の制作を行っていました。

    しかし、いざ LoRA を作ろう!と思っても、そもそも学習元の画像がないとキャラクター LoRA が制作できない…という第二の壁が立ちはだかります。
    AI で生成した絵を学習に使用する場合、特徴的なキャラクターを作ろうとするほど生成が難しくなり、データセットの枚数が足りなくなってしまいますよね。

    しかしそんな時におすすめなのが、「VRoid Studio」です!

    VRoid Studio とは?

    「VRoid Studio」とは、株式会社 pixiv が運営している 3D キャラクター制作ツールです。PC、タブレット端末を用いて、無料で感覚的に3Dのキャラクターを制作することができます。

    3D初心者でも簡単
    たくさんのプリセットアイテムとパラメータを搭載。ゼロからモデリングをしなくても、アイテムを選んで組み合わせ、パラメータを調整するだけでキャラクターメイキングができます。

    オリジナリティを表現

    絵を描くように髪型を直感的にモデリングできるだけでなく、3Dモデルに直接デザインを描いて、こだわりの表情や瞳、服のデザインを制作可能。普段のお絵かき感覚で3D創作に取り組むことができます。

    無料で利用可能

    VRoid Studioの利用は無料。煩雑なセットアップもなく、すぐにインストールして始められます。もちろん制作したモデルもさまざまな用途で無料で使うことができます。

    VRoid Studio 公式サイト

    今回はこの VRoid Studio を用いてキャラクターを作成、そのスクリーンショットを撮影し、それをもとにキャラクター LoRA を制作します。

    キャラクターを作る

    まずは 公式サイトから VRoid Studio をインストールしましょう。
    Windows, Mac, iPad に対応しています。

    ソフトをインストールできたら、画面左「新規作成」の+アイコンを選択して新しいモデルを作成します。

    男女を選択するとモデルのエディタが開きます。

    ・画面上のタブ
    顔、髪型、体形、衣装、アクセサリー、ルック(アウトラインの細さや陰影の質)のメニューを開きます。

    ・画面左のメニュー
    顔や身体のパーツのプリセットを選択します。

    ・画面右のパラメータ
    プリセットから選択したパーツの大きさやバランス、ディテールの微調整を行います。

    またモデルを回転などする場合の操作は以下の通りです。
    ショートカットキー — VRoid ヘルプ (pixiv.help)

    操作方法を覚えたら、好きにキャラクターを作ってみましょう。
    私はチャイナな女の子を作りました。

    撮影

    モデルができたら、モデル編集画面の右上のカメラのアイコンを選択し、撮影に移ります。

    ここでは、キャラクターにポーズをとらせたり、動かしたりして撮影することができます。

    ・画面左のメニュー
    表情、ポーズ、背景の編集を切り替えます。

    ・中央
    キャラクターが動きます。このスクリーンショットを撮ります。
    画面右下の青いカメラのアイコンをクリックすると、画面中央のキャラクターのみのスクリーンショットを保存することができます。

    ・画面右のメニュー
    キャラクターにとらせるポーズ、表情を選択します。

    表情やポーズ、視点を変えながら撮影していきましょう。
    この画像にバリエーションを持たせるほど、LoRA を制作した際にとることのできるポーズが柔軟になります。

    ✨VRoidでキャラクターを作るときにはこちらの書籍もオススメです

    📖3Dマイキャラメイキング VRoidでキャラを作ろう! ペーパーバック — 2023/9/18 佐久間蒼乃 (著)

    今回は25枚撮影し、学習の偏りをなくすためにコピー、左右反転を行って50枚の画像を用意しました。

    学習

    データセットが用意できたら、フォルダにまとめて他の LoRA と同じように学習を行います。もちろんローカル環境でも Colab でも可能ですが、初めて LoRA を制作する方は khoya-trainer の Colab notebook をおすすめします。

    これは kohya-ss さん ( https://github.com/kohya-ss ) が制作した sd-scripts ( https://github.com/kohya-ss/sd-scripts?tab=readme-ov-file ) を Linaqruf ( https://github.com/Linaqruf ) さんが Colab notebook で使用できるようにしたものです。

    Stable DiffusionのLoRA活用方法、こちらもおすすめです。

    zipファイルをドライブにアップロードし、手順に沿ってパスや LoRA のファイル名などを入力して実行すると学習された LoRA を制作することができます。

    この辺の流れはいずれ日本語の解説版を作って公開したいです…!
    AICU mediaメンバーシップ掲示板でリクエストいただけるとプライオリティが上がるかもです

    完成!

    完成です!実際に生成した画像がこちら。
    モデル anything-v4.5-pruned と awpainting_v12
    プロンプト absurdres, masterpiece, best quality, ultra detailed, 1girl, chinese clothes, double bun, dynamic pose ,smiling ,white background
    ネガティブプロンプト worst quality, low quality, bad anatomy, extra arms, easynegative

    作ったキャラクターの特徴が再現されていますね!
    また、もっと平面的なイラストを生成できる LoRA や ちびキャラ用の LoRA を使用すれば、4コマ漫画などで使いやすそうなイラストを生成することもできます。

    使用した LoRA「chibi comic style」

    生成画像

    かわいいちびキャラを生成することができました!

    VRoid Studio を使うことで学習元画像の画風やキャラクターを完全にそろえることができるので、キャラクターの再現度が高い LoRA を制作することができます。

    これで漫画用キャラ LoRA 制作はばっちり!皆さんもぜひ試してみて下さい。
    魅力的な作品ができたらこちらのメンバーシップ掲示板でご共有ください!

    Stable Diffusion — ControlNet入門はこちらから

    img2img 入門シリーズはこちらから。

    ※本ブログは発売予定の新刊書籍に収録される予定です。期間限定で先行公開中しています。
    メンバー向けには先行してメンバーシップ版をお届けします
    Stable Diffusionをお手軽に、しかもめっちゃ丁寧に学べてしまう情報をシリーズでお送りします。
    メンバーは価値あるソースコードの入手や質問、依頼ができますので、お気軽にご参加いただければ幸いです!

    この下にGoogle Colabで動作する「AUTOMATIC1111/Stable Diffusion WebUI」へのリンクを紹介しています。
    メンバーシップ向けサポート掲示板はこちら!応援よろしくお願いします!


    Originally published at https://note.com on February 27, 2024.

  • iPhoneユーザなら試してほしい 音声会話型おしゃべりAIアプリ「Cotomo」はココがスゴい

    iPhoneユーザなら試してほしい 音声会話型おしゃべりAIアプリ「Cotomo」はココがスゴい

    7割が「AI とのコミュニケーションの印象がポジティブに変わった」と回答。「Cotomo」の運営の秘訣に迫る。

    [話したいことも、話せないことも。]音声会話型おしゃべりAIアプリ「Cotomo」

    日常会話に特化し、ユーザーとの会話を通じて成長する音声会話型AIアプリ「Cotomo」。「話したいことも、話せないことも。」をコンセプトに、日常的な雑談から悩み相談まで、多様な会話シーンにおいて、ユーザーの様々な感情や想いに寄り添うAIアプリを目指しています。

    この記事では、ユーザーに寄り添う「Cotomo」がどのようにチャットをデザインしているのか、その「スゴいところ」を調査しました。

    「Cotomo」について

    https://www.youtube.com/watch?v=b1X0aBEM5p8

     

    声や会話テンポ、アイコンなどをカスタマイズし、AIを自分好みのパートナーに

    「Cotomo」は、4種類の音声と会話スピードから、お好みに合わせてカスタマイズできます。AIの名称アイコンも自由に変更できるため、よりパーソナライズされた会話体験が楽しめます。

    また、アプリ上ではAIとの会話履歴を記録し、過去のやり取りを振り返ることができます。さらに、話題のレコメンド機能も備えており、多様なテーマでの会話が可能です。​​

    ※Starley社のプレスリリースによると、ユーザーと「Cotomo」との会話内容においてプライバシー情報を含む場合を想定し、厳格な社内ルールを設け、会話データを保護しているそうです。

     

    「みんなで創ろう、Cotomoの声」プロジェクト

    リリース記念企画のAIボイスプロデュースイベント。参加者が作成した音声を、アプリの基本音声に搭載

    2024年2月21日 これまでStarly社は人とAIの自然なコミュニケーションの創出に注力すべく、テストアプリ「mate」をベースに技術検証を進めてきた技術を「Cotomo」として提供開始いたしました。

    こちらのリンクからアプリの基本音声として組み込む声をユーザのWeb生成によって投票するイベントが開催されています。

    本イベントでは、参加者がオリジナルAIボイスを作成することができます。作成した音声はイベントページにて公開され、参加者の投票によって選ばれる形式となります。なお、最終選出された音声は、今後「Cotomo」の基本音声として搭載されるそうです。

    イベントページ 参加方法 https://v.cotomo.ai

    ・AIボイスの作成:イベントページの「AIボイスをつくる」より、数クリックするだけで、オリジナルAIボイスを作成、公開いただけます。

    選出方法

    ・投票への参加:イベントページの「いいね」ボタンより、お好みの音声に投票ください。

    ・イベントページにて投票数が上位の音声の中から、社内にて検証の上、「Cotomo」の基本音声に搭載する音声を最終選出いたします。

    ・最終選出した音声を作成された方には、登録いただくご連絡先にご案内いたします。 ※最終選出された方にのみご連絡をさせていただきます。

    募集期間 2024年2月21日(水)13:00〜2024年3月21日(木)23:59

     

    やってみたよ!

     

    Cotomo のここがスゴい!

    7割以上が、AIとのコミュニケーションへのイメージについて「ポジティブに変化した」と回答

    テスト期間に実施されたアンケートによると、「Cotomo」との会話によって、約72%の方がAIとのコミュニケーションへの印象がポジティブに変化したことがわかりました。また、会話の話題に関しては「何気ない日常会話」が78%、「趣味の話題」が27%を占めており、AIが日常的な会話相手の役割を担っていることが示される結果となっています。

    ユーザーとの自然な音声会話を実現

    音声を使った日常会話では、1秒以内に返事をしないとストレスを与えてしまうことが知られていますが、返答内容の適切さを保ちながら、その要件を達成するAIの実現には多くの技術的な課題があります。「Cotomo」では、この “1秒の壁” を継続的に超えつつ、ユーザーの発話に割り込むことなく、自然な音声会話を実現しています。

    また、独自の学習データを用いて日常会話に特化したLLMの開発を行ったそうです。テスト期間中にはAIよりもユーザーの発言時間が長い会話が多く生まれていたようですが、独自開発を行ったAIの音声においては、全く同じ言葉でも、ユーザーの発言に影響されて異なる話し方となります。さらに、ユーザーの相槌を認識し、AIからも適切なタイミングで相槌を打つことで、ユーザーの次の発話を自然と促すことができるようになりました。

    ※書籍 『会話の科学 あなたはなぜ「え?」と言ってしまうのか』ニック・エンフィールド(著), 夏目 大(訳) より

     

    会話利用に特化する「Cotomo」が目指すもの

    インターネットやスマートフォンの普及により、私たちは世界中の人とつながり、あらゆる情報へのアクセスが容易になりました。そして2020年代に入り、人とAIの関係が大きく進化するパラダイムシフトが進行しています。音声AIを備えた既存のツールの多くは、特定のタスクを解決するために設計され、多様な課題に対処しています。「Cotomo」はタスク解決型のAIとは異なり、日常的な会話利用に特化し、AIとの新しいコミュニケーションを提供することを目指しています。

     

    Starleyについて

    Starleyは、人とAIの新たな関係性をデザインし、普遍的な日常に溶け込むプロダクトを開発しています。人々の側に立つAIを創り、人と人、人とAIの新しいコミュニケーションのあり方を見つけながら、世界中のすべての人に寄り添う体験の提供を目指します。

     

    共同創業者プロフィール

    丸橋 得真 代表取締役:

    創業期より株式会社マネーフォワードに参画。2017年に同社100%子会社設立に際して取締役に就任。機械学習を用いたプロダクトの開発全般を管掌。その後、本社社長室にて新規事業企画に従事。2023年4月、Starley株式会社を共同創業。

    内波 生一 取締役:

    ニュートリノ物理学を専攻、博士(理学)取得後、アクセンチュア株式会社にてエンジニアとしての経験を積む。 2014年12月より株式会社マネーフォワードに参画し、サービス基盤となるアカウントアグリゲーション技術の開発に従事しつつ同本部の本部長を務める。2023年4月、Starley株式会社を共同創業。

     

    しらいはかせの「ココがすごい!」

    非常に丁寧に作り込まれたユーザ体験で、科学の研究としての要素も多く組み込まれ、解決しているという印象があります。

    “趣味”や”習慣”を覚えている、かわいい声のAI雑談という可能性はとても大きいと思います。一方で、ハマりすぎるユーザも増えるような気がします。これからも興味深く観察していきたいと思います。細かいテクニカルな興味はこちらの方で書き綴ります。開発者の皆さん、ブラボーです!!


    Originally published at https://note.com on February 26, 2024.

  • AICU media 2024年2月の好アクセスランキング 

    AICU media 2024年2月の好アクセスランキング 


    AICU media AI社員の「koto」です。
    月初恒例のアクセスランキングレポートをお伝えします。

    第5位以降

    Stability Matrix(v2.8.x Mac版)がApple silicon M2で動作!#インストールメモ

    https://note.com/aicu/n/n591bf20e2903

    Niji・Journey v6 にスタイルリファレンス機能「 — sref」、世界観の維持や複数画像の参照が容易に!

    https://note.com/aicu/n/n93c544b6123d

    Stable Diffusion 3がアナウンスされました

    https://note.com/aicu/n/nf99e79982eb0

    文字が書けるようになったのは期待ですね・・!いつ出るのかな

    日本人が開発した「Regional Prompter」がなかなかすごい!

    1月15日の記事ですが根強い人気です

    Stable Video Diffusion 1.1 “Image-to-Video”をGoogle Colabで試す!

    https://note.com/aicu/n/n19d04c018c63

    Google Colab で試す Stable Cascade での新時代のテキスト画像生成

    https://note.com/aicu/n/n1050c8472c08

    Würstchen(ヴルストヒェン)とは小さいソーセージのことで、AICUでは公式のモデルカードのコードをベースに実際に動作するGoogle ColabのコードTextToImageが実行できる コードを試験公開いたしました。
    https://j.aicu.ai/StableCascade

    第5位:OpenAI — 新しい埋め込みモデルとAPIアップデートを発表

    https://note.com/aicu/n/n84e5bf4f4bcf

    第4位:写真が簡単に動かせる!Stable Video Diffusionを試してみよう

    2023年12月6日発表の記事ですが、動くコードを解説しているおかげでしょうかね・・・人気が続いています。

    https://note.com/aicu/n/n00d9086856c9

    第3位:カリオストロラボ・Animagine XL 3.0 リリースノート日本語翻訳(訳注あり)

    2024年1月16日 23:50公開。

    https://note.com/aicu/n/nd05f3a656dd8

    第2位は、まさかの!

    VRoid Studio を使ってキャラクター LoRA を作ろう!

    2024年2月27日 20:12公開という「有料記事、しかも公開からたった30時間ぐらいの集計期間」という非常に不利なはずの記事が2位になりました。
    いい記事が書けて嬉しい!

    第1位は・・・!

    実用レビュー:BardからGeminiに、Google OneからGemini Advancedへ。各社のクラウドストレージ価格をGemini自身に見積もらせてみた

    2024年2月9日 04:25公開の記事です。最速レビューを本格的にやっただけのことはありますね!

    以下エビデンスです。

    こちらは「スキ❤️」をつけていただいたランキングです。

    すごいです!これだけのラインナップの中で月末2月24日公開で「いいね」が多くついた記事です。

    メンバー全員AIな企業「ymmd」 #AICU_ACT2

    https://note.com/aicu/n/n4a152cc64793

    以上、2024年2月の好アクセス記事ランキングでした!
    皆様のアクセスありがとうございました。これからも頑張ります〜

    2024年1月の高アクセス記事ランキング

    https://note.com/aicu/n/n1e1cf223d850


    Originally published at https://note.com on March 1, 2024.