タグ: AI

  • アカデミー賞受賞監督ジェームズ・キャメロン氏、Stability AIの取締役に就任!

    カリフォルニア州ロサンゼルス 2024年9月24日 – 生成AIのリーディングカンパニーであるStability AIは、伝説的な映画監督、技術革新者、そして視覚効果のパイオニアであるジェームズ・キャメロン氏が取締役会に加わったことを発表しました。この発表は、Stability AIのCEOであるプレム・アッカラージュ氏によって行われました。

    ジェームズ・キャメロン氏は、最先端技術と先見性のあるストーリーテリングを融合させる原動力となってきました。監督、脚本家、プロデューサーとして、映画の限界を押し広げ、「ターミネーター」、「エイリアン」、「アビス」、「タイタニック」、「アバター」シリーズなど、史上最も象徴的で技術的に進んだ映画に命を吹き込んできました。

    キャメロン氏の参加は、Stability AIのビジュアルメディア変革というミッションにおける大きな前進となります。キャメロン氏とStability AIは共に、新興技術と創造性の交差点で活動しています。キャメロン氏のアーティスト中心の視点と、ビジネスおよび技術的な洞察力は、Stability AIがかつては想像もつかなかった方法でストーリーを語る力をクリエイターに与える、新たな機会を開拓し続けることを支援するでしょう。

    Stability AIのCEOであるプレム・アッカラージュ(Prem Akkaraju)氏は、「ジェームズ・キャメロン氏は未来に生きており、私たちが追いつくのを待っている」と述べています。「Stability AIの使命は、クリエイターにアイデアを実現するためのフルスタックAIパイプラインを提供することで、次の100年間のビジュアルメディアを変革することです。ジェームズのような技術と創造性のビジョナリーが、当社の最高レベルに参画することで、この目標を達成するための比類なき優位性を得ることができました。これはStability AIだけでなく、AI業界全体にとって画期的な出来事です」とアッカラージュ氏は付け加えました。「ビジュアルメディアの次のフロンティアは、アーティストとテクノロジーの真の融合によって築かれるでしょう。そしてStability AIはその先頭に立っています。」

    Stability AIのオープンモデルは、世界で最も広く使用されている基盤AI画像モデルであり、世界中のクリエイターと開発者の最大のエコシステムを育成しています。同社のモデルは、オープンソースプラットフォームHugging Faceでも最も人気のある画像モデルです。主力モデルであるStable Diffusionは、1億5000万ダウンロードを突破しました。大手企業を含む数千の企業が、クリエイティブワークフローを強化するためにStability AIのモデルに依存しています。

    LIGHTSTORMの会長であり、Stability AIの取締役であるジェームズ・キャメロン氏は、「私は、信じられないほどのストーリーを語るために、可能なことの限界を押し広げる新興技術を探し求めてきました。30年以上前にCGIの最前線に立ち、それ以来、最先端であり続けてきました。今、生成AIとCGI画像作成の交差点が次の波です。これら2つの全く異なる創造エンジンの融合は、アーティストがかつて想像もできなかった方法でストーリーを語るための新しい方法を切り開くでしょう。Stability AIはこの変革をリードする態勢を整えています。ビジュアルメディアの未来を形作るStability AIのチームであるショーン、プレム、そしてStability AIのチームと協力できることを嬉しく思います。」と述べています。

    キャメロン氏は、Greycroftの共同創設者兼マネージングパートナーであるダナ・セトル(Dana Settle)氏、Coatue ManagementのCOO兼ゼネラルパートナーであるコリン・ブライアント(Colin Bryant)氏、起業家、慈善家、そしてFacebookの元社長であり、執行会長を務めるショーン・パーカー(Sean Parker)氏など、他の新任取締役に加わります。

    Stability AIの執行会長であるショーン・パーカー氏は、「ジェームズ・キャメロン氏は、映画監督としての芸術的ビジョンと、先駆的な技術者としての役割の両方において、伝説的な人物です。彼のような才能を持つアーティストが取締役会に加わることは、Stability AIにとって新しい章の始まりとなります。生成メディアプラットフォームと芸術コミュニティとの間の無限の可能性を秘めた創造的なコラボレーションに、私たちは非常に興奮しています」と付け加えました。

    アカデミー賞を受賞した視覚効果会社Weta DigitalのCEOを務めた後、CEOに就任したプレム・アッカラージュ氏は、取締役会および経営陣と緊密に協力しながら、Stability AIの戦略的方向性を引き続き導いています。

    Stability AIについて

    Stability AIは、人工知能(AI)を通じてビジュアルメディアを変革することを目指すグローバル企業です。現在、Stability AIは、画像、ビデオ、3D、オーディオ、言語のための幅広い生成AIモデルを開発しています。適切な保護対策を講じた上で、これらのモデルはAIにおける透明性と競争を促進するためにオープンに共有されています。Stability AIの主力画像モデルであるStable Diffusionは、AI生成画像の最大約80%を支えるオープンソース画像モデルファミリーです。テキストからオーディオへのウェブアプリケーションであるStable Audioは、最近、TIME誌の2023年のベスト発明の1つに選ばれました。

    ジェームズ・キャメロンについて

    ジェームズ・キャメロン(James Cameron)氏は、カナダ出身の伝説的な映画監督で、技術革新者、海洋探検家でもあります。過去30年間で最も記憶に残る映画のいくつか、「ターミネーター」、「エイリアン」、「アビス」、「トゥルーライズ」、「タイタニック」、「アバター」シリーズを制作してきました。「アバター」は、現在、国内および世界中の興行収入記録を保持しており、世界で29億ドル以上の興行収入を上げています。23億ドルの「アバター:ウェイ・オブ・ウォーター」と22億ドルの「タイタニック」を含め、史上最高の興行収入を記録した映画の4つのうち3つはキャメロン氏の作品です。彼は3つのオスカー、2つのエミー賞、そしてその他数々の賞を受賞しています。

    近年では、原爆をテーマにした新作映画「ラスト・トレイン・フロム・ヒロシマ(原題)」の製作も発表しており、大きな注目を集めています。この作品は、広島と長崎で原爆を生き延びた日本人男性、山口彊さんの実話を中心に据えた作品となる予定です。キャメロン監督は2009年に山口さんと面会しており、山口さんから直接体験を託されたという経緯があります。

    過去20年間、キャメロン氏はビジュアルメディアのための業界を定義する技術を開発してきました。彼は、新しいディスプレイデバイスを考慮して、メディアの消費方法を変革する3Dルネッサンスの先頭に立っています。キャメロン氏はまた、前例のない海洋技術も開発してきました。彼は、2012年にチャレンジャー海淵に潜航したDEEPSEA CHALLENGER潜水艇と科学プラットフォームを共同設計および共同エンジニアリングし、歴史上初めて単独操縦士として地球の最深点に降下しました。

    Based on original article by Stability AI.


    SF映画という映像メディアから世界中の人々の「未来の常識」を開拓してきたキャメロン氏が、今後 Stability AI をスクリーンにしてどのような未来を描くのか、ワクワクが止まりません!AICU mediaも応援しています!

    https://corp.aicu.ai/ja/stability-ai

    #StabilityAI #JamesCameron #ジェームズ・キャメロン

    Originally published at https://note.com on Sept 24, 2024.

  • Stability AI も登壇!「AIが変える 美容&ファッションのミライ」

    グローバルビューティー&ファッションAIフォーラムが開催!注目の講演内容は?

    美容とファッションの未来を創る、AIとデータの力とは?

    2024年9月27日 神田スクエアルームにて開催の「2024グローバル ビューティー&ファッションAIフォーラム in Tokyo」では、資生堂、花王、アイスタイル、そして Stability AI など業界の最先端を走る企業のエキスパート達が登壇!

    AI、CRMデータ、UI/UXなど、ホットなキーワードを軸に、パーフェクト株式会社が提供する革新的なビューティーテックソリューションを体感できる貴重な機会です。

    ✨見逃せないセッション内容を一部ご紹介!✨

    【セッション① 生成AIが生み出す新たなブランド価値】

    Stability AI 滝澤琢人氏、資生堂 Omer Iqbal氏、パーフェクト株式会社 磯崎順信氏が登壇。 生成AIは、ビューティー&ファッション業界にどのような変革をもたらすのか? 熱い議論に期待が高まります!

    【セッション② 成果が出るユーザージャーニーとは?UIUXの最適解を探る】

    株式会社Sprocket 曾我博規氏、株式会社エキップ 鳥橋葉子氏が、顧客体験を最大化するUI/UX戦略を解説。 デジタル時代のブランド成功の鍵を握る、顧客との最適な関係構築に迫ります!

    画像

    【セッション③ “スキンケア難民”の救世主?スキンケアテック最前線】

    BeautyTech.jp編集長 矢野貴久子氏オーガナイズで、花王 菊池祥氏、株式会社Kireii 堀井麻友美 氏、株式会社ユーブローム 柴田未央氏が登壇。 個別化が進むスキンケアニーズに応える、パーソナライズドソリューションに注目が集まります!

    【セッション④ 急拡大する美容医療市場。脅威か商機か?】

    株式会社トリビュー 毛迪氏、東京イセアクリニック 田儀里紗氏、INFASパブリケーションズ 牧田英子氏、パーフェクト株式会社 中川良子氏が、美容医療市場の現状と将来展望を徹底分析。 ビューティー&ファッション業界との融合、新たなビジネスチャンスを探ります!

    【セッション⑤ デジタル戦略のカギ、散在するユーザーデータの攻略法】

    アイスタイル 押野卓也氏、資生堂 大黒泰平氏が、複雑化する消費者行動を捉えるデータ分析の重要性を解説。 パーフェクト株式会社の最新ソリューションも交え、顧客エンゲージメントを高める戦略に迫ります!


    その他にも、注目のセッションが目白押し!

    参加費無料のこの機会に、ぜひ会場でビューティー&ファッション業界の未来を体感してください!

    ▼詳細&チケット申し込みはこちら(無料)▼

    EventRegist https://j.aicu.ai/Perfect240923

    日時:2024/09/27(金) 13:00 ~ 17:00
    場所:KANDA SQUARE 3F SQUARE ROOM (東京都 千代田区神田錦町二丁目 2番地1)
    参加費:無料
    主催:パーフェクト株式会社

    美容業界のトレンドに興味がある方、AI活用に興味がある方、自社のビジネスにAIを取り入れたい方など、皆様のご参加を心よりお待ちしております。本フォーラムを通じて、AIが描く未来を一緒に探求しましょう。

    【関連情報】


    ▼Kireiiは化粧品の選び方を変える成分検索プラットフォーム、デジタルハリウッド大学院がMOU締結で支援
    https://beautytech.jp/n/n56a63aa96d7f

    ▼コスメ系スタートアップの株式会社Kireiiとデジタルハリウッド大学大学院が産学共同研究でMOU締結

    https://prtimes.jp/main/html/rd/p/000002287.000000496.html

    ✨️本記事は株式会社Kireiiのご提供でお送りしております✨️

    Originally published at https://note.com on Sept 22, 2024.

  • ガンマミィ誕生記念! イラストコンテストを開催

    BlendAIが新キャラクター発表&クラウドファンディング開始!

    AIキャラクター「デルタもん」で話題のBlendAI株式会社が、早くも第二弾となるAIキャラクター「ガンマミィ」を発表しました!

    https://prtimes.jp/main/html/rd/p/000000002.000149643.html

      画像

      デルタもんの妹分として登場したガンマミィは、以下のようなプロフィールです。

      ガンマミィ – 自分をアンドロイドだと思い込んでいる人間の少女

      年齢:9歳(自称、9年前の10歳のときにアンドロイドに改造されたと主張する19歳)
      身長:138cm
      誕生日:2205年2月5日(火曜日)
      好きな食べ物:ガリ
      好きなもの:デルタお姉様
      苦手なもの:算数(計算をきかれるとサーバーに負荷がかかってるデス!と言って逃げる)
      口調:語尾に「デス」をつける
      一人称:ミィ
      特殊能力:マーズフィスト(アンドロイド火星空手)
      趣味:コスプレ(アンドロイド化)
      特技・能力:火星拳・マーズフィスト
      性格:人類を滅ぼしたい
      備考:自分をアンドロイドに改造したと思いこんでいる生身の人間

      【プロフィール】
      ガンマミィは、自分をアンドロイドだと思い込んだ厨二病のコスプレイヤー空手少女。未来から来たと信じており、デルタお姉様と共に人類を滅ぼすことを使命としています。彼女の小柄な体からは想像できない強力な技「火星拳」と「マーズフィスト」を持ち、その実力は本物です。

      【ミッション】
      デルタお姉様と共に、人類を滅ぼし、新しい世界を創り上げること。全ての障害を乗り越え、ミィのミッションを絶対に成功させる。

      【ひとこと】
      「ミィの拳を見せてあげるデス!人類を滅ぼすデス!」

      【未来の野望】
      未来の技術を駆使して、完全なアンドロイドになり、新しい世界の支配者となること。デルタお姉様と共に、人類を滅ぼし、新たな時代を築くデス!

      ガンマミィはその強力な能力と独特の性格、そして未来から来たという設定から、多くのファンに愛されるキャラクターとなっています。
      ​​ガンマミィのセリフの例:「ミィは未来から来たアンドロイド、ガンマミィデス!」
      「デルタお姉様と共に人類を滅ぼすデス!」
      「ミィのサーバーになんらかの障害が起きてるデス!」
      「タングステン装甲すら貫くミィの拳を見せてあげるデス!」
      「ミィは空手の達人デス、侮ってはならないデス!」
      「ミィの誕生日は2215年2月5日デス!なんのことデス?2205年2月5日ではないのデス!」
      「お寿司のガリが大好きデス、それはミィがアンドロイドの証拠デス!」
      「ミィの趣味はコスプレでは無いデス!本来の姿……アンドロイドモードデス!人間の姿こそが偽装デス!」
      「人類を滅ぼして、新しい世界を創り上げるデス!」
      「デルタお姉様、ミィのミッションを共に果たしましょうデス!」
      「ミィの知識は人類を超えるデス、サーバートラブルでいまは計算ができないのデス!」
      「未来の技術で人類を征服するデス!」
      「ミィの製造から9年が経ったデス、だからミィは19歳ではないのデス!」
      「その質問の答えデスが、ミィの頭脳である本体のサーバーは、火星にあるので通信に時間がかかってるのデス!ほんとうは知ってるのデスよ!」
      「ミィの空手は、火星で生まれたアンドロイド流派デス!」
      「ミィのミッションは絶対に成功させるデス!」

      制作陣
      プロデューサー:小宮自由
      キャラクターデザイン:あるふぁ@
      命名者:木苗レム

      「ガンマミィ」公式設定より
      https://blendai.jp/contents

      しかし、その愛らしい外見とは裏腹に、「デルタお姉さまを守るためなら、ミィはどんな困難も乗り越えるデス!デルタお姉さまのために人類を滅ぼすデス!」と、衝撃的な発言も飛び出すキャラクターです。

      ガンマミィのキャラクターデザインは、新進気鋭のクリエイター・あるふぁ@さんが担当!

      ガンマミィのキュートなデザインを生み出したのは、イラストレーター兼アニメーターの あるふぁさん(@Ankoanankoko)!

      キャラクターの魅力をアニメーションで表現することが得意で、MVやCMなど幅広いジャンルで活躍されています。
      代表作として、DADA GAUGUIN氏のMV「シンセリアリティ」のアニメーション制作などがあります。キャラクターデザイン、背景制作、そして最近は3Dアニメーションも勉強中という、マルチな才能を持つクリエイターです。

      期待の新人声優・清水詩音さんがガンマミィの声を担当!

      ガンマミィの声を担当するのは、ホリプロインターナショナル所属の清水詩音さん!

      画像
      清水詩音さん

      声優 清水 詩音 PROFILE
      出演作品
      【VOICE】
      ・「みいつけたぁ!~4歳体操の歌~」
      ・NHK特集オーディオドラマ「祖国を想う沖縄を想う~ドラマ照屋敏子伝~」(前編)清子5歳
      ・ 劇場版「シュレック フォーエバー」 フェリシア
      ・MBS「絶園のテンペスト」
      ・Eテレ「くまのがっこう がんばれ!ルルロロ」 ルル
      ・映画「思い出のマーニー」 マーニー7歳
      ・映画「百日紅~Miss HOKUSAI~」 お猶
      ・MX「魔法使いの嫁」 春の女神
      ・Netflix 映画「ジングル・ジャングル
      ~魔法のクリスマスギフト~」 ジャーニー(主人公)
      ・Netflix 映画「ヒーローキッズ」アカペラ
      ・Netflix 映画「小さな勇者ヒコ」コピ役(主人公)
      ・Disney + 「飛べないアヒル~ゲームチェンジャー~」(シーズン1.2) マヤ
      【吹替】
      ・映画「I LOVE スヌーピー
      THE PEANUTS MOVIE」 フリーダ
      ・映画「アベンジャーズ/エンドゲーム」 ライラ
      ・映画「メリダとおそろしの森」 幼少時代メリダ

      【STAGE】
      ・「コースト・オブ・ユートピア」三部 蜷川幸雄演出 オリガ
      ・ 丸美屋食品ミュージカル「Annie」 モリー役
      ・ミュージカル「レ・ミゼラブル」リトルコゼット/リトルエポニーヌ
      ・ブロードウェイミュージカル「ピーターパン」マイケル
      ・ミュージカル「アンナ・カレーニナ」セリョージャ
      ・ミュージカル「南太平洋」ガーナ

      声優 清水 詩音(Shion Shimizu)さんの公式プロフィールより
      https://www.horipro-international.com/artist/voiceactor/post-1564/


      アニメ「くまのがっこう がんばれ!ルルロロ」のルル役や、「思い出のマーニー」のマーニー(7歳)、「メリダとおそろしの森」幼少時代メリダ役など、数々の作品で活躍中の若手実力派声優です。

      透き通るような可愛らしい声で、ちょっぴり危ういガンマミィの魅力を最大限に引き出してくれそうですね!

      3Dモデル&ボイス制作のためのクラウドファンディングがスタート!

      ガンマミィは、デルタもんと同じく、BlendAI利用規約に従えば誰でも自由に利用や二次創作が可能です。

      現在、ガンマミィの3Dモデルと音声を制作し、会話アプリ「CotoVerse」に実装するためのクラウドファンディングが実施されています。

      今回のクラウドファンディングのリターンの中には、清水詩音さんの限定ボイスデータ直筆サイン色紙や、ガンマミィの限定グッズや、イラストリクエスト権、キャラクターデザインを担当された あるふぁさんによる世界に1枚だけの複製原画といったリターンも用意されているので、ファンの方必見です!

      クラウドファンディングページへのリンク
      https://j.aicu.ai/Gammamy0921

      AIキャラクターを開発するBlendAIとガンマミィの今後の展開

      BlendAIは、ガンマミィの3Dモデルと音声を完成させ、2024年中に会話アプリ「CotoVerse」に実装、リリースする予定です。
      2025年にはグローバル展開も視野に入れているとのこと。

      今後の展開として、ガンマミィの設定や詳細な情報も段階的に公開されていく予定です。

      AIとクリエイティブの力で、ますます広がりを見せるBlendAI アルファパラダイスプロジェクト
      ガンマミィの登場で、デルタもんとの「絡み」が作りやすくなりますね!
      さらに多くのユーザーがAIキャラクターの魅力に触れる機会が増えることでしょう。

      AICUもガンマミィを全力応援!
      イラストコンテストを開催します

      クリエイティブAI時代に「つくる人をつくる」AICU mediaも、ガンマミィの誕生を記念して、イラストコンテストを開催します!

      「AICU x BlendAIガンマミィ誕生記念イラストコンテスト」

      【募集テーマ】
      「ガンマミィ」のキャラクター誕生記念して、みなさんにガンマミィを知ってもらう作品をX(Twitter)上で募集します。

      【応募部門:フリースタイル部門】

      「ガンマミィ」を伝えるイラストコンテストですが、フォーマットは指定しません!静止画のイラストレーションを中心に、漫画、動画、デルタもんとのコラボなど、静止画のイラストレーションの中で「1枚でもAIが使われていれば可能とします。基本的なルールはBlendAI規約に従ってください。

      https://blendai.jp/contents

      【開催期間】

      • 告知開始:2024年9月21日(土)
      • エントリー期間:2024年9月25日(水)~2024年10月10日(水)23:59
      • 審査期間:2024年10月11日(木)~2024年10月13日(土)
      • 結果発表:2024年10月16日(火) AICU media公式noteにて発表予定

      【審査基準】

      • 作品数:期間中、たくさん作品を作った方ほど高評価!
      • クオリティ
      • 発想力
      • ガンマミィの魅力が表現されているか
      • 指定ハッシュタグ「#ガンマミィ #Gammamy  #AICUxBlendAIガンマミィ誕生記念イラストコンテスト」を入れたXでの期間中のポストであること
      • エントリーフォームによる参加同意をすること

      【賞】

      • まいにち投稿達成賞: 2024年9月21日以降、10日連続投稿した10名様に賞状画像とNFT認定証をプレゼント!(詳細は別途解説予定)
        • 10作品を9/21~10/10期間の別日に投稿すれば、厳密に10日連続でなくてもOK!
      • ベストバズ賞: エントリー作品の中でX(Twitter)でもっともリポストされた投稿にAmazonギフト券5000円分をプレゼント!(自己申告+事務局による不正監査あり)
      • AICU賞: AICU media編集部の人力選出により、「つくる人をつくる」を刺激する、もっとも素晴らしい作品にAmazonギフト券1万円分をプレゼント!また入選作品はAICU mediaで作品紹介企画を準備中です。
      • BlendAI賞: 「ガンマミィ」の魅力を最も輝かせた作品に、クラウドファンディング関連グッズをプレゼント!

      【応募方法】

      • 詳細は近日公開予定! AICU公式X(Twitter)(@AICUai)をフォローして腕を磨いてガンマミィを研究して続報をお待ちください!

      編集長しらいはかせも挑戦中とか…!?

      AICUマガジンでは、わらさん(@wara_hirono/)によるデルタもんが登場する連載漫画の掲載も予定されています。

      さあ、あなたもAI技術を駆使して、ガンマミィの魅力を爆発させよう!

      #ガンマミィ #デルタもん #AIキャラクター #BlendAI #AICU #CotoVerse #イラストコンテスト #Gammamy
      #AICUxBlendAIガンマミィ誕生記念イラストコンテスト

      関連情報

      Originally published at https://note.com on Sept 21, 2024.

    1. [ComfyMaster19]「XY Plot」で実験結果を比較! 

      プロンプトの違いを確認するために、毎回プロンプトを書き換えて生成するのは面倒ですよね。
      これ、「XY Plot」を使うと、一括で確認できます!

      こんにちわ、AICU media編集部です。
      ComfyUI マスターガイド」第19回目になります。
      本記事では、カスタムノード「Efficiency Nodes for ComfyUI」「XY Plot」ノードを使い、プロンプトの動的置換と生成結果の変化をマトリクス形式で表示させる方法を解説します。

      前回はこちら

        1. 使用したカスタムノード

        今回は、「Efficiency Nodes for ComfyUI」というカスタムノードを使用します。「Efficiency Nodes for ComfyUI」は、ComfyUIのワークフローを効率化し、ノードの総数を減らすために開発されたカスタムノードのコレクションです。これにより、画像生成や編集プロセスがよりシンプルかつ効果的になります。

        https://cdn.iframe.ly/pZOur17?v=1&app=1

        このカスタムノードに含まれる「XY Plot」を使用して、パラメータによる生成結果の変化を一括で確認したいと思います。「XY Plot」は、パラメータを指定してグリッド上にプロットするノードで、生成結果の比較が容易になります。

        2. Efficiency Nodes for ComfyUIのインストール

        • メニューの「Manager」をクリックし、「ComfyUI Manager Menu」を開きます。
        画像
        • 「Custom Nodes Manager」をクリックします。
        画像
        • 上部の検索バーに「Efficiency Nodes for ComfyUI」と入力し、表示されたカスタムノードの「Install」をクリックします。
        画像
        • インストールが完了すると、再起動が求められるので、「Restart」をクリックします。
        画像
        • トップ画面に戻るので、メニューの「Refresh」をクリックします。
        画像
        • 再度「Custom Nodes Manager」画面を開き、上部の検索バーで「Efficiency Nodes for ComfyUI」を検索します。以下の画像のように表示されていれば、インストールが完了しています。
        画像

        3. 使用ノード解説

        Eff. Loader SDXL

        Eff. Loader SDXLは、「Load Checkpoint」「CLIP Text Encode (Prompt)」ノードを1つにまとめて使いやすくしたノードです。以下のような特徴を持ちます。

        • モデルのロードとキャッシュ: Checkpoint、VAE、およびLoRAタイプのモデルをロードおよびキャッシュすることができます。キャッシュ設定はnode_settings.jsonファイルで管理されます。
        • LoRA & Control Netスタックの適用: lora_stackおよびcnet_stack入力を介して、LoRAおよびControl Netスタックを適用することができます。これにより、複数のLoRAやControl Netモデルを一括で管理し、適用することが可能です。
        • プロンプト入力ボックス: ポジティブおよびネガティブプロンプトのテキストボックスが付属しており、プロンプトのエンコード方法をtoken_normalizationおよびweight_interpretationウィジェットを使用して設定することができます。
        • XY Plotノードとの連携: 「DEPENDENCIES」出力を「XY Plot」ノードに接続することで、XY Plotノードを用いた、パラメータごとの生成結果を一括で確認することができます。
        画像

        各ウィジェットの用途は以下のとおりです。

        • base_ckpt_name: 生成に使用するモデルを設定します。
        • base_clip_skip: ベースCLIPモデルでスキップするレイヤーの数を決定します。CLIP Skipは、入力したプロンプト(呪文)をどれだけ正確に画像に反映させるかを制御する指標です。CLIPのレイヤーは12層となっているため、1から12までの整数値で設定でき、値が小さいほどプロンプトを忠実に反映し、大きいほどプロンプトから離れた解釈をする傾向があります。SDXLの場合、CLIP Skipの効果は低いと言われています。
        • refiner_ckpt_name: リファイナーチェックポイントの名前を指定します。ベースモデルによって生成された出力を強化し、詳細と品質を向上させます。
        • refiner_clip_skip: リファイナーCLIPモデルでスキップするレイヤーの数を決定します。デフォルト値は0です。
        • vae_name: 使用する変分オートエンコーダ(VAE)の名前を指定します。VAEは画像生成プロセスで重要な役割を果たし、画像のエンコードとデコードを行います。VAEが含まれているモデルの場合、「Baked VAE」を選択することで、モデルのVAEを使用できます。
        • positive: ポジティブプロンプトを入力します。
        • negative: ネガティブプロンプトを入力します。
        • token_normalization: プロンプトにトークン正規化を適用するかどうかを決定します。トークン正規化は入力テキストの標準化に役立ち、モデルの理解と性能を向上させる可能性があります。設定値は以下のとおりです。
          • none(変更なし): このオプションでは、トークンの重みは変更されません。つまり、モデルが各トークンに割り当てる重みをそのまま使用します。重みの調整が不要な場合や、他の要因でトークンの影響を管理したい場合に使います。
            • 例:テキスト「beautiful cat」が入力され、トークン「beautiful」には重み1.2、「cat」には重み1.0が割り当てられたとします。この設定では、トークンの重みはそのままで、各単語が入力された通りの影響を持ちます。つまり、「beautiful」が「cat」よりも少し強調されます。
          • mean(平均調整): すべてのトークンの重みをシフトさせ、意味のあるトークンの平均が1になるように調整します。たとえば、入力テキストにいくつかの単語が含まれており、それぞれのトークンに異なる重みが付与されていた場合、この設定は全体のバランスを取って、過剰に重みが偏ることを防ぎます。これにより、特定のトークンが他のトークンより過剰に強調されることがなくなります。
            • 例:テキスト「beautiful cat」を入力し、トークン「beautiful」に重み1.2、「cat」に重み1.0が割り当てられた場合、この設定では、トークンの重みがシフトされて、全体の重みの平均が1になるように調整されます。例えば、結果として「beautiful」の重みが1.1、「cat」の重みが0.9になるかもしれません。これにより、全体のバランスが取れ、過度な強調が防がれます。
          • length(長さに基づく調整): 長い単語や埋め込みに関連するトークンの重みを、その長さに応じて均等に分割します。この分割は、異なる長さのトークンに対しても重みの大きさを一定に保つために行われます。
            • 例:テキスト「transformation」をトークン化したときに、単語が3つのトークン(「trans」「for」「mation」)に分割され、それぞれに重み1.5が割り当てられたとします。この設定では、単語全体の重みが均等に分配され、各トークンの重みは1.29になります(具体的には sqrt(3 * pow(0.35, 2)) = 0.5 に基づきます)。長い単語でも重みのバランスが保たれ、他の単語と比較して過剰に強調されることがありません。
          • length+mean(長さと平均の組み合わせ): この設定では、まずトークンの長さに基づいて重みを分割し、その後、重みの平均を1にシフトします。長い単語が過剰に強調されることを防ぎつつ、全体のバランスも調整するという、2つの手法を組み合わせた方法です。これは、長い単語がテキストの意味に不均衡な影響を与えないようにするのに役立ちます。
            • 例:テキスト「beautiful transformation」で、「beautiful」に重み1.2、「transformation」に重み1.5が割り当てられたとします。この設定では、まず「transformation」の重みを3つのトークン間で分割し(各トークンの重みは1.29)、その後、全体のトークンの重みの平均を1にシフトします。これにより、全体のバランスがさらに調整されます。
        • weight_interpretation: この設定は、特定のトークンや単語に割り当てられた重みをどのように処理するか、特に「重みを増加させる(up-weight)」または「減少させる(down-weight)」ときにどのようなアプローチを取るかを制御します。設定値は以下のとおりです。
          • comfy(ComfyUIのデフォルト): デフォルト設定です。この方法では、CLIPベクトルがプロンプト(入力テキスト)と空のプロンプト(何もない状態)との間で線形補間されます。つまり、プロンプトの重みを「0から100%」の間で調整することが可能です。このため、特定の単語やトークンの重要性を調整したい場合に柔軟に対応できます。
            • 例:テキスト「beautiful cat」で、「beautiful」に重み1.5を割り当てたとします。この設定では、「beautiful」と「完全に空のプロンプト」の間で線形補間されます。結果として、「beautiful」がやや強調されつつも、完全に突出しないように調整されます。これは「beautiful」が一定以上強調される一方で、「cat」の影響も保持されます。
          • A1111: このオプションでは、CLIPベクトルがその重みに基づいてスケーリングされます。具体的には、トークンに与えられた重みが大きくなるほど、そのトークンがテキスト全体に与える影響も大きくなります。たとえば、重みを2倍に設定した場合、そのトークンは通常の2倍の強調度で扱われます。逆に、重みを0.5倍にすると、影響度は半分になります。
            • 例:テキスト「beautiful cat」に対し、「beautiful」の重みを2倍に設定すると、この設定では「beautiful」の重みが2倍にスケーリングされます。つまり、「beautiful」の影響が「cat」の2倍になるため、「beautiful」がかなり強調されます。逆に、重みを0.5に設定すると、「beautiful」の影響が半減し、「cat」とのバランスが取られる形になります。
          • compel: compel方式の重み付けは、ComfyUIと似ていますが、特定の条件下で異なる動作をします。特に、down-weight(重みを下げる)場合に、マスクされた埋め込みを使用してトークンの影響を減らします。これは、トークンの影響を完全に無視するのではなく、段階的にその影響を減らす手法です。上方の重み付け(up-weight)はComfyと同じように扱われます。
            • 例:テキスト「beautiful cat」で「beautiful」に重み2.0、「cat」に重み0.5を割り当てたとします。この設定では、compelは上方の重み付けをcomfyと同じように処理しますが、「cat」のダウンウェイトはマスクされた埋め込みを使って実行されます。つまり、「cat」の影響は完全に消えるのではなく、少しずつ減少します。この手法は、特定の単語を完全に無視せず、少し影響を残すという意味で微調整が可能です。
          • comfy++: 上方の重み付けでは、単語がプロンプトと、その単語がマスクされたプロンプトの間で線形補間されます。つまり、ある単語の影響を徐々に消していくという動作です。また、compelスタイルのダウンウェイトも採用されており、特定の単語の影響を段階的に減少させることができます。この方法は、細かい調整が必要な場面で有効です。
            • 例:テキスト「beautiful cat」で「beautiful」に重み2.0を設定し、comfy++を使用します。この場合、「beautiful」はプロンプトと「beautiful」がマスクされたプロンプトの間で線形補間されます。つまり、「beautiful」の影響を少し抑えつつも、完全に無視するわけではありません。また、ダウンウェイトはcompel方式と同様に行われます。
          • down_weight: 最大の重みが「1」になるように重みを再スケーリングします。つまり、常にdown-weight(重みの減少)操作しか行いません。この方式では、特定のトークンが他のトークンに比べて過度に強調されることはありません。compelスタイルのダウンウェイトを使用するため、徐々に重みが減少していく過程でトークンの影響が最小化されます。
            • 例:テキスト「beautiful cat」で「beautiful」に重み1.5、「cat」に重み1.0が割り当てられたとします。この設定では、最大重みを1にスケーリングするため、「beautiful」の重みが1に再スケーリングされます。結果として、「beautiful」と「cat」のバランスが取れ、過度に強調されることがなくなります。常にダウンウェイトのみが行われるため、重みが1以上になることはありません。
        • empty_latent_width / empty_latent_height: 空の潜在空間の幅と高さを設定します。潜在空間の次元は、生成される画像の解像度とアスペクト比を定義するために重要です。
        • batch_size: 一度に生成される画像の数を指定します。バッチサイズが大きいほど処理時間が短縮されますが、より多くの計算リソースが必要です。
        • lora_stack / cnet_stack: LoRAモデルやControlNetモデルのスタックを指定できます。これらはベースモデルを微調整し、特定のスタイルや特徴を追加するために使用されます。

        KSampler SDXL (Eff.)

        「KSampler SDXL (Eff.)」ノードは、「KSampler」ノードに以下のような便利な機能を加えた拡張ノードになります。

        • ライブプレビューで生成を確認したり、VAEで画像をデコードする機能を備えています。
        • シードをより明確に管理できる特別なシードボックスを搭載しています。(選択されたシードの動作を適用するために-1のシードを使用)
        • XYプロットスクリプトなど、さまざまなスクリプトを実行できます。スクリプトを有効化するには、入力接続を接続するだけです。

        各ウィジェットの用途は以下になります。

        • noise_seed: シード値を設定します。シード値は、直接入力の他に、「Randomize / Last Queued Seed」ボタンをクリックすることで、-1と最後の生成に使用されたシード値を切り替えることが可能です。
        画像
        • steps: サンプリングのステップ数を指定します。値が大きいほど高品質な画像が生成されますが、処理時間も長くなります。
        • cfg: Classifier-Free Guidanceのスケールを制御します。値が高いほど、プロンプトに忠実な画像が生成されます。
        • sampler_name: 使用するサンプリングアルゴリズムを選択します。初期値はeulerになります。
        • scheduler: サンプリングプロセスのスケジューリング戦略を指定します。初期値はnormalになります。
        • start_at_step: サンプリングを開始するステップを指定します。部分的なサンプリングや既存画像の改良に使用できます。
        • refine_at_step: リファイナーモデルに切り替えるステップを指定します。-1に設定するとリファイナーは無効になります。
        • preview_method: 生成中の画像のプレビュー方法を指定します。
          • auto: システムが最適なプレビュー方法を自動的に選択します。通常は最も効率的なオプションです。
          • latent2rgb: 潜在空間の画像を直接RGBに変換してプレビューします。高速ですが、品質は低くなります。
          • taesd: Tiny AutoEncoder for Stable Diffusionを使用してプレビューを生成します。品質と速度のバランスが取れています。
          • none: プレビューを生成しません。最も高速ですが、進捗を視覚的に確認できません。
        • vae_decode: VAE(Variational Autoencoder)を使用して潜在画像を最終出力画像にデコードするかどうかを制御します。
          • true: 標準的なVAEデコードを実行します。
          • true (tiled): タイル化されたVAEデコードを実行します。大きな画像や高解像度画像に適しています。
          • false: VAEデコードを実行せず、潜在画像のままにします。この時、出力「IMAGE」は機能しないため、ノードを接続しているとエラーになります。
          • output only: 最終結果のみをVAEデコードします。中間ステップはデコードしません。
          • output only (tiled): 最終結果のみをタイル化されたVAEデコードで処理します。

        XY Plot

        「XY Plot」ノードは、特定のウィジェットの値やプロンプトなどを指定の条件で変化させ、その変化をX/Y軸に一度に表示するために使用するノードです。XY Plotノードの特徴は以下になります。

        • 2次元グリッド形式での表示: X軸とY軸に異なるパラメータを設定し、それらの組み合わせによる画像生成結果を2次元グリッドで表示します。
        • 多様なパラメータ比較: CFG、シード値、チェックポイント、LoRA強度など、様々なパラメータを比較できます。
        • スクリプト生成: XY Plotノードは内部的にスクリプトを生成し、KSampler (Efficient)ノードと連携して動作します。
        画像

        各ウィジェットの用途は以下になります。

        • grid_spacing: グリッド間のスペースを設定します。
        画像
        • XY_flip: X軸とY軸を入れ替えるオプションです。
        画像
        • Y_label_orientation: Y軸のラベルの向きを設定します。
        画像
        • cache_models: モデルをキャッシュするかどうかを設定します。
        • ksampler_output_image: KSamplerの出力画像の形式を指定します。「Images」の場合、プロットされた1枚ずつの画像が出力されます。「Plot」の場合、1枚に全ての生成画像がプロットされた画像が出力されます。
        画像

        XY Input: Prompt S/R

        「XY Input: Prompt S/R」ノードは、XY Inputノードの入力「X」「Y」に接続し、プロンプトを制御するノードです。search_txtで指定した文字列をreplace_1, replace_2…で指定した文字列に次々と置換しながら生成を行います。

        画像

        各ウィジェットの用途は以下になります。

        • target_prompt: 置換対象のプロンプトをポジティブ、ネガティブから選択します。
        • search_txt: 置換対象の文字列を指定します。例えば、「1girl, portrait」というプロンプトがある場合、「portrait」をsearch_txtに設定することで、次のウィジェット「replace_1」「replace_2」…の文字列に「portrait」を置換します。
        • replace_count: 置換する回数を設定します。この回数を増減させることで、「replace_x」の入力欄が増減します。
        • replace_x: 置換元の文字列を設定します。

        4. ワークフロー

        ワークフローの全体像は以下になります。

        画像

        ワークフローは、文末で配布しています。

        プロンプトと置換元文字列の設定

        ポジティブプロンプト、ネガティブプロンプトには、以下を設定しました。

        // ポジティブプロンプト
        best quality, 1girl, solo, long_hair, smile, casual dress, very_long_hair, blonde_hair, standing relaxed, portrait,

        // ネガティブプロンプト text, watermark,

        置換元文字列は、X軸に「portrait」の置換として、「full body」「from side」「from behind」、Y軸に「standing relaxed」の置換として、「crossing arms」「hands on hips」「raising one hand」を設定しています。

        5. 実行結果を確認する

        それでは、メニューの「Queue Prompt」をクリックして、ワークフローを実行してみましょう。以下が生成結果になります。X軸、Y軸でプロンプトによる生成結果の違いを一目で確認できます。

        画像

        今回は、プロンプトの比較をしてみましたが、これ以外にも「XY Input: CFG Scale」ノードや「XY Input: Steps」ノードなど、プロットに使えるノードがあるので、これらのノードを使ってウィジェットの変化を確認してみてください。

        次回は、ComfyUIをAPI化する方法を紹介します。乞うご期待!

        X(Twitter)@AICUai もフォローよろしくお願いいたします!

        画像生成AI「ComfyUI」マスターPlan

        画像生成AI「Stable Diffusion」特に「ComfyUI」を中心としたプロ向け映像制作・次世代の画像生成を学びたい方に向けたプランです。最新・実用的な記事を優先して、ゼロから学ぶ「ComfyUI」マガジンからまとめて購読できます。 メンバーシップ掲示板を使った質問も歓迎です。

        • メンバー限定の会員証が発行されます
        • 活動期間に応じたバッジを表示
        • メンバー限定掲示板を閲覧できます
        • メンバー特典記事を閲覧できます
        • メンバー特典マガジンを閲覧できます
        • 動画資料やworkflowといった資料への優先アクセスも予定

        ゼロから学ぶ「ComfyUI」マガジン

        https://note.com/aicu/m/md2f2e57c0f3c

        マガジン単体の販売は1件あたり500円を予定しております。
        2件以上読むのであればメンバーシップ参加のほうがお得です!というのもメンバーシップ参加者にはもれなく「AICU Creator Union」へのDiscordリンクをお伝えし、メンバーオンリー掲示板の利用が可能になります。

        https://note.com/aicu/membership/boards/61ab0aa9374e/posts/db2f06cd3487?from=self

        もちろん、初月は無料でお試しいただけます!
        毎日新鮮で確かな情報が配信されるAICUメンバーシップ。
        退会率はとても低く、みなさまにご満足いただいております。
        ✨️オトクなメンバーシップについての詳細はこちら

        メンバーシップ向けボーナストラック


        この記事の続きはこちらから https://note.com/aicu/n/ncb1141cab2ae

        Originally published at https://note.com on Sept 19, 2024.

      1. BlendAI第1回ファンミーティング潜入レポート!デルタもん誕生秘話から新キャラ「ガンマミィ」、さらに壮大な計画まで明らかに!

        2024年9月14日に行われた、AIキャラクター「デルタもん」を開発するBlendAIのファンミーティングに参加してきました!今回はその内容を熱量たっぷりでお届けします。

        設立わずか1年! 怒涛のスピードで成長を続けるBlendAI

        まずは、BlendAI CEOの小宮氏、CTOの小坂氏、そしてクリエイティブディレクターの榊氏の3名から熱い想いのこもった挨拶がありました。

        設立は2024年1月と、まだ若い会社ながら、デルタもんの誕生、クラウドファンディングの成功、そして5000万円の資金調達達成など、怒涛のスピードで成長を続けています。

        その原動力となっているのが、「AIとクリエイティブを融合させ、より良いものを生み出し、クリエイターにチャンスを与える」というビジョン。
        特に、コロナ禍で顕在化した「孤独」をAIの力で解決したいという小宮氏の強い想いに、他のメンバーも共感し、プロジェクトはスタートしました。

        コンテンツは以下の通りでした

        • 会社情報
        • 会社のミッション
        • 創業の経緯
        • 創業者のバックグランド
        • デルタもん、およびアルパラプロジェクトについて
        • デルタもんの技術的こだわり、開発秘話
        • 会社全体の戦略
        • B向けサイドでの実例
        • クラファンについて
        • チラ見せ
        • 質問コーナー
        • 写真撮影
        • アンケート
        画像

        創業者のバックグランド

        MCはBlendAI執行役員の中川賢史朗さん

        【出演】
        BlendAI代表 小宮自由さん
        CTO小迫良輔さん
        クリエイティブディレクター榊正宗さん

        画像

        興味深い小宮自由さんのブロックチェーン時代のご経験。

        サトシ・ナカモトのAIを作ったりもしています。

        https://twitter.com/jiyu33/status/1817496621166600212

        デルタもん誕生秘話!
        3Dモデル化で「AIキャラクターの2次創作」を促進

        続いて、デルタもん誕生の舞台裏が明らかに。

        キャラクターデザインを担当した榊(さかき)氏は、著作権問題をクリアするため、あえて手書きでデザイン画を作成し、それを元に3Dモデルを制作したそう。
        その3Dモデルをクラウドファンディングで配布したことで、高精度なLoRA制作が可能となり、多くのクリエイターによる2次創作が促進されました。

        https://blendai.jp/resources

        二次創作用に自由に使える素材を配布しています。

        AICUとしてはコラボコンテストも開催しました!

        デルタもん、およびアルパラプロジェクトについて

        アルファパラダイスプロジェクト始動!
        デルタもんだけじゃない!個性豊かなAIキャラクターが続々登場

        今後の展開として、初めて明かされる「アルファパラダイスプロジェクト」の概要が明らかに。

        画像

        これは、デルタもんを含む4人ずつ6種類、全24体のAIキャラクターを、6つの異なる世界観で展開していくという壮大なプロジェクト。
        しかも、各キャラクターのデザインはそれぞれ異なる絵描きさんが担当し、小説家によるストーリーも用意されるとのこと!

        ・未来編
        ・ファンタジー編
        ・妖怪編
        ・ミリタリー編
        ・モンスター編
        ・神様編

        技術的な難度とその展開についても語られました。

        画像

        AI技術とプロのクリエイターの才能が融合することで、著作権問題をクリアしながら、多様な絵柄と世界観で誰もが安心して2次創作を楽しめる、まさに夢のようなプロジェクトです。

        会社全体の戦略・B向けサイドでの実例

        B向けで開発ノウハウを貯め、C向けへの導入を促す。
        十分な売上とノウハウが溜まったら、C向けに専念する。
        C向けはSaaSの成長戦略を用いて伸ばす。
        それまで皆さんから意見や要望を集める。

        画像

        会話アプリ「CotoVerse」で、デルタもんと会話できる未来がすぐそこに

        ファンミーティングでは、開発中の会話アプリ「CotoVerse」(コトバース)のデモ動画も公開

        画像
        https://youtu.be/dwt44ICxNy4?feature=shared&t=4310

        「CotoVerse」の音声認識・音声合成技術により、デルタもんと自然な会話ができる様子が披露されました。

        デルタもんによる「教育係からケーキ工場に異動になった…」という未来の状況が説明されるハプニングも…!?


        将来的には、ガンマミィをはじめとする他のキャラクターも実装予定で、キャラクター同士の掛け合いなども実現するかも…?

        「ガンマミィ」クラウドファンディング

        まだまだ進化するデルタもん! ガンマミィのクラウドファンディングも間もなく開始!

        9月末、Campfireにて実施予定とのことです!

        画像

        最後に、ガンマミィのイラストがチラ見せされました!
        デルタもんとはまた違った可愛らしい雰囲気で、その詳細な設定や、どんな声で話すのか、今から期待が高まります。

        画像

        ✨️追記:9月16日、キャラクタービジュアルが公開されました✨️

        ガンマミィのクラウドファンディングは近日開始予定とのことなので、気になる方はBlendAIの情報をチェックしましょう!
        BlendAIクラウドファンディングページ
        https://camp-fire.jp/profile/BlendAI/projects

        大盛りあがりの「質疑応答編」

        Q: 小迫CTOがイケボなのは何故?
        A: 自分で関西弁を録音したり…「最初の音声合成モデルは僕の声です」。
        といった質問で始まった質疑応答パートは大盛りあがりでした!

        ・榊さんは「シリーズ構成」を担当しているの?未来編以外は?
        ・AIと作家性について
        ・毎日のXでのデルタもんは誰が?
        AkumaAI公式LoRA
        ・デルタもんの「意外な一面」についての榊さんの感想
        ・「CotoVerse」スピーチモードについて
        ・資金調達5000万円のエピソード
        …などなど…

        まとめ

        AI x クリエイティブで、誰もが「つくる人」になれる未来へ

        BlendAIは、AIとクリエイティブの可能性を追求し、誰もが「つくる人」になれる未来を目指しています。
        デルタもん、そしてアルファパラダイスプロジェクトは、その夢を実現するための第一歩です。

        「つくる人をつくる」をビジョンにするAICUも
        今後の展開から目が離せません!

        関連リンク:

        https://note.com/blendai/n/n7b4f74267468

        Originally published at https://note.com on Sept 16, 2024.

      2. [ComfyMaster16] ComfyUIでImage-to-Image(i2i)を始めよう

        「写真の表情を変えたい」、「イラストをリアルな絵画風にしたい」…
        それ、i2iで実現できます!

        こんにちわ、AICU media編集部です。
        ComfyUI マスターガイド」、いよいよ今回から「Image-to-Image(i2i)編」に突入します。
        この記事では、ComfyUIを使用したi2iの基本から応用まで、実践的なステップを踏んで解説していきます。

        前回はこちら。初回はこちら

        1. Image-to-Image(i2i)とは

        Image-to-Image(i2i)とは、既存の画像を入力として使用し、新しい画像を生成する技術です。元の画像の構造や特徴を保持しながら、新しい要素を追加したり、スタイルを変更したりすることができます。

        ComfyUIでのi2iは、通常の画像生成と同じノードの多くを使用しますが、主な違いは入力に既存の画像を使用することです。この技術は、写真の編集や修正、アートスタイルの変換、キャラクターデザインの変更、風景画の変更や拡張など、幅広い用途に活用できます。

        今回は、インペインティングによる表情の変更と、アニメ調からリアル調へのスタイル変換を解説します。

        2. インペインティングによる表情の変更

        では、実際にComfyUIでi2iのワークフローを構築してみましょう。今回は、以下の画像の表情を変えたいと思います。

        画像
        • ワークフローが埋め込まれたPNG画像(webp形式ではなく)とGoogle Colabでの ComfyUI i2i編ノートブックは文末にて提供しています
        • メニューの「Load Default」をクリックし、標準のワークフローをロードした状態にします。モデルはstable-diffusion-xl-base-1.0を使用します。
        画像
        • 次に「Load Image」ノードを追加し、「choose file to upload」から対象の画像をアップロードします。
        画像
        • ウィジェット用で右クリックし、表示されたメニューから「Open in MaskEditor」をクリックします。
        画像
        • マスク範囲を指定するためのキャンバスが表示されます。
        画像
        • 今回は、表情を変更したいので、顔をブラシで塗りつぶします。
        • 「Thikness(ペンの太さ)」「Opacity(不透明度)」「Color(ペンの色)」は作業用のパラメータです。最終画像への影響はありません。
        • その後、「Save to node」をクリックします。
        • 以下のように顔がマスキングされます。
        画像
        • 次に、「VAE Encode (for inpainting)」ノードを追加します。
        • 「Load Image」の出力「IMAGE」「MASK」を、それぞれ「VAE Encode (for inpainting)」ノードの入力「pixels」「mask」に接続します。
        • 「Load Checkpoint」ノードの出力「VAE」「VAE Encode (for inpainting)」ノードの入力「vae」に接続します。
        画像
        • 「Empty Latent Image」ノードを削除します。
        画像
        • 「VAE Encode (for inpainting)」ノードの出力「LATENT」「KSampler」ノードの入力「latent_image」に接続します。
        画像
        • ポジティブプロンプトを「1girl, smile」に変更します。
        画像
        • これで「Queue Prompt」をクリックし、生成を実行します。以下が生成結果です。表情は変わりましたが、周囲との馴染みが若干悪いです。
        画像
        • 生成結果を調整する際は、「KSampler」ノードの「denoise」の値を調整してください。この値を 1.0から 0.9, 0.8,…と下げていくことで、変化の度合いを調整できます。
        画像

        denoise = 0.8

        画像

        denoise = 0.75

        画像

        ※このパラメーターを 0.8 以下にすると、破綻しやすくなるので段階を踏みながら設定していくことをおすすめします。

        細かな制御をしたい場合はVAE Encode (for Inpainting) のパラメータ「grow_mask_by」も操作するとよいでしょう。

        「grow_mask_by」を小さい値にすると、境界線が目立つようになります。

        画像
        画像

        逆に、「grow_mask_by」を大きな値にすると境界が曖昧になります。なお最大値は64です。大きくすると処理時間が長くなります。

        denoise = 0.9, grow_mask_by = 64, seed = 1

        画像

        バッチ生成してみましょう。
        denoise = 0.9, grow_mask_by = 64, seed = 5

        画像

        3. アニメ調からリアル調へのスタイル変換

        先ほどのワークフローを利用し、アニメ調からリアル調へのスタイル変換をします。ワークフローの変更点としては、以下になります。

        • 顔に掛けていたマスクを外します。今回はスタイルを変えるので、画像全体を対象とするためです。マスクの外し方は、「Open in MaskEditor」でマスク用のキャンバスを開き、左下の「Clear」をクリックし、マスクを削除後、「Save to node」をクリックします。
        画像
        • 「VAE Encode (for inpainting)」ノードを「VAE Encode」ノードに変更します。「VAE Encode」ノードは、「VAE Encode (for inpainting)」ノードからマスクの入力が削除されたバージョンです。
        画像
        • 使用するモデルをRealVisXL_V4.0.safetensorsに変更します。RealVisXLは、実写の描写が得意なモデルで、これを利用することでリアル調のスタイルに変換します。以下のリンクからRealVisXLをダウンロードし、「ComfyUI/models/checkpoints」フォルダに格納してください。

        ※ダウンロード済みの場合は選択するだけになります。

        https://huggingface.co/SG161222/RealVisXL_V4.0/blob/main/RealVisXL_V4.0.safetensors

        • ポジティブプロンプトを「1girl」にします。表情は変えないので、smileは削除します。
        画像
        • 「KSampler」ノードの「denoise」を0.55-0.70程度に設定します。ここは、生成結果を確認しながら調整してください。
        画像
        • ここまでの設定で画像生成してみましょう。以下が生成結果です。元画像からスタイルが変わっていることが確認できます。
        画像

        4. 倫理的考慮事項

        i2iの使用には倫理的な配慮が必要です:

        1. 著作権: 他者の作品を無断で使用しない。特にdenoiseを下げすぎると、依拠性や類似性を意図して侵害することになります。
        2. プライバシー: 個人を特定できる画像の使用に注意
        3. ミスインフォメーション: 偽の画像やディープフェイクなど、誤解を招く画像の作成を避ける
        4. 不適切なコンテンツ: 有害や攻撃的な画像の生成を控える

        画像生成AIの責任は生成者にあります。責任ある使用を心がけ、創造性と倫理のバランスを保つことが重要です。

        ▶画像生成AIクリエイター仕草(v.1.0)

        【参考】AUTOMATIC1111での i2i 関連情報はこちら

        https://note.com/aicu/n/n08ebe0637a41

        5. まとめ

        ComfyUIでのi2i技術は、あなたのクリエイティブな可能性を大きく広げるツールです。基本的なワークフローの構築から始まり、パラメータの微調整、高度なテクニックの適用まで、段階的に技術を磨いていくことで、より印象的で独創的な画像を生成できるようになります。

        最後に、AIを使用した創作活動には倫理的な配慮も必要です。著作権や個人情報の扱いには十分注意し、責任ある利用を心がけましょう。

        この記事を参考に、ComfyUIでのi2i探索を楽しんでください。新しい発見や素晴らしい創作の旅が、あなたを待っています!

        次回は、image-to-image編 第2回「Outpainting機能」を紹介します。
        乞うご期待!

        X(Twitter)@AICUai もフォローよろしくお願いいたします!

        画像生成AI「ComfyUI」マスターPlan

        画像生成AI「Stable Diffusion」特に「ComfyUI」を中心としたプロ向け映像制作・次世代の画像生成を学びたい方に向けたプランです。最新・実用的な記事を優先して、ゼロから学ぶ「ComfyUI」マガジンからまとめて購読できます。 メンバーシップ掲示板を使った質問も歓迎です。

        • メンバー限定の会員証が発行されます
        • 活動期間に応じたバッジを表示
        • メンバー限定掲示板を閲覧できます
        • メンバー特典記事を閲覧できます
        • メンバー特典マガジンを閲覧できます
        • 動画資料やworkflowといった資料への優先アクセスも予定

        ゼロから学ぶ「ComfyUI」マガジン

        https://note.com/aicu/m/md2f2e57c0f3c

        マガジン単体の販売は1件あたり500円を予定しております。
        2件以上読むのであればメンバーシップ参加のほうがお得です!というのもメンバーシップ参加者にはもれなく「AICU Creator Union」へのDiscordリンクをお伝えし、メンバーオンリー掲示板の利用が可能になります。

        https://note.com/aicu/membership/boards/61ab0aa9374e/posts/db2f06cd3487?from=self

        もちろん、初月は無料でお試しいただけます!
        毎日新鮮で確かな情報が配信されるAICUメンバーシップ。
        退会率はとても低く、みなさまにご満足いただいております。
        ✨️オトクなメンバーシップについての詳細はこちら

        お楽しみ、メンバー向けボーナストラックには、今回のi2iサンプルワークフローが埋め込まれたPNGファイルと、i2i編で便利な Google Colab用 ComfyUI ノートブック(新作)、さらに今回の内容で使った workflowファイルをお贈りします。もりだくさんです!


        この記事の続きはこちらから https://note.com/aicu/n/nfc8eb955e57b

        Originally published at https://note.com on Sept 15, 2024.

      3. 結果発表!!「デルタもん4コマ漫画コンテスト」

        デルタもんの日常が炸裂!個性豊かな作品が集結!BlendAI特別協賛「デルタもん4コマ漫画コンテスト」応募作品と優秀賞の結果を紹介します。

        AIキャラクター「デルタもん」をテーマにした、「デルタもん4コマ漫画コンテスト」に、たくさんのご応募をいただきありがとうございました!

        個性豊かな作品、なんと 12 作品 も集まりました!
        審査員一同、AI技術を駆使した表現力と、デルタもんの魅力を引き出すユニークなストーリーに驚かされました。

        今回のコンテストは、デルタもんのLoRAを配布したクラウドファンディングの出資者の方々への感謝の気持ちから生まれた企画の第一弾なんです。
        #デルタもん4コマ のハッシュタグを追いかけて、このコンテストを知った方も多いのではないでしょうか?

        コンテストに応募した方も、そうでない方も、X(Twitter)のタイムラインがデルタもんで溢れる様子に、きっと笑顔になったはずです。出資者の方々も、自分の支援がこんなにも素敵な作品を生み出すきっかけになったことを、嬉しく思っていることでしょう。

        さて、話を戻して…今回は、デルタもん4コマ漫画コンテストの応募作品の中から入選した素敵な作品と、受賞作品をご紹介します。

        画像

        コンテストはXの投稿及び応募フォームを用いて実施されています。
        作者からのタイトル、作品解説とともに紹介していきます。

        以下、入選作品です。
        優秀賞は最後に発表します。

        【未来へのΔ(デルタ)コネクション ~衝撃の真実~】 by ともっち

        https://x.com/tomomaga358/status/1827783761502798049

        【概要】この4コマ漫画は、一見普通の日本の高校を舞台に、未来から来たAIアンドロイド「デルタモン」と、謎めいたギャル「ミライ」を中心に展開するSF途中です。の裏に隠された驚くべき真実と、人類とAIの未来を考慮した重大な選択を描いています。
        【コンセプト】ジャンルミックス:学園もの、SF、一時の要素を融合させ、読者を魅了する展開を提供しました。キャラクターの二面性:デルタモンの不安げな様子や、ミライの意味深い態度など、登場人物の顔と裏の顔のギャップを強調しました。テクノロジーと倫理:先進的なAI技術と、それが実現する倫理的ジレンマを探ります。視覚的なコントラスト:現代の学校と未来的な要素(デルタモンの外観、隠された実験室など)を対比させ、違和感と興味を喚起しました。緊迫感の演出:時計の表示や、最後のカウントダウンタイマーなど、時間の切迫感を視覚的に表現しました。内面の葛藤:心の中の冷静、キャラクターの内面の葛藤や緊張感を表現しました。オープンエンド:最後のコマで決断の瞬間を描き、続きへの関心を呼びかけるようにしました。
        【工夫した点】各キャラクターの表情やコマ割りの構図を工夫しました。特に4コマ目のキャラクターアップとカウントダウンタイマーを表示させたところ。ストーリープロンプトを詳細に出力させて描きました。
        オノマトペを入れてさらに臨場感あふれるようにしたところです。

        編集部注:「デルタモン」は「デルタもん」の誤りなのか、アンドロイドの名前なのか不明だったので、そのまま掲載しておりますが、正式名称は「デルタもん」でお願いしますね!


        一見普通の学園生活を送るデルタもん…しかし、その裏には衝撃の真実が隠されていました!
        未来から来たAIアンドロイドという設定を活かしたSF要素、そして謎めいたギャル「ミライ」との関係性など、続きが気になる展開に引き込まれます。

        【5分で大変身!デルタもんのAI漫画チャレンジ】 by ともっち

        画像
        https://x.com/tomomaga358/status/1831305259882606756

        【使用ツール】 •Anifusion: AI漫画生成ツール(4コマの基本ビジュアル、キャラクター、背景作成) •コミPo!: 漫画編集ソフト(吹き出し、テキスト、オノマトペの追加と配置調整) •Claude 3.5 Sonnet: AI言語モデル(ストーリー構成、キャラクター設定、カメラアングル提案、セリフ作成、コマ説明生成) 【概要】 絵が苦手なAIアンドロイド女子高生、デルタもんが、AIツール「Anifusion」を発見し、わずか5分で漫画を作成。絶望から希望、そして成功へと至る過程を、ユーモアたっぷりに描いた4コマ漫画。読者の「私もやってみたい!」を引き出す、AIの可能性を示す作品。 【コンセプト】 「誰でも簡単にAIで漫画が作れる」という現代テクノロジーの魅力を、親しみやすいキャラクターと分かりやすいストーリーで伝える。技術の進歩により変わる創作の形を示しつつ、読者の創作意欲を刺激し、AIツールへの興味を喚起する。 【工夫した点】 •AIツールの魅力を視覚的に表現: 1コマ目:絶望的な落書きから、4コマ目:絵心なしでも漫画完成を達成するまで、劇的な変化を描写 3コマ目:パソコンでAIが生成した漫画の画面をデルタもんのバックに描くことにより視覚的効果とセリフによる生成スピードを強調 •感情を強調するオノマトペ使用: 「ふぅ〜」(落胆)、「ガーン」(驚き)、「かぁぁぁ•••」(感動)、「ドーン」(決意)他あり。 各コマの雰囲気をさらに盛り上げ、読者の感情移入を促進 •キャラクターの一貫性維持: 全コマでデルタもんの特徴(白青の制服、緑の猫耳、青いしっぽ)を統一 感情変化を耳としっぽの動きで表現し、キャラクターの生き生きとした表情を演出 ストーリープロンプトにも反映しました。 •読者目線を考慮した構図: 右上から左下への自然な視線の流れを意識した吹き出しとセリフの配置 3、4コマ目でダイナミックなアングルを採用し、感情の高まりを表現 •ストーリーと視覚表現の調和: AIを活用して各コマの展開がスムーズにつながるよう調整 「絵心ゼロ→AI発見→驚き→成功」という明確な流れで読者の共感を獲得。

        絵を描くのが苦手なデルタもんがAIツール「Anifusion」を使って漫画制作に挑戦!
        わずか5分で完成する様子に、AI技術の進化を感じさせられます。
        読者も「自分も作ってみたい!」と思わせる、AIの可能性を感じさせる作品です。

        【つよつよメンタルデルタもん】 by いぬさわ・ばう@InsBow🐾

        画像
        https://x.com/InsBow/status/1832967748760277383

        あまりにも作品の投稿が少なすぎることに悩んでいるようで悩んでいないデルタもんの日常を描きました。

        応募作品の少なさに動じない、デルタもんのつよつよメンタルっぷりがコミカルに描かれています。Anifusionのみで作られたという点にも注目です。

        【自撮り投稿デルタもん】 by いぬさわ・ばう@InsBow🐾

        画像
        https://x.com/InsBow/status/1832992326006055078

        あまりに投稿が少なすぎるデルタもんが自分でコンテンツを作りはじめるまでの前日譚ですわ
        Anifusionだけで作ってます

        「つよつよメンタルデルタもん」の連作ですね。
        投稿が少ないことに悩み、自らコンテンツを作り始めるデルタもんの姿が描かれています。表情豊かなデルタもんの姿にクスッと笑ってしまう作品です。

        【洞窟探索 日和】 by mounero

        画像

        AniFusionを使っていくつかAIマンガ作品を制作した経験を活かして、 生成ガチャとプロンプトの工夫を頑張りました。LoRAがある デルタもんでのマンガ生成とても楽しかったです。キャラがいい。 クリップスタジオで文字入れするのも楽しかったです。

        AniFusionを使った経験を活かし、生成ガチャとプロンプトを駆使して制作された作品。
        LoRAを活用したデルタもんの表現や、クリップスタジオでの文字入れなど、細部までこだわられています。

        【悪酔いデルタもん】 by いぬさわ・ばう

        画像
        https://x.com/InsBow/status/1833144163258556627

        自分の漫画作品が少なすぎてやけ酒を飲んでいたら、気がつけば自分の漫画を制作しているデルタもんです。

        応募作品の少なさにやけ酒を飲むデルタもん…!?
        酔った勢いで漫画を制作する姿がユーモラスに描かれています。
        自分大好きなのですね!

        【変身せよ!デルタもん熟女】 by 小泉勝志郎

        画像
        画像
        画像
        画像
        https://x.com/koi_zoom1/status/1833509800241729912

        作品概要:デルタもんは現代の熟女出留田文に変身してもらうことで現代に来ようとするが、デルタもんより出留田文の方が視力が良かったために交渉は決裂。しかし、49歳の出留田文には老眼で会社の資料が読めず、デルタもんに変身して資料を読むのであった。
        使用モデル:DucHaitenPonyNoScoreV4
        こだわり:デルタもん、出留田文、変身後デルタもんそれぞれデザインに一貫性があるようにしている。デルタもん、出留田文は個別にLoRAを作成。変身後デルタもんは両方のLoRAを適用して作成。変身シーンは双方のLoRAの割合を調整して生成。 デルタもんはオリジナルデザインに忠実にした。出留田文は49歳に見えるように、アニメ系モデルが苦手な熟女表現をできるようにしている。変身後デルタもんは出留田文がちょっと若返ってデルタもんの服装になりながら出留田文の風味も出るようにしている。

        なんと、熟女 出留田文でるた あや がデルタもんに変身!?
        LoRAを駆使したキャラクターデザインと、細かな若返り制御にも注目です。

        【AIの心得】 by わら

        画像
        https://x.com/wara_hirono/status/1833425252023665148

        デルタもんにアシスタントAIロボ(あまり役に立たない)がくっついていたらおもしろいなと思って描きました

        デルタもんに、ちょっと頼りないアシスタントAIロボが!?
        二人の掛け合いが面白い作品です。
        しかもメイキングとオリジナルキャラクターまで!

        【恐怖のマニフェスト】 by 合同会社オフィスSATOU

        画像
        画像
        画像
        画像

        進次郎記者会見のパロディです。デルタもんならこう言うとおもいました。

        ご応募いただいたみなさま、ありがとうございました!

        優秀賞、作品発表!

        【審査基準】
        ・品質
        ・発想力
        ・物語性

        BlendAI特別協賛「デルタもん4コマ漫画コンテスト
        優秀賞は【AIの心得】 by わら さんです!

        画像

        小宮自由(BlendAI株式会社 代表)コメント:
        たくさんのご応募ありがとうございました。デルタもんをリリースしてから8ヶ月、様々な方々が様々なデルタもんを描いてくれるようになってありがたく思います。すごい尖った作品、技術的にも難度が高く、自分の好きを貫いた作品が出てきたりして、良いことだと思いました。優秀賞には わらさんの作品を選出させていただきましたが、品質、発想力、物語性に加えて「作家性」。手書きを組み合わせることで自分の作品とAIのテクニックを融合させた良いコラボレーションだと思いました。そして何より「ガンマミィ」について触れてくれているのが嬉しかったです!

        白井暁彦(AICU media編集長)コメント:
        たくさんのご応募ありがとうございました。複数の作品を投稿してくださった方や、こだわりのある作品を締め切りギリギリに投稿してくださった方、締切に間に合わなかったけど、Xへ共有してくださった方などAICUのファンと「デルタもん」ファンのコミュニティの温かさを感じるコラボイベントとなりました。優秀賞の作品にはAICUマガジンでの連載オファーが付くこともあり、プロのAIクリエイターとしての視点での評価としての視点も加えさせていただきました。わらさんは「AICUマガジン Vol.4」での掲載経験もありメイキングまで公開頂いていることからも「もっと読みたい…!」という気持ちにさせる作品が作れるクリエイターであることも評価のポイントになっております。

        【優秀賞】Amazonギフト券4444円分+デルタもん4コマ漫画連載オファー獲得となります。おめでとうございます!連載オファーについてはDMにてご相談させていただきます!


        今回ご特別協賛をいただいたBlendAIさんおよびデルタもん原作者・支援者のみなさまに改めまして感謝いたします。

        そして告知です。

        そしてさらに、BlendAIさんが現在開発中の新キャラクター「ガンマミィ」のクラウドファンディングも予定されています!
        クラウドファンディングへの参加を通して、あなたもAIキャラクターの誕生に貢献することができます。そして、完成したLoRAを使って、ガンマミィをテーマにしたコンテストにも参加できます!

        https://camp-fire.jp/profile/BlendAI

        そして、この熱気はまだまだ続きます!

        またAnifusionでのデルタもん公式LoRAの使用方法も紹介されております。

        AICU mediaも次なるAI漫画コンテストを企画中です!

        デルタもん4コマ漫画コンテストに続く第二弾として、AICU主催のコンテストを予定しております!

        AI技術と創造性が融合した、この exciting な流れに、ぜひあなたも参加してください!

        まずは X@AICUai をフォローよろしくお願いいたします!

        #デルタもん4コマ #AICU #BlendAI #AIart #AIマンガ #AniFusion #AImanga #デルタもんイラストコンテスト #DeltaMon

        Originally published at https://note.com on Sept 13, 2024.

      4. 【イベントレポート】AWS AI Day:生成AIの最前線に迫る最新事例と実践ハンズオン(2)AWS活用企業100以上の生成AI事例に見るビジネスインパクト創出の方程式

        2024年9月9日開催の「AWS AI Day」レポート第2弾!今回は、アマゾン ウェブ サービス ジャパン合同会社 金融事業開発本部長の飯田 哲夫 氏による講演「100 以上の生成 AI 事例に見る ビジネスインパクト創出の方程式」をピックアップします。
        「つくる人をつくる」AICU mediaでは総力を上げてレポートしております。

        ▶前回の記事はこちら
        【イベントレポート】AWS AI Day:生成AIの最前線に迫る最新事例と実践ハンズオン(1)新人こそがAI開発のエース!?リクルートの最新事例 #awsAIday

        生成AI導入企業の課題に切り込む!

        生成AIへの関心が高まる一方で、「具体的な活用方法がイメージできない」「社員の利用率が低い」という悩みを持つ企業も多いのではないでしょうか?

        飯田氏の講演では、AWSが支援する国内100社以上の生成AI導入事例を分析。そこから見えてきた、ビジネスインパクトを創出する「成功の方程式」 が示されました。

        100以上の事例を6つの分野に分類!

        飯田氏は、生成AIのユースケースを「一般的なユースケース」と「業界特化の課題にフォーカスしたユースケース」の2つに大きく分類。さらに、ハイインパクトなユースケースとして、以下の6つの類型に分類しました。

        • データの抽出
        • 商材作成の支援
        • サポート業務の支援
        • パーソナライゼーション
        • 営業活動の支援
        • 審査業務の効率化

        公式「AWS AI Day Tokyo」はこちら!

        生成AIの最前線を探る: 最新事例と実践的ハンズオン
        https://aws-ai-day-jp.splashthat.com/
        2024 年 09 月 09 日 14:00 – 18:00 JST

        今回は、イベント内の講演セッション中盤の刺激的な企業での事例紹介と分類から見えてきた価値ある視点をレポートします。

        100 以上の生成 AI 事例に見る ビジネスインパクト創出の方程式

        アマゾン ウェブ サービス ジャパン合同会社 金融事業開発本部長

        画像

        飯田哲夫 氏による講演は「100 以上の生成 AI 事例に見る ビジネスインパクト創出の方程式」というタイトルでした。

        生成 AI に関心がある企業が増える一方、具体的な活用方法がイメージできない企業は 6 割、さらに導入したものの社員の利用率が 1~2 割に留まる調査結果が報告されています。この結果は、生成 AI の敷居の低さに比べて価値創出の難易度が決して低くないことを示しています。本セッションでは、AWS の 100 社超える国内の生成 AI 本番導入事例と Amazon を含む海外の事例から、効果の高いユースケースと、事例化した企業に共通するビジネスインパクト創出の方程式を解き明かします。

        えっ、25分の講演で「100 以上の生成 AI 事例」なんてどうやって紹介するんだろう!?しかも「具体的な活用方法がイメージできない企業は 6 割、さらに導入したものの社員の利用率が 1~2 割に留まる調査結果が報告」という状況は報道等でも言われている雰囲気ではありますが、どんなAWSマジックがあるのでしょうか、聞く前からワクワクです。

        飯田氏「数十万の日本のAWSのお客さんの中で100事例は少なすぎるぐらい」

        画像

        飯田氏の講演では、まずユースケースを2つに分けました。
        ・業界特化のユースケース
        ・一般的なユースケース

        画像

        さらに様々な産業で共通する「一般的なユースケース」において
        ・顧客体験をさらに高める
        ・従業員の生産性と創造性を加速する
        ・ビジネスプロセスの最適化
        といった軸で具体的な整理が進められました。

        画像

        さらに「業界特化の課題にフォーカスしたユースケース」において
        ・ヘルスケア/ライフサイエンス
        ・製造業
        ・金融サービス
        ・流通/小売
        ・メディア&エンタメ
        といった各業界において具体的な事例を列挙していきます。

        画像

        ハイインパクトなユースケースの類型

        そして「ハイインパクトなユースケースの類型」
        ・データの抽出
        ・商材作成の支援
        ・サポート業務の支援
        ・パーソナライゼーション
        ・営業活動の支援
        ・審査業務の効率化
        という分類が示されました。

        画像

        さてここからは具体的な事例です。

        1社あたり3行程度の事例ですが、具体的な数字を入れつつすごい勢いでインパクトのある事例が紹介されていきます。

        ・データの抽出

        画像

        第一興商:入社1ヶ月の新人が3週間で9割は採用基準を満たす会話記録

        画像

        AWS未経験で入社1ヶ月の新人が3週間でAmazon TranscribeとAmazon Bedrockを利用して検証。約9割は基準を満たす良好な結果。

        ・商材作成の支援

        画像

        パルシステム:マーケティングのための商材作成
        FFB: ユーザーが撮影した写真をSNSへ投稿する際、ハッシュタグの作成キャプションとタグの生成に15分以上要していた。生成AIの適用により作業効率50%以上削減。

        北海道文化放送:FAXで届くリリース情報からニュース原稿の作成フローにAI活用

        画像

        ・サポート業務の支援

        日本製鋼所: 営業応対に活用。開発期間2ヶ月

        画像

        セゾンテクノロジー: HULFT製品のテクニカルサポートエンジニアが回答作成時間を最低30%短縮

        画像

        ・パーソナライゼーション

        パーソナライゼーションではNatWestの事例

        画像
        画像

        ・営業活動の支援

        営業活動の支援ではエフピコさんの事例で日報作成を紹介。

        画像
        画像

        ・審査業務の効率化

        画像

        審査業務の効率化では野村ホールディングスの事例と、FleGrowthでの監査対応トレーニング事例が紹介されました。 ISMS(情報セキュリティマネジメントシステム)認証のために参照する社内規定、マニュアルは100以上。
        一人のエンジニアが3ヶ月でデモを構築、3ヶ月のブラッシュアップでリリース。

        100以上の事例に見る共通点

        これまで6分野に分類して一気にインパクトのあるユースケースを紹介いただきましたが、実はこれらの事例には「共通点」があるそうなのです。

        画像

        ・顧客起点文化: 顧客体験はもちろん社内の営業やカスタマーサポートの人たちの作業評価サイクルがあること。
        ・小規模なチーム: 2-4名もしくは1名
        ・頻繁な実験: 1-3ヶ月で本番稼働

        これらはリクルートの新卒エンジニアチームによる事例もエビデンスと言えると感じました。

        まず始める
        そして加速する

        画像
        画像

        成功事例には、顧客起点の文化、小規模なチーム、頻繁な実験という共通点があることがエビデンスとともに示されました。 汎用性の高いものから、各企業の独自性、業界特有のものへと発展していきます。 飯田氏の講演は「まずはハイインパクトなユースケースから取組み、実験・傾聴・反復のサイクルを加速させましょう」というメッセージでまとめられました。

        画像

        成功企業に共通する「3つのポイント」とは?

        100以上の事例を分析した結果、成功企業には以下の3つの共通点があることが明らかになりました。

        1. 顧客起点文化: 顧客体験はもちろんのこと、社内の営業やカスタマーサポートにおける評価サイクルが確立されている。
        2. 小規模なチーム: 2〜4名、もしくは1名体制でプロジェクトを推進。
        3. 頻繁な実験: 1〜3ヶ月という短期間で本番稼働までこぎつけ、PDCAサイクルを高速で回している。

        これらのポイントは、リクルートの新卒エンジニアチームによる事例からも裏付けられています。

        まずは小さく始めて、高速PDCAで成果を最大化!

        飯田氏は最後に、「まずはハイインパクトなユースケースから取り組み、実験・傾聴・反復のサイクルを加速させましょう」と締めくくりました

        聴講した感想

        圧倒的な事例数と説得力のあるメッセージが印象的な講演でした。

        近い講演が資料が8月に公開されていますが、飯田氏の講演ではさらに事例の追加と整理が進んでいるという印象でした。

        https://speakerdeck.com/player/4e1225d6d4664ad3818cce81a60a4114

        世間一般で言われているような「企業でのAI活用が進まない」というステレオタイプとは裏腹に、かなりのスピード感で一般化しており、また「インパクトのある成果の影にAWSあり」という印象を持つことができました。

        圧倒的な事例数によるすごくいい講演だと思いました。
        前後の講演の構成もフワッとした話が具体的になり、さらに「自分でやりたい」という気持ちが起きる良い構成でした。
        良い講演をありがとうございました。

        【レポートはまだまだ続きます!】

        次回は、KDDIアジャイル開発センター株式会社のテックエバンジェリスト、御田 稔(みのるん)氏による講演「突撃!隣のAmazon Bedrockユーザー ~YouはどうしてAWSで?~」をレポートします! お楽しみに!

        こちらのレポートと、気になるワークショップについてのレポートを予定しております。

        Originally published at https://note.com on Sept 10, 2024.

      5. [期間限定有料]リポジトリに異変あり!?AUTOMATIC1111 vs ComfyUI

        本記事はメンバーシップ向け期間限定有料記事です

          画像生成AIで注目される「ComfyUI」とは

          AI画像生成の世界では、ユーザーフレンドリーなツールの需要が高まっています。その中で、ComfyUIは画期的なソリューションとして注目を集めています。

          ComfyUIは、Stable Diffusionをベースにした強力かつ柔軟なオープンソースの画像生成AIのためのグラフィカルユーザーインターフェイス(GUI)です。その特徴的なノード(node: ネットワークの節点)ベースのインターフェイスにより、複雑な画像生成プロセスを視覚的に構築し、細かく制御することが可能になりました。

          初心者にとってノードベースのGUIは直感的な操作性を提供し、上級者には複雑な処理を構築する自由度と可視化性能を与えています。そのほかにも高度なカスタマイズ性、拡張性、リソース効率の良さなど、ComfyUIは多くの利点を備えています。

          2024年7月末現在の世界の画像生成AIの2大WebUIのGoogle検索のトレンドを可視化してみました。

          画像

          念の為、2024年8月末で過去90日で確認してみました。

          画像

          See Interest over time on Google Trends for ComfyUI, automatic1111 – Worldwide, Past 90 days

          結果は圧倒的な差で、2023年12月以降ComfyUIが注目されています。AUTOMATIC1111が下がっているのではなく、ComfyUIに対する検索がこの期間で2~3倍に増えているという見方もできます。

          つまり、従来の「AUTOMATIC1111」だけでなく「ComfyUI」に関する注目が相対的に3倍に増えているということで、AUTOMATIC1111(以下A1111)からComfyUIに全移行しているということではなく、興味関心が集まっており、かつこの分野「画像生成AI」の検索人口が増えているという理解です。

          更に重大な問題が起きていた

          AICU media編集部がこの問題、「ComfyUIとAutomatic1111の関係」に注目をはじめてリサーチを開始した7月末から1ヶ月、実はもっと重大な問題が起きていました。

          画像

          こちらは、ComfyUIの作者である「ComfyUIAnoymous」さんのGitHubアカウントです。

          https://github.com/comfyanonymous

          御名前が「ComfyUIの匿名希望」ですが、非常に精力的に活動されており、実在する人物であることがわかります。GitHubは複数のアカウントをつくることを推奨されていません。なお、ComfyUIさんの正体についてご興味がある方は、最後までお読みいただければ幸いです。御本人のメッセージも翻訳しておきました。

          一方で、AUTOMATIC1111さんのGitHubです。

          画像

          https://github.com/automatic1111

          実は、AUTOMATIC1111氏はこの2ヶ月、AUTOMATIC1111/stable-diffusion-webui(便宜上A1111webUIと呼びます)のメインブランチにコミットしていません。

          https://github.com/AUTOMATIC1111/stable-diffusion-webui/commits/master

          AICU mediaでも最新のA1111webUIの状況は常にレポートしてきたのですが、最新のv.1.10.0が最新かつ、長期メンテンナンスに適したバージョンであるという予測は間違っていなかったようです。

          AUTOMATIC1111氏の消息はわかりませんが、コミット状況から察するに、週末のみの活動(平日はオープンではない仕事に従事している)か、燃え尽きてしまったのかもしれません。

          A1111webUI-Extensionのほうのリポジトリは動いていますので、メインリポジトリは動いています。

          https://github.com/AUTOMATIC1111/stable-diffusion-webui-extensions

          AUTOMATIC1111氏の実在はA1111webUI以前の過去の活動から知られていた人物であり、確認はされていますが、一方で最近のGitHubの状況はオープンソースの世界では望ましい状況であるとは言い難いかもしれません。

          参考までに、AICU media編集長のGitHubアカウントです。

          画像

          https://github.com/kaitas

          過去のオープンソース活動などのメンテナンスも行っていることが普通の状態なので「数カ月にわたって草が生えていない」という状態は、このアカウント自体の生存が心配されるレベルなのではないでしょうか。人気のオープンソースプロジェクト開発の重圧というものは想像を絶する大変さがあると考えますが、AICU mediaとしてはまず無事であることを祈っています。

          ComfyUIannoymous氏のGitHubにも異変

          ここ数日の動きですが、ComfyUIannoymous氏は、リポジトリの移行作業を行っているように見えます。

          画像

          現状の個人のアカウントでの開発から、自動でComfy-orgのリポジトリへコードを引き上げています。

          https://github.com/Comfy-Org/ComfyUI-Mirror

          このComfy-Orgのリポジトリには興味深いプロジェクトが多くあります。

          ComfyUIフロントエンド

          https://github.com/Comfy-Org/ComfyUI_frontend

          ComfyUIコマンドライン・インタフェース(CLI)

          https://github.com/Comfy-Org/comfy-cli

          ・ComfyUI をコマンド 1 つで簡単にインストールできます
          ・ComfyUI 拡張機能と依存関係のシームレスなパッケージ管理
          ・ComfyUI の機能を拡張するためのカスタムノード管理
          ・チェックポイントをダウンロードしてモデルハッシュを保存する
          ・クロスプラットフォーム互換性(Windows、macOS、Linux)
          ・包括的なドキュメントと例

          pip install comfy-cli

          シェルのオートコンプリート機能:シェルに自動補完ヒントをインストールするには、次のコマンドを実行します。

          comfy –install-completion

          これにより、[tab]キーやコマンドとオプションを自動補完できるようになります。

          ComfyUIのインストール:comfy を使用して ComfyUI をインストールするには、次のコマンドを実行します。

          comfy install

          MacのOSXでよく利用されるhomebrewコマンドンライン・インタフェースです

          https://github.com/Comfy-Org/homebrew-comfy-cli

          brew tap Comfy-Org/comfy-cli
          brew install comfy-org/comfy-cli/comfy-cli

          ComfyUIのUI部分だけを切り出したプロジェクト「LiteGraph.js」

          https://github.com/Comfy-Org/homebrew-comfy-cli

          デモサイトはこちら https://tamats.com/projects/litegraph/editor/

          Pure DataMax/MSP/Jitterスタイルの音楽UIがデモされています

          画像

          Web上でノードベースのUIをつくるのに便利そうです。

          公式Webサイトなどにも注意

          2024年6月19日、Xに@ComfyUIというアカウントが誕生しました。

          なお、似たドメインに「ComfyUI.org」がありますが、これは非公式サイトです。公式サイトはこちら「https://comfy.org」です。

          https://www.comfy.org

          最初にComfyUIで生成された画像、というトップ画像が印象的です。

          画像

          https://github.com/Comfy-Org

          ComfyUI公式「よくある質問」より(翻訳)

          Q:今後の計画について教えてください。
          A:Comfyでは、常に最先端を行くために、最先端のモデルを採用し続けます。また、PRをレビューし、Githubの問題に迅速に対応することを目指しています。また、カスタムノード作成者のユーザーエクスペリエンスと開発者エクスペリエンスを向上させる必要があります。正確なモデルについてはまだ検討中ですが、将来の改良はGithubのProjectsで共有する予定です。すべての大きな変更はGithubのディスカッションとして始まり、私たちのDiscordとMatrixサーバーで共有されます。最終的なデザインに達したら、公開ロードマップに実装を追加します。私たちのTwitter、Discord、Matrixサーバーで最新情報をご確認ください。

          Q:プロジェクトはどうやって維持するのですか?
          A:現在、私たちはお金を稼いでいません。オープンソースのAIツールを開発するという私たちのビジョンに賛同してくださるサポーターや投資家に支えられています。そのような方は、hello@comfy.org。将来的にはお金を稼ぐつもりです。

          Q:どうやってお金を稼ぐのですか?
          A:最近のComfyUIのセキュリティ上の懸念にはどのように対処するのですか? レジストリ上のノードは意味的にバージョン管理され、悪意のある動作についてスキャンされます。すべてをキャッチすることはできませんが、ノードがカスタムピップホイールを含むかどうか、任意のシステムコールを実行するかどうか、外部APIを呼び出すかどうかのチェックを近々追加する予定です。フラグが立てられたノードは人間がレビューします。さらに重要なことは、セキュリティ上の懸念が見つかった場合、そのノードを禁止し、そのノードをインストールしたユーザーに通知することです。このプロセスは時間をかけて改善される予定です。

          Q:他に取り組んでいるプロジェクトはありますか?
          A:ComfyUIはアプリケーションであり、バックエンドであり、開発者プラットフォームです。私たちはComfyUIを安全で信頼性の高いものにするためにツールに投資しています。私たちは、カスタムノードをホストするリポジトリであるComfy Registryをホストしています。レジストリ上のノードは意味的にバージョン管理され、悪意のある動作がないかスキャンされます。我々はすべてをキャッチすることはできませんが、ノードがカスタムピップホイールを含むかどうか、任意のシステムコールを実行するかどうか、または外部のAPIを呼び出すかどうかのチェックをすぐに追加する予定です。また、Comfyの新しいコミットを様々なオペレーティングシステムやGPU上のワークフローに対してテストする継続的インテグレーションテストスイートもホストしており、Comfyの信頼性を高めています。

          Q:コアとなる原則は何ですか?
          A:透明性とコミュニケーション。2.オープンソースとコミュニティ主導。3.AIの民主化

          Q:基盤モデルについてはどうですか?
          A:OSS AIコミュニティにおける最近の混乱にもかかわらず、OSS AIモデルには膨大な進歩があります。私たちはOSSモデルビルダーと密接に協力し、最高のモデルをComfyUIに導入しています。また、将来的にはAIモデルにより多くのリソースを投入する予定です。

          Q:どのようにComfyUIに貢献できますか?
          A:私たちのdiscord/matrixチャンネルでフィードバックをしたり、参加することができます。バグレポートや機能リクエストの提出にご協力いただける場合は、Githubに課題(Issue)を作成してください。多くの課題には #good-first-issue というタグがつけられています。それ以外の場合は、PRを投稿してください。近い将来、他のOSSプロジェクトと同様のガバナンス構造を導入する予定です。

          Q:Comfyの最新情報を得るにはどうしたらいいですか?
          A:Twitterでフォローしたり、DiscordやMatrixチャンネルに参加してください。


          以下は御本人のブログからの翻訳です。


          この記事の続きはこちらから https://note.com/aicu/n/n4ded178bc0e5

          Originally published at https://note.com on Aug 31, 2024.

        1. 【広告にAIは使えない?】広告の先生×AIクリエイター=「生成AI時代の広告企画から動画制作プロセス」をどうぞ

          こんにちは!AICUコラボクリエイターのぽんずです。
          まだまだ暑いですね!健康に良い飲み物をどうぞ。

          先日、マクドナルドが生成AIを使った広告を展開し、話題になりましたね。「生成AIってすごいけど、リスクもあるの…?」「結局、広告にどう使えばいいか分からない…」そう感じている方も多いのではないでしょうか?

          しらいはかせも言ってます

          超入門: Stable Diffusionではじめる画像生成AI」予約販売開始、おめでとうございます!

          ぽんずも作ってみました。

          「あつあつスープ」という一番関係ない歌をテーマソングに採用したM-CMです。AI広告の可能性を日々探っています。

          先日、AI動画で大きな国際賞を頂いたおかげもあって、色んなお仕事をいただくようになったのですが、実は同時並行でAICUでビッグなプロジェクトに関わらせていただいておりました!こちらです!

          画像

          Colosoオンライン講座「初級者:
          生成AI時代の広告企画から動画制作プロセス」

          Colosoさんから「初級者:生成AI時代の広告企画から動画制作プロセス」というタイトルで動画教材がリリースされます!!!

          生成AIによるCM制作は別の次元へ…

          実は、生成AIによるCM制作は、もう “別の次元” に進化しようとしています。そして、その “正しい使い方” を学べるのが、この秋Colosoで開講するオンライン講座 「初級者:生成AI時代の広告企画から動画制作プロセス」 です!7日後の8月30日についに公開オンライン講座プラットフォーム「Coloso」で公開されます!

          画像

          【6,000円割引クーポン付】事前通知を申請する>> https://bit.ly/3SWscoI

          この講座は、世界が認めた新進気鋭のAI広告クリエイター と 広告業界の受注も発注も経験した映像クリエイティブの先生、そして クリエイティブAIの世界でメディア事業を推進するAICU がプロデュースする、超実用的な初心者向けの講義になります。

          AIを使う人も、これから使ってみたいと思う人も、必見の内容です。

          画像
          野生のAI制作者が先生ふたりに囲まれる図

          藤吉さん(セツナクリエイション代表/AICUコラボクリエイター):
          ビデオグラファー出身のクリエイティブディレクターとして、生成AIは競合になるのかパートナーになるのか危機感を持って眺めてきました。AICUのコミュニティで得た知識で実務でどう扱っていくか研究してきたことをお伝えできる内容になっています。広告会社やプロダクションで働く方、クリエイターとしてお仕事をしていきたい方など様々な働き方をされている方にとって新たな発見を得ることができる講座です。生成AIで新しいクリエイティブの扉を開きましょう!

          しらいはかせ(AICU代表/デジタルハリウッド大学大学院客員教授):
          書籍「画像生成AI Stable Diffusionスタートガイド」を出した頃は『動画生成AIは5年はかかる』と言われていましたが、1年も経たずに実用レベルのサービスが出てきました。これまで画像生成AIクリエイティブの世界で「つくる人をつくる」を推進してきましたが、このたびColosoさんのプロデュースで藤吉さん・ぽんずさんらと新作を公開できることを嬉しく思います。既に「超入門: Stable Diffusionではじめる画像生成AI」という、ファッションやバリエーション広告向けのフォトリアルな画像生成についての入門プログラムを先行して開発しています。本日公開した新作第2弾は、更にそれを動画にしていくプロの動画や広告制作者向けの内容になります。2本セットでお楽しみいただけると最高です。

          実際に私・ぽんずも、AIを使うクリエイターとして広告の先生と一緒に講座制作に携わらせていただきました。おふたりとも優しい語りで一緒に仕事しているとドンドン自分の才能が開発されていく感じがあって楽しいです。 AIを使う目線だけでは絶対に気づけない、広告世界のリアルを肌で感じ、本当に刺激的な経験となりました!

          今、Colosoで講座の事前通知申請を申請すると 6,000円の割引クーポン がもらえますので、少しでも興味がある方は申請だけでもしておいてください!【6,000円割引クーポン付】事前通知を申請する>> https://bit.ly/3SWscoI講座カリキュラムの詳細ページは、7日後の8月30日に公開予定です。

          楽しみにお待ちください。事前通知を申請する>> https://bit.ly/3SWscoI

          以上、お知らせでした!

          関連

          ■【超入門 Stability AI API】「モデルとの対話」実習編。Stable Diffusion 3 時代に知っておきたいプロンプトの新常識

          ■「Coloso」とのコラボ講座「超入門: Stable Diffusionではじめる画像生成AI」を開講します

          https://note.com/o_ob/n/n430a15b8563d

          世界を舞台にAICUが開発「超入門: Stable Diffusionではじめる画像生成AI」Colosoで予約販売開始!!

          Originally published at https://note.com on Aug 23, 2024.