タグ: Coloso

  • Coloso講座第2弾「初級者:広告企画から動画制作までのプロセス」配信開始!!

    AICUxColosoコラボ企画第2弾「広告企画から動画制作までのプロセス」が2024年10月31日(木)18時に配信開始となります。この講座では、MidJourney, Runway, Sunoなどの生成AIツールを活用した広告の企画から動画と楽曲制作まで、初心者でも制作できるように解説しています。

    AICUのコラボクリエイター 藤吉香帆さんが中心になって製作しています。動画を中心としたデジタルクリエイティブや広告を制作しながら、生成AIの魅力と可能性を世の中に伝えています。

    生成AI時代の動画広告プロダクションを理解

    生成AI時代における動画制作工程のパラダイムシフトに対応するための知識を、各生成AIツールの設定や特徴と共に解説します。

    画像

    https://corp.aicu.ai/ja/runway-gen-3-alpha

    生成AIを活用したプロモーションビデオ制作方法を習得

    MidjourneyとRunway、Sunoを活用したキャッチーなCM動画制作の全プロセスを、基礎から学ぶことができます。

    画像

    プランニングにおける生成AIの活用方法

    動画広告制作の過程やプランニングをする上で、生成AIを活用してより効率的にする方法を、実演を通して分かりやすく解説します。

    画像

    こちらは ぽんずさんの作品です。Coloso番組内ではもっとすごい!

    本講座を通して、生成AIを用いた動画制作に挑戦することで、生成AIの活用法を学んでいただければ幸いです。

    画像
    画像

    生成AIツールを活用した広告企画から動画制作までのプロセスを習得

    講師陣はこちら

    画像

    藤吉香帆:動画クリエイター、セツナクリエイション合同会社 代表取締役。デジタルハリウッド大学 非常勤講師。

    ぽんず:生成AIクリエイター。各種イラスト・動画コンペで受賞歴多数。

    白井暁彦:生成AIクリエイティブAICU代表。デジタルハリウッド大学大学院 特任教授。著書に「AIとコラボして神絵師になる 論文から読み解くStable Diffusion」など。

    こんな方におすすめ

    ・動画広告制作に興味がある方
    ・生成AIを使ったクリエイティブ制作を学びたい方
    ・広告代理店や制作会社で働く方
    ・最先端の広告制作スキルを身につけたい方

    画像

    今ならお得な割引キャンペーン実施中!

    いよいよ、2024年10月31日リリース予定です。
    定価 25,350円
    →現在は 24%offの¥19,013円
    リリース後は割引価格が終了します!

    詳細はこちら: [https://j.aicu.ai/coloso2]

    https://note.com/iamkaho/n/n81b7691db92d

    AICU x Colosoコラボ企画3作はこちら
    【Coloso講座】ComfyUIマスター:カスタムノードとアプリ開発
    ComfyUIを活用したワークフローの構築と画像生成の実践講座

    https://bit.ly/3YsuzCP 👈 

    https://j.aicu.ai/coloso1

    https://note.com/o_ob/n/n4aa82191b566

    Originally published at https://note.com on Oct 28, 2024.

  • 【広告にAIは使えない?】広告の先生×AIクリエイター=「生成AI時代の広告企画から動画制作プロセス」をどうぞ

    こんにちは!AICUコラボクリエイターのぽんずです。
    まだまだ暑いですね!健康に良い飲み物をどうぞ。

    先日、マクドナルドが生成AIを使った広告を展開し、話題になりましたね。「生成AIってすごいけど、リスクもあるの…?」「結局、広告にどう使えばいいか分からない…」そう感じている方も多いのではないでしょうか?

    しらいはかせも言ってます

    超入門: Stable Diffusionではじめる画像生成AI」予約販売開始、おめでとうございます!

    ぽんずも作ってみました。

    「あつあつスープ」という一番関係ない歌をテーマソングに採用したM-CMです。AI広告の可能性を日々探っています。

    先日、AI動画で大きな国際賞を頂いたおかげもあって、色んなお仕事をいただくようになったのですが、実は同時並行でAICUでビッグなプロジェクトに関わらせていただいておりました!こちらです!

    画像

    Colosoオンライン講座「初級者:
    生成AI時代の広告企画から動画制作プロセス」

    Colosoさんから「初級者:生成AI時代の広告企画から動画制作プロセス」というタイトルで動画教材がリリースされます!!!

    生成AIによるCM制作は別の次元へ…

    実は、生成AIによるCM制作は、もう “別の次元” に進化しようとしています。そして、その “正しい使い方” を学べるのが、この秋Colosoで開講するオンライン講座 「初級者:生成AI時代の広告企画から動画制作プロセス」 です!7日後の8月30日についに公開オンライン講座プラットフォーム「Coloso」で公開されます!

    画像

    【6,000円割引クーポン付】事前通知を申請する>> https://bit.ly/3SWscoI

    この講座は、世界が認めた新進気鋭のAI広告クリエイター と 広告業界の受注も発注も経験した映像クリエイティブの先生、そして クリエイティブAIの世界でメディア事業を推進するAICU がプロデュースする、超実用的な初心者向けの講義になります。

    AIを使う人も、これから使ってみたいと思う人も、必見の内容です。

    画像
    野生のAI制作者が先生ふたりに囲まれる図

    藤吉さん(セツナクリエイション代表/AICUコラボクリエイター):
    ビデオグラファー出身のクリエイティブディレクターとして、生成AIは競合になるのかパートナーになるのか危機感を持って眺めてきました。AICUのコミュニティで得た知識で実務でどう扱っていくか研究してきたことをお伝えできる内容になっています。広告会社やプロダクションで働く方、クリエイターとしてお仕事をしていきたい方など様々な働き方をされている方にとって新たな発見を得ることができる講座です。生成AIで新しいクリエイティブの扉を開きましょう!

    しらいはかせ(AICU代表/デジタルハリウッド大学大学院客員教授):
    書籍「画像生成AI Stable Diffusionスタートガイド」を出した頃は『動画生成AIは5年はかかる』と言われていましたが、1年も経たずに実用レベルのサービスが出てきました。これまで画像生成AIクリエイティブの世界で「つくる人をつくる」を推進してきましたが、このたびColosoさんのプロデュースで藤吉さん・ぽんずさんらと新作を公開できることを嬉しく思います。既に「超入門: Stable Diffusionではじめる画像生成AI」という、ファッションやバリエーション広告向けのフォトリアルな画像生成についての入門プログラムを先行して開発しています。本日公開した新作第2弾は、更にそれを動画にしていくプロの動画や広告制作者向けの内容になります。2本セットでお楽しみいただけると最高です。

    実際に私・ぽんずも、AIを使うクリエイターとして広告の先生と一緒に講座制作に携わらせていただきました。おふたりとも優しい語りで一緒に仕事しているとドンドン自分の才能が開発されていく感じがあって楽しいです。 AIを使う目線だけでは絶対に気づけない、広告世界のリアルを肌で感じ、本当に刺激的な経験となりました!

    今、Colosoで講座の事前通知申請を申請すると 6,000円の割引クーポン がもらえますので、少しでも興味がある方は申請だけでもしておいてください!【6,000円割引クーポン付】事前通知を申請する>> https://bit.ly/3SWscoI講座カリキュラムの詳細ページは、7日後の8月30日に公開予定です。

    楽しみにお待ちください。事前通知を申請する>> https://bit.ly/3SWscoI

    以上、お知らせでした!

    関連

    ■【超入門 Stability AI API】「モデルとの対話」実習編。Stable Diffusion 3 時代に知っておきたいプロンプトの新常識

    ■「Coloso」とのコラボ講座「超入門: Stable Diffusionではじめる画像生成AI」を開講します

    https://note.com/o_ob/n/n430a15b8563d

    世界を舞台にAICUが開発「超入門: Stable Diffusionではじめる画像生成AI」Colosoで予約販売開始!!

    Originally published at https://note.com on Aug 23, 2024.

  • 世界を舞台にAICUが開発「超入門: Stable Diffusionではじめる画像生成AI」Colosoで予約販売開始!!

    生成AIの常識を覆した「Stable Diffusion」の革命から2年…「つくる人をつくる」AICUが世界を舞台に大型新作をリリース!

    クリエイティブAI時代に「つくる人をつくる」をビジョンに活動する生成AIの最先端を走り続けるクリエイターユニオン「AICU」が、Stable Diffusionによる最新・最先端・最高品質の画像生成の基礎から応用までを丁寧に解説するオンライン講座を国際的なラーニングプラットフォーム「コルソ」で開講します!

    ▼ Coloso講座ページはこちら ▼
    https://j.aicu.ai/AICUXColosoJP

    「画像生成AIって難しそう…」

    そんな風に思っていませんか?

    この講座は、AI初心者の方でも安心して学べるよう、AICUが開発した特別なカリキュラムに基づいて構成されています。

    ゼロからスタートし、AI初心者から次の一歩を踏み出すことができるカリキュラムを、Colosoで体験してください!

    画像

    【本講座で得られる3つのメリット】

    1. AI時代の必須スキル「プロンプトエンジニアリング」を基礎から習得
      • 生成AIを使いこなすための「呪文」、プロンプト。高品質、高画質な画像生成が可能になった今、隠されたテクニックは従来とは大きく変わっています。
      • 最新の商用利用可能なStability AI API公式サンプルを使って学ぶことで、 Stable Diffusion 3 時代のポテンシャルを最大限に引き出し、思い通りの画像を生成できるようになります。
      • 単語の選び方や順番といった基本文法から、シードやスタイルといったAPIならではの制御手法、未知のモデルとの対話テクニックなど、2年分のノウハウを体系的に詰め込んだ、先駆者ならではの『勝ち筋』を、入門者からプロフェッショナルに向けて優しく解説します。
    2. Google Colab & Slidesで、コードを書かずに実践的なスキルを習得
      • Google Colab & Slidesで開発された専用ツールを提供。
      • 専門知識不要! 環境構築でつまずくことなく、すぐに実践できます。
      • オープンソースなので改造もカンタン。商用も今すぐできます。
      • APIとツールを使って制御しながらプロフェッショナルな画像を大量に生成する実用的な解説、サンプル、プロンプト集。
      • バーチャルファッションモデル制作や広告バリエーション展開など、 すぐに使える実践的なスキルが身につきます。
    3. 生成AI時代に必要な著作権や倫理に関する知識も網羅
      • AI作品と著作権、倫理的な問題など、知っておくべき重要な知識を丁寧に解説します。
      • 責任あるクリエイターとして、自信を持って活動するための社会基盤としての常識を築きます。
      • 生成AIに関するクリエイティブの倫理課題を人に教えられるレベル、サービスやプロダクトを開発し、契約できるレベルまで高めましょう

    ▼ Coloso講座ページはこちら ▼ 
    https://j.aicu.ai/AICUXColosoJP

    【講座内容】

    • 生成AIの基礎知識
    • Stable Diffusion 3の仕組みと特徴
    • プロンプトエンジニアリング入門
    • Stability AI APIを活用した高度な画像生成
    • バーチャルファッションモデルの開発
    • AI技術を駆使した広告制作
    • AIの活用における倫理と未来予測

    使用プログラム
    [メインツール]
    – Stability AI API
    – Google Colab
    – Google Workspace

    【こんな方におすすめ】

    • 画像生成AIに興味があるけど、何から始めればいいか分からない方
    • Stable Diffusionをもっと使いこなしたい方
    • これからの時代を見据え、AIスキルを身につけておきたい方
    • デザイン、アート、広告など、クリエイティブな仕事に携わっている方
    • 業務的な画像生成AIを体系的に学ぶ必要が出てきた企業クリエイター
    • 新しい技術を学び、自分の可能性を広げたい方

    【AICU開発! 本講座だけの特典】

    • AICUによる画像生成AIに必要な知識が詰まった講座動画25講を期間制限なしで受講可能
    • 講座を通してセミリアルや実写など12点の例題を完成
    • 講座内容に関するPDFデータや資料、Google Slidesで使えるツールを提供
    • 画像生成プロンプト集を提供
    • AICUのノウハウが詰まった講座PDF使用を提供

    AICU Inc. は Stability AIと戦略提携を

    AICU Inc.(本社Delaware州Dover City, カリフォルニア州サニーベール)は、Stability AI Ltd.(本社London、United Kingdom)とのパートナーシップを発表しました。このパートナーシップは、エンゲージメント・レターを通じて正式に締結されており、持続革新的でオープンなAIDX(AI Driven user eXperience)開発、技術広報を提供するもので、生成AI技術の社会的認知と価値向上と市場開拓を推進するコミュニケーションに重点を置いています。
    AICU Inc.は、この提携により、Stability AI Ltd. の生成AI技術の社会的認知と円滑なコミュニケーションのために、advocacy communication service としてコンサルティングサービスと開発者・クリエイター支援・技術広報・PoC開発・クリエイターユニオン構築に協力します。

    2024/1/22 AICU Inc. プレスリリースより
    https://prtimes.jp/main/html/rd/p/000000007.000133647.html

    画像

    https://corp.aicu.ai/ja/stability-ai

    【講師紹介】

    • 白井 暁彦:生成AIクリエイティブ「AICU」代表、デジタルハリウッド大学大学院特任教授
    • RUNO.:生成AIクリエイター

    AIの波に乗り遅れるな!
    今すぐ予約して、未来を創造する力を手に入れよう!

    画像

    ▼ Coloso講座ページはこちら ▼ 

    https://bit.ly/AICUXColosoJP

    カリキュラム

    カリキュラム内容から一部を紹介します!

    SECTION 01:画像生成AIの歴史と現在、今後の価値

    画像
    画像
    画像
    画像

    SECTION 02:環境構築

    Google Slidesだけで使えるオリジナルツールが提供されます!

    画像

    その他、Google Colabを使った最新のデモやサンプルもあります。

    SECTION 03:基礎編[SD3時代のモデル評価とプロンプト探求]

    画像

    最新・最先端・高画質のモデル評価手法をしっかりマスター!

    https://j.aicu.ai/SD3GP

    SECTION 04:Stability AI API の革新的機能

    知らないと損、Stability AIのAPIだけで利用できる革新的な機能。

    画像

    Edit機能を活用した画像加工

    Structureを使ったポージング、構造の制御

    画像

    便利なツールと、初心者向けの対話、デモなどを使ってスキマ時間にギュンギュン学べちゃう構成になっています!

    SECTION 05:応用編 [バーチャルファッションモデルの開発]

    バーチャルなファッションブランドのルックブックを作ってみましょう!

    画像

    卒業制作や研究、企業のプロトタイプとして実践的なワークフローを学ぶ最高のチャンスです。

    SECTION 06:活用編 [広告バリエーションの展開と評価手法]

    広告バリエーションの制作にお悩みではありませんか?

    画像

    旅行代理店の広告制作を通して、画像生成AIを使った具体的な広告バリエーションの制作フローを体得できます。もちろんChatGPTを使いこなすプロンプトも含まれています!

    SECTION 07:法律・倫理・未来

    「画像生成AIって違法なの?」法律だけではありません、生成AIクリエイティブ分野の社会実装でトップランナーを続けてきたAICUならではのノウハウ、国家試験である知的財産管理技能検定に基づいた理解と解説、弁護士とのヒアリングで開発した倫理クイズ、子供でもわかる画像生成AIの「陽の当たる未来」のための重要なポイントを他人に説明できるレベルで体系的に学ぶことができます…!

    画像

    受講生全員に提供:AICUの講座だけの特典

    • AICUによる画像生成AIに必要な知識が詰まった、講座動画25講を期間制限なしで受講可能
    • 講座を通してセミリアルや実写など12点の例題を完成
    • 講座内容に関するPDFデータや資料、Google Slidesで使えるツールを提供
    • 画像生成プロンプト
      1. 講座で生成するイメージのプロンプト集提供
    • 講座資料提供
      1. AICUのノウハウが詰まった講座PDF使用を提供

    豊富な例題を通して学ぶ画像生成AIの基礎!

    1. ゴールの設定
    2. Google Slidesで使える自動スライド生成
    3. Google ColabによるStability AI公式サンプルの動作確認
    4. プロンプトの要素の並びによる生成結果の違い
    5. ネガティブプロンプトの有無による生成結果の違い
    6. APIから学ぶSD3時代のText to Imageモデル
    7. ワードリストを使った多様な表現
    8. Conservativeを用いた作品の高解像度化
    9. Edit機能を活用した画像加工
    10. Structureを使った構造の制御
    11. オリジナルLookbookの作成
    12. 広告バリエーションの制作

    講師紹介

    生成AIクリエイティブ:AICU

    [白井暁彦]

    こんにちは。生成AIクリエイティブAICU代表の白井暁彦です。 エンタメ業界とメタバース技術の研究開発や、ホワイトハッカー作家として活動しており、デジタルハリウッド大学大学院で特任教授を務めております。デジハリ発国際スタートアップ企業AICU Inc.は、生成AI 時代に「つくる人をつくる」をビジョンに英語や日本語、フランス語、プログラミング言語など、オープンなクリエイティブ活動を行っている会社です。生成AIの最先端で研究や作家活動を通して、生成AIの魅力と楽しさをたくさんの人々に届かせるために活動しています。

    [RUNO.]

    こんにちは。生成AIクリエイティブ AICUのRUNO.です。昼間は、ITベンチャーでマーケティング・事業開発・データアナリストとして活動しており、夜は、白井主宰のクリエイティブAIラボ「CAIL」で、クリエイティブAI分野の社会実装を研究する「クリエイティブAI系VTuber」として活動しています。得意分野は、プロンプトエンジニアリングやAIサービス開発、執筆、アート制作、事業企画などです。

    https://note.com/runos_log/n/ncf1843b2a30c

    ▼ Coloso講座ページはこちら ▼ https://j.aicu.ai/AICUXColosoJP

    この講座のポイント

    AI時代の必須スキル「プロンプトエンジニアリング」の基礎を網羅的に学習

    具体的な例題と実践を通して、安定した高品質画像生成のために必要なプロンプトの構造から、最新のテクニックまで、プロンプトエンジニアリングのスキルを体系的に学ぶことができます。また、今後登場するであろう、新しい画像生成AIにも応用可能な、普遍的なプロンプト構築の考え方を身に付けます。

    Google ColabとGoogle Slidesを用いたコーディング不要の実践スキル

    プログラミングの知識がなくても、Google ColabとGoogle Slidesを使用して、画像生成AIをビジネスに応用する方法を学びます。特に、バーチャルファッションモデルの制作や広告バリエーションの制作といった、具体的な例題を通して、実践的なスキルを磨いていきます。

    生成AI時代に必要な著作権や倫理における知識

    生成AIを取り巻く法律や倫理的な問題は法律だけではありません。新たな著作権の理解、クリエイティブの扱い、広告ビジュアルや消費者など受け手の理解、そして今後の展望について理解を深めます。それらを通して、AI技術を正しく、責任を持って活用するための知識と、実践的なガイドラインについて学び、持続的な創作活動を行うための基盤を築きます。

    講座内容: 下記のような内容を学べます。

    • 生成AIにおける基礎知識
      1. 画像生成AIの歴史やStable Diffusionの仕組み、AIにおける今後の展望など、AI技術についての理解を深めるために必要な基礎知識を学ぶことができます。
    • プロンプトによる画像生成の文法
      1. 高品質な画像生成を可能にするためのプロンプトの構造と要素、そして最新のテクニックを体系的に学びながら、プロンプトエンジニアリングのスキルを身に付けていきます。
    • Stability AI APIを活用した高度な画像生成
      1. 公式APIを活用した画像編集や構造制御などを実践的に学びながら、高度な画像生成技術を習得します。その上で、AIの可能性を最大限に引き出し、より複雑で創造的な画像生成に挑戦します。
    • バーチャルファッションモデルの開発
      1. バーチャルファッションモデルを制作する例題を通して学んだ知識を応用し、ファッションブランドのLookbookを制作することで、ポートフォリオとして活用できるレベルの作品制作を目指します。
    • AI技術を駆使した広告制作
      1. AIを活用した広告バリエーションの制作を通して、ビジネスにおけるAI活用の可能性を広げ、実践的なマーケティングスキルを習得します。AI技術をビジネスに活用することで、新たな価値創造とイノベーションに挑戦します。
    • AIの活用における倫理と未来予測
      1. 生成AIを取り巻く法的、倫理的な問題を理解し、責任のあるAI活用を実践するための知識を身に付けます。AI技術の倫理的な側面を理解し、持続可能な社会におけるAIのあり方を深く考察することで、AIの未来を創造する力を養います。
    • 無期限視聴:一回の購入で、期限の制限なく視聴することができます。
    • 最安値:08/31 (土) 販売価格が上がります。

    もうすぐ販売価格が上がる予定です。
    今すぐご購入ください!今が最安値!

    ▼ Coloso講座ページはこちら ▼ 

    https://j.aicu.ai/AICUXColosoJP

    インタビューを受けました

    生成AIクリエイティブ
    AICUがお話ししたいこと

    Question.01:該当の分野を勉強している方は、どういう部分を一番難しいと思っているでしょうか?また、本講座を通じて、そのような部分をどのように解決できるでしょうか?

    画像生成AIは、日々進化しており、新しい技術や情報が次々と出てきます。そのため、最新情報をキャッチアップし続けること、そして専門用語や技術的な内容を理解することが難しいと感じている方が多いと思います。この講座では、クリエイティブAIニュースメディアとして、クリエイターのための情報を発信する「AICU」が、基礎知識から先端技術、未来予測までを丁寧に解説していきます。また、実習を通して、実践的なスキルを身に付けることができるので、AI技術への理解を深め、自信を持って活用できるようになると思います。

    Question.02:講師さまご自身は、勉強してきた中で難しかった部分、それを解決するためにどのような努力をされてきましたか?

    日々進化し続ける生成AIの世界で、その技術についていきながら、毎日勉強し続けることが一番大切で、難しいことだと思います。私は、毎日ブログを書くことを続けています。日々の仮説検証や、新技術の検証といった積み重ねが、「自分自身の成長」としてしっかりと可視化できます。これは、ChatGPT時代のクリエイターにとってとても重要なことで、単に道具の使い方を学ぶのではなく、新しい技術に対して適応する速度が大きく変わってきます。

    Question.03:アウトプットを形にすることにおいて、大切なポイントは何になりますか?

    アウトプットを形にする上で大切なポイントは、「明確なビジョンと目的意識を持つこと」、そして「それを達成するための仮説と実験する方法論を持つこと」だと考えています。AI技術は常に進化しており、新しい技術や情報が次々と出てきます。何を作りたいのか、なぜ作りたいのか、誰のために作るのか、といった根本的なメッセージにフォーカスを合わせ、それを明確にすることで、ビジュアル制作の方向性を定めることができ、迷いが少なくなると思います。

    Question.04:講師さまがお考えになる、クリエイティブAI分野においての市場性と展望についてお話しください。

    クリエイティブAI分野は、まだ市場が構築されていません。世間には、謎のAIクリエイターがたくさんいらっしゃいますが、この技術を専門的に学べる場があるわけでもなく、多くの方々は、独学で学んでいる状況です。誰でも簡単に、画像を生成できるサービスが普及する一方で、業務的には、超スピードでインパクトのある画像や映像をつくる人々が求められる、専門性の高いプロフェッショナルな分野になっていくと予測します。単に「安く」ではなく、倫理観がしっかりした「学び続ける人」が、体系的な知識と技術を背景に、速度感をもって大きな市場を作っていくと思います。

    ▼ Coloso講座ページはこちら ▼ 

    https://bit.ly/AICUXColosoJP

    今後の更新情報や、オトクな情報はメンバーシップ向けに発信していきます。

    【8/24追記!】

    8月30日23時59分まで or 先着100名様限定で、AICUの講座限定で5,000円割引が受けられるシークレットクーポンをいただきました!
    リポストで見れるようにしておきましたのでぜひチェックしてください!

    最安値でゲットしてください!


    この記事の続きはこちらから https://note.com/aicu/n/nd680d8290d11

    Originally published at https://note.com on Aug 23, 2024.

  • 【超入門 Stability AI API】「モデルとの対話」実習編。Stable Diffusion 3 時代に知っておきたいプロンプトの新常識

    こんにちは、AICU代表の しらいはかせ です。
    本日は重大ニュースがありますので、最後までしっかりお読みください。

    前回、Stability AI API Guideの「超入門」としてライターのRUNO.さんに基本となるGenerate APIと「TextToImageの最近の文法」を総ざらいしていただきました。

    Google Colabを使って、基本的な操作に慣れたところだと思います。

    この記事ではこの先の画像生成の時代に長く役に立つ「モデルとの対話テクニック」とStable Diffusion 3時代に知っておきたいプロンプトの新常識についてお伝えします。

      「Stable Diffusion 3」の時代に知っておきたいプロンプトの新常識

      モデル、TextToImage、プロンプト、CLIP…

      画像生成AI「Stable Diffusion」の最大の特徴は、テキストを入力することで単語をもとに画像を生成できる機能です。これを「TextToImage(t2i)」、AIに対する指示を行うテキストを「プロンプト」と呼びます。その後も多様な画像生成AIが登場していますが、多くはCLIPという画像と言語の対を学習したモデルが内部に使われており、現在も様々な言語理解を特徴として有したモデルが提案・開発されています。新しい画像生成AIサービスやモデルに出会った時に、まずはモデルと対話して、効率的なプロンプトの構造を理解することが重要です。またモデルや、それを利用したネットワーク、学習方法が多様にあり、多くはそのモデルを調教した側のノウハウにもなるため公開はされていません。想像や噂がネット上にたくさんあるのですが「これが完璧」という方法を一様に宣言することは難しいです。最近のモデルはプロンプトを短くすることに努力が割かれていますし、一方では簡単なキーワードで美麗な結果が出すぎるモデルは「過学習」と言えるかもしれません。

      重要なのは「制御性」と仮説検証テクニック

      画像生成の使い手にとって重要なのは品質や速度、簡単さに加えて「意のままに操れること」つまり「制御性」が重要になります。いくつかのポイントをおさえて仮説検証を行いながらモデルと対話すると、短時間でその特徴を理解して制御することが可能になってきます。

      「モデルとの対話」と実用的で再現可能な実験手法

      また公式情報として提供されているStability AI 公式のAPIガイド、そしてサンプルに散りばめられたプロンプトテクニックを読むことも重要なヒントになります。さらにコミュニティの開発者や探求者による情報も重要なヒントがあります。大事なポイントは、噂や推測でなく、自分で手を動かして、それを検証しなが「モデルと対話」していくことです。実用的で再現可能な実験手法です。ここでは、いくつかの実践的な例や実験手法を通して、最新のStable Diffusion 3時代の文法や表現力を引き出すコツをお伝えします。

      例:ネガティブプロンプトの位置づけの変化

      たとえばこちらに、海外で書かれたStable Diffusion 3 Medium (SD3M)に関する検証記事があります。
      How to get the best results from Stable Diffusion 3
      Posted June 18, 2024 by @fofr
      https://replicate.com/blog/get-the-best-from-stable-diffusion-3

      コミュニティのDELLさんが日本翻訳を公開してくれています。
      ■あなたはStable diffusion 3 の真の性能を発揮できていない

      https://qiita.com/nqdior/items/bd980e2664966871272e

      従来のStable Diffusionと SD3Mが異なる要素として、

      1. プロンプトの長さの制限が大幅に緩和され、より詳細な指示が可能になったこと
      2. 3つのテキストエンコーダーが採用され、表現力とメモリ効率のバランスを取れるようになったこと
      3. ネガティブプロンプトが効果を持たなくなり、詳細なポジティブプロンプトと適切な設定が重要になったこと

      などが挙げられています。SD3Mはオープンモデルなので実際にComfyUI等を使ってより詳細に対話することができます。ネガティブプロンプトはノイズを与える程度の意味しかなくなっています。さらにポジティブプロンプトはより具体性が求められ、従来あったCLIP テキストエンコーダーの77トークンの制限を気にする必要はなく、プロンプトは10,000文字、または1,500語以上といった、従来のプロンプトの常識とは異なるモデルになっています。

      前回の復習「プロンプトの文法:モデルとの対話ポイント」

      Stability AI API で提供されている各種モデル(Ultra, Core, SD3Large等)は、上記のSD3Mと同じではなく、上位のSD3を使ってより使いやすくトレーニングされたモデルになっています。
      前回のポイントを復習しながら、実際に手を動かしながら理解を深めてみたいと思います。同じプロンプト、同じシードを設定すると同様の結果画像が出力されますので、是非お手元で試してみてください。

      画像

      それでは実際に、公式で提供されているGoogle Colabサンプルを用いて、
      画像生成してみましょう!

      Stability AI 提供の公式サンプルへのショートカット
      https://j.aicu.ai/SAIci

      APIリファレンスから参照する場合はこちらから
      https://platform.stability.ai/docs/api-reference

      気になるAPI費用も最高画質のUltraでも1枚10円前後ですから文房具代感覚で使っていくと良いと思います。
      加えて、今回の復習でSD3時代の新常識を身につけると、効率よく画像生成ができるので「GPUやそれを運用する電気代より安い…」という感覚がでてくると思います。

      ポイント①:「生成したい画像のイメージを的確にする」

      画像のイメージ、とはなかなか難しいのですが、「主題・背景・その他」と整理しました。わかりやすく表現すれば単に「女の子」ではなく「女の子、どこで?何着ている?どんな画風で?どんなポーズで?どんな表情をしているの?」といった、主題に続く場面、画風、演出を具体的に意識しましょう。
      逆にモデルと対話したい場合は1語「girl」とだけ打ってみて、Seedや画面の縦横比を変えてみると良いです。具体的な指示がなかったときに何が起きるかを把握できるからです。

      ▼「girl」(seed:39, aspect ratio 1:1)Ultraにて生成

      画像

      ▼「girl」(seed:40, aspect ratio 1:1)Ultraにて生成

      画像

      ▼「girl」(seed:39, aspect ratio 16:9)Ultraにて生成

      画像

      どれも美麗な出力結果ですが、具体的に「どこで、どんな画風で、何を着ているの…?」といった対話するための「画像のイメージ」を持つことが大切です。

      ポイント②:「知っておくべきルール」

      • 英語で書く
      • 単語もしくは 文の区切りにカンマ(,)を入れる

      このあたりは基本として変わらないようです。こういうときも「日本語で書いてみると反応するかも?」という視点で試しておくと良いでしょう。

      ▼「日本人」(seed:39, aspect ratio 16:9)Ultraにて生成

      画像

      ▼「日本人」(seed:40, aspect ratio 16:9)Ultraにて生成

      画像

      日本語をある程度解釈していることがわかります。
      フランス語で「フランス人(les Français)」も試してみましょう。

      ▼「les Français」(seed:38, aspect ratio 16:9)Ultraにて生成

      画像

      ▼「les Français」(seed:39, aspect ratio 16:9)Ultraにて生成

      画像

      想像したような画像が出力されておりますでしょうか?
      フランスの法律によれば、「フランス人」は『すべて個人的にフランス国籍を享受する人々であり、また集団として主権領土として、自由な国民または国家としてフランスを享受する人々』ですが、なかなか「人々」を描いてくれません。日本語の学習と他の言語の学習を比較すると一様ではないということでもあります。

      具体的に英語で「人々(people)」を表現してみましょう。

      ▼「French people」(seed:39, aspect ratio 16:9)Ultraにて生成

      画像

      ▼「Japanese people」(seed:39, aspect ratio 16:9)Ultraにて生成

      画像

      ステレオタイプを強化する意図はないですが、「具体的に、英語で指示する」ことが重要なポイントであることが検証できました。

      カンマや順番についても実験しておきます。

      ▼「Japanese, people」(seed:39, aspect ratio 16:9)Ultraにて生成

      画像

      ▼「people, Japanese」(seed:39, aspect ratio 16:9)Ultraにて生成

      画像

      カンマで区切ったり、順番を入れ替えたりすることで、同シード・同じアスペクト比でも全く異なる画像が出る可能性があることがわかりました。

      ロケ地が近いことはなんとなく想像できるのですが、やはり「プロンプトの具体性がないと、画像として美しい絵はしっかり出るけれども、制御が難しい」という「ルール」が体感できたようであればまずは十分です。

      ポイント③:「クオリティプロンプトを使用する」

      過去、Stable Diffusion 1.x時代、Stable Diffusion XL (SDXL)時代に画像生成界隈で言及されてきたプロンプトの常識として「クオリティプロンプト」がありました。例えば、傑作(masterpiece)、高クオリティ(high quality, best quality)、非常に詳細(ultra detailed)、高解像度(8k)といった「定型句」を入れるとグッと画質が上がるというものです。これは内部で使われているCLIPやモデル全体の学習に使われた学習元による「集合知(collective knowledge/wisdom of crowds/collective knowledge)」なのですが、「それがなぜ画質を向上させるのか?」を説明することは難しい要素でもあります。
      Stability AI APIでも上記のクオリティプロンプトは効果があり、意識して使ったほうが良いことは確かですが、過去と同じ使い方ではありません。
      実験的に解説してみます。

      ultra detailed, hires,8k, girl, witch, black robe, hat, long silver hair, sitting, smile, looking at viewer, full body, flower garden, blue sky, castle, fantasy, vivid color, noon, sunny

      #SD黄色本」からの引用です

      上記のプロンプトをクオリティプロンプトとしての「ultra detailed, hires, 8k,」を変更して、同じシード(seed:39)を使って Stability AI Generate Ultraによる比較をしてみました。

      ▼(seed:39), Stability AI Generate Ultraによる比較

      「girl, witch, black robe, hat, long silver hair, sitting, smile, looking at viewer, full body, flower garden, blue sky, castle, fantasy, vivid color, noon, sunny」

      実は合成魔法なの…!? 過去と異なるクオリティプロンプト

      最近のモデルの言語理解力は「単語単位ではない」ようです。例えば今回の実験で与えた{hires, 8k, ultra detailed}をそれぞれバラバラに与えた場合、ほんの少し画像への影響はありますが、どれも同程度の変化です。

      しかし、「ultra detailed, hires, 8k」という形で3ワード同時に与えた場合は大きく画風が変わります。

      またベースになっているプロンプトにおいても、どこにも『アニメ絵で描いて』という指定は入っていません。{fantasy, witch} といったワードを外しても、プロンプト全体の雰囲気でファンタジーイラストを生成します。

      ▼「girl, black robe, hat, long silver hair, sitting, smile, looking at viewer, full body, flower garden, blue sky, castle, vivid color, noon, sunny」(seed:39) Stability AI Generate Ultraによる生成

      画像

      ▼「girl, black robe, hat, long silver hair, sitting, smile, looking at viewer, full body, flower garden, blue sky, castle, vivid color, noon, sunny」(seed:40) Stability AI Generate Ultraによる生成

      画像

      ここで公式のAPIガイドを確認しておきましょう。

      What you wish to see in the output image. A strong, descriptive prompt that clearly defines elements, colors, and subjects will lead to better results.
      To control the weight of a given word use the format (word:weight), where word is the word you’d like to control the weight of and weight is a value between 0 and 1. For example: The sky was a crisp (blue:0.3) and (green:0.8) would convey a sky that was blue and green, but more green than blue.

      出力画像で表示させたいもの。 要素、色、主題を明確に定義するわかりやすい説明的なプロンプトを使用すると、より良い結果が得られます。
      特定の単語の重みを制御するには、(単語:重み)という形式を使用します。単語は重みを制御したい単語、重みは0から1の間の値です。例えば、「空は晴れやかだった(青:0.3), (緑:0.8)」は、青と緑の空を表現しますが、青よりも緑が強調されます。

      という1文があります。
      要素、色、主題、そしてカッコを使った重み構文についての実験と検証もしてみましょう。

      vivid color,を外して、代わりに「(photoreal:1.0)」を入れてみます。

      ▼(photoreal:0.5), girl, black robe, hat, long silver hair, sitting, smile, looking at viewer, full body, flower garden, blue sky, castle, noon, sunny (seed:40)

      画像

      この構文の数値は「0-1の間をとる」とのことですので、増減させることで、フォトリアル度を制御できます。この数字を減らすことで、アニメ絵に寄せることができるなら便利です。

      (photoreal:0.5), girl, black robe, hat, long silver hair, sitting, smile, looking at viewer, full body, flower garden, blue sky, castle, noon, sunny (seed:40)

      画像

      (photoreal:0.1), girl, black robe, hat, long silver hair, sitting, smile, looking at viewer, full body, flower garden, blue sky, castle, noon, sunny (seed:40)

      画像

      上手くフォトリアル-アニメ度を制御できました。

      逆に、1を超えて大きな値をいれるとどうなるでしょうか。

      (photoreal:2), girl, black robe, hat, long silver hair, sitting, smile, looking at viewer, full body, flower garden, blue sky, castle, noon, sunny (seed:40)

      画像

      うまくリアル度が上がっていきます。
      「さらに大きな値を…」と欲張ってみましたが、ここから先は絵が破綻します。あまりにお見苦しいので興味があるひとはご自身で試してみてください。
      仕様から読み取ることができる使い方としては、複数のワード間の重み付けに使えるので、バランスを取ったり、色指定や表情の指定に使うと良さそうです。

      ▼(photoreal:1) a 10 years old child looks (girl:0.5) (boy:0.5), black robe, hat, long silver hair, sitting, smile, looking at viewer, flower garden, blue sky, castle, noon, sunny (seed:40)

      画像

      男児か女児か微妙な「10歳の子供」が見事に表現できました。

      ポイント④:「ポーズを指定しよう」

      人物画などを生成したいときは、ポーズを指定してみましょう。

      • sitting (座る)
      • raise hands (手を上げる)
      • looking back (振り返る)
      • jumping (ジャンプ)

      こちらも、より深い言語理解を想定して、きちんと人物に係る場所に入れるのが大事です。さらに複数語に渡るワードの強調構文も有効で(AICUの独自実験によると)スペースでもハイフンも認識されるようです。

      (photoreal:1), a10 years old child looks (girl:0.5) (boy:0.5), (hands-on-own-cheeks:1), black robe, hat, long silver hair, sitting, smile, looking at viewer, full body, flower garden, blue sky, castle, noon, sunny (seed:39)

      画像

      (photoreal:1), a10 years old child looks (girl:0.5) (boy:0.5), (hands on own cheeks:1), black robe, hat, long silver hair, sitting, smile, looking at viewer, full body, flower garden, blue sky, castle, noon, sunny (seed:39)

      画像

      男児か女児かわからない10歳ぐらいの子供が、「頬に手を当てこっちをみている」が表現できました。

      ポイント⑤:「構図を指定しよう」

      ポーズを指定しても、思ったような絵が出ない場合は、構図を指定すると効果的です。構図を後から変えると絵全体が変わることがあるので、初めからある程度決めておくのがおすすめです。

      • from above (上から)
      • from below (下から)
      • face focus (顔のアップ)
      • from side (横顔)

      さきほどのプロンプトから「looking at viewer, full body」を外して「(from side:1)」を入れてみます。

      ▼(photoreal:1), a10 years old child looks (girl:0.5) (boy:0.5), (hands on own cheeks:1), black robe, hat, long silver hair, sitting, smile, (from side:1) ,flower garden, blue sky, castle, noon, sunny (seed:39)

      画像

      ▼(photoreal:1), a10 years old child looks (girl:0.5) (boy:0.5), (hands on own cheeks:1), black robe, hat, long silver hair, sitting, smile, (from side:1), (face focus:1) ,flower garden, blue sky, castle, noon, sunny (seed:39)

      画像

      いい感じに顔に注目が当たりました。さらに目線をがんばってみたい。

      ▼(photoreal:1), a10 years old child looks (girl:0.5) (boy:0.5), (hands on own cheeks:1), black robe, hat, long silver hair, sitting, smile, (from side:1), (eyes focus:1) ,flower garden, blue sky, castle, noon, sunny (seed:39)

      画像

      顔や目だけでなく、指にも気遣いたいのでバランスを取っていきます。

      ▼(photoreal:1) (from side:1), a10 years old child looks (girl:0.5) (boy:0.5), (hands on own cheeks:1), black robe, hat, long silver hair, sitting, smile, (finger focus:0.5), (eyes focus:0.5) ,flower garden, blue sky, castle, noon, sunny (seed:39)

      画像

      良いプロンプトができました。
      念のため、シードも複数で試しておきますね。

      ▼(photoreal:1) (from side:1), a10 years old child looks (girl:0.5) (boy:0.5), (hands on own cheeks:1), black robe, hat, long silver hair, sitting, smile, (finger focus:0.5), (eyes focus:0.5) ,flower garden, blue sky, castle, noon, sunny Seed:40

      画像
      指もいいかんじですね

      ▼(photoreal:1) (from side:1), a10 years old child looks (girl:0.5) (boy:0.5), (hands on own cheeks:1), black robe, hat, long silver hair, sitting, smile, (finger focus:0.5), (eyes focus:0.5) ,flower garden, blue sky, castle, noon, sunny Seed:41

      画像
      画像
      Seed 42
      画像
      Seed 43

      「中性的な魅力を持った子供っぽい魔法使い」を制御性高く表現できるようになりました。

      まとめ

      Stable Diffusion 3時代に知っておきたいプロンプトの新常識と、その検証方法を整理しました。ファンタジーイラストからフォトリアルまで、完璧に制御できるプロンプトの文法、さらに画風や性別なども数字で表現できるテクニック、シードを使った制御方法やその確認など、今までのTextToImageよりもさらに深い世界が広がっていることを感じていただけたようであれば幸いです。
      これらのテクニックやモデルとの対話方法により、従来のホビー向けイラスト表現や「一発出し」のフリー画像素材的な使い道を超えて、商業広告やグラフィックデザイン、動画制作のようなプロフェッショナル用途に使用できる可能性が大きく拡がっています。しかもライセンス的にもすべて商用利用可能です。

      AICUもさまざまなAI時代のクリエイターとともに、AI時代の商業映像開発、パイプライン開発、教育マテリアル開発などを行っています。

      Stability AI APIは手軽に使えて高機能で、こんなに美麗なグラフィックスが作れるのに、使いこなしのための情報が少ない!
      AICU media編集部ではこれからも Stability AIさんやクリエイティブAIコミュニティのみなさんと協力して、各種読み物メディアで日々APIガイドの日本語情報を発信していきます。

      記事はこちらに集約されています
      マガジン「Stability AI Fan!」
      ▶Stability AI APIガイド(インデックスページはこちら

      https://note.com/aicu/n/n4eda1d7ffcdf

      そして品質の高い技術を開発していただいている、Stability AIさんありがとうございます!

      https://corp.aicu.ai/ja/stability-ai

      そして「ワタシはこんな風に使いこなしてる!」という方、ぜひAICUでクリエイターとして活躍しませんか?ライターや案件など X@AICUai のDMやメンバーシップ、コミュニティDiscordにて随時お話お聞きしております。

      重大ニュース!「Coloso」とのコラボ講座
      超入門: Stable Diffusionではじめる画像生成AI」開講!!

      さて、誰もが簡単に出せるt2iから、プロフェッショナル向け、商業向けレベルの生成AIクリエイティブの新時代もやってきています。
      これはCGの歴史を振り返ってみても確実な流れです。
      ここで重大ニュースの発表です。

      画像
      https://coloso.global/

      世界中のトップクラスのコンテンツばかりを集めたオンライン講座の国際企業「Coloso」(コロッソ)とAICUが一緒に企画した、初めてのクリエイティブAIに関する専門講座「超入門: Stable Diffusionではじめる画像生成AI」が7日後(2024年8月23日)に公開されます!

      画像
      このシリーズ「超入門 Stability AI API」と同じなのでは…?いえいえ違います!

      講座内容はAICU mediaで人気の日々お送りしている生成AIクリエイティブの情報、画像生成AIの歴史や文化、GPU不要・Macでも安心な環境構築、Google Slidesを使ったオリジナルツール、そして「超入門 Stability AI API」でもお送りしている「Stability AI API」を使って基礎の基礎から丁寧に学ぶ「基礎編」、さらに美麗なファッションデザインを自分で制作する「応用編」、広告業界やクリエイティブ業界にとって気になる「広告バリエーション」を生成AIだけで制作する「活用編」、そして画像生成AIにおける倫理など広範になる予定です。

      画像
      受講者はオリジナルファッションブランドのルックブックを作りあげることができます

      全20講座超え、総プログラム時間10時間を超える豊富なカリキュラムで構成されています。
      (AICUクリエイターの夏休みのすべてが凝縮されています!!)

      【代表からのメッセージ】
      世界の動画ラーニングプラットフォームのトップブランド「Coloso」で、AICUから今回の講座を発表できることを嬉しく思います。
      今回、準備しながら感じたこととして。日々の読み物メディアで発信をしつつ、企業向けコンサルティング大企業向けワークショップで数多くのトップクリエーターさん向けにレクチャーを提供させていただいているAICUですが、今回はさらに広い方々向けに動画メディアで短期集中で実用的なテクニックを確実に学べる講座を企画いたしました。このような企画が短時間で実現できたのは、画像生成AI分野を長年研究し「つくる人をつくる」をビジョンに活動するデジタルハリウッド大学発の国際スタートアップ企業「AICU Inc.」と、国際ラーニングメディア「Coloso」とのコラボならでは!と感じています。
      世界を舞台に日々進化する画像生成AIの分野。長期に活用できるようなテクニックを、従来の画像生成の常識を揺さぶりながら、最新のテクニックを短い時間で丁寧に、楽しく集中して学べる良質コンテンツになっておりますので、「これからはじめてみたい」という方々も、画像生成に詳しい方々も、「最先端の使いこなしを知りたい」「社内教育に使いたい」といった方々にもご活用いただければ幸いです。

      講座のカリキュラムが確認できる詳細ページは、7日後
      8月23日に公開される予定ですのでもう少しお待ちください!

      実は今、Colosoで講座の事前通知申請を申請すると
      6,000円の割引クーポンがもらえるので、お得な特典をお見逃しなく!
      ▶事前通知を申請する>> https://bit.ly/3YGSNda

      以上、AICU media編集部・および代表のしらいはかせがお送りしました。
      🙇今後とも皆さんの応援をよろしくお願いいたします🙇

      最後まで読んでいただきありがとうございました!

      Originally published at https://note.com on Aug 16, 2024.