年: 2024年

  • #10分で学べるAI バッチファイルでバリエーション広告を生成しよう(2)解説編

    #10分で学べるAI バッチファイルでバリエーション広告を生成しよう(2)解説編

    前回紹介した、いろいろなスタイルの画像を生成しまくってくれるバッチファイル「Stable Image Core API Image Creator」の仕掛けを解説します!

    なお、概要や使い方は前回の記事をご覧ください #10分で学べるAI

    バッチファイルをダウンロード

    このリンクでダウンロードして使える バッチファイルを配布しています。

    https://j.aicu.ai/SaiImgBat

    これを無料で配ってしまうのはいかがなものか……という議論がありますが、今回はさらにこの中身を解説していきます。

    バッチファイルの中身解説

    このバッチファイルは以下の流れで動作しています

    • 設定を読み込む
    • APIキーの確認をする
    • 現在の設定を表示して確認を促す
    • APIを呼び出して生成する
    • 生成が完了したことを知らせる

    これからそれぞれの動作について説明します

    なお気になる場合はメモ帳やVisual Studio Codeなどでバッチファイルを開くと中身を直接見ることができます

    設定を読み込む

    バッチファイルが実行されると、ウィンドウタイトルなど、プログラムとして必要な機能を設定します

    @ECHO OFF
    title SIC_IMG_Creator
    setlocal enabledelayedexpansion
    cd /d %~dp0

    また設定ファイル(SIC_setting.txt)を読み込んで生成に使うAPIキーやプロンプト、スタイルを変数として保存しています

    for /f "tokens=1,* delims==" %%a in (SIC_setting.txt) do (
        set %%a=%%b
    )
    set STYLE_PRESET[1]=3d-model
    set STYLE_PRESET[2]=analog-film
    set STYLE_PRESET[3]=anime
    set STYLE_PRESET[4]=cinematic
    set STYLE_PRESET[5]=comic-book
    set STYLE_PRESET[6]=digital-art
    set STYLE_PRESET[7]=enhance
    set STYLE_PRESET[8]=fantasy-art
    set STYLE_PRESET[9]=isometric
    set STYLE_PRESET[10]=line-art
    set STYLE_PRESET[11]=low-poly
    set STYLE_PRESET[12]=modeling-compound
    set STYLE_PRESET[13]=neon-punk
    set STYLE_PRESET[14]=origami
    set STYLE_PRESET[15]=photographic
    set STYLE_PRESET[16]=pixel-art
    set STYLE_PRESET[17]=tile-texture
    set STYLE_PRESETNOW=

    APIキーの確認をする

    プログラムの説明を表示し、APIキーの確認をします

    設定ファイル保存されていたAPIキーが空だった場合、エラーとしてユーザーにAPIキーを設定ファイルに記入するよう促しプログラムを終了します

    echo Stable Image Core API Image Creatorへようこそ!
    echo このバッチファイルでは同じプロンプトで複数のスタイルの画像を連続で生成できます
    :: STABILITY_API_KEY が設定されているか確認
    if not defined STABILITY_API_KEY (
        echo エラー: APIキーがセットされていません、settings.txtに入力して保存してください
        echo APIキーを持っていない場合は https://platform.stability.ai/account/keys にアクセスしてAPIキーを取得してください
        GOTO :END_PROGRAM
        exit /b 1
    )

    現在の設定を表示して確認を促す

    設定ファイルを読み込み、APIキーも確認すると現在の設定を表示してユーザーに確認してもらいます

    さらにユーザーからの入力が「y」だった場合、次のフェーズに移ります

    set /a all_img_num=%IMG_NUM%*17
    :: 出力設定の確認
    echo 以下の設定で出力します
    echo プロンプト: %PROMPT%
    echo ネガティブプロンプト: %NEG_PROMPT%
    echo アスペクト比: %ASPECT_RATIO%
    echo 保存フォーマット: %OUTPUT_FORMAT%
    echo 出力サイクル数: %IMG_NUM%
    echo 合計出力枚数: %all_img_num%
    
    :INPUT_CONF
    ECHO この設定で生成しますか? (同じプロンプトで生成する場合、上書きされてしまいます! )
    ECHO (Y / N)
    SET CONF_SELECT=
    SET /P CONF_SELECT=
    
    IF "%CONF_SELECT%"== SET CONF_SELECT=Y
    IF /I NOT "%CONF_SELECT%"=="Y"  GOTO :END_PROGRAM

    APIを呼び出して生成する

    いよいよ Stable Image Core のAPIを呼び出して画像を生成します

    Stable Image Core ではスタイルプリセットを指定できるので、スタイルプリセットだけ変更してAPIを繰り返し呼び出します

    またAPIの呼び出しは指定されたサイクル数だけ行います

    :: API呼び出し
    :CREATE_IMG
    ECHO 画像を %all_img_num%枚 生成中...
    for /L %%n in (1,1,%IMG_NUM%) do (
        for /L %%i in (1,1,17) do (
            set STYLE_PRESET_NOW=!STYLE_PRESET[%%i]!
            echo !STYLE_PRESET_NOW!スタイル で生成中...
            curl -f -sS "https://api.stability.ai/v2beta/stable-image/generate/core" -H "authorization: %STABILITY_API_KEY%"   -H "accept: image/*"   -F prompt="%PROMPT%"  -F negative_prompt="%NEG_PROMPT%" -F style_preset="!STYLE_PRESET_NOW!" -F aspect_ratio="%ASPECT_RATIO%" -F output_format="%OUTPUT_FORMAT%" -o "./SIC_image/%PROMPT%_!STYLE_PRESET_NOW!_%%n.%OUTPUT_FORMAT%"
        )
       echo %%nサイクル 生成完了
    )
    

    APIはcurlを使って呼び出しています

    この1行だけで画像生成をすることはできますが、コマンドプロンプト上でプロンプトを編集するのは至難の技なのでテキストで編集できるようにしました

    curl -f -sS "https://api.stability.ai/v2beta/stable-image/generate/core" 
      -H "authorization: Bearer sk-MYAPIKEY" 
      -H "accept: image/*" 
      -F prompt="Lighthouse on a cliff overlooking the ocean" 
      -F output_format="webp" 
      -o "./lighthouse.webp"

    APIについての詳しい仕様は Stability AI – Developer Platformを参照してください

    生成が完了したことを知らせる

    最後に生成が完了したことをユーザーに知らせ、プログラムを終了します

    :: 結果表示
    :DISPRAY_IMG
    ECHO 生成が完了しました SIC_imageフォルダを確認してください
    
    :END_PROGRAM
    
    PAUSE
    EXIT

    まとめ

    いかがでしたか?

    たったこれだけのバッチファイルで画像生成をすることができます!

    SIC_IMG_Creator.bat に加えて、Stable Diffusion 3で画像生成ができる SD3_IMG_Creator.bat も同梱されています。ぜひ高解像度・高品質・文字入れ可能な画像生成をお楽しみください。

    ダウンロードはこちらから https://j.aicu.ai/SaiImgBat

    プロンプト例「sweet smile, 16 years old, red hair boy leaning in a classroom, anime style」

    次回予告

    コト先輩「ルゥくん、すばらしいね!クライアントも大喜びだよ」
    ルゥ「お役に立てたようで良かったです~」

    コト先輩「で、今回の依頼があった不動産屋さんの紹介を受けて、新規の依頼が舞い込んだよ……!」
    ルゥ「えー!トントン拍子じゃないすかぁ……🫠」

    次回はEdit APIを用いて自撮り写真の顔を置き換えちゃいます!

    次回の #10分で学べるAI をお楽しみに!


    AICUmediaでは今後もStable Diffusion 3.0 やStable Image Core を用いた記事を発信していく予定です

    面白かったらぜひフォロー、いいねをお願いします!

    ✨️本記事が面白かったら、 X@AICUai, noteのフォロー、シェアをよろしくお願いいたします!

    https://note.com/aicu

    社内Slack等のシェアでも歓迎です。

    また「こんな記事欲しい」といったリクエストがございましたら X@AICUai までメンションやDMでいただければ幸いです。

    ✨️AICU Inc.は Stability AI 公式パートナーです。

    様々なアプリ開発のご相談も承っております!サービスに導入したい、使いこなせる社員をパッと育成したい!そんな需要がございましたら sai@aicu.ai までどうぞご相談ください。

    https://corp.aicu.ai/ja/stability-ai-membership

    生成AI時代に「つくる人をつくる」AICU社、生成AIリーディング企業「Stability AI」と戦略提携 

    https://prtimes.jp/main/html/rd/p/000000007.000133647.html

  • 2024年5月の好アクセスランキング+おすすめ記事を紹介! #AICU_media

    2024年5月の好アクセスランキング+おすすめ記事を紹介! #AICU_media

    AICU media 編集部です。月初恒例のアクセスランキングレポートをお伝えします。


    AICU media 5月のまとめ

    よく読まれた記事ランキング

    5月中によく読まれた記事を紹介します

    1. 漫画制作に適したモデルは?Animagine 3.1 vs Animagine 3.0 徹底比較!
    1. [保存版] Animagine XL 3.1 生成比較レポート

    [保存版] Animagine XL 3.1 生成比較レポート|AICU media

    1. OpenAI – GPT-4oをリリース
    1. Stability AI、日本語大規模言語モデル「Japanese Stable LM 2 1.6B」を発表。Google Colabのシークレット機能で短いコードを書いてみよう!
    1. プロンプトからサイトが作れる!?話題の「Create.xyz」を使ってみた!

    Animagine 3.1 / 3.0の記事はもはや恒例ですね。

    そしてGPT-4oのリリースはかなり衝撃的でした。これで何ができるのか考えるだけでも楽しかったです。

    Japanese Stable LM 2 1.6Bは軽量でローカル環境でも扱いがしやすいモデルでした。

    Create.xyzはプロンプトからwebサイトを生成できるサービスで、話題になりました。

    AICU編集部が選ぶ、5月のおすすめ記事

    5月に投稿した記事でAICU編集部がお勧めしたい記事をピックアップしてみました。

    まだほかの人が知らない、生成AIの情報を読んでみませんか?

    • Stable Diffusionの仕組み(入門編)
    • Fooocus v2.4.0リリース & AICUによるColab無料版で動く日本語UI版も継続メンテナンス実施
    • [期間限定無料記事] Stable DiffusionでAI時代のキャラクター開発!最適LoRAモデルの比較実験

    [期間限定無料記事] Stable DiffusionでAI時代のキャラクター開発!最適LoRAモデルの比較実験|AICU media

    • 日報を画像生成でバエさせる #10分で学べるAI
    • #技術書典16 現地取材レポート!生成AIクリエイティブ分野で才能と知見あふれる良書にたくさん出会いました

    AICUマガジン5月号に収録されている特集

    最後にAICUマガジン5月号の特集について紹介します。

    こちらでは実践する方法を書籍形式で詳しく紹介しています。

    • 「画像生成AI Stable Diffusion スタートガイド」公式ワークショップの予習をしておこう!-LoRA制作の予習をしよう
    • 画像生成 AI で X(Twitter) 用2コマ漫画を描こう!

    AICUマガジン5月号はkindle unlimitedに加入されている方は無料で、加入されていない方は電子版の購入ができます。ぜひ読んでください!

    https://j.aicu.ai/Mag2405

    バックナンバーはこちらです

    https://j.aicu.ai/Mag2404

    AICU media 6月のイベント情報

    6/26 19:00〜20:30「画像生成AI Stable Diffusion スタートガイド」 #SD黄色本 公式ワークショップ開催!

    「画像生成AI Stable Diffusion スタートガイド」 #SD黄色本 公式ワークショップが6月も開催されます!今回のテーマは【生成AIの社会と倫理】!

    現在複雑さを極めている、生成AIの法律面を弁護士さんとともに解説します。

    詳しくはこちらをご覧ください。

    • 【生成AIの社会と倫理】「画像生成AI Stable Diffusion スタートガイド」 #SD黄色本 公式ワークショップ 2024/6/26(水)19:00〜20:30開催

    なお、画像生成AI Stable Diffusion スタートガイドには、生成AIにかかわる法律や倫理について解説があります。

    予習として読まれてみてはいかがでしょうか?

    https://j.aicu.ai/SBXL

    最後に

    AICU mediaでは生成AIに関する情報をこれからも皆さんにお届けしてまいります。

    面白い!参考になった!と感じていただけましたら、ぜひいいねやフォローをお願いします

    6月もAICU mediaをよろしくお願いします!

  • にじジャーニーv6の日本語能力が向上-画風に合わせたレタリング技術を公式が解説

    にじジャーニーv6の日本語能力が向上-画風に合わせたレタリング技術を公式が解説

    2024年6月7日、にじジャーニーv6の日本語能力が向上しました。
    公式リリースを中心に、実際に手を動かしてみた記事をお送りします。

    nijiの日本語テキスト描画の精度を向上させるアップデートをリリースしました!

    https://nijijourney.com/ja/blog/improved-japanese-text-writing

    使い方

    プロンプトを作成するときに、正確な単語を引用符 “” で囲む ことで、niji にテキストを書かせることができます。

    例: miku holding a sign that says “ハンバーガー”

    画像

    簡単な漢字も処理できます

    girl with white hair, one eye closed, holding a sign that says “愛してる”

    画像

    看板を持った女の子に限らず、文字がそのままシーンに溶け込ませることもできます

    aerial view, a blue fast food building that says “こんにちは”

    画像

    技術解説「言葉に隠された声

    絵の上に文字を載せたことがある人なら知っているように、絵に合った適切なフォントを選ぶのは非常に巧妙なことです。文字の形は、隠された意味を非常に多く伝えます。文字には独自の「声」があるのです。

    たとえば、Spellbrush のロゴの2つのバージョンを比較してみましょう

    現在の Spellbrush ロゴ vs  初期の Spellbrush ドラフトロゴ

    画像

    なぜ左のロゴの方が右のロゴよりも良く見えるのでしょうか?
    どちらかというと、直接の絵を並べて比較すると、右の方が生き生きしているように見えます。

    画像

    その答えは、フォントとイラストの一致にあります。

    画像

    最終的な絵の曲線は、文字の曲線に直接沿うように調整されます。文字と絵がより調和した一致は、単純にイラストが優れているよりも目に優しいです。

    画像
    画像
    画像

    非常に示唆のある解説がされています。

    続きは新しくなった公式日本語ブログをご参照ください。

    https://nijijourney.com/ja/blog/improved-japanese-text-writing

    AICU media編集部でも試してみました

    「つくる人をつくる」AICU media編集部が、実際に手を動かして試していきます。

    miku holding a sign that says “ハンバーガー” –s 400 –niji 6

    画像

    勝率25%というところでしょうか。

    girl with white hair, one eye closed, holding a sign that says “愛してる” –s 400 –niji 6

    勝率5割!しかもけっこう楽しい感じです。「愛」の漢字が中国語と混ざっていますね…。

    画像

    今回公開された画風に合わせた書体を選ぶ技術に加えて、既に、ネガティブプロンプト(–no)に「signature」を入れる、サインボードをもたせるなどで向上することがわかっています。

    「アイキューメディア」をよろしくおねがいしてみました!

    anime screencap, red hair, red eyes, gentle eyes, sweet smile , streaked hair, happy red hair boy holding a sign “あいきゅーめでぃあ” –ar 16:9 –niji 6 –no signature

    画像
    画像
    画像

    うーん、ちょっと間違ってるけど雰囲気に合っているし、カワイイから許す!

    今後リリースされるnijiJourney v6での改善に期待します!

    この記事に「いいね!」と思ったら、いいねとフォロー、おすすめをお願いします!
    https://note.com/aicu/
    X(Twitter)@AICUai

    niji・Journey V6 alpha版公開!文字描画機能以外にも様々な機能

    Niji・Journey v6 にスタイルリファレンス機能「–sref」、世界観の維持や複数画像の参照が容易に! #NijiJourney

    🌈「にじジャーニー」スマホ版はご存知ですか?

  • AICU、業務拡大に伴い、新プロジェクトの主軸となるAIアート系人材をオーディション形式で募集開始

    AICU、業務拡大に伴い、新プロジェクトの主軸となるAIアート系人材をオーディション形式で募集開始

    「つくる人をつくる」をビジョンに、書籍「画像生成AI Stable Diffusionスタートガイド」などを執筆・開発しているAICU Inc.がこの夏、あらたにAIアート時代のプロクリエイターを育成する目的で「AIアート系インターン」をオーディション形式で募集します。

    【AICU Creators University Audition 2024 Summer】

    • 賞金総額: 10万円
    • インターン期間: 3ヶ月(有償インターン)

    https://corp.aicu.ai

    【目的】

    AICU Inc.(本社:米国Sunnyvale、CEO:白井暁彦)は、生成AI時代に「つくる人をつくる」をビジョンに活動しています(https://corp.aicu.ai/)。主要取引先はStability AIや電通、SBクリエイティブといった世界を代表する企業であり、一般向け書籍「画像生成AI Stable Diffusionスタートガイド」、ブログメディア「AICU media」や、中高生向けKindle雑誌「AICUマガジン」、各種ワークショップ開発などを通して生成AIクリエイティブの発展に寄与しています。

    今回のオーディションは、業務拡大に伴い、さらなる新プロジェクトの主軸となる生成AI時代のビジュアルアートクリエイターの長期育成を目的としています。

    https://corp.aicu.ai/visual

    【募集要項】

    美大・芸大・情報メディア系・専門学校の現役学生を対象とした、AIビジュアルアート作品を通した賞金付きオーディションを開催します。

    【応募スケジュール 】

    • エントリー受付期間: 随時
    • オーディション作品提出締切: 2024年6月16日23:59
    • 2次審査プレゼン兼面接: 2024年6月19日~21日(調整あり)

    【募集部門】

    • 動画部門: YouTubeのURLでショート動画を提出
    • 静止画部門: X(Twitter)のURLでキャラクターイラストを提出
    • タテ動画部門: TikTok向けのダンス動画やCM動画をURLで提出
    • 技術部門: ComfyUIを中心とした技術ブログを評価

    各部門から最終候補作品を選定し、2次審査(プレゼンテーション・面談)を経て最優秀賞を決定します。

    【エントリー応募条件】

    • Stable Diffusion「ComfyUI」を中心に使用(AUTOMATIC1111も歓迎)
    • 作品のメイキングを社内・社外に公開可能
    • アウトプットの動画や静止画は既発表・公開済みでも可
    • メイキング発表用のスライドをGoogle Slidesで作成し、URLを提供(更新は発表会直前まで可能)
    • 2024年7月~10月にかけて、新規事業におけるプロダクション業務に従事できること(週3日程度から。教育あり・時給保証)
    • 上記の要件を満たしていれば、現役学生である必要はありません。

    【2次審査までの流れ】

    • 先着順で評価
    • 既発表作品歓迎
    • SNSでのインフルエンス、コミュニケーション力もプラス評価
    • 過去作品も評価(Pixiv、GitHub、X等)
    • AI作品以外の作品制作力も評価
    • 提出資料は随時更新可能
    • 作品の優劣だけでなく、AI時代のクリエイターとしての適性を評価
    • 未完成な要素も歓迎
    • インターンで体験したいこと、担当したい業務や将来の希望も評価

    【インターン採用に関してのFAQ】

    • 書籍や動画、ワークショップの開催を実施する開発アシスタントとして、サンプルアートの制作、ブログの執筆などを担当
    • 基本はリモートワークになります。
    • 「画像生成AI Stable Diffusion スタートガイド」の内容をマスターしていると有利
    • 現在のアーティストネームやAICUでのクリエイターネームで活動(名義は希望・相談可)
    • 守秘義務契約、インターンプログラム参加契約および業務委託契約を締結

    興味のある方はぜひエントリーを検討してみてください。
    詳細情報はこちらのURL()およびX(Twitter)@AICUai にお問い合わせください。

    【応募フォーム】

    https://docs.google.com/forms/d/e/1FAIpQLSeA939fc4nmu28fcUH14CHM2g6gCgS04qfMad28eZLTLTLpaA/viewform

    【業務内容・プロダクト・企業紹介】

    https://corp.aicu.ai/ja/products


    (参考資料)過去のインターンに関する募集はこちらからご参照ください。

    学生インターン募集(2024年1-2月期) #長期有給インターン募集
    https://note.com/aicu/n/n732ed1580ba4

    AICU インターン募集(2024年3-6月期)
    https://note.com/aicu/n/n45e15b2091f9

    AICU media 学生インターン募集(2023年11月期)
    https://corp.aicu.ai/ja/intern20231103

  • #10分で学べるAI バッチファイルでバリエーション広告を生成(1)使ってみよう編

    #10分で学べるAI バッチファイルでバリエーション広告を生成(1)使ってみよう編

    Google Slidesで新築分譲マンションのバリエーション広告を大量生成…したはいいけど…ええっ!?

    前回、知り合いの不動産会社から依頼された案件のため、

    新築分譲マンションのバリエーション広告を大量生成できるGoogle Slidesを作成した2人でしたが……。

    前回のSTORY #10分で学べるAI

    Google Slidesでバリエーション広告を大量生成 

    ★バリエーション広告:さまざまな対象者に向けて制作する多様性のある広告

    以下、アイキュー部のDiscordでのやり取りです

    ルゥ「コト先輩~、Google Slides作っておきましたよ~」

    コト先輩「わあ!すごいのができたね!!早速クライアントに提出してくる!」

    (…しばらく後…)

    コト先輩「ルゥくんゴメェン!今回のクライアントは『Google Slides禁止!』だそうです!!」

    ルゥ「うええええええええ!先に聞いてきてくださいよ!!」

    コト先輩「今回のクライアントさんからの依頼によると、『オペレーターさんの作業環境は追加ソフトのインストールが禁止されている事務用ノートPC』、だそうです」

    ルゥ「えっ、ゲーミングPCとかは期待してなかったけど……それじゃあGPUは全く期待できないじゃん!」

    Koto「一応期限は半日だけ延長してもらえたけど、『最低15パターンは譲れない』っていわれちゃった」

    ルゥ「どうしてこんな案件受けちゃったんですか!」

    ――こんな環境でも動くものってバッチファイルくらいか…ってバッチファイルでもAPIは呼び出せるんだから Stability AI の Stable Image Core も使えるかも!

    やってみよう

    Stability AI が提供する Stability AI Developer Platform のイメージサービス のうちのひとつ「Stable Image Core」 のAPIを使って、GPUいらず、たった3分程度で商用利用できるバリエーション広告(さまざまな対象者に向けて制作する多様性のある広告)画像を様々なスタイル画像で生成してみましょう。今回はバッチファイルだけ、ノーコードで利用できるツールとして提供します。

    Stability AI のプラットフォーム APIキーの入手

    まず、このバッチファイルで画像生成をするには Stability AI のプラットフォームを利用するAPIキーが必要です。持ってない人はここにアクセスしてAPIキーを取得するか、管理者殿にお願いしてキーを発行してもらってください。

    https://platform.stability.ai/account/keys

    生成できない場合は支払い設定(https://platform.stability.ai/account/credits)を確認してください。

    Copy ❏ したら「sk-….」で始まるAPIキーをクリップボードにコピーできます。このAPIキーが流出すると勝手に使われてしまいますので管理はお気をつけて。

    次のステップに進みます。

    バッチファイルをダウンロード

    このリンクでダウンロードして使える バッチファイルを配布しています。

    ダウンロードしたら解凍して中身を確認してください

    https://j.aicu.ai/SaiImgBat

    設定ファイルを開いてAPIキーを設定

    生成する前にAPIキーを設定します

    SIC_settingという名前のテキストファイルがあるのでメモ帳で開いて、

    「STABILITY_API_KEY=」と書かれている部分の後ろに先ほどコピーしたAPIキーを貼り付けて保存します。

    これだけで画像を生成できるようになりました!

    設定を確認しよう

    生成する前に設定を確認しましょう

    先ほどAPIキーを入力したテキストファイルから以下の項目を設定できます。

    ・プロンプト

    ・ネガティブプロンプト

    ・アスペクト比

    ・出力フォーマット

    ・生成サイクル数

    設定するにはそれぞれの項目の「=」より後ろを書き換えてから保存してください。

    バッチファイルを実行して画像生成!

    いよいよバッチファイルを実行しましょう。

    SIC_IMG_Creatorというバッチファイルをダブルクリックすると実行できます。

    初回はスマートスクリーンの確認画面が出ます。危険なバッチファイルではありませんので詳細情報を押すと実行ボタンが現れます

    ※ここで管理者様に止められてしまう環境の場合は、貴社の情報システム管理部門殿にお願いしてください。

    起動するとこのような黒怖いコマンドプロンプト画面が現れます。

    ここで生成する画像のプロンプトや枚数を確認できます。

    「y」と入力してEnterキーを押下すると生成が開始されます。

    すべてのスタイルで生成が完了するまで大体3分ぐらいかかります。

    生成された画像を確認する

    生成された画像はSIC_Imageというフォルダに格納されています。

    前回と同じ流れが作れそうです!

    まとめ

    いかがでしたか?

    たったこれだけで様々なスタイルの画像を生成をすることができます!

    AICUmediaでは今後もStable Diffusion 3.0 やStable Image Core を用いた記事を発信していく予定です

    面白かったらぜひフォロー、いいねをお願いします!

    次回予告

    次回はこのプログラムの中身を解説しちゃいます!お楽しみに!

    #10分で学べるAI

    #10分で学べるAI シリーズ

    ✨️本記事が面白かったら、X@AICUai, noteのフォロー、シェアをよろしくお願いいたします!
    https://note.com/aicu
    社内Slack等のシェアでも歓迎です。
    また「こんな記事欲しい」といったリクエストがございましたら X@AICUai までメンションやDMでいただければ幸いです。

    ✨️AICU Inc.は Stability AI 公式パートナーです。
    様々なアプリ開発のご相談も承っております!サービスに導入したい、使いこなせる社員をパッと育成したい!そんな需要がございましたら sai@aicu.ai までどうぞご相談ください。

    https://corp.aicu.ai/ja/stability-ai-membership

    生成AI時代に「つくる人をつくる」AICU社、生成AIリーディング企業「Stability AI」と戦略提携 https://prtimes.jp/main/html/rd/p/000000007.000133647.html

  • 【生成AIの社会と倫理】「画像生成AI Stable Diffusion スタートガイド」 #SD黄色本 公式ワークショップ 2024/6/26(水)19:00〜20:30開催

    【生成AIの社会と倫理】「画像生成AI Stable Diffusion スタートガイド」 #SD黄色本 公式ワークショップ 2024/6/26(水)19:00〜20:30開催

    本ワークショップは2024年3月29日に発売された書籍「画像生成AI Stable Diffusion スタートガイド」(白井暁彦AICU media編集部SBクリエイティブ刊)をベースに、最新の画像生成AIについて学びたい方のためのワークショップです。

    お申し込みはTechplayから https://techplay.jp/event/946209

    「生成AIを使うにあたって何に気を付ければいいんだろう?」
    「画像生成AIで生成してみたけどこれって著作権違反にならないの?」
    「生成AIのモデルを作ってみたいけど何かしなければいけないことはあるのかな?」

    このような方に向けて、本書の法律監修で参加された 柴山吉報 弁護士 (阿部井窪片山法律事務所)の とAICU media編集部が、生成AIを取り巻く法律と発注や受注する際に必要な知識、トラブルにならないためのポイントを解説します。

    業務の上での発注者や受注者、イベントやスクール開催、教育、著作権や意匠権といった知的財産権との関係、訴訟リスクが高いパターンなど、生成AI・画像生成AIを扱う際の「『陽のあたる場所』を増やすべく、不安な点を明らかにしていく」という目的の公式ワークショップになります。

    第1パートはSD黄色本の監修を行った弁護士による勉強会、
    第2パートは参加者からの質問にお答えしていく相談会、
    第3パートはAICU編集部とのオンライン交流会・LT登壇を受け付けます。

    参加対象

    • 生成AIに関するビジネス開発、法務担当者、経営者
    • 生成AI時代のクリエイター/フリーランサー
    • 広告・映像業界、アニメ制作、ゲーム開発、教育・研究系のプロフェッショナル
    • 生成AIを業務や社内で活かしたい方
    • これから本書を買ってみようと思う人
    • 生成AIを今後の人生に活かしたい方

    参加費

    ・書籍購入済みの方 : 2,000円
    ・書籍付き : 5,000円
    ・本ワークショップの社内での展開等はこちらをご参考ください

    オンラインサイン本企画

    申込時に「書籍付き(サイン入り・申込後に発送)」をお選びいただくと、著者の直筆サイン本を事前発送いたします。発送が間に合うように、ぜひとも早めのご参加登録をおすすめします。

    タイムスケジュール

    時間内容
    19:00〜オープニング
    19:10〜19:30【勉強会】SD黄色本監修弁護士による「生成AIの社会と倫理」
    最新の基本知識を解説(仮)
    19:30〜20:00【相談会】参加登録者からの事前質問への回答タイム(仮)
    20:00〜20:30【交流会】AICU mediaオンライン交流会・ライトニングトーク

    ※ 当日予告なく時間配分・内容が変更になる可能性がございます。

    登壇者

    Kippo_Shibayama

    柴山吉報 弁護士

    阿部井窪片山法律事務所 (#SD黄色本 法律監修)

    主な取扱分野は、一般企業法務、人事労務、ベンチャー法務、事業再生、M&A等の各分野。IT企業のクライアントが多く、システム開発、AIのモデル開発及びデータの取引等の相談及び契約書の作成、知的財産戦略等に関するアドバイスなどを行う。機械学習エンジニアの資格(JDLA Deep Learning for ENGINEER 2020 #1)を有し、AIエンジニアとしての知見を用いて踏み込んだアドバイスを提供している。 先端的な事業を行うベンチャー企業からの規制法対応や上場支援等の相談を受ける一方で、窮境にある会社の事業計画の策定支援や金融機関との交渉等の事業再生分野の業務も行うなど、様々なフェーズの会社において、事業に深く関与した法的サポートを得意とする。また、事業再生のための組織再編など、多数のM&Aの経験を有する。 特許庁・経済産業省「オープンイノベーション促進のためのモデル契約書ver2.0(AI編)」検討メンバー一般社団法人日本ディープラーニング協会有識者会員AI プロダクト品質保証コンソーシアムメンバー一般社団法人日本ディープラーニング協会の研究会「AIデータと個人情報保護」副座長 主要著書「マンガでわかる DX」(共著)SBクリエイティブ(2023年)「ディープラーニングG検定(ジェネラリスト) 法律・倫理テキスト」(共著)技術評論社(2023年)「実践 ゼロから法務!―立ち上げから組織づくりまで―」(共著) 中央経済社(2023年)「Q&A AIの法務と倫理」(共著) 中央経済社(2021年)「経験者が語るQ&A 電子契約導入・運用実務のすべて」(共同編著) 中央経済社 (2021年)「契約解消の法律実務」(共著)中央経済社(2022年)「第4次産業革命と法律実務-クラウド・IoT・ビッグデータ・AIに関する論点と保護対策-」(共著) 民事法研究会 (2019年)ほか。
    

    白井暁彦

    白井暁彦

    AICU Inc. CEO

    白井暁彦(Akihiko Shirai, PhD / しらいはかせ)(X アカウント:@o_ob)エンタメ・メタバース技術の研究開発に関わる研究者、ホワイトハッカー作家、米国スタートアップ「AICU Inc.」「Hidden Pixel Technology Inc.」のCEO。東京工芸大学写真工学科卒、同画像工学専攻修了。キヤノン株式会社とグループの研究所より生まれた英国・Criterion Software にて世界初の産業用ゲームエンジン「RenderWare」の普及開発に参加、その後、東京工業大学知能システム科学専攻に復学。博士学位後、NHK エンジニアリングサービス・次世代コンテント研究室、フランスに渡りENSAM 客員研究員、国際公募展Laval Virtual ReVolution の立ち上げ、日本科学未来館科学コミュニケーター神奈川工科大学情報メディア学科准教授を経て、2018 年よりデジタルハリウッド大学 大学院客員教授 およびグリー株式会社GREE VR Studio Laboratory Director。スマートフォン向けメタバース「REALITY」を開発・運用するREALITY 株式会社の立ち上げを通して、Virtual YouTuber などXR ライブエンタメ技術のR&D、国際発信など、メタバースエンタテイメントの未来開発や知財創出を中心に、自らエンタテイメントのライブプレイヤーとして世界に向けた開発・発信活動方法論化しながら世界中のエンタテインメント技術業界に数百人の規模でクリエイターを育成している。2023 年よりデジタルハリウッド大学発米国スタートアップ企業「AICU Inc.」CEO。生成AI 時代に「つくる人をつくる」をビジョンに英語、日本語、フランス語、プログラミング言語などでオープンな作家活動を続けている。日本バーチャルリアリティ学会 IVRC実行委員会委員。芸術科学会副会長。著書に『画像生成AI Stable Diffusionスタートガイド』、『WiiRemote プログラミング』(オーム社)、『白井博士の未来のゲームデザイン - エンターテインメントシステムの科学-』(ワークスコーポレーション)、『AI とコラボして神絵師になる 論文から読み解くStable Diffusion』(インプレスR&D)他。
    

    【#SD黄色本 『画像生成AI Stable Diffusion スタートガイド』 紹介】

    全目次公開記事はこちら!
    https://ja.aicu.ai/sbxl/

    画像生成AIの1つであるStable Diffusionを導入・体験するための入門書です。
    プログラミングが分からない、ネットの情報を見てもうまく使えなかった、そんな悩みを抱えている人でもAIを使った画像生成体験ができるようにしっかりサポートします。
    本書籍では以下の環境で解説します。
    ・Google Colab Pro環境
    ・Windows10/11 NVIDIA GPU環境
    ・MacOS Apple silicon 環境
    本書籍では以下の内容を取り扱います。
    ・拡散モデルによる画像生成の原理
    ・Stable Diffusionを使用するためのWebUI環境構築
    ・テキスト/画像を元に画像を生成する(txt2img/img2img/ControlNet)
    ・Google Colab 上で追加学習を行う(LoRAの作成)

    本書ではソフトウェアの使い方解説だけではなく、自分で設定できるセッティングやパラメータが画像生成にどのように関わっているのかについても解説しているため、AI技術について知識を深めたい人にとってもおすすめです。
    また、既にAIを活用している方にもご満足いただけるように、よりAI画像制作を極めるヒントとなるようなStable Diffusionを含むAI画像生成を利用した作例のメイキング方法やプロンプト構成/生成パラメーターなどの情報を公開・解説しています。ハンズオン形式で最後まで取り組むことで、画像生成AIへの理解をより深めることができる1冊となっています。

    Chapter1 画像生成AIについて知ろう
    Chapter2 環境構築をしてはじめよう
    Chapter3 プロンプトから画像を生成してみよう
    Chapter4 画像を使って画像を生成してみよう
    Chapter5 ControlNetを使ってみよう
    Chapter6 LoRAを作って使ってみよう
    Chapter7 画像生成AIをもっと活用しよう

    お申し込みはTechplayから
     https://techplay.jp/event/946209

    各分野に向けた各章を深く掘り下げる形のレギュラーイベントとして実施する可能性がありますので、こちらのコミュニティをフォローよろしくお願いいたします。
    https://techplay.jp/community/AICU
    また内容も、映像プロフェッショナルから、企業研修、学校団体(クラブ・サークル等含む)も多様に開発していく予定です。


    注意事項

    • 本ワークショップの配布物や上映内容の録音、スクリーンショットはご遠慮ください。
      ※公式イベントレポートは AICU media noteメンバーシップにて募集中しております。
    • リクルーティング、勧誘など、採用目的でのイベント参加はお断りしております。
    • キャンセル待ち・補欠・落選の方はご参加いただくことが出来ませんのでご了承ください。
    • 欠席される場合は、お手数ですが速やかにキャンセル処理をお願い致します。
    • 無断キャンセルや欠席が続く場合、次回以降の参加をお断りさせていただく場合がございます。
  • AiSalon Tokyo-June2024にAICUが登壇

    AiSalon Tokyo-June2024にAICUが登壇

    2024年6月12日に東京で開催されるAiSalonイベントに参加しませんか?AiSalonは、AIに特化した創業者、構築者、投資家、企業パートナーによる、そしてそのためのグローバル・コミュニティです。

    Lumaにて受付中 https://lu.ma/r9xncgw1?tk=YAsFmH

    月に一度、日本に進出しているスタートアップ企業が、他の創業者、パートナー、投資家に向けて、現在取り組んでいるプロダクトを紹介するライトニングトークを行う対面形式のイベントです。

    デモを希望される方は、応募時にお知らせください!注:今すぐ、または今後の月例AiSalonイベントでデモをしたい場合は、イリヤ・クルヤチン(ilya@tokyoai.jp またはLinkedIn)に確認してください!

    どのイベントでもAIスタートアップのデモが行われ、ファウンダーは貴重なフィードバックを得たり、関係を築くことができます。投資家やVCがAiSalonを訪れ、最新の東京のAIとMLスタートアップエコシステムイノベーションを見学します。

    AiSalonはBlitzscaling VenturesのGPであるJeffrey Abbottによって立ち上げられ、東京支部のJETRO後援を通じてTokyo AI (TAI)と提携することになりました。DEEPCOREは飲食のサポートをしており、東京AIのエコシステムには欠かせない存在です。

    アジェンダ

    18:00 開場
    18:30 今月のAI(10分)
    Tokyo AIのイリヤ・クルヤチンより、この1ヶ月でAI界で何が起こったかをご紹介します。
    19:00 スタートアップデモスピーカー(各4-5分):
    SOXAI渡邉達彦、創業者兼CEO): SOXAI RINGは日本製の指輪型ウェアラブルデバイスで、睡眠、ストレス、活動の質など日常生活の健康状態をモニタリングすることができます。

    Jurin AI (Rise Ooi, 創業者兼CEO): 樹林AIは、現代に相応しい、優れた不動産管理ソフトウェアです。

    StreamPodオクタビオ・カノ、創業者兼プラットフォーム・エンジニア): StreamPodは、マルチテナント管理プラットフォーム内にパッケージ化されたマルチモーダルLLMを統合します。このプラットフォームは、マルチメディアワークフローのための幅広いAPIセットを提供します。

    Zeteohヤン・ル・ギリー、共同創設者兼CEO): 従来の屋内位置情報システムはビーコンを使用しますが、技術的な複雑さ、制限、メンテナンスの必要性からビジネスに不満を抱かせる可能性があります。ZeteohはウェアラブルデバイスとAIを組み合わせ、ビーコンを使わないロケーションソリューションを提供します。これにより、企業は障壁なくこのシステムの恩恵を受けることができます。

    AICU Inc.(創業者兼CEO 白井暁彦): AICU Inc.は、クリエイティブAI時代の「つくる人をつくる」をビジョンに掲げるクリエイティブAIニュースメディアです。

    スタートアップ6:未定

    21:00まで、スタートアップのデモブースとオープンネットワーキングを行います。

    場所
    日本, 〒107-6006 東京都港区赤坂1丁目12番32号 アーク森ビル総合案内7階

    エレベーターで7階までお越しください!

    グローバルAiSalonについて

    AiSalonは、AIに特化した創業者、構築者、投資家、企業パートナーによる、AIに特化した創業者、構築者、投資家、企業パートナーのためのグローバルコミュニティです。

    ジェトロ(JETRO)について

    ジェトロは、対日直接投資と日本と世界のビジネス・パートナーシップを促進する政府関連機関です。

    ジェトロウェブサイト:https://www.jetro.go.jp/en/invest/

    ジェトロLinkedInページ

    https://www.linkedin.com/company/jetro-japanexternaltradeorganization

    https://www.linkedin.com/company/jetro-collaborate-and-invest-japan

    https://www.linkedin.com/company/jetro-global-connection

    東京AI(TAI)について

    TAIは、東京に活気と結束力のあるAIエコシステムを育成することを使命とする、構築者、エンジニア、投資家のコミュニティです。

    TAI Discord: https://discord.gg/a7UUvZpvvj

    TAI LinkedIn: https://www.linkedin.com/company/tokyoai/

    DEEPCOREについて

    DEEPCOREは東京を拠点とするAIに特化したインキュベーターであり、テクノロジーで世界を変えようとする起業家を支援するVCです。プレシードからシリーズAまで投資。

    DEEPCOREウェブサイト:https://deepcore.jp/en-home

    KERNEL by DEEPCOREは、テクノロジーで世界を変えたい人のためのコミュニティです。プレアントレプレナー(スタートアップに関わる前)でもサポートが受けられます。

    個人向け:https://kernel.deepcore.jp/en/

    チーム/企業向け:https://bit.ly/kernel-plus

    会場: 〒107-6006 東京都港区赤坂1丁目12番32号 アーク森ビル総合案内7階

  • Computex 2024 基調講演 Stability AI のCEO/CTOが語る Stable Diffusion 3 は「自然の進化」

    Computex 2024 基調講演 Stability AI のCEO/CTOが語る Stable Diffusion 3 は「自然の進化」

    ■Stability AI クリスチャン・ラフォート氏の講演を入手

    AICU media は講演動画を入手しましたので要約翻訳でお送りします

    AMDの基調講演(Dr. Lisa Su, Chair and CEO, AMD)

    https://www.computextaipei2024.com.tw/en/index.aspx#keynote1

    司会者:皆さん、本日は、AI開発者と密接に連携しているAMDのMI300 (AMD Instinct™ MI300 Series Accelerators)についてお話しします。それでは、Stable Diffusion の画期的なオープンアクセスAIモデルで知られる Stability AI のCTO兼共同CEO、クリスチャン・ラフォートさんをお迎えしましょう。こんにちは、クリスチャンさん。お元気ですか?

    クリスチャン:こんにちは。元気です。この場に立てることを光栄に思います。Stability AI の仲間たちを代表してここにいます。

    司会者:今日はStability AIの多くの革新についてお話しいただきますね。まずは、これらのAIモデルがどのようにして可能性の境界を押し広げているのか、教えていただけますか?

    クリスチャン:もちろんです。私たちは、あらゆる業界で生産性の飛躍的な向上を目の当たりにしています。特に、私たちがモデルとソースコードを無料で公開したことで、多くの開発者や研究者が新しい発見を驚異的な速度で行い、新しいアプリケーションを作り上げました。例えば、古い家族写真の修正や品質向上、あるいはもう見たくない人を写真から削除することが、今や誰でも数秒でできるようになりました。同様に、生産性の向上は画像だけでなく、言語、コーディング、音楽、音声、3Dといった他の研究分野でも見られます。これらを組み合わせることで、映画制作やビデオゲームの生産性を少なくとも10倍に引き上げることを目指しています。

    司会者:それは素晴らしいですね。さて、今日は何か大きなニュースがあると伺っていますが。

    クリスチャン:はい、Stable Diffusion 3のリリースが間もなくです(the weight/wait fot Stable Diffusion 3 is almost over..!)。

    コミュニティの皆さんの忍耐と理解に感謝しています。品質と安全性を向上させるために多大な努力を注ぎました。本日、6月12日にStable Diffusion 3のミディアムモデルを皆さんにダウンロードいただけるようリリースすることを発表します。

    (会場から拍手)

    クリスチャン:多くの努力がこのモデルに注がれました。私たちは、コミュニティがこのモデルをどのように活用するのか、とても楽しみにしています。技術的でない方々にはわかりにくいかもしれませんが、かつては研究の最前線がこうしたモデル、例えば Stable Diffusion のようなものに繋がっていました。これはまさに自然な進化のようなもので、様々な新しい方法で組み合わさっています。これをオープンに公開することで、何百万人もの人々が最適な組み合わせ方を発見し、新しいユースケースを解放するのを手助けしてくれます。SD3ミディアムは、これまでにない視覚品質を実現したSD3の最適化バージョンであり、コミュニティが自分たちの特定のニーズに合わせて改善することができます。これにより、次の生成AIのフロンティアを発見する手助けになります。このモデルはもちろんMI300上で非常に高速に動作し、発表されたばかりのRyzen AI搭載のラップトップでも動作するほどコンパクトです。こちらがStable Diffusion 3で生成した画像です。台湾の夜市を描写するようにチャレンジしました。

    司会者:とても素晴らしいですね。

    クリスチャン:細かく見ると完全なフォトリアリスティックではないかもしれませんが、テキストプロンプトのさまざまな要素をよく捉えていると思います。特に、この長いテキストプロンプトを実際に入力するよりもはるかに速く生成されたことを考えると、特に印象的です。歩いている通行人、石でできた通り、夜間の雰囲気などが捉えられています。

    クリスチャン:SD3は、マルチモーダルディフュージョントランスフォーマーアーキテクチャを使用しており、視覚コンセプトとテキストプロンプトを以前のモデルよりもはるかに優れた方法で理解します。シンプルなプロンプトにも対応しているので、これを使いこなすための専門知識は必要ありませんが、より複雑なプロンプトにも対応し、そのすべての要素をうまく組み合わせることができます。SD3は、あらゆる種類の芸術スタイルやフォトリアリズムに優れています。

    ここに実際に非常に難しい例があります。これは、1年以内にリリースした前のバージョンであるStable Diffusion XL (SDXL) との比較です。この例は特に難しいのですが、なぜなら、手を描くことがこれらのモデルにとって非常に難しいからです。また、ギターの弦やフレットのような繰り返しのパターンも含まれています。これらはすべて、モデルが理解し正確に描写するのが非常に難しいものです。SD3がギターの形や手のようなより現実的なディテールを生成したことに注目してください。細かく見ると、いくつかの不完全な点があるかもしれませんが、前世代に比べて大きな改善です。

    司会者:本当にすごいですね。MI300 GPUについての印象はどうですか?

    クリスチャン:素晴らしいです。MI300の192GBのメモリはまさにゲームチェンジャーです。新しいモデルを解放する方法として、より多くのメモリを持つことが非常に重要です。これが、より大きなモデルをより早く、より効率的にトレーニングするのに役立つのです。具体例を挙げると、AMDとの協力でクリエイティブアップスケーラ機能を開発しました。これは、1メガピクセル未満の古い写真を取り込み、解像度を大幅に向上させ、品質も同時に向上させる機能です。Nvidia H100で30メガピクセルを達成した時も嬉しかったのですが、MI300Xにコードを移植したところ、ほとんど努力なしで100メガピクセルに達しました。コンテンツクリエイターは常により多くのピクセルを求めているので、これは大きな違いを生みます。実現するためにほとんど努力が必要なかったことも大きなステップアップです。研究者やエンジニアは、AMDとStankのGPUが提供する素晴らしいメモリ容量と帯域幅の利点を気に入ることでしょう。

    司会者:それは驚異的です。AMDとの今後の協力についてはどう考えていますか?

    クリスチャン:AMDとのさらに密接な協力を通じて、新しい最先端のビデオモデルを開発し、全世界に公開したいと考えています。これにはより多くのメモリとコンピュートパワーが必要です。AMDのチームと密接に協力して、これを実現したいと考えています。

    司会者:素晴らしいですね。今日はお話いただき、ありがとうございました。

    ✨️本記事が面白かったら、ぜひシェアをよろしくお願いいたします!

    社内Slack等のシェアでも歓迎です。

    また「こんな記事欲しい」といったリクエストがございましたら X@AICUai までメンションやDMでいただければ幸いです。

    ✨️AICU Inc.は Stability AI 公式パートナーです。

    様々なアプリ開発のご相談も承っております!サービスに導入したい、使いこなせる社員をパッと育成したい!そんな需要がございましたら sai@aicu.ai までどうぞご相談ください。

    https://corp.aicu.ai/ja/stability-ai-membership

    生成AI時代に「つくる人をつくる」AICU社、生成AIリーディング企業「Stability AI」と戦略提携 https://prtimes.jp/main/html/rd/p/000000007.000133647.html

  • Stability AI が Stable Diffusion 3 の weights を 2024年6月12日に公開予定…ところで画像生成AIにおける weights って何?

    Stability AI が Stable Diffusion 3 の weights を 2024年6月12日に公開予定…ところで画像生成AIにおける weights って何?

    Computex Taipei 2024のオープニングキーノートにて、Stability AI 共同CEOの Christian Laforte氏(@chrlaf) がStable Diffusion 3 Medium を6月12日にオープンリリースすると発表しました。

    <Stability AIの公式メールニュースからの翻訳>

    「Stable Diffusion 3 Medium」が登場します!6月12日(水)より、Hugging Faceでweights をダウンロードできるようになります。SD3 Mediumは、20億のパラメータを持つSD3モデルで、これまでのモデルが苦手としていた分野で特に優れた性能を発揮するように設計されています。主な特徴は以下の通りです:

    フォトリアリズム: 手や顔によく見られるアーチファクトを克服し、複雑なワークフローを必要とせずに高品質の画像を提供します。

    タイポグラフィ: タイポグラフィにおいて強固な結果を達成し、大規模な最新モデルを凌駕します。

    パフォーマンス: 最適化されたサイズと効率性により、コンシューマー・システムとエンタープライズ・ワークロードの両方に最適です。

    ファインチューニング: 小さなデータセットから微妙なディテールを吸収できるため、カスタマイズや創造性に最適です。

    SD3 Mediumのweightsとコードは、非商用目的にのみご利用いただけます。Stable Diffusion 3の商用利用を目的としたセルフホスティングライセンスのご相談は、以下のフォームにご記入ください。弊社のチームがすぐにご連絡いたします。

    Sign Up to the Stable Diffusion 3 Weights List

    https://stability.ai/stablediffusion3

    追伸:それまで待てないという方は、当社のフレンドリーなチャットボットStable Assistant、DiscordのStable Artisan、またはAPIから、当社の最も高性能なテキスト画像変換モデルの3日間無料トライアルにアクセスできます。

    Stable LM2 12B は、Stable Assistant を強力にサポートします。Stable Assistant は、当社の最も先進的な言語モデルであり、その強力なテキスト生成機能でコンテンツを強化します。 

    Stable Artisanは、Discordエコシステム内のStability AI Platform API上の製品を利用する、楽しいマルチモーダル生成AI Discordボットです。このボットは、Stable Diffusion Discordサーバーにアクセスして、他のコミュニティと一緒に画像を生成・編集することができます。

    <公式発信ここまで>

    「weightsの公開」にはどんな意味があるのか

    つまり、「weightsをダウンロードできるようになる」というということの意味は、「AIモデルをダウンロードできるようになる」というとして理解してよいと考えます。

    ただしリリースに記載のある通り、AIモデルをダウンロードして使用できるのは非商用目的であり、商用利用する場合は要相談となる点には注意が必要です。

    画像生成AI解説用語集

    📖用語「weights」

    「weights」とは「AIモデル」にあたります。

    #SD黄色本「画像生成AI Stable Diffusionスタートガイド」p.27の解説によると……

    「コンピューターの中では、「ノード」と呼ばれる単位がニューロンの役割をしていて、これらが「重み」(weights)でつながっており、「バイアス」(bias)は入力が0の時、出力にどれだけ値を上乗せするかを意味します。この大量の「重みとバイアス」のセットこそがそのネットワークの「モデル」であり、この調整を入力刺激と出力結果を評価していくことでモデルを学習させることになります。」

    機械学習における「weights & biases」はモデルの学習結果そのものであり、Stable Diffusion以降のAI画像生成AIにおいては safetensorsファイルのことを意味する事が多いでしょう。

    なお英語的には「weights」であって「weight」ではないのでAICU media編集部ではカタカナで「ウェイト」と表記することは限定的とします。

    📖用語「アーチファクト」artifacts 

    アーチファクト(artifacts)という語は、ラテン語で「人工物」を表すars、artisと「作られたもの」を表すfactumの組み合わせで「人工的に作られたもの」を意味します。人為的または技術的な影響によって発生する産物または現象を指します。画像生成AIにおいては「自然物」に対して「人造物」と解釈することができます。

    📖用語「セルフホスティング」self-hosting

    AIモデル提供企業自身による演算基盤や環境をAPI経由で提供するのではなく、weightsをオープンに配布し、ダウンロードして独自の演算環境やアプリケーション、ツールやAPIサーバーに実装して利用すること。ブラックボックス化や長期サポートが保証されないモデル提供企業のAPI経由に対して、内部動作の透明化や最適化、コミュニティのサポートなどの利点がある。

  • #10分で学べるAI Google Slidesでバリエーション広告を大量生成

    #10分で学べるAI Google Slidesでバリエーション広告を大量生成

    「ようこそ!アイキュー部」-1話

    「AIでクリエイティブなビジネスをする!」をテーマに学内起業コンテストにエントリー提案をして「アイキュー部」を設立したKotoちゃん。

    今日は知り合いの不動産会社から依頼された案件に取り組んでいます。

    Koto「あ~あ、新築分譲マンションのバリエーション広告を作ってくれ……って頼まれたんだけど、今日はもう帰らないと…ルゥくん、あと頼むわね!」

    ★バリエーション広告:さまざまな対象者に向けて制作する多様性のある広告

    ルゥ「Koto先輩!?待ってください、何やってるんですか?」
    Koto「え……?アイキュー部で受けたバイトなんですが何か問題でも?」
    ルゥ「そうなんだ……って!なんで手で作ってるんですか?『AIでクリエイティブなビジネスする』ってのがこの部活なんですよね??」
    Koto「私は『アートイラスト・キュレーション部』の略のつもりで「AICU部」って書いたつもりなんだけど……審査員の先生にウケが良かったのでついそのまま……」
    ルゥ「押し切られちゃったんですか!?」
    Koto「こうやって部室も案件もらえたし、いいじゃない。しっかり稼ぎましょ」

    ルゥ「まあ……そうですね、で、これは何なんですか?」

    Koto「わからないの?『マンションポエム』よ!!」
    ルゥ「『上質が佇む(たたずむ)至高の邸宅』……なんだかよくわからないけどこれがあるだけでリッチな感じしますね」
    Koto「『これをできるだけ多くのバリエーションを作ってこい』というのがクライアントから出された課題よ」
    ルゥ「たしかにAI画像生成でできなくもなさそうだけど……これをいくらで受けたんですか?」
    Koto「ああ!もう帰らないと門限が!じゃあ私が家につくまでに、そのAI画像生成とやらで、最低15パターンをGoogle Slidesに作っておいてね!」
    ルゥ「ひぃ」

    ――どうしよう、突然、大量の広告ビジュアルの生成を頼まれちゃった。画像生成しようにもGPUもないしな…。

    あ、でもこんな時は… Stability AI の Stable Image CoreGoogle Apps Scripts が使えるかも!

    ……とおもったら、即実行。こんな感じに出来上がってました!

    ▼「ようこそ!アイキュー部」-1話(後編)はこの技術解説の続きにあります▼

    やってみよう

    Stability AI が提供する Stability AI Developer Platform のイメージサービス のうちのひとつ「Stable Image Core」 のAPIを使って、GPUいらず、たった3分程度で商用利用できるバリエーション広告(さまざまな対象者に向けて制作する多様性のある広告)画像を様々なスタイル画像で生成してみましょう。今回はGoogle Slidesだけ、ノーコードで利用できるツールとして提供します。

    Stability AI のプラットフォーム APIキーの入手

    まず、このプログラムで画像生成をするには Stability AI のプラットフォームを利用するAPIキーが必要です。持ってない人はここにアクセスしてAPIキーを取得するか、管理者殿にお願いしてキーを発行してもらってください。

    https://platform.stability.ai/account/keys

    生成できない場合は支払い設定(https://platform.stability.ai/account/credits)を確認してください。

    Copy ❏ したら「sk-….」で始まるAPIキーをクリップボードにコピーできます。このAPIキーが流出すると勝手に使われてしまいますので管理はお気をつけて。

    次のステップに進みます。

    Google Slides コピーして自分のDriveに

    このリンクでコピーして使える Google Slidesを配布しています。
    お使いのGoogleアカウントでアクセスしてください。

    https://j.aicu.ai/SAIAD

    こんな画面のGoogle Slidesが表示されます。このあと自分のDriveにコピーしていきます。

    ファイル⇢「コピーを作成」⇢「プレゼンテーション全体」を実行します。

    「ドキュメントをコピー」のダイアログが表示されますので、そのまま「コピーを作成」ボタンを押してください。

    初回起動でAPIキーを設定

    まず最初に、APIキーを設定します。

    スライドの上に以下のようなダイアログが表示されます。コピーした直後に表示されるはずです。

    [S.] Stability AI Platform API Key Required

    このツールでは、画像を生成するために Stability AI プラットフォームの APIキー が必要です。
    お持ちでない場合は、https://platform.stability.ai/account/keys でAPIキーを取得してください。

    This program requires a Stability.ai API key to generate images.
    If you do not have one, please visit https://platform.stability.ai/account/keys to obtain an API key.

    と表示されますので、冒頭で取得した「sk-」で始まる51文字のAPIキーを貼り付けてOKを押してください。

    もし、コピー直後のダイアログで設定しそびれた人は、メニューの[AI Image Generator]⇢[Set API key]を実行することで設定できます。

    スクリプト実行権限の設定

    次に、APIキーの動作確認とスクリプト実行権限の許可を行います。メニューの3番目「Generate Images」を選んでみてください。

    「認証が必要です」というダイアログが表示されるはずです。

    スクリプト実行権限を許可していきます。

    現在お使いのGmailアドレスが表示されているはずです。

    スクリプト実行権限を許可するアカウントを選びましょう。保存先ドライブを選択する意味もありますので、実験目的であれば、まずは個人をおすすめします。

    アカウントを選択すると、今度は 「⚠️ このアプリは Google で確認されていません」という警告が表示されます。危険なアプリではありませんので左下の「詳細」を押して行きます。

    最後に「AICU-AdGenerator(安全ではないページ)に移動」を押して、各サービスへの許可を設定していきます。

    許可ボタンを押すことでドライブへの閲覧、書き込み権限、スライドの編集、外部サービス(Stability AIのAPI)へのアクセスを許可します。編集履歴などはお使いのGmailアカウントで実行したことが記録されますし、知らないうちに実行するような処理にはなっておりませんのでご安心ください。

    権限の設定が終わったら、再度メニューの3番目「Generate Images」を選んでみてください。

    「スクリプトを実行しています」が表示され、画像の生成がはじまります。

    3分程度で、「画像の生成が完了しました。フォルダを確認してください」が表示されるはずです。

    Google Driveのマイドライブ直下「AICU-Stability-AdGenerator https://j.aicu.ai/SAIAD のコピー」というフォルダに以下のような画像が生成されていれば成功です!

    これは同じプロンプトに対して、 異なるスタイルが15種類適用された画像になります。

    Google Slides自動生成とキャッチコピーの配置

    これで終わり!でもいいと思ったのですが、クライアントの要求は画像の生成だけでなく、「マンションポエム」と呼ばれるキャッチコピーも含まれるような気がしたので、もうひと押しGoogle Slidesで頑張ってみます。

    Kotoさんが作っていたスライドにあったキャッチコピー「上質が佇む至高の邸宅。」とスタイルを第1ページに設定してあります。こちらは自由に編集していただいて構いません。

    これで準備は完了です!

    下の[Prompt=]に生成したいもの,
    [NP=] に見たくないものを英語で入れて
    メニューの3番目の[AI Image Generator]⇢[Add Slides by all styles] を選んでみてください。

    「スクリプトを実行しています」と表示されます。

    この後の結果が出るまでは、数分かかります。無事に生成されるとこのように15枚のスライドがキャッチコピー付きで生成されます。左下のスライド一覧表示にしてみましょう。

    初期状態では「Prompt=urban tokyo bayfront skyline residences ad luxury super rich visual」(プロンプト=東京ベイフロントのスカイライン・レジデンス広告の豪華なスーパー・リッチ・ビジュアル)となっているので、このまま何度でも「Add Slides by all styles」を実行すれば15枚づつ、東京湾ベイエリアの高級そうな住居の画像が生成されます。第1ページにある「Prompt=」と「NP=」を変えるだけなので、例えばこんなプロンプトにしてみます

    Prompt=Paris urban apartment  パリの都会のアパルトマン
    NP=Nsfw, worst quality
      (ネガティヴ・プロンプト)職場にふさわしくない、悪いクオリティ

    Stability AIの Stable Image Core API に実装されている多様なスタイルのおかげで、自然なバリエーション広告を生成できています。ネガティヴ・プロンプトのおかげもあってか、あまり出来の悪いスライドはありませんが、不要なスライドやキャッチコピーの修正を行って完成です。

    このSlidesに追加してある「AI Image Generator」メニューから実行できる機能の詳細は以下のとおりです。

    ・ Set API Key:Stability AI のAPIキーを設定します。

    ・Add Slides by all styles:タイトル(1枚目のスライド)で「Prompt=」で与えられたプロンプトと「NP=」で与えられたネガティブプロンプト(英語)から Stability AIの Stable Image Core API を使用して15種類のスタイル適用済み画像をGPU不要で画像を生成し、1枚生成されるごとに、スライドの画面全体に表示されるように背景画像として配置しています。追加された各スライドのタイトルとメモに 使用したstyleとプロンプトを設定しています。

    ・Generate Images:タイトル(1枚目のスライド)で与えられたプロンプトから、スライドのファイル名と同じ名前のディレクトリにすべてのスタイルの‪2,040 x 1,152‬pixelsの画像を15スタイル生成します。

    ・Save All Slides:PDF がDriveに保存されます。Google Slidesの[ファイル]⇢[ダウンロード]で保存でも構いません。

    ・15スタイルの生成は3分程度で51credit (80円ぐらい)です。

    ※安全のため、他人とシェアするときは Set API Keyを使って有効ではないAPIキーを設定しておくことをおすすめします。
    ※本ツールのソースコードが気になる方は Google Slides上でスクリプトエディタをご参照ください。このコードの著作権はAICU Inc. が保有しています。この記事で公開されているツールの使用における損害等についてAICU Inc.は責任を負いません。
    ※実際の広告等への利用など Stable Diffusionの商用利用に関するご質問は sai@aicu.ai までお問い合わせください。

    技術解説「Slidesだけでも画像生成できる」

    Google SlidesをコピーしてAPIキーを貼り付けるだけで様々なスタイルの画像を生成をすることができました!

    AICU media では今後も話題の Stable Diffusion 3.0 やStable Image Core を用いた記事を発信していく予定です。面白かったらぜひフォロー、いいねをお願いします!

    次回予告

    さてその後のアイキュー部のDiscordでのやり取りです

    ルゥ「Koto先輩~、Google Slides作っておきましたよ~」
    Koto「わあ!すごいのができたね!!早速クライアントに提出してくる!」

    (…しばらく後…)

    Koto「ルゥくんゴメェン!今回のクライアントは『Google Slides禁止!』だそうです!!」
    ルゥ「うええええええええ!先に聞いてきてくださいよ!!」

    せっかくルゥくんが頑張って作ったGoogle Slidesですが、別のアプローチを探さねばならないようです。

    #10分で学べるAI いかがでしたでしょうか?ご感想は X@AICUai までいただけると幸いです。

    続きはこちら

    漫画「ようこそアイキュー部」はこちらに続きます!

    ▼ようこそ!アイキュー部 第1話 https://note.com/aicu/n/ne878b6d68004

    ▼AICUマガジン5月号 https://j.aicu.ai/Mag2405