タグ: SD

  • Stable ImageのEdit APIで顔を置き換えよう #10分で学べるAI

    Stable ImageのEdit APIで顔を置き換えよう #10分で学べるAI

    AIでいろいろ作ってビジネスをつくりだす「AICU部」

    ルゥくんとコト先輩がAIでいろいろ作ってビジネスをつくりだす「AICU部」の部活動。
    前回までのお話はこちら #10分で学べるAI

    今回のクライアントは「旅行代理店」です。

    どうやら何か画像で困っているようです。

    ルゥ「この写真、美味そうっすね!」

    コト先輩「これね……今回のクライアント、旅行代理店からの依頼。ツアーに参加したお客さんが送ってきた『海外の有名レストランの自撮り写真』を使って、『バエるブログを書いてほしい』という依頼なんだけど、お客さんさんの顔は出しちゃダメっていわれて頭抱えてます……」

    ルゥ「絵文字とか雑コラで顔を隠すのはダメなんですか?」

    コト先輩「やってみたんだけど、それだと『リアル感が伝わらないからってダメ』ってダメ出しされちゃった……。」

    ――自撮り写真は使うけど、顔は出しちゃダメって無茶だろ……でもこんなときこそStable Imageの「Edit API」の出番かも!

    やってみよう

    Stability AI が提供する Stability AI Developer Platform のイメージサービス のうちのひとつ「Stable Image」 のEdit APIを使って、GPUいらず、たった3分程度で商用利用できる肖像権対策のための顔置き換えを行ってみましょう。

    今回はGoogle Colabで動作するツールとして提供します。

    Stability AI のプラットフォーム APIキーの入手

    まず、このGoogle Colabで画像生成をするには Stability AI のプラットフォームを利用するAPIキーが必要です。持ってない人はここにアクセスしてAPIキーを取得するか、管理者殿にお願いしてAPIキーを発行してもらってください。

    https://platform.stability.ai/account/keys

    生成できない場合は支払い設定(https://platform.stability.ai/account/credits)を確認してください。

    Copy ❏ したら「sk-….」で始まるAPIキーをクリップボードにコピーできます。このAPIキーが流出すると他人にクレジットを勝手に使われてしまいますので管理はお気をつけて。

    自分のドライブにGoogle Colabをコピーしよう

    このリンクでコピーして使える Google Colabを配布しています。

    https://j.aicu.ai/CIEdit

    このColabを開いたら、まずは「ドライブにコピー」のボタンを押してご自身のドライブにコピーしましょう。

    Google Colabを実行してみよう

    「ドライブにコピー」できたら上のコードから▶を押して実行しましょう。

    するとGoogle Driveに接続するための許可を要求してきますので指示に従って許可してください。

    2番目のコードを実行するとAPIキーの入力を求められます。

    発行したAPIキーを入力してからEnterを押すとAPIキーの入力は完了します。

    最後に3番目のコードを実行すれば準備完了です。

    Edit APIを実行して顔を置き換えてみよう

    ここまでできたら編集したい画像をGoogleドライブ上に作成されたImage_Edit_APIフォルダに配置しましょう。

    画像ファイルの名前をColabにあるimagefileという欄に入力して実行すると顔を置き換える画像編集が自動で行われます。

    しばらくすると編集前の画像と編集された画像が Colab に表示されます。

    編集前の画像

    編集後の画像

    料理や背景はそのままに顔だけ置き換えることができました!

    また編集された画像はGoogleドライブのImage_Edit_API/editedというフォルダに保存されます。

    まとめ

    うまく顔だけ置き換えることができましたか?

    今回は Search & Replace のみを紹介しましたが、Stability AI の Edit APIには以下の機能があります。
    ・Search and Replace
    ・Inpaint
    ・Outpaint
    ・Remove Background
    ・Erase Object
    https://platform.stability.ai/

    画像

    AICU mediaでは今後も Stable Diffusion 3 のディープな使いこなしや、Stable Image Core などをはじめとする魅力的な API を用いた記事を発信していきます。

    ✨️AICU Inc.は Stability AI 公式パートナーです。

    様々なアプリ開発のご相談も承っております!サービスに導入したい、使いこなせる社員をパッと育成したい!そんな需要がございましたら sai@aicu.ai までどうぞご相談ください。

    https://corp.aicu.ai/ja/stability-ai-membership

    noteマガジン「Stability AI Fun!」もおすすめします!

    https://note.com/aicu/m/m6000f560d1db

    ❏生成AI時代に「つくる人をつくる」AICU社、生成AIリーディング企業「Stability AI」と戦略提携 

    https://prtimes.jp/main/html/rd/p/000000007.000133647.html

    #10分で学べるAI

    Stability AI 関連記事

    面白かったらぜひフォロー、いいねをお願いします!

    ✨️本記事が面白かったら、 X@AICUai, noteのフォロー、シェアをよろしくお願いいたします!

    https://note.com/aicu

    社内Slack等のシェアでも歓迎です。

    また「こんな記事欲しい」といったリクエストがございましたら X@AICUai までメンションやDMでいただければ幸いです。

  • Stable Diffusion 3 Mediumリリース

    Stable Diffusion 3 Mediumリリース

    日本時間2024年6月12日午後10時ごろ、ついに Stable Diffusion 3のオープンな最新モデル「Stable Diffusion 3 Medium」のweightsがリリースされました。公式リリースを中心にお送りします。

    Stability AI が Stable Diffusion 3 の weights を 2024年6月12日に公開予定…ところで画像生成AIにおける weights って何?

    最も洗練された画像生成モデル、Stable Diffusion 3 Medium のオープンリリースを発表 — Stability AI Japan

    最も洗練された画像生成モデル、Stable Diffusion 3 Medium のオープンリリースを発表

    • Stable Diffusion 3 Medium は、Stability AI の最も先進的なテキストから画像を生成するオープンモデルで、20億のパラメータから構成されています。
    • このモデルはサイズが小さいため、個人向けシステムや企業向けGPUで動作させるのに最適です。
    • このモデルは、現在、オープンな非商用ライセンスと低コストのクリエイターライセンスの下で利用可能です。大規模な商用利用のライセンスの詳細についてお問い合わせください。
    • このモデルを手軽に利用するには、 Stability Platform のAPI を利用するか、Stable Assistant や、 Discord 上の Stable Artisan からもご利用いただけます。

    Stable Diffusion 3 シリーズの最新かつ最も高度なテキストから画像へのAIモデルである Stable Diffusion 3 Medium を発表できることを嬉しく思います。Stable Diffusion 3 Medium は、生成AIの進化における重要なマイルストーンであり、このパワフルなテクノロジーを民主化するというStability AI のコミットメントを継続するものです。

    SD3 Medium の特徴

    SD3 Medium は、SD3の20億パラメーターモデルで、いくつかの特筆すべき特徴を備えています。

    • フォトリアリズム: 手や顔によく見られる不自然さを克服し、複雑なワークフローを必要とせずに高品質の画像を提供します。
    • プロンプトの忠実さ: 空間的関係、構成要素、動作、スタイルを含む複雑なプロンプトを理解します。
    • テキスト生成: Diffusion Transformer architecture により、ノイズやスペルミスのないテキスト生成において、これまでにない結果を達成します。
    • リソース効率: 低いVRAMフットプリントにより、標準的なコンシューマー向けGPUでパフォーマンスを低下させることなく実行することができます。
    • ファインチューニング: 小さなデータセットから微妙なディテールを理解することができ、カスタマイズに最適です。
    画像

    NVIDIA とのコラボレーション

    NVIDIAとコラボレーションし、NVIDIA® RTX™ GPUとTensorRT™を活用することで、Stable Diffusion 3 Medium を含むすべてのStable Diffusion モデルのパフォーマンスを強化しました。TensorRT で最適化されたバージョンは、クラス最高のパフォーマンスを提供し、パフォーマンスが50%向上します。

    TensorRT に最適化された Stable Diffusion 3 Medium にご期待ください。

    AMD とのコラボレーション

    最新のAPU、コンシューマー向けGPU、MI-300XエンタープライズGPUなど、さまざまなAMDデバイス向けにSD3 Medium の推論を最適化しています。

    オープンでアクセスしやすいモデル

    オープンな生成AIへの Stability AI のコミットメントは揺るぎません。Stable Diffusion 3 Medium は無償の非商用ライセンスでリリースされ、Hugging Face を通じて入手可能です。アーティスト、デザイナー、開発者、AI愛好家の皆さまは新しいクリエイターライセンスをご利用ください。

    大規模な商用利用については、お問い合わせください。
    ⭐︎AICUはStability AIの公式パートナーです sai@aicu.ai ⭐︎

    HuggingFaceのモデルカードで詳細情報が公開されています

    モデルの種類: MMDiTテキスト画像生成モデル
    モデルの説明: テキストプロンプトに基づいて画像を生成するために使用できるモデルです。マルチモーダル拡散変換器(Multimodal Diffusion Transformer)(https://arxiv.org/abs/2403.03206)であり、3つの固定された事前学習済みテキストエンコーダ(OpenCLIP-ViT/G、CLIP-ViT/L、T5-xxl)を使用します。

    画像
    画像

    APIとアプリケーションでStable Diffusion 3を試してみる

    オープンリリースと同時に、Stable Diffusion 3 Medium を API でご利用いただけるようになりました。Stable Diffusion 3 のモデルをベースにした様々な強力な画像サービスが、Stable Assistant や、Stable Artisan 経由の Discord でお試しいただけます。まずは3日間の無料トライアルをお試しください。

    利用方法

    • Stable Diffusion 3 Medium を ダウンロード: 非商用利用目的で Hugging Face からダウンロードする。
    • 商用利用: Contact us からお問い合わせください。
    • アプリケーション: Stable Assistant と Stable Artisan からもご利用いただけます。
    • FAQ: その他は FAQs をご確認ください。

    安全性

    Stability AI は、安全で責任あるAIの実践を信じています。これは、悪意ある者による Stable Diffusion 3 Medium の悪用を防ぐために、合理的な手段を講じ、それを継続することを意味します。安全性は、モデルのトレーニングを開始した時点から始まり、テスト、評価、デプロイを通して継続します。Stability AI は、このモデルの広範な内部および外部テストを実施し、危害を防止するための数多くのセーフガードを開発し、実施してきました。

    研究者、専門家、そしてコミュニティと継続的に協力することで、モデルを改善し続けながら、誠実にさらなる革新を進めていきます。Stability AI の安全性へのアプローチについての詳細は、 Stable Safety をご参照ください。

    ライセンス

    Stable Diffusion 3 Mediumは、Stability Non-Commercial Research Community Licenseの下でリリースされています。
    Stability AI は、コミュニティが Stable Diffusion 3 を活用することを奨励すると同時に、AIをオープンでアクセス可能な状態に保つというミッションのもと、新しいクリエーターランセンスを導入しました。プロのアーティスト、デザイナー、開発者、AI愛好家の皆様には、クリエーターライセンスを利用して、Stable Diffusion を使った開発を始めることをおすすめします。

    大規模な商用ユーザーや企業の方は、ご連絡いただき、エンタープライズライセンスを取得してください。これにより、Stability AI の利用ガイドラインを遵守しながら、皆さまがモデルの可能性を最大限に活用できるようになります。

    Stability AIより:今後の展開

    皆さまからのフィードバックに基づき、Stable Diffusion 3 Medium を継続的に改善し、機能を拡張し、パフォーマンスを向上させる予定です。Stability AI の目標は、AI生成アートにおける創造性の新たな基準を設定し、Stable Diffusion 3 Medium をプロと趣味利用の方の双方に不可欠なツールにすることです。

    皆さんが新しいモデルを使ってどのような作品を創作されるかを楽しみにしていますし、皆さんからのフィードバックを楽しみにしています。共に、生成AIの未来を形作って行けたらと思っています。

    公式ツイート動画より

    画像
    画像
    画像
    画像
    画像
    画像
    画像
  • #10分で学べるAI バッチファイルでバリエーション広告を生成しよう(2)解説編

    #10分で学べるAI バッチファイルでバリエーション広告を生成しよう(2)解説編

    前回紹介した、いろいろなスタイルの画像を生成しまくってくれるバッチファイル「Stable Image Core API Image Creator」の仕掛けを解説します!

    なお、概要や使い方は前回の記事をご覧ください #10分で学べるAI

    バッチファイルをダウンロード

    このリンクでダウンロードして使える バッチファイルを配布しています。

    https://j.aicu.ai/SaiImgBat

    これを無料で配ってしまうのはいかがなものか……という議論がありますが、今回はさらにこの中身を解説していきます。

    バッチファイルの中身解説

    このバッチファイルは以下の流れで動作しています

    • 設定を読み込む
    • APIキーの確認をする
    • 現在の設定を表示して確認を促す
    • APIを呼び出して生成する
    • 生成が完了したことを知らせる

    これからそれぞれの動作について説明します

    なお気になる場合はメモ帳やVisual Studio Codeなどでバッチファイルを開くと中身を直接見ることができます

    設定を読み込む

    バッチファイルが実行されると、ウィンドウタイトルなど、プログラムとして必要な機能を設定します

    @ECHO OFF
    title SIC_IMG_Creator
    setlocal enabledelayedexpansion
    cd /d %~dp0

    また設定ファイル(SIC_setting.txt)を読み込んで生成に使うAPIキーやプロンプト、スタイルを変数として保存しています

    for /f "tokens=1,* delims==" %%a in (SIC_setting.txt) do (
        set %%a=%%b
    )
    set STYLE_PRESET[1]=3d-model
    set STYLE_PRESET[2]=analog-film
    set STYLE_PRESET[3]=anime
    set STYLE_PRESET[4]=cinematic
    set STYLE_PRESET[5]=comic-book
    set STYLE_PRESET[6]=digital-art
    set STYLE_PRESET[7]=enhance
    set STYLE_PRESET[8]=fantasy-art
    set STYLE_PRESET[9]=isometric
    set STYLE_PRESET[10]=line-art
    set STYLE_PRESET[11]=low-poly
    set STYLE_PRESET[12]=modeling-compound
    set STYLE_PRESET[13]=neon-punk
    set STYLE_PRESET[14]=origami
    set STYLE_PRESET[15]=photographic
    set STYLE_PRESET[16]=pixel-art
    set STYLE_PRESET[17]=tile-texture
    set STYLE_PRESETNOW=

    APIキーの確認をする

    プログラムの説明を表示し、APIキーの確認をします

    設定ファイル保存されていたAPIキーが空だった場合、エラーとしてユーザーにAPIキーを設定ファイルに記入するよう促しプログラムを終了します

    echo Stable Image Core API Image Creatorへようこそ!
    echo このバッチファイルでは同じプロンプトで複数のスタイルの画像を連続で生成できます
    :: STABILITY_API_KEY が設定されているか確認
    if not defined STABILITY_API_KEY (
        echo エラー: APIキーがセットされていません、settings.txtに入力して保存してください
        echo APIキーを持っていない場合は https://platform.stability.ai/account/keys にアクセスしてAPIキーを取得してください
        GOTO :END_PROGRAM
        exit /b 1
    )

    現在の設定を表示して確認を促す

    設定ファイルを読み込み、APIキーも確認すると現在の設定を表示してユーザーに確認してもらいます

    さらにユーザーからの入力が「y」だった場合、次のフェーズに移ります

    set /a all_img_num=%IMG_NUM%*17
    :: 出力設定の確認
    echo 以下の設定で出力します
    echo プロンプト: %PROMPT%
    echo ネガティブプロンプト: %NEG_PROMPT%
    echo アスペクト比: %ASPECT_RATIO%
    echo 保存フォーマット: %OUTPUT_FORMAT%
    echo 出力サイクル数: %IMG_NUM%
    echo 合計出力枚数: %all_img_num%
    
    :INPUT_CONF
    ECHO この設定で生成しますか? (同じプロンプトで生成する場合、上書きされてしまいます! )
    ECHO (Y / N)
    SET CONF_SELECT=
    SET /P CONF_SELECT=
    
    IF "%CONF_SELECT%"== SET CONF_SELECT=Y
    IF /I NOT "%CONF_SELECT%"=="Y"  GOTO :END_PROGRAM

    APIを呼び出して生成する

    いよいよ Stable Image Core のAPIを呼び出して画像を生成します

    Stable Image Core ではスタイルプリセットを指定できるので、スタイルプリセットだけ変更してAPIを繰り返し呼び出します

    またAPIの呼び出しは指定されたサイクル数だけ行います

    :: API呼び出し
    :CREATE_IMG
    ECHO 画像を %all_img_num%枚 生成中...
    for /L %%n in (1,1,%IMG_NUM%) do (
        for /L %%i in (1,1,17) do (
            set STYLE_PRESET_NOW=!STYLE_PRESET[%%i]!
            echo !STYLE_PRESET_NOW!スタイル で生成中...
            curl -f -sS "https://api.stability.ai/v2beta/stable-image/generate/core" -H "authorization: %STABILITY_API_KEY%"   -H "accept: image/*"   -F prompt="%PROMPT%"  -F negative_prompt="%NEG_PROMPT%" -F style_preset="!STYLE_PRESET_NOW!" -F aspect_ratio="%ASPECT_RATIO%" -F output_format="%OUTPUT_FORMAT%" -o "./SIC_image/%PROMPT%_!STYLE_PRESET_NOW!_%%n.%OUTPUT_FORMAT%"
        )
       echo %%nサイクル 生成完了
    )
    

    APIはcurlを使って呼び出しています

    この1行だけで画像生成をすることはできますが、コマンドプロンプト上でプロンプトを編集するのは至難の技なのでテキストで編集できるようにしました

    curl -f -sS "https://api.stability.ai/v2beta/stable-image/generate/core" 
      -H "authorization: Bearer sk-MYAPIKEY" 
      -H "accept: image/*" 
      -F prompt="Lighthouse on a cliff overlooking the ocean" 
      -F output_format="webp" 
      -o "./lighthouse.webp"

    APIについての詳しい仕様は Stability AI – Developer Platformを参照してください

    生成が完了したことを知らせる

    最後に生成が完了したことをユーザーに知らせ、プログラムを終了します

    :: 結果表示
    :DISPRAY_IMG
    ECHO 生成が完了しました SIC_imageフォルダを確認してください
    
    :END_PROGRAM
    
    PAUSE
    EXIT

    まとめ

    いかがでしたか?

    たったこれだけのバッチファイルで画像生成をすることができます!

    SIC_IMG_Creator.bat に加えて、Stable Diffusion 3で画像生成ができる SD3_IMG_Creator.bat も同梱されています。ぜひ高解像度・高品質・文字入れ可能な画像生成をお楽しみください。

    ダウンロードはこちらから https://j.aicu.ai/SaiImgBat

    プロンプト例「sweet smile, 16 years old, red hair boy leaning in a classroom, anime style」

    次回予告

    コト先輩「ルゥくん、すばらしいね!クライアントも大喜びだよ」
    ルゥ「お役に立てたようで良かったです~」

    コト先輩「で、今回の依頼があった不動産屋さんの紹介を受けて、新規の依頼が舞い込んだよ……!」
    ルゥ「えー!トントン拍子じゃないすかぁ……🫠」

    次回はEdit APIを用いて自撮り写真の顔を置き換えちゃいます!

    次回の #10分で学べるAI をお楽しみに!


    AICUmediaでは今後もStable Diffusion 3.0 やStable Image Core を用いた記事を発信していく予定です

    面白かったらぜひフォロー、いいねをお願いします!

    ✨️本記事が面白かったら、 X@AICUai, noteのフォロー、シェアをよろしくお願いいたします!

    https://note.com/aicu

    社内Slack等のシェアでも歓迎です。

    また「こんな記事欲しい」といったリクエストがございましたら X@AICUai までメンションやDMでいただければ幸いです。

    ✨️AICU Inc.は Stability AI 公式パートナーです。

    様々なアプリ開発のご相談も承っております!サービスに導入したい、使いこなせる社員をパッと育成したい!そんな需要がございましたら sai@aicu.ai までどうぞご相談ください。

    https://corp.aicu.ai/ja/stability-ai-membership

    生成AI時代に「つくる人をつくる」AICU社、生成AIリーディング企業「Stability AI」と戦略提携 

    https://prtimes.jp/main/html/rd/p/000000007.000133647.html

  • 2024年5月の好アクセスランキング+おすすめ記事を紹介! #AICU_media

    2024年5月の好アクセスランキング+おすすめ記事を紹介! #AICU_media

    AICU media 編集部です。月初恒例のアクセスランキングレポートをお伝えします。


    AICU media 5月のまとめ

    よく読まれた記事ランキング

    5月中によく読まれた記事を紹介します

    1. 漫画制作に適したモデルは?Animagine 3.1 vs Animagine 3.0 徹底比較!
    1. [保存版] Animagine XL 3.1 生成比較レポート

    [保存版] Animagine XL 3.1 生成比較レポート|AICU media

    1. OpenAI – GPT-4oをリリース
    1. Stability AI、日本語大規模言語モデル「Japanese Stable LM 2 1.6B」を発表。Google Colabのシークレット機能で短いコードを書いてみよう!
    1. プロンプトからサイトが作れる!?話題の「Create.xyz」を使ってみた!

    Animagine 3.1 / 3.0の記事はもはや恒例ですね。

    そしてGPT-4oのリリースはかなり衝撃的でした。これで何ができるのか考えるだけでも楽しかったです。

    Japanese Stable LM 2 1.6Bは軽量でローカル環境でも扱いがしやすいモデルでした。

    Create.xyzはプロンプトからwebサイトを生成できるサービスで、話題になりました。

    AICU編集部が選ぶ、5月のおすすめ記事

    5月に投稿した記事でAICU編集部がお勧めしたい記事をピックアップしてみました。

    まだほかの人が知らない、生成AIの情報を読んでみませんか?

    • Stable Diffusionの仕組み(入門編)
    • Fooocus v2.4.0リリース & AICUによるColab無料版で動く日本語UI版も継続メンテナンス実施
    • [期間限定無料記事] Stable DiffusionでAI時代のキャラクター開発!最適LoRAモデルの比較実験

    [期間限定無料記事] Stable DiffusionでAI時代のキャラクター開発!最適LoRAモデルの比較実験|AICU media

    • 日報を画像生成でバエさせる #10分で学べるAI
    • #技術書典16 現地取材レポート!生成AIクリエイティブ分野で才能と知見あふれる良書にたくさん出会いました

    AICUマガジン5月号に収録されている特集

    最後にAICUマガジン5月号の特集について紹介します。

    こちらでは実践する方法を書籍形式で詳しく紹介しています。

    • 「画像生成AI Stable Diffusion スタートガイド」公式ワークショップの予習をしておこう!-LoRA制作の予習をしよう
    • 画像生成 AI で X(Twitter) 用2コマ漫画を描こう!

    AICUマガジン5月号はkindle unlimitedに加入されている方は無料で、加入されていない方は電子版の購入ができます。ぜひ読んでください!

    https://j.aicu.ai/Mag2405

    バックナンバーはこちらです

    https://j.aicu.ai/Mag2404

    AICU media 6月のイベント情報

    6/26 19:00〜20:30「画像生成AI Stable Diffusion スタートガイド」 #SD黄色本 公式ワークショップ開催!

    「画像生成AI Stable Diffusion スタートガイド」 #SD黄色本 公式ワークショップが6月も開催されます!今回のテーマは【生成AIの社会と倫理】!

    現在複雑さを極めている、生成AIの法律面を弁護士さんとともに解説します。

    詳しくはこちらをご覧ください。

    • 【生成AIの社会と倫理】「画像生成AI Stable Diffusion スタートガイド」 #SD黄色本 公式ワークショップ 2024/6/26(水)19:00〜20:30開催

    なお、画像生成AI Stable Diffusion スタートガイドには、生成AIにかかわる法律や倫理について解説があります。

    予習として読まれてみてはいかがでしょうか?

    https://j.aicu.ai/SBXL

    最後に

    AICU mediaでは生成AIに関する情報をこれからも皆さんにお届けしてまいります。

    面白い!参考になった!と感じていただけましたら、ぜひいいねやフォローをお願いします

    6月もAICU mediaをよろしくお願いします!

  • AICU、業務拡大に伴い、新プロジェクトの主軸となるAIアート系人材をオーディション形式で募集開始

    AICU、業務拡大に伴い、新プロジェクトの主軸となるAIアート系人材をオーディション形式で募集開始

    「つくる人をつくる」をビジョンに、書籍「画像生成AI Stable Diffusionスタートガイド」などを執筆・開発しているAICU Inc.がこの夏、あらたにAIアート時代のプロクリエイターを育成する目的で「AIアート系インターン」をオーディション形式で募集します。

    【AICU Creators University Audition 2024 Summer】

    • 賞金総額: 10万円
    • インターン期間: 3ヶ月(有償インターン)

    https://corp.aicu.ai

    【目的】

    AICU Inc.(本社:米国Sunnyvale、CEO:白井暁彦)は、生成AI時代に「つくる人をつくる」をビジョンに活動しています(https://corp.aicu.ai/)。主要取引先はStability AIや電通、SBクリエイティブといった世界を代表する企業であり、一般向け書籍「画像生成AI Stable Diffusionスタートガイド」、ブログメディア「AICU media」や、中高生向けKindle雑誌「AICUマガジン」、各種ワークショップ開発などを通して生成AIクリエイティブの発展に寄与しています。

    今回のオーディションは、業務拡大に伴い、さらなる新プロジェクトの主軸となる生成AI時代のビジュアルアートクリエイターの長期育成を目的としています。

    https://corp.aicu.ai/visual

    【募集要項】

    美大・芸大・情報メディア系・専門学校の現役学生を対象とした、AIビジュアルアート作品を通した賞金付きオーディションを開催します。

    【応募スケジュール 】

    • エントリー受付期間: 随時
    • オーディション作品提出締切: 2024年6月16日23:59
    • 2次審査プレゼン兼面接: 2024年6月19日~21日(調整あり)

    【募集部門】

    • 動画部門: YouTubeのURLでショート動画を提出
    • 静止画部門: X(Twitter)のURLでキャラクターイラストを提出
    • タテ動画部門: TikTok向けのダンス動画やCM動画をURLで提出
    • 技術部門: ComfyUIを中心とした技術ブログを評価

    各部門から最終候補作品を選定し、2次審査(プレゼンテーション・面談)を経て最優秀賞を決定します。

    【エントリー応募条件】

    • Stable Diffusion「ComfyUI」を中心に使用(AUTOMATIC1111も歓迎)
    • 作品のメイキングを社内・社外に公開可能
    • アウトプットの動画や静止画は既発表・公開済みでも可
    • メイキング発表用のスライドをGoogle Slidesで作成し、URLを提供(更新は発表会直前まで可能)
    • 2024年7月~10月にかけて、新規事業におけるプロダクション業務に従事できること(週3日程度から。教育あり・時給保証)
    • 上記の要件を満たしていれば、現役学生である必要はありません。

    【2次審査までの流れ】

    • 先着順で評価
    • 既発表作品歓迎
    • SNSでのインフルエンス、コミュニケーション力もプラス評価
    • 過去作品も評価(Pixiv、GitHub、X等)
    • AI作品以外の作品制作力も評価
    • 提出資料は随時更新可能
    • 作品の優劣だけでなく、AI時代のクリエイターとしての適性を評価
    • 未完成な要素も歓迎
    • インターンで体験したいこと、担当したい業務や将来の希望も評価

    【インターン採用に関してのFAQ】

    • 書籍や動画、ワークショップの開催を実施する開発アシスタントとして、サンプルアートの制作、ブログの執筆などを担当
    • 基本はリモートワークになります。
    • 「画像生成AI Stable Diffusion スタートガイド」の内容をマスターしていると有利
    • 現在のアーティストネームやAICUでのクリエイターネームで活動(名義は希望・相談可)
    • 守秘義務契約、インターンプログラム参加契約および業務委託契約を締結

    興味のある方はぜひエントリーを検討してみてください。
    詳細情報はこちらのURL()およびX(Twitter)@AICUai にお問い合わせください。

    【応募フォーム】

    https://docs.google.com/forms/d/e/1FAIpQLSeA939fc4nmu28fcUH14CHM2g6gCgS04qfMad28eZLTLTLpaA/viewform

    【業務内容・プロダクト・企業紹介】

    https://corp.aicu.ai/ja/products


    (参考資料)過去のインターンに関する募集はこちらからご参照ください。

    学生インターン募集(2024年1-2月期) #長期有給インターン募集
    https://note.com/aicu/n/n732ed1580ba4

    AICU インターン募集(2024年3-6月期)
    https://note.com/aicu/n/n45e15b2091f9

    AICU media 学生インターン募集(2023年11月期)
    https://corp.aicu.ai/ja/intern20231103

  • #10分で学べるAI バッチファイルでバリエーション広告を生成(1)使ってみよう編

    #10分で学べるAI バッチファイルでバリエーション広告を生成(1)使ってみよう編

    Google Slidesで新築分譲マンションのバリエーション広告を大量生成…したはいいけど…ええっ!?

    前回、知り合いの不動産会社から依頼された案件のため、

    新築分譲マンションのバリエーション広告を大量生成できるGoogle Slidesを作成した2人でしたが……。

    前回のSTORY #10分で学べるAI

    Google Slidesでバリエーション広告を大量生成 

    ★バリエーション広告:さまざまな対象者に向けて制作する多様性のある広告

    以下、アイキュー部のDiscordでのやり取りです

    ルゥ「コト先輩~、Google Slides作っておきましたよ~」

    コト先輩「わあ!すごいのができたね!!早速クライアントに提出してくる!」

    (…しばらく後…)

    コト先輩「ルゥくんゴメェン!今回のクライアントは『Google Slides禁止!』だそうです!!」

    ルゥ「うええええええええ!先に聞いてきてくださいよ!!」

    コト先輩「今回のクライアントさんからの依頼によると、『オペレーターさんの作業環境は追加ソフトのインストールが禁止されている事務用ノートPC』、だそうです」

    ルゥ「えっ、ゲーミングPCとかは期待してなかったけど……それじゃあGPUは全く期待できないじゃん!」

    Koto「一応期限は半日だけ延長してもらえたけど、『最低15パターンは譲れない』っていわれちゃった」

    ルゥ「どうしてこんな案件受けちゃったんですか!」

    ――こんな環境でも動くものってバッチファイルくらいか…ってバッチファイルでもAPIは呼び出せるんだから Stability AI の Stable Image Core も使えるかも!

    やってみよう

    Stability AI が提供する Stability AI Developer Platform のイメージサービス のうちのひとつ「Stable Image Core」 のAPIを使って、GPUいらず、たった3分程度で商用利用できるバリエーション広告(さまざまな対象者に向けて制作する多様性のある広告)画像を様々なスタイル画像で生成してみましょう。今回はバッチファイルだけ、ノーコードで利用できるツールとして提供します。

    Stability AI のプラットフォーム APIキーの入手

    まず、このバッチファイルで画像生成をするには Stability AI のプラットフォームを利用するAPIキーが必要です。持ってない人はここにアクセスしてAPIキーを取得するか、管理者殿にお願いしてキーを発行してもらってください。

    https://platform.stability.ai/account/keys

    生成できない場合は支払い設定(https://platform.stability.ai/account/credits)を確認してください。

    Copy ❏ したら「sk-….」で始まるAPIキーをクリップボードにコピーできます。このAPIキーが流出すると勝手に使われてしまいますので管理はお気をつけて。

    次のステップに進みます。

    バッチファイルをダウンロード

    このリンクでダウンロードして使える バッチファイルを配布しています。

    ダウンロードしたら解凍して中身を確認してください

    https://j.aicu.ai/SaiImgBat

    設定ファイルを開いてAPIキーを設定

    生成する前にAPIキーを設定します

    SIC_settingという名前のテキストファイルがあるのでメモ帳で開いて、

    「STABILITY_API_KEY=」と書かれている部分の後ろに先ほどコピーしたAPIキーを貼り付けて保存します。

    これだけで画像を生成できるようになりました!

    設定を確認しよう

    生成する前に設定を確認しましょう

    先ほどAPIキーを入力したテキストファイルから以下の項目を設定できます。

    ・プロンプト

    ・ネガティブプロンプト

    ・アスペクト比

    ・出力フォーマット

    ・生成サイクル数

    設定するにはそれぞれの項目の「=」より後ろを書き換えてから保存してください。

    バッチファイルを実行して画像生成!

    いよいよバッチファイルを実行しましょう。

    SIC_IMG_Creatorというバッチファイルをダブルクリックすると実行できます。

    初回はスマートスクリーンの確認画面が出ます。危険なバッチファイルではありませんので詳細情報を押すと実行ボタンが現れます

    ※ここで管理者様に止められてしまう環境の場合は、貴社の情報システム管理部門殿にお願いしてください。

    起動するとこのような黒怖いコマンドプロンプト画面が現れます。

    ここで生成する画像のプロンプトや枚数を確認できます。

    「y」と入力してEnterキーを押下すると生成が開始されます。

    すべてのスタイルで生成が完了するまで大体3分ぐらいかかります。

    生成された画像を確認する

    生成された画像はSIC_Imageというフォルダに格納されています。

    前回と同じ流れが作れそうです!

    まとめ

    いかがでしたか?

    たったこれだけで様々なスタイルの画像を生成をすることができます!

    AICUmediaでは今後もStable Diffusion 3.0 やStable Image Core を用いた記事を発信していく予定です

    面白かったらぜひフォロー、いいねをお願いします!

    次回予告

    次回はこのプログラムの中身を解説しちゃいます!お楽しみに!

    #10分で学べるAI

    #10分で学べるAI シリーズ

    ✨️本記事が面白かったら、X@AICUai, noteのフォロー、シェアをよろしくお願いいたします!
    https://note.com/aicu
    社内Slack等のシェアでも歓迎です。
    また「こんな記事欲しい」といったリクエストがございましたら X@AICUai までメンションやDMでいただければ幸いです。

    ✨️AICU Inc.は Stability AI 公式パートナーです。
    様々なアプリ開発のご相談も承っております!サービスに導入したい、使いこなせる社員をパッと育成したい!そんな需要がございましたら sai@aicu.ai までどうぞご相談ください。

    https://corp.aicu.ai/ja/stability-ai-membership

    生成AI時代に「つくる人をつくる」AICU社、生成AIリーディング企業「Stability AI」と戦略提携 https://prtimes.jp/main/html/rd/p/000000007.000133647.html

  • Computex 2024 基調講演 Stability AI のCEO/CTOが語る Stable Diffusion 3 は「自然の進化」

    Computex 2024 基調講演 Stability AI のCEO/CTOが語る Stable Diffusion 3 は「自然の進化」

    ■Stability AI クリスチャン・ラフォート氏の講演を入手

    AICU media は講演動画を入手しましたので要約翻訳でお送りします

    AMDの基調講演(Dr. Lisa Su, Chair and CEO, AMD)

    https://www.computextaipei2024.com.tw/en/index.aspx#keynote1

    司会者:皆さん、本日は、AI開発者と密接に連携しているAMDのMI300 (AMD Instinct™ MI300 Series Accelerators)についてお話しします。それでは、Stable Diffusion の画期的なオープンアクセスAIモデルで知られる Stability AI のCTO兼共同CEO、クリスチャン・ラフォートさんをお迎えしましょう。こんにちは、クリスチャンさん。お元気ですか?

    クリスチャン:こんにちは。元気です。この場に立てることを光栄に思います。Stability AI の仲間たちを代表してここにいます。

    司会者:今日はStability AIの多くの革新についてお話しいただきますね。まずは、これらのAIモデルがどのようにして可能性の境界を押し広げているのか、教えていただけますか?

    クリスチャン:もちろんです。私たちは、あらゆる業界で生産性の飛躍的な向上を目の当たりにしています。特に、私たちがモデルとソースコードを無料で公開したことで、多くの開発者や研究者が新しい発見を驚異的な速度で行い、新しいアプリケーションを作り上げました。例えば、古い家族写真の修正や品質向上、あるいはもう見たくない人を写真から削除することが、今や誰でも数秒でできるようになりました。同様に、生産性の向上は画像だけでなく、言語、コーディング、音楽、音声、3Dといった他の研究分野でも見られます。これらを組み合わせることで、映画制作やビデオゲームの生産性を少なくとも10倍に引き上げることを目指しています。

    司会者:それは素晴らしいですね。さて、今日は何か大きなニュースがあると伺っていますが。

    クリスチャン:はい、Stable Diffusion 3のリリースが間もなくです(the weight/wait fot Stable Diffusion 3 is almost over..!)。

    コミュニティの皆さんの忍耐と理解に感謝しています。品質と安全性を向上させるために多大な努力を注ぎました。本日、6月12日にStable Diffusion 3のミディアムモデルを皆さんにダウンロードいただけるようリリースすることを発表します。

    (会場から拍手)

    クリスチャン:多くの努力がこのモデルに注がれました。私たちは、コミュニティがこのモデルをどのように活用するのか、とても楽しみにしています。技術的でない方々にはわかりにくいかもしれませんが、かつては研究の最前線がこうしたモデル、例えば Stable Diffusion のようなものに繋がっていました。これはまさに自然な進化のようなもので、様々な新しい方法で組み合わさっています。これをオープンに公開することで、何百万人もの人々が最適な組み合わせ方を発見し、新しいユースケースを解放するのを手助けしてくれます。SD3ミディアムは、これまでにない視覚品質を実現したSD3の最適化バージョンであり、コミュニティが自分たちの特定のニーズに合わせて改善することができます。これにより、次の生成AIのフロンティアを発見する手助けになります。このモデルはもちろんMI300上で非常に高速に動作し、発表されたばかりのRyzen AI搭載のラップトップでも動作するほどコンパクトです。こちらがStable Diffusion 3で生成した画像です。台湾の夜市を描写するようにチャレンジしました。

    司会者:とても素晴らしいですね。

    クリスチャン:細かく見ると完全なフォトリアリスティックではないかもしれませんが、テキストプロンプトのさまざまな要素をよく捉えていると思います。特に、この長いテキストプロンプトを実際に入力するよりもはるかに速く生成されたことを考えると、特に印象的です。歩いている通行人、石でできた通り、夜間の雰囲気などが捉えられています。

    クリスチャン:SD3は、マルチモーダルディフュージョントランスフォーマーアーキテクチャを使用しており、視覚コンセプトとテキストプロンプトを以前のモデルよりもはるかに優れた方法で理解します。シンプルなプロンプトにも対応しているので、これを使いこなすための専門知識は必要ありませんが、より複雑なプロンプトにも対応し、そのすべての要素をうまく組み合わせることができます。SD3は、あらゆる種類の芸術スタイルやフォトリアリズムに優れています。

    ここに実際に非常に難しい例があります。これは、1年以内にリリースした前のバージョンであるStable Diffusion XL (SDXL) との比較です。この例は特に難しいのですが、なぜなら、手を描くことがこれらのモデルにとって非常に難しいからです。また、ギターの弦やフレットのような繰り返しのパターンも含まれています。これらはすべて、モデルが理解し正確に描写するのが非常に難しいものです。SD3がギターの形や手のようなより現実的なディテールを生成したことに注目してください。細かく見ると、いくつかの不完全な点があるかもしれませんが、前世代に比べて大きな改善です。

    司会者:本当にすごいですね。MI300 GPUについての印象はどうですか?

    クリスチャン:素晴らしいです。MI300の192GBのメモリはまさにゲームチェンジャーです。新しいモデルを解放する方法として、より多くのメモリを持つことが非常に重要です。これが、より大きなモデルをより早く、より効率的にトレーニングするのに役立つのです。具体例を挙げると、AMDとの協力でクリエイティブアップスケーラ機能を開発しました。これは、1メガピクセル未満の古い写真を取り込み、解像度を大幅に向上させ、品質も同時に向上させる機能です。Nvidia H100で30メガピクセルを達成した時も嬉しかったのですが、MI300Xにコードを移植したところ、ほとんど努力なしで100メガピクセルに達しました。コンテンツクリエイターは常により多くのピクセルを求めているので、これは大きな違いを生みます。実現するためにほとんど努力が必要なかったことも大きなステップアップです。研究者やエンジニアは、AMDとStankのGPUが提供する素晴らしいメモリ容量と帯域幅の利点を気に入ることでしょう。

    司会者:それは驚異的です。AMDとの今後の協力についてはどう考えていますか?

    クリスチャン:AMDとのさらに密接な協力を通じて、新しい最先端のビデオモデルを開発し、全世界に公開したいと考えています。これにはより多くのメモリとコンピュートパワーが必要です。AMDのチームと密接に協力して、これを実現したいと考えています。

    司会者:素晴らしいですね。今日はお話いただき、ありがとうございました。

    ✨️本記事が面白かったら、ぜひシェアをよろしくお願いいたします!

    社内Slack等のシェアでも歓迎です。

    また「こんな記事欲しい」といったリクエストがございましたら X@AICUai までメンションやDMでいただければ幸いです。

    ✨️AICU Inc.は Stability AI 公式パートナーです。

    様々なアプリ開発のご相談も承っております!サービスに導入したい、使いこなせる社員をパッと育成したい!そんな需要がございましたら sai@aicu.ai までどうぞご相談ください。

    https://corp.aicu.ai/ja/stability-ai-membership

    生成AI時代に「つくる人をつくる」AICU社、生成AIリーディング企業「Stability AI」と戦略提携 https://prtimes.jp/main/html/rd/p/000000007.000133647.html

  • Stability AI が Stable Diffusion 3 の weights を 2024年6月12日に公開予定…ところで画像生成AIにおける weights って何?

    Stability AI が Stable Diffusion 3 の weights を 2024年6月12日に公開予定…ところで画像生成AIにおける weights って何?

    Computex Taipei 2024のオープニングキーノートにて、Stability AI 共同CEOの Christian Laforte氏(@chrlaf) がStable Diffusion 3 Medium を6月12日にオープンリリースすると発表しました。

    <Stability AIの公式メールニュースからの翻訳>

    「Stable Diffusion 3 Medium」が登場します!6月12日(水)より、Hugging Faceでweights をダウンロードできるようになります。SD3 Mediumは、20億のパラメータを持つSD3モデルで、これまでのモデルが苦手としていた分野で特に優れた性能を発揮するように設計されています。主な特徴は以下の通りです:

    フォトリアリズム: 手や顔によく見られるアーチファクトを克服し、複雑なワークフローを必要とせずに高品質の画像を提供します。

    タイポグラフィ: タイポグラフィにおいて強固な結果を達成し、大規模な最新モデルを凌駕します。

    パフォーマンス: 最適化されたサイズと効率性により、コンシューマー・システムとエンタープライズ・ワークロードの両方に最適です。

    ファインチューニング: 小さなデータセットから微妙なディテールを吸収できるため、カスタマイズや創造性に最適です。

    SD3 Mediumのweightsとコードは、非商用目的にのみご利用いただけます。Stable Diffusion 3の商用利用を目的としたセルフホスティングライセンスのご相談は、以下のフォームにご記入ください。弊社のチームがすぐにご連絡いたします。

    Sign Up to the Stable Diffusion 3 Weights List

    https://stability.ai/stablediffusion3

    追伸:それまで待てないという方は、当社のフレンドリーなチャットボットStable Assistant、DiscordのStable Artisan、またはAPIから、当社の最も高性能なテキスト画像変換モデルの3日間無料トライアルにアクセスできます。

    Stable LM2 12B は、Stable Assistant を強力にサポートします。Stable Assistant は、当社の最も先進的な言語モデルであり、その強力なテキスト生成機能でコンテンツを強化します。 

    Stable Artisanは、Discordエコシステム内のStability AI Platform API上の製品を利用する、楽しいマルチモーダル生成AI Discordボットです。このボットは、Stable Diffusion Discordサーバーにアクセスして、他のコミュニティと一緒に画像を生成・編集することができます。

    <公式発信ここまで>

    「weightsの公開」にはどんな意味があるのか

    つまり、「weightsをダウンロードできるようになる」というということの意味は、「AIモデルをダウンロードできるようになる」というとして理解してよいと考えます。

    ただしリリースに記載のある通り、AIモデルをダウンロードして使用できるのは非商用目的であり、商用利用する場合は要相談となる点には注意が必要です。

    画像生成AI解説用語集

    📖用語「weights」

    「weights」とは「AIモデル」にあたります。

    #SD黄色本「画像生成AI Stable Diffusionスタートガイド」p.27の解説によると……

    「コンピューターの中では、「ノード」と呼ばれる単位がニューロンの役割をしていて、これらが「重み」(weights)でつながっており、「バイアス」(bias)は入力が0の時、出力にどれだけ値を上乗せするかを意味します。この大量の「重みとバイアス」のセットこそがそのネットワークの「モデル」であり、この調整を入力刺激と出力結果を評価していくことでモデルを学習させることになります。」

    機械学習における「weights & biases」はモデルの学習結果そのものであり、Stable Diffusion以降のAI画像生成AIにおいては safetensorsファイルのことを意味する事が多いでしょう。

    なお英語的には「weights」であって「weight」ではないのでAICU media編集部ではカタカナで「ウェイト」と表記することは限定的とします。

    📖用語「アーチファクト」artifacts 

    アーチファクト(artifacts)という語は、ラテン語で「人工物」を表すars、artisと「作られたもの」を表すfactumの組み合わせで「人工的に作られたもの」を意味します。人為的または技術的な影響によって発生する産物または現象を指します。画像生成AIにおいては「自然物」に対して「人造物」と解釈することができます。

    📖用語「セルフホスティング」self-hosting

    AIモデル提供企業自身による演算基盤や環境をAPI経由で提供するのではなく、weightsをオープンに配布し、ダウンロードして独自の演算環境やアプリケーション、ツールやAPIサーバーに実装して利用すること。ブラックボックス化や長期サポートが保証されないモデル提供企業のAPI経由に対して、内部動作の透明化や最適化、コミュニティのサポートなどの利点がある。

  • #10分で学べるAI Google Slidesでバリエーション広告を大量生成

    #10分で学べるAI Google Slidesでバリエーション広告を大量生成

    「ようこそ!アイキュー部」-1話

    「AIでクリエイティブなビジネスをする!」をテーマに学内起業コンテストにエントリー提案をして「アイキュー部」を設立したKotoちゃん。

    今日は知り合いの不動産会社から依頼された案件に取り組んでいます。

    Koto「あ~あ、新築分譲マンションのバリエーション広告を作ってくれ……って頼まれたんだけど、今日はもう帰らないと…ルゥくん、あと頼むわね!」

    ★バリエーション広告:さまざまな対象者に向けて制作する多様性のある広告

    ルゥ「Koto先輩!?待ってください、何やってるんですか?」
    Koto「え……?アイキュー部で受けたバイトなんですが何か問題でも?」
    ルゥ「そうなんだ……って!なんで手で作ってるんですか?『AIでクリエイティブなビジネスする』ってのがこの部活なんですよね??」
    Koto「私は『アートイラスト・キュレーション部』の略のつもりで「AICU部」って書いたつもりなんだけど……審査員の先生にウケが良かったのでついそのまま……」
    ルゥ「押し切られちゃったんですか!?」
    Koto「こうやって部室も案件もらえたし、いいじゃない。しっかり稼ぎましょ」

    ルゥ「まあ……そうですね、で、これは何なんですか?」

    Koto「わからないの?『マンションポエム』よ!!」
    ルゥ「『上質が佇む(たたずむ)至高の邸宅』……なんだかよくわからないけどこれがあるだけでリッチな感じしますね」
    Koto「『これをできるだけ多くのバリエーションを作ってこい』というのがクライアントから出された課題よ」
    ルゥ「たしかにAI画像生成でできなくもなさそうだけど……これをいくらで受けたんですか?」
    Koto「ああ!もう帰らないと門限が!じゃあ私が家につくまでに、そのAI画像生成とやらで、最低15パターンをGoogle Slidesに作っておいてね!」
    ルゥ「ひぃ」

    ――どうしよう、突然、大量の広告ビジュアルの生成を頼まれちゃった。画像生成しようにもGPUもないしな…。

    あ、でもこんな時は… Stability AI の Stable Image CoreGoogle Apps Scripts が使えるかも!

    ……とおもったら、即実行。こんな感じに出来上がってました!

    ▼「ようこそ!アイキュー部」-1話(後編)はこの技術解説の続きにあります▼

    やってみよう

    Stability AI が提供する Stability AI Developer Platform のイメージサービス のうちのひとつ「Stable Image Core」 のAPIを使って、GPUいらず、たった3分程度で商用利用できるバリエーション広告(さまざまな対象者に向けて制作する多様性のある広告)画像を様々なスタイル画像で生成してみましょう。今回はGoogle Slidesだけ、ノーコードで利用できるツールとして提供します。

    Stability AI のプラットフォーム APIキーの入手

    まず、このプログラムで画像生成をするには Stability AI のプラットフォームを利用するAPIキーが必要です。持ってない人はここにアクセスしてAPIキーを取得するか、管理者殿にお願いしてキーを発行してもらってください。

    https://platform.stability.ai/account/keys

    生成できない場合は支払い設定(https://platform.stability.ai/account/credits)を確認してください。

    Copy ❏ したら「sk-….」で始まるAPIキーをクリップボードにコピーできます。このAPIキーが流出すると勝手に使われてしまいますので管理はお気をつけて。

    次のステップに進みます。

    Google Slides コピーして自分のDriveに

    このリンクでコピーして使える Google Slidesを配布しています。
    お使いのGoogleアカウントでアクセスしてください。

    https://j.aicu.ai/SAIAD

    こんな画面のGoogle Slidesが表示されます。このあと自分のDriveにコピーしていきます。

    ファイル⇢「コピーを作成」⇢「プレゼンテーション全体」を実行します。

    「ドキュメントをコピー」のダイアログが表示されますので、そのまま「コピーを作成」ボタンを押してください。

    初回起動でAPIキーを設定

    まず最初に、APIキーを設定します。

    スライドの上に以下のようなダイアログが表示されます。コピーした直後に表示されるはずです。

    [S.] Stability AI Platform API Key Required

    このツールでは、画像を生成するために Stability AI プラットフォームの APIキー が必要です。
    お持ちでない場合は、https://platform.stability.ai/account/keys でAPIキーを取得してください。

    This program requires a Stability.ai API key to generate images.
    If you do not have one, please visit https://platform.stability.ai/account/keys to obtain an API key.

    と表示されますので、冒頭で取得した「sk-」で始まる51文字のAPIキーを貼り付けてOKを押してください。

    もし、コピー直後のダイアログで設定しそびれた人は、メニューの[AI Image Generator]⇢[Set API key]を実行することで設定できます。

    スクリプト実行権限の設定

    次に、APIキーの動作確認とスクリプト実行権限の許可を行います。メニューの3番目「Generate Images」を選んでみてください。

    「認証が必要です」というダイアログが表示されるはずです。

    スクリプト実行権限を許可していきます。

    現在お使いのGmailアドレスが表示されているはずです。

    スクリプト実行権限を許可するアカウントを選びましょう。保存先ドライブを選択する意味もありますので、実験目的であれば、まずは個人をおすすめします。

    アカウントを選択すると、今度は 「⚠️ このアプリは Google で確認されていません」という警告が表示されます。危険なアプリではありませんので左下の「詳細」を押して行きます。

    最後に「AICU-AdGenerator(安全ではないページ)に移動」を押して、各サービスへの許可を設定していきます。

    許可ボタンを押すことでドライブへの閲覧、書き込み権限、スライドの編集、外部サービス(Stability AIのAPI)へのアクセスを許可します。編集履歴などはお使いのGmailアカウントで実行したことが記録されますし、知らないうちに実行するような処理にはなっておりませんのでご安心ください。

    権限の設定が終わったら、再度メニューの3番目「Generate Images」を選んでみてください。

    「スクリプトを実行しています」が表示され、画像の生成がはじまります。

    3分程度で、「画像の生成が完了しました。フォルダを確認してください」が表示されるはずです。

    Google Driveのマイドライブ直下「AICU-Stability-AdGenerator https://j.aicu.ai/SAIAD のコピー」というフォルダに以下のような画像が生成されていれば成功です!

    これは同じプロンプトに対して、 異なるスタイルが15種類適用された画像になります。

    Google Slides自動生成とキャッチコピーの配置

    これで終わり!でもいいと思ったのですが、クライアントの要求は画像の生成だけでなく、「マンションポエム」と呼ばれるキャッチコピーも含まれるような気がしたので、もうひと押しGoogle Slidesで頑張ってみます。

    Kotoさんが作っていたスライドにあったキャッチコピー「上質が佇む至高の邸宅。」とスタイルを第1ページに設定してあります。こちらは自由に編集していただいて構いません。

    これで準備は完了です!

    下の[Prompt=]に生成したいもの,
    [NP=] に見たくないものを英語で入れて
    メニューの3番目の[AI Image Generator]⇢[Add Slides by all styles] を選んでみてください。

    「スクリプトを実行しています」と表示されます。

    この後の結果が出るまでは、数分かかります。無事に生成されるとこのように15枚のスライドがキャッチコピー付きで生成されます。左下のスライド一覧表示にしてみましょう。

    初期状態では「Prompt=urban tokyo bayfront skyline residences ad luxury super rich visual」(プロンプト=東京ベイフロントのスカイライン・レジデンス広告の豪華なスーパー・リッチ・ビジュアル)となっているので、このまま何度でも「Add Slides by all styles」を実行すれば15枚づつ、東京湾ベイエリアの高級そうな住居の画像が生成されます。第1ページにある「Prompt=」と「NP=」を変えるだけなので、例えばこんなプロンプトにしてみます

    Prompt=Paris urban apartment  パリの都会のアパルトマン
    NP=Nsfw, worst quality
      (ネガティヴ・プロンプト)職場にふさわしくない、悪いクオリティ

    Stability AIの Stable Image Core API に実装されている多様なスタイルのおかげで、自然なバリエーション広告を生成できています。ネガティヴ・プロンプトのおかげもあってか、あまり出来の悪いスライドはありませんが、不要なスライドやキャッチコピーの修正を行って完成です。

    このSlidesに追加してある「AI Image Generator」メニューから実行できる機能の詳細は以下のとおりです。

    ・ Set API Key:Stability AI のAPIキーを設定します。

    ・Add Slides by all styles:タイトル(1枚目のスライド)で「Prompt=」で与えられたプロンプトと「NP=」で与えられたネガティブプロンプト(英語)から Stability AIの Stable Image Core API を使用して15種類のスタイル適用済み画像をGPU不要で画像を生成し、1枚生成されるごとに、スライドの画面全体に表示されるように背景画像として配置しています。追加された各スライドのタイトルとメモに 使用したstyleとプロンプトを設定しています。

    ・Generate Images:タイトル(1枚目のスライド)で与えられたプロンプトから、スライドのファイル名と同じ名前のディレクトリにすべてのスタイルの‪2,040 x 1,152‬pixelsの画像を15スタイル生成します。

    ・Save All Slides:PDF がDriveに保存されます。Google Slidesの[ファイル]⇢[ダウンロード]で保存でも構いません。

    ・15スタイルの生成は3分程度で51credit (80円ぐらい)です。

    ※安全のため、他人とシェアするときは Set API Keyを使って有効ではないAPIキーを設定しておくことをおすすめします。
    ※本ツールのソースコードが気になる方は Google Slides上でスクリプトエディタをご参照ください。このコードの著作権はAICU Inc. が保有しています。この記事で公開されているツールの使用における損害等についてAICU Inc.は責任を負いません。
    ※実際の広告等への利用など Stable Diffusionの商用利用に関するご質問は sai@aicu.ai までお問い合わせください。

    技術解説「Slidesだけでも画像生成できる」

    Google SlidesをコピーしてAPIキーを貼り付けるだけで様々なスタイルの画像を生成をすることができました!

    AICU media では今後も話題の Stable Diffusion 3.0 やStable Image Core を用いた記事を発信していく予定です。面白かったらぜひフォロー、いいねをお願いします!

    次回予告

    さてその後のアイキュー部のDiscordでのやり取りです

    ルゥ「Koto先輩~、Google Slides作っておきましたよ~」
    Koto「わあ!すごいのができたね!!早速クライアントに提出してくる!」

    (…しばらく後…)

    Koto「ルゥくんゴメェン!今回のクライアントは『Google Slides禁止!』だそうです!!」
    ルゥ「うええええええええ!先に聞いてきてくださいよ!!」

    せっかくルゥくんが頑張って作ったGoogle Slidesですが、別のアプローチを探さねばならないようです。

    #10分で学べるAI いかがでしたでしょうか?ご感想は X@AICUai までいただけると幸いです。

    続きはこちら

    漫画「ようこそアイキュー部」はこちらに続きます!

    ▼ようこそ!アイキュー部 第1話 https://note.com/aicu/n/ne878b6d68004

    ▼AICUマガジン5月号 https://j.aicu.ai/Mag2405

  • 工場勤務のおじさんが書く:橋本大也教授と白井暁彦CEOが解説する生成AIの未来

    工場勤務のおじさんが書く:橋本大也教授と白井暁彦CEOが解説する生成AIの未来

    デジタルハリウッド大学の橋本大也教授と、デジタルハリウッド大学特命教授でもあるAICU Inc.の白井暁彦CEOが、それぞれのベストセラー書籍をもとに、ChatGPTやStable Diffusionなどの生成AIの最新動向を紹介しました。


    人気著者が語る生成AIの魅力を一挙レポート

    今回イベントレポートを書かせていただきます、AICU media のゲストライターです。工場のおじさんとしての目線でレポートしていきます!現地に参加できなかった読者に向けて、両著者の最新刊や #SD黄色本のサイン本即売会、交流の様子をお届けします。

    私は初めてデジタルハリウッド大学に行きましたが、とても高いビルの中にあり、「こんなところに大学があるんだ」とドキドキしました。(このイベントに参加するために、岡山からきました!)

    wikipediaより。このビルの3Fと4Fがデジタルハリウッド大学です!

    https://ja.wikipedia.org/wiki/%E3%83%87%E3%82%B8%E3%82%BF%E3%83%AB%E3%83%8F%E3%83%AA%E3%82%A6%E3%83%83%E3%83%89%E5%A4%A7%E5%AD%A6#

    AICU イベント告知記事→https://note.com/aicu/n/na27e9055f06f

    3階へ行き、会場の受付を済ませた後、中に入りました。

    (編集部:注)開演前に上映されていた動画
    #AICU – AI Creators Union Demo Reel 2024 Summer

    イベントの時間になり、スタートはデジタルハリウッド大学の杉山知之学長の動画から始まりました。

    イベントがはじまる

    写真:デジタルハリウッド大学の杉山知之学長の動画(AIの技術が入っているとは思えないくらい自然でしょ)

    これはAIで作られた杉山学長のアバターが、デジタルハリウッド大学の入学式で講演している動画です。
    ここで、杉山知之学長の発表で感じたことを率直に書きますね。

    この動画を見て、最近はAIが仕事を奪うなどネガティブなニュースが多いけれど、このような使い方は素晴らしいなと思いました。
    この動画、ただ学長が話をしているだけじゃんと思う人もいるかもしれません。
    しかし、杉山知之学長は2021年よりALSという難病のため、体を自由に動かせず、声も出せない状況です。

    AIを使って昔の声を再現し、AIの技術で表情を作り出すことで、まるで健康な時のように登壇している姿で動画の中で話をしていたのです。

    この姿を見て、体の不自由な人々に対してAIがどれだけのサポートを提供できるかを実感できたんですよね。
    AIが障害を持つ人々の生活をサポートする可能性を強く感じました。


    橋本大也先生の話 – ChatGPTで作業時間が3分の1に?

    続いて、今回のイベントのメインスピーカーの一人である橋本大也先生について紹介します。
    さくっと一言で言うと、『頭がいい人のChatGPT&Copilotの使い方』(橋本大也著)という本を書かれた先生です。
    本の表紙に、仕事時間を1/3に短縮できるって言葉が書いてありました。

    え、えっー!仕事時間を1/3に短縮。。。まじか!?

    そんな大きなことを書いてしまったら、めっちゃくちゃ叩かれてしまいそうと、ちょっと不安に思いました。みなさんも思いますよね?

    しかし、登壇内容を聞いていたら、めちゃくちゃ納得できました。

    橋本大也先生の話を書いたので読んでください。


    橋本大也先生の話で特に面白かった2点

    橋本先生の話は、主にAIで面白い映像を制作する方法にふれていました。

    写真:実際にAIで作った動画。スクリーンで見る大きな恐竜は大迫力!

    講演の序盤では、大画面に生成AIで作られた動画が流れていて、ワクワクする気持ちがおさえきれませんでした。

    橋本大也先生の話で特に面白かったことは2点あります。
    1点目は、実際に動画を作る工程を細かく説明してくれたことです。
    2点目は、数学的なグラフにアニメーションを加えるとアートになることです。

    これは1点目の話題で発表された、動画の製作工程の一部です。

    通常、完成形しか見ることがないAI動画の制作過程について、プロの目線から具体的なツールの使用方法を教えてくれました。

    橋本先生によるAI動画の手順の一例を紹介します。
    ChatGPTでストーリーを作り
    ②その段落ごとにRunwayを使って動画作成(日本語だと精度がよくないので英語に翻訳)
    Uidoで音楽生成(ストーリーをもとに)
    DIDでナレーションを追加
    ⑤動画を結合

    この作業をAIなしでやろうとすると、たぶん、1ヶ月から3ヶ月くらいかかる内容(私が、前に動画制作をしている人から聞いた情報です)を、なんと1時間ほどで作れるというのです。

    橋本先生の「仕事時間を1/3に短縮できる」という言葉は本当でした!

    2点目の、数学的なグラフにアニメーションを加えるとアートになるという話題です。

    普通のグラフはただ表示されるだけでは全く面白くありません。(面白いと思う人はすごくレベルが高いと思います)
    しかし、ChatGPTに「このグラフをアニメーションにしてください」と指示を与えてグラフのアニメーションをつくり、音楽を加えて編集することで、グラフの印象ががらっと180度くらい変わるのです。

    写真:この線グラフは、音楽に合わせて脈動しているところの写真。(一回、実際に体感してほしい。写真じゃ伝わらない。体感してみてください。)

    他にも、ドーナッツチャートに音楽を加えると、カラフルで楽しいアートになるんです。

    また、3次元サーフェスプロットに関しては、まるで新しい生物が誕生したかのような感覚になります。まるで新海で見たことがない生物を眺めている気持ちになるんです。これは実際に見たからこその感動でした。


    しらいはかせの話 – 「世界で最も[おもしろい]生成AIビジネスをつくるには」

    https://note.com/o_ob/n/n930c390b6dfa

    続いて、今回のイベントのメインスピーカーの一人であるしらいはかせについて紹介します。

    しらいはかせは、いろんなことができる方で、大ボリュームの発表でした。

    なので、しらいはかせをさくっと一言で説明すると
    画像生成AI Stable Diffusion スタートガイド」を書いた人です。

    写真:この本は、予約してすぐに買いました。個人的に、世界の生成AI画像をつくる教科書になるものだと思っています。

    有益な内容が多すぎる!
    正直、カルピスの原液一気飲みを3本くらいやった感じです。
    なので、情報量の濃さと多さに途中から頭がついていっていないのです笑

    実際の内容の1割ぐらいしか書き起こせなさそう。実際に発表を聞いた方ならわかってくれるはず!


    つくる人をつくる

    「つくる人をつくる」が生まれた理由には、しらい博士のこれまでの経験が濃縮されています。

    『綺麗なグラフィックでも、おもしろくない』

    印象的だったのは、「綺麗なグラフィックでも、おもしろくない」という言葉です。

    この言葉は非常に深い意味を持っており、しっかり理解するには深海3000メートルまで潜る覚悟が必要です。なので、ここでは簡単に説明します。

    例えば、非常に綺麗なグラフィックのAIアバターが全自動で会話をするアニメーションを作っても、見る人は3秒で飽きてしまいます。

    つまり、面白くないのです。

    ですが、そこに人の感情を反映させるような演出を人間が加えると、とても面白くなります。例えば、目線の動き、カメラのフレーミング、仕草などです。

    つまり、面白いものをつくるためには、人の演出が必要だということです。
    人がどこで面白いと感じ、感情が動くのかを考えながら手を加える必要があります。

    この点においては、現時点では人間の手による演出がAIを上回っているのかもしれません。



    人生のターニングポイント

    しらいはかせの人生には、2つのターニングポイントがあるそうです。

    1つ目は、「ゴキブリ」?
    2つ目は、子供たちの遊びの本質の探究

    「ゴキブリ」
    ゴキブリと聞くと驚くかもしれません。

    過去にしらいはかせが「ファンタスティック・ファントム・スリッパ」という作品を作った話です。

    写真:「ファントムスリッパー」。今でも最先端だと思う。そんな技術を1997年に、やっていたしらいはかせは、すごすぎる。

    この作品では、2匹のゴキブリの疑似体験が描かれています。1匹は感触を感じられ、もう1匹はただのグラフィックです。この疑似体験を通じて、リアルとバーチャルの境界を探りました。

    なぜこの疑似体験が海外で「アメージング」と言われ、大きな反響を呼んだのかを深く考えたことが、1つ目のターニングポイントだったそうです。


    子供たちの遊びの本質を探究したこと

    日本科学未来館 (旧)常設展示『アナグラのうた 〜消えた博士と残された装置〜』

    写真:「アナグラのうた」。自分が歩いたところを遡って、足跡をつくれるらしい。面白そう。この作品も10年以上も前に作られたそうです。

    「アナグラのうた」を通じて、子供たちの遊びの本質を探求しました。

    このプロジェクトでは、モーションキャプチャー技術を使って子供たちの遊びを可視化しました。子供たちが歩いたり、ダンスをしたりする際に足跡やマークが現れる仕組みを導入しました。

    (編集部注)

    ゲーム業界をやめて東京工業大学の博士学生に戻った頃から、子供たちが楽しそうに遊ぶ姿を観察し、博士論文を通して「遊ぶこと」の本質についてさらに深く考えるきっかけになったそうです。

    【博士論文】「床面提示型触覚エンタテイメントシステムの提案と開発 白井暁彦」

    https://akihiko.shirai.as/AkihikoSHIRAI-DoctorThesis2004.html





    『あそぶ』って言葉の意味っていろいろ。

    「あそぶ」という言葉には、実にたくさんの意味があります。

    写真:あそびの意味って、こんなに多い。

    例えば、

    遊ぶ(あそぶ)、(およぐ)、戯れる(たわむれる)、(もてあそぶ)、弄ぶ(たわむれる)
    このように、「あそぶ」という言葉には多くの意味が詰まっています。

    英語の「play」も同じように、多義的な意味を持っています。
    例えば、「play」はスポーツをする、楽器を演奏する、ゲームをするなど、さまざまな場面で使われます。これってすごく面白くないですか?

    つまり、「あそぶ」という言葉は、それを通じて私たちの好奇心を大いに刺激するもの。
    動作や使う人の思考や視点でも変わるって面白い。

    遊びながら新しいことを発見したり、楽しい経験を通じて学んだりすることは、まさに好奇心をくすぐる最高の方法ですよね。


    これからの人類に必要なこと

    これらの「つくる人をつくる」に繋がる話を聴いて、好奇心を持ち、情熱を持って生きることが、これからの人類にとって何よりも大切だと思いました。

    しらいはかせは、「情熱」と「ハルシネーション(幻覚)」という言葉を使っていました。

    ここからは、しらいはかせの言葉を使いながら、私なりに解釈したことを書きます。

    写真;昔のひとは、どうしてこの絵を描いたのだろう?そこに今求められている生きる秘密が隠されてそうです。

    個人的に解釈したのは、人間の存在意義を考えると、好奇心を持ち続け、情熱を持って生きることが、最もハッピーな人生を送る秘訣だということです。

    AIなどの技術がどんなに発展しても、人間が幸せに生きるためにはそれだけでは不十分です。目標を持ち、情熱を持って生きることが必要です。

    例えば、極端な話、定年退職してやることがない高齢者の方がいたとします。(極端な例の話ですよ。)
    無限に時間があるけどやることがない、これは地獄のような人生です。

    逆に、日々好奇心を持ち、情熱を持って生きると、毎日が楽しくなります。
    今日は絵を上手く描いて売ってみようという目標を持てるような毎日です。

    これによって色々学べるし、人生も楽しいものになります。私自身、本気で情熱がある方が良いと思っています。
    好奇心を持てるようになるためには、学ぶことが大切です。

    その学ぶ機会を無限に提供できるのが、「つくる人をつくる」ということなのだと思います。

    「つくる人をつくる」というのは、人間が持つ好奇心や情熱を育むことにあると考えています。これによって人生が充実し、ハッピーに生きることができるんですよね。

    Stable Diffusionの画像生成の話

    写真:Stable Diffusionの仕組み

    仕組みについての解説パートはこちらで資料が出ていました。

    ■Stable Diffusionの仕組み(入門編)

    https://note.com/aicu/n/n505b0dfb1a75

    最後に

    学べることと情報量がとても多く、おなかいっぱいになったイベントでした!

    他にも撮影不可の特別資料なども特別に公開されていましたが、現場にきた人だけの特権ということで、私からのレポートを終わらせてもらいますね。

    お読みくださりありがとうございました。

    イベント速報記事→https://ja.aicu.ai/talk20240530/

    前回のイベント「デルタもんLoRAを作ろう!」ワークショップレポートはこちら

    https://ja.aicu.ai/event20240516/

    デジタルハリウッド大学の動画より
    【公式60秒】デジタルハリウッド大学新CM『みんなを生きるな。自分を生きよう。2024』篇フルバージョン

    【関連】

    #SD黄色本 サイン本即売会も開催!生成AI書籍人気著者の2人が語る「ChatGPTとStable Diffusion丸わかりナイト」

    この記事が面白いと思ったら、AICU media をフォローよろしくお願いいたします!