投稿者: media

  • Google ColabでのAUTOMATIC1111 xformers関連の不具合と解決方法について(2024/5/22)

    Google ColabでのAUTOMATIC1111 xformers関連の不具合と解決方法について(2024/5/22)

    「生成AI時代に つくる人をつくる」AICUの しらいはかせ です。
    ご高評いただいております「画像生成AI Stable Diffusion スタートガイド」
    (通称 #SD黄色本 )掲載の主要なプログラム(SBXL1SBXL2)につきまして、編集部が本日、Google ColabでのAUTOMATIC1111において不具合を発見いたしましたので、本日、解説とともに修正を実施いたしました。

    【現象1】SD1.5系でGradioURLが表示されない

    p47 【Start Stable-Diffusion】のセルを実行時 WARNING[XFORMERS]: xFormers can’t load C++/CUDA extensions. xFormers was built for: PyTorch 2.2.1+cu121 with CUDA 1201 (you have 2.3.0+cu121) Python 3.10.13 (you have 3.10.12) Please reinstall xformers というエラーが出てURLも表示されず完了しません。

    読者の方からも同様のご報告を頂いております(SBクリエイティブさんありがとうございます)。

    【現象2】起動には成功するが画像生成に失敗する

    「Generate」ボタンを押すと以下のようなエラー表示されます。

    AUTOMATIC1111側にはこちらのエラーが表示されています

    NotImplementedError: No operator found for `memory_efficient_attention_forward` with inputs:
    query : shape=(1, 4096, 1, 512) (torch.float32)
    key : shape=(1, 4096, 1, 512) (torch.float32)
    value : shape=(1, 4096, 1, 512) (torch.float32)
    attn_bias : <class 'NoneType'>
    p : 0.0
    `decoderF` is not supported because:
    max(query.shape[-1] != value.shape[-1]) > 128
    xFormers wasn't build with CUDA support
    attn_bias type is <class 'NoneType'>
    operator wasn't built - see `python -m xformers.info` for more info
    `flshattF@0.0.0` is not supported because:
    max(query.shape[-1] != value.shape[-1]) > 256
    xFormers wasn't build with CUDA support
    requires device with capability > (8, 0) but your GPU has capability (7, 5) (too old)
    dtype=torch.float32 (supported: {torch.bfloat16, torch.float16})
    operator wasn't built - see `python -m xformers.info` for more info
    `cutlassF` is not supported because:
    xFormers wasn't build with CUDA support
    operator wasn't built - see `python -m xformers.info` for more info
    `smallkF` is not supported because:
    max(query.shape[-1] != value.shape[-1]) > 32
    xFormers wasn't build with CUDA support
    operator wasn't built - see `python -m xformers.info` for more info
    unsupported embed per head: 512

    ChatGPTによるログと日本語解説はこちら

    https://chatgpt.com/share/41ae4cbb-74ce-4e72-8851-42d1698f8bf0

    なお、xFormersとは、Facebook Research (Meta)がオープンソースソフトウェアとして公開しているPyTorchベースのライブラリで、Transformersの研究を加速するために開発されたものです。xFormersは、NVIDIAのGPUでのみ動作します。NVIDIAのGPUを演算基盤として動作させるためのCUDAやそのビルド時のバージョンをしっかり管理する必要があります。
    https://github.com/facebookresearch/xformers

    【関連】PyTorchとCUDAバージョンエラーの警告について

    実はPyTorchとCUDAバージョンエラーの警告も出ています。

    PyTorch 2.2.1+cu121 with CUDA 1201 (you have 2.3.0+cu121)
    Python 3.10.13 (you have 3.10.12)

    AUTOMATIC1111のインストールマニュアルによると
    https://github.com/AUTOMATIC1111/stable-diffusion-webui

    Install Python 3.10.6 (Newer version of Python does not support torch), checking “Add Python to PATH”.
    Python 3.10.6をインストールし、”Add Python to PATH “をチェックする。

    とありますが、実際にGoogle Colab上でデフォルトで動作しているPythonは現在、Python 3.10.12です(!python — version で確認できます)。
    Python3.10.6が推奨なので、だいぶ後続のバージョンを使っていることになります。この問題はGoogle Colab上でのPythonのメジャーバージョンに関する問題で、関係はありますが、文末で解説します。

    AICU版の原作となったTheLastBenさんのリポジトリでも同様の問題がレポートされています。

    Xformers Google Colab ERROR · Issue #2836 · TheLastBen/fast-stable-diffusion

    Getting Error in the last cell during the launch: WARNING[XFORMERS]: xFormers can’t load C++/CUDA extensions. xFormers…

    github.com

    Google Colabが xformers や JAX といった関連ライブラリを更新してしまうことが問題の根幹でもありますので不具合報告を Google Colab 側にも入れておきます。

    Python and xformers version conflict · Issue #4590 · googlecolab/colabtools

    Describe the current behavior I’m Google Colab Pro+ user and using TheLastBen’s Automatic1111 (A1111) frequently…

    github.com

    【解決】とりいそぎの回避方法

    Start Stable-Diffusionの手前にセルを追加して、以下のコードを入れて実行してください。これで問題の xformersをアンインストールし、解決したバージョンの xformers を再インストールできます。

    #@markdown ### xformers の再インストール(v20240522)
    !python --version
    !yes | pip uninstall xformers
    !pip install xformers

    この「xformers 0.0.26.post1」がインストールされていれば、問題なく動作するはずです。

    【補足】Google ColabのPythonはいつまで現行のバージョン3.10.xなのか

    ところで、いい機会なので Google Colab上でのPythonはいつまで現行のバージョンなのか、調べてみました。実は2024年4月にPython自体のメジャーバージョンアップが予定されているようです。
    https://colab.google/articles/py3.10

    colab.google

    Colab Updated to Python 3.10 With the upgrade to Python 3.10, it brings Colab into alignment with the cadence of final…

    colab.google

    Python 3.10 へのアップグレードにより、Colab はPython バージョン最終的な定期的なバグ修正リリースペースに合わせられます。 Python の次のバージョン (3.11) は、2024 年 4 月に最終的な定期バグ修正リリースが予定されています。

    最終リリースとなる Python3.11.9 は2024年4月2日にリリースされているので、実はもういつ移行してもおかしくない時期なんですね…これはAUTOMATIC1111ユーザーにとってはたいへん重要なアップデートとなります。いきなり使えなくなるのは困るのでGoogle Colab上での切り替えも用意されると良いですね…。
    Google Colab上での賢い方法を期待しつつ、さいごにPythonのメジャーバージョンのロードマップをチェックしておきましょう。

    https://devguide.python.org/versions

    Status of Python versions

    The main branch is currently the future Python 3.13, and is the only branch that accepts new features. The latest…

    devguide.python.org

    Python3.10は2026年中、Python3.11は2027年に終了(end-of-life ; EOL)が宣言されています。

    AICU Inc.は生成AI時代のつくる人をつくるとともに、オープンソースソフトウェアや日本語コミュニティへの貢献を常に行っています。

    書籍なのに最新のオープンソースソフトウェアがアップデートされる、
    新感覚の画像生成AIの教科書「画像生成AI Stable Diffusion スタートガイド」の購入はこちらから! https://j.aicu.ai/SBXL

    書籍[画像生成AI Stable Diffusionスタートガイド] – つくる人をつくる AICU Inc.
    著者:AICU media、白井 暁彦 発売日:2024年3月29日(金) ISBN:978-4-8156-2456-9サイズ:B5判 ページ数:224定価:2,640円(本体2,400円+10%税) 画像生成AIの1つであるStable…

    ja.aicu.ai

    Originally published at https://note.com on May 22, 2024.

  • 最先端のWeb3と音楽生成AIのプレイヤーに会う「AI Beats Lounge Vol.1」イベント参加レポート

    最先端のWeb3と音楽生成AIのプレイヤーに会う「AI Beats Lounge Vol.1」イベント参加レポート

    2024年5月20日に開催されたAI Beats Lounge Vol.1 は、音楽とAIの融合をテーマにしたイベントです。音楽制作にAIを活用するツールや世界のアーティストの考え方について最前線の事例が紹介され、参加者が実際に体験できる魅力的なプログラムが満載でした。Web3とAIと音楽の交差点には才能あふれる女性プレイヤーもたくさんいらっしゃいました。現場よりレポートをお送りします。

    https://note.com/aicu/n/n83d8cb1f774b

    「AI Beats Lounge Vol.1」イベント概要

    • 日付と時間: 2024年5月20日 (月) 18:30–22:00
    • 場所: Crypto Lounge GOX, 新宿区, 東京
    • 詳細はLuMaにて https://lu.ma/btlxtu5q

    ゲストスピーカーによる音楽生成AI活用事例

    音楽とAIの最前線で活躍するゲストスピーカーによる活用事例の紹介。

    Shinya:パーソナルコンテンツのAI動画化

    Shinya / @clabon40: 会場であるGoxLoungeの関係者。T2WEB株式会社代表、音楽AIを活用した作曲に夢中な社会人。
    実はミュージシャンでもあるそうで、娘さんの幼稚園卒業、友達の新居引っ越し祝いなど、非常に身近なパーソナルコンテンツとSunoの活用事例3連発を紹介いただきました。

    ※撮影できる内容ではなかったので残念ながら割愛します

    実はこのイベントはAICUのイベントACT3がきっかけだったそうです!

    明日はAICU Creators Talk3 (ACT3) の開催です! 登壇者紹介・申し込みはいますぐ!|AICU media

    AICU 代表の白井暁彦 (@o_ob)です 明日はAICU Creators Talk3 (ACT3) の開催です! ついに明日、製品発表会です! 登壇やパートナークリエイターの方々が揃い、タイムテーブルが更新されました。…

    note.com

    MISOSHITA:何を最終版とするかは人が決める。完成を決める感性が大事。

    @Misositaworks: テクノロジー&カルチャーを探求するクリエーター

    MISOSHITA:何を最終版とするかは人が決める。完成を決める感性が大事。

    実演:ステム分離

    MISOSHITAさんのおすすめ動画とともに、11年ぶりにメジャーアップデートされた「LogicPro」のアップデートで実装されたAI機能を解説。

    AYAME:生成AIは「音楽のコラージュ」

    AYAME / @aym2m V系バンド「摩天楼オペラ」のキーボーディスト、京都情報大学院大学客員教授

    『AIに全部残して、おかしんでいこうかなとおもいます!』

    発表17分で未発表作品の披露が…!素敵です…!

    Jun Fukunaga: 人間の創造性や作曲能力の拡張。音楽業界でAI否定する人は少ない。

    Jun Fukunaga / @LadyCitizen69: 幅広いジャンルで活動するフリーランスライター・インタビュワー

    非常に深い示唆にとんだ、世界のアーティストの声をお届けします。

    Suno AIStable Audioudio

    良い結果を得るためには経験や知識が必要。

    人間の創造性や作曲能力の拡張。

    フランスのアーティスト「ジャスティス」のインタビューが印象的。
    マルセル・デュシャンの「泉」の例なども出てきました。

    Justice (band) – Wikipedia

    Justice is a French electronic music duo consisting of Gaspard Augé and Xavier de Rosnay. Justice is known for…

    en.wikipedia.org

    LLM開発の面白さ,ゼロから頂点までを一気に学んだ! #WandB |AICU media

    AICUメディアコミュニケーション事業部のKotoneです! 今回の記事では、Fully Connected Tokyo 2023というWeights and Biases社さん(ウェイツ・アンド・バイアスィズ…

    note.com

    音楽業界でAI否定する人は少ない。
    一方で「Stop Devaluing Music」、AIによってアーティストの価値を下げる行為に対する反対も起きている。

    200+ Artists Urge Tech Platforms: Stop Devaluing Music

    Click here to join the movement!

    artistrightsnow.medium.com

    参加型AI作曲体験

    参加者から1フレーズずつ歌詞をもらい、その場でAIを使って曲を作成します。これは参加者全員が楽曲制作のプロセスをリアルタイムで体験できる貴重な機会です。

    参加者AI作曲コンテスト

    Discordにて応募し、イベント当日に優勝者を発表します。優勝者にはAmazonギフト券3,000円分が贈られます。

    お題は「九九の歌」。
    様々な作品の中から1作品が選ばれました。他の作品もすごかった!

    MISOSHITA: 第一回コンテストはこちらのYTR-334Sさんの作品が大賞に決まりました!おめでとうございます。
    選考理由としては楽曲のクオリティが高く、九九の歌の既存イメージとは大きく違う新たな世界観を提示し、キャッチーさも同時に感じられる点です。

    名前:YTR-334S「九九 一の段のうた」
    作品について:シンフォニックメロディアスメタルに。

    九九 一の段のうた by @ytr334s | Suno

    symphonic melodious metal song. Listen and make your own with Suno.

    suno.com

    YTR-334Sさん

    YTR-334Sさんの受賞の言葉:
    ありがとうございます!SUNOいじってほんの数日でしたが、リアルイベントめっさ楽しかったです!!これからもAIと仲良くしていきたいです😊

    音楽AIのクリエイターさんたちは元気な女性たちでした

    YTR-334Sさんはじめとして、多くの元気な女性が目立つコミュニティでした。これからもSunoやStable Audioの使い手がどんどん増えていきそうですね。

    撮影許可いただきました。山形のお土産も頂いちゃいました!

    【AI Beats Lounge】音楽×AI専用コミュニティDiscord

    https://discord.com/invite/bYhHwgUEQT

    X.comでの感想戦

    Suno使ってみたくなりました

    AI×音楽のイベント AI beats lounge Vol.1 ありがとうございました! 参加者は決して多く無かったですが、一人一人の熱量がありかなりディープな最前線の内容ではあったのではないでしょうか。 何でもここから始まっていくというフェーズが1番面白いですね

    イベントで話された内容物凄く簡単にまとめると ・AI楽曲のプライベートミュージック活用の可能性 ・クリエイターはAI楽曲一発生成から一歩進んで複数AIツール活用して楽曲の編集/改変を試し始めてる ・技術は置き換え可能だが、センスや感性は現状ではAIで置き換えづらくより重視される方向

    https://x.com/o_ob/status/1792558479401738448

    https://x.com/clabon40/status/1792561212489945301

    Suno

    Suno is building a future where anyone can make great music.

    suno.com

    https://www.stableaudio.com

    生成AI作家による世界に向けた動画リールを開発

    AICU Inc.のプレスリリース(2024年3月21日 07時10分)生成AI作家による世界に向けた動画リールを開発

    prtimes.jp

    Originally published at https://note.com on May 21, 2024.

  • 日報を画像生成でバエさせる #10分で学べるAI

    日報を画像生成でバエさせる #10分で学べるAI

    新企画「#10分で学べるAI」

    「つくる人をつくる」AICU新人ライターのNaruです。初の原稿となる今回は、Stability AIが提供しているStable Diffusion 3 APIを用いた画像生成ついて、忙しいビジネスパーソンがめっちゃ使えそうなテクニックを #10分で学べるAI というシリーズで紹介していきたいと思います。

    今すぐ終業、でもバエる絵が見つからない…。

    「提案書や日報にバエる、インパクトがある画像がほしいな…」と思ったこと、ありませんか?でもライセンスフリーの画像検索では画像的にも著作権的に微妙…有料のストックフォトを日報に使うなんて予算がない…そんなあなたに送る、画像生成テクニックです。

    <設定>新入社員のSくん
    新人研修ももうすぐ終わり…毎日の日報もネタがつきてきました。今すぐスライドのトップページに16:9の画像を付け足して、BOSSに送りつけて帰宅したい…!でも検索しても検索してもバエる絵が見つからない…!

    ふと某ChatGPT 4oさんにお願いしてみました。
    「今日の日報に使える16:9のバエる画像がほしい」

    うーん、ちょっと、微妙すぎやしませんか。ここは日本ですし。

    ちなみに今日は飛び込み営業で、 日焼けした27歳の元気なスタートアップ企業の社長さんにお会いしました。というレポートしたいので、そんな感じの絵を作りたかったのです。

    そしてBOSSから注文が入りました。

    「今日の日付を入れて」

    いま16時30分ですよ?

    出来上がった画像がこれです。

    念の為、ソースコードへのリンクがあったので確認してみました。

    from PIL import Image, ImageDraw, ImageFont
    import matplotlib.font_manager as fm
    
    # Load the image
    image_path = "/mnt/data/A_vibrant,_eye-catching_image_for_a_daily_report,_.png"
    image = Image.open(image_path)
    
    # Define the date text
    date_text = "2024年5月20日"
    
    # Get a font
    # Using a default font as an example
    font_path = fm.findSystemFonts(fontpaths=None, fontext='ttf')[0]
    font = ImageFont.truetype(font_path, 40)
    
    # Initialize ImageDraw
    draw = ImageDraw.Draw(image)
    
    # Define the text position and color
    text_position = (image.width - 300, image.height - 70)
    text_color = (255, 255, 255)  # White color
    
    # Add the date text to the image
    draw.text(text_position, date_text, font=font, fill=text_color)
    
    # Save the edited image
    output_path = "/mnt/data/A_vibrant_image_with_date.png"
    image.save(output_path)
    
    output_path

    ちがう!僕がやりたいのはこういうことじゃない…!

    僕が作りたいのは、こういうインパクトがある絵です。

    ギラッギラです

    ギラッギラなカバーアートでぜひともBOSSに読んでもらいたい!
    ですが、
    必要な知識は AICU media の過去記事だけで十分でした。
    非エンジニアでも大丈夫、コーディングはゼロ、絵心もゼロです。
    さて作っていきましょう。

    必要なもの

    • Google Colab(無料アカウントでOK)
    • Stability AI のアカウント

    Stability AIのアカウントを持っていない人は https://platform.stability.ai/ にアクセスすると作成できます。

    右上からアカウントを作成できます

    セットアップしよう

    APIキーを取得する

    まずはGoogle Colabで呼び出すためのAPIキーを用意しましょう。

    https://platform.stability.ai/account/keys

    https://platform.stability.ai/account/keys にアクセスするとAPIの管理画面に行くことができます。

    ここでAPIキーを発行できます

    右上にあるCreate API Key というボタンを押すと新しくAPIキーが発行されます。
    なおAPIの呼び出しにはクレジットを使うので不足した人は適宜追加をしてください。

    クレジットはDreamStudioと共通です。10ドルは僕の時給よりも安いです。

    Colabでプログラムを実行する

    今回は実行に必要なPythonコードをアナタのために限定で用意しました。
    日本語解説付きです。

    https://colab.research.google.com/drive/1mc1iQyIDT7FTO74SWcGqqHItUr9nkIC8?usp=sharing

    GitHubは こちら ✨️現在はGitHubに バグ があるのでひと手間あります。

    このColabを開いたら、まずは「ドライブにコピー」のボタンを押してからはじめのコードを▶を押して実行しましょう。

    ドライブにコピーをお忘れなく
    これで必要なライブラリをインポートできます

    次のコードを実行して、取得したAPIキーを入力します。

    実行すると入力画面が現れます

    最後のコードで画像生成の機能を準備します。

    モデルをColab上に用意しないので非常に速いです

    これで画像を生成する準備ができました!


    実際に生成してみよう

    いよいよ画像の生成に取り掛かります。
    下にスクロールするとプロンプトの入力画面があるので[prompt]に生成したい画像を入力し、実行します。

    ここまで正しくできていれば ▶ を押すたびに画像が生成されます。

    文字までしっかりと生成されました!
    ※日本語はまだ書けないっぽいです。

    さて日報のカバーイラスト作っていきます

    ここまでの部分は何度でも再利用できます。
    今日の日報も明日の日報も今週末の日報も、これでイケるって寸法です。

    今日の飛び込み営業で体験した日焼けした27歳の元気なスタートアップ企業の社長さんというレポートにふさわしいカバーイラストを作りましょう。

    [Prompt]にプロンプトを入力しますが、英語で入力する必要があります。
    ここは大人しくDeepLを使いましょう、早く退勤しないとなので。

    https://www.deepl.com/ja/translator/l/ja/en-US

    日報の表紙イラスト、日焼けした27歳の元気な日本人社長のマンガ。右下に「5/20th」の文字。

    Cover illustration of the daily bulletin, a manga of a Japanese president tanned, energetic 27-year-old man, With the words “May/20th” in the lower right corner.

    prompt: Cover illustration of the daily bulletin, a manga of a Japanese president tanned, energetic 27-year-old man, With the words “May/20th” in the lower right corner.

    negative_prompt: NSFW

    aspect_ratio: 16:9

    output_format: png

    こんな感じに入力して▶を押します。

    気に入る画像になるまで、何度でも押しましょう。数秒で生成されます。
    SD3は実写も綺麗ですが、イラストレーションとか漫画も得意です。
    美少女っぽいのもめちゃ良いですが、オジサンが好きそうな絵も作れます。

    どやっ!

    どやっ!

    ちょうどイメージぴったりです!
    このカバーアートに続くレポートの本文にはもちろん、この若くて何か大きなことをしでかしそうな社長さんへの提案が記載されています。
    きっとBOSSも興味を持って読んでくれることでしょう!

    明日からはこの[Prompt]を書き換えるだけです!やったぜ

    10分でできましたか?

    今回はここで終わります。また次回もぜひ読んでください!

    なおStable Diffusion 3 APIの技術詳細についてはこちらで紹介しているのでぜひ読んでくださいね~。

    https://note.com/aicu/n/n838bf71a361f

    https://note.com/aicu/n/ne2fe8a0073b0


    ✨️以上のように業務で仕事でパッと使える画像生成を社内やサービスに導入したい、使いこなせる社員をパッと育成したい!そんな需要がございましたら sai@aicu.ai までどうぞご相談ください。

    本記事が面白かったら、ぜひシェアをよろしくお願いいたします!
    社内Slack等のシェアでも歓迎です。
    また「こんな記事欲しい」といったリクエストがございましたら X@AICUai までメンションやDMでいただければ幸いです。

    AICU Inc.は Stability AI 公式パートナーです。
    様々なアプリ開発のご相談も承っております!

    https://corp.aicu.ai/ja/stability-ai

    https://corp.aicu.ai/ja/stability-ai-membership

    Originally published at https://note.com on May 20, 2024.

  • 参加者とともに「音楽×AI」の活用法を考えるイベント「AI Beats Lounge Vol.1」開催!

    参加者とともに「音楽×AI」の活用法を考えるイベント「AI Beats Lounge Vol.1」開催!


    AI Beats Lounge Vol.1 は、音楽とAIの融合をテーマにした革新的なイベントです。音楽制作にAIを活用する最前線の事例を紹介し、参加者が実際に体験できる魅力的なプログラムが満載です。そして参加するとNFTがもらえる!?

    イベント詳細

    • 日付と時間: 2024年5月20日 (月) 18:30–22:00
    • 場所: Crypto Lounge GOX, 新宿区, 東京
    • 参加費: 2,500円 (税込) — ビールやお酒の飲み放題付き
    • チケット購入: Stripeで事前にお支払いください(GOXPRO会員は参加無料)
    • 本イベントの詳細はLuMaにて https://lu.ma/btlxtu5q

    プログラム内容

    1. セッション

    • 音楽とAIの最前線で活躍するゲストスピーカーによる活用事例の紹介。登壇者は以下の通りです:
    • Jun Fukunaga / @LadyCitizen69: 幅広いジャンルで活動するフリーランスライター・インタビュワー
    • Shinya / @clabon40: T2WEB株式会社代表、音楽AIを活用した作曲に夢中な社会人ミュージシャン
    • MISOSHITA / @Misositaworks: テクノロジー&カルチャーを探求するクリエーター
    • AYAME / @aym2m: V系バンド摩天楼オペラのキーボーディスト、京都情報大学院大学客員教授

    2. 参加型AI作曲体験

    • 参加者から1フレーズずつ歌詞をもらい、その場でAIを使って曲を作成します。これは参加者全員が楽曲制作のプロセスをリアルタイムで体験できる貴重な機会です。

    3. 参加者AI作曲コンテスト

    • Discordにて応募し、イベント当日に優勝者を発表します。優勝者にはAmazonギフト券3,000円分が贈られます。

    4. ネットワーキング

    • イベントの最後には参加者同士の交流を深めるネットワーキングタイムも用意されています。​

    【AI Beats Lounge】音楽×AI専用コミュニティ
    https://discord.com/invite/bYhHwgUEQT

    AI Beats Lounge Vol.1 · Luma
    🤖音楽×AI🤖「AI Beats Lounge」 前線コアユーザーによる活用事例を大公開 参加者とともに「音楽×AI」の活用法を考えるイベント 🎟️Ticket: 2,500円(税込) └🍺ビールやお酒 飲み放題付き 📅…lu.ma

    参加登録がおもしろい!

    歌詞1フレーズとプロンプトの指示、そしてウォレットアドレスを登録すると来場記念NFTがもらえるそうです。CryptoLoungeGOXらしい演出です!

    登壇者のツイートから

    イベントのレポートがここに追加されるかも…?

    AICUがGOXで開催した過去のイベントはこちら

    [3/13開催予定]AIクリエイターギルド@歌舞伎町GOX #AICU_ACT3
    AICU Creators Talk3 2024/3/3のイベント情報をお届けします。AIクリエイターギルド歌舞伎町GOX…corp.aicu.ai

    AICU Creators Talk 3 がCrypto Lounge GOX で開催されました! #AICU_ACT3|AICU media
    つくる人をつくる! AICU media の知山ことねです。 2024年3月13日(水)、第3回 AICU Creators Talk「AICU Creators Guild」を新宿歌舞伎町にある「Crypto Lounge…note.com


    Originally published at https://note.com on May 19, 2024.

  • OpenAI — GPT-4oをリリース

    OpenAI — GPT-4oをリリース

    2024年5月13日に OpenAI は新しい生成aiモデルであるGPT-4oをリリースしました。
    公式リリースの翻訳をベースにわかりやすく詳細にお送りします。
    https://openai.com/index/hello-gpt-4o/

    新しくできるようになったこと

    • 音声と動画から返答できる音声モード
    • テキスト、推論、コーディングの改善
    • 応答速度の高速化
    • APIの低価格化
    • 無料ユーザ向けのツール

    GPT-4oの紹介

    GPT-4o (Omni) は、人間とコンピューターのより自然な対話に向けたメジャーアップデートです。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。音声入力にはわずか 232 ミリ秒で応答でき、平均では 320 ミリ秒で、会話の中における人間の応答時間とほぼ同じです。英語のテキストおよびコードでは GPT-4 Turbo のパフォーマンスに匹敵し、英語以外の言語のテキストでは大幅に改善され、API でははるかに高速で 50% 安価です。 GPT-4o は、既存のモデルと比較して、特に視覚と音声の理解に優れています。

    GPT-4oの機能について

    現在、GPT-4oは既存のどのモデルよりも、あなたが共有する画像を理解し、議論することに優れています。例えば、異なる言語で書かれたメニューの写真を撮影し、GPT-4oに話しかけて翻訳したり、料理の歴史や意義について学んだり、おすすめの料理を教えてもらったりできるようになりました。将来的には、より自然なリアルタイムの音声会話や、リアルタイムの動画でChatGPTと会話できるように改良される予定です。例えば、ChatGPTにスポーツの試合中継を見せることで、ルールを説明してもらうことができます。これらの新機能を備えた新しい音声モードが、今後数週間のうちにアルファ版としてリリースされる予定だそうです。

    GPT-4o 以前は、音声モードを使用して、平均 2.8 秒 (GPT-3.5) および 5.4 秒 (GPT-4) の遅延で ChatGPT と会話していました。これを実現するために音声モードは 3 つの個別のモデルのパイプラインを用いていました。1つ目で音声をテキストに変換し、2つ目でGPT-3.5 または GPT-4 にテキストを取り込んでテキストを出力し、3 番目でそのテキストを音声に変換しています。このプロセスはGPT-4 が多くの情報を失うことを意味します。GPT-4 は、音調、複数の話者、環境音を直接観察することができず、笑い声や歌を発声したり、感情を表現したりすることができませんでした。

    GPT-4o では、テキスト、ビジョン、オーディオにわたって単一の新しいモデルをエンドツーエンドでトレーニングしています。これはすべての入力と出力が同じニューラル ネットワークによって処理されることを意味します。 GPT-4o はこれらすべてのモダリティを組み合わせた最初のモデルであるため、このモデルで何ができるか、そしてその限界を探る上で、まだ表面をなぞったにすぎないと言えます。

    動画によるデモ

    GPT-4oの評価について

    Text Evaluation テキスト評価

    推論の改善 — GPT-4o は、0 ショットの COT MMLU (一般知識の質問) で 88.7% のハイスコアを記録しました。これらすべての評価は、評価ライブラリでおこないました。さらに、従来の5ショットのNo-CoT MMLUでは、GPT-4oが87.2%のハイスコアを更新しました。(注: ラマ3 400bはまだ訓練中です)

    Audio ASR performance 音声ASRの性能

    オーディオ ASR パフォーマンス — GPT-4o は、すべての言語において、特にリソースの少ない言語において、Whisper-v3 よりも音声認識パフォーマンスを大幅に向上させます。

    Audio translation performance 音声翻訳性能

    音声翻訳のパフォーマンス — GPT-4o は音声翻訳において新たな最先端を確立し、MLS ベンチマークで Whisper-v3 を上回ります。

    M3Exam Zero-Shot Results M3Examゼロショット結果

    M3Exam — M3Exam ベンチマークは、多言語と視覚の両方の評価であり、他の国の標準化されたテストからの多肢選択問題で構成されており、図や図表が含まれる場合もあります。このベンチマークでは、すべての言語にわたって GPT-4o が GPT-4 よりも強力です。 (スワヒリ語とジャワ語については、視力の質問が 5 つ以下しかないため、これらの言語の視力の結果は省略します。

    Vision understanding evals 視覚理解試験

    視覚理解の評価 — GPT-4o は視覚認識ベンチマークで最先端のパフォーマンスを達成します。すべてのビジョン評価は 0 ショットであり、MMMU、MathVista、および ChartQA は 0 ショット CoT (Zero Shot Chain of Thought) です。

    従来のベンチマークで測定されているように、GPT-4o はテキスト、推論、コーディング インテリジェンスに関して GPT-4 Turbo レベルのパフォーマンスを達成すると同時に、多言語、オーディオ、ビジョン機能に関して最高水準といえます。

    GPT-4oのトークンについて

    これらの 20 の言語は、新しいトークナイザーの代表例です。

    • グジャラート語 トークンが 4.4 分の 1 (145 個から 33 個に)
    • テルグ語 トークンが 3.5 分の 1 (159 個から 45個に)
    • タミル語のトークンが 3.3 分の 1 (116 個から 35 個に)
    • マラーティー語のトークンが 2.9 分の 1 (96 個から 33 個に)
    • ヒンディー語のトークンが 2.9 分の 1 (90 個から 31個に)
    • ウルドゥー語のトークンが 2.5 分の 1 (82 個から 33 個に)
    • アラビア語のトークンが 2.0 分の 1 (53 個から 26個に)
    • ペルシャ語 トークンが 1.9 分の 1 (61 個から 32 個に)
    • ロシア語のトークンが 1.7 分の 1 (39 個から 23個に)
    • 韓国語のトークンが 1.7 分の 1 (45 個から 27 個に)
    • ベトナム語のトークンが 1.5 分の 1 (46 個から 30 個に)
    • 中国語のトークンが 1.4 分の 1 (34 個から 24 個に)
    • 日本語のトークンが 1.4 分の 1 (37 個から 26 個に)
    • トルコ語のトークンが 1.3 分の 1 (39 個から 30 個に)
    • イタリア語のトークンが 1.2 分の 1 (34 個から 28 個に)
    • ドイツ語のトークンが 1.2 分の 1 (34 個から 29 個に)
    • スペイン語のトークンが 1.1 分の 1 (29 個から 26個に)
    • ポルトガル語のトークンが 1.1 分の 1 (30 個から 27 個に)
    • フランス語のトークンが 1.1 分の 1 (31 個から 28 個に)
    • 英語のトークンが 1.1 分の 1 (27 個から 24 個に)

    GPT-4oの安全性と制限事項について

    GPT-4o には、トレーニング データのフィルタリングやトレーニング後のモデルの動作の調整などの技術を通じて、モダリティ全体に安全性が組み込まれています。また、音声出力にガードレールを提供する新しい安全システムも作成しました。
    OpenAI は準備フレームワークに従って、また自主的な取り組みに沿ってGPT-4o を評価しました。サイバーセキュリティ、CBRN(化学、生物、放射線、核)、説得、モデルの自律性に関する評価では、GPT-4o はこれらのカテゴリのいずれにおいても中リスク以上のスコアを獲得していないことが示されています。この評価には、モデルのトレーニング プロセス全体を通じて一連の自動評価と人間による評価の実行が含まれます。モデルの機能をより適切に引き出すために、カスタムの微調整とプロンプトを使用して、モデルの安全性緩和前バージョンと安全性緩和後のバージョンの両方をテストしました。
    また社会心理学、偏見と公平性、誤った情報などの分野で 70 人以上の外部専門家と広範な外部レッドチーム を結成し、新たに追加された手法によって導入または増幅されるリスクを特定しました。OpenAI はこれらの学習を利用して、GPT-4o とのやり取りの安全性を向上させるための安全介入策を構築しました。新たなリスクが発見され次第、引き続き軽減していきます。

    訳注:レッドチームとはセキュリティにおける仮想の敵チームのこと。ブルーとレッドに分かれて、パープルチームが判定します。

    OpenAI は、GPT-4o のオーディオ モダリティがさまざまな新たなリスクを引き起こすことを認識しています。本日、テキストと画像の入力とテキスト出力を一般公開します。今後数週間から数か月かけて、技術インフラストラクチャ、トレーニング後の使いやすさ、他のモダリティをリリースするために必要な安全性に取り組んでいきます。たとえば、発売時には、オーディオ出力はプリセット音声の選択に制限され、既存の安全ポリシーに準拠します。
    今後のシステム カードで GPT-4o のモダリティの全範囲に対処するさらなる詳細を共有する予定です。モデルのテストと反復を通じて、モデルのすべてのモダリティに存在するいくつかの制限を観察しました。そのうちのいくつかを以下に示します。

    GPT-4oはいつ利用できるのか

    GPT-4o は、ディープラーニングの限界を押し上げるための最新のステップであり、今回は実用的な使いやすさの方向に向かっています。過去 2 年間、OpenAI はスタックのすべての層での効率向上に多大な努力を費やしてきました。この研究の最初の成果として、GPT-4 レベルのモデルをより広範囲に利用できるようにすることができました。 GPT-4o の機能は繰り返し展開されます。今日から”レッドチーム アクセス”が拡張されます。

    GPT-4o のテキストおよび画像機能は、ChatGPT で今日から展開され始めます。 GPT-4o は無料枠で利用できるほか、最大 5 倍のメッセージ制限を持つ Plus ユーザーも利用できるようにしています。今後数週間以内に、ChatGPT Plus 内でアルファ版の GPT-4o を使用した音声モードの新バージョンを公開する予定です。

    開発者は、API の GPT-4o にテキストおよびビジョン モデルとしてアクセスできるようになりました。 GPT-4o は、GPT-4 Turbo と比較して 2 倍高速で、価格は半分で、レート制限が 5 倍高くなります。今後数週間以内に、API の信頼できるパートナーの小グループに対して GPT-4o の新しいオーディオおよびビデオ機能のサポートを開始する予定です。

    利用方法

    ChatGPT Plusのユーザはすでに利用できます。

    左上のモデル選択で選べるようになります。

    ・最大 128,000トークン
    ・2023年10月までの知識
    API playgroundはこちらから利用できます。

    https://platform.openai.com/playground/chat?mode=chat&model=gpt-4o&models=gpt-4o

    旧来のモデルと比較することができます。

    GPT-4oのリリースとChatGPT無料ユーザーへのツール追加

    実は、今回の OpenAI からのリリースには、GPT-4o 以外にもChatGPT無料ユーザへのツール追加が発表されました。

    https://openai.com/index/spring-update

    https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free

    GPT-4oという最新のフラッグシップモデルを発表したことで、ChatGPTで無料で利用できる機能が増えました。

    高度なAIをより身近で便利なものにするため、GPT-4oの言語機能は品質とスピードの両面で向上しています。ChatGPTはまた、サインアップやログイン、ユーザー設定などで50以上の言語(新しいウィンドウで開きます)をサポートするようになりました。

    GPT-4oは、ChatGPT PlusとTeamユーザーへの提供を開始し、エンタープライズユーザーへの提供も間もなく開始します。また、本日よりChatGPT Freeの利用制限を開始します。Plusユーザーには無料ユーザーの最大5倍のメッセージ制限があり、TeamとEnterpriseユーザーにはさらに高い制限があります。

    より多くのインテリジェンスと高度なツールを無料で提供

    OpenAI のミッションには、先進的なAIツールをできるだけ多くの人々に提供することが含まれています。毎週、1億人以上の人々がChatGPTを利用しています。今後数週間で、ChatGPT無料ユーザーにより多くのインテリジェンスと高度なツールを提供し始めます。

    GPT-4oを使用すると、ChatGPTフリーユーザーは以下のような機能を利用できるようになります:

    ・GPT-4レベルのインテリジェンス
    ・モデルとウェブの両方から応答を取得
    ・データの分析とグラフの作成
    ・撮影した写真についてチャット
    ・ファイルをアップロードして、要約、執筆、分析を支援する

    GPTとGPTストアの発見と使用

    Memoryでより役立つ体験を構築する

    GPT-4oの利用状況や需要に応じて、無料ユーザーが送信できるメッセージ数に制限があります。上限に達すると、ChatGPTは自動的にGPT-3.5に切り替わり、ユーザーは会話を続けることができます。

    新しいデスクトップアプリでワークフローを効率化

    無料・有料ユーザーを問わず、コンピュータ上で行っているあらゆることにシームレスに統合できるように設計されたmacOS用の新しいChatGPTデスクトップアプリもリリースします。簡単なキーボードショートカット(Option + Space)で、即座にChatGPTに質問することができます。また、アプリ内で直接スクリーンショットを撮り、議論することもできます。

    https://videos.ctfassets.net/kftzwdyauwt9/52LopQbWMG9s9TMcd3sd2k/6ef859a25569c217211bdf175009ea73/Web_-_New_UI_Updates.mp4

    本日より、PlusユーザーはmacOSアプリを配布しています。また、今年後半にはWindows版もリリースする予定です。

    GPT-4oの新しいオーディオとビデオ機能は、将来登場する予定です。社内で新しいアイデアを出したいとき、面接の準備をしたいとき、話したいトピックがあるときなど、デスクトップアプリの右下にあるヘッドフォンアイコンをタップして音声会話を始めましょう。

    編集部注:実際にはまだAppStoreには配信されていないようです。
    こちらのコミュニティで経過をみることができます

    https://community.openai.com/t/chat-gpt-desktop-app-for-mac/744613

    Originally published at https://note.com on May 14, 2024.

  • AICU media 4月のカバーアートが決定しました!

    AICU media 4月のカバーアートが決定しました!

    note で展開している AICU media では、今年度からクリエイターページのトップに掲載されるカバーアートを募集する企画を開始しました!

    毎月の AICU mediaのカバーを飾っていただける
    カバーアートをメンバーシップ会員より募集します!

    こちらの一番上にある画像です https://note.com/aicu

    【仕様】
    ・AICUのマスコットキャラクター「Kotoちゃん」が描かれていること
     (召喚できそうなプロンプトは掲示板で訊いてください~)
    ・「AICU media」の文字が入っているとうれしいです
    ・季節感があること(12ヶ月分をまとめてカレンダーを作ります!)
    ・Photoshop等での加工もOK
    ・1920 × 1006 px

    詳細は noteのフォーマットをご参照ください

    ・投稿先はこちらの掲示板の返信にて
    一言メッセージなどもいただけると幸いです
    ・締切は毎月末日になります(4月分の締切は3月31日 23:59です!)

    ★採用作品には薄謝(Amazonギフト券5000円など季節のギフト)をお送りいたします!受領方法のご連絡はTwitterDMもしくはDiscordコミュニティにて

    note のメンバーシップに加入していただいた読者の皆様からカバーアートを募り、AICU 編集部がぜひこれをメディアの顔にしたい!と思った作品を1か月間掲載させていただく、という企画になっています。

    採用となった方には 5000 円相当の謝礼もご用意しております!

    4月のカバーアートは…?

    早速今月のカバーアートの発表です!

    4月 AICU media の顔として採用になったのは、はねごろう(hane56)さんの作品です!

    満開の桜と風になびく koto ちゃんの髪と花吹雪、華やかな振袖と儚い雰囲気が春の浮足立った雰囲気を演出していますね。

    「AICU media」の文字が腕に乗っているのもユニークで面白いです!

    早速掲載させていただきました。

    ご応募くださった皆様、ありがとうございました。

    採用されたカバーアートは来年度のカレンダーになる予定です。これからの応募作品にも期待が高まりますね!

    5月のカバーアートも募集中!

    AICU media では、4月に引き続き5月のカバーアートも募集しています。

    画像生成で作品を作ることが好きな方、興味があってやってみようかな…と思っている方、また #SD黄色本 を読んで「なにか応募してみたい!」と思った方など、どなたでも大歓迎です。ぜひご応募ください!

    応募用掲示板はこちら

    メンバーシップの加入はこちら

    「画像生成AI Stable Diffusion スタートガイド」通称「SD黄色本」はこちら

  • 最先端の画像生成AIを深掘りする教科書決定版『画像生成AI Stable Diffusion スタートガイド』3月29日発売 #SD黄色本

    最先端の画像生成AIを深掘りする教科書決定版『画像生成AI Stable Diffusion スタートガイド』3月29日発売 #SD黄色本

    Stability AI 公式パートナーによるAI時代のクリエイターのための教科書。東京AI祭での特別イベントも。Amazonでの購入は https://j.aicu.ai/SBXL

    Amazonでの購入は https://j.aicu.ai/SBXL

    『画像生成AI Stable Diffusion スタートガイド』白井暁彦& AICU media編集部 著。AIメイキング解説 フィナス/らけしで

    「つくる人をつくる」デジタルクリエーションの最前線をいく、デジタルハリウッド大学発の米国スタートアップ「AICU Inc.」は、この度、画像生成AIの革新的技術「Stable Diffusion」を徹底解説した教科書『画像生成AI Stable Diffusion スタートガイド』をリリースしました。2024年3月29日にSBクリエイティブより刊行される本書は、AIによる画像生成技術に関心を持つすべての人々に、基礎から応用までを段階的に学べる一冊として開発されました。

    書籍のハイライト:

    AICU Inc.紹介: 「つくる人をつくる」をビジョンに、生成AIクリエイティブの最新の話題やテクニックを楽しい雰囲気の日々のブログで紹介する「AICU media編集部」により執筆。Webデザインや映像、ゲーム、メタバース、VTuber、キャラクターイラストレーションなどに多様に活躍する30年の経験を持つ著者(白井暁彦博士/しらいはかせ)が中心に、教育の現場や、豊富な知見と実績を背景に、未来のクリエイター育成に貢献します。

    技術の解説: 話題の画像生成AI「Stable Diffusion」「Stable Diffusion XL」とオープンソースツール「AUTOMATIC1111」を中心に、画像生成AIの基本からプロフェッショナルな絵作りのための応用テクニック、最新のテクノロジー解説を網羅。

    イラストレーションが好きな人にこそ読んで欲しい: 美しく、楽しい誌面と優しい言葉での解説。スマホで使えるniji・journeyや、最新の簡単インストーラー「Stability Matrix」、プロのイラストレーターの作例、解説、プロンプトのテクニックや背景で動いている技術の仕組み、image2image、ControlNet、LoRAでオリジナルキャラをAIに覚えさせるだけでなく、自分の子供時代の画像を学習させて不可能なコラボレーションを実現する方法など、技術系だけでなく、今後の生成AI時代に大きな進化が期待されるイラストレーターや漫画制作、映像スタジオといった幅広い用途に応用できる技術を丁寧に解説しています。

    実践的学習: GPUや高度なプログラミング知識がなくても、Google Colaboratoryを使って手軽に実践できる内容を収録。学生のアクティブラーニング、集団で学ぶワークショップ、コンピュータサイエンスやコンピュータグラフィックスの研究に入って行くための基盤的な知識や、ニューラルネットワークに関する基礎知識、専門用語などを丁寧に解説。

    クリエイター視点での法律・ライセンス・倫理: 画像生成AIを用いる際の著作権や倫理面での注意点を解説。法律の解釈だけでなく、プロのクリエイターとして安全かつ責任ある使用における注意点やライセンス解説を随所に盛り込んでいます。

    最新情報: 2024年3月時点での最新情報に基づき、動画生成やデジタルイラストレーションの専門技術を長期にわたって理解できる歴史俯瞰や用語解説が満載。

    オープンソースとコミュニティによるアップデート: 書籍だけじゃ終わらない、GitHubやGoogle Colab によるオンラインでの最新ソースへのアクセス、AICU mediaによる楽しい画像生成コミュニティでのサポートやワークショップなどのイベント情報、お仕事情報など、長く、クリエイターとして成長していけるためのパスポートになっています。

    本書の目的と読者層:

    『画像生成AI Stable Diffusion スタートガイド』は、幅広い読者を想定し、中高生、美術・芸術・イラストレーションの学生、クリエイター、そしてAI技術に興味を持つ一般読者まで、幅広い層に向けています。本書を通じて、今後30年のクリエイティブ産業をリードする知識とスキルを身につけることができます。プロフェッショナルだけでなく、趣味で美しい絵を生成したい方や、ビジネスシーンでのプレゼンテーション資料作成に利用したい方にも最適なガイドブックです。

    「画像生成AI Stable Diffusion スタートガイド」出版社情報より:

    定価:2,640円(本体2,400円+10%税)
    発売日:2024年3月29日(金)
    ISBN:978-4-8156-2456-9 サイズ:B5判 ページ数:224
    著者:白井 暁彦、AICU media

    画像生成AIの1つであるStable Diffusionを導入・体験するための入門書です。
    プログラミングが分からない、ネットの情報を見てもうまく使えなかった、そんな悩みを抱えている人でもAIを使った画像生成体験ができるようにしっかりサポートします。

    本書籍では以下の環境で解説します。
    ・Google Colab Pro環境
    ・Windows10/11 NVIDIA GPU環境
    ・MacOS Apple silicon 環境

    本書籍では以下の内容を取り扱います。
    ・拡散モデルによる画像生成の原理
    ・Stable Diffusionを使用するためのWebUI環境構築
    ・テキスト/画像を元に画像を生成する(txt2img/img2img/ControlNet)
    ・Google Colab 上で追加学習を行う(LoRAの作成)

    本書ではソフトウェアの使い方解説だけではなく、自分で設定できるセッティングやパラメータが画像生成にどのように関わっているのかについても解説しているため、AI技術について知識を深めたい人にとってもおすすめです。
    また、既にAIを活用している方にもご満足いただけるように、よりAI画像制作を極めるヒントとなるようなStable Diffusionを含むAI画像生成を利用した作例のメイキング方法やプロンプト構成/生成パラメーターなどの情報を公開・解説しています。ハンズオン形式で最後まで取り組むことで、画像生成AIへの理解をより深めることができる1冊となっています。

    全ての目次とコラムを紹介します!

    Chapter 1 画像生成AI について知ろう

    1-1 AI で画像を生成してみよう
    1-2 画像生成AI の誕生と変遷
    1-3 2024 年での「AI の定義」を考えてみよう
    1-4 ニューラルネットワークについて知っておこう
    1-5 拡散モデルによる画像生成の原理を知っておこう

    Chapter 2 環境構築をしてはじめよう

    2-1 Stable Diffusion を使う環境を用意しよう
    2-2 Google Colab での環境構築
    2-3 Stability Matrix をローカル環境で構築する
    2-4 簡単な言葉で画像を生成する
    2-5 モデルをダウンロードする
    2-6 VAE をダウンロードする

    Chapter 3 プロンプトから画像を生成してみよう

    3-1 プロンプトで意のままの画像を作り出す
    3-2 ネガティブプロンプトを構築する
    3-3 思い通りの画像を生成する
    3-4 画像の解像度を上げよう
    3-5 様々なパラメータを調整しよう
    3-6 様々なプロンプトを試してみよう

    Chapter 4 画像を使って画像を生成してみよう

    4-1 img2img でできることを知ろう
    4-2 Sketch を使って画像を生成しよう
    4-3 Inpaint で画像を編集してみよう
    4-4 Inpaint を応用して画像を修正する
    4-5 Outpainting で画像を拡張する
    4-6 img2img で画像の解像度を上げる
    4-7 拡張機能でアップスケーリングをしてみよう

    Chapter 5 ControlNet を使ってみよう

    5-1 ControlNet について知っておこう
    5-2 ControlNet をダウンロード・準備する
    5-3 ControlNet を使って画像を生成する
    5-4 プリプロセッサの働きを理解しよう

    Chapter 6 LoRA を作って使ってみよう

    6-1 追加学習でできることを知ろう
    6-2 LoRA を使用して画像を生成しよう
    6-3 自分の画風LoRA をつくる
    6-4 様々な種類のLoRA をつくってみよう
    6-5 学習内容を出力させてみよう

    Chapter 7 画像生成AI をもっと活用しよう

    Interview Guest フィナス
    Interview Guest らけしで
    画像生成AI の活用と注意点
    AUTOMATIC1111/WebUI おすすめ拡張機能
    関連用語

    充実したコラム!

    ページ番号とともに紹介します

    使用するGoogle アカウントに注意しよう 14
    変わりゆく社会とAI の関係性 25
    利用しているプログラムについて 43
    Google Colab のエラーに対応しよう 45
    Google Colab の計算資源を有効に管理しよう 47
    パッケージ選択ではエスケープしないように注意しよう 57
    画像の保存場所を変更しよう 62
    コミュニティで質問してみる 63
    StableDiffusion シリーズとは 65
    CLIP のゼロショット転移性 78
    embedding とは 82
    デフォルメキャラ風の画像を生成してみよう 106
    色の変化を抑える設定をしておこう 111
    下書きから画像を生成してみよう 114
    Mask blur を調整して自然に見せる 118
    拡張機能とは 124
    オープンソースライセンスの確認 131
    複数のControlNet を使用する 141
    Openpose をもっと使いこなそう 144
    これからのLoRA の活用方法 149
    LoRA の学習データで気を付けるべきこと 154
    手元に保管しているモデルファイルをLoRA 学習に使う 158
    写真や写実的な画像を学習させる場合 161
    学習の全体像を把握しよう 167

    主著者紹介:
    白井暁彦(Akihiko Shirai, PhD /しらいはかせ )(X アカウント:@o_ob)

    エンタメ・メタバース技術の研究開発に関わる研究者、ホワイトハッカー作家、米国スタートアップ「AICU Inc.」「Hidden Pixel Technology Inc.」のCEO。東京工芸大学写真工学科卒、同画像工学専攻修了。キヤノン株式会社とグループの研究所より生まれた英国・Criterion Software にて世界初の産業用ゲームエンジン「RenderWare」の普及開発に参加、その後、東京工業大学知能システム科学専攻に復学。博士学位後、NHK エンジニアリングサービス・次世代コンテント研究室、フランスに渡りENSAM 客員研究員、国際公募展Laval Virtual ReVolution の立ち上げ、日本科学未来館科学コミュニケーター神奈川工科大学情報メディア学科准教授を経て、2018 年よりデジタルハリウッド大学 大学院客員教授 およびグリー株式会社GREE VR Studio Laboratory Director。スマートフォン向けメタバース「REALITY」を開発・運用するREALITY 株式会社の立ち上げを通して、Virtual YouTuber などXR ライブエンタメ技術のR&D、国際発信など、メタバースエンタテイメントの未来開発や知財創出を中心に、自らエンタテイメントのライブプレイヤーとして世界に向けた開発・発信活動方法論化しながら世界中のエンタテインメント技術業界に数百人の規模でクリエイターを育成している。2023 年よりデジタルハリウッド大学発米国スタートアップ企業「AICU Inc.」CEO。生成AI 時代に「つくる人をつくる」をビジョンに英語、日本語、フランス語、プログラミング言語などでオープンな作家活動を続けている。日本バーチャルリアリティ学会IVRC 実行委員会委員。芸術科学会副会長。著書に『WiiRemote プログラミング』(オーム社)、『白井博士の未来のゲームデザイン – エンターテインメントシステムの科学-』(ワークスコーポレーション)、『AI とコラボして神絵師になる 論文から読み解くStable Diffusion』(インプレスR&D)他。

    アシスタントクリエイター 知山ことね(X アカウント:@ChiyamaKotone)

    デジタルイラストレーション、テクニカルライター、チャットボット開発、Web メディア開発を担当するAICU Inc. 所属のクリエイター。AICU Inc. のAI 社員「koto」キャラクターデザインを担当している。小学校時代に自由帳に執筆していた手描きの雑誌「ザ・コトネ」「ことまがfriends」のLoRA が話題に。技術書典15「自分のLoRAを愛でる本」他。

    AICU Inc. について:Xアカウント@AICUai https://corp.aicu.ai/ja    info@aicu.ai

    「生成AI時代につくる人をつくる」をビジョンに活動する2023年に設立された米国シリコンバレーを本拠地にするデジタルハリウッド大学発のスタートアップ企業です。LINEアカウント「全力肯定彼氏くん」「AI確定申告さん」、Webに住むAIアイドル「AICuty」、クリエイティブAIレポーター「Koto」など楽しみのあるAI体験を開発する「AIDX Lab」、わかるAIを楽しく届ける AI総合メディア「AICU media」、AI人材教育コンテンツ開発、障害者向けワークショップ開発、AIキャラクター開発運用、某有名企業の新技術プロトタイプコンテンツ開発など「クリエイティブAI」ならではのコンテンツ技術開発・体験開発を世界的な企業に展開している価値開発企業。画像生成AI「Stable Diffusion」を開発公開した Stability AI 公式パートナーであり、Google for Startups認定スタートアップでもあります。1994年に杉山知之が創立したデジタルハリウッド大学(愛称「デジハリ」)はCGやデジタルクリエーションを専門に学ぶ学校ですが、開学のころからずっと変わらず伝えていることは『すべてをエンタテインメントにせよ!』 。エンタテイメント技術の研究開発で30年の経験を持つCEO白井暁彦とAI社員、少数精鋭の人間味あふれる多様なスタッフや協力クリエイターとともに、すべてをエンタテインメントにするまで追求する文化が AICUにも息づいています。

    AICU media 編集部   https://note.com/aicu media@aicu.ai

    「わかるAIを楽しく届ける」総合AI情報メディア。AIレポーター「Koto」がクリエイティブAIを中心に24時間365日最新情報をお届けしています。 活動メディアはnote、 X(Twitter)、 動画メディア、各種商用サイトへの記事提供、同人誌・商業書籍・電子書籍など書籍企画との開発、子ども向けからお年寄り向けまで「つくる人をつくる」をビジョンに幅広いワークショップやイベントを開発しています。AI先進企業の新サービスの普及展開のお手伝い、AI活用したい企業の技術検証や社内展開、学校・スクール等のコンテンツ開発についても案件をお待ちしております。

    ファンコミュニティは note.com/aicu/membership

    ご購入とお問い合わせ:

    『画像生成AI Stable Diffusion スタートガイド』は、全国の書店およびオンライン書店でお買い求めいただけます。

    Amazon購入ページ: https://j.aicu.ai/SBXL

    最新情報は AICU media note.com/aicu

    X(Twitter) @AICUai https://twitter.com/AICUai

    @PRTIMES_JP
    最先端の画像生成AIを深掘りする教科書決定版『画像生成AI Stable Diffusion スタートガイド』発売 https://j.aicu.ai/SBXL
    https://prtimes.jp/main/html/rd/p/000000013.000133647.html

  • [保存版] Animagine XL 3.1 生成比較レポート

    [保存版] Animagine XL 3.1 生成比較レポート

    つくる人をつくる!AICU media の知山ことねです。

    Animagine XL 3.1リリース

    2024年1月16日に公開された Stable Diffusion の画像生成モデル「Animagine XL 3.0」から、新バージョンとなる Animagine XL 3.1 がリリースされました!

    この記事では、Animagine XL 3.0 と比較して画風などに違いはあるか、また Animagine XL 3.1 から搭載された新たなタグについて紹介していきます。

    【関連記事】

    漫画制作に適したモデルは?Animagine 3.1 vs Animagine 3.0 徹底比較を行いました!

    XL 3.1 では、Animagine XL 3.0 で重要だったプロンプトも引き続き使用できます!

    https://note.com/aicu/n/n44085d702617

    Animagine XL 3.0 リリースノートはこちら。

    https://note.com/aicu/n/nd05f3a656dd8

    Hugging Face はこちら

    https://huggingface.co/cagliostrolab/animagine-xl-3.1

    公式リリース 和訳(一部抜粋)

    Animagine XL 3.1は、前バージョンのAnimagine XL 3.0を強化したもので、より高い品質でアニメスタイルの画像を生成できるように改良されています。有名なアニメシリーズからのより幅広いキャラクター、最適化されたデータセット、より良い画像作成のための新しいタグが含まれています。アニメキャラクターの正確で詳細な表現を生成することで、アニメファン、アーティスト、コンテンツクリエイターにとって価値あるリソースとなることを目指しています。

    Animagine XL 3.0 をより高品質にしたということですね!

    Animagine XL 3.0 との比較

    それでは、実際に生成して Animagine XL 3.0 と比較していきましょう。
    今回生成に使用した環境は、Windows10、NVIDIA GeForce RTX 3060 搭載の VRAM6GB の GALLERIA ノート PC に直接インストールした ComfyUI です。

    画風

    まずシンプルなプロンプトで生成し、Animagine XL 3.0 と比較してみます。

    プロンプト: best quality, 1girl
    ネガティブプロンプト: worst quality, low quality, nomal quality, bad anatomy, NSFW

    Animagine XL 3.0

    Animagine XL 3.1

    強い光源、耳の見える髪型、逆光感などの大きな特徴はそのまま残っていますが、Animagine XL 3.0 の特徴だった切れ長の目とピンクの頬が目立たなくなり、露出度も軽減されました。また Animagine XL 3.0 では肌がつやっとする雰囲気がありましたがそれも軽減され、全体的に落ち着いたように感じます。

    また Animagine XL 3.0 よりも Animagine XL 3.1 の方が線画が細くはっきり出ていて、厚塗り感、立体感が減り少し平面的になった印象を受けますね。

    タグ

    Animagine XL 3.0 には画風を指定する「年代タグ」やクオリティを指定する「クオリティタグ」がありましたが、Animagine XL 3.1 ではそれらがアップデートされたことに加え、「Aesthetic Tags」が追加されました。

    クオリティタグ

    Animagine XL 3.1 公式 Hugging Face より

    従来のクオリティタグから数値が少し調整され、タグ名が一部変更されました。よく使用する「masterpiece」「best / worst / low quality」は変わらないので、今まで通りの感覚で使えそうです。

    年代タグ

    Animagine XL 3.1 公式 Hugging Face より

    「2024」が追加され年が少しずつ調整されていること、「late」が「recent」に変更されたことが主な変更で、年代タグも大きくは変わっていません。

    実際の生成画像比較

    newest (2021–2024)

    Animagine XL 3.0 に似た絵柄です

    recent (2018–2020)

    newestを少し繊細にした雰囲気です。VTuber全盛期ですね。

    mid (2015–2017)

    退廃的な雰囲気が可愛いです
    明らかに画風がVTuber風ではなくなってきました。

    early (2011–2014)

    セピアな雰囲気が出ています

    https://j.aicu.ai/Mag2405

    Oldest (2005–2010)

    年代的には涼宮ハルヒや長門有希が流行った時期ですね。
    90年代風のテイストもありますが、明らかに描きわけができています。

    レーティングタグ(年齢制限タグ)

    Animagine XL 3.1 公式 Hugging Face より

    センシティブな表現を調節するレーティングタグも、Animagine XL 3.0 から大きく変化はありません。プロンプトとネガティブプロンプトを使い分けて露出度を調節しましょう。

    Aestheticタグ

    アニメデータに特化したViT(Vision Transformer)画像分類モデルと、コンテンツの美的価値を評価するモデルshadowlilac/aesthetic-shadow-v2を利用し、視覚的に魅力的であるものを生成するタグです。

    aesthetic

    プロンプト「best quality, 1girl, very aesthetic」

    カメラアングルやポーズがダイナミックになりました!

    「aesthetic」(イェステティック;美的)というプロンプトは Nijijourney や Novel AI でも有効なので、ぜひ試してみてください!

    推奨設定

    公式 Hugging Face で紹介されている推奨設定、プロンプトを紹介します。

    「Absurdres」とは造語で、absurd-res、ありえないぐらい高解像度、という意味のようです。

    プロンプト

    masterpiece, best quality, very aesthetic, absurdres

    ネガティブプロンプト

    nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

    CFG Scale

    低め(5–7)

    Sampling Steps

    30以下

    Sampler

    Euler a(Euler Ancestral)

    https://j.aicu.ai/Mag2404

    ギャラリー

    お気に入りの生成画像です!

    パステルカラー!

    抜け感

    kotoちゃん

    oldest

    newest

    アニメ風

    皆さんもお気に入りの画像が生成できたら、ぜひご共有ください!

    メンバーオンリー画像投稿コーナー https://note.com/aicu/membership/boards

    https://note.com/aicu/membership/boards/61ab0aa9374e/posts/17273820a798

    Animagine XL 3.0 おすすめのプロンプトはこちら

    ANIMAGINE XL 3.0 画風が変わる!おすすめプロンプト集
    https://note.com/aicu/n/n44085d702617

    Stable Diffusion — ControlNet入門はこちらから
    https://note.com/aicu/n/nde6fe41f077b

    img2img 入門シリーズはこちらから。
    https://note.com/aicu/n/n08ebe0637a41

    この下にGoogle Colabで動作する「AUTOMATIC1111/Stable Diffusion WebUI」へのリンクを紹介しています。

    https://note.com/aicu/membership/boards/61ab0aa9374e/posts/7cab00942b22?from=self

    メンバーシップ向けサポート掲示板はこちら!応援よろしくお願いします!

    AICU mediaによる新作書籍「画像生成AI Stable Diffusionスタートガイド」ついに予約開始です!(2024年3月29日リリース)

    詳細はこちらから https://ja.aicu.ai/sbxl/

    今回の記事の内容はAICUマガジンでもご覧いただけます

    AICU magazine Vol.1 2024年4月号 https://j.aicu.ai/Mag2404

    AICU magazine Vol.1 2024年5月号 https://j.aicu.ai/Mag2405

    AICU:AIクリエイターユニオンでは皆様のご質問をお待ちしております
    https://note.com/aicu/membership/boards

    Originally published at https://note.com on March 19, 2024.

  • [3/13開催]AIクリエイターギルド@歌舞伎町GOX #AICU_ACT3

    [3/13開催]AIクリエイターギルド@歌舞伎町GOX #AICU_ACT3

    AICUイベント事務局です。

    https://ja.aicu.ai/wp-content/uploads/2024/03/rectangle_large_type_2_4252042e5f801ee4737368928ce03239-1024×536.webp



    すでにお伝えしておりました「AICU Creators Talk3」ですが企画を拡大し、
    AIクリエイターギルド歌舞伎町GOX #AICU_ACT3といたしまして、現在参加者募集中です。
    https://techplay.jp/event/936576

    2024年3月1日、プレスリリースを発信させていただきました。


    AICU新製品発表会を予定。各業界を横断にAIクリエイターがデモを持ち込み新宿歌舞伎町「クリプトラウンジGOX」に集合します!▶ https://j.aicu.ai/TPACT3

    https://prtimes.jp/main/html/rd/p/000000012.000133647.html



    「つくる人をつくる」をビジョンに活動するAICU社の月例イベント「AICU Creators Talk」(ACT)、第3回は AICU の社名の由来でもある「AI クリエイターユニオン」をテーマに、「AIクリエイターの集まるギルド」を新宿歌舞伎町「GOX」にて開催します。

    AICU のファンイベントとして「新製品発表会」をはじめとして、AICUパートナー企業やクリエイターの活動紹介、ライトニングトーク、デモ、製品即売会など、これからのクリエイター、エンジニア、BizDev、学生さんなど分野や年齢を問わず AI に関わる方々や AI に興味がある方の交流の場をつくります。

    2024年3月23~24日に渋谷ストリームで開催される「東京AI祭」(https://www.aisai.tokyo )にむけた準備デモの準備やクリエイティブ AI に関わる皆さんの躍進のチャンスを提供をできれば幸いです。 お申し込み詳細はこちら▶︎https://j.aicu.ai/TPACT3

    会場は「Crypto Lounge GOX」

    https://www.youtube.com/watch?v=XVhaVwzXMKI


    会場である「Crypto Lounge GOX」はワールドコインが手に入る「人間であることを証明できるバー」です。ChatGPTを生み出したサム・アルトマン氏が最高経営責任者を務めるワールドコイン財団 @worldcoin の認証スポットとして登録されています。

    ※ご予約は各自参加者で WORLD Appから事前にご準備ください(完全予約制でorbによる認証ができます)

    https://twitter.com/groove_on_x


    会場へのルート
    https://twitter.com/groove_on_x/status/1736978718269293047


    参加予定クリエイター(参加表明順・随時更新)

    Ryo Shimizu AI研究家 @shi3z

    凄腕エンジニアであり実業家でありUber配達員。

    Hidekazu Furukawa @npaka123

    プログラマー。iPhone / Android / Unity / ROS / AI / AR / VR / RasPi / ロボット / ガジェット。年2冊ペースで技術書を執筆。アニソン / カラオケ / ギター / 猫
    [note]

    jiyu @jiyu33

    BlendAI CEO。クリエイティブ領域でのAI利用を推進する目的で「デルタもん」というキャラクターを X/Twitter を中心に展開しています(@BlendAIjp)。

    「AI関係の利用は商用・非商用問わず自由」「すべてのデルタもん公式・二次創作著作物は、AI関連の学習をしてもよい」というルールなので、著作権法等の権利問題を気にすることなくAIを利用した創作や学習が可能です。公式からは、画像や音声などの基本的な素材にとどまらず、LoRA や音声モデルなど既に学習されたデータも積極的に公開していきます。これらすべてがAIを利用していさえすれば商用利用を含め原則無制限に利用可能です。現在、3DCGモデルを作るためにクラウドファンディングを行っております。3DCGモデルがあれば、LoRAを始めとした高品質なAI素材の提供が可能となります。ぜひクラファンにご協力いただけると幸いです。クラファンはこちらで行っています

    Nobuyuki Kobayashi @nyaa_toraneko

    The man of Tech Otakus @Unity/AI/Anime/元Unity Technologies Japanのシニアエバンジェリストの小林です。在職中はユニティちゃんの企画とか、トゥーンシェーダーとか、いろいろやってました。現在は、リアルタイムキャラクター表現、アニメを中心とする映像表現、AIをの活用など、日々面白そうなことを探している最中です!
    興味ある方はお声がけよろしくお願いします。
    もちろんこちらからもお声がけさせていただきますので、その際はよろしくお願いします![LinkedIn]

    そのほかの参加表明

    ・marimosphereさん (@marimosphere) Web3の女王
    ・Scott Broock (@scottbroock) Visitor from AI Los Angeles!
    ・はねだ プロダクションマネージャー
    ・Kaho Fujiyoshi クリエイター
    ・しらいはかせさん AICU Inc. CEO (@o_ob) 実は3/13は誕生日です! 祝ってあげてください!

    ライトニングトーク


     ライトニングトークは5分程度のプレゼンテーションです。
     自身の制作物や活動、その成果や宣伝、即売会など皆さんに発表していただけます。
     AICU およびパートナー企業による撮影、配信も予定しております。
     生成 AI の最先端を行く方々と関わり、視野や可能性を大きく広げられる交流会となっております。皆さんぜひお気軽にご参加ください。

    以下エントリー順で紹介いたします(当日の発表順や内容ではないかもしれません)

    株式会社メイクリー @kokushing

    クリエイターを支援する株式会社メイクリーを創業し、主にエンジニアとして生きています。「つくる人がつくり続けられる世界を創る」べく、日々サービスを開発中。アニメゲーム好き、最近はAI×サブカル領域の可能性を探っています

    よーへん(xRデザイナー) @Yohen_XR

    2017年からアバターを探求するVTuberを始めて、xRを仕事にしています。最近は可愛らしいロボットに毎日骨抜きにされたり創作相方との間にAIの娘が生まれたりして、AIキャラクターに関しても公私いろいろ研究しています。

    debittoo 合同会社MetAI 代表 @debichanchan

    スペイン人。来日してから15年目。
    メタバース、AIビジネスが長くやっております。
    アップル、ソニー、楽天、ヤフーなど大手企業で働く経験あり。
    現在メタバース、AIの会社持ってます。
    Twitter @debichanchan Instagram @metaijp

    藤吉香帆 @kahofujiyoshi

    セツナクリエイション合同会社 代表取締役 / デジタルハリウッド大学非常勤講師
    刹那的に生きることをテーマに、瞬間(イマ)を捉える、瞬間(イマ)を演出するクリエイティブカンパニーの代表の片割れです。イマっぽいクリエイティブ、イマ必要なクリエイティブを作る会社として、AIの活用もやっていかなきゃ!と勉強中。
    友だちと仕事をする社長をしています。ぜひ友だちになりましょう!
    LTは #50DAYSママ活 中間報告とインフィードクリエイティブでの活用考察(発表までに変わるかも!)




    最新の参加者リストはハッシュタグ「#AICU_ACT3」もしくは
    TechPlayイベントページにて!
    https://techplay.jp/community/AICU

    短縮リンク j.aicu.ai/TPACT3 → https://techplay.jp/event/936576

    AICU活動紹介&新製品発表会

    詳細は当日会場にて発表いたします、お楽しみに!

    トークセッション(予定)


    生成 AI のトップランナーの方をお招きし、グラフィックス産業やキャラクターがこれから生成 AI とどう関わっていくのかについてのトークセッションを開催します。

    クリエイティブAIマーケットプレイス(デモつき交流会&AI同人即売会)
     交流会に合わせて、自身の制作物や活動、その成果や宣伝、即売会など皆さんに発表していただけます。

     ■想定される販売可能物品
      新規AIサービス
      AI VJ
      動画上映
      チャットボット/ChatGPTsやエージェントのデモ
      生成AIによる同人グッズ
      技術同人誌
      その他(合法なものに限ります)
     注意:ハンズオンで持ち込み、18時集合、22時に完全撤収ができるものに限ります。
     無料のデモのみでも構いません。
     決済はQRコードやWeb決済のみ。当日の現金の授受はなきようお願いします。

    参加方法:TechPlayよりクレジットカード決済にてご参加登録ください。
     開催日 : 2024年3月13日
     開催時間 : 18:30 ~ 21: 30
     会場 : Crypto Lounge GOX
     https://cryptoloungegox.com/
     〒160-0021 東京都新宿区歌舞伎町2丁目19−15 てなむタウンビル 6F
    主催 : AICU Inc.

    みなさまのお越しを楽しみにしております。

    ※ 当日予告なく時間配分・内容が変更になる可能性がございます。
    その他お問い合わせ
     AICU イベント事務局
    https://corp.aicu.ai/ja

    https://techplay.jp/community/AICU

  • Stability Matrixのエラーを確認しよう

    Stability Matrixのエラーを確認しよう

    Stability Matrixのエラーを確認しよう

    Stability Matrixでのエラーは英語とコマンドラインで表示されるので敬遠されがちですが、実際には自力で環境構築を進めるのに比べて理解しやすい形式になっています。インストール時のエラーについて、多くの場合は「もう一度試せばよい」ということも多いので、諦めずに繰り返しインストールと、翻訳や検索をしてみると理解に繋がって無駄な時間を過ごすことがないでしょう。

    WebUI起動後のエラーメッセージの多くは、Colabの時と同じくGradioのWebインタフェースの右下に表示されています。さらに細かなエラーメッセージは「Stability Matrix」の「Launch」タブにも表示されています。特にエラーが起きていなくても、WebUIでは表示されない画像生成のプロセスや経過時間を確認できるので、表示する習慣をつけておくと良いでしょう。

    パッケージ選択ではエスケープしないように注意する

    最初のパッケージ選択は慎重に操作することをおすすめします。何か間違えても必ずエラーメッセージ等は出ていますので、強制終了などはしないで丁寧にログは見ていきましょう。
    最初の「Packages」でパッケージ選択をしますが、インストール中にエスケープキーなどで抜けないように気をつけましょう。抜けてしまった場合は「Packages」下部の「+パッケージの追加」から追加できます。

    欲張って一度に複数のパッケージを入れようとしない

    ・本書の解説は「 AUTOMATC1111/WebUI」の「v1.7.0」もしくは本書刊行時点での最新版は「v1.8.0」で行っています。インストール時に「Version」プルダウンで選択することで過去のバージョンもインストールできます。
    ・複数の同名パッケージをインストールするときに「表示名」を変更するとバージョン違いでインストールできます(更新すると最新版になってしまいますので注意)。

    動作確認のために「Stable Diffusion 1.5」をダウンロードしておく

    「Model Browser」から「Hugging Face」の「Base Models」からインストールできます。最低でも「Stable Diffusion 1.5」はインストールしておきましょう(「Stable Diffusion XL」が動けば何の問題もありませんが、メモリ不足でロードできないという問題も多く発生しますので)。

    「Fooocus」や「ComfyUI」をインストールしておく

    最近は「Fooocus」や「ComfyUI」に関する情報も多く、モデルのダウンロードやセットアップなどは共通の基盤でもあるので、これらのパッケージのインストールやセットアップも実施しておくと 問題が解決することもあります。逆を言えば、「Fooocus」や「ComfyUI」が動いているのに「AUTOMATIC1111/WebUI」だけが動かない、という状態であれば、ハードウェアのスペックではなく、WebUIやモデルの選択、拡張機能などのセッティングが問題であると粗く絞ることもできます。

    Packageにインストールされたその他のパッケージの3点メニュー「…」から「アンインストール」、「アップデートを確認」や「共通画像フォルダ」の設定ができます。「Model Sharing」で「Symlink」にすると、モデルデータをリンクファイルとして共有できるのでディスクの容量を節約することができます。

    Stability Matrixの GitHub Issues

    https://github.com/LykosAI/StabilityMatrix/issues

    2024年3月3日時点で v2.8.3、Issues (不具合報告)は 142件存在しますが、積極的に解決が進んでいるようです。似たようなエラーがあったときはそのキーワードで探してみると、世界中の利用者が互助的に解決していることもあります。特にMac版はリリースされたばかりなので問題があるかもしれませんが、同じような問題で詰まっている方も多くいるので情報も見つかりやすい状況です。
    英語でのIssueを立てられるようになれば、オープンソースの貢献者への第一歩です。

    noteのハッシュタグ「#StabilityMatrix」

    日本語では note に情報が集まっています。ハッシュタグ「#StabilityMatrix」はこちらで確認することができます。

    https://note.com/hashtag/stabilitymatrix

    人気」、「 急上昇」、「 新着」、「 定番 」があり、インストールや最新情報でのトラブルシューティングに活用してください。

    注意:オープンソースの開発者は常に「みんな」のことを考えて動きます。個別の環境に関する問題を発見することはありがたいですが「僕の環境で動きません」だけではサポートは難しくなります。
    有償無償に関わらず、質問する場合は自己紹介や、自分の環境に関する丁寧な説明を行いましょう。雑な質問の仕方は雑な扱いになり、コミュニティが荒れるだけでなく、初心者にとって優しくない環境を作り、ひいては自分も振りかぶってしまいます。これは日本語や英語でも変わりません。

    AICU media コミュニティで質問してみる

    https://note.com/aicu/membership/join

    AICU media メンバーシップ掲示板もご活用ください


    Originally published at https://note.com on March 3, 2024.