タグ: AI

にじジャーニーv6の日本語能力が向上-画風に合わせたレタリング技術を公式が解説

2024年6月7日、にじジャーニーv6の日本語能力が向上しました。
公式リリースを中心に、実際に手を動かしてみた記事をお送りします。

nijiの日本語テキスト描画の精度を向上させるアップデートをリリースしました！
https://nijijourney.com/ja/blog/improved-japanese-text-writing

使い方

プロンプトを作成するときに、正確な単語を引用符 “” で囲む ことで、niji にテキストを書かせることができます。

例: miku holding a sign that says “ハンバーガー”

簡単な漢字も処理できます

girl with white hair, one eye closed, holding a sign that says “愛してる”

看板を持った女の子に限らず、文字がそのままシーンに溶け込ませることもできます

aerial view, a blue fast food building that says “こんにちは”

技術解説「言葉に隠された声」

絵の上に文字を載せたことがある人なら知っているように、絵に合った適切なフォントを選ぶのは非常に巧妙なことです。文字の形は、隠された意味を非常に多く伝えます。文字には独自の「声」があるのです。

たとえば、Spellbrush のロゴの2つのバージョンを比較してみましょう

現在の Spellbrush ロゴ　vs 初期の Spellbrush ドラフトロゴ

なぜ左のロゴの方が右のロゴよりも良く見えるのでしょうか？
どちらかというと、直接の絵を並べて比較すると、右の方が生き生きしているように見えます。

その答えは、フォントとイラストの一致にあります。

最終的な絵の曲線は、文字の曲線に直接沿うように調整されます。文字と絵がより調和した一致は、単純にイラストが優れているよりも目に優しいです。

非常に示唆のある解説がされています。

続きは新しくなった公式日本語ブログをご参照ください。

https://nijijourney.com/ja/blog/improved-japanese-text-writing

AICU media編集部でも試してみました

「つくる人をつくる」AICU media編集部が、実際に手を動かして試していきます。

miku holding a sign that says “ハンバーガー” –s 400 –niji 6

勝率25%というところでしょうか。

girl with white hair, one eye closed, holding a sign that says “愛してる” –s 400 –niji 6

勝率5割！しかもけっこう楽しい感じです。「愛」の漢字が中国語と混ざっていますね…。

今回公開された画風に合わせた書体を選ぶ技術に加えて、既に、ネガティブプロンプト（–no）に「signature」を入れる、サインボードをもたせるなどで向上することがわかっています。

「アイキューメディア」をよろしくおねがいしてみました！

anime screencap, red hair, red eyes, gentle eyes, sweet smile , streaked hair, happy red hair boy holding a sign “あいきゅーめでぃあ” –ar 16:9 –niji 6 –no signature

うーん、ちょっと間違ってるけど雰囲気に合っているし、カワイイから許す！

今後リリースされるnijiJourney v6での改善に期待します！

この記事に「いいね！」と思ったら、いいねとフォロー、おすすめをお願いします！
https://note.com/aicu/
X(Twitter)@AICUai

niji・Journey V6 alpha版公開！文字描画機能以外にも様々な機能

Niji・Journey v6 にスタイルリファレンス機能「–sref」、世界観の維持や複数画像の参照が容易に！ #NijiJourney

🌈「にじジャーニー」スマホ版はご存知ですか？

2024-06-10
AICU、業務拡大に伴い、新プロジェクトの主軸となるAIアート系人材をオーディション形式で募集開始
「つくる人をつくる」をビジョンに、書籍「画像生成AI Stable Diffusionスタートガイド」などを執筆・開発しているAICU Inc.がこの夏、あらたにAIアート時代のプロクリエイターを育成する目的で「AIアート系インターン」をオーディション形式で募集します。

【AICU Creators University Audition 2024 Summer】
- 賞金総額: 10万円
- インターン期間: 3ヶ月（有償インターン）
https://corp.aicu.ai

【目的】

AICU Inc.（本社：米国Sunnyvale、CEO：白井暁彦）は、生成AI時代に「つくる人をつくる」をビジョンに活動しています（https://corp.aicu.ai/）。主要取引先はStability AIや電通、SBクリエイティブといった世界を代表する企業であり、一般向け書籍「画像生成AI Stable Diffusionスタートガイド」、ブログメディア「AICU media」や、中高生向けKindle雑誌「AICUマガジン」、各種ワークショップ開発などを通して生成AIクリエイティブの発展に寄与しています。

今回のオーディションは、業務拡大に伴い、さらなる新プロジェクトの主軸となる生成AI時代のビジュアルアートクリエイターの長期育成を目的としています。

https://corp.aicu.ai/visual

【募集要項】

美大・芸大・情報メディア系・専門学校の現役学生を対象とした、AIビジュアルアート作品を通した賞金付きオーディションを開催します。

【応募スケジュール】
- エントリー受付期間: 随時
- オーディション作品提出締切: 2024年6月16日23:59
- 2次審査プレゼン兼面接: 2024年6月19日～21日（調整あり）
【募集部門】
- 動画部門: YouTubeのURLでショート動画を提出
- 静止画部門: X(Twitter)のURLでキャラクターイラストを提出
- タテ動画部門: TikTok向けのダンス動画やCM動画をURLで提出
- 技術部門: ComfyUIを中心とした技術ブログを評価
各部門から最終候補作品を選定し、2次審査（プレゼンテーション・面談）を経て最優秀賞を決定します。

【エントリー応募条件】
- Stable Diffusion「ComfyUI」を中心に使用（AUTOMATIC1111も歓迎）
- 作品のメイキングを社内・社外に公開可能
- アウトプットの動画や静止画は既発表・公開済みでも可
- メイキング発表用のスライドをGoogle Slidesで作成し、URLを提供（更新は発表会直前まで可能）
- 2024年7月～10月にかけて、新規事業におけるプロダクション業務に従事できること（週3日程度から。教育あり・時給保証）
- 上記の要件を満たしていれば、現役学生である必要はありません。
【2次審査までの流れ】
- 先着順で評価
- 既発表作品歓迎
- SNSでのインフルエンス、コミュニケーション力もプラス評価
- 過去作品も評価（Pixiv、GitHub、X等）
- AI作品以外の作品制作力も評価
- 提出資料は随時更新可能
- 作品の優劣だけでなく、AI時代のクリエイターとしての適性を評価
- 未完成な要素も歓迎
- インターンで体験したいこと、担当したい業務や将来の希望も評価
【インターン採用に関してのFAQ】
- 書籍や動画、ワークショップの開催を実施する開発アシスタントとして、サンプルアートの制作、ブログの執筆などを担当
- 基本はリモートワークになります。
- 「画像生成AI Stable Diffusion スタートガイド」の内容をマスターしていると有利
- 現在のアーティストネームやAICUでのクリエイターネームで活動（名義は希望・相談可）
- 守秘義務契約、インターンプログラム参加契約および業務委託契約を締結
興味のある方はぜひエントリーを検討してみてください。
詳細情報はこちらのURL()およびX(Twitter)@AICUai にお問い合わせください。

【応募フォーム】

https://docs.google.com/forms/d/e/1FAIpQLSeA939fc4nmu28fcUH14CHM2g6gCgS04qfMad28eZLTLTLpaA/viewform

【業務内容・プロダクト・企業紹介】

https://corp.aicu.ai/ja/products

（参考資料）過去のインターンに関する募集はこちらからご参照ください。

学生インターン募集(2024年1-2月期) #長期有給インターン募集
https://note.com/aicu/n/n732ed1580ba4

AICU インターン募集(2024年3-6月期)
https://note.com/aicu/n/n45e15b2091f9

AICU media 学生インターン募集(2023年11月期)
https://corp.aicu.ai/ja/intern20231103
2024-06-09
#10分で学べるAI バッチファイルでバリエーション広告を生成(1)使ってみよう編

Google Slidesで新築分譲マンションのバリエーション広告を大量生成…したはいいけど…ええっ!?

前回、知り合いの不動産会社から依頼された案件のため、

新築分譲マンションのバリエーション広告を大量生成できるGoogle Slidesを作成した２人でしたが……。

前回のSTORY #10分で学べるAI

Google Slidesでバリエーション広告を大量生成

#10分で学べるAI Google Slidesでバリエーション広告を大量生成

★バリエーション広告：さまざまな対象者に向けて制作する多様性のある広告

以下、アイキュー部のDiscordでのやり取りです

ルゥ「コト先輩～、Google Slides作っておきましたよ～」

コト先輩「わあ！すごいのができたね！！早速クライアントに提出してくる！」

（…しばらく後…）

コト先輩「ルゥくんゴメェン！今回のクライアントは『Google Slides禁止！』だそうです！！」

ルゥ「うええええええええ！先に聞いてきてくださいよ！！」

コト先輩「今回のクライアントさんからの依頼によると、『オペレーターさんの作業環境は追加ソフトのインストールが禁止されている事務用ノートPC』、だそうです」

ルゥ「えっ、ゲーミングPCとかは期待してなかったけど……それじゃあGPUは全く期待できないじゃん！」

Koto「一応期限は半日だけ延長してもらえたけど、『最低15パターンは譲れない』っていわれちゃった」

ルゥ「どうしてこんな案件受けちゃったんですか！」

――こんな環境でも動くものってバッチファイルくらいか…ってバッチファイルでもAPIは呼び出せるんだから Stability AI の Stable Image Core も使えるかも！

やってみよう

Stability AI が提供する Stability AI Developer Platform のイメージサービスのうちのひとつ「Stable Image Core」のAPIを使って、GPUいらず、たった3分程度で商用利用できるバリエーション広告（さまざまな対象者に向けて制作する多様性のある広告）画像を様々なスタイル画像で生成してみましょう。今回はバッチファイルだけ、ノーコードで利用できるツールとして提供します。

Stability AI のプラットフォーム APIキーの入手

まず、このバッチファイルで画像生成をするには Stability AI のプラットフォームを利用するAPIキーが必要です。持ってない人はここにアクセスしてAPIキーを取得するか、管理者殿にお願いしてキーを発行してもらってください。

https://platform.stability.ai/account/keys

生成できない場合は支払い設定（https://platform.stability.ai/account/credits）を確認してください。

Copy ❏ したら「sk-….」で始まるAPIキーをクリップボードにコピーできます。このAPIキーが流出すると勝手に使われてしまいますので管理はお気をつけて。

次のステップに進みます。

バッチファイルをダウンロード

このリンクでダウンロードして使えるバッチファイルを配布しています。

ダウンロードしたら解凍して中身を確認してください

https://j.aicu.ai/SaiImgBat

設定ファイルを開いてAPIキーを設定

生成する前にAPIキーを設定します

SIC_settingという名前のテキストファイルがあるのでメモ帳で開いて、

「STABILITY_API_KEY=」と書かれている部分の後ろに先ほどコピーしたAPIキーを貼り付けて保存します。

これだけで画像を生成できるようになりました！

設定を確認しよう

生成する前に設定を確認しましょう

先ほどAPIキーを入力したテキストファイルから以下の項目を設定できます。

・プロンプト

・ネガティブプロンプト

・アスペクト比

・出力フォーマット

・生成サイクル数

設定するにはそれぞれの項目の「＝」より後ろを書き換えてから保存してください。

バッチファイルを実行して画像生成！

いよいよバッチファイルを実行しましょう。

SIC_IMG_Creatorというバッチファイルをダブルクリックすると実行できます。

初回はスマートスクリーンの確認画面が出ます。危険なバッチファイルではありませんので詳細情報を押すと実行ボタンが現れます

※ここで管理者様に止められてしまう環境の場合は、貴社の情報システム管理部門殿にお願いしてください。

起動するとこのような~~黒怖い~~コマンドプロンプト画面が現れます。

ここで生成する画像のプロンプトや枚数を確認できます。

「y」と入力してEnterキーを押下すると生成が開始されます。

すべてのスタイルで生成が完了するまで大体３分ぐらいかかります。

生成された画像を確認する

生成された画像はSIC_Imageというフォルダに格納されています。

前回と同じ流れが作れそうです！

#10分で学べるAI Google Slidesでバリエーション広告を大量生成

まとめ

いかがでしたか？

たったこれだけで様々なスタイルの画像を生成をすることができます！

AICUmediaでは今後もStable Diffusion 3.0 やStable Image Core を用いた記事を発信していく予定です

面白かったらぜひフォロー、いいねをお願いします！

次回予告

次回はこのプログラムの中身を解説しちゃいます！お楽しみに！

#10分で学べるAI

#10分で学べるAI　シリーズ

✨️本記事が面白かったら、X@AICUai, noteのフォロー、シェアをよろしくお願いいたします！
https://note.com/aicu
社内Slack等のシェアでも歓迎です。
また「こんな記事欲しい」といったリクエストがございましたら X@AICUai までメンションやDMでいただければ幸いです。

✨️AICU Inc.は Stability AI 公式パートナーです。
様々なアプリ開発のご相談も承っております！サービスに導入したい、使いこなせる社員をパッと育成したい！そんな需要がございましたら sai@aicu.ai までどうぞご相談ください。

https://corp.aicu.ai/ja/stability-ai-membership

生成AI時代に「つくる人をつくる」AICU社、生成AIリーディング企業「Stability AI」と戦略提携 https://prtimes.jp/main/html/rd/p/000000007.000133647.html

2024-06-07

【生成AIの社会と倫理】「画像生成AI Stable Diffusion スタートガイド」 #SD黄色本公式ワークショップ 2024/6/26(水)19:00〜20:30開催

本ワークショップは2024年3月29日に発売された書籍「画像生成AI Stable Diffusion スタートガイド」（白井暁彦＋AICU media編集部／SBクリエイティブ刊）をベースに、最新の画像生成AIについて学びたい方のためのワークショップです。

お申し込みはTechplayから https://techplay.jp/event/946209

「生成AIを使うにあたって何に気を付ければいいんだろう？」
「画像生成AIで生成してみたけどこれって著作権違反にならないの？」
「生成AIのモデルを作ってみたいけど何かしなければいけないことはあるのかな？」

このような方に向けて、本書の法律監修で参加された柴山吉報弁護士 (阿部井窪片山法律事務所)のとAICU media編集部が、生成AIを取り巻く法律と発注や受注する際に必要な知識、トラブルにならないためのポイントを解説します。

業務の上での発注者や受注者、イベントやスクール開催、教育、著作権や意匠権といった知的財産権との関係、訴訟リスクが高いパターンなど、生成AI・画像生成AIを扱う際の「『陽のあたる場所』を増やすべく、不安な点を明らかにしていく」という目的の公式ワークショップになります。

第1パートはSD黄色本の監修を行った弁護士による勉強会、
第2パートは参加者からの質問にお答えしていく相談会、
第3パートはAICU編集部とのオンライン交流会・LT登壇を受け付けます。

参加対象

生成AIに関するビジネス開発、法務担当者、経営者
生成AI時代のクリエイター／フリーランサー
広告・映像業界、アニメ制作、ゲーム開発、教育・研究系のプロフェッショナル
生成AIを業務や社内で活かしたい方
これから本書を買ってみようと思う人
生成AIを今後の人生に活かしたい方

参加費

・書籍購入済みの方 : 2,000円
・書籍付き : 5,000円
・本ワークショップの社内での展開等はこちらをご参考ください

オンラインサイン本企画

申込時に「書籍付き（サイン入り・申込後に発送）」をお選びいただくと、著者の直筆サイン本を事前発送いたします。発送が間に合うように、ぜひとも早めのご参加登録をおすすめします。

タイムスケジュール

時間	内容
19:00〜	オープニング
19:10〜19:30	【勉強会】SD黄色本監修弁護士による「生成AIの社会と倫理」最新の基本知識を解説(仮)
19:30〜20:00	【相談会】参加登録者からの事前質問への回答タイム(仮)
20:00〜20:30	【交流会】AICU mediaオンライン交流会・ライトニングトーク

※ 当日予告なく時間配分・内容が変更になる可能性がございます。

登壇者

柴山吉報弁護士

阿部井窪片山法律事務所 (#SD黄色本法律監修)

主な取扱分野は、一般企業法務、人事労務、ベンチャー法務、事業再生、M&A等の各分野。IT企業のクライアントが多く、システム開発、AIのモデル開発及びデータの取引等の相談及び契約書の作成、知的財産戦略等に関するアドバイスなどを行う。機械学習エンジニアの資格（JDLA Deep Learning for ENGINEER 2020 #1）を有し、AIエンジニアとしての知見を用いて踏み込んだアドバイスを提供している。 先端的な事業を行うベンチャー企業からの規制法対応や上場支援等の相談を受ける一方で、窮境にある会社の事業計画の策定支援や金融機関との交渉等の事業再生分野の業務も行うなど、様々なフェーズの会社において、事業に深く関与した法的サポートを得意とする。また、事業再生のための組織再編など、多数のM&Aの経験を有する。　特許庁・経済産業省「オープンイノベーション促進のためのモデル契約書ver2.0（AI編）」検討メンバー一般社団法人日本ディープラーニング協会有識者会員AI プロダクト品質保証コンソーシアムメンバー一般社団法人日本ディープラーニング協会の研究会「AIデータと個人情報保護」副座長　主要著書「マンガでわかる DX」（共著）SBクリエイティブ（2023年）「ディープラーニングG検定（ジェネラリスト）　法律・倫理テキスト」（共著）技術評論社（2023年）「実践　ゼロから法務！―立ち上げから組織づくりまで―」（共著）　中央経済社（2023年）「Ｑ＆Ａ　ＡＩの法務と倫理」（共著）　中央経済社（2021年）「経験者が語るＱ＆Ａ　電子契約導入・運用実務のすべて」（共同編著）　中央経済社　（2021年）「契約解消の法律実務」（共著）中央経済社（2022年）「第4次産業革命と法律実務－クラウド・IoT・ビッグデータ・AIに関する論点と保護対策－」（共著）　民事法研究会　（2019年）ほか。

白井暁彦

AICU Inc. CEO

白井暁彦（Akihiko Shirai, PhD / しらいはかせ）（X アカウント：@o_ob）エンタメ・メタバース技術の研究開発に関わる研究者、ホワイトハッカー作家、米国スタートアップ「AICU Inc.」「Hidden Pixel Technology Inc.」のCEO。東京工芸大学写真工学科卒、同画像工学専攻修了。キヤノン株式会社とグループの研究所より生まれた英国・Criterion Software にて世界初の産業用ゲームエンジン「RenderWare」の普及開発に参加、その後、東京工業大学知能システム科学専攻に復学。博士学位後、NHK エンジニアリングサービス・次世代コンテント研究室、フランスに渡りENSAM 客員研究員、国際公募展Laval Virtual ReVolution の立ち上げ、日本科学未来館科学コミュニケーター神奈川工科大学情報メディア学科准教授を経て、2018 年よりデジタルハリウッド大学 大学院客員教授 およびグリー株式会社GREE VR Studio Laboratory Director。スマートフォン向けメタバース「REALITY」を開発・運用するREALITY 株式会社の立ち上げを通して、Virtual YouTuber などXR ライブエンタメ技術のR&D、国際発信など、メタバースエンタテイメントの未来開発や知財創出を中心に、自らエンタテイメントのライブプレイヤーとして世界に向けた開発・発信活動方法論化しながら世界中のエンタテインメント技術業界に数百人の規模でクリエイターを育成している。2023 年よりデジタルハリウッド大学発米国スタートアップ企業「AICU Inc.」CEO。生成AI 時代に「つくる人をつくる」をビジョンに英語、日本語、フランス語、プログラミング言語などでオープンな作家活動を続けている。日本バーチャルリアリティ学会 IVRC実行委員会委員。芸術科学会副会長。著書に『画像生成AI Stable Diffusionスタートガイド』、『WiiRemote プログラミング』（オーム社）、『白井博士の未来のゲームデザイン - エンターテインメントシステムの科学-』（ワークスコーポレーション）、『AI とコラボして神絵師になる　論文から読み解くStable Diffusion』（インプレスR&D）他。

【#SD黄色本『画像生成AI Stable Diffusion スタートガイド』紹介】

全目次公開記事はこちら！
https://ja.aicu.ai/sbxl/

画像生成AIの１つであるStable Diffusionを導入・体験するための入門書です。
プログラミングが分からない、ネットの情報を見てもうまく使えなかった、そんな悩みを抱えている人でもAIを使った画像生成体験ができるようにしっかりサポートします。
本書籍では以下の環境で解説します。
・Google Colab Pro環境
・Windows10/11 NVIDIA GPU環境
・MacOS Apple silicon 環境
本書籍では以下の内容を取り扱います。
・拡散モデルによる画像生成の原理
・Stable Diffusionを使用するためのWebUI環境構築
・テキスト/画像を元に画像を生成する（txt2img/img2img/ControlNet）
・Google Colab 上で追加学習を行う（LoRAの作成）

本書ではソフトウェアの使い方解説だけではなく、自分で設定できるセッティングやパラメータが画像生成にどのように関わっているのかについても解説しているため、AI技術について知識を深めたい人にとってもおすすめです。
また、既にAIを活用している方にもご満足いただけるように、よりAI画像制作を極めるヒントとなるようなStable Diffusionを含むAI画像生成を利用した作例のメイキング方法やプロンプト構成/生成パラメーターなどの情報を公開・解説しています。ハンズオン形式で最後まで取り組むことで、画像生成AIへの理解をより深めることができる1冊となっています。

Chapter1　画像生成AIについて知ろう
Chapter2　環境構築をしてはじめよう
Chapter3　プロンプトから画像を生成してみよう
Chapter4　画像を使って画像を生成してみよう
Chapter5　ControlNetを使ってみよう
Chapter6　LoRAを作って使ってみよう
Chapter7　画像生成AIをもっと活用しよう

お申し込みはTechplayから
https://techplay.jp/event/946209

各分野に向けた各章を深く掘り下げる形のレギュラーイベントとして実施する可能性がありますので、こちらのコミュニティをフォローよろしくお願いいたします。
https://techplay.jp/community/AICU
また内容も、映像プロフェッショナルから、企業研修、学校団体（クラブ・サークル等含む）も多様に開発していく予定です。

注意事項

本ワークショップの配布物や上映内容の録音、スクリーンショットはご遠慮ください。
※公式イベントレポートは AICU media noteメンバーシップにて募集中しております。
リクルーティング、勧誘など、採用目的でのイベント参加はお断りしております。
キャンセル待ち・補欠・落選の方はご参加いただくことが出来ませんのでご了承ください。
欠席される場合は、お手数ですが速やかにキャンセル処理をお願い致します。
無断キャンセルや欠席が続く場合、次回以降の参加をお断りさせていただく場合がございます。

2024-06-06

Computex 2024 基調講演 Stability AI のCEO/CTOが語る Stable Diffusion 3 は「自然の進化」

■Stability AI クリスチャン・ラフォート氏の講演を入手

AICU media は講演動画を入手しましたので要約翻訳でお送りします

AMDの基調講演（Dr. Lisa Su, Chair and CEO, AMD）

https://www.computextaipei2024.com.tw/en/index.aspx#keynote1

司会者：皆さん、本日は、AI開発者と密接に連携しているAMDのMI300 （AMD Instinct™ MI300 Series Accelerators）についてお話しします。それでは、Stable Diffusion の画期的なオープンアクセスAIモデルで知られる Stability AI のCTO兼共同CEO、クリスチャン・ラフォートさんをお迎えしましょう。こんにちは、クリスチャンさん。お元気ですか？

クリスチャン：こんにちは。元気です。この場に立てることを光栄に思います。Stability AI の仲間たちを代表してここにいます。

司会者：今日はStability AIの多くの革新についてお話しいただきますね。まずは、これらのAIモデルがどのようにして可能性の境界を押し広げているのか、教えていただけますか？

クリスチャン：もちろんです。私たちは、あらゆる業界で生産性の飛躍的な向上を目の当たりにしています。特に、私たちがモデルとソースコードを無料で公開したことで、多くの開発者や研究者が新しい発見を驚異的な速度で行い、新しいアプリケーションを作り上げました。例えば、古い家族写真の修正や品質向上、あるいはもう見たくない人を写真から削除することが、今や誰でも数秒でできるようになりました。同様に、生産性の向上は画像だけでなく、言語、コーディング、音楽、音声、3Dといった他の研究分野でも見られます。これらを組み合わせることで、映画制作やビデオゲームの生産性を少なくとも10倍に引き上げることを目指しています。

司会者：それは素晴らしいですね。さて、今日は何か大きなニュースがあると伺っていますが。

クリスチャン：はい、Stable Diffusion 3のリリースが間もなくです（the weight/wait fot Stable Diffusion 3 is almost over..!）。

コミュニティの皆さんの忍耐と理解に感謝しています。品質と安全性を向上させるために多大な努力を注ぎました。本日、6月12日にStable Diffusion 3のミディアムモデルを皆さんにダウンロードいただけるようリリースすることを発表します。

（会場から拍手）

クリスチャン：多くの努力がこのモデルに注がれました。私たちは、コミュニティがこのモデルをどのように活用するのか、とても楽しみにしています。技術的でない方々にはわかりにくいかもしれませんが、かつては研究の最前線がこうしたモデル、例えば Stable Diffusion のようなものに繋がっていました。これはまさに自然な進化のようなもので、様々な新しい方法で組み合わさっています。これをオープンに公開することで、何百万人もの人々が最適な組み合わせ方を発見し、新しいユースケースを解放するのを手助けしてくれます。SD3ミディアムは、これまでにない視覚品質を実現したSD3の最適化バージョンであり、コミュニティが自分たちの特定のニーズに合わせて改善することができます。これにより、次の生成AIのフロンティアを発見する手助けになります。このモデルはもちろんMI300上で非常に高速に動作し、発表されたばかりのRyzen AI搭載のラップトップでも動作するほどコンパクトです。こちらがStable Diffusion 3で生成した画像です。台湾の夜市を描写するようにチャレンジしました。

司会者：とても素晴らしいですね。

クリスチャン：細かく見ると完全なフォトリアリスティックではないかもしれませんが、テキストプロンプトのさまざまな要素をよく捉えていると思います。特に、この長いテキストプロンプトを実際に入力するよりもはるかに速く生成されたことを考えると、特に印象的です。歩いている通行人、石でできた通り、夜間の雰囲気などが捉えられています。

クリスチャン：SD3は、マルチモーダルディフュージョントランスフォーマーアーキテクチャを使用しており、視覚コンセプトとテキストプロンプトを以前のモデルよりもはるかに優れた方法で理解します。シンプルなプロンプトにも対応しているので、これを使いこなすための専門知識は必要ありませんが、より複雑なプロンプトにも対応し、そのすべての要素をうまく組み合わせることができます。SD3は、あらゆる種類の芸術スタイルやフォトリアリズムに優れています。

ここに実際に非常に難しい例があります。これは、1年以内にリリースした前のバージョンであるStable Diffusion XL (SDXL) との比較です。この例は特に難しいのですが、なぜなら、手を描くことがこれらのモデルにとって非常に難しいからです。また、ギターの弦やフレットのような繰り返しのパターンも含まれています。これらはすべて、モデルが理解し正確に描写するのが非常に難しいものです。SD3がギターの形や手のようなより現実的なディテールを生成したことに注目してください。細かく見ると、いくつかの不完全な点があるかもしれませんが、前世代に比べて大きな改善です。

司会者：本当にすごいですね。MI300 GPUについての印象はどうですか？

クリスチャン：素晴らしいです。MI300の192GBのメモリはまさにゲームチェンジャーです。新しいモデルを解放する方法として、より多くのメモリを持つことが非常に重要です。これが、より大きなモデルをより早く、より効率的にトレーニングするのに役立つのです。具体例を挙げると、AMDとの協力でクリエイティブアップスケーラ機能を開発しました。これは、1メガピクセル未満の古い写真を取り込み、解像度を大幅に向上させ、品質も同時に向上させる機能です。Nvidia H100で30メガピクセルを達成した時も嬉しかったのですが、MI300Xにコードを移植したところ、ほとんど努力なしで100メガピクセルに達しました。コンテンツクリエイターは常により多くのピクセルを求めているので、これは大きな違いを生みます。実現するためにほとんど努力が必要なかったことも大きなステップアップです。研究者やエンジニアは、AMDとStankのGPUが提供する素晴らしいメモリ容量と帯域幅の利点を気に入ることでしょう。

司会者：それは驚異的です。AMDとの今後の協力についてはどう考えていますか？

クリスチャン：AMDとのさらに密接な協力を通じて、新しい最先端のビデオモデルを開発し、全世界に公開したいと考えています。これにはより多くのメモリとコンピュートパワーが必要です。AMDのチームと密接に協力して、これを実現したいと考えています。

司会者：素晴らしいですね。今日はお話いただき、ありがとうございました。

Stability AI が Stable Diffusion 3 の weights を 2024年6月12日に公開予定…ところで画像生成AIにおける weights って何？

✨️本記事が面白かったら、ぜひシェアをよろしくお願いいたします！

社内Slack等のシェアでも歓迎です。

また「こんな記事欲しい」といったリクエストがございましたら X@AICUai までメンションやDMでいただければ幸いです。

✨️AICU Inc.は Stability AI 公式パートナーです。

様々なアプリ開発のご相談も承っております！サービスに導入したい、使いこなせる社員をパッと育成したい！そんな需要がございましたら sai@aicu.ai までどうぞご相談ください。

https://corp.aicu.ai/ja/stability-ai-membership

生成AI時代に「つくる人をつくる」AICU社、生成AIリーディング企業「Stability AI」と戦略提携 https://prtimes.jp/main/html/rd/p/000000007.000133647.html

2024-06-04
Stability AI が Stable Diffusion 3 の weights を 2024年6月12日に公開予定…ところで画像生成AIにおける weights って何？

Computex Taipei 2024のオープニングキーノートにて、Stability AI 共同CEOの Christian Laforte氏(@chrlaf) がStable Diffusion 3 Medium を6月12日にオープンリリースすると発表しました。

🎉Weight の公開はまもなくです🎉@ComputexTaipeiにて、Stability AI 共同CEOの@chrlafがStable Diffusion 3 Medium を6月12日にオープンリリースすると発表しました。

🔗 ウェイトリストに登録して、モデルのリリースの最新情報をチェックしてください。https://t.co/rhVC1UFG7K pic.twitter.com/M50Mb0gfWX
— Stability AI Japan (@StabilityAI_JP) June 3, 2024

＜Stability AIの公式メールニュースからの翻訳＞

「Stable Diffusion 3 Medium」が登場します！6月12日（水）より、Hugging Faceでweights をダウンロードできるようになります。SD3 Mediumは、20億のパラメータを持つSD3モデルで、これまでのモデルが苦手としていた分野で特に優れた性能を発揮するように設計されています。主な特徴は以下の通りです：

フォトリアリズム：手や顔によく見られるアーチファクトを克服し、複雑なワークフローを必要とせずに高品質の画像を提供します。

タイポグラフィ：タイポグラフィにおいて強固な結果を達成し、大規模な最新モデルを凌駕します。

パフォーマンス：最適化されたサイズと効率性により、コンシューマー・システムとエンタープライズ・ワークロードの両方に最適です。

ファインチューニング：小さなデータセットから微妙なディテールを吸収できるため、カスタマイズや創造性に最適です。

SD3 Mediumのweightsとコードは、非商用目的にのみご利用いただけます。Stable Diffusion 3の商用利用を目的としたセルフホスティングライセンスのご相談は、以下のフォームにご記入ください。弊社のチームがすぐにご連絡いたします。

Sign Up to the Stable Diffusion 3 Weights List

https://stability.ai/stablediffusion3

追伸：それまで待てないという方は、当社のフレンドリーなチャットボットStable Assistant、DiscordのStable Artisan、またはAPIから、当社の最も高性能なテキスト画像変換モデルの3日間無料トライアルにアクセスできます。

Stable LM2 12B は、Stable Assistant を強力にサポートします。Stable Assistant は、当社の最も先進的な言語モデルであり、その強力なテキスト生成機能でコンテンツを強化します。

Stable Artisanは、Discordエコシステム内のStability AI Platform API上の製品を利用する、楽しいマルチモーダル生成AI Discordボットです。このボットは、Stable Diffusion Discordサーバーにアクセスして、他のコミュニティと一緒に画像を生成・編集することができます。

＜公式発信ここまで＞

「weightsの公開」にはどんな意味があるのか

つまり、「weightsをダウンロードできるようになる」というということの意味は、「AIモデルをダウンロードできるようになる」というとして理解してよいと考えます。

ただしリリースに記載のある通り、AIモデルをダウンロードして使用できるのは非商用目的であり、商用利用する場合は要相談となる点には注意が必要です。

画像生成AI解説用語集

📖用語「weights」

「weights」とは「AIモデル」にあたります。

#SD黄色本「画像生成AI Stable Diffusionスタートガイド」p.27の解説によると……

「コンピューターの中では、「ノード」と呼ばれる単位がニューロンの役割をしていて、これらが「重み」(weights)でつながっており、「バイアス」(bias)は入力が0の時、出力にどれだけ値を上乗せするかを意味します。この大量の「重みとバイアス」のセットこそがそのネットワークの「モデル」であり、この調整を入力刺激と出力結果を評価していくことでモデルを学習させることになります。」

機械学習における「weights & biases」はモデルの学習結果そのものであり、Stable Diffusion以降のAI画像生成AIにおいては safetensorsファイルのことを意味する事が多いでしょう。

なお英語的には「weights」であって「weight」ではないのでAICU media編集部ではカタカナで「ウェイト」と表記することは限定的とします。

📖用語「アーチファクト」artifacts

アーチファクト（artifacts）という語は、ラテン語で「人工物」を表すars、artisと「作られたもの」を表すfactumの組み合わせで「人工的に作られたもの」を意味します。人為的または技術的な影響によって発生する産物または現象を指します。画像生成AIにおいては「自然物」に対して「人造物」と解釈することができます。

📖用語「セルフホスティング」self-hosting

AIモデル提供企業自身による演算基盤や環境をAPI経由で提供するのではなく、weightsをオープンに配布し、ダウンロードして独自の演算環境やアプリケーション、ツールやAPIサーバーに実装して利用すること。ブラックボックス化や長期サポートが保証されないモデル提供企業のAPI経由に対して、内部動作の透明化や最適化、コミュニティのサポートなどの利点がある。

2024-06-03
#10分で学べるAI Google Slidesでバリエーション広告を大量生成

「ようこそ！アイキュー部」-1話

「AIでクリエイティブなビジネスをする！」をテーマに学内起業コンテストにエントリー提案をして「アイキュー部」を設立したKotoちゃん。

今日は知り合いの不動産会社から依頼された案件に取り組んでいます。

Koto「あ～あ、新築分譲マンションのバリエーション広告を作ってくれ……って頼まれたんだけど、今日はもう帰らないと…ルゥくん、あと頼むわね！」

★バリエーション広告：さまざまな対象者に向けて制作する多様性のある広告

ルゥ「Koto先輩！？待ってください、何やってるんですか？」
Koto「え……？アイキュー部で受けたバイトなんですが何か問題でも？」
ルゥ「そうなんだ……って！なんで手で作ってるんですか？『AIでクリエイティブなビジネスする』ってのがこの部活なんですよね？？」
Koto「私は『アートイラスト・キュレーション部』の略のつもりで「AICU部」って書いたつもりなんだけど……審査員の先生にウケが良かったのでついそのまま……」
ルゥ「押し切られちゃったんですか！？」
Koto「こうやって部室も案件もらえたし、いいじゃない。しっかり稼ぎましょ」

ルゥ「まあ……そうですね、で、これは何なんですか？」

Koto「わからないの？『マンションポエム』よ！！」
ルゥ「『上質が佇む（たたずむ）至高の邸宅』……なんだかよくわからないけどこれがあるだけでリッチな感じしますね」
Koto「『これをできるだけ多くのバリエーションを作ってこい』というのがクライアントから出された課題よ」
ルゥ「たしかにAI画像生成でできなくもなさそうだけど……これをいくらで受けたんですか？」
Koto「ああ！もう帰らないと門限が！じゃあ私が家につくまでに、そのAI画像生成とやらで、最低15パターンをGoogle Slidesに作っておいてね！」
ルゥ「ひぃ」

――どうしよう、突然、大量の広告ビジュアルの生成を頼まれちゃった。画像生成しようにもGPUもないしな…。

あ、でもこんな時は… Stability AI の Stable Image Core と Google Apps Scripts が使えるかも！

……とおもったら、即実行。こんな感じに出来上がってました！

▼「ようこそ！アイキュー部」-1話(後編)はこの技術解説の続きにあります▼

やってみよう

Stability AI が提供する Stability AI Developer Platform のイメージサービスのうちのひとつ「Stable Image Core」のAPIを使って、GPUいらず、たった3分程度で商用利用できるバリエーション広告（さまざまな対象者に向けて制作する多様性のある広告）画像を様々なスタイル画像で生成してみましょう。今回はGoogle Slidesだけ、ノーコードで利用できるツールとして提供します。

Stability AI のプラットフォーム APIキーの入手

まず、このプログラムで画像生成をするには Stability AI のプラットフォームを利用するAPIキーが必要です。持ってない人はここにアクセスしてAPIキーを取得するか、管理者殿にお願いしてキーを発行してもらってください。

https://platform.stability.ai/account/keys

生成できない場合は支払い設定（https://platform.stability.ai/account/credits）を確認してください。

Copy ❏ したら「sk-….」で始まるAPIキーをクリップボードにコピーできます。このAPIキーが流出すると勝手に使われてしまいますので管理はお気をつけて。

次のステップに進みます。

Google Slides コピーして自分のDriveに

このリンクでコピーして使える Google Slidesを配布しています。
お使いのGoogleアカウントでアクセスしてください。

https://j.aicu.ai/SAIAD

こんな画面のGoogle Slidesが表示されます。このあと自分のDriveにコピーしていきます。

ファイル⇢「コピーを作成」⇢「プレゼンテーション全体」を実行します。

「ドキュメントをコピー」のダイアログが表示されますので、そのまま「コピーを作成」ボタンを押してください。

初回起動でAPIキーを設定

まず最初に、APIキーを設定します。

スライドの上に以下のようなダイアログが表示されます。コピーした直後に表示されるはずです。

[S.] Stability AI Platform API Key Required

このツールでは、画像を生成するために Stability AI プラットフォームの APIキーが必要です。
お持ちでない場合は、https://platform.stability.ai/account/keys でAPIキーを取得してください。

This program requires a Stability.ai API key to generate images.
If you do not have one, please visit https://platform.stability.ai/account/keys to obtain an API key.

と表示されますので、冒頭で取得した「sk-」で始まる51文字のAPIキーを貼り付けてOKを押してください。

もし、コピー直後のダイアログで設定しそびれた人は、メニューの[AI Image Generator]⇢[Set API key]を実行することで設定できます。

スクリプト実行権限の設定

次に、APIキーの動作確認とスクリプト実行権限の許可を行います。メニューの3番目「Generate Images」を選んでみてください。

「認証が必要です」というダイアログが表示されるはずです。

スクリプト実行権限を許可していきます。

現在お使いのGmailアドレスが表示されているはずです。

スクリプト実行権限を許可するアカウントを選びましょう。保存先ドライブを選択する意味もありますので、実験目的であれば、まずは個人をおすすめします。

アカウントを選択すると、今度は「⚠️ このアプリは Google で確認されていません」という警告が表示されます。危険なアプリではありませんので左下の「詳細」を押して行きます。

最後に「AICU-AdGenerator（安全ではないページ）に移動」を押して、各サービスへの許可を設定していきます。

許可ボタンを押すことでドライブへの閲覧、書き込み権限、スライドの編集、外部サービス（Stability AIのAPI）へのアクセスを許可します。編集履歴などはお使いのGmailアカウントで実行したことが記録されますし、知らないうちに実行するような処理にはなっておりませんのでご安心ください。

権限の設定が終わったら、再度メニューの3番目「Generate Images」を選んでみてください。

「スクリプトを実行しています」が表示され、画像の生成がはじまります。

3分程度で、「画像の生成が完了しました。フォルダを確認してください」が表示されるはずです。

Google Driveのマイドライブ直下「AICU-Stability-AdGenerator https://j.aicu.ai/SAIAD のコピー」というフォルダに以下のような画像が生成されていれば成功です！

これは同じプロンプトに対して、異なるスタイルが15種類適用された画像になります。

Google Slides自動生成とキャッチコピーの配置

これで終わり！でもいいと思ったのですが、クライアントの要求は画像の生成だけでなく、「マンションポエム」と呼ばれるキャッチコピーも含まれるような気がしたので、もうひと押しGoogle Slidesで頑張ってみます。

Kotoさんが作っていたスライドにあったキャッチコピー「上質が佇む至高の邸宅。」とスタイルを第1ページに設定してあります。こちらは自由に編集していただいて構いません。

これで準備は完了です！

下の[Prompt=]に生成したいもの,
[NP=] に見たくないものを英語で入れて
メニューの3番目の[AI Image Generator]⇢[Add Slides by all styles] を選んでみてください。

「スクリプトを実行しています」と表示されます。

この後の結果が出るまでは、数分かかります。無事に生成されるとこのように15枚のスライドがキャッチコピー付きで生成されます。左下のスライド一覧表示にしてみましょう。

初期状態では「Prompt=urban tokyo bayfront skyline residences ad luxury super rich visual」（プロンプト=東京ベイフロントのスカイライン・レジデンス広告の豪華なスーパー・リッチ・ビジュアル）となっているので、このまま何度でも「Add Slides by all styles」を実行すれば15枚づつ、東京湾ベイエリアの高級そうな住居の画像が生成されます。第1ページにある「Prompt=」と「NP=」を変えるだけなので、例えばこんなプロンプトにしてみます

Prompt=Paris urban apartment　　パリの都会のアパルトマン
NP=Nsfw, worst quality　　（ネガティヴ・プロンプト）職場にふさわしくない、悪いクオリティ

Stability AIの Stable Image Core API に実装されている多様なスタイルのおかげで、自然なバリエーション広告を生成できています。ネガティヴ・プロンプトのおかげもあってか、あまり出来の悪いスライドはありませんが、不要なスライドやキャッチコピーの修正を行って完成です。

このSlidesに追加してある「AI Image Generator」メニューから実行できる機能の詳細は以下のとおりです。

・ Set API Key：Stability AI のAPIキーを設定します。

・Add Slides by all styles：タイトル(1枚目のスライド)で「Prompt=」で与えられたプロンプトと「NP=」で与えられたネガティブプロンプト（英語）から Stability AIの Stable Image Core API を使用して15種類のスタイル適用済み画像をGPU不要で画像を生成し、1枚生成されるごとに、スライドの画面全体に表示されるように背景画像として配置しています。追加された各スライドのタイトルとメモに使用したstyleとプロンプトを設定しています。

・Generate Images：タイトル(1枚目のスライド)で与えられたプロンプトから、スライドのファイル名と同じ名前のディレクトリにすべてのスタイルの‪2,040 x 1,152‬pixelsの画像を15スタイル生成します。

・Save All Slides：PDF がDriveに保存されます。Google Slidesの[ファイル]⇢[ダウンロード]で保存でも構いません。

・15スタイルの生成は3分程度で51credit (80円ぐらい)です。

※安全のため、他人とシェアするときは Set API Keyを使って有効ではないAPIキーを設定しておくことをおすすめします。
※本ツールのソースコードが気になる方は Google Slides上でスクリプトエディタをご参照ください。このコードの著作権はAICU Inc. が保有しています。この記事で公開されているツールの使用における損害等についてAICU Inc.は責任を負いません。
※実際の広告等への利用など Stable Diffusionの商用利用に関するご質問は sai@aicu.ai までお問い合わせください。

技術解説「Slidesだけでも画像生成できる」

Google SlidesをコピーしてAPIキーを貼り付けるだけで様々なスタイルの画像を生成をすることができました！

AICU media では今後も話題の Stable Diffusion 3.0 やStable Image Core を用いた記事を発信していく予定です。面白かったらぜひフォロー、いいねをお願いします！

次回予告

さてその後のアイキュー部のDiscordでのやり取りです

ルゥ「Koto先輩～、Google Slides作っておきましたよ～」
Koto「わあ！すごいのができたね！！早速クライアントに提出してくる！」

（…しばらく後…）

Koto「ルゥくんゴメェン！今回のクライアントは『Google Slides禁止！』だそうです！！」
ルゥ「うええええええええ！先に聞いてきてくださいよ！！」

せっかくルゥくんが頑張って作ったGoogle Slidesですが、別のアプローチを探さねばならないようです。

#10分で学べるAI いかがでしたでしょうか？ご感想は X@AICUai までいただけると幸いです。

続きはこちら

#10分で学べるAI バッチファイルでバリエーション広告を生成(1)使ってみよう編

漫画「ようこそアイキュー部」はこちらに続きます！

▼ようこそ！アイキュー部第1話 https://note.com/aicu/n/ne878b6d68004

▼AICUマガジン5月号 https://j.aicu.ai/Mag2405

2024-06-02
工場勤務のおじさんが書く：橋本大也教授と白井暁彦CEOが解説する生成AIの未来

デジタルハリウッド大学の橋本大也教授と、デジタルハリウッド大学特命教授でもあるAICU Inc.の白井暁彦CEOが、それぞれのベストセラー書籍をもとに、ChatGPTやStable Diffusionなどの生成AIの最新動向を紹介しました。

人気著者が語る生成AIの魅力を一挙レポート

今回イベントレポートを書かせていただきます、AICU media のゲストライターです。工場のおじさんとしての目線でレポートしていきます！現地に参加できなかった読者に向けて、両著者の最新刊や #SD黄色本のサイン本即売会、交流の様子をお届けします。

私は初めてデジタルハリウッド大学に行きましたが、とても高いビルの中にあり、「こんなところに大学があるんだ」とドキドキしました。（このイベントに参加するために、岡山からきました！）

wikipediaより。このビルの3Fと4Fがデジタルハリウッド大学です！

https://ja.wikipedia.org/wiki/%E3%83%87%E3%82%B8%E3%82%BF%E3%83%AB%E3%83%8F%E3%83%AA%E3%82%A6%E3%83%83%E3%83%89%E5%A4%A7%E5%AD%A6#

AICU イベント告知記事→https://note.com/aicu/n/na27e9055f06f

３階へ行き、会場の受付を済ませた後、中に入りました。

（編集部：注）開演前に上映されていた動画
#AICU – AI Creators Union Demo Reel 2024 Summer

イベントの時間になり、スタートはデジタルハリウッド大学の杉山知之学長の動画から始まりました。

イベントがはじまる

写真：デジタルハリウッド大学の杉山知之学長の動画（AIの技術が入っているとは思えないくらい自然でしょ）

これはAIで作られた杉山学長のアバターが、デジタルハリウッド大学の入学式で講演している動画です。
ここで、杉山知之学長の発表で感じたことを率直に書きますね。

この動画を見て、最近はAIが仕事を奪うなどネガティブなニュースが多いけれど、このような使い方は素晴らしいなと思いました。
この動画、ただ学長が話をしているだけじゃんと思う人もいるかもしれません。
しかし、杉山知之学長は2021年よりALSという難病のため、体を自由に動かせず、声も出せない状況です。

AIを使って昔の声を再現し、AIの技術で表情を作り出すことで、まるで健康な時のように登壇している姿で動画の中で話をしていたのです。

この姿を見て、体の不自由な人々に対してAIがどれだけのサポートを提供できるかを実感できたんですよね。
AIが障害を持つ人々の生活をサポートする可能性を強く感じました。

橋本大也先生の話 – ChatGPTで作業時間が3分の1に？

続いて、今回のイベントのメインスピーカーの一人である橋本大也先生について紹介します。
さくっと一言で言うと、『頭がいい人のChatGPT&Copilotの使い方』（橋本大也著）という本を書かれた先生です。
本の表紙に、仕事時間を1/3に短縮できるって言葉が書いてありました。

え、えっー！仕事時間を1/3に短縮。。。まじか！？

そんな大きなことを書いてしまったら、めっちゃくちゃ叩かれてしまいそうと、ちょっと不安に思いました。みなさんも思いますよね？

しかし、登壇内容を聞いていたら、めちゃくちゃ納得できました。

橋本大也先生の話を書いたので読んでください。

橋本大也先生の話で特に面白かった２点

橋本先生の話は、主にAIで面白い映像を制作する方法にふれていました。

写真：実際にAIで作った動画。スクリーンで見る大きな恐竜は大迫力！

講演の序盤では、大画面に生成AIで作られた動画が流れていて、ワクワクする気持ちがおさえきれませんでした。

橋本大也先生の話で特に面白かったことは2点あります。
1点目は、実際に動画を作る工程を細かく説明してくれたことです。
2点目は、数学的なグラフにアニメーションを加えるとアートになることです。

これは1点目の話題で発表された、動画の製作工程の一部です。

通常、完成形しか見ることがないAI動画の制作過程について、プロの目線から具体的なツールの使用方法を教えてくれました。

橋本先生によるAI動画の手順の一例を紹介します。
①ChatGPTでストーリーを作り
②その段落ごとにRunwayを使って動画作成（日本語だと精度がよくないので英語に翻訳）
③Uidoで音楽生成（ストーリーをもとに）
④DIDでナレーションを追加
⑤動画を結合

この作業をAIなしでやろうとすると、たぶん、1ヶ月から3ヶ月くらいかかる内容（私が、前に動画制作をしている人から聞いた情報です）を、なんと1時間ほどで作れるというのです。

橋本先生の「仕事時間を1/3に短縮できる」という言葉は本当でした！

2点目の、数学的なグラフにアニメーションを加えるとアートになるという話題です。

普通のグラフはただ表示されるだけでは全く面白くありません。（面白いと思う人はすごくレベルが高いと思います）
しかし、ChatGPTに「このグラフをアニメーションにしてください」と指示を与えてグラフのアニメーションをつくり、音楽を加えて編集することで、グラフの印象ががらっと180度くらい変わるのです。

写真：この線グラフは、音楽に合わせて脈動しているところの写真。（一回、実際に体感してほしい。写真じゃ伝わらない。体感してみてください。）

他にも、ドーナッツチャートに音楽を加えると、カラフルで楽しいアートになるんです。

また、3次元サーフェスプロットに関しては、まるで新しい生物が誕生したかのような感覚になります。まるで新海で見たことがない生物を眺めている気持ちになるんです。これは実際に見たからこその感動でした。

しらいはかせの話 – 「世界で最も[おもしろい]生成AIビジネスをつくるには」

https://note.com/o_ob/n/n930c390b6dfa

続いて、今回のイベントのメインスピーカーの一人であるしらいはかせについて紹介します。

しらいはかせは、いろんなことができる方で、大ボリュームの発表でした。

なので、しらいはかせをさくっと一言で説明すると
「画像生成AI　Stable Diffusion スタートガイド」を書いた人です。

写真：この本は、予約してすぐに買いました。個人的に、世界の生成AI画像をつくる教科書になるものだと思っています。

有益な内容が多すぎる！
正直、カルピスの原液一気飲みを３本くらいやった感じです。
なので、情報量の濃さと多さに途中から頭がついていっていないのです笑

実際の内容の1割ぐらいしか書き起こせなさそう。実際に発表を聞いた方ならわかってくれるはず！

つくる人をつくる

「つくる人をつくる」が生まれた理由には、しらい博士のこれまでの経験が濃縮されています。

『綺麗なグラフィックでも、おもしろくない』

印象的だったのは、「綺麗なグラフィックでも、おもしろくない」という言葉です。

この言葉は非常に深い意味を持っており、しっかり理解するには深海3000メートルまで潜る覚悟が必要です。なので、ここでは簡単に説明します。

例えば、非常に綺麗なグラフィックのAIアバターが全自動で会話をするアニメーションを作っても、見る人は3秒で飽きてしまいます。

つまり、面白くないのです。

ですが、そこに人の感情を反映させるような演出を人間が加えると、とても面白くなります。例えば、目線の動き、カメラのフレーミング、仕草などです。

つまり、面白いものをつくるためには、人の演出が必要だということです。
人がどこで面白いと感じ、感情が動くのかを考えながら手を加える必要があります。

この点においては、現時点では人間の手による演出がAIを上回っているのかもしれません。

人生のターニングポイント

しらいはかせの人生には、２つのターニングポイントがあるそうです。

１つ目は、「ゴキブリ」？
２つ目は、子供たちの遊びの本質の探究

「ゴキブリ」
ゴキブリと聞くと驚くかもしれません。

過去にしらいはかせが「ファンタスティック・ファントム・スリッパ」という作品を作った話です。

写真：「ファントムスリッパー」。今でも最先端だと思う。そんな技術を1997年に、やっていたしらいはかせは、すごすぎる。

この作品では、２匹のゴキブリの疑似体験が描かれています。１匹は感触を感じられ、もう１匹はただのグラフィックです。この疑似体験を通じて、リアルとバーチャルの境界を探りました。

なぜこの疑似体験が海外で「アメージング」と言われ、大きな反響を呼んだのかを深く考えたことが、１つ目のターニングポイントだったそうです。

子供たちの遊びの本質を探究したこと

日本科学未来館 (旧)常設展示『アナグラのうた　〜消えた博士と残された装置〜』

写真：「アナグラのうた」。自分が歩いたところを遡って、足跡をつくれるらしい。面白そう。この作品も10年以上も前に作られたそうです。

「アナグラのうた」を通じて、子供たちの遊びの本質を探求しました。

このプロジェクトでは、モーションキャプチャー技術を使って子供たちの遊びを可視化しました。子供たちが歩いたり、ダンスをしたりする際に足跡やマークが現れる仕組みを導入しました。

（編集部注）

ゲーム業界をやめて東京工業大学の博士学生に戻った頃から、子供たちが楽しそうに遊ぶ姿を観察し、博士論文を通して「遊ぶこと」の本質についてさらに深く考えるきっかけになったそうです。

【博士論文】「床面提示型触覚エンタテイメントシステムの提案と開発　白井暁彦」

https://akihiko.shirai.as/AkihikoSHIRAI-DoctorThesis2004.html

『あそぶ』って言葉の意味っていろいろ。

「あそぶ」という言葉には、実にたくさんの意味があります。

写真：あそびの意味って、こんなに多い。

例えば、

•遊ぶ（あそぶ）、游（およぐ）、戯れる（たわむれる）、玩（もてあそぶ）、弄ぶ（たわむれる）
このように、「あそぶ」という言葉には多くの意味が詰まっています。

英語の「play」も同じように、多義的な意味を持っています。
例えば、「play」はスポーツをする、楽器を演奏する、ゲームをするなど、さまざまな場面で使われます。これってすごく面白くないですか？

つまり、「あそぶ」という言葉は、それを通じて私たちの好奇心を大いに刺激するもの。
動作や使う人の思考や視点でも変わるって面白い。

遊びながら新しいことを発見したり、楽しい経験を通じて学んだりすることは、まさに好奇心をくすぐる最高の方法ですよね。

これからの人類に必要なこと

これらの「つくる人をつくる」に繋がる話を聴いて、好奇心を持ち、情熱を持って生きることが、これからの人類にとって何よりも大切だと思いました。

しらいはかせは、「情熱」と「ハルシネーション（幻覚）」という言葉を使っていました。

ここからは、しらいはかせの言葉を使いながら、私なりに解釈したことを書きます。

写真；昔のひとは、どうしてこの絵を描いたのだろう？そこに今求められている生きる秘密が隠されてそうです。

個人的に解釈したのは、人間の存在意義を考えると、好奇心を持ち続け、情熱を持って生きることが、最もハッピーな人生を送る秘訣だということです。

AIなどの技術がどんなに発展しても、人間が幸せに生きるためにはそれだけでは不十分です。目標を持ち、情熱を持って生きることが必要です。

例えば、極端な話、定年退職してやることがない高齢者の方がいたとします。（極端な例の話ですよ。）
無限に時間があるけどやることがない、これは地獄のような人生です。

逆に、日々好奇心を持ち、情熱を持って生きると、毎日が楽しくなります。
今日は絵を上手く描いて売ってみようという目標を持てるような毎日です。

これによって色々学べるし、人生も楽しいものになります。私自身、本気で情熱がある方が良いと思っています。
好奇心を持てるようになるためには、学ぶことが大切です。

その学ぶ機会を無限に提供できるのが、「つくる人をつくる」ということなのだと思います。

「つくる人をつくる」というのは、人間が持つ好奇心や情熱を育むことにあると考えています。これによって人生が充実し、ハッピーに生きることができるんですよね。

Stable Diffusionの画像生成の話

写真：Stable Diffusionの仕組み

仕組みについての解説パートはこちらで資料が出ていました。

■Stable Diffusionの仕組み（入門編）

https://note.com/aicu/n/n505b0dfb1a75

最後に

学べることと情報量がとても多く、おなかいっぱいになったイベントでした！

他にも撮影不可の特別資料なども特別に公開されていましたが、現場にきた人だけの特権ということで、私からのレポートを終わらせてもらいますね。

お読みくださりありがとうございました。

イベント速報記事→https://ja.aicu.ai/talk20240530/

前回のイベント「デルタもんLoRAを作ろう！」ワークショップレポートはこちら

https://ja.aicu.ai/event20240516/

デジタルハリウッド大学の動画より
【公式60秒】デジタルハリウッド大学新CM『みんなを生きるな。自分を生きよう。2024』篇フルバージョン

【関連】

#SD黄色本サイン本即売会も開催！生成AI書籍人気著者の2人が語る「ChatGPTとStable Diffusion丸わかりナイト」

#SD黄色本サイン本即売会も開催！生成AI書籍人気著者の2人が語る「ChatGPTとStable Diffusion丸わかりナイト」

この記事が面白いと思ったら、AICU media をフォローよろしくお願いいたします！

2024-06-01
Stable Diffusionの仕組み（入門編）

Stable Diffusionの仕組みについてご存知ですか？
プロンプトを入れると画像が生成される…その内部を説明できるとかっこいいですよね。
こちらの講演で使用したスライドを白井CEOから頂いたので一部公開いたします。

https://note.com/aicu/n/n8d4575bcf026

画像生成AIの誕生と変遷(2)画像生成技術の歴史年表

https://note.com/o_ob/n/n971483495ef3

画像生成AIの誕生と変遷(4) 画像生成AIの2014–2024におきたパラダイムシフト

https://note.com/o_ob/n/n3c1d8523cf68

Stable Diffusionの仕組み（入門編）

CLIPとは画像とテキストの関係だけを学んでいます。
CLIP (Contrastive Language-Image Pretraining), Predict the most relevant text snippet given an image

https://github.com/openai/CLIP

実はネガティブプロンプトはStable Diffusionが公開されてからAUTOMATIC111で生まれました。

https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Negative-prompt

ネガティブプロンプトは、正プロンプトと同じ仕組みでCLIPを持ち、サンプラーが条件付き逆拡散をする際にUNETの左側に入ります。
画像のLatent Space化はちょうどZIP圧縮のような超圧縮で、フロート列が並んでいるweight&biasです。VAEを使うことで画像に展開できます。

ImageToImageやControlNetも、基本的にはLatent SpaceでUNETの左側に入ります。

UNetについて補足

UNETは元々は医用画像のセグメンテーションタスクのために想定されたが、多くの画像2-画像タスクに再利用されている。畳み込みエンコーダ（ダウンサンプリング）とデコーダ（アップサンプリング）を持つ。

マルチスケール、マルチ抽象レベルで変調を学習。

ReLU(Rectified Linear Unit)のことで、max(0, x)のような実装をする。Convolution層ではこの活性化関数を使うことが多い。

https://deepage.net/deep_learning/2016/11/07/convolutional_neural_network.html

https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/

画像生成AI Stable Diffusion スタートガイドより。

https://j.aicu.ai/SBXL

https://j.aicu.ai/SBXL

Originally published at https://note.com on May 30, 2024.

2024-05-30
AICU マガジン5月号アップデート！

AICU media 編集部の知山ことねです。
わかるAIを届ける、AICU マガジン5月号はもうお読みいただけましたか？特集の「次世代まんが制作術」が魅力の一冊となっております！

4月号に引き続き、今回も大幅アップデートを行いました。主にキャラ LoRA 制作が、現時点での保存版とも呼べる程の詳細な解説になっています。

この記事ではマガジンの紹介と、更新箇所のお知らせをします。パワーアップした AICU マガジン5月号をぜひお読みください！
購入はこちら https://j.aicu.ai/Mag2405

https://note.com/aicu/n/n61476a3fc852

https://j.aicu.ai/Mag2405

AICUマガジン5月号目次（最新版）

2024年5月29日時点での最新の目次です。

画像生成 AI で漫画を描こう！
この記事で必要なもの
漫画制作ステップ① アイビスペイントでコマを作ろう
キャンバスを用意する
コマを配置しよう
漫画制作ステップ② ネーム（下書き）を描こう
漫画制作ステップ③ 画像を生成しよう
キャラクターを生成しよう
背景を生成しよう
漫画制作ステップ④ 生成した画像を漫画に編集しよう
漫画制作ステップ⑤ フキダシを配置しよう
漫画制作ステップ⑥ 手描き文字を追加する
完成！

[キャラLoRA学習ガイド]デルタもんLoRAで学ぶLoRA制作！←Updated!
(1) データセットを用意しよう
データセットとは？
データセット作りのコツ
(2) Google Colaboratory で学習しよう
Colab notebook の用意
データセットの展開
学習の設定
(3) 生成した LoRA を回収しよう
生成してみよう！

りんりん倫理
Q1. 生成 AI は著作権違反なの？
Q2.「無断学習禁止」って何？
Q3. 生成 AI に関する法律はどこで調べればいいの？

編集コラム：生成AIクリエイターに必要なのは「自在性」
ようこそ！アイキュー部
今月の12星座占い

アップデート！「キャラLoRA制作ガイド」

今回アップデートしたのは、特集2つ目の「キャラLoRA制作ガイド」です。
第1版では、5月に行われたキャラLoRA制作ワークショップ（ https://ja.aicu.ai/event20240516/ ）の予習として、キャラLoRA用データセットの作り方をデルタもんの画像を用いて解説しました。
第2版となる今回は、データセットの作り方のみならず、学習に必要な Colab notebook の配布、使い方解説、学習時のモデルやパラメータ調整など、キャラLoRA制作に必要な情報を全て盛り込みました！

また、AICU 特製のデルタもんデータセットの配布も行っています。
期間限定で、ワークショップ「デルタもんLoRAを作ろう！」の録画も公開しています。
AICU のワークショップが気になる方や、実際の操作画面をチェックしたい方は要チェックです。

また漫画の解説では、動画を追加するなど、さらにわかりやすくなる工夫を凝らしました。

マガジンを読むと、こんなことができるようになります！

他にもアップデートにより、全体的に様々な補足情報が追加され、より親切でわかりやすいマガジンになりました。
もう第1版を読んでくださった方は、まためくってみて、新たな学びや発見を見つけてください。
まだ読んでいらっしゃらない方は、この機会にぜひ読んでみてくださいね！Kindle Unlimited で無料で読むことができます。

https://j.aicu.ai/Mag2405

次回のアップデート・次号リリースをお楽しみに！
AICU media をフォローして最新記事をお見逃しなく。記事のいいねとおすすめもお待ちしております！

Originally published at https://note.com on May 29, 2024.

2024-05-29