タグ: AI

  • 東大のHCI研究:Stable Diffusionを用いた写真内の情報秘匿技術

    東大のHCI研究:Stable Diffusionを用いた写真内の情報秘匿技術

    東京大学より 2024年5月14日に発信されたプレスリリースが興味深い画像生成AIに関する研究でしたので紹介いたします。
    コンピュータ・ヒューマン・インタラクションのトップカンファレンス「CHI 2024」に「 Examining Human Perception of Generative Content Replacement in Image Privacy Protection 」というタイトルで採択されております。

    拡散モデルを用いた写真内の情報秘匿技術

    発表のポイント
    ◆ 生成AI を用いた画像の生成的コンテンツ置換(GCR)法を開発し、秘匿しつつ画像の見た目と内容の両方を維持する加工手法を開発しました。
    ◆ 新たに開発された手法では、画像の全体的な内容とプライバシーに関係しうる部分を特定した上で、拡散モデルを用いて代替画像を生成し、元の画像に適応させることで、プライバシーを守りつつ画像の視覚的魅力を保持する革新的なアプローチを提供します。
    ◆ 本手法は、SNS での画像共有、プレゼンテーション、ビジュアルデザインなど写真の視覚的美しさが重要な場面への応用が見込まれています。

    本研究が提案する画像秘匿手法GCRによる秘匿加工例

    概要

    東京大学大学院工学系研究科電気系工学専攻の矢谷浩司准教授らのグループは、生成AIを用いた画像の生成的コンテンツ置換(GCR)法を開発し、秘匿しつつ画像の見た目と内容の両方を維持する加工手法を開発しました。画像の秘匿化は、SNSの普及により重要性が増しています。従来の秘匿化手法にはモザイクやぼかしがありますが、これらの方法は手間がかかり、しばしば秘匿が不十分であるだけでなく、画像の見た目や統一感を損なう問題がありました。開発された手法は、画像全体とプライバシーに関連しうる部分の内容を表現するテキストを生成し、それらから拡散モデルにより代替画像を生成し、元の画像に配置することで、プライバシー保護と視覚的美しさのバランスを実現する画期的な方法となっています。SNSでの画像共有やプレゼンテーション、ビジュアルデザインへの応用が期待されます。また、将来的には動画への応用や、より使用しやすいインタフェースの開発も進められています。

    発表内容

    画像の秘匿化は、画像の中に含まれているプライバシーに関係する情報を保護するために、大変重要な編集方法です。近年では画像のごく一部の情報から、撮影者の場所や属性が漏洩することが度々発生していますが、SNSなどの急速な普及により、そのような危険性を十分に理解しないまま、画像が一般に公開されていることも数多くあります。秘匿化を実現する既存の編集方法としては、モザイクやぼかし、あるいは絵文字などを重ねる、などがありますが、多くの場合ではユーザが直接編集を施す必要があるため、多くの手間を要したり、秘匿が十分でなかったりすることがあります。またこのような秘匿加工を施すと、元の画像から比べて見た目の美しさや統一感を損なってしまうことがあり、SNSなどでの共有を目的とする場合には好ましくないこともあります。

    この研究では、生成AI技術を用いてプライバシーに関係する情報を現実的な類似の代替物でシームレスに置き換える生成的コンテンツ置換(Generative Content Replacement, GCR)法を構築しました(図1)。この方法では、ユーザが加工を行いたい画像をシステムにアップロードします。システムはアップロードされた画像に対してBLIP-2モデル(注1)を用い、画像全体の内容を表現するようなテキストを生成します。さらに、DIPA(注2)と呼ばれる矢谷研究室が構築したデータセットにより提供されているマスク情報を用いて、画像内のプライバシーに関連しうる部分を抽出し、その部分の内容を表現するようなテキストを生成します。この2つのテキストをもとに、Stable diffusion(現在はバージョン2.1を使用)(注3)して、画像内のプライバシーに関連しうる部分に類似した代替画像を生成し、元画像上に配置することで、コンテンツの置換を行います。これにより、もと画像にあったプライバシーに関連しうる情報は秘匿化されながらも、画像の見た目や内容を維持することが可能となります。

    図1:GCRの処理フロー

    ユーザがアップロードした画像に対して、画像全体とプライバシーに関連しうる部分のテキストを生成し、それを元に画像内のプライバシーに関連しうる部分に類似した代替画像を生成し、元画像上に配置することで、コンテンツの置換を行います。

    図2に示す通り、ぼかし、カートゥーニング(画像の一部を非現実的な程度に強調する方法)、色塗り、除去(画像内の物体等を消し去り、背景で置き換える)、GCRの5つを比較したユーザ実験の結果、GCRによる秘匿加工では、画像内で加工が行われた場所を見つけ出すことが最も難しかったことが確認されました。また、他の秘匿加工手法と比較して、加工後の視覚的な調和が最も保たれていることも確認されました。元画像が持つストーリー性の維持に関しては、GCRはカートゥーニングよりも劣ったものの、プライバシー保護の強さにおいてはGCRが秀でており、GCRによる秘匿加工が、プライバシー保護と画像の視覚的美しさを両立しうる手法であることが確認されました。そのほか、GCRによる秘匿加工の一例を図3に示します。

    図2:秘匿加工方法の比較

    左から、元画像、ぼかし、カートゥーニング、色塗り、除去、GCR。

    図3:GCRによる秘匿加工の一例

    (上)後ろにいる男性を置換している。左が元画像、右が加工後の画像。(下)前面にある車は維持しつつ、背景にある車やナンバープレートを置換している。左が元画像、右が加工後の画像。

    この研究成果は、画像のプライバシー保護と有用性の両方が求められる応用において、実用的な生成AIの応用例を示すものです。SNSでの画像共有のほか、プレゼンテーションやビジュアルデザインへの応用も期待されます。将来への展望として、研究室では、一般的なユーザがより簡単にGCRを使用できるインタフェースを構築しているほか、動画への応用を検討しています。

    本研究はMicrosoft Research Asia D-CORE Program、および株式会社メルカリ R4Dとインクルーシブ工学連携研究機構との共同研究である価値交換工学の成果の一部です。

    発表者・研究者等情報

    東京大学大学院工学系研究科電気系工学専攻

    矢谷 浩司 准教授

    論文情報

    雑誌名: Proccedings of the ACM Conference on Human Factors in Computing Systems(CHI 2024)

    題 名: Examining Human Perception of Generative Content Replacement in Image Privacy Protection

    著者名: Anran Xu*, Shitao Fang, Huan Yang, Simo Hosio, and Koji Yatani*

    用語解説

    (注1)BLIP-2

    与えられた画像から情報を抽出し、画像を説明するテキストを生成するマルチモーダル学習技術をベースに構築された人工知能技術。

    (注2)DIPA

    矢谷研究室で構築した画像内においてプライバシーに関連しうる物体にアノテーションを施したデータセット。

    (注3)Stable Diffusion

    拡散モデルと呼ばれる確率的プロセスを用い、テキストの記述に基づいて画像を生成する人工知能技術。

    プレスリリース本文: PDFファイル

    Examining Human Perception of Generative Content Replacement in Image Privacy Protection | Proceedings of the CHI Conference on Human Factors in Computing Systems https://dl.acm.org/doi/10.1145/3613904.3642103

    https://dl.acm.org/doi/10.1145/3613904.3642103

    [MIT Technology Review] 生成AIを用いて画像内の情報を秘匿するシステム、東大が開発

    https://www.technologyreview.jp/n/2024/05/17/336549/

    東京大学によるプレスリリース
    https://www.t.u-tokyo.ac.jp/press/pr2024-05-14-002

    Originally published at https://note.com on May 24, 2024.

  • 技術書典16 AICU media 編集部の「これ欲しい!」紹介

    技術書典16 AICU media 編集部の「これ欲しい!」紹介

    つくる人をつくる、AICU media の知山ことねです。

    皆さん、#SD黄色本 「画像生成AI Stable Diffusionスタートガイド」はもう読まれましたか?
    ご存じの通り、AICU が3月に発売開始したStable Diffusion の体系的な教科書を目指して書かれています。

    実は、この書籍は技術書典15(2023年11月11日~2023年11月26日)で、9食委員さん、CEOしらいはかせ・852話さんで出版された「自分のLoRAを愛でる本」が底本になっています。

    ▶「自分のLoRAを愛でる本」 作:9食委員・しらいはかせ・852話

    インターネットで新鮮なAIの情報を得るのも大切ですが、たまには出版された書籍「技術書」で体系的に技術を学ぶことも勉強には必要ですよね。

    そこでこの記事では「最新の技術書が生まれる場所」、2024年5月25日 (土) 〜2024年6月9日(日)までオンラインで開催中 、5月26日(日) 池袋サンシャインシティにてオフライン開催される技術書典16 に先行して、味わい深い技術書の世界を知山ことね視点で紹介します。

    技術書典とは?

    技術書典は、テックベース合同会社が主催する、技術書のオンリーイベントです。オンラインマーケットとオフライン会場の双方で、新しい技術に出会えるお祭りを開催しています。2016年から年に2回ほど開催されており、Webサイトに登録しているユーザーは約37,000人、同人誌を制作・販売している出展者は1,000サークルにのぼります。(出典: エンジニア版コミケ「 #技術書典 」が来場者1万人超えのイベントに成長した軌跡 | アンドエンジニア (and-engineer.com))

    おすすめの書籍紹介!

    技術書典16は、オンライン、オフライン双方で展開しており、現在出品予定の書籍はオンラインマーケットで確認することができます。

    技術書典16 :技術書のオンラインマーケット開催中
    ここからAICU media 編集部が「これ欲しい!」「読んでみたい!」と思った書籍をピックアップしてご紹介します。皆様もぜひ確認して、一緒にわくわくしましょう!

    AI編

    情報処理 特集別刷「AI はクリエータになれるか」(2023 年 7 月号)(情報処理学会)

    情報処理 特集別刷「AI はクリエータになれるか」(2023 年 7 月号):情報処理学会

    生成AIとは、機械学習により大量のデータを学習し、学習結果から類似性を保ったまったく新しい人工物を生成するAI技術を指す。これまでのAIで難しいとされてきた、デザイン、広告、映画、音楽、文学、作曲といったクリエイティブな領域での活用が期待されている。本特集ではホットな生成AIを各分野の専門家の方々に「AIはクリエータになれるか」という観点から解説いただいた。
    0.編集にあたって(袖美樹子・吉村 剛)
    1.生成AIは我々の創造力をどのように変えていくのか?(栗原 聡)
    2.AI俳句─AI一茶くん─(山下倫央)
    3.生成言語モデルは創作者になれるか(船越孝太郎・奥村 学)
    4.AI絵師─イラスト自動生成AIの功罪─(金森由博)
    5.ファウンデーションモデルのさまざまな分野・モダリティでのビジネス応用─IBMでの取り組みの例─(倉田岳人・吉田一星・武田征士)
    6.音楽AIは創造性を高める(浜中雅俊) 編集室

    様々な専門家の方が、「AIにこれはできるのか?」という視点で意見や事例をまとめています。クリエイターを目指すAICU mediaの読者にとっては気になる内容なのではないでしょうか。

    生成AIで絵本を作ろう ChatGPT Plus/Midjourneyで始めるクリエーター生活(橄欖石庵)

    生成AIで絵本を作ろう ChatGPT Plus/Midjourneyで始めるクリエーター生活:橄欖石庵

    本書は生成AIを活用して絵本を作成する方法について説明しています。 本書で学べること 本書を読むことで、次のことについて学習できます。
    * 生成AIの活用方法
    * 生成AIによる絵本のストーリー検討方法
    * 生成AIによる絵本のイラスト作成方法 本書の想定読者 本書は次の方を対象として執筆しております。
    * 生成AIを使って絵本のストーリーを考えたい方
    * 生成AIを使って絵本のイラストを描きたい方
    * 生成AIを使って絵本を作りたい方

    midjourneyで絵本を作る本とのこと。水彩画のような可愛い表紙、思わずジャケ買いしたくなりますね…!

    動画編集、画像認識で自動化してみる。(味噌とんトロ定食)

    動画編集、画像認識で自動化してみる。:味噌とんトロ定食
    そこの社会人YouTuber! 動画編集大変じゃないですか? 画像認識で自動化しちゃいませんか? 本書ではポケモンソード・シールドのバトルにおけるコマンド選択画面をカットしたもの、通称バトルビデオを作成することを目標とします。

    そこの社会人YouTuber!
    動画編集大変じゃないですか?
    画像認識で自動化しちゃいませんか?

    本書ではポケモンソード・シールドのバトルにおけるコマンド選択画面をカットしたもの、通称バトルビデオを作成することを目標とします。
    画像認識で可能な限り自動化を行います。

    本書は YouTuber に憧れて動画編集にチャレンジしてみたものの、あまりにも編集作業に時間が掛かってしまいこのままでは YouTuber を続けられないといった経緯から、編集作業の内のカット編集を自動化した方法や知見が記載されています。本書ではプログラミングや画像処理といった内容が出てきますが、未経験の方でも問題無いよう記載することを心掛けています。

    プログラミング初心者・未経験者にもやさしい動画処理でYoutuberとして動画を編集する本。
    読んだらきっとYoutuberを始めたくなりますね!

    Diffusion Models 入門(ジンギスカン同盟)

    Diffusion Models 入門:ジンギスカン同盟
    本書は、Diffusion Modelsについて解説した本です。Denoising Diffusion Probabilistic Modelsをもとに理論の説明と実装を行います。

    本書は、Diffusion Modelsについて解説した本です。Denoising Diffusion Probabilistic Modelsをもとに理論の説明と実装を行います。Diffusion Modelsに興味がある人、実装を通して理解したい人向けの本です。流行技術を触ってみたものの、その詳細まではキャッチアップの時間が取れないという方も多いと思い、日本語による理論解説と最低限の実装を提供しようと本書を執筆しました。本書内のソースコードはGithubから取得できます。本書を読むにはPythonの基礎知識、PyTorchの基礎知識、統計学の知識が必要となります。

    第2版では誤記の修正および2023年5月のGoogle Colaboratory環境でのソースコードの動作検証を行いました。

    Stable Diffusion の Diffusion Models について解説された書籍。画像生成AIのテクニカルな面に興味のある方は楽しめそう。

    ライトニングトークがうまくなる本(RPACommunity)

    ライトニングトークがうまくなる本:RPACommunity
    自動化大好きなコミュニティ主催メンバーが語るライトニングトークのコツ!イベント回数は300回以上、ライトニングトーク登壇者は数百人、見てきたライトニングトーク登壇は1,000回以上!そこで得たライトニングトーク知見を語る本です!

    自動化大好きなコミュニティ主催メンバーが語るライトニングトークのコツ!イベント回数は300回以上、ライトニングトーク登壇者は数百人、見てきたライトニングトーク登壇は1,000回以上!そこで得たライトニングトーク知見を語る本です!

    AIに直接関係は薄いかもしれませんが、AIのイベントで頻繁に目にするライトニングトーク、経験のある方や「応募してみたい…」と思った方は多いのではないでしょうか?
    ライトニングトークに特化したプレゼン技法書は技術書典ならではのものなので注目です!

    その他編

    筆者知山が個人的に「買いたいっ!」と思った本です。

    宇宙世紀の統計学マニュアル Mk-Ⅱ(ひのまる呉服店)

    宇宙世紀の統計学マニュアル Mk-Ⅱ:ひのまる呉服店
    統計学の基礎を、「機動戦士ガンダム」等のアニメ作品を題材に解説しました。…

    統計学の基礎を、「機動戦士ガンダム」等のアニメ作品を題材に解説しました。 平均値と標準偏差から始まって、管理図/変動係数/一様分布と正規分布/分散の加法性/2変数の相関/記述統計と推測統計/母集団と標本/点推定と区間推定/推定と検定/平均値の差の検定/二項分布/ポアソン分布/抜き取り検査/サンプリング方法等について解説しており、これ一冊で統計学の基礎を全て理解することが可能です。
    今、統計学を学習している高校生、大学生、ビジネスマン、あるいはかつて学習したけど挫折した方に、強くお勧めいたします。

    統計学をとことんガンダムに絡めて解説しています。
    文章にガンダムへの熱意が込められていて、読んでいて面白い!
    ガンダム好きな人はすらすら内容が入ってきそうです。

    軌道上補給・軌道上修理概覧2018(帝都高速度衛星通信団)

    軌道上補給・軌道上修理概覧2018:帝都高速度衛星通信団

    宇宙にいる人工衛星への補給や修理を行なう時代になりました。メカです!ロボです!合体です!

    宇宙にいる人工衛星への補給や修理を行なう時代になりました。メカです!ロボです!合体です!
    世界の人工衛星技術はいよいよ宇宙にいる衛星への補給や修理を行うところまで来ました。アメリカの先進的なプロジェクトの他に中国やイスラエルのプロジェクトなどを総括的に紹介しています。宇宙好きの方、メカ好きの方、合体好きの方にお勧めです。
    <項目の紹介>
    ・ はじめに
    ・目次
    ・ 軌道上補給
    ・軌道上修理について
    ・ 各国動向
    ・ スペースシステムズロラール
    ・ Restore-L
    ・ RSGS
    ・ ノースロップグラマン
    ・ MEV
    ・ MEP
    ・ MRV
    ・ 中国 OMEV
    ・ 英国 エフェクティブスペース

    紹介文の「メカです!ロボです!合体です!」の力強さが最高です。
    軌道上補給、着眼点が面白い…!

    あんまりAIに関係あるラインナップじゃなくてすみません、しかも旧刊が多かった…!

    AICU マガジンもよろしくお願いします!

    技術書典での学びと一緒に、Kindle で販売中の AICU マガジンもぜひご覧ください!

    5月号では AIを使用した漫画制作、4月号では Stable Diffusion のWeb UI、 AUTOMATIC1111 を大特集しています!

    AICU マガジン Vol.2 2024年5月号 次世代まんが制作術!
    AICU magazine Vol.1 2024年4月号

    この記事に「いいね!」と思ったら、ぜひいいねとnoteのフォローよろしくお願いします!

  • メンバーシップに新たなプランが誕生!報酬ありレポーター募集開始

    メンバーシップに新たなプランが誕生!報酬ありレポーター募集開始

    「つくる人をつくる」 AICU media の noteメンバーシップに、新たなプランが誕生しました。また、既存のプランもアップデートし、さらにAI時代のクリエイターを応援する取り組みとして改善を続けています。

    この記事では、新規追加・アップデート内容をお知らせします。

    <アップデート>AI用語集ライターに「レポーター報酬」追加

    現在の「 AI用語集ライター」プランでは、メンバーシップに加入している皆さんでAI用語集を作るプロジェクトを実施しています。AIに関する単語(現在投稿されている例: Stable Video Diffusion、 Stability Matrix など)を解説や論文とともに投稿していただくと、それが用語集に組み込まれていくというシステムです。
    ご投稿いただいた方には明確な基準に基づき報酬も支払われます。

    今回のアップデートでは、それに加え、オンラインイベントを中心にレポート活動を行える「 レポーター報酬制度 」を導入しました。

    以下は 「みんなでつくるAI用語集」プラン加入者の note の掲示板「AI用語集ライター」に掲示された概要 です。

    noteでのイベントレポート記事の取材をお願いできるオンラインレポーターさんを募集します。 例えば以下のようなオンラインイベントの記事起こしをお願いします。

    ■出来上がった記事の例 「生成AIなんでも展示会」運営レポート
    https://note.com/aicu/n/n44ad7b02f175

    【イベントアーカイブ記事の寄稿ガイドライン】
    ・謝礼:イベント終了から1日以内の納品で3000円相当の謝礼(Amazonギフト券を予定しています)以後、終了後24時間を超えるごとに500円の減少(翌日2500円、2日後2000円、3日後1500円、4日後1000円、5日後500円、以後は報酬をお支払いできません)

    ・メリット:オンライン・オフラインのイベント参加をレポートすると、謝礼がもらえます。ご自身のセルフブランディングにも有効です。

    ・「このイベントのレポ書きたいでます!」を宣言して、お使いのGoogle DocsのURLを、本掲示板([[AI用語集ライターONLY]イベントレポーター募集]( https://note.com/aicu/membership/boards )へお伝え下さい。

    ・主催者側へ確認や依頼が必要な場合は公開前に編集部から連絡を取ります。連絡先メールアドレス、氏名、依頼や確認したいことを伝える文も添えてください。

    ・イベント主催者のガイドラインとして『撮影・録音・SNS禁止』などが明記されている場合は取材対象にはなりません。

    ・寄稿として、基本的にはAICU編集部に著作権をお譲りいただく形になります。レビューやリライト、修正などは編集部で対応することになりますが、上記の例にあるようにライターとしての草稿をご提供いただいた方のお名前や記名記事を原稿にご記載いただいても構いません。

    ✨️「AICUのライターです」を名乗る条件については別途定めがあります(ライター契約にご同意いただく形になります)。本プランへの参加+レポーターとしてのクラスが上がった方々に個別に打診させていただきます。

    🚫「このイベントをレポートしたいのですが」というご相談も歓迎です。ですが、編集部としての判断と予算があってのご依頼になります。参加費の支出なども編集部としての判断に準じます。
    ご質問も歓迎です。

    https://note.com/aicu/membership/boards/61ab0aa9374e/posts/e7597507f835?from=self

    AICU media のイベントレポーターとして、オンラインイベントを中心にイベントを取材し、レポート記事を書いていただくという内容です。例えば、即日レポートを提出していただけると、謝礼として3000円分のアマゾンギフトカードをお支払いします。

    ご自身の実績づくりやブランディングにも有効です。レポーターとして活動してくださる方は、掲示板のコメント欄にご応募お願いいたします。質問も受け付けていますので、ぜひ、 こちらのスレッドでご相談ください。

    <新メンバーシップ>漫画制作のための画像生成AI

    新メンバーシップは、漫画クリエイターの方、また漫画クリエイターを目指す方に向けた、漫画制作をAIで応援するメンバーシップとなっています。

    プロフェッショナルな漫画製作のための画像生成AI技術や関連ツール活用技術に加えて、サンプルデータなどを[漫画製作メンバー特典マガジン]で提供します。

    また、 TwitterDMやDiscordでのAICUクリエイティブチームへの個別相談も可能 です。以下、プランに加入するとできることの詳細です。

    ・Discordでのご相談(申請)
    ・TwitterDMでのご相談
    ・メンバー限定の会員証が発行されます
    ・活動期間に応じたバッジを表示
    ・メンバー限定掲示板を閲覧できます
    ・メンバー特典記事を閲覧できます
    ・メンバー特典マガジンを閲覧できます

    AICU: AI Creators Union|AICU media

    生成AIクリエイターユニオン『AICU: AI Creators …

    note.com

    こちらのプランで購読することのできる記事の例としては、「 漫画制作に適したモデルは?Animagine 3.1 vs Animagine 3.0 徹底比較! 」のように漫画制作の際に使用すべきツールを解説した記事や、

    漫画制作に適したモデルは?Animagine 3.1 vs Animagine 3.0 徹底比較!|AICU media

    4月に入り、X や kindle インディーズで AI で漫画を見かける機会が増えてきました。最近のイラスト系画像生成 AI では、漫画が流行の兆しを見せてきているようです。 参考:SD黄色本 書籍[画像生成AI Stable…

    note.com

    「 アイビスペイントで作る!Animagineでの漫画製作テクニック 」シリーズのように、既存の漫画の作り方を解説しつつ、そこにどう画像生成AIを組み込んでいくかの解説記事などを予定しています。

    アイビスペイントで作る!Animagineでの漫画製作テクニック(2)レイヤー編|AICU media

    前回の記事「アイビスペイントで作る!Animagineでの漫画製作テクニック(1)トーン調整」では、「AI…

    note.com

    ぜひこちらのリンクからご確認、ご加入ください。
    皆様のクリエイターとしてのキャリアを応援できることをお待ちしております。

    AICU: AI Creators Union|AICU media

    生成AIクリエイターユニオン『AICU: AI Creators …

    note.com

    すでにメンバーシップに加入してくださっている方はこの機会を生かし、AIクリエイターとしての腕をさらに磨いていただきたいと思います。まだメンバーシップに加入していない方も、この機会を逃さずに加入し、一緒にクリエイターとして高め合っていく仲間を見つけていただけると幸いです。

    また、わかるAIを届ける電子マガジン「AICU マガジン」でもクリエイターに向けたAIの最新情報や画像生成テクニック、イベント情報などを発信中です。Kindle Unlimited に加入されている方は無料ですので、ぜひご確認ください。

    Amazon.co.jp: AICU Media 編集部: Kindleストア

    Kindleストア の優れたセレクションでオンラインショッピング。

    j.aicu.ai

    読者さんのフィードバックも楽しみにしております!

    以上、AICU mediaからのお知らせでした。

    Originally published at https://note.com on May 23, 2024.

  • Google ColabでのAUTOMATIC1111 xformers関連の不具合と解決方法について(2024/5/22)

    Google ColabでのAUTOMATIC1111 xformers関連の不具合と解決方法について(2024/5/22)

    「生成AI時代に つくる人をつくる」AICUの しらいはかせ です。
    ご高評いただいております「画像生成AI Stable Diffusion スタートガイド」
    (通称 #SD黄色本 )掲載の主要なプログラム(SBXL1SBXL2)につきまして、編集部が本日、Google ColabでのAUTOMATIC1111において不具合を発見いたしましたので、本日、解説とともに修正を実施いたしました。

    【現象1】SD1.5系でGradioURLが表示されない

    p47 【Start Stable-Diffusion】のセルを実行時 WARNING[XFORMERS]: xFormers can’t load C++/CUDA extensions. xFormers was built for: PyTorch 2.2.1+cu121 with CUDA 1201 (you have 2.3.0+cu121) Python 3.10.13 (you have 3.10.12) Please reinstall xformers というエラーが出てURLも表示されず完了しません。

    読者の方からも同様のご報告を頂いております(SBクリエイティブさんありがとうございます)。

    【現象2】起動には成功するが画像生成に失敗する

    「Generate」ボタンを押すと以下のようなエラー表示されます。

    AUTOMATIC1111側にはこちらのエラーが表示されています

    NotImplementedError: No operator found for `memory_efficient_attention_forward` with inputs:
    query : shape=(1, 4096, 1, 512) (torch.float32)
    key : shape=(1, 4096, 1, 512) (torch.float32)
    value : shape=(1, 4096, 1, 512) (torch.float32)
    attn_bias : <class 'NoneType'>
    p : 0.0
    `decoderF` is not supported because:
    max(query.shape[-1] != value.shape[-1]) > 128
    xFormers wasn't build with CUDA support
    attn_bias type is <class 'NoneType'>
    operator wasn't built - see `python -m xformers.info` for more info
    `flshattF@0.0.0` is not supported because:
    max(query.shape[-1] != value.shape[-1]) > 256
    xFormers wasn't build with CUDA support
    requires device with capability > (8, 0) but your GPU has capability (7, 5) (too old)
    dtype=torch.float32 (supported: {torch.bfloat16, torch.float16})
    operator wasn't built - see `python -m xformers.info` for more info
    `cutlassF` is not supported because:
    xFormers wasn't build with CUDA support
    operator wasn't built - see `python -m xformers.info` for more info
    `smallkF` is not supported because:
    max(query.shape[-1] != value.shape[-1]) > 32
    xFormers wasn't build with CUDA support
    operator wasn't built - see `python -m xformers.info` for more info
    unsupported embed per head: 512

    ChatGPTによるログと日本語解説はこちら

    https://chatgpt.com/share/41ae4cbb-74ce-4e72-8851-42d1698f8bf0

    なお、xFormersとは、Facebook Research (Meta)がオープンソースソフトウェアとして公開しているPyTorchベースのライブラリで、Transformersの研究を加速するために開発されたものです。xFormersは、NVIDIAのGPUでのみ動作します。NVIDIAのGPUを演算基盤として動作させるためのCUDAやそのビルド時のバージョンをしっかり管理する必要があります。
    https://github.com/facebookresearch/xformers

    【関連】PyTorchとCUDAバージョンエラーの警告について

    実はPyTorchとCUDAバージョンエラーの警告も出ています。

    PyTorch 2.2.1+cu121 with CUDA 1201 (you have 2.3.0+cu121)
    Python 3.10.13 (you have 3.10.12)

    AUTOMATIC1111のインストールマニュアルによると
    https://github.com/AUTOMATIC1111/stable-diffusion-webui

    Install Python 3.10.6 (Newer version of Python does not support torch), checking “Add Python to PATH”.
    Python 3.10.6をインストールし、”Add Python to PATH “をチェックする。

    とありますが、実際にGoogle Colab上でデフォルトで動作しているPythonは現在、Python 3.10.12です(!python — version で確認できます)。
    Python3.10.6が推奨なので、だいぶ後続のバージョンを使っていることになります。この問題はGoogle Colab上でのPythonのメジャーバージョンに関する問題で、関係はありますが、文末で解説します。

    AICU版の原作となったTheLastBenさんのリポジトリでも同様の問題がレポートされています。

    Xformers Google Colab ERROR · Issue #2836 · TheLastBen/fast-stable-diffusion

    Getting Error in the last cell during the launch: WARNING[XFORMERS]: xFormers can’t load C++/CUDA extensions. xFormers…

    github.com

    Google Colabが xformers や JAX といった関連ライブラリを更新してしまうことが問題の根幹でもありますので不具合報告を Google Colab 側にも入れておきます。

    Python and xformers version conflict · Issue #4590 · googlecolab/colabtools

    Describe the current behavior I’m Google Colab Pro+ user and using TheLastBen’s Automatic1111 (A1111) frequently…

    github.com

    【解決】とりいそぎの回避方法

    Start Stable-Diffusionの手前にセルを追加して、以下のコードを入れて実行してください。これで問題の xformersをアンインストールし、解決したバージョンの xformers を再インストールできます。

    #@markdown ### xformers の再インストール(v20240522)
    !python --version
    !yes | pip uninstall xformers
    !pip install xformers

    この「xformers 0.0.26.post1」がインストールされていれば、問題なく動作するはずです。

    【補足】Google ColabのPythonはいつまで現行のバージョン3.10.xなのか

    ところで、いい機会なので Google Colab上でのPythonはいつまで現行のバージョンなのか、調べてみました。実は2024年4月にPython自体のメジャーバージョンアップが予定されているようです。
    https://colab.google/articles/py3.10

    colab.google

    Colab Updated to Python 3.10 With the upgrade to Python 3.10, it brings Colab into alignment with the cadence of final…

    colab.google

    Python 3.10 へのアップグレードにより、Colab はPython バージョン最終的な定期的なバグ修正リリースペースに合わせられます。 Python の次のバージョン (3.11) は、2024 年 4 月に最終的な定期バグ修正リリースが予定されています。

    最終リリースとなる Python3.11.9 は2024年4月2日にリリースされているので、実はもういつ移行してもおかしくない時期なんですね…これはAUTOMATIC1111ユーザーにとってはたいへん重要なアップデートとなります。いきなり使えなくなるのは困るのでGoogle Colab上での切り替えも用意されると良いですね…。
    Google Colab上での賢い方法を期待しつつ、さいごにPythonのメジャーバージョンのロードマップをチェックしておきましょう。

    https://devguide.python.org/versions

    Status of Python versions

    The main branch is currently the future Python 3.13, and is the only branch that accepts new features. The latest…

    devguide.python.org

    Python3.10は2026年中、Python3.11は2027年に終了(end-of-life ; EOL)が宣言されています。

    AICU Inc.は生成AI時代のつくる人をつくるとともに、オープンソースソフトウェアや日本語コミュニティへの貢献を常に行っています。

    書籍なのに最新のオープンソースソフトウェアがアップデートされる、
    新感覚の画像生成AIの教科書「画像生成AI Stable Diffusion スタートガイド」の購入はこちらから! https://j.aicu.ai/SBXL

    書籍[画像生成AI Stable Diffusionスタートガイド] – つくる人をつくる AICU Inc.
    著者:AICU media、白井 暁彦 発売日:2024年3月29日(金) ISBN:978-4-8156-2456-9サイズ:B5判 ページ数:224定価:2,640円(本体2,400円+10%税) 画像生成AIの1つであるStable…

    ja.aicu.ai

    Originally published at https://note.com on May 22, 2024.

  • 最先端のWeb3と音楽生成AIのプレイヤーに会う「AI Beats Lounge Vol.1」イベント参加レポート

    最先端のWeb3と音楽生成AIのプレイヤーに会う「AI Beats Lounge Vol.1」イベント参加レポート

    2024年5月20日に開催されたAI Beats Lounge Vol.1 は、音楽とAIの融合をテーマにしたイベントです。音楽制作にAIを活用するツールや世界のアーティストの考え方について最前線の事例が紹介され、参加者が実際に体験できる魅力的なプログラムが満載でした。Web3とAIと音楽の交差点には才能あふれる女性プレイヤーもたくさんいらっしゃいました。現場よりレポートをお送りします。

    https://note.com/aicu/n/n83d8cb1f774b

    「AI Beats Lounge Vol.1」イベント概要

    • 日付と時間: 2024年5月20日 (月) 18:30–22:00
    • 場所: Crypto Lounge GOX, 新宿区, 東京
    • 詳細はLuMaにて https://lu.ma/btlxtu5q

    ゲストスピーカーによる音楽生成AI活用事例

    音楽とAIの最前線で活躍するゲストスピーカーによる活用事例の紹介。

    Shinya:パーソナルコンテンツのAI動画化

    Shinya / @clabon40: 会場であるGoxLoungeの関係者。T2WEB株式会社代表、音楽AIを活用した作曲に夢中な社会人。
    実はミュージシャンでもあるそうで、娘さんの幼稚園卒業、友達の新居引っ越し祝いなど、非常に身近なパーソナルコンテンツとSunoの活用事例3連発を紹介いただきました。

    ※撮影できる内容ではなかったので残念ながら割愛します

    実はこのイベントはAICUのイベントACT3がきっかけだったそうです!

    明日はAICU Creators Talk3 (ACT3) の開催です! 登壇者紹介・申し込みはいますぐ!|AICU media

    AICU 代表の白井暁彦 (@o_ob)です 明日はAICU Creators Talk3 (ACT3) の開催です! ついに明日、製品発表会です! 登壇やパートナークリエイターの方々が揃い、タイムテーブルが更新されました。…

    note.com

    MISOSHITA:何を最終版とするかは人が決める。完成を決める感性が大事。

    @Misositaworks: テクノロジー&カルチャーを探求するクリエーター

    MISOSHITA:何を最終版とするかは人が決める。完成を決める感性が大事。

    実演:ステム分離

    MISOSHITAさんのおすすめ動画とともに、11年ぶりにメジャーアップデートされた「LogicPro」のアップデートで実装されたAI機能を解説。

    AYAME:生成AIは「音楽のコラージュ」

    AYAME / @aym2m V系バンド「摩天楼オペラ」のキーボーディスト、京都情報大学院大学客員教授

    『AIに全部残して、おかしんでいこうかなとおもいます!』

    発表17分で未発表作品の披露が…!素敵です…!

    Jun Fukunaga: 人間の創造性や作曲能力の拡張。音楽業界でAI否定する人は少ない。

    Jun Fukunaga / @LadyCitizen69: 幅広いジャンルで活動するフリーランスライター・インタビュワー

    非常に深い示唆にとんだ、世界のアーティストの声をお届けします。

    Suno AIStable Audioudio

    良い結果を得るためには経験や知識が必要。

    人間の創造性や作曲能力の拡張。

    フランスのアーティスト「ジャスティス」のインタビューが印象的。
    マルセル・デュシャンの「泉」の例なども出てきました。

    Justice (band) – Wikipedia

    Justice is a French electronic music duo consisting of Gaspard Augé and Xavier de Rosnay. Justice is known for…

    en.wikipedia.org

    LLM開発の面白さ,ゼロから頂点までを一気に学んだ! #WandB |AICU media

    AICUメディアコミュニケーション事業部のKotoneです! 今回の記事では、Fully Connected Tokyo 2023というWeights and Biases社さん(ウェイツ・アンド・バイアスィズ…

    note.com

    音楽業界でAI否定する人は少ない。
    一方で「Stop Devaluing Music」、AIによってアーティストの価値を下げる行為に対する反対も起きている。

    200+ Artists Urge Tech Platforms: Stop Devaluing Music

    Click here to join the movement!

    artistrightsnow.medium.com

    参加型AI作曲体験

    参加者から1フレーズずつ歌詞をもらい、その場でAIを使って曲を作成します。これは参加者全員が楽曲制作のプロセスをリアルタイムで体験できる貴重な機会です。

    参加者AI作曲コンテスト

    Discordにて応募し、イベント当日に優勝者を発表します。優勝者にはAmazonギフト券3,000円分が贈られます。

    お題は「九九の歌」。
    様々な作品の中から1作品が選ばれました。他の作品もすごかった!

    MISOSHITA: 第一回コンテストはこちらのYTR-334Sさんの作品が大賞に決まりました!おめでとうございます。
    選考理由としては楽曲のクオリティが高く、九九の歌の既存イメージとは大きく違う新たな世界観を提示し、キャッチーさも同時に感じられる点です。

    名前:YTR-334S「九九 一の段のうた」
    作品について:シンフォニックメロディアスメタルに。

    九九 一の段のうた by @ytr334s | Suno

    symphonic melodious metal song. Listen and make your own with Suno.

    suno.com

    YTR-334Sさん

    YTR-334Sさんの受賞の言葉:
    ありがとうございます!SUNOいじってほんの数日でしたが、リアルイベントめっさ楽しかったです!!これからもAIと仲良くしていきたいです😊

    音楽AIのクリエイターさんたちは元気な女性たちでした

    YTR-334Sさんはじめとして、多くの元気な女性が目立つコミュニティでした。これからもSunoやStable Audioの使い手がどんどん増えていきそうですね。

    撮影許可いただきました。山形のお土産も頂いちゃいました!

    【AI Beats Lounge】音楽×AI専用コミュニティDiscord

    https://discord.com/invite/bYhHwgUEQT

    X.comでの感想戦

    Suno使ってみたくなりました

    AI×音楽のイベント AI beats lounge Vol.1 ありがとうございました! 参加者は決して多く無かったですが、一人一人の熱量がありかなりディープな最前線の内容ではあったのではないでしょうか。 何でもここから始まっていくというフェーズが1番面白いですね

    イベントで話された内容物凄く簡単にまとめると ・AI楽曲のプライベートミュージック活用の可能性 ・クリエイターはAI楽曲一発生成から一歩進んで複数AIツール活用して楽曲の編集/改変を試し始めてる ・技術は置き換え可能だが、センスや感性は現状ではAIで置き換えづらくより重視される方向

    https://x.com/o_ob/status/1792558479401738448

    https://x.com/clabon40/status/1792561212489945301

    Suno

    Suno is building a future where anyone can make great music.

    suno.com

    https://www.stableaudio.com

    生成AI作家による世界に向けた動画リールを開発

    AICU Inc.のプレスリリース(2024年3月21日 07時10分)生成AI作家による世界に向けた動画リールを開発

    prtimes.jp

    Originally published at https://note.com on May 21, 2024.

  • 日報を画像生成でバエさせる #10分で学べるAI

    日報を画像生成でバエさせる #10分で学べるAI

    新企画「#10分で学べるAI」

    「つくる人をつくる」AICU新人ライターのNaruです。初の原稿となる今回は、Stability AIが提供しているStable Diffusion 3 APIを用いた画像生成ついて、忙しいビジネスパーソンがめっちゃ使えそうなテクニックを #10分で学べるAI というシリーズで紹介していきたいと思います。

    今すぐ終業、でもバエる絵が見つからない…。

    「提案書や日報にバエる、インパクトがある画像がほしいな…」と思ったこと、ありませんか?でもライセンスフリーの画像検索では画像的にも著作権的に微妙…有料のストックフォトを日報に使うなんて予算がない…そんなあなたに送る、画像生成テクニックです。

    <設定>新入社員のSくん
    新人研修ももうすぐ終わり…毎日の日報もネタがつきてきました。今すぐスライドのトップページに16:9の画像を付け足して、BOSSに送りつけて帰宅したい…!でも検索しても検索してもバエる絵が見つからない…!

    ふと某ChatGPT 4oさんにお願いしてみました。
    「今日の日報に使える16:9のバエる画像がほしい」

    うーん、ちょっと、微妙すぎやしませんか。ここは日本ですし。

    ちなみに今日は飛び込み営業で、 日焼けした27歳の元気なスタートアップ企業の社長さんにお会いしました。というレポートしたいので、そんな感じの絵を作りたかったのです。

    そしてBOSSから注文が入りました。

    「今日の日付を入れて」

    いま16時30分ですよ?

    出来上がった画像がこれです。

    念の為、ソースコードへのリンクがあったので確認してみました。

    from PIL import Image, ImageDraw, ImageFont
    import matplotlib.font_manager as fm
    
    # Load the image
    image_path = "/mnt/data/A_vibrant,_eye-catching_image_for_a_daily_report,_.png"
    image = Image.open(image_path)
    
    # Define the date text
    date_text = "2024年5月20日"
    
    # Get a font
    # Using a default font as an example
    font_path = fm.findSystemFonts(fontpaths=None, fontext='ttf')[0]
    font = ImageFont.truetype(font_path, 40)
    
    # Initialize ImageDraw
    draw = ImageDraw.Draw(image)
    
    # Define the text position and color
    text_position = (image.width - 300, image.height - 70)
    text_color = (255, 255, 255)  # White color
    
    # Add the date text to the image
    draw.text(text_position, date_text, font=font, fill=text_color)
    
    # Save the edited image
    output_path = "/mnt/data/A_vibrant_image_with_date.png"
    image.save(output_path)
    
    output_path

    ちがう!僕がやりたいのはこういうことじゃない…!

    僕が作りたいのは、こういうインパクトがある絵です。

    ギラッギラです

    ギラッギラなカバーアートでぜひともBOSSに読んでもらいたい!
    ですが、
    必要な知識は AICU media の過去記事だけで十分でした。
    非エンジニアでも大丈夫、コーディングはゼロ、絵心もゼロです。
    さて作っていきましょう。

    必要なもの

    • Google Colab(無料アカウントでOK)
    • Stability AI のアカウント

    Stability AIのアカウントを持っていない人は https://platform.stability.ai/ にアクセスすると作成できます。

    右上からアカウントを作成できます

    セットアップしよう

    APIキーを取得する

    まずはGoogle Colabで呼び出すためのAPIキーを用意しましょう。

    https://platform.stability.ai/account/keys

    https://platform.stability.ai/account/keys にアクセスするとAPIの管理画面に行くことができます。

    ここでAPIキーを発行できます

    右上にあるCreate API Key というボタンを押すと新しくAPIキーが発行されます。
    なおAPIの呼び出しにはクレジットを使うので不足した人は適宜追加をしてください。

    クレジットはDreamStudioと共通です。10ドルは僕の時給よりも安いです。

    Colabでプログラムを実行する

    今回は実行に必要なPythonコードをアナタのために限定で用意しました。
    日本語解説付きです。

    https://colab.research.google.com/drive/1mc1iQyIDT7FTO74SWcGqqHItUr9nkIC8?usp=sharing

    GitHubは こちら ✨️現在はGitHubに バグ があるのでひと手間あります。

    このColabを開いたら、まずは「ドライブにコピー」のボタンを押してからはじめのコードを▶を押して実行しましょう。

    ドライブにコピーをお忘れなく
    これで必要なライブラリをインポートできます

    次のコードを実行して、取得したAPIキーを入力します。

    実行すると入力画面が現れます

    最後のコードで画像生成の機能を準備します。

    モデルをColab上に用意しないので非常に速いです

    これで画像を生成する準備ができました!


    実際に生成してみよう

    いよいよ画像の生成に取り掛かります。
    下にスクロールするとプロンプトの入力画面があるので[prompt]に生成したい画像を入力し、実行します。

    ここまで正しくできていれば ▶ を押すたびに画像が生成されます。

    文字までしっかりと生成されました!
    ※日本語はまだ書けないっぽいです。

    さて日報のカバーイラスト作っていきます

    ここまでの部分は何度でも再利用できます。
    今日の日報も明日の日報も今週末の日報も、これでイケるって寸法です。

    今日の飛び込み営業で体験した日焼けした27歳の元気なスタートアップ企業の社長さんというレポートにふさわしいカバーイラストを作りましょう。

    [Prompt]にプロンプトを入力しますが、英語で入力する必要があります。
    ここは大人しくDeepLを使いましょう、早く退勤しないとなので。

    https://www.deepl.com/ja/translator/l/ja/en-US

    日報の表紙イラスト、日焼けした27歳の元気な日本人社長のマンガ。右下に「5/20th」の文字。

    Cover illustration of the daily bulletin, a manga of a Japanese president tanned, energetic 27-year-old man, With the words “May/20th” in the lower right corner.

    prompt: Cover illustration of the daily bulletin, a manga of a Japanese president tanned, energetic 27-year-old man, With the words “May/20th” in the lower right corner.

    negative_prompt: NSFW

    aspect_ratio: 16:9

    output_format: png

    こんな感じに入力して▶を押します。

    気に入る画像になるまで、何度でも押しましょう。数秒で生成されます。
    SD3は実写も綺麗ですが、イラストレーションとか漫画も得意です。
    美少女っぽいのもめちゃ良いですが、オジサンが好きそうな絵も作れます。

    どやっ!

    どやっ!

    ちょうどイメージぴったりです!
    このカバーアートに続くレポートの本文にはもちろん、この若くて何か大きなことをしでかしそうな社長さんへの提案が記載されています。
    きっとBOSSも興味を持って読んでくれることでしょう!

    明日からはこの[Prompt]を書き換えるだけです!やったぜ

    10分でできましたか?

    今回はここで終わります。また次回もぜひ読んでください!

    なおStable Diffusion 3 APIの技術詳細についてはこちらで紹介しているのでぜひ読んでくださいね~。

    https://note.com/aicu/n/n838bf71a361f

    https://note.com/aicu/n/ne2fe8a0073b0


    ✨️以上のように業務で仕事でパッと使える画像生成を社内やサービスに導入したい、使いこなせる社員をパッと育成したい!そんな需要がございましたら sai@aicu.ai までどうぞご相談ください。

    本記事が面白かったら、ぜひシェアをよろしくお願いいたします!
    社内Slack等のシェアでも歓迎です。
    また「こんな記事欲しい」といったリクエストがございましたら X@AICUai までメンションやDMでいただければ幸いです。

    AICU Inc.は Stability AI 公式パートナーです。
    様々なアプリ開発のご相談も承っております!

    https://corp.aicu.ai/ja/stability-ai

    https://corp.aicu.ai/ja/stability-ai-membership

    Originally published at https://note.com on May 20, 2024.

  • 参加者とともに「音楽×AI」の活用法を考えるイベント「AI Beats Lounge Vol.1」開催!

    参加者とともに「音楽×AI」の活用法を考えるイベント「AI Beats Lounge Vol.1」開催!


    AI Beats Lounge Vol.1 は、音楽とAIの融合をテーマにした革新的なイベントです。音楽制作にAIを活用する最前線の事例を紹介し、参加者が実際に体験できる魅力的なプログラムが満載です。そして参加するとNFTがもらえる!?

    イベント詳細

    • 日付と時間: 2024年5月20日 (月) 18:30–22:00
    • 場所: Crypto Lounge GOX, 新宿区, 東京
    • 参加費: 2,500円 (税込) — ビールやお酒の飲み放題付き
    • チケット購入: Stripeで事前にお支払いください(GOXPRO会員は参加無料)
    • 本イベントの詳細はLuMaにて https://lu.ma/btlxtu5q

    プログラム内容

    1. セッション

    • 音楽とAIの最前線で活躍するゲストスピーカーによる活用事例の紹介。登壇者は以下の通りです:
    • Jun Fukunaga / @LadyCitizen69: 幅広いジャンルで活動するフリーランスライター・インタビュワー
    • Shinya / @clabon40: T2WEB株式会社代表、音楽AIを活用した作曲に夢中な社会人ミュージシャン
    • MISOSHITA / @Misositaworks: テクノロジー&カルチャーを探求するクリエーター
    • AYAME / @aym2m: V系バンド摩天楼オペラのキーボーディスト、京都情報大学院大学客員教授

    2. 参加型AI作曲体験

    • 参加者から1フレーズずつ歌詞をもらい、その場でAIを使って曲を作成します。これは参加者全員が楽曲制作のプロセスをリアルタイムで体験できる貴重な機会です。

    3. 参加者AI作曲コンテスト

    • Discordにて応募し、イベント当日に優勝者を発表します。優勝者にはAmazonギフト券3,000円分が贈られます。

    4. ネットワーキング

    • イベントの最後には参加者同士の交流を深めるネットワーキングタイムも用意されています。​

    【AI Beats Lounge】音楽×AI専用コミュニティ
    https://discord.com/invite/bYhHwgUEQT

    AI Beats Lounge Vol.1 · Luma
    🤖音楽×AI🤖「AI Beats Lounge」 前線コアユーザーによる活用事例を大公開 参加者とともに「音楽×AI」の活用法を考えるイベント 🎟️Ticket: 2,500円(税込) └🍺ビールやお酒 飲み放題付き 📅…lu.ma

    参加登録がおもしろい!

    歌詞1フレーズとプロンプトの指示、そしてウォレットアドレスを登録すると来場記念NFTがもらえるそうです。CryptoLoungeGOXらしい演出です!

    登壇者のツイートから

    イベントのレポートがここに追加されるかも…?

    AICUがGOXで開催した過去のイベントはこちら

    [3/13開催予定]AIクリエイターギルド@歌舞伎町GOX #AICU_ACT3
    AICU Creators Talk3 2024/3/3のイベント情報をお届けします。AIクリエイターギルド歌舞伎町GOX…corp.aicu.ai

    AICU Creators Talk 3 がCrypto Lounge GOX で開催されました! #AICU_ACT3|AICU media
    つくる人をつくる! AICU media の知山ことねです。 2024年3月13日(水)、第3回 AICU Creators Talk「AICU Creators Guild」を新宿歌舞伎町にある「Crypto Lounge…note.com


    Originally published at https://note.com on May 19, 2024.

  • Stability AI が Discordで利用できる多機能メディア生成サービス「Stable Artisan」をリリース!早速試してみた

    Stability AI が Discordで利用できる多機能メディア生成サービス「Stable Artisan」をリリース!早速試してみた


    Stability AI が Discordで利用できる多機能メディア生成サービス「Stable Artisan」をリリース!早速試してみた

    Stable Artisanとは? Discord内で高品質の画像や動画を生成・編集できるDiscordボットです。Stable Diffusion 3、Stable Video Diffusion、Stable Image Coreのパワーを活用しています。

    登録・利用はこちら https://stability.ai/stable-artisan

    メディア生成に加え、Stable Artisanには、検索と置換、背景の削除、クリエイティブ・アップスケール、アウトペインティングなど、作品を編集するためのツールが用意されています。

    使い方は簡単、/dreamコマンドで。

    まず、 https://stability.ai/stable-artisan でアカウントを作成し、artisan-1、artisan-2、artisan-3、artisan-4、artisan-5 のいずれかのチャンネルにアクセスして、/dream を使って制作を始めてください

    チャンネルの中で、入力できるチャンネルを探してください。
    (たとえば artisan-2 が利用できました)

    スラッシュコマンド「/dream」と入力すると、こんな感じにオプションが表示されます。
    ・プロンプト
    ・ネガティブプロンプト
    ・縦横比
    ・モデル(コアモデルとSD3が選べます)
    ・シード指定
    ・画像生成枚数
    不要な要素は省略して構いません!

    気になる料金は

    スラッシュコマンド「/credits」で確認できます。

    今月は 1/200 のクレジットが残っています。 Stability Artisan 機能のクレジットレート: 
    Image Core 3 SD3 6.5 Creative Upscale 25 Search & Replace 4 Outpaint 4 Remove Background 2 Sketch Control 3 Structure Control 3 Video 20
     Info クレジットは、成功した個々の生成ごとに計算されます。 たとえば、/image を使用して 2 つの画像を取得した場合、2x 3、つまり合計 6 クレジットを使用します。 これはまた、生成に失敗した場合(エラーや自動フィルタリングなどによる)、失敗した生成分のクレジットが返金されることを意味します。

    Platform APIサービスの詳細については、こちらをご覧ください: https://platform.stability.ai/docs/getting-started/stable-image

    もし行き詰まったら、Artisanチャンネルで/helpを使えば、Stable Artisanの使い方についてより詳しいヘルプが得られます

    関連:Stable Assistantと間違えないように…

    4月にリリースされたStable Assistantと間違えないようにしましょう。

    間違って登録したプランをキャンセルするには?

    ウェブサイト(https://assistant.stability.ai/login)からアカウントにログインし、メールアドレスの頭文字が表示されている右上のボタンをクリックします。 次に、”Manage Subscription “をクリックし、右上の “Cancel plan “をクリックします。 “プランのキャンセル “をクリックしてキャンセルを確定します。

    利用規定

    利用規約はこちら https://stability.ai/terms-of-use

    それでは、良い作品作りを!
    https://youtu.be/MWfb30kWqTM


    Originally published at https://note.com on May 9, 2024.

  • AI の価値は「技術」にあらず?トークセッション「AIファースト時代の広告代理店のマネタイズ戦略を考える」#Web3BB

    AI の価値は「技術」にあらず?トークセッション「AIファースト時代の広告代理店のマネタイズ戦略を考える」#Web3BB

    2024年4月25日、26日に国立新美術館で開催された Web3 AIマーケティングBB(Beyond Borders)は、東京と米国シリコンバレーに法人をもつ Pivot Tokyo が主催・運営する、最先端テクノロジーとマーケティングの融合を探求するイベントです。

    Day1 のレポートはこちら

    Day2 に開催されたNVIDIA基調講演はこちら

    この記事では、Day2 の 11:00 ごろから行われたセッション、
    「AIファースト時代の広告代理店のマネタイズ戦略を考える」
    にて、AIファースト時代の広告代理店が実際にどのような試行錯誤をしているか、興味深い議論が交わされた様子をレポートしていきます。

    画像

    写真右から
    [モデレーター]  小山 隼司 (社長執行役員CEO, アドイノベーション株式会社)
    山田 翔(代表取締役, 株式会社アドウェイズ)
    柴山 大(Hakuhodo DY ONE / 博報堂テクノロジーズ執行役員)
    山内 大輔(代表取締役, 株式会社 ID Cruise)

    トークセッションは、以下のトピックに沿って進みました。

    画像

    トピック1: 正直、AI 活用フルで出来てますか?

    小山(アドイノベーション) – では、「正直、AI 活用フルで出来てますか?」のテーマから始めましょうか。
    私の会社ではまだまだ通常業務での AI フル活用はできていないと感じるのですが、お三方はいかがでしょうか?

    柴山(博報堂) – 博報堂では業務にかなり AI を組み込んでいます。
    検索連動型広告ってすごく量が多いじゃないですか。ビッグワードやミドルワードに対してそれぞれ広告を入れる。AI なしには運用できないですね。
    やっぱり人間が書いた方が情緒に溢れてるんですけど、クリック数が多いキャッチコピーはAIの方が良く知っているんです。
    カスタマージャーニーやペルソナも AI が企画しています。社内では年間 2000 ~ 3000 ペルソナが生み出されています。欠かせない存在ですね。

    小山 – では、業務効率もかなり上がっているんですね?

    柴山 – そうですね。暇になるわけではありませんが、ペルソナを作る際に、資料をみながら考える時間がかなり減りました。

    小山 – ありがとうございます。山田さん(アドウェイズ)はメディア事業も行われていますが、その点いかがですか?

    山田(アドウェイズ)– まだ横断した組織を作れておらず、AI のフル活用はできていないですね。
    それぞれの部署で AI は使用していて、ぺルソナ作りやブランディングには使用しています。業務の効率化、標準化は進みましたが、AI によって新たな価値が生まれるところまでには至っていません。現在は各部門の AI が得意な人を集めて、中央集権的に仕組みを作ろうとしています。

    小山 – ありがとうございます。山内さん(ID Cruise)は AI 開発を行っているので、やはり業務でも AI を活用されているんですか?

    山内(ID Cruise)– そうですね、コードを書く作業は ChatGPT を活用しています。エンジニアの業務削減にはなっていますが、活用できるかどうかはアイデア次第ですね。

    トピック2 : AI 時代の広告代理店の価値

    小山 – これから AI に強い代理店が必要になっていったり、効率化により1人で代理店が経営できる世界になるかもしれません。またデータの質も重視されるようになると思います。数年後まで見た時、代理店は何を求められるのでしょうか?

    山田 – 運用型広告はAIにとってかわられ、販売代理店などはしんどくなるのではないかと感じています。
    顧客のマーケットをどれだけ広げられるかが伸びるかどうかの分岐点なので、そこにどれだけ AI を活用できるかが勝負です。従来の広告代理店の、人数に頼った運営をできるだけ早く脱却しなくてはいけません。

    小山 – なるほど。柴山さんはどうですか?

    柴山 – AI はマーケターというよりオペレーターですよね。代理店の価値はマーケターを増やすことだと考えています。
    マーケターの教育は人間がやらなければいけないことで、大きなコストがかかる。その質を担保するのが代理店の役割になると思います。
    また、新しいメディアを横断的に運用、情報収集することは代理店の仕事ですね。
    これからの AI は集合知が加速するだろうことに注目が必要です。

    小山 – 難しいところですよね。データが少ない代理店はゲームや EC など専門分野に特化するしかなくなるとは思いつつ、クライアントの要望を見極めることも重要ですね。
    山内さんは開発者として問い合わせが多く来ると思いますが、どういった要望が多いのですか?

    山内 – そうですね、広告運用だけでなく、会社やクライアントを巻き込み売り上げを上げるための商流などをふまえて、売り上げ向上の手伝いを求められるようになりましたね。

    トピック3 : 広告主側のメリット、ニーズ

    小山 – 最近は「生成 AI で楽ができるのは代理店だけ」という意見を聞くことがあり、クライアントにが生成 AI でどのような利益を得られるのか説明が必要なシーンがあります。皆さんは業務に AI を使用することを顧客にどう説明していますか。

    山田 – 私は、AI がどこでどう使われているかは説明する必要がないと思っています。商品自体の価値が大切かと。
    ただ、「このデータは AI が分析しました」のように説得力をアピールすれば、気難しいお客さんの説得材料として有用ですね。

    トピック4 : AI 活性化による脅威

    小山 – Google が生成 AI を活用、制作しているなど、生成 AI によって代理店の仕事が脅かされる懸念があるのではないかと思います。皆さんは AI 活性化による脅威をどう捉えていますか?

    柴山 – ほとんどないんじゃないですかね。Google は広告のことを良く知っていますが、OpenAI は「いい広告」のデータを入手できない。
    僕は彼らのことをパートナーとして考えています。技術や自社の情報を組み合わせて新たな機会をつくれそうです。

    小山 – ありがとうございます。山田さんいかがですか?

    山田 – 広告プラットフォームはセルサイドなので、どう売るかという視点で AI を作ってきます。でも代理店はバイサイドなので、プラットフォームを横断してどう買うかという目線でものをつくります。なので全く違うものであることは生成 AI が活性化してもかわらないと思います。
    しかし少し前まで AI は使わなくても良かったのですが、今はもう「やらなくてはいけないもの」になりました。波に乗らないことが大きな脅威ですね。

    トピック5 : AI でのマネタイズ

    小山 – 自分は AI 単体でのマネタイズは難しいと思っていて、価値提供の仕方が大切だと思っています。皆様事例や考え方はありますか?

    柴山 – おっしゃる通り、 AI ツール単体で売るのは超劣等種なんですよね。OpenAI のおかげで安く全員キャッチアップできるので、ツール紹介は代理店としてはありえないです。
    しかし、ツールを使ったうえでどのような判断をするか、何を選択するか、AB テストのようなものはマネタイズできると思います。

    小山 – ありがとうございます。山内さんは開発したものを売っている立場からみていかがですか?

    山内 – AIツールの需要はありますね。また、依頼時に手数料の一部でバナーを制作するといった悪い慣習をなくしたいです。まだ課題が残りますね。

    小山 – ありがとうございます。アドウェイズさんは今後のマネタイズ戦略などありますか?

    山田 – 先ほども触れましたが、現在代理店用の内部システムを開発中で、プラットフォームの提供などを進めたいです。中身の一部が AI になるという形で価値を提供したいですね。

    小山 – ありがとうございました。まだまだお話したいところではありますが、時間が来てしまったので、今回のセッションは終了させていただきます。ありがとうございました。

    (拍手)

    取材後の AICU media の感想

    皆さんの意見が、「AI 技術自体ではなく、それをどう活用するかが価値で、マネタイズすべき箇所」というところで一致していたことが印象深かったです。すごい AI 技術を「すごい」で終わりにせず、セルサイド、バイサイドでみて、何に使用すると価値が生じるかを考え、売ることが AI 時代のマネタイズだと感じました。

    引き続き2日目の講演のレポートを行っていきます!

    Day1 のレポートはこちら

    Day2 に開催されたNVIDIA基調講演はこちら

  • AI Marketing BB東京 Day1レポート – CivitaiのエクゼクティブプロデューサーMatty Shimuraの基調講演 #Web3BB

    AI Marketing BB東京 Day1レポート – CivitaiのエクゼクティブプロデューサーMatty Shimuraの基調講演 #Web3BB

    AI Marketing BB とは

    AIマーケティングBB(Beyond Borders)は、東京と米国シリコンバレーに法人をもつ Pivot Tokyo が主催・運営する、最先端テクノロジーとマーケティングの融合を探求するイベントです。

    また、AIがマーケティングにもたらす革新を追求し、参加者がその変革に積極的に関与し、ビジネスに活かすための知識やアイデアを共有する場ともなっています。
    イベント公式サイト→https://web3bb2024.pivot-tokyo.com/

    このサミットは、年間3回の定期的な開催を通じて、国内外の最新トレンドや事例を紹介し、参加者が自社の事業に生かす機会を提供しています。2024年4月の春開催では、AIとマーケティングに焦点を当てたセミナーやワークショップ型のゼミ講座が予定されています。

    さらに、リスキリングや新年度に伴う新しいチームの研修、新しいパートナーとの出会いをサポートする場でもあります。

    参加者が自らの成長とビジネスの展望を広げるためのプラットフォームとして位置づけられています。BBサミットは、AIとマーケティングの未来を共に創造するために、皆さんの積極的な参加を呼びかけています。

    カンファレンス責任者からのメッセージ

    河野 友香 Yuka Kawano AI&Marketing BB ディレクター

    これまでエージェンシー、事業主側と双方でマーケティングに数十年携わってきました。日本企業と外資系企業を経験しましたが、目の前のKPIに追われる日々を送っていました。日本のマーケティングの現状と未来を考えた時、危機感が芽生えました。務めていた会社を辞め、何か業界変革に携わることがしたいと独立し、BBチームへ参画しました。マーケティングに特化したカンファレンスを立ち上げ、今の日本のマーケティングを根本から変えたい。実践の場にいたからこそわかる課題感などを反映して実践的なプログラムを提供したい。そう思って作っています。「このままで良いのだろうか?」と少しでも感じている方にぜひご参加いただきたいです。
    皆さんも、私と一緒に日本のマーケティングを変えていきませんか?

    河野 友香さん 開催にあたって-カンファレンス責任者からのメッセージ 
    https://web3bb2024.pivot-tokyo.com/

    参加予定企業(一部紹介)

    株式会社セブン&アイ・ホールディングス/野村アセットマネジメント株式会社/ルイ・ヴィトン ジャパン株式会社/日本生命保険相互会社/パナソニック コネクト株式会社/味の素株式会社/株式会社ベネッセホールディングス/ヤンマーホールディングス株式会社/株式会社ファンケル/株式会社リクルート/カシオ計算機株式会社/良品計画/J.フロント リテイリング株式会社/エスエス製薬株式会社/株式会社フェリシモ/株式会社コーセー/株式会社オートバックスセブン/株式会社そごう・西武/(株)三陽商会/SBCマーケティング株式会社/トヨタ自動車/パーソルキャリア株式会社/株式会社ベルーナ/資生堂インタラクティブビューティー株式会社/雪印メグミルク株式会社/株式会社ジャパネットメディアエージェンシー/日本空港ビルデング/日本アイ・ビー・エム/株式会社マネーフォワード/ソニーマーケティング株式会社/森永乳業株式会社/マネーフォワード/ビザワールドワイドジャパン/エヌビディア合同会社/三井住友海上火災保険株式会社/LVMH モエ ヘネシー・ルイ ヴィトン・ジャパン合同会社/エン・ジャパン株式会社/ヤマハ株式会社/日本生命保険相互会社/積水化学工業株式会社/株式会社ポーラ/TSI Holdings/ソフトバンク株式会社/富士通株式会社/TSI Holdings/株式会社ニトリホールディングス/トヨタ自動車株式会社/武田薬品工業株式会社/コスモ石油マーケティング株式会社/株式会社講談社 (52社)

    Day1 プログラム

    13:30~13:40 オープニングリマークス サマリー

    13:40~14:10 [M-1] オープニングキーノート:世界アクセストップ10 Civitaiのプロデューサー初来日!AIは次世代のクリエイティブをどう変革するのか? サマリー

    14:10~14:40

    • [M-2]【公式】オープニングキーノート:Generative AIの世界では何が起こっているのか。産業実装における現在と未来。 サマリー
    • [AI-1] カスタマーサービス・オートメーションの未来:生成AI活用によるCX向上の挑戦 サマリー
    • [WS-1] AIガバナンスと倫理的視点のチェックリスト サマリー

    14:50~15:20

    • [M-3] 多様性の時代における、経済学を使った顧客理解とプライシング サマリー
    • [AI-2]【公式】ディスカッション:AIとImmersiveテクノロジーの融合による新しいコミュニケーションデザインの可能性 サマリー
    • [WS-2] ゼミ講座概論 いまさら聞けないAI基礎知識 「AI進化の最前線:人工知能(AI)とは?従来型AIから生成AI、AGIまで」Powered by 日本ディープラーニング協会 サマリー

    15:20~15:50

    • [M-4] CMOが考えるAI時代のマーケティング戦略の成功の鍵とは? サマリー
    • [AI-3] リテールAI研究会プレゼンツ:日本のリテーラーの課題とAI革命への道筋 サマリー
    • [WS-3] スペシャルゼミ講座:AIトレンド総復習 グラフと動画で一気に理解する生成AI サマリー

    16:00~16:30

    16:30-17:00

    • [M-6] 「AIとメディアの未来:ブランドセーフティな生成AIコンテンツの可能性と課題」 サマリー
    • [AI-5]生成AI旋風によるゲームチェンジ。企業経営の常識はどう変わるか サマリー
    • [WS- 5] AIデジタル生産性協会 プレゼンツ AI教育コンサルタントが活用法をレクチャー!マーケターが業務で使えるGPTs&ツール事例紹介 サマリー

    17:00 – 17:30

    • [M-7] [クロージングキーノート] 味の素のマーケティング改革における生成AIの活用 サマリー

    18:00 – 20:00【公式ネットワーキングパーティー】

    セッション抜粋紹介

    世界アクセストップ10 Civitaiのプロデューサー初来日!AIは次世代のクリエイティブをどう変革するのか?

    このセッションでは、クリエイティブ産業におけるAIの変革的役割を探ります。AIは人間の創造性を補完し、新たな可能性のためのコラボレーションを促進することができるのか?著作権や偏見といった倫理的な問題にも触れ、責任あるAIの利用を提唱します。AIと人間の創造性が相乗効果を発揮し、イノベーションを生み出す未来を描くには?
    [スピーカー] Matty Shimura (Executive Producer of AI Film and TV, Civitai)
    [M] 三浦 謙太郎(創業者兼 CEO, DouZen, Inc)

    Civitaiのプロデューサー初来日です!

    画像

    Shimura氏は日系のお名前ですが、日本語はわからないそうで、コンピュータ生成による不思議な感覚の音声合成が披露されました。

    最後の部分が非常に印象的でしたので紹介します。
    「どのツールが 長期的に最適な ソリューションになるかは誰 にもわからないと。ツールに関係なくインパクトを 生み出せる ことが今後 ますます 重要になる だろう。その上で、AI が人間の創造性を代替するので はなく、どのように普及できるかを考えてみて欲しい。映画・テレビ・マーケティング キャンペーンなどでは使用されるテクノロジーにかかわらず、その背後には常に優れたアイデアが必要だ。アーティストとなくして芸術 は なく 、人々が共感するこメッセージがなければ、聴衆はいないでしょう。」

    ・米国シリコンバレーから世界アクセストップ10にランクインしている
    ・ギルドと組合を中心としたマーケティングメディア。
    ・特に著作権に関しては。
    ・ギーク・エコノミーではなく、こういった新しいタイプのキャリアで人々が給料を得られているか?
    ・多くのA.I.企業は、雇用がどのように変わるかについて話していますが、実際の解決策を提示していない。
    ・コミュニティ・イニシアチブ、インキュベーター・プログラム、アーティスト・イン・レジデンス・プログラムを通じて、Civitaiは、これらのツールを実際に使って、仕事の流れに適用し、価値を見出すことができるように、人々に資金を提供する方法を証明しようとしている
    ・やろうとしているのは、A Iリソース、ワークフロー、教育、アート処理を作成できるプラットフォームを提供することで、クリエイティブなプロセスを民主化することです。
    ・将来的には、このような難しいスキルの多くはそれほど重要ではなくなり、最高のアイデアを持つ人が最高のアウトプットを出せるようになると思います。
    ・テレビ番組を見る方法や、映画館で映画を見る方法、スマホでソーシャルメディアコンテンツを見る方法など、参入障壁を下げると同時に誰でも素晴らしいストーリーを作れるようになったら、どうなるんでしょうね。
    ・しかし、それはまた、次のレベルを解き放つことができるよう、トップの人たちを後押しするのです。つまり、それがあなたのアイデアであり、ストーリーテリングなのです。

    三浦氏:Matty Shimura氏はアーティスト出身だそうですが、クリエイティブなコミュニティに入ってくる若い人たちや、エグゼクティブの人たちに対して、どんなアドバイスがありますか。

    ・若い人たち、特に今学校で伝統的な映画制作のプロセスを学んでいるクリエイターたちにとっては。授業で学んでいる道具が、毎日、リリースから時代遅れにされているというのは、チャレンジだと思います。そして、紙にペンで書くという技術から、創作という行為、そしてそのプロセスを人間らしくすることができるように、それを再構築しなければならない方法があると思います。そうすれば、より多くの採用につながると思います。

    ・知財保有者であれ、クリエイティブ・エージェンシーであれ、プロダクションのワークフローにA.I.を統合しようと考えている企業のための管理について教えてください。たとえプロダクションで使うつもりがないとしても、投資を始める時期が来ていると思います。ですから、特に変化に対してオープンマインドでいられることだと思います。それが私のおすすめです。

    そして最後にもう一つ、A rvrnft暗号のバブルがありました。しかし、私たちがこの半年ですでに目にした価値は、それがここにとどまり、さらに良くなっていることを示していると思います。ですから、今、統合できることは、私のプレゼンテーションにおいて、将来的に多くの見返りをもたらすでしょう。

    APAC地域だけでなく、欧米全土にローカライズすることで、言葉や文化の障壁のためにリーチできなかった、まったく新しいオーディエンスや市場層にリーチすることができます。

    AICU mediaからの質問:有料プランを導入でどのような判断があったのでしょうか。

    以前は無料の世代がありましたが、今は独自のバズエコノミーがあります。モデルやLoRAなど、すべてのリソースの世代を作るために使えるクレジットは、誰でもこれらのツールにアクセスできるように、無料で提供しています。そして将来的には、みんなが集まり、仕事を共有し、コミュニケーションやコミュニティを持てるような「タウンスクエア」になろうとしています。モデルやツールは無料で利用できるのですね。サブスクリプションについて、人々は何にお金を払っているのでしょうか?これらの画像を作るのに必要な計算能力の生成時間や、電気代などです。

    Day2のレポートに続きます!