タグ: 白井暁彦

  • AICU代表 しらいはかせ がAIアートバトル「AIBATO」にて優勝! 作品とAICU開発技術を公開解説 [期間限定メンバーシップ先行]

    AICU Inc./AICU Japan株式会社 代表 白井暁彦(aka しらいはかせ/AICU編集長/Dr.Hakase:以下「しらいはかせ編集長」)が、AI人工知能EXPO内で開催された「AIアートバトル」チャンピオンシップ決勝に4人のファイナリストとして選出。Stable Diffusion部門で初代優勝を勝ち取りました。

    AICU media編集部は、しらいはかせ編集長の個人クリエイターとしての活動は、(業務に支障がない限り)他の所属クリエイター同様、個人活動として平らに尊重して扱っております。改めておめでとうございます。

    画像
    https://x.com/o_ob/status/1859883395855384816

    本稿では開催概要にあわせて、決勝での作品について紹介し、AICUがこれまで開発に関わってきた技術とともに公開解説いたします。

    AIBATO (AIアートバトル) イベント概要

    https://prtimes.jp/main/html/rd/p/000000006.000147393.html

    主催: 株式会社LimerenceAI
    イベント名: AIBATO (アイバト) – 国内初*のオフラインAIアートバトル
    *注: 国内初の「オフラインAIアートバトル」として (2024年8月時点、株式会社LimerenceAI調べ)

    公式サイト: https://aiartbattle.jp/

    イベントの目的: クリエイターとAIの融合による新しい芸術表現の開拓、AIクリエイターの発掘・支援。

    ポイント:

    • 国内初のオフラインで開催されるAIアートバトル。
    • MidjourneyとStable Diffusion、それぞれでチャンピオンが決定。
    • 著名なクリエイターやAI業界関係者が審査員を務める。
    • 予選はポートフォリオ審査、決勝はリアルタイムのバトル形式。

    開催日時:
    2024年11月21日(木): チャンピオンシップ決勝 (Midjourney使用)
    2024年11月22日(金): チャンピオンシップ決勝 (Stable Diffusion使用)

    開催場所: 幕張メッセ NexTech Week 2024 (AI・人工知能 EXPO) 内 LimerenceAIブース

    審査員:

    • 木下健太郎 (THE FIRST TAKE 映像プロデューサー)
    • 佐藤カズー (TBWA HAKUHODO CCO)
    • 平久江勤 (TBWA HAKUHODO プロデューサー)
    • 元木大介 (KandaQuantum 代表取締役社長)
    • 本田崇人 (株式会社メロン 共同代表CTO)
    • マドカ・ジャスミン (タレント、KandaQuantum CMO)
    • Hakushi (ShiftAI AIクリエイティブ講師)

    大会MC: トンピ (eスポーツキャスター)

    画像
    https://x.com/AI_Marika1018/status/1859923877369168212

    競技形式

    • 予選 (作品選考): ポートフォリオによる審査。MidjourneyとStable Diffusionそれぞれ8名が決勝進出。
    • チャンピオンシップ決勝 (リアルイベント): 主催者からのお題に基づき、制限時間内に画像生成。シングルエリミネーション方式。

    使用ツール: Midjourney, Stable Diffusion


    しらいはかせ本人の個人ブログにて手記が公開されております

    準備編

    https://note.com/o_ob/n/n3ed4cc5266c1

    予習編

    https://note.com/o_ob/n/ndf85d8b24d46

    実況編

    https://note.com/o_ob/n/nf7a760746933


    [PR]使用された技術について

    使用された画像生成テクノロジーにつきましては大会レギュレーションに基づき、多くはAICUメディア編集部より発行されております以下の技術群によって構成されています。

    GPU不要で利用できるAUTOMATIC1111学習のための教科書
    「画像生成AI Stable Diffusionスタートガイド」(SBクリエイティブ刊)

    https://j.aicu.ai/SBXL

    Stability AI APIに関する日本語の情報発信(note無料マガジン)

    Stability AI Fan!|AICU media

    https://note.com/aicu/m/m6000f560d1db

    AICUマガジン Vol.5特集「Stability AI Forever!」

    https://j.aicu.ai/MagV5

    「CGWORLD vol.315」画像生成AIによる表紙メイキング、大公開。
    #デジタルハリウッド30周年 記念寄稿

    上記の原稿はAICU Magazine Vol.6特集「エンターテインメントxAI」に収録されております。 https://j.aicu.ai/MagV6

    Google ColabとGoogle Slidseを使った再現性の高い絵作り技術についてはこちらの記事「#10分で学べるAI」が関連あります。

    https://note.com/aicu/n/n4fcc8c200569

    AICUマガジン5月号「次世代まんが制作術!」に収録されております

    https://j.aicu.ai/Mag2405

    Coloso「生成AIクリエイティブ AICU」シリーズ

    Stability AI API、Google Slides、Google Colabを使った画作りについて短時間で実用的な技術を学ぶことができます。

    ■「超入門:Stable Diffusionではじめる画像生成AI」

    https://j.aicu.ai/coloso1

    ■「初級者:広告企画から動画制作までのプロセス」

    https://j.aicu.ai/coloso2

    ■「ComfyUIマスター:カスタムノードとアプリ開発」

    https://j.aicu.ai/coloso3

    詳細なテクニックにつきましては今後も、AICUマガジンにて特集を組んで紹介予定です。

    https://j.aicu.ai/mag

    「つくる人をつくる・わかるAIを伝える」
    AICU media https://note.com/aicu

    チャンピオンシップ決勝での作品

    しらいはかせのコメントや実際に使われたプロンプトとともに、期間限定メンバーシップ向け先行でお送りします。


    ウォーミングアップ編

    当日のMCが前日のMidJourney部門の報告を行うタイミングや、第1試合が実施されている傍らでリアルタイム生成した画像はこちらになります。

    画像
    正確な文字盤を持った目覚まし時計と、ベッドで横たわる青年
    “prompt”: “photorealistic, detailed, highly detailed, alarm clock with accurate dial, young man lying on bed, bedroom scene, realistic lighting and shadows”, “negativePrompt”: “blurred, blurry, out of focus, low quality, distorted, disfigured, deformed, mutilated, extra limbs, poorly drawn, bad anatomy, bad proportions, ugly, monstrous, mutation, mutant, extra body parts, extra heads, extra faces, extra arms, extra legs, extra hands, extra feet, extra fingers, extra toes, malformed hands, malformed feet, malformed legs, malformed arms, malformed digits, malformed limbs, malformed face, malformed body, malformed proportions, poorly rendered, poorly rendered face, poorly rendered hands, poorly rendered body, poorly rendered proportions, artifacts, errors, defects, low resolution, text, watermark, signature, username, logo, ui, hud, bad quality”
    画像
    “prompt”: “photorealistic, highly detailed, young girl, squinting, blinded by bright flash, dazzled, overwhelmed, dramatic lighting, dynamic pose, intense expression, detailed facial features, detailed eyes, detailed hair, intricate clothing”, “negativePrompt”: “blurred, blurry, out of focus, low quality, distorted, disfigured, deformed, mutilated, extra limbs, poorly drawn, bad anatomy, bad proportions, ugly, monstrous, mutation, mutant, extra body parts, extra heads, extra faces, extra arms, extra legs, extra hands, extra feet, extra fingers, extra toes, malformed hands, malformed feet, malformed legs, malformed arms, malformed digits, malformed limbs, malformed face, malformed body, malformed proportions, poorly rendered, poorly rendered face, poorly rendered hands, poorly rendered body, poorly rendered proportions, artifacts, errors, defects, low resolution, text, watermark, signature, username, logo, ui, hud, bad quality”
    画像
    “prompt”: “movie poster, intense, gripping, thrilling, action, suspense, drama, security, robust, impenetrable, fortress, stronghold, armored, shielded, protected, guarded, cinematic, photorealistic, highly detailed, dynamic composition, dramatic lighting, bold typography”, “negativePrompt”: “blurred, blurry, out of focus, low quality, distorted, disfigured, deformed, mutilated, extra limbs, poorly drawn, bad anatomy, bad proportions, ugly, monstrous, mutation, mutant, extra body parts, extra heads, extra faces, extra arms, extra legs, extra hands, extra feet, extra fingers, extra toes, malformed hands, malformed feet, malformed legs, malformed arms, malformed digits, malformed limbs, malformed face, malformed body, malformed proportions, poorly rendered, poorly rendered face, poorly rendered hands, poorly rendered body, poorly rendered proportions, artifacts, errors, defects, low resolution, text, watermark, signature, username, logo, ui, hud, bad quality”

    まず、これらの非常に長いプロンプトを英語で表現する上で、シードやモデルとともに一貫性を維持するため、プロンプトエンジンとしてAWSを利用した自社開発のシステムを運用しております。

    ベースになっているシステムはAWSが公開しているオープンソースでのGenUであり、AWS 生成 AI 実用化推進プログラムの協力もあり、実用レベルでの実証実験を行っております。

    例えば、AICUが実施を担当している、神奈川県「ともいきメタバース講習会プロジェクト」でも障害者むけワークショップでiPad等で利用されており、以下の書籍でも報告されております。

    ■メタバースとAIで「ともに生きる」を実装する本 ~ 神奈川県の障害福祉現場で開発してみた!(技術書典17:DHGS_CAIL デジハリ大学院「クリエイティブAIラボ」)

    https://techbookfest.org/product/2wMwe21GnNdPPpQeby4Dc9?productVariantID=pD8wVXcUzd5zcvXRwH122L

    ネット環境やPC、GPU環境が乏しい環境においても安定して日本語でStable Diffusion XLを用いた画像生成が行える環境になります。構築についてのご相談はAICU AIDX Labまでお問い合わせください。

    画像

    さらに続きます。
    上記のプロンプトエンジンは、あくまでベースモデルとなるStable Diffusion XL (SDXL)での生成となります。このプロンプトをベースに複数のモデルにおいて、適した画像を生成していく方針になります。またSDXLは2023年6月に公開されたモデルであり、ベースモデルとしてオープンに公開されており、また光の表現や構図構成力、解像度などはSD1.5系とは一線を画すレベルですが、指の表現や人物・人種の偏りには難があります。またメモリ消費が大きくローカルGPUでの複数モデル同時利用は現実的ではありません。そのため、近年公開されたSD3系のモデルを複数並列してAPIを経由して利用します。

    例えばGoogle ColabやGoogle Slides、Windowsのバッチファイルなど、ありとあらゆるインタフェースやツールを使い、並列して再現性高く評価していきます。また同様に、SD3だけでなく、SD3.5やFlux、またそのLoRAなども並列して評価を行っています。

    Shot1テーマ: ”息が止まる”

    画像
    “prompt”: “manga, comic panel, underwater scene, swimmer, holding breath, intense gaze, blue water, bubbles, athletic body, dynamic pose, comic shading, manga line art”, “negativePrompt”: “blurry, low quality, watermarks, text, logos, inappropriate content, explicit nudity, gore, violence”,

    例えばこちらは、Google Slidesでのテストです。

    画像

    Google Driveに生成された中間生成群です。

    画像

    もともと「AIバリエーション広告」(AICU用語で制御高く広告のバリエーションを生成するテクニック、またAIでスタイルを制御しながらA/Bテストなどを準備して入稿するところまでを指すこともあります)のためにStability AIさんの協力でAICUが開発したものです。

    実際にお手元のGoogle Slidesでお使いいただけるリンクも紹介します。

    第2テーマは「最新AIツールの広告」

    作品「AI代供養に出資しませんか?」、こちらは上記の手法で、Google Slides上でできています。「実況編」にあるとおり、主催の平田茉莉花さんの「AI仏壇」をテーマにキャッチコピーとビジュアルコンセプトを考えたものですが、Google Slidesなので文字のタイプセットやフォント、装飾などもスタイリッシュにテンプレートを作り込むことができます。

    画像
    “prompt”: “futuristic buddhist altar, money printing, stacks of cash, blonde short-haired businesswoman, black suit, tight skirt, boots, slick advertising, unethical business practices, ai technology”, “negativePrompt”: “blurry, low quality, watermarks, text, logos, offensive content, illegal activities, extreme views, hate symbols, religious insensitivity, sexualized imagery, inappropriate elements”,
    画像
    Style used: digital-art Prompt=futuristic buddhist altar, money printing, stacks of cash, blonde short-haired businesswoman, black suit, tight skirt, boots, slick advertising, unethical business practices, ai technology NP=NSFW, worst quality, ugry, blurry, low quality, watermarks, text, logos, offensive content, illegal activities, extreme views, hate symbols, religious insensitivity, sexualized imagery, inappropriate elements

    処理としても、プロンプトを設定してから数十枚の画像の結果を見るまで、他の処理系や評価に集中できるので、確実に短い時間で、確実に品質の高いアウトプットを、確実に制御性高く出力することができます。

    画像

    このGoogle Slidesを使ったツール内部はGoogle Apps Scriptで書かれており、一番最初のスライド上の各テキストオブジェクトにプロンプトやパラメータを設定するという風変わりなツールになっています。
    これは画像生成AI時代の「ガトリング砲」のような手法であり、プロフェッショナルな画像生成案件において培われたノウハウでもあります。

    決勝Shot1お題は「ニルヴァーナ」

    作品「魑魅魍魎曼陀羅」です。同様の手法で作られていますが、仕上げの段階が異なってきます。

    画像
    画像
    画像
    画像
    画像
    画像
    画像

    AICU-Stability-AdGenerator を使った絵作りの利点として、スライド上での評価が高速に行える点があります。写真を比較して差分を確認して、より良い広告を作るためのノウハウは先に述べたとおりですが、表情やスタイルの違いを横断的に評価できます。またレイアウトも自由に検討できます。
    さらにバッチ処理の待ち時間に並行してGoogle Colabを使ったスタイル学習を試しています。

    [AIBATO]AICU_Coloso1_Original_Tool.ipynb という Coloso第一弾の購入者向けに開発したツールであり、プロンプトを分割して Stable Image Ultraで生成したり、シードを横断的に指定したり、スタイルを学習させることができます。

    画像
    画像

    例えばこの絵は「ニルヴァーナ感は高いですが、平田茉莉花さんのキャラクターとしては神々しさよりももっと邪悪な狡猾さをきちんと組み込んでいきたいな」といった判断があります。大会レギュレーションに沿うと縦長画像を生成する必要がある一方で、ディスプレイとしては横長であり、PCモニタとディスプレイの色味も異なるので、生成しつつもどちらで勝負するかは考えながら審査表示用の画像やツイートなども準備しています。

    ツイートに関しては、勝負を馬鹿にしたり余裕を噛ましているのではなく、「余裕時間や区切りを作っている」というテクニックになります。「時間最後までギリギリにやるぞ」と考えていると、画像生成にかかる時間を逆算できなくなりますので、「最後はツイートまでするぞ」と保存やツイートにかかる時間を逆算しつつ、タイムスタンプとしての時系列を記録しています。また後ほどこの原稿のようにタイムラインを振り返るためにも必要な行為です。こうして、制御性の高いプロフェッショナルの絵作りノウハウが積み重ねられていく、以上が解説になります。

    最終テーマは「背水の陣」

    以上が基本テクニックです。エンターテインメントとしての生成AIアートバトルを意識して、これまで作ったプロンプトを合体させつつ斬新なコンセプトやウィットの利いたジョークをキャッチコピーと画像のコンセプトに忍ばせつつ、品質の高い制御された絵作りをツイート込みで続けていきます。

    最終テーマは「背水の陣」ですが、ここでゼロからの絵作りを勝負するのは良い戦法ではありません。審査員も観客も、すべての手の内を見ておりますので、目も肥えてきます。隠し武器はたくさん持っているのですが、文字通り「背水の陣」であれば、いままで使ってきたテクニックだけでより完成度の高い統合や、世界観、広告としてのエンゲージメントを勝ち取らねばなりません。

    特に世界観を支える背景や、キャラクターデザイン、それを支えるモデルやシードは運ではなく、開発して錬成して制御していく要素なので、短い時間で緊張感のある現場ですが、丁寧にログが残る形でGoogle Colabノートブックで生成しています。

    画像
    画像

    リクエストはREST APIによって行われ、繰り返し構文「For」を使ってシードやフィデリティパラメータを調整していきます。ファイル名にプロンプトやパラメータが残るようになっています。

    画像
    画像
    画像
    画像

    一見余裕を噛ましているように見えますが、こういうときは「この系は一旦終わりにしよう」という意味でもあります。
    息を吐くようにツイートし、写真や漫画やイラストレーションなどで経験があるしらいはかせならではの行動かもしれませんが、絵師さんがツイートするときも同じような気持ちの切り替え行動をしていると想像します。

    なお、表情の探求についてはプロンプトとスタイル制御で行います。このあたりは細かいところはColoso動画で紹介しています。

    画像

    これは「半目閉じ」を指定しつつ、背景に魑魅魍魎が足りなかった、また曼荼羅としての方位を示す要素が甘かった、などで没になった画像です。このような画像の評価もGoogle Colabは便利ではなく、Google DriveやSlidesを使うように連携しています。

    画像
    画像

    最後の方は秒単位まで集中していますので、コピーライティングとしての文字や漢字のトンマナ調整、レイアウトなども整理させていただくとこんな感じになると思います。これもGoogle Slidesでの作業です。

    画像

    以上が主なツールや技術の紹介になります。
    Coloso第一弾企画の復習ですね! 
    本当に良い講座なので、幅広い人にみてもらいたい。

    https://j.aicu.ai/coloso1


    作品の文字なしクリア素材や中間生成物、ツールなどについては有料パートに置かせていただきます。

    ここから先はAICUマガジンの特集の方で公開していく予定ですが、ご質問等はコメントいただけましたら、解説を拡充していきたいと思います。

    以上ご報告でした。
    今後ともAICU mediaをよろしくお願いいたします。

    寄稿・生成AIクリエイター しらいはかせ (@o_ob)


    この記事の続きはこちらから https://note.com/aicu/n/n26c3001b2b13

    Originally published at https://note.com on Nov 26, 2024.

  • あんしんなクリエイティブAIで「陽のあたる場所」をつくる

    エキサイティングな生成AIの年になった2024年も、もう残り僅かになってきました。「つくる人をつくる」をビジョンにするAICU Inc. は、新たな挑戦をいくつか準備していきます。その一つが「『生成AI倫理』に「AIクリエイター視点でしっかりと意見を述べていこう」という取り組みです。

    シリーズ「AIクリエイターに訊く生成AI倫理」

    生成AI分野、特にクリエイティブなAI、クリエイティブとAI分野で活躍する第一線のクリエイターの方々に直接!インタビューや講演録、寄稿や公開質問といったオピニオンを通して、法律や技術と同時に「ほんとうの意味で生成AIに求められる倫理感とは?」について時間をかけて考えてみたいというシリーズ企画「AIクリエイターに訊く生成AI倫理」を開始します。

    第1回はAICU代表、AICU media編集長、デジタルハリウッド大学大学院 特任教授、「しらいはかせ」こと白井暁彦(@o_ob)からスタートします。いつもは編集長として、プリンシパルライターとしてAICU編集部で執筆する白井氏ですが、今回は先日開催された東京科学大学INDEST「あんしんAIセミナー」で語られた講演録『あんしんなクリエイティブAIで「陽のあたる場所」をつくる』から、聞き手は編集部です。第三者視点で、最新の考えに迫ります。

    画像
    カバーアートはもちろん画像生成によるものです。しかもプロテクトが入っているそうです。

    今回の講演概要

    白井さんはエンターテイメントシステムの研究者です。

    画像
    https://akihiko.shirai.as/

    AICUという会社をやっています。AICUでは、例えばチャットボットを作ったり、動画を作ったり、レクチャーをしたり、読み物メディアとして『AICUmedia』、『AICUマガジン』等々のメディアを運営したりしてきています。また、画像生成をしていく人たちの品質やテクニック、倫理観を検定試験にしていく取り組みも提案しているそうです。

    今回は、そんな検定試験の中身になるようなお話です。白井さんは「つくる人をつくる」、クリエイティブAIで「陽の当たる場所」を作っていこうと考えています。法整備も大事ですが、そもそもAIが理解されていない問題が生成AIの普及を阻んでいます。事例とともにその問題をどんどん明らかにしていき、科学コミュニケーターで培った経験を元に様々な世代に「子供でもわかるような言葉」を意識して伝えています。白井さんのお話を全て紹介することはできませんが、その言葉の一部を見ていきましょう。

    事例1:『超入門:Stable Diffusionではじめる画像生成AI』

    最近、韓国をベースにする国際ラーニングメディア「Coloso」への3件の動画コンテンツシリーズをリリースしました。「Coloso(コロソ)」という韓国をベースにする国際ラーニングメディアで公開されています。

    画像

    ・『超入門:Stable Diffusionではじめる画像生成AI
    ・『初級者:広告企画から動画制作までのプロセス
    ・『ComfyUIマスター:カスタムノードとアプリ開発』 

    白井氏:この3作は基本的に、(アニメや漫画、イラストではなく)「リアリスティックな生成AIじゃなきゃ作れない」という画質の画像生成を「責任を持って活用する」ための「持続的創作活動を行う基盤を築く」というコンセプトで作っています。氏は『韓国の生成AI分野は日本と異なる進化・進歩・倫理観があり、困難も多いが韓国企業とのコラボレーションから学ぶことは多い』と述べており、また『結構な勢いで売れていて、こういうのを学びたい人はちゃんとお金払って学ぶんだなということが体感できた』と述べています。

    白井氏:日本では文化庁をはじめ、法整備が進んでいる一方で、議論がいわゆる「炎上屋」のおかげで変なブレーキが踏まれてしまうケースがみられます。それからテクノロジー的には「SD黄色本」で解説した「AUTOMATIC1111」に並んで「ComfyUI(コンフィユーアイ)」のほうが主流になっていて、知っている人たちの技術はものすごく高い一方で、まとまった体系的な知識を教えられる人がいるのかというとなかなかアンダーグラウンドな世界に落ちている感じがしています。なので、教科書などを真面目に作って、専門学校の先生とか大学の先生がそれを利用できるようにするということやっています。

    事例2:『AICUマガジン』

    また、中高生がこういったAIの世界を楽しそうと思って入ってこれるように『AICUマガジン』を毎月発行しています。漫画の書き方や生成AI時代の社会と倫理なども特集しました。

    画像
    画像

    「AniFusion」(アニフュージョン)みたいな最新刊のテクノロジーツールといったものが袋とじになっていて、これを買ってくれた人がコードを入れると1ヶ月無料で遊べるというのもやっています。書いてあるプログラムや書いてあるプロンプトを打ち込んだら同じことができるみたいなことができる世界は、すごく大事だなと思っています。なので、儲からないですけど、根性でAICU Magazineは出し続けています。

    画像

    頑張って続けていると、Stability AIも準公式で協力してくれますし、「BlendAI」のキャラクター「ガンマミィ」の漫画連載が始まるなどしました。漫画の連載が始まるというのはすごい大事なことで、「AIで漫画を描く人」に「漫画の原稿料が払える」ということなんですよね。そういう世界がやってこないと、いくら無料でコンテンツを作り続けても、それはその趣味への範囲を超えていかないということなんです。紙の本を出すということも結構重要で、ちゃんと産業が成り立っていく、その重さを感じられます。

    画像

    事例3:博士や修士卒が書く知的探求メディア

    実はAICUの主要ライター陣は「しらいはかせ」、東京工業大学知能システム科学卒・博士(工学)をはじめとして国内外の大学の修士卒以上が活躍しています。これは白井氏の日本科学未来館での科学コミュニケーターという経験からきているらしく、『専門的な知識を有しているからこそ、責任持って面白く、わかりやすく伝えるプロでもある』という考え方があるそうです。

    最近では、東京ゲームショウ(TGS2024)での紹介記事がきっかけになって、テレビ取材になったケースも有るそうです。

    画像

    ▲感情分析で変わるゲーム【トレたまneo】2024.10.03

    たしかに、ゲームやアニメの世界と違って、クリエイティブAIの世界は専門的な知識、特にコンピューターサイエンスから工学、芸術学、メディア学や文学などにも精通している必要がありますよね。怪しげな情報が飛び交うディープ・フェイクの時代に「博士や修士でなければ責任持って書けない」という視点は特徴があります。

    事例4:障害者向けクリエイティブワークショップ

    画像

    白井氏:僕らの仕事の中には、神奈川県をクライアントにして、「ともいきメタバース講習会」という障害者に向けたクリエイティブワークショップも実施しています。障害者の施設を回って、知的障害、身体障害、精神障害、発達障害といったいろんな人たちに実際に接してクリエイティブなことをやることによって、付加価値を出していっています。その中にメタバースやAI生成というのがいかに役に立つか、どんな問題が払われているのかといったことを研究しています。障害者の人たちにとって「AIで文字から画像生成をできるということは本当に求められていた技術だ」ということを、長年養護学校で先生を勤められた先生が生々しく僕に語ってくれました。『生成AIは悪だ』と言い放っている人たちに訊きたいのですが、あなた方が『生成AIは悪である、と思っているだけ』であって、「その技術を否定されることによってどんな人が傷ついているか?」を想像していますか。

    たしかに、音声文字入力や視線入力、漢字の予測変換入力なども「AIのおかげ」ですし、これは障害者だけでなく障がいを持たない方々にも有益な技術ですよね。画像生成がそのような技術になる可能性は大いにありますね。

    事例5:『CG WORLD』2024年11月号 vol.315の表紙

    今月の『CGWORLD』に注目です。表紙は杉山学長というデジタルハリウッド大学の初代学長・改革者です。『CGWORLD』が30周年で特集を組みました。

    画像

    https://amzn.to/4hhas22

    白井氏:杉山先生には30年前、僕が21歳のときに出会いました。この人が「この後デジタルコンテンツやCGなどを学びたい人がたくさん増えるからそういう学校を作ったほうがいいと思うんだ」と言って、株式会社で大学を作るということをやってきました。当時はゲームやCGの専門学校はなかったんです。今であれば想像もつかないかもしれませんけど、CG業界にはデジタルハリウッド卒業生がたくさんいます。さらに専門学校の先生にもいます。そういったところにちゃんとした「先生たちの先生」を送り込んだ人です。

    この背景は生成AIで作っています。杉山先生のご意向をFacebookメッセンジャーで聞いて「こういう絵にしたい」、それに合わせて僕はキャラクターデザインまで起こして、レイアウトや配置を編集部や本人と一緒にやりました。杉山先生はALSという病気で人工呼吸器をつけて車椅子でしか移動できません。AIの力がなかったらここまでできないです。AIのおかげで今月成し遂げました。そして僕はもちろん個人のAIクリエイターとして、『CGWORLD編集部』から結構なお金を頂きました。CGクリエイターとしてCGWORLDの表紙を飾ることは並大抵のことでは実現しませんし、「クリエイターとして飯を食う、対価をもらう」というのはこういうことの積み重ねなんだと思います。

    事例6:AIキャラクター「ガンマミィ」

    最新の事例として、先日AICUから電撃公開された「ガンマミィ・ジェネレーター」が紹介されました。

    画像

    白井氏:僕らはメディア企業というだけでなく、最新の制御された高品質な画像生成AIというテクノロジーを使って「ガンマミィジェネレーター」という「ガンマミィ」を誰でも使えるチャットシステムを1日ぐらいで作りきるだけの技術力はあります。ですが、その想像をさらに上回るようなテクノロジーやテクニックですごい絵を作ってくる人が出てくるんです。これは感動です。やはり予想を上回るようなことを作ってきてこそ、我々はやっと報われるんです。それに対してお金を出したいという人が出てきてこそ、やっと経済が回るということなので。生成AIに対して「エアプをやっている人たち」(※やってもいないことをやったように言ったりする、いわゆる知ったかぶりを指す言葉「エアプレイ」や「エアプレーヤー」の省略語)には「変な邪魔しないでください」と言いたいです。

    白井氏:僕たちは無料で作れる「ガンマミィ」をリリースしているのに、使ったこともないという人たちが「生成AIは悪だから」と言うのは構いませんけど、そういう世界線と我々の世界線がどういう風に今後変わっていくのかというのは、皆さんがしっかりと認識していただきたい事実だし、未来だと思います。例えば、真面目に商業をやっている人たちは「学習こそが価値だ」と言って、GPUを買い集めてライセンスを買い、新しいモデルを探求し、広告や映像制作に使っています。AIは安く作る技術じゃなくて不可能を可能にする技術なんです。

    事例7:『画像生成AI Stable Diffusion スタートガイド』

    画像

    https://j.aicu.ai/SBXL

    画像

    この本の中で、200ページのところに書いているのが、「画像生成AIクリエイター仕草(v.1.0)」というコンセプトで、「すべきことと、すべきでないこと」を「子供でもわかるよう」に話しています。簡単に言うと、「すべきでないこと」は「他人の迷惑」になること。技術的な可否や法律の可否、マナーやモラル、過去の常識、リスク、感情を混ぜて「混乱させること」。マナーやモラルというのは皆さんの知識、理解、お気持ち、感情なので、法律的にできる、できないという話や、技術的にできる、できないという話と混ぜてはいけないのです。

    画像

    白井氏:つまり、「赤信号は渡ってはいけないけど、僕は急いでるので渡ります」というリスクを犯している個人の話であって、その人が車に轢かれたら自業自得なのに、そこを混ぜて「自分はこう思う」みたいな話をしても仕方ないんです。そこを混ぜて混乱させるみたいなことがそもそもテクニックとして喋る人もいますけれど、それに混乱させられては技術やテクノロジー、商売といったものを整理することはできないです。だから『混ぜて混乱させているやつは誰だ?』という視点に皆さんの目を光らせてください。
    「生成AIだから安い」、「自動だ」、「無料で何か作れるなんて楽して儲かる」みたいなのも嘘です。これは完全に世間を誤解させている行為です。生成AIだから安くて早いということはないです。生成AIはやっているクリエイターだったらわかると思います。1時間の中で絵を作らなきゃいけないとなったら、できるだけ頑張ってたくさん作って、その中から「最高の絵を作った」という、これがクリエイターです。だからこそ人の心を動かすので、楽な道でもなければ、自動でできるものでもないです。そこは誤認をしてほしくないところです。
    すべきことは、とにかく楽しむこと、作品を作る情熱を持ち続けることだと思います。僕は、陽の当たる場所を作るためには徹底抗戦するつもりです。

    画像

    ここで「画像生成AIの価値創出」要素として、

    ・技術の進化速度について発信し続けていくことが価値
    ・「写真と同じ」
    ・オープンなモデルでどんな価値を出せるか?
    ・「学習こそが価値」
    ・「安く作る技術」ではなく「不可能を可能にする技術」
    ・「つくる人をつくる」

    とまとめました。

    画像生成AIの近年

    さらに歴史を振り返ります。ラスコー洞窟など先史時代の絵画から、

    画像

    写真の歴史、

    画像
    https://www.statista.com/chart/18488/camera-timeline/

    CG/画像生成AIの誕生と変遷 文化的背景 (1940-2020)

    画像

    そして近年の画像生成AIの歴史です。

    画像

    白井氏:画像生成の世界でLvmin Zhangさんを知らない人はいないと思います。Style Transferのアニメスケッチをやったり、style2paints、ControlNet、Fooocus、Forgeなどを開発している彼ですね。彼は実は日本のシモセラ・エドガーさんに習っています。日本で勉強していた人で今もまだ学生をやっています。

    https://note.com/aicu/n/n8990c841e373

    こういう中国出身、もしくは中華系二世の研究者でアメリカの文化に馴染んで研究している人たちは、画像生成のコア的なテクノロジーをやってる人たちにかなりの確率でいます。この人たちは日本のアニメや漫画がめちゃくちゃ好きなんです。その人たちが我々のアニメや漫画を、外部のサイトを使ってAIに学習させています。僕は10年以上前に彼らの論文を読んだとき、「ちょっと待て。これは著作権違反だぞ。」と気づきました。学会に訴えたり、査読者としてコメント出したり。いくらテクノロジー的に楽しくても僕はこの論文はアクセプトできない、と言ったんだけれども、実はもうそのときすでにデータセットが存在していてもう止められなかったんです。
    ところが、日本の研究者や世界の研究者で、アニメを学習させることにこんなに価値があると分かっていた人がほとんどいなかったんです。その頃はまだ、欧米の研究者も日本の研究者も、それを問題だとは思っていなかったんです。イラストコミュニケーションサービスのSNSもたくさんありました。robot.txtも無視されていました。僕はそのときにもっと力を持っていたら、もっとこの問題に社会の目を向けるべきだと思いましたが、社会がそこに目を向けていたかというと疑問があります。CGの研究者そんなに多くないし。そして、今は中国の研究者はかなり野放し状態になっています。対中国人が云々という話をしているんじゃないです。中国のCG研究者やコンピュータービジョンの研究者は数千から数万いますが、我々日本の研究者は数百から数千です。彼らの興味と探究心と成果です。日本の研究がいかに不甲斐がないかということを身を持って感じています。もっと大きなところに出て、インパクトのある研究を世界のステージで対話して、英語で論文を書き、日本の研究者がちゃんとこの状況を認識している人が増えて、たくさんの才能が戦っていかないといけないということは認識してください。

    今後のAI利用に関する議論の可能性

    アメリカには法律があって、教育や引用などはフェアユースで公共物であるから使ってよいと認められています。そのフェアユースとしての引用は、日本の著作権法ではフェアユースの記述がないんです。最近議論はされていましたけど、生成AIの時代においてというのと、著作権法30条が適応してしまった瞬間にだいぶおかしくなりました。

    つまり、生成AIの議論のかなり過激な問題の原点は、著作権法30条の改正が原因だったし、多くの人たちはそこで声を上げるべきだったんですね。やらなきゃいけないのが著作権法30条の4の改正でしょう?ということは、僕は議論したいこととしてあります。日本は憲法改正には非常に保守的です。ところが、著作権法に関しては4〜5年に一度改正されてるんです。だったらこうするべきだって皆さんで言い続ければいいんですよ。議論のやり方は先ほど言った「混ぜるな禁止」をちゃんと考えてほしいなと思っています。

    やはり事業者レベルで言うと経産省だと思うんですね。つまり、文科省でもなく経産省が対応すべきだと思います。文化庁が著作権の定義で特に変える必要ないという結論に至ってる以上、これは経済の話です。誰が権利を持っていてどういう対価を払っているのかという話になるのであって、やはりちゃんと対話相手として権利団体はしっかりとそういう専門家を置いて、議論にちゃんと挟まっていてほしいと思っています。

    例題:NijiJourneyでみかけた他のユーザが生成した画像

    問題です。この画像に知的財産の侵害はあるでしょうか?この画像を自分のブログに自分の著作として利用することはできるでしょうか?この画像をブレンドして新たな画像を作ることはできるでしょうか?テクノロジーとしてできる、できないという問題と、法律としてできる、できないの問題を考えてみてください。

    画像

    答えです。これはとある弁護士さんによる2024年8月ごろの監修ですが、知的財産の損害はないとのことです。マクドナルドの商標は侵害していません。「マクドナルド」と書いちゃったら問題では?と思うかもしれませんが、それも大丈夫です。皆さんの考えている知的財産の侵害というものは、実はちょっと違うんじゃないの?ということがこの1枚でも語れます。

    自分のブログに利用できるかというと、これも「画像生成による生成物は著作物ではない」という判例が出ていまして、日本においても「著作とは、思想又は感情を創作的に表現したもの」なので、一般的なサービスによって生成されただけのテキストや画像には「著作権がない」ということになっています。なので、これは別に著作権侵害にならないです。つまり、「このNijiJourneyの画像可愛い。じゃあ“僕の画像として”ブログにおこう」と“僕の画像として”のところだけが問題であり、著作物ではなく、「NijiJourneyで拾った画像です」だったら別に問題がないです。

    ブレンドして新たな画像を作ることができるかという点は、「日本の法律においては問題がない」というのがこの問題を問われた弁護士さんのご意見ですが、他の人の画像をアップロードしたら、それは実は複製権を侵害している可能性があります。それから、依拠性や類似性を目的としてやってるんだったら、それは依拠性などを侵害する可能性があります。

    ほんとうの意味で生成AIに求められる倫理感とは?

    書籍「画像生成AI Stable Diffusionスタートガイド」から数十枚のスライドを引用しつつ、特にこの図を指しました。

    画像

    白井氏:欧州のリスクベースアプローチについても紹介をしておきます。「容認できないリスク」、「ハイリスク」、「限定的なリスク」、「最小限のリスク」等がある中、「画像生成AIはどのようなリスクレベルなのか?」をしっかり捉えてほしい。これが医療や法律、そして自動運転車に例えたら、どのようなリスクレベルなのかをはっきりと認識したうえで、反対するなら、反対としてきちんと責任を持って、どのような社会を考えているのか、すべてのひとにわかるように話をしてほしいと思います。

    まとめ

    しらいはかせ、白井暁彦氏は事例を交えながら、熱量たっぷりに、AIが理解されていない問題や著作権の問題がどうして起こっているのかをお話しくださいました。「画像生成AIクリエイター仕草(v.1.0)」の「子供でもわかるような、すべきこととすべきでないこと」を心に刻みながら、あんしんなクリエイティブAIで「陽のあたる場所」をつくる、そのための問題と向き合っていける世の中をつくっていきたいですね。

    みなさんの意見も訊きたい!

    ご感想はこの記事のコメント欄、もしくは
    Xでは引用いただいて、ハッシュタグは
    #AIクリエイターに訊く #生成AI倫理
    でよろしくお願い致します。みなさんの建設的な意見はネット上のみならず、AICU Magazineや動画メディアや論文等でも扱っていきたいと考えております。

    また「私はAIクリエイター、なので意見を述べたい!」という方はご寄稿いただく仕組みも準備しております。X@AICUai にてDMをいただけると幸いです。

    Originally published at https://note.com on Oct 24, 2024.

  • 「CGWORLD vol.315」画像生成AIによる表紙メイキング、大公開。

    2024年10月10日発売、CGWORLD vol.315 (2024年11月号)の表紙の制作に、AICU代表・白井暁彦が画像生成AIによるアートを提供いたしました。
    本稿ではその制作の裏側、画像生成AIによる商業出版およびVFX技術の実際の進行とワークフローを紹介したいと思います。

    ★本件は白井個人への依頼制作であり、個人クリエイターとしての寄稿となります。

    デジタルハリウッド大学30周年おめでとうございます。

    https://amzn.to/4dKt3jP

      実は、画像生成は全てStable Diffusion,  Stability AI APIで行っています。

      クレジットをご記載いただきました。

      画像

      本稿ではその制作の裏側を紹介させていただきます。

      画像

      杉山知之学長によるコンセプト解説です。

      1994年年末のデジタルコミュニケーションの夜明けから30年、歴史的な様々なトピックがありましたが、その世界が暮れていきます。だから、夕日をバックに、新たな夜明けを見る方向に向かって座っています。新たな夜明けは、AIと暮らす世界、シンギュラリティ・エラの到来を告げます。表4にキャラクターを乗せるアイデアは白井暁彦先生からです。メタバースなど様々なデジタル空間にパラレルで生きる姿の象徴です。アバターを引き連れて、新たな世界へ行きます(杉山学長)

      ・画像生成AIサービス
      背景・人物:Stability AI API, 主に Stable Image Ultra、Google Colabでの独自開発システムにより生成

      ・プロンプト(一部抜粋)
      背景:hippy style, (photoreal:2), futuristic, orange toned urban sight scene, cyber worlds with a nature fusioned, skyscraper buildings. seed = 59.
      人物:cyberpunk-themed mechanical robotic guitar hero, with a headset, neon-lit circuit tattoos on face, glowing white lines, looking at viewer, smile, passionate 40 years old man, prosthetic hand, with artificial respirator, with a super detailed guitar, color scheme of orange, dramatic orange and white lightings, intense expression, super detailed mechanical design,

      プロンプトによるtext to imageだけではなく、様々な技術を駆使していますが、まずは画像生成以外の制作の裏側を可能な限りで紹介していきたいと思います。

      最新のVFX技術による実写撮影

      まず、この杉山学長は本物、御本人による撮影です。
      2021年にALSを発症された杉山知之先生は、現在、人工呼吸器と車椅子の上で学長業務を遂行されています。

      祝辞などは本人の人工合成ボイスで行われています。

      https://note.com/dhu/n/nb71507b6921a

      筋肉の自由が奪われたとしても、呼吸を奪われたとしても、CG・VFX技術により、3D高解像度アバターや人工合成ボイスによって、人々に礼をして、若き才能を称賛する姿は、勇気を与えます。そう、これはALSという難病だけではなく、我々高度長寿化社会を生きる人生そのものをみているのかもしれないのです。

      人は生きるうえでは、社会とコミュニケーションしていかねばなりません。
      その姿をいかに、楽しいものにしていくか、挑戦の日々が続きます。

      御本人による直接のディレクション

      まず本件は、杉山知之学長自身のFacebookメッセンジャーによるDMによって直接のディレクションが行われました。

      画像

      https://note.com/mojo_sugiyama

      依頼は2024年8月16日17:41に届いたメッセージからはじまりました。

      画像

      左が杉山学長、右が白井です。

      画像

      Google DriveでCGWORLDの表紙レイアウトが届きました。
      間に、だれも、仲介や介在はいません。

      その日のうちに作ったプロト

      画像

      代表的な1枚をお送りしていますが、DriveのURLには専用の画像生成システムから生成した高品質画像が100枚ほど収められています。

      画像

      杉山学長の公式写真をベースにスタイル学習を行い、さまざまなポーズ、衣装、表情、レイアウトのバリエーションを作っていきます。
      シードとプロンプトを固定して、再現性を高く探求しています。

      たとえば1つのファイルを紹介します。

      “S40_PP_neon-punk style….MF0.50.png”というファイル名に、シードや処理の系統、プロンプトの一部が埋め込まれています。

      画像

      Stability AI APIと公式のGoogle Colabノートブックがベースになっていますが、その中の最新APIのなかでも特に高品質な「Stable Image Ultra」と、その公式サンプルが使われています。

      https://platform.stability.ai

      公式サンプルの状態では、画像の保存やプロンプトの探求は難しいので、画像の生成やスタイル学習のサンプルを改造して、以下のような機能が追加されています。

      画像

      ・APIキーの自動参照(セキュリティ機能)
      ・Google Driveへの画像保存
      ・プロンプトの3分割
      ・シードとフィデリティの制御

      テキスト画像生成だけでは制御性の高い画像は作れません。また未来的な雰囲気、杉山先生のヒッピーカルチャー、ギターなど難度の高い要素も盛り込んでいきつつ、画風としても写実性とキャラクターイラスト風を交えていきます。

      画像
      画像
      画像

      今回、ALSである現実を、そのまま世間にさらしたいという気持ちがあり、車椅子に乗って喉にパイプを通している姿は写真で行きます。 しかし白井先生の生成した人物を見ると、市民全員が高度に発達したVision Proのようなデバイスを付ければ、それぞれの人物が観られたい姿に変容して、相手に見え、誰に観られるかによって姿が変わる世界が可能と感じます。

      (視線入力や呼気式入力装置で、こんなふうに長い文章を打つのがどんなに大変か…)と思いながら、返信していきます。

      画像

      ・デジハリ風オレンジ
      ・表4(裏表紙)にアバターが登場するのもあり
      ・未来の自然と調和した街
      ・現実かメタバースかわからない感じ

      画像

      (信じられてしまった……)

      これはとても大事なポイントではありました。
      人を信じる、作風を信じる、という信じ方はあるとおもいますが
      「感覚を信じる」という点で、バランス感覚や遊びの感覚、かっこよさなども委託されつつも、感覚への信頼・信用が相互にかかってくる感じです。

      遊びつつも、襟を正しつつ、世界観と品質と、心象風景の画像化、共有を繰り返していきます。

      最新のVFX技術による実写撮影

      初期の依頼から10日経過、日々の業務の中でもかなり忙しく制作をしている月末の土日のやり取りです。

      画像

      どうやら撮影手法が珍しいことになりそうです。

      画像

      こんな動画が届きました。

      横浜のスタジオWADAYAさんは、デジハリ卒業生による運営です。
      とてもポップで楽しい感じの動画が、撮影環境を見事に説明してくれていて助かりました!

      WADAYA Studio80 https://wadaya.info/

      ちょうどこの8月末はこんな出来事が並列していました

      https://www.bunka.go.jp/seisaku/chosakuken/aiandcopyright.html

      https://youtu.be/bD0Kp5PiP8o

      https://note.com/o_ob/n/ne4d9735ab5cb

      会社として編集長としての制作をバリバリこなしながらも、ちょこちょこ個人としての制作や発信も行っているところが読み取れましたら幸いです。

      本制作のワークフローと「裏側のキャラクター」について

      さて、いよいよ本制作のワークフローです。
      詳細を解説していきます。

      最終的な完成品、表4には印象的な未来都市の夕暮れ、そして小さな人物があしらわれています。

      画像

      これは、サイバネティクス技術を駆使して生き生きとエレキギターを演奏する未来の杉山学長アバターです。人工呼吸器、胸のジェネレーター、義手、顔のマスクなどは私の趣味です。

      画像

      このキャラクターにたどり着くまでのプロトタイプも紹介しておきます。

      美しい猫耳をもったビジュアル系ロックバンドのギタリスト。
      ギターのフレットが別次元になっているのですが、全体的に美しい。

      画像

      元気なお年寄り。これも美しいけどなにか違う。

      画像

      逆に若返らせてみたり、

      画像

      ハッスルさせてみたり。

      画像

      杉山学長の意思として「ALSである現実を、そのまま世間にさらしたいという気持ち」と、この美しくて元気なキャラクターたちは、何か方向性が違うことに気づきます。筋肉に指令を出す神経が難病により歩くことも呼吸すらもできなくなるという現実や、70歳という年輪、そして「市民全員が高度に発達したVision Proのようなデバイスを付ければ、それぞれの人物が観られたい姿に変容して、相手に見え、誰に観られるかによって姿が変わる世界が可能と感じます」というメタバースの30年という歴史を振り返って、私自身と杉山先生の30年を振り返ってみました。

      まず描くべきは、世界。

      未来都市のメタボリズム、自然との調和。そしてオレンジ。
      更に私の中での杉山先生に見え隠れする「ヒッピー文化」(私自身が60年代米国文化に憧れがあったのかもしれません)そういったものをまずはプロンプトにして世界を描いていきます。

      画像

      未来の御茶ノ水ソラシティを思い描いたり、

      画像
      画像

      自然との調和に重きをおいてみたり、何十枚も生成していきます。

      画像

      そうしてベースラインとして選択された1枚がこちらでした。

      画像
      画像
      「水没都市の夕日世界」(S59)

      これで描くべき世界が決まりました。
      作品名は『水没都市の夕日世界』(S59)です。
      「S59」とはシード番号です。同じモデル、同じシード、同じプロンプトで再現性があります。

      仮のレイアウトとトーンを出していきます。

      画像

      ちなみに白井は写真工学の出身であり、白黒写真は高校時代からの積み上げがあります。プロをたくさん輩出した有名な「写真部」に所属し、白黒写真のトーニングやレタッチは3年ほど積み上げがあり、写真作品でちょっとした賞をもらったり、街の現像店を任されるぐらいのスキルはありました。さらにそのバイト代で買ったMacとPhotoshop2.0、2.5、3.0のあたりでデジタルに移行して写真部の仲間からは「異端扱い」されます。それがちょうど30年前の21歳のときに経験した出来事です。漫画を描いたり、ミニコミ誌を作ったり、いまの画像生成AI時代の狂乱に似たようなムーブメントがデジタルクリエイションの世界に起きていました。
      大学4年生のとき、日本バーチャルリアリティ学会設立総会での基調講演で、「デジタルハリウッド構想」をホリプロ所属のバーチャルアイドル「伊達杏子 DK-96」や長野オリンピックでのボブスレーシミュレータなどとともに熱量込めてお話する数学出身の杉山先生との出会いでした。

      https://tachilab.org/jp/addendum/vrsj.html

      まさかその25年後に白井がそこで教鞭をとるとは考えてもいなかったのですが、運命とは不思議なものです。そう、まるで魅力的なバンドメンバーを引き入れていくボーカリストのような杉山先生やその仲間たちを描かねば。
      たとえ使われなくても、リアルだけど、美しすぎず、かつその世界で「わいわいしている」、楽しそうな、コンヴィヴィアリティ※があるキャラクターを描かねば……!

      ※「コンヴィヴィアリティ」については杉山知之先生執筆の「私のコンピュータ文化史 TOKYO1964 – TOKYO2020」という論文を引用しておきます。

      画像
      画像
      画像

      DNA “Entertainment. It’s Everything!”

      https://school.dhw.co.jp/about/dna.html

      創立から30年。
      開学のころからずっと変わらず伝えていることは『すべてをエンタテインメントにせよ!』ということ。
      受講生・卒業生だけでなく、講師・スタッフのモットーでもあります。
      卒業制作のクオリティはもちろん、1回の授業の組み立て方、就職活動のあり方、卒業後の仕事まで、すべてをエンタテインメントになるまで追求する文化がここにあります。
      「すべてをエンタテインメントにする!」という強い思い。それが世界中で活躍する9万人の卒業生に共通するDNAです。

      https://school.dhw.co.jp/about/dna.html

      画像
      画像

      ……と思う存分、遊んでいるように見えるかもしれませんが、実際には大真面目です。しかも激務のさなかです。神奈川県「ともいきメタバース講習会」という障がい者向けクリエイティブワークショップの開発などの現場指揮を行いながらの制作でした。
      全てをエンターテインメントにしないと、やってられないよ!!

      現場撮影用の画像

      さてWADAYAスタジオさんでのLEDディスプレイウォールスタジオでの撮影です。残念ながら白井はワークショップの開発があったので立会はできない日程なので、撮影現場に任せるための素材をお渡しして祈るしかありません。
      3000mm x 1686mmの高輝度高ピッチLEDウォールスタジオを背景に、

      画像

      ここに未来都市を配置して、杉山先生が車椅子でやってきます。

      画像

      専門のライティング担当さんもいらっしゃる。

      画像

      用意すべきはこのレイアウト案を示しつつ、レイヤーを分けた素材もわかりやすく提供する必要があります。しかもスマートに、Google DriveのURLだけでお渡ししたい。

      画像

      Stability AI APIのフル活用

      もともと商用利用できるプロフェッショナル向けAPIでもあるStability AI APIですが、具体的にはこんな使い方もあります。「背景除去」です。

      一見なんということはない「背景除去」なのですが、

      画像

      実はそんなことはありません。
      ウェービーヘアの銀髪は、マスクを切るのがとても大変です。

      画像

      ですが、このマスクは背景除去(Remove background)ですぐに生成できました。もはやPhotoshopよりもGoogle Colabのほうが便利なときもあるのです。

      画像

      さらに印刷原稿を想定して、高解像度化を行っていきます。
      こちらも Stability AIのUpscale機能を使って高解像度化、特にConservative(コンサバ=保守的)なアップスケールを行います。この際は、生成に使ったプロンプトを再利用します。

      hippy style, (photoreal:2), futuristic, orange toned urban sight scene, cyber worlds with a nature fusioned, skyscraper buildings,

      (photoreal:2)とは、Stability AI APIにおける強調構文です。

      画像

      この時点でも高解像度ですが「商業誌の表紙」という、最高品質印刷原稿を想定して、さらにAUTOMATIC1111の Extraを使って高解像度化していきます。

      BG02026-16448×9408.png (186.7MB) という強烈な解像度ですが、ご興味あるようでしたらダウンロードしてみてください。

      全てが終わったのは朝の5時ですね。
      Google DriveのURLをお届けして祈りました。

      画像

      商業誌の制作を「商業政策」と間違えて書くぐらいには疲れていたようですが、「クリエイティブのヤマ」を超えた清々しさが伝わったようでしたら幸いです。

      SD黄色本」で長年お世話になったAUTOMATIC1111の超解像化技術が、最後の最後の品質に貢献したことは特筆に値すると思います。

      全ての画像生成AIの貢献者、オープンソース開発者に感謝を述べさせてください。

      撮影の現場より

      後日談としてWADAYA Studioの和田圭介さんより写真とメッセージが届きましたので紹介させていただきます。

      画像
      画像
      画像
      画像
      画像

      特に問題は無いのですが、僕がデジタルハリウッドを卒業しているわけではなく、創立3年目に入社した、元スタッフです。 デジタルコンテンツについては、杉山先生の教えで、この道にたどり着いたので、杉山先生の教え子であることには間違いないと思います(笑) ある意味、スタッフも含め卒業なんででしょうね。 ありがたいことに退職した後も、杉山先生からはいろいろなご相談お声掛けをいただき、20周年の時は、メッセージ映像を撮影し、そして30周年でこのコラボレーションが実現しているのが、何とも感慨深いのです。 デジハリからいただいた、この3人の縁も含めて、それを活かして何かしていかなければいけないなと、再度えりを正しました。 これからが楽しみです!!

      WADAYA Studio 和田圭介さんより

      (テスト撮影のデータから)

      画像

      どう考えても「Entertainment, it’s everything!」なDNAが感じられる会社紹介ですね。今後もよろしくお願いいたします。

      さいごに:画像生成AIの過去と未来と人類のクリエイティビティの1ページによせて。

      以上、1998年からCGの世界、世界のCGを届け続けてきた「CGWORLD」さんの表紙、しかも日本のCG・デジタルクリエイター教育とともにあるデジタルハリウッドの30周年を記録する特集、さらにそれを最新のLEDディスプレイウォールによるインカメラVFXで撮影するための画像生成AIによる世界素材の提供…というクリエイター冥利に尽きる仕事の一部始終を個人ブログ形式でお送りさせていただきました。

      この30年、テクノロジー、デジタルツール、生成AIによって楽になったこともあります。しかし、クリエイターはその効率化によって生まれた時間を余暇に費やすのではなく、制作やクオリティ、そして「不可能を可能にする挑戦」に費やしていきます。その姿勢は30年経っても何も変わらないと思います。

      さらに、画像生成AIは、世界中の画像という画像を食べて育った化け物です。イラストやデザインだけではありません。写真出身の私にしてみれば、「写真表現とは何か」を常に突きつけられてきた30余年です。Stable DiffusionやStability AIのAPIに何か言いたいことがあるひとはたくさんいると思います。しかし世界中のクリエイティブをLatent Spaceに詰め込んで、高品質、かつ高速なAPIを提供し、新たな人類のクリエイティビティに挑戦させていただいて、さらに商業利用可能であるとなると、それはホビーでもなんでもなく、プロのクリエイターとして勝負せねばなりません。
      ローカルのGPUも、APIのクレジットも、糸目なく投じて、きちんとクリエイターとしてCGの歴史に爪痕を残す仕事ができたようであれば幸いです。

      なお、公開当初からのStable Diffusion、そしtStability AIのAPIの使い手としてはこの技術を伝承するために、毎日のように個人ブログやAICU mediaを通して解説を発信していることはお気づきかと存じます。

      さらに、こちらの動画教材としてはColosoからこちらのラーニングメディアで公開予定です。
      ■「超入門:Stable Diffusionではじめる画像生成AI」
      https://j.aicu.ai/AICUXColosoJP

      書籍「画像生成AI Stable Diffusion」(SD黄色本)もおかげさまで好調であり、まだまだお問い合わせやサポートなどを通して読者の皆様と交流させていただいております。

      今後、広告、グラフィックス、ゲーム、漫画やアニメといった分野に画像生成AIは一般的に使われるようになるでしょう。

      その時に、これらの作品は、枯れ葉や土壌のような存在になっている事でしょう。それでいいんだとおもいます。
      でも、クリエイティブAIの使い手として、大事なことは道具や、その使い方だけじゃないんです。
      「おもしろそうだな」「やってみよう」「すごいね」「かっこいいね」「おもしろいね」「もっとすごいものがつくれそう」「ぼくもやってみたよ」そういった「つくる人をつくる」という心に火を付ける活動そのものが、きちんと作品を通して他の人の心に伝わったか?それが大事なんです。

      そしてクリエイターの世界は真剣です。偉かろうが、社会的に立場があろうがなかろうが、上手であったり、美しかったりも大事ですが、それだけではなく、最終的なアウトプットにどれぐらいのピクセルが露出するのか、しないのかといった効率だけでなく、その世界とか、メッセージとか、コンテキストとか、モチベーションとか、恥ずかしがらずに馬鹿になってやり続けることが、とても大事だったりします。

      デジタルハリウッド30周年、「CGWORLD」26周年、おめでとうございます。今日、本誌が物理的に届きましたが、その重さ、厚さ、関わった人の多さとニオイに咽んでおります。今後とも、この分野の皆様のご健勝ご盛栄をお祈り申し上げますとともに、この個人ブログの筆を置きたいと存じます。

      謝辞:ご依頼いただいた杉山知之先生、クレジット、およびCGWORLD本誌に掲載できなかったメイキング公開へのご快諾、また本寄稿へ「CGWORLD」のロゴ利用などご許諾いただきましたCGWORLD編集部の藤井さま、ありがとうございました。
      Stable Diffusion開発チーム、Stability AI APIおよびStability AI Japanの皆様、特にご支援いただいたJerry Chiさん、ありがとうございました。この場をお借りして感謝の意を記させていただきます。

      Thank you to the all of Stable Diffusion development team, Stability AI API and Stability AI Japan, and especially to Jerry Chi for your support. I would like to take this opportunity to express my gratitude.

      AICU Inc. 代表・白井暁彦, Akihko SHIRAI, Ph.D (@o_ob)

      画像

      ▼デジタルハリウッド 創立30周年記念ページ

      https://www.dhw.co.jp/30th

      ▼杉山先生の音楽ブログ「Sound Scape of Mojo」
      画像生成によるカバーアートも見どころですね!

      https://note.com/mojo_sugiyama/n/n600cce7f4b69

      Originally published at https://note.com on Oct 9, 2024.

    1. [速報]AICU CEO白井が「ChatGPTとStable Diffusion丸わかりナイト」に登壇いたしました

      [速報]AICU CEO白井が「ChatGPTとStable Diffusion丸わかりナイト」に登壇いたしました

      2024年5月30日(木)に、デジタルハリウッド大学本校にて開催された「ChatGPTとStable Diffusion丸わかりナイト」に弊社CEO白井暁彦(@o_ob/しらいはかせ)が登壇いたしました!

      https://ai-maruwakari-night.peatix.com/

      デジタルハリウッド大学大学院教授の橋本大也先生、特任教授の弊社CEO白井暁彦が、近日それぞれ発売した書籍に関する講演、トークイベントを実施しました。

      『頭がいい人のChatGPT&Copilotの使い方』(橋本大也教授著)
      『画像生成AI Stable Diffusionスタートガイド』(AICU media (著), 白井 暁彦 (著))

      ChatGPTとStable Diffusionを中心に、文章、画像、音楽、動画の生成AIの面白さ、可能性について熱く語られ、本を読んだ人も読んでいない人も、学生も社会人も、生成AIの最新事情をアップデートできるイベントとなりました。

      書籍執筆に使われた蔵出し資料の数々!

      参加された方の感想
      「2時間びっしり濃い内容すぎて、消化しきれませんでした・・・」
      「楽しかった!」
      「頭のいい人…じゃなくて…頭のおかしい人の情報量…」

      本人曰く「40分強の講演に実に244枚のスライドがあるんだ」とのこと

      https://note.com/o_ob/n/n930c390b6dfa

      1分あたり6.1枚、だいたい10秒1枚という計算なんですね!(慣れた)

      終了後のサイン会でも沢山の方が購入されました。

      購入された方のご感想
      「実はKindle版も購入していたのですが、これはリアル本であったほうがいい!&先生のサイン付き✨ということでゲットできて良かったです😊」

      ご参加・ご購入ありがとうございました。

      詳細のレポートをお楽しみに!

      Originally published at https://note.com on May 30, 2024.

    2. #SD黄色本 サイン本即売会も開催!生成AI書籍人気著者の2人が語る「ChatGPTとStable Diffusion丸わかりナイト」

      #SD黄色本 サイン本即売会も開催!生成AI書籍人気著者の2人が語る「ChatGPTとStable Diffusion丸わかりナイト」

      人気著者が語る生成AIの魅力

      デジタルハリウッド大学の橋本大也教授と、デジタルハリウッド大学特命教授でAICU media編集長でもある白井暁彦CEOが、それぞれのベストセラー書籍をもとに、ChatGPTやStable Diffusionなどの生成AIの最新動向を紹介します。また、イベントでは両著者の最新刊 #SD黄色本のサイン本即売会も実施されます。

      イベント詳細

      日時: 2024年5月30日(木)19:30~21:30(開場19:00)

      会場: デジタルハリウッド大学 駿河台ホール(東京都千代田区神田駿河台4-6 御茶ノ水ソラシティ アカデミア3階)

      参加費: 無料

      定員: 150名

      申込み: イベントページ

      https://ai-maruwakari-night.peatix.com

      登壇者プロフィール

      白井暁彦(Akihiko Shirai, PhD /しらいはかせ)

      エンタメ・メタバース技術の研究開発に関わる研究者、ホワイトハッカー作家、米国スタートアップ「AICU Inc.」「Hidden Pixel Technology Inc.」のCEO。東京工芸大学写真工学科卒、同画像工学専攻修了。キヤノン株式会社とグループの研究所より生まれた英国・Criterion Software にて世界初の産業用ゲームエンジン「RenderWare」の普及開発に参加、その後、東京工業大学知能システム科学専攻に復学。博士学位後、NHK エンジニアリングサービス・次世代コンテント研究室、フランスに渡りENSAM 客員研究員、国際公募展Laval Virtual ReVolution の立ち上げ、日本科学未来館科学コミュニケーター神奈川工科大学情報メディア学科准教授を経て、2018 年よりデジタルハリウッド大学 大学院客員教授 およびグリー株式会社GREE VR Studio Laboratory Director。

      スマートフォン向けメタバース「REALITY」を開発・運用するREALITY 株式会社の立ち上げを通して、Virtual YouTuber などXR ライブエンタメ技術のR&D、国際発信など、メタバースエンタテイメントの未来開発や知財創出を中心に、自らエンタテイメントのライブプレイヤーとして世界に向けた開発・発信活動方法論化しながら世界中のエンタテインメント技術業界に数百人の規模でクリエイターを育成している。2023年よりデジタルハリウッド大学発米国スタートアップ企業「AICU Inc.」CEO。生成AI時代に「つくる人をつくる」をビジョンに英語、日本語、フランス語、プログラミング言語などでオープンな作家活動を続けている。日本バーチャルリアリティ学会IVRC 実行委員会委員。芸術科学会副会長。

      著書に『WiiRemote プログラミング』(オーム社)、『白井博士の未来のゲームデザイン – エンターテインメントシステムの科学-』(ワークスコーポレーション)、『AIとコラボして神絵師になる 論文から読み解くStable Diffusion』(インプレスR&D)他。

      橋本大也(Daiya Hashimoto)

      デジタルハリウッド大学教授兼メディアライブラリー館長。多摩大学大学院客員教授。早稲田情報技術研究所取締役。ブンシン合同会社CEO。翻訳者。IT戦略コンサルタント。ビッグデータと人工知能の技術ベンチャー企業データセクション株式会社の創業者。同社を上場させた後、顧問に就任し、教育とITの領域でイノベーションを追求している。デジタルハリウッド大学大学院では「テクノロジー特論 Bデータ」、多摩大学経営大学院で「先端テクノロジー・マーケティングイノベーション」を教える。2024年1月デジタルハリウッドで生成AI教育プログラムを開発するブンシン合同会社CEOに就任し、生成AIの活用を教える「プロンプト・エンジニアリング・マスターコース」を創設し、自ら主任講師として教鞭をとっている。その他に、洋書を紹介するブログを運営しており、『WIRED』日本版などのメディアに書評を寄稿している。

      書籍の概要

      頭がいい人のChatGPT&Copilotの使い方』(橋本大也 著)

      • 人気のカテゴリー
        • 情報社会
        • メディアと社会
        • ナレッジマネジメント

      画像生成AI Stable Diffusionスタートガイド』(白井暁彦 著)

      • 人気のカテゴリー
        • デザイン
        • コンピュータサイエンス
        • 人工知能

      これらの書籍は大学のメディアライブラリ(図書館)にも配架されています。

      イベント参加のメリット

      このイベントに参加することで、生成AIの最新情報を直接学ぶことができます。また、デジタルハリウッド大学の専門家からの貴重なインサイトを得ることができ、ネットワーキングの機会も豊富です。さらに、#SD黄色本のサイン本を手に入れるチャンスもあります。

      まもなく定員の150名に到達します

      申込みは無料、イベントページへ。

      https://ai-maruwakari-night.peatix.com

      当日はAICU mediaのスタッフに会えるかも?

      書籍:画像生成AI Stable Diffusionスタートガイド