タグ: Stabilityai

  • 新ドメイン「AICU.jp」のおしらせ

    新ドメイン「AICU.jp」のおしらせ

    2024年12月17日、「つくる人をつくる」をビジョンに「わかるAIを届ける」を続けてきたAICUが、新たなドメイン「AICU.jp」で活動を開始します。

    画像

    2つの「AICU」でパワーアップ!!

    2023年7月24日に米国企業として創立したAICU Inc.と2024年11月11日に日本企業として創立したAICU Japan株式会社は独立した企業体として活動します。

    画像

    今後、AICU Inc. (本社・米国サニーベール/CEO Akihiko SHIRAI, Ph.D)は、
    国際企業連携、Kindle、日本企業やAI時代のクリエイターの海外進出支援を中心に、ライツ管理、ライセンシングを担当します。
    Amazon/Kindleを中心に展開している出版事業は変わらず「AICU media」となります。

    新生「AICU Japan株式会社」(本社・港区)は、50万PV・1,200フォロワー・年間365本、連続投稿200日を超えるnoteでの記事開発をより強化し、クリエイティブAIによって企業や大学、公共のDXを推進する「AIDX事業」、AIキャラクターやAITuberなど「AI-IP」事業、そして検定試験やスキル認定などを行う「Cert事業」を担当します。

    「つくる人をつくる」AI時代のクリエイターの育成を強化

    既存のnoteや出版事業は便宜上「AICU編集部」と呼び、編集長は代表であるしらいはかせ(白井暁彦)が担当し、コラボクリエイターの増強や、資金調達、採用活動を強化し、いままで以上に品質高くAICUのビジョンである「つくる人をつくる」を実行してまいります。

    従来よりご協力いただいてきたコラボクリエイターの皆様には、今後も変わらず、また、より活躍の場を創出すべく、メンバーシップの強化、コンテストやワークショップ、ギャラリーイベントや展示会といった「単なる知識獲得ではない」コミュニティ醸成機会の開発、国際イベントへの出展、上映、発信支援といった形で応援してまいります。

    https://ja.aicu.ai/aicu-siggraph-asia-20241204

    新ドメイン「AICU.jp誕生」

    2023年10月より、日本最大のブログサイト「note」にて運用してきた AICU media(note.com/aicu)ですが、これまでの記事を継承する形で今後はAICU Japan株式会社が、新ドメイン「aicu.jp」にて運用をいたします。過去記事は自動でリダイレクトされ、読者の皆様への影響は軽微でありますが、より短いURLで、読者の皆様にアクセスしやすくなることを心がけていきます。

    既存の商品群はAICU Inc.で継続

    Kindleおよびペーパーバックで配本中の月刊誌「AICU Magazine」をはじめ、『SD黄色本』で親しまれている「画像生成AI Stable Diffusionスタートガイド」(SBクリエイティブ刊)は国際出版プロジェクトとして複数の言語での翻訳版が準備されています。生成AIブームの火付け役となった英国「Stability AI」や、クリエイティブ学習メディアの注目企業・韓国「Coloso」とのコラボレーション成果である「生成AIクリエイティブAICU」の3本のラーニングメディア番組「超入門:Stable Diffusionではじめる画像生成AI」、「初級者:広告企画から動画制作までのプロセス」、「ComfyUIマスター:カスタムノードとアプリ開発」は、おかげさまで大きな反響をいただき、多くの方から感謝やフィードバックをいただいております。

    国際連携では2024年12月16日から応募開始した国際AI映像制作コンペ「Project Odyssey」に公式スポンサーとして参加しており、日本からのクリエイターの応募を支援させていただいております。

    https://aicu.jp/n/ne4456e0ed64a

    今回の新ドメインでの noteブログ展開は、既存のAICUファンの皆様の利便性を損なわずに、より多くのユーザーにとって、柔軟かつ品質高く、先進的なサービスを提供しやすくする施策となっております。

    新サービスの開発も進行中

    読み物メディア中心で展開してきたAICUですが、新ドメイン「AICU.jp」でのサービスは note をさらに活用し、ファンの皆様のご期待やお悩みに答えられるような価値あるサービス、商品、イベントをスピード感速く開発してまいります。
    AIDXとは「AIによるDX」というAICUの造語ですが、LINEやDiscord, Difyを使ったチャットボット開発、AIキャラクター運用、クリエイティブAIサービス、大学・自治体・企業等の社内教育、PoC開発や研究開発戦略や、映像制作・漫画・広告や出版、イベント、ワークショップ開発など、既存のIT産業だけでは解決しない「AI+プロフェッショナル」の情報メディア、コンテンツ生成マネジメント、イメージングソリューションを展開していきます。

    https://ja.aicu.ai/gammamy-20241011
    https://ja.aicu.ai/comfymaster30-aws-20241105

    日本のパートナー企業との連携を促進

    AI時代のオープンソースソフトウェアを活用するクリエイティブAI分野の世界的なリーディングカンパニーとして、成果物もオープンに、多様なパートナー企業と連携できるよう、AIラーニングメディアのOEMや提携、ソリューションの導入支援やブランディング、パートナー企業との連携も積極的に行ってまいります。

    https://ja.aicu.ai/sora-20241214

    イベント等の掲載依頼などはこちらで承っております。

    https://ja.aicu.ai/aicu-20241121

    お問い合わせは X@AICUai のDMまでいただけましたら幸いです。

    以上、お知らせとなります。
    今後とも宜しくお願いいたします。

    AICU Inc. / AICU Japan株式会社  社員一同

    #AICU #AI #生成AI  #AIとやってみた
    #画像生成AI  #画像生成 #Stabilityai

    Originally published at https://aicu.jp/ on Dec 16, 2024.

  • Stability AI、Amazonとの連携を拡大 – Stable Diffusion 3.5 LargeがAmazon SageMaker JumpStartで利用可能に

    Stability AI、Amazonとの連携を拡大 – Stable Diffusion 3.5 LargeがAmazon SageMaker JumpStartで利用可能に

    主なポイント:

    • Stability AIは、Amazon Web Services (AWS) との連携を拡大し、最先端のテキスト画像生成モデルであるStable Diffusion 3.5 LargeをAmazon SageMaker JumpStartで提供開始しました。
    • 世界中のスタートアップ企業や大企業は、この最先端技術にアクセスし、プロフェッショナルグレードの画像を大規模に作成できます。
    • 80億のパラメータを持つStable Diffusion 3.5 Largeは、3D、写真、線画、絵画などのスタイルで高品質な1メガピクセルの画像を生成することに優れており、プロンプトの精度と画質の両方でより大きなモデルよりも優れたパフォーマンスを発揮します。
    • Stable Diffusion 3.5 Largeの使用を開始するには、Amazon SageMaker JumpStartをご覧ください。

    Stability AIは、最先端のテキスト画像生成モデルであるStable Diffusion 3.5 LargeがAmazon SageMaker JumpStartで利用可能になったことをお知らせしています。これは、2023年7月にStable Diffusion XL (SDXL 1.0) がリリースされて以来、SageMaker JumpStartで初めて登場する新しいStable Diffusionモデルとなります。

    今回のAWSとの連携拡大により、スタートアップ企業と大企業の両方に最新の生成AIツールが提供されることになります。これにより、SageMaker JumpStartの仮想プライベートクラウド (VPC) 内にStable Diffusion 3.5 Largeを安全にデプロイし、データ保護とプライバシーを確保できます。

    Stability AIの最先端技術とAWSのリーチを組み合わせることで、世界中の企業が、このテクノロジーを使用してプロフェッショナルグレードの画像を大規模に作成できるようになります。

    モデルの優位性

    Stable Diffusion 3.5 Large は、プロンプトへの忠実度と画質において最高レベルのパフォーマンスを維持しながら、以下の分野で優れています。

    • 効率的なパフォーマンス: 幅広いユーザーがアクセスしやすく、使いやすくなるように、効率性のために最適化されています。
    • 多様な出力: 広範なプロンプトを必要とせずに、1種類の人々だけでなく、さまざまな肌の色や特徴を持つ、世界を代表する画像を作成します。
    • 多様なスタイル: 3D、写真、絵画、線画など、想像できるほぼすべてのビジュアルスタイルを生成できます。

    アイデア出しから制作まで、このモデルは、ビジュアルメディア制作パイプライン全体で貴重なクリエイティブパートナーとして機能し、メディア、ゲーム、広告などの業界をサポートします。

    使用開始するには

    Stable Diffusion 3.5 Largeモデルは、本日(2024年11月15日)よりAmazon SageMaker JumpStartで利用可能です。使用方法とSageMaker Studioの設定方法の詳細については、Amazon SageMaker Studioのドキュメントを参照してください。

    https://docs.aws.amazon.com/sagemaker/latest/dg/studio.html

    https://aws.amazon.com/jp/pm/sagemaker

    安全性へのコミットメント

    Stability AIは、安全で責任あるAIの実践を信条としており、開発の初期段階から整合性を確保するための対策を講じています。これは、悪意のある人物によるStable Diffusion 3.5の悪用を防ぐために、合理的な措置を講じており、今後も講じていくことを意味します。安全性への取り組みの詳細については、Stable Safetyページをご覧ください。

    https://stability.ai/safety

    Originally published at https://note.com on Nov 15, 2024.

  • Stable Diffusion 3.5 Medium 登場! 盛り上がる開発者コミュニティ、LoRAやSkip Layer Guidance (SLG)で指も改善?

    2024年10月29日(日本時間)、Stability AIから予告通り、最新の画像生成モデル「Stable Diffusion 3.5 Medium」がオープンリリースされました。

    Stable Diffusion 3.5 Medium が登場しました!

    このオープンモデルは、25億のパラメータを持ち、消費者向けハードウェア上で「箱から出してすぐに」動作するように設計されています。

    ブログにMediumの内容を追加しています。ぜひご覧ください。

    https://x.com/StabilityAI_JP/status/1851268389140119774

    https://ja.stability.ai/blog/introducing-stable-diffusion-3-5

    「消費者向けハードウェア…!?」というドヨメキがAICU media編集部に響き渡ったのですが、Stability AI公式が具体的なモデル名とGPU製品名で推奨動作表を提供しています。

    画像
    https://ja.stability.ai/blog/introducing-stable-diffusion-3-5

    Stable Diffusion 3.5 Medium (以下、SD3.5M) は 2.5B(25億パラメータ)のモデルであり、NVIDIA GeForce RTX 3080 (VRAM 10GB以上) が推奨になっています。NVIDIA GeForce RTX 4060 (VRAM 6GB)では、[!] という黄色いマークがつけられており、「[!] indicates the model requires performance – compromising optimizations, such as quantization or sequential offloading, to run on this device.」(モデルをこのデバイスで実行するには、量子化や順次オフロードなどのパフォーマンスを犠牲にした最適化が必要であることを示します)と書かれています。

    ダウンロードはこちらから、ファイルサイズは4.75GBです。

    https://huggingface.co/stabilityai/stable-diffusion-3.5-medium/resolve/main/sd3.5_medium.safetensors?download=true

    なお、SD3.5 Large (80億パラメータ)も配布されています(ファイルサイズとしては16.5GB!です)。動作させるには32GB VRAMを搭載した NVIDIA H100クラスのGPUが必要とのことです。

    https://huggingface.co/stabilityai/stable-diffusion-3.5-large/blob/main/sd3.5_large.safetensors

    https://github.com/Stability-AI/sd3.5

    Google Colab上でweightをダウンロードするテクニック!

    Google Colab上で、HuggingFaceに置かれたStable Diffusion 3.5 MediumやLargeを活用したい!でもHuggingFaceでの認証が通らないのでwgetすることができない…なんて諦めてしまったひとはいませんか?

    AICU AIDX Labではこんな方法で、自動でダウンロードできるスクリプトを組んでいます。
    まずはGoogle Colabの「シークレット機能」を使って、HuggingFaceのAPIキーを保存します。ここでは「HF_TOKEN」という名前にしてあります。

    画像

    Google Colabノートブック上でこちらのHF_TOKENにアクセスを許可して、以下のようなコードを書きます。

    #!wget -c https://huggingface.co/stabilityai/stable-diffusion-3.5-medium/resolve/main/sd3.5_medium.safetensors  -P ./models/checkpoints
    # %cd /content/drive/MyDrive/ComfyUI/models/checkpoints
    !pip install huggingface_hub
    
    import os 
    from google.colab import userdata
    os.environ['HF_TOKEN'] = userdata.get('HF_TOKEN')
    !huggingface-cli login --token $token
    
    token = userdata.get('HF_TOKEN')
    from huggingface_hub import hf_hub_download
    hf_hub_download(repo_id="stabilityai/stable-diffusion-3.5-medium", filename="sd3.5_medium.safetensors", local_dir="/content/drive/MyDrive/ComfyUI/models/checkpoints")
    

    hf_hub_download(repo_id=”stabilityai/stable-diffusion-3.5-medium”, filename=”sd3.5_medium.safetensors”, local_dir=”/content/drive/MyDrive/ComfyUI/models/checkpoints”)

    と書くことで、HuggingFaceにログインした状態でファイルを指定ディレクトリに直接ダウンロードできます!これは便利。

    画像

    参考:その他のHuggingFaceの使いこなしはこの記事でも扱っています。

    盛り上がる開発者コミュニティ

    AICU media編集部でもSD3.5のリリース直後から評価に入っています。

    日本人などの人種や肌の多様性は確認できましたが、一方で「指の正確さ」については難があるという印象を得ましたが、実はその後、急速にコミュニティ内で改善が見られるので共有したいと思います。

    まずは、sampler をEuler Ancestral (Euler_a) にする!

    集合知的に様々なノウハウが集まってきていますが、SD3.5でMMDiT-Xにモデルが変わっていることもあり、サンプラーについても見直しが必要なようです。

    指に関しては、Euler Ancestral (Euler_a)がよいという説があります。

    世界のKohya氏、LoRA対応を追加。

    LoRA学習スクリプト「sd-scripts」を開発し、世界中のStable Diffusionコミュニティの英雄ともいえるKohya氏がSD3.5M対応をGitHubリポジトリにプッシュしました。

    https://github.com/kohya-ss/sd-scripts/pull/1719

    コメントでは世界中の開発者からの検証結果が寄せられ始めています。

    Civitaiによるマニュアル・ワークフローの提供

    SD3公開直後、荒れた瞬間があったCivitaiコミュニティですが、SD3.5については公式のエデュケーションブログやワークフローの公開が提供されています。

    せっかくなので翻訳を提供していきたいと思います。最新のモデルと専門用語を学ぶうえでも大変役に立ちます。

    Stable Diffusion 3.5 Mediumクイックスタートガイド

    Stable Diffusion 3.5 Mediumは、画質、タイポグラフィ、複雑なプロンプトの理解、リソース効率の向上を実現する、マルチモーダル拡散トランスフォーマー(MMDiT-x)をベースにしたテキスト画像生成モデルです。

    注記: このモデルはStability Community Licenseの下でリリースされています。商用ライセンスについては、Stability AIのサイトをご覧いただくか、当社までお問い合わせください。

    モデルの説明

    • 開発元: Stability AI
    • モデルの種類: MMDiT-Xテキスト画像生成モデル
    • モデルの説明: このモデルは、テキストプロンプトに基づいて画像を生成します。3つの固定の事前学習済みテキストエンコーダー、トレーニングの安定性を向上させるためのQK正規化、および最初の12個のトランスフォーマーレイヤーにおけるデュアルアテンションブロックを使用する改良版マルチモーダル拡散トランスフォーマー(https://arxiv.org/abs/2403.03206)です。

    ライセンス

    • コミュニティライセンス: 年間総収益が100万ドル未満の組織または個人の研究、非商用、および商用利用は無料です。詳細はコミュニティライセンス契約をご覧ください。https://stability.ai/license で詳細をご覧ください。
    • 年間収益が100万ドルを超える個人および組織の場合:エンタープライズライセンスを取得するには、当社までお問い合わせください。

    実装の詳細

    • MMDiT-X: トランスフォーマーの最初の13レイヤーに自己注意モジュールを導入し、マルチ解像度生成と全体的な画像の整合性を強化します。
    • QK正規化: トレーニングの安定性を向上させるためにQK正規化技術を実装します。
    • 混合解像度トレーニング:
      • プログレッシブトレーニングステージ:256→512→768→1024→1440の解像度
      • 最終段階には、マルチ解像度生成パフォーマンスを向上させるための混合スケール画像トレーニングが含まれていました
      • 低解像度ステージでは、位置埋め込み空間を384×384(潜在)に拡張
      • 混合解像度とアスペクト比の全範囲にわたるトランスフォーマーレイヤーの堅牢性を強化するために、位置埋め込みにランダムクロップ拡張を採用しました。たとえば、64×64の潜在画像が与えられた場合、トレーニング中に192×192の埋め込み空間からランダムにクロップされた64×64の埋め込みをxストリームへの入力として追加します。

    これらの機能強化は、マルチ解像度画像生成、一貫性、および様々なテキスト画像タスクへの適応性におけるモデルのパフォーマンス向上に総合的に貢献しています。

    • テキストエンコーダー:
      • CLIP:OpenCLIP-ViT/G、CLIP-ViT/L、コンテキスト長77トークン
      • T5:T5-xxl、トレーニングのさまざまな段階でのコンテキスト長77/256トークン
    • トレーニングデータと戦略:
      • このモデルは、合成データやフィルタリングされた公開データなど、様々なデータでトレーニングされました。

    元のMMDiTアーキテクチャの技術的な詳細については、研究論文を参照してください。

    使用方法と制限事項

    • このモデルは長いプロンプトを処理できますが、T5トークンが256を超えると、生成された画像の端にアーティファクトが発生する場合があります。ワークフローでこのモデルを使用する場合はトークン制限に注意し、アーティファクトが目立ちすぎる場合はプロンプトを短くしてください。
    • MediumモデルはLargeモデルとはトレーニングデータの分布が異なるため、同じプロンプトに同じように反応しない場合があります。
    • より良い構造と解剖学的整合性を得るためには、Skip Layer Guidanceを使ったサンプリングを推奨します。

    実装の詳細

    • MMDiT-X: トランスフォーマーの最初の13層に自己関心モジュールを導入し、マルチ解像度生成と全体的なイメージの一貫性を強化。
    • QK正規化: トレーニングの安定性を向上させるために、QK正規化技術を導入。
    • 混合解像度トレーニング:
      • 段階的なトレーニングステージ:256 → 512 → 768 → 1024 → 1440解像度
      • 最終段階では、マルチ解像度生成性能を高めるために、混合スケール画像のトレーニングを実施
      • 低解像度段階では、位置埋め込み空間を384×384(潜在)に拡張
      • 混合解像度およびアスペクト比の全範囲にわたってトランスフォーマー層の頑健性を強化するために、位置埋め込みにランダムなクロップ拡張を採用しました。例えば、64×64の潜在画像が与えられた場合、192×192の埋め込み空間からランダムにクロップした64×64の埋め込みを、xストリームへの入力としてトレーニング中に追加します。

    これらの強化により、多様なテキストから画像へのタスクにおける、マルチ解像度の画像生成、一貫性、適応性の向上というモデルのパフォーマンス改善に総合的に貢献しています。

    • テキストエンコーダー:
      • CLIPs: OpenCLIP-ViT/GCLIP-ViT/L、文脈の長さ77トークン
      • T5: T5-xxl、トレーニングの異なる段階における文脈の長さ77/256トークン
    • トレーニングデータと戦略:
    • このモデルは、合成データやフィルタリングされた公開データなど、さまざまなデータでトレーニングされています。

    MMDiT-X

    Stable Diffusion 3.5 Medium は、画像品質、タイポグラフィ、複雑なプロンプトの理解、リソース効率の向上を特徴とする、改良された Multimodal Diffusion Transformer with improvements (MMDiT-X; マルチモーダル拡散トランスフォーマー)によるテキストから画像へのモデルです。

    画像

    MMDiTのオリジナルアーキテクチャの技術的な詳細については、研究論文を参照してください。

    使用法と制限事項

    • このモデルは長いプロンプトを処理できますが、T5トークンが256を超えると、生成の端にアーティファクトが発生することがあります。このモデルをワークフローで使用する際はトークン制限に注意し、アーティファクトが顕著になる場合はプロンプトを短くしてください。
    • 中規模モデルは大規模モデルとは異なるトレーニングデータの分布であるため、同じプロンプトに対して同じように反応しない場合があります。
    • より良い構造と解剖学的整合性を得るために、Skip Layer Guidanceでサンプリングすることをお勧めします。

    Skip Layer Guidance (SLG)の推奨

    Stability AIが提案している方法としてはSkip Layer Guidance (SLG)です。Skip Connection(残差接続)についてはこちらの日本語解説が詳しいです。これによって指の改善がStability AIによって提案されており、ComfyUIやHuggingFaceでも試されています。

    https://github.com/comfyanonymous/ComfyUI/pull/5404

    https://github.com/huggingface/candle/issues/2588

    スキップ レイヤー ガイダンス (SLG) は、特定の範囲のサンプリング ステップで元の CFG に追加のガイダンスを追加するサンプリング手法です。追加のガイダンスは、元のモデルからの正の DiT モデル出力から、特定のレイヤー (たとえば、Stable Diffusion 3.5 Medium の場合はレイヤー 7、8、9) が削除されたバリアント モデルからの正のモデル出力を減算して比較することによって計算されます。

    SLG はオプションの選択肢のように見えますが、SAI は Stable Diffusion 3.5 Medium に対して SLG を有効にすることを公式に推奨しているようです。証拠には以下が含まれます:HuggingFace Hub の公式リポジトリでは、 SLG が有効になっているComfyUI ワークフローが提供されています。
    公式リファレンス デザイン GitHub リポジトリStability-AI/sd3.5には、SD3.5-medium の SLG をサポートする最近の変更が含まれています。
    Stable Diffusion 3.5 Medium での SLG の使用について取り上げたReddit (例:こちら) および Twitter/X (例:こちら) の投稿では、SLG の使用は「解剖学的失敗の可能性を減らし、全体的な一貫性を高める」ために重要であると思われると示唆されており、複数の独立した投稿がこの主張を相互検証しています。

    HuggingFaceにおいてワークフローが配布されています。

    https://huggingface.co/stabilityai/stable-diffusion-3.5-medium/resolve/main/SD3.5M_SLG_example_workflow.json?download=true

    さいごに


    今後も、Stable Diffusionを中心としたオープンな画像生成モデルとそのコミュニティの熱狂は続きそうです。

    AICUとしては「つくる人をつくる」をビジョンにする専門AIメディアとして今後も、公平に、Stability AIやコミュニティの活動を応援していきたいと考えています。

    Originally published at https://note.com on Oct 30, 2024.

  • AICU Magazine Vol.5 紙版リリース!! 特集は「Stability AI Forever!」

    「つくる人をつくる」あなたをアップデートするクリエイティブAIエンターテイメントマガジン「AICU Magazine Vol.5」特集は「Stability AI Forever!」です。

    Kindle Unlimitedにて無料です!
    内容もアップデートされています
    (既に購入された方は自動でアップデートされます)

      特集「Stability AI Forever!」

      2022年8月に画像生成AI「Stable Diffusion」をStability AI が無償公開してから2年。API時代の Stability AI 入門から2024年10月22日に公開された「Stable Diffusion 3.5」まで。
      AICU創業前からの研究成果を凝縮し、GPU不要でも高画質・高品質で画像生成が学べる今後長年にわたって役に立つ情報と歴史を込めて「Forever!」とした総力特集です。

      【基礎編】公式サンプルで学ぶ Stability AI APIの基本!

      Stability AI API Guide の基本としてGenerate API と「TextToImage の最近の文法」を総ざらい!Google Colab を使って、基本的な操作に慣れていきましょう。

      【生成編】Stable Diffusion 3.x 時代に知っておきたい新常識

      この記事ではこの先の画像生成の時代に長く役に立つ「モデルとの対話テクニック」とStable Diffusion 3 時代に知っておきたいプロンプトの新常識についてお伝えします。

      画像

      【活用編】Stability AI API の革新的機能「Edit API」

      丁寧に書かれた解説から紹介します!(画面は印刷版になります)

      画像
      画像
      画像

      【告知】Coloso 講座「超入門: Stable Diffusion ではじめる画像生成AI」

      講座内容についての紹介です

      画像

      ▼講座ページはこちらhttps://j.aicu.ai/coloso1
      ▼ティザー動画はこちら 
       https://www.youtube.com/watch?v=J7VikMNfS50

      講座中で紹介している資料なども共有しています。

      画像
      画像

      【3D 編】Stable Fast 3D をGoogle Colab で動かす

      魅力的な機能をたくさん備えた「Stability AI API」を使いこなすシリーズで
      す。今回は、2024 年8 月に公開された「Stable Fast 3D」を使ってみます。このAPI は、単一の2D 入力画像から高品質な3D アセットを生成します。

      画像

      【ツール編】「Stable Assistant」だとこんなに簡単!

      これまでStability AI API について解説してきましたが、業務的な利用ではな
      く、よりカジュアルに使いたいユーザーには「Google Colab は大変そう」と思うかもしれません。そんな方にはこちら、Stability AI がリリースした「Stable Assistant」はいかがでしょうか。画像生成AI「Stable Diffusion」の最新版に加えて、動画生成、音楽生成、テキスト生成までできるオールインワンのAI クリエイティブツールです。

      画像
      画像

      【研究編】 SD3Mチュートリアルから読んだ Stability AIの「新モデル」

      Stability AIのYeo Wangさんによる公式ブログ記事を読みやすく解説。「新モデル」についての情報も。

      画像
      画像

      https://note.com/aicu/n/n4eda1d7ffcdf

      【未来予測】「Stable Diffusion 3.5」リリースと今後の Stability AI

      以上、120 ページ以上にわたって、Stability AI の最新のAPI やツール、研究について紹介しています。本特集を締めくくるに相応しいリリース、「Stable Diffusion 3.5」が、先日2024 年10月22 日23 時(日本時間)にアナウンスされました。AICU 編集部では「日本人の生成」を通してSD3.5 の最速レビューを実施しました。

      ▼【最速レビュー】Stability AI 最新ベースモデル「Stable Diffusion」

      サクッと先取り! クリエイティブAI ツール

      Suno でオリジナル曲を完成させよう!

      AICU コラボクリエイターのぽんず(@ponzponz15) さんによるSuno紹介です。

      オリジナル楽曲の作り方を丁寧に解説しています!

      画像
      画像

      【告知】Coloso 講座第2 弾「広告企画から動画制作」

      Colosoとのコラボラーニングメディア第2弾「初級者:広告企画から動画制作までのプロセス」がいよいよリリースです。今回の講座では、生成AIツールを活用した広告の企画から動画と楽曲制作まで、初心者でも制作できるように解説します。動画を中心としたデジタルクリエイティブや広告を制作しながら、生成AIの魅力と可能性を世の中に伝えています。

      生成AI時代の動画広告プロダクションを理解

      ・生成AI時代における動画制作工程のパラダイムシフトに対応するための知識を、各生成AIツールの設定や特徴と共に解説します。
      ・生成AIを活用したプロモーションビデオ制作方法を習得
      ・MidjourneyとRunway、Sunoを活用したキャッチーなCM動画制作の全プロセスを、基礎から学ぶことができます。

      プランニングにおける生成AIの活用方法

      ・動画広告制作の過程やプランニングをする上で、生成AIを活用してより効率的にする方法を、実演を通して分かりやすく解説します。
      ・本講座を通して、生成AIを用いた動画制作に挑戦することで、生成AIの活用法を学んでいただければ幸いです。

      講座内容
      ・マーケティング戦略に基づいた企画立案
      ・Midjourneyを使ったアイデア出しとビジュアル制作
      ・Runway Gen-3によるハイクオリティな動画生成
      ・Sunoを活用した、広告に最適な楽曲制作
      ・生成AI活用における著作権やリスクマネジメント
      受講特典
      AICUによる画像生成AI講座動画20講(期間無制限)
      ・香水と果物ジュースの2つのテーマで動画広告を制作
      ・講座内容に関するPDFデータなどの資料を提供
      講師紹介

      画像

      藤吉香帆:動画クリエイター、セツナクリエイション合同会社 代表取締役。デジタルハリウッド大学 非常勤講師。

      ぽんず:生成AIクリエイター。各種イラスト・動画コンペで受賞歴多数。

      白井暁彦:生成AIクリエイティブAICU代表。デジタルハリウッド大学大学院 特任教授。著書に「AIとコラボして神絵師になる 論文から読み解くStable Diffusion」など。

      こんな方におすすめ

      ・動画広告制作に興味がある方
      ・生成AIを使ったクリエイティブ制作を学びたい方
      ・広告代理店や制作会社で働く方
      ・最先端の広告制作スキルを身につけたい方

       今ならお得な割引キャンペーン実施中!
      いよいよ、2024年10月31日リリース予定です。発売後は割引価格が終了します!
      詳細はこちら: [https://j.aicu.ai/coloso2]

      https://j.aicu.ai/coloso2

      藤吉香帆さんによるナレーション!
      コロソでお待ちしております。

      ComfyUI とSAM2 でセグメンテーションをマスターしよう

      動画も高精度に!ComfyUIとSegment Anything Model 2(SAM 2)でセグメンテーションをマスターしようYas (@earlyfield8612)による寄稿です。

      イベントレポート

      • 結果発表!!「デルタもん4コマ漫画コンテスト」#デルタもん4コマ #AICU #BlendAI
      • Stability AI も登壇!「AIが変える 美容&ファッションのミライ」 #AIイベント情報

      BlendAI通信

      • BlendAI第1回ファンミーティング潜入レポート!デルタもん誕生秘話から新キャラ「ガンマミィ」、さらに壮大な計画まで明らかに!
      • ガンマミィ誕生記念! イラストコンテストを開催

      連載漫画「ウワサの大型新人」

      画像

      読者のひろば

      • 編集長とGemini たん: AI 開発案件に起きている地殻変動
      • カバーアート 「秋の妖精」 ないとっちさん
      • はるしね~しょん(編集部だより)

      表紙 by犬沢某さん @insbow

      今すぐKindleで手に入れよう!
      Kindle Unlimitedで無料 

      その他

      • Coloso「生成AIクリエイティブ AICU」シリーズ 5,000円割引クーポンコード付き!(有効期限あり)
      • AniFusion初月半額コード付き!

      AICU Magazine Vol.5 は、Stability AI の世界を深く探求したい、クリエイティブな挑戦をしたいあなたのための、まさに”バイブル”と言える一冊です!

      紙版のリリースは10月30日を予定しております

      ご購入は j.aicu.ai/MagV5 から

      https://j.aicu.ai/MagV5

      https://j.aicu.ai/MagV4

      https://j.aicu.ai/MagV3

      Originally published at https://note.com on Oct 27, 2024.

    1. 【最速レビュー】Stability AI 最新ベースモデル「Stable Diffusion 3.5」リリース!Stability AI APIで「日本人の生成」を試してみた!

      2024年10月22日23時(日本時間)、Stability AI による最新ベースモデル「Stable Diffusion 3.5」のオープンリリースがアナウンスされました。
      AICU編集部では「日本人の生成」を通してSD3.5の評価を実施しました。

      最もパワフルなStable Diffusion 3.5をご紹介します。 このオープンリリースには、そのサイズに対して高度にカスタマイズ可能で、民生用ハードウェアで動作し、寛容なStability AI Community Licenseの下、商用・非商用ともに無料で使用できる複数のバリエーションが含まれています。 Hugging FaceのStable Diffusion 3.5 LargeとStable Diffusion 3.5 Large Turbo、そしてGitHubの推論コードを今すぐダウンロードできます。 Stable Diffusion 3.5 Mediumは10月29日にリリースされる予定です。

      https://x.com/StabilityAI/status/1848729212250951911

      日本語版公式リリースより

      リリースされるもの

      • Stable Diffusion 3.5 Large: 80億のパラメータ、1メガピクセル解像度。
      • Stable Diffusion 3.5 Large Turbo: Stable Diffusion 3.5 Large の蒸留版、わずか4ステップで高品質な画像を生成。Stable Diffusion 3.5 Largeよりもはるかに高速。
      • Stable Diffusion 3.5 Medium (10月29日リリース予定): 26億のパラメータ、改良されたMMDiT-Xアーキテクチャとトレーニング方法により、カスタマイズのしやすさと画質を両立させ、コンシューマー向けハードウェアで「箱から出してすぐに使える」ように設計されています。0.25~2 メガピクセルの解像度の画像を生成できます。

      モデルの特徴(公式リリースより)

      モデルの開発にあたっては、柔軟な基盤を構築できるよう、カスタマイズ性を優先しました。これを実現するために、Query-Key Normalization をトランスフォーマーブロックに統合し、モデルのトレーニングプロセスを改善し、さらにファインチューニングや開発を簡素化しました。
      このレベルの下流での柔軟性をサポートするために、いくつかのトレードオフが必要でした。異なるシードを使用した同じプロンプトからの出力に、より大きなばらつきが生じる可能性があります。これは意図的なもので、ベースモデルにおける幅広い知識ベースと多様なスタイルの維持に役立ちます。しかし、その結果、特定性のないプロンプトでは出力の不確実性が増大し、見た目のレベルにばらつきが生じる可能性があります。
      特にMediumモデルでは、品質、一貫性、およびマルチ解像度生成能力を向上させるために、アーキテクチャとトレーニングプロトコルにいくつかの調整を加えました。

      モデルの優位性

      • カスタマイズ性: 特定のクリエイティブニーズを満たすために、モデルを簡単にファインチューニングしたりカスタマイズされたワークフローに基づくアプリケーションを構築したりすることができます。
      • 効率的なパフォーマンス:特にStable Diffusion 3.5 MediumおよびStable Diffusion 3.5 Large Turbo モデルでは標準的な一般消費者向けのハードウェアで高負荷をかけずに実行できるように最適化されています。
      • 多様な出力:広範な指示を必要とせずに、特定の人物だけでなく、さまざまな肌の色や特徴を持つ世界を代表するような画像を作成します。
      画像
      • 多彩なスタイル:3D、写真、絵画、線画など、幅広いスタイルと美しさを生成することが可能です。また、想像可能なほぼすべての視覚スタイルにも対応しています。
      画像

      Stable Diffusion 3.5 Medium は、他の中型モデルを上回る性能を持ち、プロンプトの再現性と画像品質のバランスに優れていますので、効率的で高品質なパフォーマンスを求める場合の最適な選択肢となりうるでしょう。

      画像

      Stability AI Community license の概要

      https://ja.stability.ai/blog/introducing-stable-diffusion-3-5

      community license の概要は以下の通りです。

      • 非営利目的の場合は無料: 個人および組織は、科学研究を含む非営利目的の場合、無料でモデルを使用することができます。
      • 商用利用も無料(年間収益100万ドルまで):年間収益が100万ドル未満のスタートアップ企業、中小企業、クリエイターは、商用目的でも無料でこのモデルを使用できます。
      • 成果物の所有権:制限付きライセンスを伴うことなく生成されたメディアの所有権を保持します。

      年間収益が100万ドル以上の企業は、エンタープライズライセンスをこちらからお問い合わせください。

      ComfyUIが即日対応

      そしてまさかのComfyUIがリリース即日対応を発表しました。

      まさかこんなことが起こるなんて!Stable Diffusion 3.5がリリースされました!Stable Diffusion 3.5モデルシリーズの初日サポート開始をお知らせできることを嬉しく思います!SD3.5の使用を開始するには、当社のブログをフォローするか、ベータ版の「missing model」機能を使用してモデルをダウンロードしてください。スキルは必要ありません!

      https://x.com/ComfyUI/status/1848728525488197963

      昨日リリースされた内容はこちらです。
      missing model機能について、チェックしていかねばですね!

      いますぐ触りたいアナタに!

      HuggingFace Spacesにて試用環境が公開されています
       Stable Diffusion 3.5 Large (8B)

      https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large

      公開直後のため、流石に混雑しているようです。同時に公開されたTurboのほうが使えそうです。

      Stable Diffusion 3.5 Large Turbo (8B)

      https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large-turbo

      画像

      文字表現についても機能は維持されているようです。
      「gemini boys with a panel written “AICU”」

      画像

      公式APIでの「Stable Diffusion 3.5 Large」

      Stability AI 公式APIマニュアルによると、既にGenerate APIとして提供が始まっています。APIキーを取得し、Open Google Colabにアクセスしてください。

      [AICU版] Stability AI APIガイド
      https://note.com/aicu/n/n4eda1d7ffcdf

      公式Google Colab notebook へのリンク

      デフォルトの解像度は1Mピクセル、1024×1024です。
      modelパラメータのデフォルトが「sd3.5-large」になりました。
      {sd3-large, sd3-large-turbo, sd3-medium, sd3.5-large, sd3.5-large-turbo}
      クレジット消費は「生成成功につき」以下のとおりです。

      ・SD3.5 & 3.0 Largeは一律6.5クレジット
      ・SD3.5 & 3.0 Large Turbo:一律 4クレジット
      ・SD3 Medium:一律3.5クレジット。
      失敗した生成については請求されません。

      AICUによるSD3.5ギャラリー

      SD3.5にて生成
      「gemini girls with a panel which written “AICU”」

      画像
      画像

      SD3.5 Turboにて生成
      「textured palette knife oil painting of a cat riding a surfboard on the beach waves in summer. the cat has a mouse friend who is also riding the surfboard」

      画像

      良いものだけ紹介するのではなく、
      文字の描画を含めた連続生成の歩留まり率を表現してみます。
      「cinematic film still, action photo of a cat with “AICU loves SD3.5”, riding a skateboard through the leaves in autumn. the cat has a mouse friend resting on their head」
      SD3.5・同一プロンプト、Seed=0にて実験

      画像
      画像
      画像
      画像
      画像
      画像
      画像
      画像
      画像
      画像

      「Japanese girls with a panel which is written “AICU loves SD3.5″」

      画像
      画像

      実写系日本人の表現については、結構特徴掴んでいる感じがします。
      指の再現率については工夫が必要そうです。

      画像
      画像
      画像
      画像
      画像

      ネガティブプロンプトの効果を確認します。
      「bad finger, nsfw, ugly, normal quality, bad quality」を入れることで歩留まり率が上がりました。

      画像

      さいごに、ComfyUIのブログにあったプロンプトを紹介します。

      Prompt: A photorealistic 4K image of a woman with transparent, crystal-like skin, glowing from within with a soft golden light.
      NP:bad finger, nsfw, ugly, normal quality, bad quality

      画像
      画像

      AICU編集部のレビュー

      電撃リリースとなったStable Diffusion 3.5です。
      即日対応を実現したComfyUI、そして商用で試用する上で、APIとしての互換性は高く保たれているようなので安心しました。初期レビューとして少し触ってみた範囲ですが、人種の多様性、特に日本人の描写について多様性と表現力があることを確認しました。
      モデルの特性としての「カスタマイズ性」はどのようなところで発揮されるのか、ファインチューニング関係がComfyUIで登場することを期待します。また既存APIでのモデル間比較やEdit API、Style APIとの関係、そして10月29日に予定されているSD3.5Mリリース以降の動向も注目したいところです。

      【PR】商用でも利用できるStability AI APIを学びたいアナタへ
      超入門:Stable Diffusionではじめる画像生成AI

      https://j.aicu.ai/AICUXColosoJP

      Originally published at https://note.com on Oct 22, 2024.

    2. 「CGWORLD vol.315」画像生成AIによる表紙メイキング、大公開。

      2024年10月10日発売、CGWORLD vol.315 (2024年11月号)の表紙の制作に、AICU代表・白井暁彦が画像生成AIによるアートを提供いたしました。
      本稿ではその制作の裏側、画像生成AIによる商業出版およびVFX技術の実際の進行とワークフローを紹介したいと思います。

      ★本件は白井個人への依頼制作であり、個人クリエイターとしての寄稿となります。

      デジタルハリウッド大学30周年おめでとうございます。

      https://amzn.to/4dKt3jP

        実は、画像生成は全てStable Diffusion,  Stability AI APIで行っています。

        クレジットをご記載いただきました。

        画像

        本稿ではその制作の裏側を紹介させていただきます。

        画像

        杉山知之学長によるコンセプト解説です。

        1994年年末のデジタルコミュニケーションの夜明けから30年、歴史的な様々なトピックがありましたが、その世界が暮れていきます。だから、夕日をバックに、新たな夜明けを見る方向に向かって座っています。新たな夜明けは、AIと暮らす世界、シンギュラリティ・エラの到来を告げます。表4にキャラクターを乗せるアイデアは白井暁彦先生からです。メタバースなど様々なデジタル空間にパラレルで生きる姿の象徴です。アバターを引き連れて、新たな世界へ行きます(杉山学長)

        ・画像生成AIサービス
        背景・人物:Stability AI API, 主に Stable Image Ultra、Google Colabでの独自開発システムにより生成

        ・プロンプト(一部抜粋)
        背景:hippy style, (photoreal:2), futuristic, orange toned urban sight scene, cyber worlds with a nature fusioned, skyscraper buildings. seed = 59.
        人物:cyberpunk-themed mechanical robotic guitar hero, with a headset, neon-lit circuit tattoos on face, glowing white lines, looking at viewer, smile, passionate 40 years old man, prosthetic hand, with artificial respirator, with a super detailed guitar, color scheme of orange, dramatic orange and white lightings, intense expression, super detailed mechanical design,

        プロンプトによるtext to imageだけではなく、様々な技術を駆使していますが、まずは画像生成以外の制作の裏側を可能な限りで紹介していきたいと思います。

        最新のVFX技術による実写撮影

        まず、この杉山学長は本物、御本人による撮影です。
        2021年にALSを発症された杉山知之先生は、現在、人工呼吸器と車椅子の上で学長業務を遂行されています。

        祝辞などは本人の人工合成ボイスで行われています。

        https://note.com/dhu/n/nb71507b6921a

        筋肉の自由が奪われたとしても、呼吸を奪われたとしても、CG・VFX技術により、3D高解像度アバターや人工合成ボイスによって、人々に礼をして、若き才能を称賛する姿は、勇気を与えます。そう、これはALSという難病だけではなく、我々高度長寿化社会を生きる人生そのものをみているのかもしれないのです。

        人は生きるうえでは、社会とコミュニケーションしていかねばなりません。
        その姿をいかに、楽しいものにしていくか、挑戦の日々が続きます。

        御本人による直接のディレクション

        まず本件は、杉山知之学長自身のFacebookメッセンジャーによるDMによって直接のディレクションが行われました。

        画像

        https://note.com/mojo_sugiyama

        依頼は2024年8月16日17:41に届いたメッセージからはじまりました。

        画像

        左が杉山学長、右が白井です。

        画像

        Google DriveでCGWORLDの表紙レイアウトが届きました。
        間に、だれも、仲介や介在はいません。

        その日のうちに作ったプロト

        画像

        代表的な1枚をお送りしていますが、DriveのURLには専用の画像生成システムから生成した高品質画像が100枚ほど収められています。

        画像

        杉山学長の公式写真をベースにスタイル学習を行い、さまざまなポーズ、衣装、表情、レイアウトのバリエーションを作っていきます。
        シードとプロンプトを固定して、再現性を高く探求しています。

        たとえば1つのファイルを紹介します。

        “S40_PP_neon-punk style….MF0.50.png”というファイル名に、シードや処理の系統、プロンプトの一部が埋め込まれています。

        画像

        Stability AI APIと公式のGoogle Colabノートブックがベースになっていますが、その中の最新APIのなかでも特に高品質な「Stable Image Ultra」と、その公式サンプルが使われています。

        https://platform.stability.ai

        公式サンプルの状態では、画像の保存やプロンプトの探求は難しいので、画像の生成やスタイル学習のサンプルを改造して、以下のような機能が追加されています。

        画像

        ・APIキーの自動参照(セキュリティ機能)
        ・Google Driveへの画像保存
        ・プロンプトの3分割
        ・シードとフィデリティの制御

        テキスト画像生成だけでは制御性の高い画像は作れません。また未来的な雰囲気、杉山先生のヒッピーカルチャー、ギターなど難度の高い要素も盛り込んでいきつつ、画風としても写実性とキャラクターイラスト風を交えていきます。

        画像
        画像
        画像

        今回、ALSである現実を、そのまま世間にさらしたいという気持ちがあり、車椅子に乗って喉にパイプを通している姿は写真で行きます。 しかし白井先生の生成した人物を見ると、市民全員が高度に発達したVision Proのようなデバイスを付ければ、それぞれの人物が観られたい姿に変容して、相手に見え、誰に観られるかによって姿が変わる世界が可能と感じます。

        (視線入力や呼気式入力装置で、こんなふうに長い文章を打つのがどんなに大変か…)と思いながら、返信していきます。

        画像

        ・デジハリ風オレンジ
        ・表4(裏表紙)にアバターが登場するのもあり
        ・未来の自然と調和した街
        ・現実かメタバースかわからない感じ

        画像

        (信じられてしまった……)

        これはとても大事なポイントではありました。
        人を信じる、作風を信じる、という信じ方はあるとおもいますが
        「感覚を信じる」という点で、バランス感覚や遊びの感覚、かっこよさなども委託されつつも、感覚への信頼・信用が相互にかかってくる感じです。

        遊びつつも、襟を正しつつ、世界観と品質と、心象風景の画像化、共有を繰り返していきます。

        最新のVFX技術による実写撮影

        初期の依頼から10日経過、日々の業務の中でもかなり忙しく制作をしている月末の土日のやり取りです。

        画像

        どうやら撮影手法が珍しいことになりそうです。

        画像

        こんな動画が届きました。

        横浜のスタジオWADAYAさんは、デジハリ卒業生による運営です。
        とてもポップで楽しい感じの動画が、撮影環境を見事に説明してくれていて助かりました!

        WADAYA Studio80 https://wadaya.info/

        ちょうどこの8月末はこんな出来事が並列していました

        https://www.bunka.go.jp/seisaku/chosakuken/aiandcopyright.html

        https://youtu.be/bD0Kp5PiP8o

        https://note.com/o_ob/n/ne4d9735ab5cb

        会社として編集長としての制作をバリバリこなしながらも、ちょこちょこ個人としての制作や発信も行っているところが読み取れましたら幸いです。

        本制作のワークフローと「裏側のキャラクター」について

        さて、いよいよ本制作のワークフローです。
        詳細を解説していきます。

        最終的な完成品、表4には印象的な未来都市の夕暮れ、そして小さな人物があしらわれています。

        画像

        これは、サイバネティクス技術を駆使して生き生きとエレキギターを演奏する未来の杉山学長アバターです。人工呼吸器、胸のジェネレーター、義手、顔のマスクなどは私の趣味です。

        画像

        このキャラクターにたどり着くまでのプロトタイプも紹介しておきます。

        美しい猫耳をもったビジュアル系ロックバンドのギタリスト。
        ギターのフレットが別次元になっているのですが、全体的に美しい。

        画像

        元気なお年寄り。これも美しいけどなにか違う。

        画像

        逆に若返らせてみたり、

        画像

        ハッスルさせてみたり。

        画像

        杉山学長の意思として「ALSである現実を、そのまま世間にさらしたいという気持ち」と、この美しくて元気なキャラクターたちは、何か方向性が違うことに気づきます。筋肉に指令を出す神経が難病により歩くことも呼吸すらもできなくなるという現実や、70歳という年輪、そして「市民全員が高度に発達したVision Proのようなデバイスを付ければ、それぞれの人物が観られたい姿に変容して、相手に見え、誰に観られるかによって姿が変わる世界が可能と感じます」というメタバースの30年という歴史を振り返って、私自身と杉山先生の30年を振り返ってみました。

        まず描くべきは、世界。

        未来都市のメタボリズム、自然との調和。そしてオレンジ。
        更に私の中での杉山先生に見え隠れする「ヒッピー文化」(私自身が60年代米国文化に憧れがあったのかもしれません)そういったものをまずはプロンプトにして世界を描いていきます。

        画像

        未来の御茶ノ水ソラシティを思い描いたり、

        画像
        画像

        自然との調和に重きをおいてみたり、何十枚も生成していきます。

        画像

        そうしてベースラインとして選択された1枚がこちらでした。

        画像
        画像
        「水没都市の夕日世界」(S59)

        これで描くべき世界が決まりました。
        作品名は『水没都市の夕日世界』(S59)です。
        「S59」とはシード番号です。同じモデル、同じシード、同じプロンプトで再現性があります。

        仮のレイアウトとトーンを出していきます。

        画像

        ちなみに白井は写真工学の出身であり、白黒写真は高校時代からの積み上げがあります。プロをたくさん輩出した有名な「写真部」に所属し、白黒写真のトーニングやレタッチは3年ほど積み上げがあり、写真作品でちょっとした賞をもらったり、街の現像店を任されるぐらいのスキルはありました。さらにそのバイト代で買ったMacとPhotoshop2.0、2.5、3.0のあたりでデジタルに移行して写真部の仲間からは「異端扱い」されます。それがちょうど30年前の21歳のときに経験した出来事です。漫画を描いたり、ミニコミ誌を作ったり、いまの画像生成AI時代の狂乱に似たようなムーブメントがデジタルクリエイションの世界に起きていました。
        大学4年生のとき、日本バーチャルリアリティ学会設立総会での基調講演で、「デジタルハリウッド構想」をホリプロ所属のバーチャルアイドル「伊達杏子 DK-96」や長野オリンピックでのボブスレーシミュレータなどとともに熱量込めてお話する数学出身の杉山先生との出会いでした。

        https://tachilab.org/jp/addendum/vrsj.html

        まさかその25年後に白井がそこで教鞭をとるとは考えてもいなかったのですが、運命とは不思議なものです。そう、まるで魅力的なバンドメンバーを引き入れていくボーカリストのような杉山先生やその仲間たちを描かねば。
        たとえ使われなくても、リアルだけど、美しすぎず、かつその世界で「わいわいしている」、楽しそうな、コンヴィヴィアリティ※があるキャラクターを描かねば……!

        ※「コンヴィヴィアリティ」については杉山知之先生執筆の「私のコンピュータ文化史 TOKYO1964 – TOKYO2020」という論文を引用しておきます。

        画像
        画像
        画像

        DNA “Entertainment. It’s Everything!”

        https://school.dhw.co.jp/about/dna.html

        創立から30年。
        開学のころからずっと変わらず伝えていることは『すべてをエンタテインメントにせよ!』ということ。
        受講生・卒業生だけでなく、講師・スタッフのモットーでもあります。
        卒業制作のクオリティはもちろん、1回の授業の組み立て方、就職活動のあり方、卒業後の仕事まで、すべてをエンタテインメントになるまで追求する文化がここにあります。
        「すべてをエンタテインメントにする!」という強い思い。それが世界中で活躍する9万人の卒業生に共通するDNAです。

        https://school.dhw.co.jp/about/dna.html

        画像
        画像

        ……と思う存分、遊んでいるように見えるかもしれませんが、実際には大真面目です。しかも激務のさなかです。神奈川県「ともいきメタバース講習会」という障がい者向けクリエイティブワークショップの開発などの現場指揮を行いながらの制作でした。
        全てをエンターテインメントにしないと、やってられないよ!!

        現場撮影用の画像

        さてWADAYAスタジオさんでのLEDディスプレイウォールスタジオでの撮影です。残念ながら白井はワークショップの開発があったので立会はできない日程なので、撮影現場に任せるための素材をお渡しして祈るしかありません。
        3000mm x 1686mmの高輝度高ピッチLEDウォールスタジオを背景に、

        画像

        ここに未来都市を配置して、杉山先生が車椅子でやってきます。

        画像

        専門のライティング担当さんもいらっしゃる。

        画像

        用意すべきはこのレイアウト案を示しつつ、レイヤーを分けた素材もわかりやすく提供する必要があります。しかもスマートに、Google DriveのURLだけでお渡ししたい。

        画像

        Stability AI APIのフル活用

        もともと商用利用できるプロフェッショナル向けAPIでもあるStability AI APIですが、具体的にはこんな使い方もあります。「背景除去」です。

        一見なんということはない「背景除去」なのですが、

        画像

        実はそんなことはありません。
        ウェービーヘアの銀髪は、マスクを切るのがとても大変です。

        画像

        ですが、このマスクは背景除去(Remove background)ですぐに生成できました。もはやPhotoshopよりもGoogle Colabのほうが便利なときもあるのです。

        画像

        さらに印刷原稿を想定して、高解像度化を行っていきます。
        こちらも Stability AIのUpscale機能を使って高解像度化、特にConservative(コンサバ=保守的)なアップスケールを行います。この際は、生成に使ったプロンプトを再利用します。

        hippy style, (photoreal:2), futuristic, orange toned urban sight scene, cyber worlds with a nature fusioned, skyscraper buildings,

        (photoreal:2)とは、Stability AI APIにおける強調構文です。

        画像

        この時点でも高解像度ですが「商業誌の表紙」という、最高品質印刷原稿を想定して、さらにAUTOMATIC1111の Extraを使って高解像度化していきます。

        BG02026-16448×9408.png (186.7MB) という強烈な解像度ですが、ご興味あるようでしたらダウンロードしてみてください。

        全てが終わったのは朝の5時ですね。
        Google DriveのURLをお届けして祈りました。

        画像

        商業誌の制作を「商業政策」と間違えて書くぐらいには疲れていたようですが、「クリエイティブのヤマ」を超えた清々しさが伝わったようでしたら幸いです。

        SD黄色本」で長年お世話になったAUTOMATIC1111の超解像化技術が、最後の最後の品質に貢献したことは特筆に値すると思います。

        全ての画像生成AIの貢献者、オープンソース開発者に感謝を述べさせてください。

        撮影の現場より

        後日談としてWADAYA Studioの和田圭介さんより写真とメッセージが届きましたので紹介させていただきます。

        画像
        画像
        画像
        画像
        画像

        特に問題は無いのですが、僕がデジタルハリウッドを卒業しているわけではなく、創立3年目に入社した、元スタッフです。 デジタルコンテンツについては、杉山先生の教えで、この道にたどり着いたので、杉山先生の教え子であることには間違いないと思います(笑) ある意味、スタッフも含め卒業なんででしょうね。 ありがたいことに退職した後も、杉山先生からはいろいろなご相談お声掛けをいただき、20周年の時は、メッセージ映像を撮影し、そして30周年でこのコラボレーションが実現しているのが、何とも感慨深いのです。 デジハリからいただいた、この3人の縁も含めて、それを活かして何かしていかなければいけないなと、再度えりを正しました。 これからが楽しみです!!

        WADAYA Studio 和田圭介さんより

        (テスト撮影のデータから)

        画像

        どう考えても「Entertainment, it’s everything!」なDNAが感じられる会社紹介ですね。今後もよろしくお願いいたします。

        さいごに:画像生成AIの過去と未来と人類のクリエイティビティの1ページによせて。

        以上、1998年からCGの世界、世界のCGを届け続けてきた「CGWORLD」さんの表紙、しかも日本のCG・デジタルクリエイター教育とともにあるデジタルハリウッドの30周年を記録する特集、さらにそれを最新のLEDディスプレイウォールによるインカメラVFXで撮影するための画像生成AIによる世界素材の提供…というクリエイター冥利に尽きる仕事の一部始終を個人ブログ形式でお送りさせていただきました。

        この30年、テクノロジー、デジタルツール、生成AIによって楽になったこともあります。しかし、クリエイターはその効率化によって生まれた時間を余暇に費やすのではなく、制作やクオリティ、そして「不可能を可能にする挑戦」に費やしていきます。その姿勢は30年経っても何も変わらないと思います。

        さらに、画像生成AIは、世界中の画像という画像を食べて育った化け物です。イラストやデザインだけではありません。写真出身の私にしてみれば、「写真表現とは何か」を常に突きつけられてきた30余年です。Stable DiffusionやStability AIのAPIに何か言いたいことがあるひとはたくさんいると思います。しかし世界中のクリエイティブをLatent Spaceに詰め込んで、高品質、かつ高速なAPIを提供し、新たな人類のクリエイティビティに挑戦させていただいて、さらに商業利用可能であるとなると、それはホビーでもなんでもなく、プロのクリエイターとして勝負せねばなりません。
        ローカルのGPUも、APIのクレジットも、糸目なく投じて、きちんとクリエイターとしてCGの歴史に爪痕を残す仕事ができたようであれば幸いです。

        なお、公開当初からのStable Diffusion、そしtStability AIのAPIの使い手としてはこの技術を伝承するために、毎日のように個人ブログやAICU mediaを通して解説を発信していることはお気づきかと存じます。

        さらに、こちらの動画教材としてはColosoからこちらのラーニングメディアで公開予定です。
        ■「超入門:Stable Diffusionではじめる画像生成AI」
        https://j.aicu.ai/AICUXColosoJP

        書籍「画像生成AI Stable Diffusion」(SD黄色本)もおかげさまで好調であり、まだまだお問い合わせやサポートなどを通して読者の皆様と交流させていただいております。

        今後、広告、グラフィックス、ゲーム、漫画やアニメといった分野に画像生成AIは一般的に使われるようになるでしょう。

        その時に、これらの作品は、枯れ葉や土壌のような存在になっている事でしょう。それでいいんだとおもいます。
        でも、クリエイティブAIの使い手として、大事なことは道具や、その使い方だけじゃないんです。
        「おもしろそうだな」「やってみよう」「すごいね」「かっこいいね」「おもしろいね」「もっとすごいものがつくれそう」「ぼくもやってみたよ」そういった「つくる人をつくる」という心に火を付ける活動そのものが、きちんと作品を通して他の人の心に伝わったか?それが大事なんです。

        そしてクリエイターの世界は真剣です。偉かろうが、社会的に立場があろうがなかろうが、上手であったり、美しかったりも大事ですが、それだけではなく、最終的なアウトプットにどれぐらいのピクセルが露出するのか、しないのかといった効率だけでなく、その世界とか、メッセージとか、コンテキストとか、モチベーションとか、恥ずかしがらずに馬鹿になってやり続けることが、とても大事だったりします。

        デジタルハリウッド30周年、「CGWORLD」26周年、おめでとうございます。今日、本誌が物理的に届きましたが、その重さ、厚さ、関わった人の多さとニオイに咽んでおります。今後とも、この分野の皆様のご健勝ご盛栄をお祈り申し上げますとともに、この個人ブログの筆を置きたいと存じます。

        謝辞:ご依頼いただいた杉山知之先生、クレジット、およびCGWORLD本誌に掲載できなかったメイキング公開へのご快諾、また本寄稿へ「CGWORLD」のロゴ利用などご許諾いただきましたCGWORLD編集部の藤井さま、ありがとうございました。
        Stable Diffusion開発チーム、Stability AI APIおよびStability AI Japanの皆様、特にご支援いただいたJerry Chiさん、ありがとうございました。この場をお借りして感謝の意を記させていただきます。

        Thank you to the all of Stable Diffusion development team, Stability AI API and Stability AI Japan, and especially to Jerry Chi for your support. I would like to take this opportunity to express my gratitude.

        AICU Inc. 代表・白井暁彦, Akihko SHIRAI, Ph.D (@o_ob)

        画像

        ▼デジタルハリウッド 創立30周年記念ページ

        https://www.dhw.co.jp/30th

        ▼杉山先生の音楽ブログ「Sound Scape of Mojo」
        画像生成によるカバーアートも見どころですね!

        https://note.com/mojo_sugiyama/n/n600cce7f4b69

        Originally published at https://note.com on Oct 9, 2024.

      1. 【超入門】Stability AI APIの革新的機能(2)Edit APIの活用

        この記事では、Stability AI APの革新的機能「Edit API」について解説します。

        おさらい:プロンプトの文法

        まずはプロンプトの基礎から始めたい!という場合は、
        合わせてこちらの記事をご覧ください!

        「プロンプトの文法」編で、こんなことがわかる!

        • Stability AI APIとは?
        • Stability AI APIの種類と特徴・構成
        • プロンプトの文法基礎
        • [機能紹介] Generate APIとは?
        • [機能紹介] Generate APIよりUpscale機能のデモ

        前回はEdit APIからInpaintとOutpaintを紹介しました。

        Stability AI APIの種類と特徴・構成

        プロンプトの文法」編でもご紹介したように、Stability AI APIの画像生成系の機能は2024年10月現在、4つの機能に大別されています。

        • 「Generate」:いわゆる「TextToImage」です
          • プロンプト(テキスト)によって画像生成を行う
          • 現在6つのモデルが提供されている
        • 「Upscale」:高解像度化
          • ベースとなる画像を入力し、そこにプロンプト(テキスト)で指示を追加し画像生成を行う
          • 現在{Creative, Conservative}という2つのモデルが提供されている(加えて、Standardがcoming soonとして予告されている)
        • 「Edit」いわゆるImageToImageです
          • ベースとなる画像を入力し、そこにプロンプト(テキスト)で指示を追加し画像再生成を行う
          • 現在{Search and Replace, Inpaint, Outpaint, Remove Background, Erase Object}5つのモデルが提供されている
        • 「Control」こちらも いわゆる ImageToImage です
          • ベースとなる画像を入力し、そこにプロンプト(テキスト)で指示を追加し画像再生成を行う
          • 現在{Sketch, Structure, Style}3つのモデルが提供されている(加えて、 Recolorがcoming soonとして予告されている)

        https://platform.stability.ai

        今回扱うSearch & Replace、Erase、 Search and Recolor、Remove backgroundは、このうちの「Edit API」に当たります。

        Edit APIの6つの機能

        Edit APIのAPIリファレンスはこちらから確認できます。

        https://platform.stability.ai/docs/api-reference#tag/Edit

        公式のAPIリファレンスによると、
        Edit機能は「既存の画像を編集するためのツール」です。

        全部で5つのEdit機能が公開されています。

        • Erase Object
          • 画像マスクを必要とする機能です
          • 画像マスクを使用して、元画像の汚れや、机の上のアイテム等の不要なオブジェクトを削除します
        • Inpaint
          • 画像マスクを必要とする機能です
          • 画像マスクを使用して、指定された領域を新しいコンテンツで埋めたり置き換えたりすることで、画像をインテリジェントに変更します
        • Outpaint
          • 画像に追加のコンテンツを挿入して、任意の方向のスペースを埋めます
          • 画像内のコンテンツを拡大する他の手段と比較して、
            Outpaint機能は、元の画像が編集された違和感を最小限に抑えます
        • Search and Replace
          • 画像マスクを必要としない、特殊なバージョンの修復機能です
          • 画像マスクの代わりに、search_promptに置換対象をテキストで指定します
          • この機能は、search_promptに指定されたオブジェクトを自動的にセグメント化し、promptで要求されたオブジェクトに置き換えます
        • Remove Background
          • 画像から前景(背景に対して、手前に位置する要素)を正確に分割し、背景を削除します
          • 結果として、前景を残し、背景が透過された状態の画像が得られます
        • Search and Recolor
          • 画像内の特定のオブジェクトの色を変更する機能を提供します。 このサービスは、マスクを必要としないインペインティングの特殊バージョンです。自動的にオブジェクトをセグメント化し、プロンプトで要求された色を使用して再カラー化します。

        Search & Replace機能とは?

        公式が提供しているGoogle Colabでは次のように例が紹介されています。

        Search & Replace機能サービスは、マスクを必要としないインペインティングの特殊バージョンです。ユーザーは「search_prompt」を使って、置き換えたいオブジェクトを簡単な言葉で特定することができます。 サービスは自動的にオブジェクトを分割し、プロンプトで要求されたオブジェクトに置き換えることができます。

        実際にSearch & Replaceを使ってみよう!

        ここからは、公式が提供しているGoogle Colabを使ってデモを行なっていきます。

        このColabへのアクセス、初期設定の方法は「超入門」編の記事を参考にしてください。

        動画でみたい方はこちら

        https://j.aicu.ai/AICUXColosoJP

        準備:画像のパスの入手方法

        Edit機能を使う際は、Colabに画像をアップロードし、その画像パスを取得する必要があります。

        まずは、画面左側の「ファイルマーク」をクリックします。
        下に示す画像に従って、順番にクリックしていきましょう。

        画像

        次に、操作対象の画像を選んで、アップロードします。

        少し待つと、この三角マークを押して表示される「content」フォルダの中にアップロードした画像の名前が表示されます。

        画像

        ここから先、「画像のパスをペーストします」という工程が何度も出てくるのですが、ここで得られるパスを入力してくださいね
        (つまり、画像を入力として入れる際には、「Google Colab内のこのファイル部分にアップロード後に得られるパス」を入力してくださいね)。

        Erase Object機能とは?

        Erase Objectサービスは、画像マスクを使用して、肖像画のシミや机の上のアイテムなど、不要なオブジェクトを削除します。 マスクは2つの方法のいずれかで提供されます
        (1)「mask」 パラメータ経由で別の画像を明示的に渡す。
        (2)「image」 パラメータのアルファチャンネルから派生させる。

        実際にEraseを使ってみよう!

        ステップ1:マスキング前の画像のパスを取得する

        Inpaintの入力項目に、「image」と「mask」があります。

        • image:マスキング前の画像のパスを入力しましょう
        • mask:マスク画像のパスを入力しましょう
        画像

        まずは、元画像のパスを取得しましょう。
        マスクを必要とする機能を使う場合、マスク画像とピクセルがずれた画像を入力したり、本来の画像とは関係のない部分(画像をGoogle Slideなどに貼り付けた場合の余った余白の部分など)を含む画像を入力すると、マスク画像とうまくリンクせずに画像が揺れてしまうことがあります。
        そのため今回は、Google Slideを使って丁寧にマスクをしていきます。
        まず、今回使うinpaint対象の元画像がこちらです。

        画像

        これをGoogle Slideに貼り付け、「背景」を選択し、黒を選択します。

        画像

        この状態で、ファイル>ダウンロード>png画像 と選択し、画像をダウンロードしましょう。

        画像

        これで、元画像の画像パスが得られました。
        プロンプトの「image」部分に、今得られた画像パスを入力しましょう。

        ステップ2:マスク画像のパスを取得する

        元画像に、Google Slideの機能を使って白い丸を乗せて、マスクしました。
        これはまだ「マスク画像」ではないので、注意してください。

        画像

        次に、先ほどと同じように、背景を黒に設定します。
        重要な工程なので、スキップしないようにお願いします。
        背景が黒に設定できたら、元画像を削除し、黒背景とマスクのみが残る状態にしてください。

        画像

        ここまで完了したら、ファイル>ダウンロード>png画像 と選択し、画像をダウンロードしましょう。

        画像

        これを先ほど同様に、Colab上にアップロードします。画像のパスを取得できたら、プロンプトの「mask」部分に得られたパスを入力します。
        これで、「image」と「mask」に適切な画像パスが入力できました。

        ステップ3:prompt, negative prompt, seedを指定する

        今回は、元画像のドレスを着た女性がもともと「何も持っていない」ところを、マスクした箇所において「一輪の白い薔薇を持っている」ようにEditを施したいと思います。
        そこで、それぞれ次のように設定します。

        • prompt:holding a red white rose
        • negative prompt:ugly, normal quality
        • seed:39(お好みで)

        ここまでで、必要な設定が完了しました!

        ステップ4:いざ、実行!

        さあ、画像を生成してみましょう。
        得られた画像が、こちら!

        画像

        Search and Recolor機能を使ってみよう

        Search and Recolorは新しく登場した機能です。まずはサンプルどおりの結果を見ていただくのが良いと思います。

        画像
        画像

        select prompt”chiken”をprompt”green chiken”で置き換えています。

        画像

        つまり、髪色の置き換えなども簡単にできます。

        画像
        画像
        画像

        Remove background機能とは?

        こちらもサンプルどおりに実行してみます。
        プロンプトは特にありません。自動で背景が削除されます。

        画像

        Google Slidesで背景に文字を打ってみました!

        画像

        以上、Stability AI APの革新的機能、「Edit API」について解説しました。

        みなさんの使いこなしアイディアがありましたら X@AICUai でお寄せください

        こちらの動画ラーニングメディアで詳しく紹介していきます!
        「生成AIクリエイティブ AICU」シリーズ
        ■超入門:Stable Diffusionではじめる画像生成AI 

        https://j.aicu.ai/AICUXColosoJP

        Originally published at https://note.com on Oct 6, 2024.

      2. AICU Magazine Vol.5 初版リリース!! 特集は「Stability AI Forever!」KDPで無料

        AICU編集部がお送りする月刊誌「AICUマガジン」が、「つくる人をつくる」あなたをアップデートするクリエイティブAIエンターテイメントマガジン「AICU Magazine」としてリニューアル&Vol.5初版をリリースしました!

        画像

        ご購入はこちらから!Kindle Unlimitedで無料
        https://j.aicu.ai/MagV5

          表紙は犬沢某さん・Stability AI APIにて生成

          画像
          表紙by犬沢某さん X@insbow

          特集は「Stability AI Forever!」

          特集は「Stability AI Forever!」API時代の Stability AI 入門から[次世代モデル]の予告まで。今後長年にわたって役に立つ、GPU不要でも高画質・高品質で画像生成が学べる総力特集です。

          初版目次

          特集「Stability AI Forever!」

          ・「超入門: Stable Diffusionではじめる画像生成AI」で画像生成を始めよう
          ・【超入門Stability AI API】公式サンプルで「TextToImageの最近の文法を総ざらい」
          ・【超入門Stability AI API】「モデルとの対話」実習編。Stable Diffusion 3時代に知っておきたいプロンプトの新常識
          ・【超入門Stability AI API】「Stable Fast 3D」をGoogle Colabで動かす
          ・「Stable Diffusion 3 Mediumファインチューニングチュートリアル」から読んだStability AIの「新モデル」

          画像
          画像
          画像

          サクッと先取り!クリエイティブAIツール

          ・【音楽知識ゼロでもOK!】Sunoでオリジナル曲を完成させよう!初心者向け【無料】(ぽんず @ponzponz15
          ・動画も高精度に!ComfyUIとSegment Anything Model 2(SAM 2)でセグメンテーションをマスターしよう(Yas @earlyfield8612

          画像
          画像

          イベント情報

          ・結果発表!!「デルタもん4コマ漫画コンテスト」
          ・「AIが変える 美容&ファッションのミライ」

          画像
          画像

          BlendAI通信

          ・ガンマミィ誕生記念! イラストコンテストを開催
          ・BlendAI第1回ファンミーティング潜入レポート!デルタもん誕生秘話から新キャラ「ガンマミィ」、さらに壮大な計画まで明らかに!

          画像

          連載漫画

          「ウワサの大型新人」by わらさん(@wara_hirono)
          なんとリリースされたばかりの「ガンマミィ」が登場…!
          公式に怒られませんように!!

          画像

          読者のひろば

          ・編集長とGeminiたん「AI開発案件に起きている地殻変動(2024年9月末)」
          ・秋のカバーアート 「秋の妖精」 ないとっちさん
          ・はるしね~しょん(編集部だより)

          犬沢某さんよりメッセージを頂いております。

          画像

          今月号も表紙を担当させていただきました。

          前回は女性に大人気の[LuC4]全力肯定彼氏くんを題材に夏祭りを表現してみましたが、今回はストレートに「Stability AI特集」とのことで、AICUで開発しているColosoの教材シリーズをこっそり拝見させていただきました。

          ひとことで言って、これはスゴい。

          そして第1弾「超入門:Stable Diffusionではじめる画像生成AI」では、自分がデザインしたキャラクターが実写になっていることにも驚きました。……が、実際にやってみると、さらに複雑な気分でした。いいじゃないか。

          今回は、そこで学んだテクニックを使って、Claudeで改良しながら……

          Stable Image Ultra: photo realistic, squatting down and holding knees girl, grumpy but half smiling, zoom out the camera, walking, animal ears, solo, brown hair, overalls, dark skin, cat ears, short hair, dark-skinned female, choker, brown eyes, sweater, pink choker, long sleeves, closed mouth, yellow shirt, bright pupils, white pupils, pink basketball shoes (seed = 4), Aspect Racio 4:5, Conservative Upscaler

          ……といった感じで Stability AI だけで仕上げています。

          表情がもっといろいろ探求できると良かったかも?と思いつつ、海外の雑誌の表紙みたいな雰囲気を目指して色なども選んでみました。

          読者のみなさんの、感想が聞きたい……!

          最後に……実は、幻のバージョンがあるんです!
          表情は良かったんだけど、指が、ちょっとだけ変な方向を向いていて……。
          レイアウトラフの段階で編集部チェックをクリアしてしまったのと表情が良かったので編集部でも賛否両論があったり「インペイントでいいのでは?」という説もあったのですが、最終的にリテイクとなりました。

          AIだからって楽じゃないよ~!!でもこういうのも雑誌というメディアならではですね。

          なので、読者のみなさんの、感想が聞きたい……! 犬沢某 X@InsBow

          オトクなクーポンはあるの!?

          前回の人気企画、今回もあります!
          Coloso「生成AIクリエイティブ AICU」シリーズ
          ■超入門:Stable Diffusionではじめる画像生成AI
          https://j.aicu.ai/AICUXColosoJP
          ■初級者:広告企画から動画制作までのプロセス
          https://j.aicu.ai/ColosoJPXAICU
          ■ComfyUIマスター:カスタムノードとアプリ開発
          https://j.aicu.ai/Coloso3

          こちらに使えるクーポンコード(5000円相当)が付いてきます。
          Vol.4にひきつづきAniFusion初月半額コードも付いてきます!

          書籍版は発売されるの?!

          Kindle版はePub版にて提供されています。PDF版は現在242ページ!ずっしり重いページ数です。今後、初版から10月末まで1ヶ月の「賞味期間」を持ちながら、最新の情報や追加コンテンツをアップデートしていき、一定の読者購読が達成された場合に最終版をフルカラーの書籍版印刷物として出版する予定です。

          Vol.4 特集完全解説「AniFusion」は書籍化達成いたしました!

          画像
          厚さが決まらないと背表紙が決まらないので表紙が大変(デザイナー談)

          図書館等にも入れられる「手に取って、重さがわかるAI」として幅広い読者に向けて届けてまいります。ぜひともクリエイティブAIを陽のあたる場所に持っていきたい!という方はKindle Unlimitedで応援お願いします!!

          画像

          ご購入はこちらから!Kindle Unlimitedで無料
          https://j.aicu.ai/MagV5


          お見苦しいところもたくさんあるかもしれませんが
          読者のみなさんのフィードバックも歓迎です!
          ▶編集部へのご感想はこちらから https://j.aicu.ai/MT24v5

          AICU Inc. について:Xアカウント@AICUai https://corp.aicu.ai/ja

          生成AI時代につくる人をつくる」をビジョンに活動する2023年に設立された米国シリコンバレーを本拠地にするデジタルハリウッド大学発のスタートアップ企業です。書籍「画像生成AI Stable Diffusionスタートガイド」(SBクリエイティブ刊)、LINEアカウント「全力肯定彼氏くん」「AI確定申告さん」、Webに住むAIアイドル「AICuty」など楽しみのあるAI体験を開発する「AIDX Lab」、わかるAIを楽しく届ける AI総合メディア「AICU media」、AI人材教育コンテンツ開発、障がい者向けワークショップ開発、AIキャラクター開発運用、某有名企業の新技術プロトタイプコンテンツ開発など「クリエイティブAI」ならではのコンテンツ技術開発・体験開発を世界的な企業に展開している価値開発企業。画像生成AI「Stable Diffusion」を開発公開した Stability AI 公式パートナーであり、Google for Startups認定スタートアップでもあります。1994年に杉山知之が創立したデジタルハリウッド大学(愛称「デジハリ」)はCGやデジタルクリエーションを専門に学ぶ学校ですが、開学のころからずっと変わらず伝えていることは『すべてをエンタテインメントにせよ!』 。エンタテイメント技術の研究開発で30年の経験を持つCEO白井暁彦とAI社員、少数精鋭の人間味あふれる多様なスタッフや協力クリエイターとともに、すべてをエンタテインメントにするまで追求する文化が AICUにも息づいています。

          Originally published at https://note.com on Oct 1, 2024.

        1. アカデミー賞受賞監督ジェームズ・キャメロン氏、Stability AIの取締役に就任!

          カリフォルニア州ロサンゼルス 2024年9月24日 – 生成AIのリーディングカンパニーであるStability AIは、伝説的な映画監督、技術革新者、そして視覚効果のパイオニアであるジェームズ・キャメロン氏が取締役会に加わったことを発表しました。この発表は、Stability AIのCEOであるプレム・アッカラージュ氏によって行われました。

          ジェームズ・キャメロン氏は、最先端技術と先見性のあるストーリーテリングを融合させる原動力となってきました。監督、脚本家、プロデューサーとして、映画の限界を押し広げ、「ターミネーター」、「エイリアン」、「アビス」、「タイタニック」、「アバター」シリーズなど、史上最も象徴的で技術的に進んだ映画に命を吹き込んできました。

          キャメロン氏の参加は、Stability AIのビジュアルメディア変革というミッションにおける大きな前進となります。キャメロン氏とStability AIは共に、新興技術と創造性の交差点で活動しています。キャメロン氏のアーティスト中心の視点と、ビジネスおよび技術的な洞察力は、Stability AIがかつては想像もつかなかった方法でストーリーを語る力をクリエイターに与える、新たな機会を開拓し続けることを支援するでしょう。

          Stability AIのCEOであるプレム・アッカラージュ(Prem Akkaraju)氏は、「ジェームズ・キャメロン氏は未来に生きており、私たちが追いつくのを待っている」と述べています。「Stability AIの使命は、クリエイターにアイデアを実現するためのフルスタックAIパイプラインを提供することで、次の100年間のビジュアルメディアを変革することです。ジェームズのような技術と創造性のビジョナリーが、当社の最高レベルに参画することで、この目標を達成するための比類なき優位性を得ることができました。これはStability AIだけでなく、AI業界全体にとって画期的な出来事です」とアッカラージュ氏は付け加えました。「ビジュアルメディアの次のフロンティアは、アーティストとテクノロジーの真の融合によって築かれるでしょう。そしてStability AIはその先頭に立っています。」

          Stability AIのオープンモデルは、世界で最も広く使用されている基盤AI画像モデルであり、世界中のクリエイターと開発者の最大のエコシステムを育成しています。同社のモデルは、オープンソースプラットフォームHugging Faceでも最も人気のある画像モデルです。主力モデルであるStable Diffusionは、1億5000万ダウンロードを突破しました。大手企業を含む数千の企業が、クリエイティブワークフローを強化するためにStability AIのモデルに依存しています。

          LIGHTSTORMの会長であり、Stability AIの取締役であるジェームズ・キャメロン氏は、「私は、信じられないほどのストーリーを語るために、可能なことの限界を押し広げる新興技術を探し求めてきました。30年以上前にCGIの最前線に立ち、それ以来、最先端であり続けてきました。今、生成AIとCGI画像作成の交差点が次の波です。これら2つの全く異なる創造エンジンの融合は、アーティストがかつて想像もできなかった方法でストーリーを語るための新しい方法を切り開くでしょう。Stability AIはこの変革をリードする態勢を整えています。ビジュアルメディアの未来を形作るStability AIのチームであるショーン、プレム、そしてStability AIのチームと協力できることを嬉しく思います。」と述べています。

          キャメロン氏は、Greycroftの共同創設者兼マネージングパートナーであるダナ・セトル(Dana Settle)氏、Coatue ManagementのCOO兼ゼネラルパートナーであるコリン・ブライアント(Colin Bryant)氏、起業家、慈善家、そしてFacebookの元社長であり、執行会長を務めるショーン・パーカー(Sean Parker)氏など、他の新任取締役に加わります。

          Stability AIの執行会長であるショーン・パーカー氏は、「ジェームズ・キャメロン氏は、映画監督としての芸術的ビジョンと、先駆的な技術者としての役割の両方において、伝説的な人物です。彼のような才能を持つアーティストが取締役会に加わることは、Stability AIにとって新しい章の始まりとなります。生成メディアプラットフォームと芸術コミュニティとの間の無限の可能性を秘めた創造的なコラボレーションに、私たちは非常に興奮しています」と付け加えました。

          アカデミー賞を受賞した視覚効果会社Weta DigitalのCEOを務めた後、CEOに就任したプレム・アッカラージュ氏は、取締役会および経営陣と緊密に協力しながら、Stability AIの戦略的方向性を引き続き導いています。

          Stability AIについて

          Stability AIは、人工知能(AI)を通じてビジュアルメディアを変革することを目指すグローバル企業です。現在、Stability AIは、画像、ビデオ、3D、オーディオ、言語のための幅広い生成AIモデルを開発しています。適切な保護対策を講じた上で、これらのモデルはAIにおける透明性と競争を促進するためにオープンに共有されています。Stability AIの主力画像モデルであるStable Diffusionは、AI生成画像の最大約80%を支えるオープンソース画像モデルファミリーです。テキストからオーディオへのウェブアプリケーションであるStable Audioは、最近、TIME誌の2023年のベスト発明の1つに選ばれました。

          ジェームズ・キャメロンについて

          ジェームズ・キャメロン(James Cameron)氏は、カナダ出身の伝説的な映画監督で、技術革新者、海洋探検家でもあります。過去30年間で最も記憶に残る映画のいくつか、「ターミネーター」、「エイリアン」、「アビス」、「トゥルーライズ」、「タイタニック」、「アバター」シリーズを制作してきました。「アバター」は、現在、国内および世界中の興行収入記録を保持しており、世界で29億ドル以上の興行収入を上げています。23億ドルの「アバター:ウェイ・オブ・ウォーター」と22億ドルの「タイタニック」を含め、史上最高の興行収入を記録した映画の4つのうち3つはキャメロン氏の作品です。彼は3つのオスカー、2つのエミー賞、そしてその他数々の賞を受賞しています。

          近年では、原爆をテーマにした新作映画「ラスト・トレイン・フロム・ヒロシマ(原題)」の製作も発表しており、大きな注目を集めています。この作品は、広島と長崎で原爆を生き延びた日本人男性、山口彊さんの実話を中心に据えた作品となる予定です。キャメロン監督は2009年に山口さんと面会しており、山口さんから直接体験を託されたという経緯があります。

          過去20年間、キャメロン氏はビジュアルメディアのための業界を定義する技術を開発してきました。彼は、新しいディスプレイデバイスを考慮して、メディアの消費方法を変革する3Dルネッサンスの先頭に立っています。キャメロン氏はまた、前例のない海洋技術も開発してきました。彼は、2012年にチャレンジャー海淵に潜航したDEEPSEA CHALLENGER潜水艇と科学プラットフォームを共同設計および共同エンジニアリングし、歴史上初めて単独操縦士として地球の最深点に降下しました。

          Based on original article by Stability AI.


          SF映画という映像メディアから世界中の人々の「未来の常識」を開拓してきたキャメロン氏が、今後 Stability AI をスクリーンにしてどのような未来を描くのか、ワクワクが止まりません!AICU mediaも応援しています!

          https://corp.aicu.ai/ja/stability-ai

          #StabilityAI #JamesCameron #ジェームズ・キャメロン

          Originally published at https://note.com on Sept 24, 2024.

        2. Stability AI も登壇!「AIが変える 美容&ファッションのミライ」

          グローバルビューティー&ファッションAIフォーラムが開催!注目の講演内容は?

          美容とファッションの未来を創る、AIとデータの力とは?

          2024年9月27日 神田スクエアルームにて開催の「2024グローバル ビューティー&ファッションAIフォーラム in Tokyo」では、資生堂、花王、アイスタイル、そして Stability AI など業界の最先端を走る企業のエキスパート達が登壇!

          AI、CRMデータ、UI/UXなど、ホットなキーワードを軸に、パーフェクト株式会社が提供する革新的なビューティーテックソリューションを体感できる貴重な機会です。

          ✨見逃せないセッション内容を一部ご紹介!✨

          【セッション① 生成AIが生み出す新たなブランド価値】

          Stability AI 滝澤琢人氏、資生堂 Omer Iqbal氏、パーフェクト株式会社 磯崎順信氏が登壇。 生成AIは、ビューティー&ファッション業界にどのような変革をもたらすのか? 熱い議論に期待が高まります!

          【セッション② 成果が出るユーザージャーニーとは?UIUXの最適解を探る】

          株式会社Sprocket 曾我博規氏、株式会社エキップ 鳥橋葉子氏が、顧客体験を最大化するUI/UX戦略を解説。 デジタル時代のブランド成功の鍵を握る、顧客との最適な関係構築に迫ります!

          画像

          【セッション③ “スキンケア難民”の救世主?スキンケアテック最前線】

          BeautyTech.jp編集長 矢野貴久子氏オーガナイズで、花王 菊池祥氏、株式会社Kireii 堀井麻友美 氏、株式会社ユーブローム 柴田未央氏が登壇。 個別化が進むスキンケアニーズに応える、パーソナライズドソリューションに注目が集まります!

          【セッション④ 急拡大する美容医療市場。脅威か商機か?】

          株式会社トリビュー 毛迪氏、東京イセアクリニック 田儀里紗氏、INFASパブリケーションズ 牧田英子氏、パーフェクト株式会社 中川良子氏が、美容医療市場の現状と将来展望を徹底分析。 ビューティー&ファッション業界との融合、新たなビジネスチャンスを探ります!

          【セッション⑤ デジタル戦略のカギ、散在するユーザーデータの攻略法】

          アイスタイル 押野卓也氏、資生堂 大黒泰平氏が、複雑化する消費者行動を捉えるデータ分析の重要性を解説。 パーフェクト株式会社の最新ソリューションも交え、顧客エンゲージメントを高める戦略に迫ります!


          その他にも、注目のセッションが目白押し!

          参加費無料のこの機会に、ぜひ会場でビューティー&ファッション業界の未来を体感してください!

          ▼詳細&チケット申し込みはこちら(無料)▼

          EventRegist https://j.aicu.ai/Perfect240923

          日時:2024/09/27(金) 13:00 ~ 17:00
          場所:KANDA SQUARE 3F SQUARE ROOM (東京都 千代田区神田錦町二丁目 2番地1)
          参加費:無料
          主催:パーフェクト株式会社

          美容業界のトレンドに興味がある方、AI活用に興味がある方、自社のビジネスにAIを取り入れたい方など、皆様のご参加を心よりお待ちしております。本フォーラムを通じて、AIが描く未来を一緒に探求しましょう。

          【関連情報】


          ▼Kireiiは化粧品の選び方を変える成分検索プラットフォーム、デジタルハリウッド大学院がMOU締結で支援
          https://beautytech.jp/n/n56a63aa96d7f

          ▼コスメ系スタートアップの株式会社Kireiiとデジタルハリウッド大学大学院が産学共同研究でMOU締結

          https://prtimes.jp/main/html/rd/p/000002287.000000496.html

          ✨️本記事は株式会社Kireiiのご提供でお送りしております✨️

          Originally published at https://note.com on Sept 22, 2024.