2022年8月に画像生成AI「Stable Diffusion」をStability AI が無償公開してから2年。API時代の Stability AI 入門から2024年10月22日に公開された「Stable Diffusion 3.5」まで。 AICU創業前からの研究成果を凝縮し、GPU不要でも高画質・高品質で画像生成が学べる今後長年にわたって役に立つ情報と歴史を込めて「Forever!」とした総力特集です。
【基礎編】公式サンプルで学ぶ Stability AI APIの基本!
Stability AI API Guide の基本としてGenerate API と「TextToImage の最近の文法」を総ざらい!Google Colab を使って、基本的な操作に慣れていきましょう。
魅力的な機能をたくさん備えた「Stability AI API」を使いこなすシリーズで す。今回は、2024 年8 月に公開された「Stable Fast 3D」を使ってみます。このAPI は、単一の2D 入力画像から高品質な3D アセットを生成します。
【ツール編】「Stable Assistant」だとこんなに簡単!
これまでStability AI API について解説してきましたが、業務的な利用ではな く、よりカジュアルに使いたいユーザーには「Google Colab は大変そう」と思うかもしれません。そんな方にはこちら、Stability AI がリリースした「Stable Assistant」はいかがでしょうか。画像生成AI「Stable Diffusion」の最新版に加えて、動画生成、音楽生成、テキスト生成までできるオールインワンのAI クリエイティブツールです。
東京工業大学でコンピュータサイエンスを学び、東京大学ロースクールで法律を学ぶ。幾つかの職を経た後に渡欧し、オランダのIT企業でエンジニアとして従事する。その後東京に戻り、リクルートホールディングスでAI(自然言語処理)のソフトウェア作成業務に携わり、シリコンバレーと東京を行き来しながら働く。この時共著者として提出したAIの言語処理の論文『A Lightweight Front-end Tool for Interactive Entity Population』と『Koko: a system for scalable semantic querying of text』はそれぞれICML(International Conference on Machine Learning)とACMという世界トップの国際会議会議に採択される。その後、ブロックチェーン業界に参入。数年間ブロックチェーンに関する知見を深める。現在はBlendAI株式会社の代表としてAIキャラクターのデルタもんを発表したり、産業技術総合研究所(AIST)でAIに関する講演を行うなど、AIに関係した活動を行っている。
・画像生成AIサービス 背景・人物:Stability AI API, 主に Stable Image Ultra、Google Colabでの独自開発システムにより生成
・プロンプト(一部抜粋) 背景:hippy style, (photoreal:2), futuristic, orange toned urban sight scene, cyber worlds with a nature fusioned, skyscraper buildings. seed = 59. 人物:cyberpunk-themed mechanical robotic guitar hero, with a headset, neon-lit circuit tattoos on face, glowing white lines, looking at viewer, smile, passionate 40 years old man, prosthetic hand, with artificial respirator, with a super detailed guitar, color scheme of orange, dramatic orange and white lightings, intense expression, super detailed mechanical design,
プロンプトによるtext to imageだけではなく、様々な技術を駆使していますが、まずは画像生成以外の制作の裏側を可能な限りで紹介していきたいと思います。
謝辞:ご依頼いただいた杉山知之先生、クレジット、およびCGWORLD本誌に掲載できなかったメイキング公開へのご快諾、また本寄稿へ「CGWORLD」のロゴ利用などご許諾いただきましたCGWORLD編集部の藤井さま、ありがとうございました。 Stable Diffusion開発チーム、Stability AI APIおよびStability AI Japanの皆様、特にご支援いただいたJerry Chiさん、ありがとうございました。この場をお借りして感謝の意を記させていただきます。
Thank you to the all of Stable Diffusion development team, Stability AI API and Stability AI Japan, and especially to Jerry Chi for your support. I would like to take this opportunity to express my gratitude.
【経歴/受賞歴】 2024年 Bond University MBA取得 2023年 Ponotech Inc. CEO 2020-2021年 数億円のM&Aの売り手側を担当 2019-2023年 ソフトウェア開発企業にて受託開発のリーダーを務める 2018年 半導体製造装置の量産化対応を担当 2013-2016年 海外向けプレス機械の制御設計として活躍
さらに「New Image with Same Structure」を使って、今度は「Japanese anime style」としてみました。
うーん、ちょっと日本人顔になったけど、もうちょいがんばりたい! 無料なので。
左上の「Generate another version」を選びます。
右側に追加されていきます。
黒髪とブロンドで悩む私でした。
「New Image with Same Structure」の使い方
同じ構図と構造を維持しながら、周囲の環境を変化させて、コーヒーカップをある景観から別の景観へと移動させてみましょう。この例では、夕暮れの森の中に置かれたコーヒーカップの画像を入力として、このツールを使用して新しい画像を生成します。アシスタントに生成を指示するだけで、 > create a picture of a cup of coffee placed in a forest at sunset (夕暮れの森の中に置かれたコーヒーカップの画像を作成) 次に、ツール設定のプロンプトセクションに文字を入力することで、構造はそのままに、この画像のスタイルと内容を変更することができます。 > a cup of coffee in the desert at sunset (夕暮れの砂漠に置かれたコーヒーカップ)