――その芽生え……。なるほど興味深いです。楽器とかも結局そうなんですよね。演奏するっていういわゆる演奏家の人がいたとしても、楽器を上手に扱えるか 扱えないかみたいなところの軸も当然あるし、さらにそのお客さんに対しての「商品性がある演奏」とか「楽曲などがやれるかどうか」みたいなところの軸もあって……。運よくそのテレビ業界で生業になり糧なりを得ているんだけれども、やはり「表現したい」、「自分の考えたことを表現したい」と思った、と。道具を使いこなして演奏するみたいなところから、画像生成 AI の演奏家として、ひとりひとりのクリエイターとして成立していて、さらにそれが「他の人たちに会いたい」、「作品を通して人に会いたい」っていうモチベーションに育っていったってことなんですね 。
2022年8月に画像生成AI「Stable Diffusion」をStability AI が無償公開してから2年。API時代の Stability AI 入門から2024年10月22日に公開された「Stable Diffusion 3.5」まで。 AICU創業前からの研究成果を凝縮し、GPU不要でも高画質・高品質で画像生成が学べる今後長年にわたって役に立つ情報と歴史を込めて「Forever!」とした総力特集です。
【基礎編】公式サンプルで学ぶ Stability AI APIの基本!
Stability AI API Guide の基本としてGenerate API と「TextToImage の最近の文法」を総ざらい!Google Colab を使って、基本的な操作に慣れていきましょう。
魅力的な機能をたくさん備えた「Stability AI API」を使いこなすシリーズで す。今回は、2024 年8 月に公開された「Stable Fast 3D」を使ってみます。このAPI は、単一の2D 入力画像から高品質な3D アセットを生成します。
【ツール編】「Stable Assistant」だとこんなに簡単!
これまでStability AI API について解説してきましたが、業務的な利用ではな く、よりカジュアルに使いたいユーザーには「Google Colab は大変そう」と思うかもしれません。そんな方にはこちら、Stability AI がリリースした「Stable Assistant」はいかがでしょうか。画像生成AI「Stable Diffusion」の最新版に加えて、動画生成、音楽生成、テキスト生成までできるオールインワンのAI クリエイティブツールです。
SD3.5にて生成 「gemini girls with a panel which written “AICU”」
SD3.5 Turboにて生成 「textured palette knife oil painting of a cat riding a surfboard on the beach waves in summer. the cat has a mouse friend who is also riding the surfboard」
良いものだけ紹介するのではなく、 文字の描画を含めた連続生成の歩留まり率を表現してみます。 「cinematic film still, action photo of a cat with “AICU loves SD3.5”, riding a skateboard through the leaves in autumn. the cat has a mouse friend resting on their head」 SD3.5・同一プロンプト、Seed=0にて実験
「Japanese girls with a panel which is written “AICU loves SD3.5″」
ネガティブプロンプトの効果を確認します。 「bad finger, nsfw, ugly, normal quality, bad quality」を入れることで歩留まり率が上がりました。
さいごに、ComfyUIのブログにあったプロンプトを紹介します。
Prompt: A photorealistic 4K image of a woman with transparent, crystal-like skin, glowing from within with a soft golden light. NP:bad finger, nsfw, ugly, normal quality, bad quality
東京工業大学でコンピュータサイエンスを学び、東京大学ロースクールで法律を学ぶ。幾つかの職を経た後に渡欧し、オランダのIT企業でエンジニアとして従事する。その後東京に戻り、リクルートホールディングスでAI(自然言語処理)のソフトウェア作成業務に携わり、シリコンバレーと東京を行き来しながら働く。この時共著者として提出したAIの言語処理の論文『A Lightweight Front-end Tool for Interactive Entity Population』と『Koko: a system for scalable semantic querying of text』はそれぞれICML(International Conference on Machine Learning)とACMという世界トップの国際会議会議に採択される。その後、ブロックチェーン業界に参入。数年間ブロックチェーンに関する知見を深める。現在はBlendAI株式会社の代表としてAIキャラクターのデルタもんを発表したり、産業技術総合研究所(AIST)でAIに関する講演を行うなど、AIに関係した活動を行っている。