Stable Image Ultra 1メガピクセル生成(以下、Ultra) Stable Image Core 1.5メガピクセル生成(以下、Core) Stable Diffusion 3 Large 80億パラメータモデル(以下SD3L) Stable Diffusion 3 Medium 20億パラメータモデル(以下、SD3M)
左上がSD3L、右上がUlta、左下がSD3LとUltraの合成、右下が3Mです。UltraとSD3LはAPIではなく文字プロンプトでスタイルを指定し、共通のシードでは同じような絵が出る傾向があります。 技術チームの印象としては、「cinema, analog filmなどの実写スタイル、SD3LとUltraの間での比較を商業的価値でレビューしてみてほしい」という所見を頂きましたので挑戦していきます。
Stable Image Ultra 1メガピクセル生成(以下、Ultra) Stable Image Core 1.5メガピクセル生成(以下、Core) Stable Diffusion 3 Large 80億パラメータモデル(以下SD3L) Stable Diffusion 3 Medium 20億パラメータモデル(以下、SD3M)
左上がSD3L、右上がUlta、左下がSD3LとUltraの合成、右下が3Mです。UltraとSD3LはAPIではなく文字プロンプトでスタイルを指定し、共通のシードでは同じような絵が出る傾向があります。 技術チームの印象としては、「cinema, analog filmなどの実写スタイル、SD3LとUltraの間での比較を商業的価値でレビューしてみてほしい」という所見を頂きましたので挑戦していきます。
ベースとなった共通プロンプト: {style*} best quality, trending on art station, looking at viewer, 1girl has a panel which is written [AICU], V-sign , in Shibuya crossroad
今回は最終的に動画を作ることになりましたので、もし同じ実験を追従される方がいらっしゃいましたら、生成時間の測定、連番ファイルでの生成やデータベースとの連動なんかも考えてみるとその後の活用がしやすいのかなと思いました。特に生成時間はローカルGPUや Google Colabでの生成と比較しても非常に高速で、数秒です。これ自身が価値あると考えます。
映像制作目的では、Google Apps Script + Google Slidesでのバリエーション広告での活用事例などもご参考にいただければ幸いです。AICU AIDX Labとしては、カスタマイズ依頼も歓迎です。
この画像の場合には、ファイル名が analog-film style, best quality, trending on art station, looking at viewer, 1girl has a panel which is written [AICU], V-sign , in Shibuya crossroad_14117_1_Ca.png となっています。
modeling-compound style, best quality, trending on art station, looking at viewer, 1girl has a panel which is written [AICU], V-sign , in Shibuya crossroad_9240_5_Ca.png こちらもCa、つまりCoreAPIでプロンプト指定によって生成されています。CoreAPIには文字を描く能力はないはずですが、胸には「ACU」の文字が確認できます。指は本数は5本できちんとVサインをしていますが、掌と親指がちょっと怪しげな結果です。しかしこのぐらいであればPhotoshopや image to image で修正できる可能性は高いと考えます。
A soft, plush toy shaped like a smiling face with two round black eyes and a simple curved smile. The toy is light purple and appears to be made of a soft, fuzzy material. It is positioned on a blue quilted surface with a light gray background, cute, kawaii, close-up shot, high detail.
a breathtaking underwater photo of a hand underwater touching the surface to create a ripple of bright abstract eye galaxy nebula vortex of beauty and nature, sunlight and chaos
robot girl, android,hanging,female, robot_torso,mechanical parts, cable, masterpiece, in a futuristic robotics lab, deactivated, wires, highly detailed, dynamic lighting, pale skin
aurora, milky way, night, night sky, shooting star, space, starry sky, galaxy, sky, city lights, constellation, light particles, skyscraper, cityscape, a girl, long hair, skyline, city, standing, twilight, looking at viewer, yellow eye
an image of a World War II battle scene. Include soldiers in era-specific uniforms, trenches, barbed wire, and debris. Show infantry, tanks, and military vehicles with smoke and fire. Add an overcast sky for a grim atmosphere. Use a muted, gritty color palette.
At dusk, in a polished, beautiful fantasy city where light and darkness intersect, god rays rain down from high in the sky, illuminating the city.
A surreal landscape with a giant floating crystal in the sky.
game screen shot of Open world game with a character in a forest, with game hud
a concept pixel art of star night, sky full of stars, a person standing on a hill, looking at the sky, japanese anime style, 16bit, Title logo write 「hello world」
a concept art of Dark soul style weapons, setting sheet,
1girl, solo, cyberpunk, barcode, black footwear, black jacket, black skirt, boots, braid, brown hair, building, car, character name, crosswalk, full body, green eyes, hand in pocket, high heel boots, high heels, holding, holding umbrella, jacket, long hair, long skirt, motor vehicle, phone, pink umbrella, road, road sign, sign, single braid, skirt, smile, standing, twin braids, umbrella
Glittering neon signs and flying cars are reflected in the dark, stagnant river. Skyscrapers built high in the sky, cyberpunk city, cyberpunk
In a vibrant 1990s-style anime illustration, a young girl strikes a fashionable model pose in the heart of a bustling city. She embodies the essence of cyberpunk, dressed in the latest streetwear trends that blend futuristic elements with retro flair. Her outfit features a sleek jacket with neon accents, high-waisted pants, and chunky sneakers, all glowing under the city’s neon lights. She wears stylish sunglasses, reflecting the colorful, electric atmosphere around her. Her confident stance and playful expression capture the spirit of a fashion icon, seamlessly merging the past's nostalgia with the future's edgy vibe. The background is a lively urban scene, filled with towering skyscrapers, bright billboards, and bustling crowds, perfectly encapsulating the dynamic energy of a cyberpunk metropolis.
a girl falling in the sky, smile, starry night, white hair, anime, vibrant, high quality,
A detailed anime-style character design, featuring a young girl with long flowing purple hair and bright blue eyes. She is wearing a stylish futuristic outfit with intricate details, including a metallic silver jacket, a neon blue skirt, and knee-high boots. Her expression is cheerful, and she is standing in a vibrant, colorful cityscape with tall buildings and neon signs in the background. The sky is stunningly beautiful, with a gradient of colors from deep blue to vibrant pink, adorned with fluffy white clouds and a glowing sunset. The lighting is dynamic, with a mix of natural and artificial light, giving the scene a lively and energetic atmosphere. The overall style is highly detailed, with a focus on capturing the unique elements of anime art and the breathtaking beauty of the sky.
1girl, solo, cyberpunk, barcode, black footwear, black jacket, black skirt, boots, braid, brown hair, building, car, character name, crosswalk, full body, green eyes, hand in pocket, high heel boots, high heels, holding, holding umbrella, jacket, long hair, long skirt, motor vehicle, phone, pink umbrella, road, road sign, sign, single braid, skirt, smile, standing, twin braids, umbrella
A girl, starry night, anime, vibrant, high quality, pixel art
Black long hair, Anime, kawaii, 1girl, black eyes, headphone, white clothing, looking down at viewer, standing, building, city, frombelow, upper body, side shot
Anime, Kawaii, ilustrated, 1 girl, purple long hair, crimson eyes, sunset, building, city, Aurora front view
In an illustration style, Kawaii and animated, it evokes the interior of a Gothic cathedral, with red ambient lighting showing large stained glass windows on either side, and rays of light in the center illuminating the dust in the air, creating a mysterious atmosphere. And a girl with black wings and red eyes floats in the center, looking at us
illustrated in an anime style with the focus on the upper body, from a slightly angled front view. A Japanese woman wearing a lace trimmed blue evening dress off shoulder style is sitting at the counter of a luxury hotel's top-floor bar. The dress shows a collarbone and the feminine curves of her body. She is wearing a jewely necklace and has her silver hair up and red eyes. With a melancholic expression, she gazes out at the fog and rainy skyscraper cityscape through the window. The woman is holding an envelope in her hand, with the word "Invitation" written on it. The bar is elegantly decorated with dim lighting, cocktail glass on counter table, creating a sophisticated and intimate atmosphere. The city lights and rain outside the window create a reflective and moody ambiance. nega:behind, v-neckline, nsfw
kawaii anime style. A medieval girl with blonde hair is swinging a katana toward front with the katana's blade gleaming in the light. She is dressed in traditional European white armor with intricate patterns and details, wearing frilled skirt. Her expression is determined and focused. The background is a blend of a serene landscape, featuring flowers in full bloom, and an ancient cathedral.photorealism, cartoon, samurai, cherry blossoms,
Anime, kawaii, depth of field, thick fog, smoke, kisser, cigarette, red and white, monotone, petals fused with body, flowers, glamour, Chinese dress, empty eyes, morbid, hair in a bun, long hair, clock tower, crack in space-time,
Anime, kawaii, girl, solo, depth of field, waves, flat colour, best image quality, symmetrical face, summer, water on dress, water droplets, specular reflection, refracted glass shards, prism, moon celestial body, liquid clothing, long yellow dress, harmony,
Anime, kawaii,depth of field, thick fog, Full smiles, happiness, hope, white wedding dress, church, disquiet, grey world, bursts of blood, despair, cracks in the world, slaughter, incident, stillness,
kawaii, anime, 1girl, solo, Very beautiful glowing skin., blue eyes, long hair, gray hair, elf, Huge breasts, looking at viewer, upper body, camisole, absurdres, highres,Detailed background,Outdoor Lakeside
Create a high-resolution, upper-body image of a cute anime girl with blue eyes and long, flowing gray hair. She has tanned skin and is an elf with delicately pointed ears. She is smiling warmly and looking directly at the viewer, giving a friendly and inviting expression. She is wearing a light, pastel-colored camisole that complements her complexion. Her hair cascades gracefully around her shoulders, with a few loose strands framing her face. The background should depict a sunny lakeside scene with clear blue skies, a sparkling lake, and lush greenery. Ensure the background is detailed yet softly blurred to keep the focus on the character. The style should be kawaii and highly detailed, capturing the charming and whimsical essence of anime art. Ensure the image is high quality and high resolution, with careful attention to the character's features and expression.
Stable Diffusion 3 シリーズの最新かつ最も高度なテキストから画像へのAIモデルである Stable Diffusion 3 Medium を発表できることを嬉しく思います。Stable Diffusion 3 Medium は、生成AIの進化における重要なマイルストーンであり、このパワフルなテクノロジーを民主化するというStability AI のコミットメントを継続するものです。
SD3 Medium の特徴
SD3 Medium は、SD3の20億パラメーターモデルで、いくつかの特筆すべき特徴を備えています。
NVIDIAとコラボレーションし、NVIDIA® RTX™ GPUとTensorRT™を活用することで、Stable Diffusion 3 Medium を含むすべてのStable Diffusion モデルのパフォーマンスを強化しました。TensorRT で最適化されたバージョンは、クラス最高のパフォーマンスを提供し、パフォーマンスが50%向上します。
TensorRT に最適化された Stable Diffusion 3 Medium にご期待ください。
AMD とのコラボレーション
最新のAPU、コンシューマー向けGPU、MI-300XエンタープライズGPUなど、さまざまなAMDデバイス向けにSD3 Medium の推論を最適化しています。
オープンでアクセスしやすいモデル
オープンな生成AIへの Stability AI のコミットメントは揺るぎません。Stable Diffusion 3 Medium は無償の非商用ライセンスでリリースされ、Hugging Face を通じて入手可能です。アーティスト、デザイナー、開発者、AI愛好家の皆さまは新しいクリエイターライセンスをご利用ください。
Stability AI は、安全で責任あるAIの実践を信じています。これは、悪意ある者による Stable Diffusion 3 Medium の悪用を防ぐために、合理的な手段を講じ、それを継続することを意味します。安全性は、モデルのトレーニングを開始した時点から始まり、テスト、評価、デプロイを通して継続します。Stability AI は、このモデルの広範な内部および外部テストを実施し、危害を防止するための数多くのセーフガードを開発し、実施してきました。
研究者、専門家、そしてコミュニティと継続的に協力することで、モデルを改善し続けながら、誠実にさらなる革新を進めていきます。Stability AI の安全性へのアプローチについての詳細は、 Stable Safety をご参照ください。
ライセンス
Stable Diffusion 3 Mediumは、Stability Non-Commercial Research Community Licenseの下でリリースされています。 Stability AI は、コミュニティが Stable Diffusion 3 を活用することを奨励すると同時に、AIをオープンでアクセス可能な状態に保つというミッションのもと、新しいクリエーターランセンスを導入しました。プロのアーティスト、デザイナー、開発者、AI愛好家の皆様には、クリエーターライセンスを利用して、Stable Diffusion を使った開発を始めることをおすすめします。
大規模な商用ユーザーや企業の方は、ご連絡いただき、エンタープライズライセンスを取得してください。これにより、Stability AI の利用ガイドラインを遵守しながら、皆さまがモデルの可能性を最大限に活用できるようになります。
Stability AIより:今後の展開
皆さまからのフィードバックに基づき、Stable Diffusion 3 Medium を継続的に改善し、機能を拡張し、パフォーマンスを向上させる予定です。Stability AI の目標は、AI生成アートにおける創造性の新たな基準を設定し、Stable Diffusion 3 Medium をプロと趣味利用の方の双方に不可欠なツールにすることです。
for /f "tokens=1,* delims==" %%a in (SIC_setting.txt) do (
set %%a=%%b
)
set STYLE_PRESET[1]=3d-model
set STYLE_PRESET[2]=analog-film
set STYLE_PRESET[3]=anime
set STYLE_PRESET[4]=cinematic
set STYLE_PRESET[5]=comic-book
set STYLE_PRESET[6]=digital-art
set STYLE_PRESET[7]=enhance
set STYLE_PRESET[8]=fantasy-art
set STYLE_PRESET[9]=isometric
set STYLE_PRESET[10]=line-art
set STYLE_PRESET[11]=low-poly
set STYLE_PRESET[12]=modeling-compound
set STYLE_PRESET[13]=neon-punk
set STYLE_PRESET[14]=origami
set STYLE_PRESET[15]=photographic
set STYLE_PRESET[16]=pixel-art
set STYLE_PRESET[17]=tile-texture
set STYLE_PRESETNOW=