つくる人をつくる AICU Inc.

投稿者: admin

全世界最高峰･最上位の画像生成AI (Stable Diffusion 3 8B+) が凄すぎた件
Stable Diffusion開発元の、Stability AI Japan – External AdvocateのD̷ELLと申します。
今回、Stable Diffusion最高モデル Stable Diffusion 3 80億パラメータ（8B） を搭載したAPI「Stable Image」の、最上位サービス 「Stable Image Ultra」 の体験会を実施しました。
実施内容をレポートにまとめましたので、報告させて頂きます。

概要
- Stability AIからStable Diffusion 3 2B のモデルがリリースされ、世界を席巻した
- Stability AI APIでは、最上位モデルの Stable Diffusion 3 8B が利用可能
- 性能を体験してもらうために、色んな人に利用してもらったら凄かった
経緯

先日、Stability AIから待望のStable Diffusion 3 Medium（2Bモデル）が発表され、大きな話題を呼びました。しかし、Stability AI APIではさらに上位の Large / Ultra（8Bモデル） が利用できることをご存知でしょうか？

先日モデルリリースされた Stable Image Medium は 2B モデルですが、Stable Image Large はその4倍のパラメータを持つ 8Bモデルです。Stable Image Ultra は、8BモデルであるLargeを調整して更に性能を向上させた、名実ともに 全世界最高･最上位の画像生成AI となります。

Stable Image Ultraの紹介は以下の通りです。

当社の最も高度なテキストから画像への生成サービスであるStable Image Ultraは、これまでにない迅速な理解で最高品質の画像を作成します。Ultraは、タイポグラフィ、複雑な構図、ダイナミックな照明、鮮やかな色合い、芸術作品の全体的なまとまりや構成に優れています。Stable Diffusion 3を含む最先端のモデルから作られたUltraは、Stable Diffusionのエコシステムの最高峰を提供します。

Stable Diffusion 3 8Bの性能を最大限に引き出すように調整されたAPI、ということですね。

その優れた性能をぜひ体験していただきたく、先日Google Colabファイルを提供させていただきました。こちらからご確認いただけます。

Stable Diffusion 3 Medium (2Bモデル) がリリースされましたが、#StabilityAI APIでは、上位モデルである #StableDiffusion3 8Bモデルが利用可能です。

8Bモデルを搭載した Stable Image Ultra をすぐに試せるColab Notebookを作成しました。お気軽にご利用ください。https://t.co/ZDVeXtQc63 pic.twitter.com/IuR8x9ST2Z
— D̷ELL (@xqdior) June 13, 2024

Google Colab notebook への短縮URL
https://j.aicu.ai/SD3UC

とはいえ、急に有償のAPIを利用するのは少しハードルが高いかもしれません。そこで今回は、懇意にしている皆様に、APIの最上位モデルである Stable Image Ultra を利用いただき、その感想を伺いました。

生成画像集

みなさまの生成された画像と、プロンプト、利用コメントを頂いております。
多種多様な画像を生成いただいておりますので、ぜひお楽しみください。

ご協力頂いた Discordサーバー AI声づくり技術研究会様、ありがとうございます。

うんわさん

コメント：「あまりプロンプトを工夫してなくても非常に高品質な画像がパッと出てきて、とてつもない進化を感じました。」

A soft, plush toy shaped like a smiling face with two round black eyes and a simple curved smile. The toy is light purple and appears to be made of a soft, fuzzy material. It is positioned on a blue quilted surface with a light gray background, cute, kawaii, close-up shot, high detail.

a breathtaking underwater photo of a hand underwater touching the surface to create a ripple of bright abstract eye galaxy nebula vortex of beauty and nature, sunlight and chaos

robot girl, android,hanging,female, robot_torso,mechanical parts, cable, masterpiece, in a futuristic robotics lab, deactivated, wires, highly detailed, dynamic lighting, pale skin

aurora, milky way, night, night sky, shooting star, space, starry sky, galaxy, sky, city lights, constellation, light particles, skyscraper, cityscape, a girl, long hair, skyline, city, standing, twilight, looking at viewer, yellow eye

an image of a World War II battle scene. Include soldiers in era-specific uniforms, trenches, barbed wire, and debris. Show infantry, tanks, and military vehicles with smoke and fire. Add an overcast sky for a grim atmosphere. Use a muted, gritty color palette.

へむろっくさん

コメント：「触ってみな　飛ぶぞ！」

Girls who play games on a gaming PC with multiple monitors at home, willing, aged 20

Girl taking a selfie with her smartphone in the mirror at home, Young girl dressed in black gothic Lolita fashion, kawaii, anime,

うみせさん

コメント：「SD3を使ってみて、先日公開されたmediumよりも良い感じに生成できて楽しかったです。これまでにSD1、SD2、XL、cascadeと試してきましたが、SD3はそれらの良いところをうまく取り入れているように感じました。プロンプトの効きと生成結果がとてもよく、体験としては非常に素晴らしかったです。まだultraはAPIのみでの利用ですが、APIに抵抗がない方にはぜひ試してみてほしいです。」

At dusk, in a polished, beautiful fantasy city where light and darkness intersect, god rays rain down from high in the sky, illuminating the city.

A surreal landscape with a giant floating crystal in the sky.

game screen shot of Open world game with a character in a forest, with game hud

a concept pixel art of star night, sky full of stars, a person standing on a hill, looking at the sky, japanese anime style, 16bit, Title logo write 「hello world」

a concept art of Dark soul style weapons, setting sheet,

1girl, solo, cyberpunk, barcode, black footwear, black jacket, black skirt, boots, braid, brown hair, building, car, character name, crosswalk, full body, green eyes, hand in pocket, high heel boots, high heels, holding, holding umbrella, jacket, long hair, long skirt, motor vehicle, phone, pink umbrella, road, road sign, sign, single braid, skirt, smile, standing, twin braids, umbrella

Glittering neon signs and flying cars are reflected in the dark, stagnant river. Skyscrapers built high in the sky, cyberpunk city, cyberpunk

In a vibrant 1990s-style anime illustration, a young girl strikes a fashionable model pose in the heart of a bustling city. She embodies the essence of cyberpunk, dressed in the latest streetwear trends that blend futuristic elements with retro flair. Her outfit features a sleek jacket with neon accents, high-waisted pants, and chunky sneakers, all glowing under the city’s neon lights. She wears stylish sunglasses, reflecting the colorful, electric atmosphere around her. Her confident stance and playful expression capture the spirit of a fashion icon, seamlessly merging the past's nostalgia with the future's edgy vibe. The background is a lively urban scene, filled with towering skyscrapers, bright billboards, and bustling crowds, perfectly encapsulating the dynamic energy of a cyberpunk metropolis.

yutoさん

コメント：「未来の技術は今使ってこそ未来の技術と言います。Stable Image API Ultraは今使える未来の技術です!!」

realistic, natural light, photo, long hair, portrait, asian and caucasin mixed girl, beautiful model, white shirt, having card "Yes I am"

realistic, natural light, photo, long hair, portrait, asian and caucasin mixed girl, beautiful model, white shirt,

uthreeさん

コメント：「メチャクチャクオリティ高いとしか言いようがない」

a girl falling in the sky, smile, starry night, white hair, anime, vibrant, high quality,

A detailed anime-style character design, featuring a young girl with long flowing purple hair and bright blue eyes. She is wearing a stylish futuristic outfit with intricate details, including a metallic silver jacket, a neon blue skirt, and knee-high boots. Her expression is cheerful, and she is standing in a vibrant, colorful cityscape with tall buildings and neon signs in the background. The sky is stunningly beautiful, with a gradient of colors from deep blue to vibrant pink, adorned with fluffy white clouds and a glowing sunset. The lighting is dynamic, with a mix of natural and artificial light, giving the scene a lively and energetic atmosphere. The overall style is highly detailed, with a focus on capturing the unique elements of anime art and the breathtaking beauty of the sky.

1girl, solo, cyberpunk, barcode, black footwear, black jacket, black skirt, boots, braid, brown hair, building, car, character name, crosswalk, full body, green eyes, hand in pocket, high heel boots, high heels, holding, holding umbrella, jacket, long hair, long skirt, motor vehicle, phone, pink umbrella, road, road sign, sign, single braid, skirt, smile, standing, twin braids, umbrella

A girl, starry night, anime, vibrant, high quality, pixel art

雫さん

コメント：「久しぶりに画像生成AIを使いましたが、前に使った時よりすごくプロンプトが効きやすい気がしました。ものすごく楽しかったです。貴重な機会をありがとうございました！」

Black long hair, Anime, kawaii, 1girl, black eyes, headphone, white clothing, looking down at viewer, standing, building, city, frombelow, upper body, side shot

Anime, Kawaii, ilustrated, 1 girl, purple long hair, crimson eyes, sunset, building, city, Aurora front view

In an illustration style, Kawaii and animated, it evokes the interior of a Gothic cathedral, with red ambient lighting showing large stained glass windows on either side, and rays of light in the center illuminating the dust in the air, creating a mysterious atmosphere. And a girl with black wings and red eyes floats in the center, looking at us

flyfrontさん

コメント：「長い自然文でもちゃんとイラストに反映されてて良い感じ！」

illustrated in an anime style with the focus on the upper body, from a slightly angled front view. A Japanese woman wearing a lace trimmed blue evening dress off shoulder style is sitting at the counter of a luxury hotel's top-floor bar. The dress shows a collarbone and the feminine curves of her body. She is wearing a jewely necklace and has her silver hair up and red eyes. With a melancholic expression, she gazes out at the fog and rainy skyscraper cityscape through the window. The woman is holding an envelope in her hand, with the word "Invitation" written on it. The bar is elegantly decorated with dim lighting, cocktail glass on counter table, creating a sophisticated and intimate atmosphere. The city lights and rain outside the window create a reflective and moody ambiance. nega:behind, v-neckline, nsfw

kawaii anime style. A medieval girl with blonde hair is swinging a katana toward front with the katana's blade gleaming in the light. She is dressed in traditional European white armor with intricate patterns and details, wearing frilled skirt. Her expression is determined and focused. The background is a blend of a serene landscape, featuring flowers in full bloom, and an ancient cathedral.photorealism, cartoon, samurai, cherry blossoms,

焼肉Yakiinkuさん

コメント：「プロンプトの反映がとても自然に感じました！頭で考えたイメージや情景をかなりの精度で絵にしてくれる(しかもすごい生成速度早いっ)ので、「すごい！」もそうなのですが「とっても楽しい！」って感じなので時間を忘れて夢中になります･･！楽しいイベントありがとうございます！」

Anime, kawaii, depth of field, thick fog, smoke, kisser, cigarette, red and white, monotone, petals fused with body, flowers, glamour, Chinese dress, empty eyes, morbid, hair in a bun, long hair, clock tower, crack in space-time,

Anime, kawaii, girl, solo, depth of field, waves, flat colour, best image quality, symmetrical face, summer, water on dress, water droplets, specular reflection, refracted glass shards, prism, moon celestial body, liquid clothing, long yellow dress, harmony,

Anime, kawaii,depth of field, thick fog, Full smiles, happiness, hope, white wedding dress, church, disquiet, grey world, bursts of blood, despair, cracks in the world, slaughter, incident, stillness,

Anime, kawaii, fantasy, Arabian Nights, lamp witch, dragon, fun, flying, magic carpet, light shards, adventure, boy, girl

代屋モントさん

A scene where a giant octopus-like monster and a fighting humanoid robot shoot pile bunkers into the octopus.

An androgynous elementary school boy with a dark atmosphere wearing a gothic dress

An anime style of a hero wearing a tiger mask standing on a telephone pole.

(((((((anime))))))) depth of field, wave at the edge of dress, masterpiece, flat color, best quality, BRAKE. ((kawaii)), perfect symmetrical face,summer,wave, ((colorful refraction)), ((beautiful detailed sky)), ((dark intense shadows)), ((cinematic lighting)), ((overexposure)), water on the dress, (water sea red dress blending with sea), from side,beautiful detailed glow, ,detailed lighting, detailed water,(beautiful detailed eyes),(smile), standing in the ocean, detailed wet clothes， partially submerged, Refracting glass fragments, prisms, lunar celestial nature, BRAKE. (liquid clothes:1.2) ,a girl solo: {dress<wave>, {{dissolving dress}},A dress in harmony with the sea,dress floating into sea}, (beautiful detailed girl) (long dress blending with ocean), (yellow long dress:1.5), small breasts, skinny 【Negative】 blur, lowres, bad anatomy, bad hands, text error, missing fingers, extra digits, fewer digits, cropped, worst quality, low quality, standard quality, jpeg artifacts, signature, watermark, username, blurry, glow, slippage, blur, bokeh, pink, multiple views,large breasts, large breasts, medium breasts, huge breasts, enormous breasts ,Hair that doesn't fit into the illustration, blush, flat chest q_version, nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, symmetry, outline(painting),cartoons,sketch,(worst quality:2),(backlight:1.2),bad anatomy,bad hands,double navel,collapsed eyeshadow,multiple eyebrows,freckles,signature,logo,2faces,((3fingers:1.2)),((4fingers:1.2)),((6fingers:1.2)),(laugh line:1.2),

マッキーさん

kawaii, anime, 1girl, solo, Very beautiful glowing skin., blue eyes, long hair, gray hair, elf, Huge breasts, looking at viewer, upper body, camisole, absurdres, highres,Detailed background,Outdoor Lakeside

Create a high-resolution, upper-body image of a cute anime girl with blue eyes and long, flowing gray hair. She has tanned skin and is an elf with delicately pointed ears. She is smiling warmly and looking directly at the viewer, giving a friendly and inviting expression. She is wearing a light, pastel-colored camisole that complements her complexion. Her hair cascades gracefully around her shoulders, with a few loose strands framing her face. The background should depict a sunny lakeside scene with clear blue skies, a sparkling lake, and lush greenery. Ensure the background is detailed yet softly blurred to keep the focus on the character. The style should be kawaii and highly detailed, capturing the charming and whimsical essence of anime art. Ensure the image is high quality and high resolution, with careful attention to the character's features and expression.

生の声

ちょっとだけお試し。
2Bモデルと比べて表現の幅とPromptの効き方がすごくてよき☺️#StableDiffusion3 #SD3 https://t.co/g2dgSkCHbO pic.twitter.com/k6REuE9w4u
— へむろっく (@Hemlok_AI) June 15, 2024

試してみました https://t.co/8bV0SyvWeL pic.twitter.com/qm4eB08sCD
— 代屋モント (@DaiyaMontoZ) June 15, 2024

プロンプトの効きがハンパないです！！
もう作れない画像ないのでは…？https://t.co/1Y26xBnPHW pic.twitter.com/EhLKfx4hsY
— 山茶花 (@sazankaimoto) June 15, 2024

SD3 medium出たからultra試したけど、meduimよりは良かった。
これはultraラーメンです https://t.co/yrt3X6STBR pic.twitter.com/v0IT0KW781
— 海瀬稜創 / umise (@UiE029) June 15, 2024

アニメイラスト指定でちゃんとそれっぽい画風で出るんで良い感じね
— flyfront (@flyfront) June 15, 2024

#StableDiffusion3 8Bモデル Ultra というわけで試してみた
アニメ風イラストは問題なくいけるねー(NSFW引っかからない範囲で妖艶な女性のドレス)
雰囲気とても良し！
カードにはInvitationって文字指定したけどサイズ小さいからか読める感じではなかったね https://t.co/laSeIVYoH5 pic.twitter.com/LscZY5J0GN
— flyfront (@flyfront) June 15, 2024

すごく良い感じ。 https://t.co/yhtQV964dp pic.twitter.com/Mt0Oet8ahu
— uthree (@UThree271828) June 15, 2024

https://twitter.com/mckey_draw/status/1801990763578093651

ChatGPTとの連携

プロンプトは、ChatGPTに生成してもらったという方が多くおられました。
GPTsでStable Diffusionのプロンプトを生成できるらしく、ぜひ参考にして頂ければと思います。また、Stable Diffusion 3 は自然言語処理に対応しておりますので、一般的な英文でも高品質な画像が生成できます。

「どんな呪文を使えばいいかわからない…。」という方でも、安心して本稿のような画像が生成可能です。安心ですね。

まとめ

いかがでしょうか？ひとつのAPIで、スタイルの指定など不要で、様々な画像が生成できていることがご覧いただけたかと思います。ユーザーのみなさまは、画像生成のベテランの方から初学者の方まで様々でしたが、望み通りの画像が出力出来たと大好評をいただきました。

APIの利用方法は、以下の記事にまとめておきました。
ぜひこの機会に、全世界最高峰・最上位の画像生成AIをお試しくださいませ。

ご協力いただいたみなさまに感謝申し上げます。
最後までご覧いただき、ありがとうございました。

本投稿はこちらの原作より、AICU media編集部に寄稿されたものです。
寄稿日 2024年06月16日

ご協力いただいた皆様、ありがとうございます。

Stability AI Japan – External AdvocateのD̷ELLさんもありがとうございます。
Stable Diffusionの探求を拡げていけるクリエイターのみなさまに感謝です。

AICU、業務拡大に伴い、新プロジェクトの主軸となるAIアート系人材をオーディション形式で募集開始
2024-06-16
Stable ImageのEdit APIで顔を置き換えよう #10分で学べるAI

AIでいろいろ作ってビジネスをつくりだす「AICU部」

ルゥくんとコト先輩がAIでいろいろ作ってビジネスをつくりだす「AICU部」の部活動。
前回までのお話はこちら #10分で学べるAI

今回のクライアントは「旅行代理店」です。

どうやら何か画像で困っているようです。

ルゥ「この写真、美味そうっすね！」

コト先輩「これね……今回のクライアント、旅行代理店からの依頼。ツアーに参加したお客さんが送ってきた『海外の有名レストランの自撮り写真』を使って、『バエるブログを書いてほしい』という依頼なんだけど、お客さんさんの顔は出しちゃダメっていわれて頭抱えてます……」

ルゥ「絵文字とか雑コラで顔を隠すのはダメなんですか？」

コト先輩「やってみたんだけど、それだと『リアル感が伝わらないからってダメ』ってダメ出しされちゃった……。」

――自撮り写真は使うけど、顔は出しちゃダメって無茶だろ……でもこんなときこそStable Imageの「Edit API」の出番かも！

やってみよう

Stability AI が提供する Stability AI Developer Platform のイメージサービスのうちのひとつ「Stable Image」のEdit APIを使って、GPUいらず、たった3分程度で商用利用できる肖像権対策のための顔置き換えを行ってみましょう。

今回はGoogle Colabで動作するツールとして提供します。

Stability AI のプラットフォーム APIキーの入手

まず、このGoogle Colabで画像生成をするには Stability AI のプラットフォームを利用するAPIキーが必要です。持ってない人はここにアクセスしてAPIキーを取得するか、管理者殿にお願いしてAPIキーを発行してもらってください。

https://platform.stability.ai/account/keys

生成できない場合は支払い設定（https://platform.stability.ai/account/credits）を確認してください。

Copy ❏ したら「sk-….」で始まるAPIキーをクリップボードにコピーできます。このAPIキーが流出すると他人にクレジットを勝手に使われてしまいますので管理はお気をつけて。

自分のドライブにGoogle Colabをコピーしよう

このリンクでコピーして使える Google Colabを配布しています。

https://j.aicu.ai/CIEdit

このColabを開いたら、まずは「ドライブにコピー」のボタンを押してご自身のドライブにコピーしましょう。

Google Colabを実行してみよう

「ドライブにコピー」できたら上のコードから▶を押して実行しましょう。

するとGoogle Driveに接続するための許可を要求してきますので指示に従って許可してください。

2番目のコードを実行するとAPIキーの入力を求められます。

発行したAPIキーを入力してからEnterを押すとAPIキーの入力は完了します。

最後に3番目のコードを実行すれば準備完了です。

Edit APIを実行して顔を置き換えてみよう

ここまでできたら編集したい画像をGoogleドライブ上に作成されたImage_Edit_APIフォルダに配置しましょう。

画像ファイルの名前をColabにあるimagefileという欄に入力して実行すると顔を置き換える画像編集が自動で行われます。

しばらくすると編集前の画像と編集された画像が Colab に表示されます。

編集前の画像

編集後の画像

料理や背景はそのままに顔だけ置き換えることができました！

また編集された画像はGoogleドライブのImage_Edit_API/editedというフォルダに保存されます。

まとめ

うまく顔だけ置き換えることができましたか？

今回は Search & Replace のみを紹介しましたが、Stability AI の Edit APIには以下の機能があります。
・Search and Replace
・Inpaint
・Outpaint
・Remove Background
・Erase Object
https://platform.stability.ai/

AICU mediaでは今後も Stable Diffusion 3 のディープな使いこなしや、Stable Image Core などをはじめとする魅力的な API を用いた記事を発信していきます。

✨️AICU Inc.は Stability AI 公式パートナーです。

様々なアプリ開発のご相談も承っております！サービスに導入したい、使いこなせる社員をパッと育成したい！そんな需要がございましたら sai@aicu.ai までどうぞご相談ください。

https://corp.aicu.ai/ja/stability-ai-membership

noteマガジン「Stability AI Fun!」もおすすめします！

https://note.com/aicu/m/m6000f560d1db

❏生成AI時代に「つくる人をつくる」AICU社、生成AIリーディング企業「Stability AI」と戦略提携

https://prtimes.jp/main/html/rd/p/000000007.000133647.html

#10分で学べるAI

Stability AI 関連記事

面白かったらぜひフォロー、いいねをお願いします！

✨️本記事が面白かったら、 X@AICUai, noteのフォロー、シェアをよろしくお願いいたします！

https://note.com/aicu

社内Slack等のシェアでも歓迎です。

また「こんな記事欲しい」といったリクエストがございましたら X@AICUai までメンションやDMでいただければ幸いです。

2024-06-15
Stable Diffusion 3 Mediumリリース
日本時間2024年6月12日午後10時ごろ、ついに Stable Diffusion 3のオープンな最新モデル「Stable Diffusion 3 Medium」のweightsがリリースされました。公式リリースを中心にお送りします。

Stable Diffusion 3 シリーズの最新かつ最も洗練されたモデルである Stable Diffusion 3 Medium をご紹介します。

このリリースは、生成 AI の進化における大きなマイルストーンであり、オープンな生成AIに対する私たちの取り組みを継続するものです。

詳細は、こちらをご覧ください。… pic.twitter.com/01ZoA9UW8p
— Stability AI Japan (@StabilityAI_JP) June 12, 2024

Stability AI が Stable Diffusion 3 の weights を 2024年6月12日に公開予定…ところで画像生成AIにおける weights って何？

最も洗練された画像生成モデル、Stable Diffusion 3 Medium のオープンリリースを発表 — Stability AI Japan

最も洗練された画像生成モデル、Stable Diffusion 3 Medium のオープンリリースを発表
- Stable Diffusion 3 Medium は、Stability AI の最も先進的なテキストから画像を生成するオープンモデルで、20億のパラメータから構成されています。
- このモデルはサイズが小さいため、個人向けシステムや企業向けGPUで動作させるのに最適です。
- このモデルは、現在、オープンな非商用ライセンスと低コストのクリエイターライセンスの下で利用可能です。大規模な商用利用のライセンスの詳細についてお問い合わせください。
- このモデルを手軽に利用するには、 Stability Platform のAPI を利用するか、Stable Assistant や、 Discord 上の Stable Artisan からもご利用いただけます。
Stable Diffusion 3 シリーズの最新かつ最も高度なテキストから画像へのAIモデルである Stable Diffusion 3 Medium を発表できることを嬉しく思います。Stable Diffusion 3 Medium は、生成AIの進化における重要なマイルストーンであり、このパワフルなテクノロジーを民主化するというStability AI のコミットメントを継続するものです。

SD3 Medium の特徴

SD3 Medium は、SD3の20億パラメーターモデルで、いくつかの特筆すべき特徴を備えています。
- フォトリアリズム: 手や顔によく見られる不自然さを克服し、複雑なワークフローを必要とせずに高品質の画像を提供します。
- プロンプトの忠実さ: 空間的関係、構成要素、動作、スタイルを含む複雑なプロンプトを理解します。
- テキスト生成: Diffusion Transformer architecture により、ノイズやスペルミスのないテキスト生成において、これまでにない結果を達成します。
- リソース効率: 低いVRAMフットプリントにより、標準的なコンシューマー向けGPUでパフォーマンスを低下させることなく実行することができます。
- ファインチューニング: 小さなデータセットから微妙なディテールを理解することができ、カスタマイズに最適です。
NVIDIA とのコラボレーション

NVIDIAとコラボレーションし、NVIDIA® RTX™ GPUとTensorRT™を活用することで、Stable Diffusion 3 Medium を含むすべてのStable Diffusion モデルのパフォーマンスを強化しました。TensorRT で最適化されたバージョンは、クラス最高のパフォーマンスを提供し、パフォーマンスが50%向上します。

TensorRT に最適化された Stable Diffusion 3 Medium にご期待ください。

AMD とのコラボレーション

最新のAPU、コンシューマー向けGPU、MI-300XエンタープライズGPUなど、さまざまなAMDデバイス向けにSD3 Medium の推論を最適化しています。

オープンでアクセスしやすいモデル

オープンな生成AIへの Stability AI のコミットメントは揺るぎません。Stable Diffusion 3 Medium は無償の非商用ライセンスでリリースされ、Hugging Face を通じて入手可能です。アーティスト、デザイナー、開発者、AI愛好家の皆さまは新しいクリエイターライセンスをご利用ください。

大規模な商用利用については、お問い合わせください。
⭐︎AICUはStability AIの公式パートナーです sai@aicu.ai ⭐︎

HuggingFaceのモデルカードで詳細情報が公開されています

モデルの種類： MMDiTテキスト画像生成モデル
モデルの説明：テキストプロンプトに基づいて画像を生成するために使用できるモデルです。マルチモーダル拡散変換器（Multimodal Diffusion Transformer）（https://arxiv.org/abs/2403.03206）であり、3つの固定された事前学習済みテキストエンコーダ（OpenCLIP-ViT/G、CLIP-ViT/L、T5-xxl）を使用します。

APIとアプリケーションでStable Diffusion 3を試してみる

オープンリリースと同時に、Stable Diffusion 3 Medium を API でご利用いただけるようになりました。Stable Diffusion 3 のモデルをベースにした様々な強力な画像サービスが、Stable Assistant や、Stable Artisan 経由の Discord でお試しいただけます。まずは3日間の無料トライアルをお試しください。

利用方法
- Stable Diffusion 3 Medium をダウンロード: 非商用利用目的で Hugging Face からダウンロードする。
- 商用利用: Contact us からお問い合わせください。
- アプリケーション: Stable Assistant と Stable Artisan からもご利用いただけます。
- FAQ: その他は FAQs をご確認ください。
安全性

Stability AI は、安全で責任あるAIの実践を信じています。これは、悪意ある者による Stable Diffusion 3 Medium の悪用を防ぐために、合理的な手段を講じ、それを継続することを意味します。安全性は、モデルのトレーニングを開始した時点から始まり、テスト、評価、デプロイを通して継続します。Stability AI は、このモデルの広範な内部および外部テストを実施し、危害を防止するための数多くのセーフガードを開発し、実施してきました。

研究者、専門家、そしてコミュニティと継続的に協力することで、モデルを改善し続けながら、誠実にさらなる革新を進めていきます。Stability AI の安全性へのアプローチについての詳細は、 Stable Safety をご参照ください。

ライセンス

Stable Diffusion 3 Mediumは、Stability Non-Commercial Research Community Licenseの下でリリースされています。
Stability AI は、コミュニティが Stable Diffusion 3 を活用することを奨励すると同時に、AIをオープンでアクセス可能な状態に保つというミッションのもと、新しいクリエーターランセンスを導入しました。プロのアーティスト、デザイナー、開発者、AI愛好家の皆様には、クリエーターライセンスを利用して、Stable Diffusion を使った開発を始めることをおすすめします。

大規模な商用ユーザーや企業の方は、ご連絡いただき、エンタープライズライセンスを取得してください。これにより、Stability AI の利用ガイドラインを遵守しながら、皆さまがモデルの可能性を最大限に活用できるようになります。

Stability AIより：今後の展開

皆さまからのフィードバックに基づき、Stable Diffusion 3 Medium を継続的に改善し、機能を拡張し、パフォーマンスを向上させる予定です。Stability AI の目標は、AI生成アートにおける創造性の新たな基準を設定し、Stable Diffusion 3 Medium をプロと趣味利用の方の双方に不可欠なツールにすることです。

皆さんが新しいモデルを使ってどのような作品を創作されるかを楽しみにしていますし、皆さんからのフィードバックを楽しみにしています。共に、生成AIの未来を形作って行けたらと思っています。

公式ツイート動画より
2024-06-15
JETROから世界のAIコミュニティへ – AiSalon Tokyo June 2024 登壇資料を公開
AiSalonとは？

AiSalonは、AI技術に情熱を持つプロフェッショナルたちが一堂に会し、ネットワーキングと協力を促進するための世界的コミュニティです。世界中の各地の地域支部の分散型グローバルコミュニティで運営されています。

Tokyo AI(TAI) について
東京支部はすでに30登壇者191人のコミュニティに成長しています。

独立行政法人日本貿易振興機構（ジェトロ）とは
ジェトロ(Japan External Trade Organization: JETRO)は貿易・投資促進と開発途上国研究を通じ、日本の経済・社会の更なる発展に貢献する国の機関です。70カ所を超える海外事務所があり、イノベーション創出、輸出や中堅・中小企業等の海外展開を支援しています。 https://www.jetro.go.jp/jetro/

世界を舞台に日本で活動するAIスタートアップのピッチ

今回の「AiSalon Tokyo」は、JETRO（ジェトロ）を会場にAICUの白井暁彦CEOをはじめとするスタートアップ8社の企業が登壇し、それぞれの最新の技術、サービス、プロジェクトについて5分で紹介しました。本記事では登壇各社の資料や写真を紹介します。

イベントのハイライト
- 各社ピッチ: 各企業が独自のAI技術を5分間のピッチ披露しました。参加者は最新の技術に触れ、その可能性に驚きを隠せないといった表情をしていました。
- ネットワーキングセッション: イベント後半には、自由に交流できる時間が設けられ、登壇者と参加者同士で自由に交流が行われました。
- AICUの特色が光る: 「つくる人をつくる」をビジョンにするAICUの白井CEOが、クリエイティブAIの現在と未来について熱く語り、参加者や他の登壇社から「尖ったピッチだった！」とフィードバックをいただきました。
登壇者一覧とスライドへのリンク

JETRO　（加賀悠介氏）

資料： AIST3_00_JETRO.pdf

SOXAI（渡邉達彦、創業者兼CEO）： SOXAI RINGは日本製の指輪型ウェアラブルデバイスで、睡眠、ストレス、活動の質など日常生活の健康状態をモニタリングすることができます。

資料： AIST3_01_SOXAI.pdf

Jurin AI ( Rise Ooi、創業者兼CEO)：樹林AIは、タスク管理や文書作成など物件管理で必要になる仕事を自動化する不動産管理サービスです。

StreamPod（オクタビオ・カノ、創業者兼プラットフォーム・エンジニア）： StreamPodは、マルチテナント管理プラットフォーム内にパッケージ化されたマルチモーダルLLMを統合することができるプラットフォームサービスです。StreamPodでは、マルチメディアのための幅広いAPIセットを提供します。

資料： AIST3_03_StreamPod.pdf

Zeteoh（ヤン・ル・ギリー、共同創設者兼CEO）：従来の屋内位置情報システムはビーコンを使用しますが、技術的な複雑さ、制限、メンテナンスの必要性からビジネスに不満を抱かせる可能性があります。ZeteohはウェアラブルデバイスとAIを組み合わせ、ビーコンを使わないロケーションソリューションを提供しています。

資料： AIST3_04_zeteoh.pdf

AICU Inc.（白井暁彦CEO）： AICU Inc.は、クリエイティブAI時代の「つくる人をつくる」をビジョンに掲げるクリエイティブAIメディア事業について紹介しました。

資料： AIST3_05_AICU.pdf
SpeakerDeck [AICU Vision「生成AI時代につくる人をつくる」Creating people who create]

AICU Vision 「生成AI時代につくる人をつくる」 Creating people who create

Somhako（ソマンナ・アイヤッパ、創業者兼CEO）： SomhakoはAIを活用した人材管理プラットフォームで、データ主導の重要な洞察に基づいて効率的に人材を採用・管理するよう設計されています。

資料： AIST3_06_Somhako.pdf

RightsTech（佐々木繁取締役）： HIMEPAはインターネット上の性犯罪やリベンジポルノを検知するサービスです。ダークウェブやソーシャルメディアをクロールし、AIを使って動画や画像を分析・報告します。また、弁護士との連携により、対象となる動画や画像の削除をワンクリックで依頼できます。

資料： AIST3_07_RightsTech.pdf

AWL（フランシスコ・レンテリア取締役）： AWLは、AIとディープラーニングをベースとした動画解析のマーケットリーダーであり、小売業を中心とした広範な企業顧客にリアルタイムの洞察とインテリジェントデータを提供しております。

資料： AIST3_08_AWL.pdf

ピッチの後には懇親会が開催されました

「つくる人をつくる」というビジョンで終始一貫ハイスピードに語られたAICUのピッチは他の登壇とは明らかに違う！という反応を多々いただきました。

書籍「画像生成AI Stable Diffusionスタートガイド」についても「こんないい本があるの！知らなかった」という方々に書籍の魅力をとどけることが出来ました。海外版の需要もありそうですね。

AiSalon Tokyo、続きはdiscordで…

まとめ

以上、「つくる人をつくる」をビジョンとするAICUにジョインをした
はねごろうがお伝えしました。

今回はイベントレポートからのデビューとなりましたが、今後は他の分野の記事でも皆様に喜んでいただけるものをお届けできるよう努めていきたいと思います。

また当日の取材は全て英語でのコミュニケーションとなりましたが、イベント後の交流会でご挨拶させていただいた方々には、ITやヘルスケア・投資家だけでなく、映像・VFX・ゲーム業界の方々などと交流させていただき、大変刺激的かつ貴重な経験を積むことができました。

今後も読者の皆様にむけて、ディープなイベント取材を実施していきたいと思います！

この記事に「いいね！」と思ったら、いいねとフォロー、おすすめをお願いします！
https://note.com/aicu/ X(Twitter)@AICUai
2024-06-15
国際AI映像制作コンペ「オデッセイ」開催 #ProjectOdyssey

第1回 AI映像制作コンペティション「プロジェクト・オデッセイ」が開催されます！

2024年6月17日から7月15日まで、3Dアニメーション、ミュージック・ビデオ、技術紹介などの動画に挑戦する作品を募集します。
参加申し込みはこちら：http://projectodyssey.ai

プロジェクト・オデッセイのX(Twitter)はこちら：X@Project0dyssey

コンペの目的

プロジェクト・オデッセイは、AIと映画業界のクリエイター、コミュニティ、企業を結びつけることを目的としています。2024年6月17日から7月15日まで、AI映画制作の限界に挑戦し、あなたの壮大な作品をコミュニティにシェアして、プロフェッショナルな審査委員会を驚かせて賞金とクレジット総額28,000ドル（参考：日本円で437万円）を獲得してください！

主催者/プレミアスポンサー/スポンサー

Civitaiをはじめとする主催者、プレミアスポンサー、スポンサー企業が興味深いです。

Announcing the 1st Project Odyssey AI Filmmaking Competition!

From June 17th to July 15th, we are excited to challenge the community to make next-level 3D Animations, Music Videos, Narrative Shorts, and more. Sign up at: https://t.co/o5ZBfkMUV0 #projectodyssey pic.twitter.com/e0CHGePAXd
— ProjectOdyssey.ai (@Project0dyssey) June 10, 2024

募集カテゴリー

募集カテゴリーは４部門です。

3Dアニメーション部門

AI映像制作ワークフローを使って3Dアニメーションでキャラクターと背景をユニークなスタイルでアニメーション化する部門です。

オープンフォーマット部門

ストーリー性のある短編、実験的なアート、視覚化された詩、映画の予告編、スペック広告など、まったく別のものを作りたいですか？オープンフォーマット部門は、すべてをカバーします！

ミュージックビデオ部門

あなたが制作した、またはAI音楽ツールで制作したオリジナル曲を使って、AIミュージックビデオまたはビジュアライザーを制作してください。

舞台裏動画部門

AIコミュニティの素晴らしさの一端は、オープンソースで共有され、学ぶ機会を与えている点でもあります。「Behind-The-Scenes（ビハインド・ザ・シーン；舞台裏）カテゴリーでは、クリエイターとしてのあなた自身にスポットライトを当て、3Dアニメーション、ミュージックビデオ、またはオープンフォーマットで提出した作品に費やしたテクニック、ツール、努力を紹介する部門になります。

参加者には無料トライアルやスポンサーツールの早期利用が予定されているそうです。
サインアップはこちらから　https://www.projectodyssey.ai/signup-form

審査委員会

スポンサーしているAI動画生成系のツールを中心に多様な審査員がリストされています。

エリック・ソロリオ：AI映像作家、VFXアーティスト
マット・ウルフ：AI映像作家、FutureTools.io創設者
セバスチャン・カムフ：AI教育者
タイラー・ベルナベ：AI映像作家、Civitaiソーシャル戦略・コンテンツマーケティング責任者
ジャスティン・ハックニー：AI映像作家、ElevenLabsクリエイティブ・ディレクター、Realdreams創設者
クリスティ・ラウ：デジタルアーティスト、Realdreams代表
リング・ヒヤシンス：AI映像作家、Morph Studio代表
フローレス・リアルトーク：ミュージシャン、ラッパー、起業家
ジョイワイン：AIフィルムメーカー、LensGo代表
ブライアン・ライオン：オープンソースAIのエキスパート、DeepMake CTO
ニコライ・クレンケ：Neural Frames創業者兼CEO
レイチェル・ジョイ・ヴィクター：FBRC.ai共同創設者
マックス・ラッシャー：AIインフルエンサー、Artificial Inspiration創設者アーロン・シストス：AI映画制作ベンチャーキャピタリスト
Nitta ココ：iKHOR Labs CEO

続報を待て！

日本国内のAI動画生成作家も素晴らしいですが、このように複数のスタートアップ企業や、クリエイターが支援する国際コンペティションの機会はなかなかあることではありません。

https://corp.aicu.ai/visual

AICU – AI Creators Union Demo Reel 2024 Summer

ルール、賞金、応募の詳細は6月17日に発表されるそうです。
「つくる人をつくる」AICU mediaでは引き続きレポートしていきます。

★プロジェクト・オデッセイ事務局へのお問い合わせは hello@projectodyssey.ai まで英語でご連絡ください。

2024-06-15
#10分で学べるAI バッチファイルでバリエーション広告を生成しよう(2)解説編
前回紹介した、いろいろなスタイルの画像を生成しまくってくれるバッチファイル「Stable Image Core API Image Creator」の仕掛けを解説します！

なお、概要や使い方は前回の記事をご覧ください #10分で学べるAI

#10分で学べるAI バッチファイルでバリエーション広告を生成(1)使ってみよう編

#10分で学べるAI Google Slidesでバリエーション広告を大量生成

バッチファイルをダウンロード

このリンクでダウンロードして使えるバッチファイルを配布しています。

https://j.aicu.ai/SaiImgBat

これを無料で配ってしまうのはいかがなものか……という議論がありますが、今回はさらにこの中身を解説していきます。

バッチファイルの中身解説

このバッチファイルは以下の流れで動作しています
- 設定を読み込む
- APIキーの確認をする
- 現在の設定を表示して確認を促す
- APIを呼び出して生成する
- 生成が完了したことを知らせる
これからそれぞれの動作について説明します

なお気になる場合はメモ帳やVisual Studio Codeなどでバッチファイルを開くと中身を直接見ることができます

設定を読み込む

バッチファイルが実行されると、ウィンドウタイトルなど、プログラムとして必要な機能を設定します
```
@ECHO OFF
title SIC_IMG_Creator
setlocal enabledelayedexpansion
cd /d %~dp0
```
また設定ファイル(SIC_setting.txt)を読み込んで生成に使うAPIキーやプロンプト、スタイルを変数として保存しています
```
for /f "tokens=1,* delims==" %%a in (SIC_setting.txt) do (
    set %%a=%%b
)
set STYLE_PRESET[1]=3d-model
set STYLE_PRESET[2]=analog-film
set STYLE_PRESET[3]=anime
set STYLE_PRESET[4]=cinematic
set STYLE_PRESET[5]=comic-book
set STYLE_PRESET[6]=digital-art
set STYLE_PRESET[7]=enhance
set STYLE_PRESET[8]=fantasy-art
set STYLE_PRESET[9]=isometric
set STYLE_PRESET[10]=line-art
set STYLE_PRESET[11]=low-poly
set STYLE_PRESET[12]=modeling-compound
set STYLE_PRESET[13]=neon-punk
set STYLE_PRESET[14]=origami
set STYLE_PRESET[15]=photographic
set STYLE_PRESET[16]=pixel-art
set STYLE_PRESET[17]=tile-texture
set STYLE_PRESETNOW=
```
APIキーの確認をする

プログラムの説明を表示し、APIキーの確認をします

設定ファイル保存されていたAPIキーが空だった場合、エラーとしてユーザーにAPIキーを設定ファイルに記入するよう促しプログラムを終了します
```
echo Stable Image Core API Image Creatorへようこそ！
echo このバッチファイルでは同じプロンプトで複数のスタイルの画像を連続で生成できます
:: STABILITY_API_KEY が設定されているか確認
if not defined STABILITY_API_KEY (
    echo エラー: APIキーがセットされていません、settings.txtに入力して保存してください
    echo APIキーを持っていない場合は https://platform.stability.ai/account/keys にアクセスしてAPIキーを取得してください
    GOTO :END_PROGRAM
    exit /b 1
)
```
現在の設定を表示して確認を促す

設定ファイルを読み込み、APIキーも確認すると現在の設定を表示してユーザーに確認してもらいます

さらにユーザーからの入力が「y」だった場合、次のフェーズに移ります
```
set /a all_img_num=%IMG_NUM%*17
:: 出力設定の確認
echo 以下の設定で出力します
echo プロンプト: %PROMPT%
echo ネガティブプロンプト: %NEG_PROMPT%
echo アスペクト比: %ASPECT_RATIO%
echo 保存フォーマット: %OUTPUT_FORMAT%
echo 出力サイクル数: %IMG_NUM%
echo 合計出力枚数: %all_img_num%

:INPUT_CONF
ECHO この設定で生成しますか？ (同じプロンプトで生成する場合、上書きされてしまいます！ )
ECHO （Y / N）
SET CONF_SELECT=
SET /P CONF_SELECT=

IF "%CONF_SELECT%"== SET CONF_SELECT=Y
IF /I NOT "%CONF_SELECT%"=="Y"  GOTO :END_PROGRAM
```
APIを呼び出して生成する

いよいよ Stable Image Core のAPIを呼び出して画像を生成します

Stable Image Core ではスタイルプリセットを指定できるので、スタイルプリセットだけ変更してAPIを繰り返し呼び出します

またAPIの呼び出しは指定されたサイクル数だけ行います
```
:: API呼び出し
:CREATE_IMG
ECHO 画像を %all_img_num%枚 生成中...
for /L %%n in (1,1,%IMG_NUM%) do (
    for /L %%i in (1,1,17) do (
        set STYLE_PRESET_NOW=!STYLE_PRESET[%%i]!
        echo !STYLE_PRESET_NOW!スタイル で生成中...
        curl -f -sS "https://api.stability.ai/v2beta/stable-image/generate/core" -H "authorization: %STABILITY_API_KEY%"   -H "accept: image/*"   -F prompt="%PROMPT%"  -F negative_prompt="%NEG_PROMPT%" -F style_preset="!STYLE_PRESET_NOW!" -F aspect_ratio="%ASPECT_RATIO%" -F output_format="%OUTPUT_FORMAT%" -o "./SIC_image/%PROMPT%_!STYLE_PRESET_NOW!_%%n.%OUTPUT_FORMAT%"
    )
   echo %%nサイクル 生成完了
)
```
APIはcurlを使って呼び出しています

この1行だけで画像生成をすることはできますが、コマンドプロンプト上でプロンプトを編集するのは至難の技なのでテキストで編集できるようにしました
```
curl -f -sS "https://api.stability.ai/v2beta/stable-image/generate/core" 
  -H "authorization: Bearer sk-MYAPIKEY" 
  -H "accept: image/*" 
  -F prompt="Lighthouse on a cliff overlooking the ocean" 
  -F output_format="webp" 
  -o "./lighthouse.webp"
```
APIについての詳しい仕様は Stability AI – Developer Platformを参照してください

生成が完了したことを知らせる

最後に生成が完了したことをユーザーに知らせ、プログラムを終了します
```
:: 結果表示
:DISPRAY_IMG
ECHO 生成が完了しました SIC_imageフォルダを確認してください

:END_PROGRAM

PAUSE
EXIT
```
まとめ

いかがでしたか？

たったこれだけのバッチファイルで画像生成をすることができます！

SIC_IMG_Creator.bat に加えて、Stable Diffusion 3で画像生成ができる SD3_IMG_Creator.bat も同梱されています。ぜひ高解像度・高品質・文字入れ可能な画像生成をお楽しみください。

ダウンロードはこちらから　https://j.aicu.ai/SaiImgBat

プロンプト例「sweet smile, 16 years old, red hair boy leaning in a classroom, anime style」

次回予告

コト先輩「ルゥくん、すばらしいね！クライアントも大喜びだよ」
ルゥ「お役に立てたようで良かったです～」

コト先輩「で、今回の依頼があった不動産屋さんの紹介を受けて、新規の依頼が舞い込んだよ……！」
ルゥ「えー！トントン拍子じゃないすかぁ……🫠」

次回はEdit APIを用いて自撮り写真の顔を置き換えちゃいます！

次回の #10分で学べるAI をお楽しみに！

AICUmediaでは今後もStable Diffusion 3.0 やStable Image Core を用いた記事を発信していく予定です

面白かったらぜひフォロー、いいねをお願いします！

✨️本記事が面白かったら、 X@AICUai, noteのフォロー、シェアをよろしくお願いいたします！

https://note.com/aicu

社内Slack等のシェアでも歓迎です。

また「こんな記事欲しい」といったリクエストがございましたら X@AICUai までメンションやDMでいただければ幸いです。

✨️AICU Inc.は Stability AI 公式パートナーです。

様々なアプリ開発のご相談も承っております！サービスに導入したい、使いこなせる社員をパッと育成したい！そんな需要がございましたら sai@aicu.ai までどうぞご相談ください。

https://corp.aicu.ai/ja/stability-ai-membership

生成AI時代に「つくる人をつくる」AICU社、生成AIリーディング企業「Stability AI」と戦略提携

https://prtimes.jp/main/html/rd/p/000000007.000133647.html
2024-06-11
2024年5月の好アクセスランキング＋おすすめ記事を紹介！　#AICU_media
AICU media 編集部です。月初恒例のアクセスランキングレポートをお伝えします。

AICU media 5月のまとめ

よく読まれた記事ランキング

5月中によく読まれた記事を紹介します
1. 漫画制作に適したモデルは？Animagine 3.1 vs Animagine 3.0 徹底比較！
漫画制作に適したモデルは？Animagine 3.1 vs Animagine 3.0 徹底比較！
1. [保存版] Animagine XL 3.1 生成比較レポート
[保存版] Animagine XL 3.1 生成比較レポート｜AICU media
1. OpenAI – GPT-4oをリリース
OpenAI — GPT-4oをリリース
1. Stability AI、日本語大規模言語モデル「Japanese Stable LM 2 1.6B」を発表。Google Colabのシークレット機能で短いコードを書いてみよう！
Stability AI、日本語大規模言語モデル「Japanese Stable LM 2 1.6B」を発表。Google Colabのシークレット機能で短いコードを書いてみよう！
1. プロンプトからサイトが作れる！？話題の「Create.xyz」を使ってみた！
AIと作るWeb体験「Create.XYZ」今すぐ始めるインタラクティブなサイト開発

Animagine 3.1 / 3.0の記事はもはや恒例ですね。

そしてGPT-4oのリリースはかなり衝撃的でした。これで何ができるのか考えるだけでも楽しかったです。

Japanese Stable LM 2 1.6Bは軽量でローカル環境でも扱いがしやすいモデルでした。

Create.xyzはプロンプトからwebサイトを生成できるサービスで、話題になりました。

AICU編集部が選ぶ、5月のおすすめ記事

5月に投稿した記事でAICU編集部がお勧めしたい記事をピックアップしてみました。

まだほかの人が知らない、生成AIの情報を読んでみませんか？
- Stable Diffusionの仕組み（入門編）
Stable Diffusionの仕組み（入門編）
- Fooocus v2.4.0リリース＆ AICUによるColab無料版で動く日本語UI版も継続メンテナンス実施
Fooocus v2.4.0リリース＆ AICUによるColab無料版で動く日本語UI版も継続メンテナンス実施
- [期間限定無料記事] Stable DiffusionでAI時代のキャラクター開発！最適LoRAモデルの比較実験
[期間限定無料記事] Stable DiffusionでAI時代のキャラクター開発！最適LoRAモデルの比較実験｜AICU media
- 日報を画像生成でバエさせる #10分で学べるAI
日報を画像生成でバエさせる #10分で学べるAI
- #技術書典16 現地取材レポート！生成AIクリエイティブ分野で才能と知見あふれる良書にたくさん出会いました
技術書典16 現地取材レポート！生成AIクリエイティブ分野で才能と知見あふれる良書にたくさん出会いました

AICUマガジン5月号に収録されている特集

最後にAICUマガジン5月号の特集について紹介します。

こちらでは実践する方法を書籍形式で詳しく紹介しています。
- 「画像生成AI Stable Diffusion スタートガイド」公式ワークショップの予習をしておこう！-LoRA制作の予習をしよう
- 画像生成 AI で X（Twitter）用2コマ漫画を描こう！
AICUマガジン5月号はkindle unlimitedに加入されている方は無料で、加入されていない方は電子版の購入ができます。ぜひ読んでください！

https://j.aicu.ai/Mag2405

バックナンバーはこちらです

https://j.aicu.ai/Mag2404

AICU media 6月のイベント情報

6/26 19:00〜20:30「画像生成AI Stable Diffusion スタートガイド」 #SD黄色本公式ワークショップ開催！

「画像生成AI Stable Diffusion スタートガイド」 #SD黄色本公式ワークショップが6月も開催されます！今回のテーマは【生成AIの社会と倫理】！

現在複雑さを極めている、生成AIの法律面を弁護士さんとともに解説します。

詳しくはこちらをご覧ください。
- 【生成AIの社会と倫理】「画像生成AI Stable Diffusion スタートガイド」 #SD黄色本公式ワークショップ 2024/6/26(水)19:00〜20:30開催
【生成AIの社会と倫理】「画像生成AI Stable Diffusion スタートガイド」 #SD黄色本公式ワークショップ 2024/6/26(水)19:00〜20:30開催

なお、画像生成AI Stable Diffusion スタートガイドには、生成AIにかかわる法律や倫理について解説があります。

予習として読まれてみてはいかがでしょうか？

https://j.aicu.ai/SBXL

最後に

AICU mediaでは生成AIに関する情報をこれからも皆さんにお届けしてまいります。

面白い！参考になった！と感じていただけましたら、ぜひいいねやフォローをお願いします

6月もAICU mediaをよろしくお願いします！
2024-06-10
にじジャーニーv6の日本語能力が向上-画風に合わせたレタリング技術を公式が解説

2024年6月7日、にじジャーニーv6の日本語能力が向上しました。
公式リリースを中心に、実際に手を動かしてみた記事をお送りします。

nijiの日本語テキスト描画の精度を向上させるアップデートをリリースしました！
https://nijijourney.com/ja/blog/improved-japanese-text-writing

使い方

プロンプトを作成するときに、正確な単語を引用符 “” で囲む ことで、niji にテキストを書かせることができます。

例: miku holding a sign that says “ハンバーガー”

簡単な漢字も処理できます

girl with white hair, one eye closed, holding a sign that says “愛してる”

看板を持った女の子に限らず、文字がそのままシーンに溶け込ませることもできます

aerial view, a blue fast food building that says “こんにちは”

技術解説「言葉に隠された声」

絵の上に文字を載せたことがある人なら知っているように、絵に合った適切なフォントを選ぶのは非常に巧妙なことです。文字の形は、隠された意味を非常に多く伝えます。文字には独自の「声」があるのです。

たとえば、Spellbrush のロゴの2つのバージョンを比較してみましょう

現在の Spellbrush ロゴ　vs 初期の Spellbrush ドラフトロゴ

なぜ左のロゴの方が右のロゴよりも良く見えるのでしょうか？
どちらかというと、直接の絵を並べて比較すると、右の方が生き生きしているように見えます。

その答えは、フォントとイラストの一致にあります。

最終的な絵の曲線は、文字の曲線に直接沿うように調整されます。文字と絵がより調和した一致は、単純にイラストが優れているよりも目に優しいです。

非常に示唆のある解説がされています。

続きは新しくなった公式日本語ブログをご参照ください。

https://nijijourney.com/ja/blog/improved-japanese-text-writing

AICU media編集部でも試してみました

「つくる人をつくる」AICU media編集部が、実際に手を動かして試していきます。

miku holding a sign that says “ハンバーガー” –s 400 –niji 6

勝率25%というところでしょうか。

girl with white hair, one eye closed, holding a sign that says “愛してる” –s 400 –niji 6

勝率5割！しかもけっこう楽しい感じです。「愛」の漢字が中国語と混ざっていますね…。

今回公開された画風に合わせた書体を選ぶ技術に加えて、既に、ネガティブプロンプト（–no）に「signature」を入れる、サインボードをもたせるなどで向上することがわかっています。

「アイキューメディア」をよろしくおねがいしてみました！

anime screencap, red hair, red eyes, gentle eyes, sweet smile , streaked hair, happy red hair boy holding a sign “あいきゅーめでぃあ” –ar 16:9 –niji 6 –no signature

うーん、ちょっと間違ってるけど雰囲気に合っているし、カワイイから許す！

今後リリースされるnijiJourney v6での改善に期待します！

この記事に「いいね！」と思ったら、いいねとフォロー、おすすめをお願いします！
https://note.com/aicu/
X(Twitter)@AICUai

niji・Journey V6 alpha版公開！文字描画機能以外にも様々な機能

Niji・Journey v6 にスタイルリファレンス機能「–sref」、世界観の維持や複数画像の参照が容易に！ #NijiJourney

🌈「にじジャーニー」スマホ版はご存知ですか？

2024-06-10
AICU、業務拡大に伴い、新プロジェクトの主軸となるAIアート系人材をオーディション形式で募集開始
「つくる人をつくる」をビジョンに、書籍「画像生成AI Stable Diffusionスタートガイド」などを執筆・開発しているAICU Inc.がこの夏、あらたにAIアート時代のプロクリエイターを育成する目的で「AIアート系インターン」をオーディション形式で募集します。

【AICU Creators University Audition 2024 Summer】
- 賞金総額: 10万円
- インターン期間: 3ヶ月（有償インターン）
https://corp.aicu.ai

【目的】

AICU Inc.（本社：米国Sunnyvale、CEO：白井暁彦）は、生成AI時代に「つくる人をつくる」をビジョンに活動しています（https://corp.aicu.ai/）。主要取引先はStability AIや電通、SBクリエイティブといった世界を代表する企業であり、一般向け書籍「画像生成AI Stable Diffusionスタートガイド」、ブログメディア「AICU media」や、中高生向けKindle雑誌「AICUマガジン」、各種ワークショップ開発などを通して生成AIクリエイティブの発展に寄与しています。

今回のオーディションは、業務拡大に伴い、さらなる新プロジェクトの主軸となる生成AI時代のビジュアルアートクリエイターの長期育成を目的としています。

https://corp.aicu.ai/visual

【募集要項】

美大・芸大・情報メディア系・専門学校の現役学生を対象とした、AIビジュアルアート作品を通した賞金付きオーディションを開催します。

【応募スケジュール】
- エントリー受付期間: 随時
- オーディション作品提出締切: 2024年6月16日23:59
- 2次審査プレゼン兼面接: 2024年6月19日～21日（調整あり）
【募集部門】
- 動画部門: YouTubeのURLでショート動画を提出
- 静止画部門: X(Twitter)のURLでキャラクターイラストを提出
- タテ動画部門: TikTok向けのダンス動画やCM動画をURLで提出
- 技術部門: ComfyUIを中心とした技術ブログを評価
各部門から最終候補作品を選定し、2次審査（プレゼンテーション・面談）を経て最優秀賞を決定します。

【エントリー応募条件】
- Stable Diffusion「ComfyUI」を中心に使用（AUTOMATIC1111も歓迎）
- 作品のメイキングを社内・社外に公開可能
- アウトプットの動画や静止画は既発表・公開済みでも可
- メイキング発表用のスライドをGoogle Slidesで作成し、URLを提供（更新は発表会直前まで可能）
- 2024年7月～10月にかけて、新規事業におけるプロダクション業務に従事できること（週3日程度から。教育あり・時給保証）
- 上記の要件を満たしていれば、現役学生である必要はありません。
【2次審査までの流れ】
- 先着順で評価
- 既発表作品歓迎
- SNSでのインフルエンス、コミュニケーション力もプラス評価
- 過去作品も評価（Pixiv、GitHub、X等）
- AI作品以外の作品制作力も評価
- 提出資料は随時更新可能
- 作品の優劣だけでなく、AI時代のクリエイターとしての適性を評価
- 未完成な要素も歓迎
- インターンで体験したいこと、担当したい業務や将来の希望も評価
【インターン採用に関してのFAQ】
- 書籍や動画、ワークショップの開催を実施する開発アシスタントとして、サンプルアートの制作、ブログの執筆などを担当
- 基本はリモートワークになります。
- 「画像生成AI Stable Diffusion スタートガイド」の内容をマスターしていると有利
- 現在のアーティストネームやAICUでのクリエイターネームで活動（名義は希望・相談可）
- 守秘義務契約、インターンプログラム参加契約および業務委託契約を締結
興味のある方はぜひエントリーを検討してみてください。
詳細情報はこちらのURL()およびX(Twitter)@AICUai にお問い合わせください。

【応募フォーム】

https://docs.google.com/forms/d/e/1FAIpQLSeA939fc4nmu28fcUH14CHM2g6gCgS04qfMad28eZLTLTLpaA/viewform

【業務内容・プロダクト・企業紹介】

https://corp.aicu.ai/ja/products

（参考資料）過去のインターンに関する募集はこちらからご参照ください。

学生インターン募集(2024年1-2月期) #長期有給インターン募集
https://note.com/aicu/n/n732ed1580ba4

AICU インターン募集(2024年3-6月期)
https://note.com/aicu/n/n45e15b2091f9

AICU media 学生インターン募集(2023年11月期)
https://corp.aicu.ai/ja/intern20231103
2024-06-09
#10分で学べるAI バッチファイルでバリエーション広告を生成(1)使ってみよう編

Google Slidesで新築分譲マンションのバリエーション広告を大量生成…したはいいけど…ええっ!?

前回、知り合いの不動産会社から依頼された案件のため、

新築分譲マンションのバリエーション広告を大量生成できるGoogle Slidesを作成した２人でしたが……。

前回のSTORY #10分で学べるAI

Google Slidesでバリエーション広告を大量生成

#10分で学べるAI Google Slidesでバリエーション広告を大量生成

★バリエーション広告：さまざまな対象者に向けて制作する多様性のある広告

以下、アイキュー部のDiscordでのやり取りです

ルゥ「コト先輩～、Google Slides作っておきましたよ～」

コト先輩「わあ！すごいのができたね！！早速クライアントに提出してくる！」

（…しばらく後…）

コト先輩「ルゥくんゴメェン！今回のクライアントは『Google Slides禁止！』だそうです！！」

ルゥ「うええええええええ！先に聞いてきてくださいよ！！」

コト先輩「今回のクライアントさんからの依頼によると、『オペレーターさんの作業環境は追加ソフトのインストールが禁止されている事務用ノートPC』、だそうです」

ルゥ「えっ、ゲーミングPCとかは期待してなかったけど……それじゃあGPUは全く期待できないじゃん！」

Koto「一応期限は半日だけ延長してもらえたけど、『最低15パターンは譲れない』っていわれちゃった」

ルゥ「どうしてこんな案件受けちゃったんですか！」

――こんな環境でも動くものってバッチファイルくらいか…ってバッチファイルでもAPIは呼び出せるんだから Stability AI の Stable Image Core も使えるかも！

やってみよう

Stability AI が提供する Stability AI Developer Platform のイメージサービスのうちのひとつ「Stable Image Core」のAPIを使って、GPUいらず、たった3分程度で商用利用できるバリエーション広告（さまざまな対象者に向けて制作する多様性のある広告）画像を様々なスタイル画像で生成してみましょう。今回はバッチファイルだけ、ノーコードで利用できるツールとして提供します。

Stability AI のプラットフォーム APIキーの入手

まず、このバッチファイルで画像生成をするには Stability AI のプラットフォームを利用するAPIキーが必要です。持ってない人はここにアクセスしてAPIキーを取得するか、管理者殿にお願いしてキーを発行してもらってください。

https://platform.stability.ai/account/keys

生成できない場合は支払い設定（https://platform.stability.ai/account/credits）を確認してください。

Copy ❏ したら「sk-….」で始まるAPIキーをクリップボードにコピーできます。このAPIキーが流出すると勝手に使われてしまいますので管理はお気をつけて。

次のステップに進みます。

バッチファイルをダウンロード

このリンクでダウンロードして使えるバッチファイルを配布しています。

ダウンロードしたら解凍して中身を確認してください

https://j.aicu.ai/SaiImgBat

設定ファイルを開いてAPIキーを設定

生成する前にAPIキーを設定します

SIC_settingという名前のテキストファイルがあるのでメモ帳で開いて、

「STABILITY_API_KEY=」と書かれている部分の後ろに先ほどコピーしたAPIキーを貼り付けて保存します。

これだけで画像を生成できるようになりました！

設定を確認しよう

生成する前に設定を確認しましょう

先ほどAPIキーを入力したテキストファイルから以下の項目を設定できます。

・プロンプト

・ネガティブプロンプト

・アスペクト比

・出力フォーマット

・生成サイクル数

設定するにはそれぞれの項目の「＝」より後ろを書き換えてから保存してください。

バッチファイルを実行して画像生成！

いよいよバッチファイルを実行しましょう。

SIC_IMG_Creatorというバッチファイルをダブルクリックすると実行できます。

初回はスマートスクリーンの確認画面が出ます。危険なバッチファイルではありませんので詳細情報を押すと実行ボタンが現れます

※ここで管理者様に止められてしまう環境の場合は、貴社の情報システム管理部門殿にお願いしてください。

起動するとこのような~~黒怖い~~コマンドプロンプト画面が現れます。

ここで生成する画像のプロンプトや枚数を確認できます。

「y」と入力してEnterキーを押下すると生成が開始されます。

すべてのスタイルで生成が完了するまで大体３分ぐらいかかります。

生成された画像を確認する

生成された画像はSIC_Imageというフォルダに格納されています。

前回と同じ流れが作れそうです！

#10分で学べるAI Google Slidesでバリエーション広告を大量生成

まとめ

いかがでしたか？

たったこれだけで様々なスタイルの画像を生成をすることができます！

AICUmediaでは今後もStable Diffusion 3.0 やStable Image Core を用いた記事を発信していく予定です

面白かったらぜひフォロー、いいねをお願いします！

次回予告

次回はこのプログラムの中身を解説しちゃいます！お楽しみに！

#10分で学べるAI

#10分で学べるAI　シリーズ

✨️本記事が面白かったら、X@AICUai, noteのフォロー、シェアをよろしくお願いいたします！
https://note.com/aicu
社内Slack等のシェアでも歓迎です。
また「こんな記事欲しい」といったリクエストがございましたら X@AICUai までメンションやDMでいただければ幸いです。

✨️AICU Inc.は Stability AI 公式パートナーです。
様々なアプリ開発のご相談も承っております！サービスに導入したい、使いこなせる社員をパッと育成したい！そんな需要がございましたら sai@aicu.ai までどうぞご相談ください。

https://corp.aicu.ai/ja/stability-ai-membership

生成AI時代に「つくる人をつくる」AICU社、生成AIリーディング企業「Stability AI」と戦略提携 https://prtimes.jp/main/html/rd/p/000000007.000133647.html

2024-06-07