つくる人をつくる AICU Inc.

タグ: AI

Text to AppなAI開発ツール「CREATE.xyz」首脳陣が渋谷でミートアップを開催 #CreateTokyo
話題の「Text to App」なAI開発ツール「CREATE.xyz」首脳陣が日本にやってきます！ CEOのドゥルブ氏をはじめとする少数精鋭チームが、2024年7月15日(月・海の日)、渋谷のGMO Yours・フクラスに集結しミートアップ（交流会）を開催します！

ウェブサイト作成からアプリ開発まで、まるで魔法のように簡単に実現してしまうAIツール「CREATE.xyz」。
その最新技術を、CREATE.xyzチームから直接学べるチャンスです！

こんな方にオススメ
- 最新のAI技術に触れてみたい方
- ホームページやアプリ開発に興味がある方
- ビジネスにAIを取り入れたいと考えている方
- グローバルな環境で活躍するスタートアップ企業の熱気を感じたい方
イベントで得られること
- AI開発の未来を体感できるデモを間近で見学
- AI業界のエキスパートによるトークセッション
- CREATE.xyzチームとの質疑応答
- 参加者同士のネットワーキング
CREATE.xyzとは？

日本語でチャットするだけで、ウェブサイトやアプリが開発できるAIツールです。
https://www.create.xyz/
- プログラミング知識は一切不要！
- 簡単なランディングページ（LP）制作から、ゲーム、データベース構築まで幅広く対応
- 開発者向けにコード編集機能も搭載
AICU関連記事：AIと作るWeb体験「Create.XYZ」今すぐ始めるインタラクティブなサイト開発

AIと作るWeb体験「Create.XYZ」今すぐ始めるインタラクティブなサイト開発 プロンプトからサイトが作れる！？話題の「Create.xyz」を使ってみた！さいきん話題の「Create.xyz」という ja.aicu.ai

イベント詳細

日時: 2024年7月15日(月) 15:30-19:00（開場15:00）
場所: GMO Yours・フクラス (東京都渋谷区道玄坂1丁目2番3号渋谷フクラス 16階)
参加費: 無料（事前登録制）
参加方法: 下記リンクより事前登録をお願いします。

create.xyz Team in Tokyo: CEO Demo & AI Meetup @ GMO Yours · Luma 「CREATE.xyz」が日本に初上陸しました！CREATE.xyzは、サンフランシスコを拠点とするスタートアップで、日本 lu.ma

イベントスケジュール
- 15:30-15:40 開会の挨拶と紹介
- 15:40-16:00 Createデモ – はじめに
- 16:00-16:30 CEO × AIMトーク – AIツールの未来
- 16:30-17:00 Createデモ – 応用編
- 17:00-17:30 専門家トーク – サプライズゲスト
- 17:30-18:00 Q&A – 深く掘り下げる
- 18:00-19:00 ネットワーキング
*スケジュールは変更になる可能性があります

無料で試す: create.xyzDiscord: create.xyz/discord
X: x.com/create_xyz

一緒に未来を創造しましょう！

共催：AIM
協力：GMO教えてAI株式会社

事前登録制となっております。満員になることが予想されますので、お早めにご登録ください。

共催：AIM
協力：GMO教えてAI株式会社

事前登録制となっております。満員になることが予想されますので、お早めにご登録ください。

開催場所
Shibuya FUKURAS
1-chōme-2-3 Dōgenzaka, Shibuya City, Tokyo 150-0043, Japan
東京都渋谷区道玄坂1丁目2番3号渋谷フクラス 16階 GMOインターネットグループ　グループ第２本社　GMO Yours・フクラス

CREATE×AIM in TOKYO CREATE.xyz チームが日本上陸！ AI時代を牽引する対話型AI開発ツール「CREATE.xyz」がチームメンバー ymmd-ai.co.jp https://note.com/embed/notes/n3c44e9beb59d https://note.com/embed/notes/n241a0e076e96
2024-07-13
「Omost」で画像生成を細かく制御しよう
Omost（オモスト）とは？

Omost（オモスト）とは、ControlNetやStable Diffusion WebUI Forge、Foocusの開発者として著名なlllyasviel氏が開始した、新しいオープンソースプロジェクトです。

https://github.com/lllyasviel/Omost

Omostは、LLMを利用して、画像生成AIが生成する画像のコーディングをしようという試みで、簡単に言ってしまえば「Omostを使うことで、Stable Diffusionにレイアウト指定をほとんど制御できる」――「ほとんどできる」から、AlmostでOmost…という洒落のようです。

ご存じの通り、画像生成AIというのは、どんなに厳密なプロンプトを組んだり、ComifyUIを使って緻密なノードを組んだとしても、完全に制御できるものではありません。それはこのOmostを使っても同じことです。そこには「生成AIに共通する入力に対する出力のゆらぎ」のようなものがあります。

それでもOmostを使うと、それまで偶然に頼ることが多かったtxt2Imgでの画像生成に対して、かなり再現性の高いレイアウトを指定することができるようです。

lllyasviel氏の過去作「Fooocus」でも多くの内部最適化と品質改善がGPT-2をベースに組み込まれています。

https://github.com/lllyasviel/Fooocus

Fooocusで使われている技術詳細はこちら

https://github.com/lllyasviel/Fooocus?tab=readme-ov-file#tech_list

書籍「画像生成AI Stable Diffusionスタートガイド」でも、最初の段階でこちらの日本語版を扱っています。

書籍[画像生成AI Stable Diffusionスタートガイド]

https://j.aicu.ai/FoooC

Book-StartGuideSDXL/Fooocus_onColab.ipynb at main · aicuai/Book-StartGuideSDXL

さて、今回紹介する「Omost」は、より上を目指す、ちょっとマニアックなツールになりますが、幸いなことにHuggingFace Spaceで試すことができます。さっそく使用感を見ていきましょう。

上手に使えると、こんな高度なポージングをした画像が再現性高く生成できます。

Omostを準備する

Spaceを使う場合

一番お手軽に使う方法はHuggingFaceのSpaceを利用することです。下のURLからアクセスできます。

Omost – a Hugging Face Space by lllyasviel

使ってみた印象では、ちょっと試すぐらいならSpaceを使うとよいと思います。スピードはローカルと変わらないぐらい速いです。

ローカル環境にインストールする場合

Omostは、お使いのWindows PCが8GB以上のVRAMを搭載しているNVIDIA製のビデオボードを搭載していれば、ローカル環境で動かすことができます。

ローカル環境で動かすためのインストールの方法は、Omostのリポジトリより Get Started（https://github.com/lllyasviel/Omost#get-started）より確認してください。
Omostをインストールする前に、事前に以下の環境が整っていることが必要です。
- Git for Windows
- AnacondaのWindowsローカル環境(Python 3.10)
- CUDA 11.8 もしくは 12.5
- インストールしたCUDAに対応したPyTorch
これらがコマンドプロンプトから動作するように、適切にWindowsの環境変数が設定されていることも必要です。

もし頑張ってインストールする場合には、ChatGPTなどに相談しながらやるとよいでしょう。
ここではOmostのインストールは終わっているものとして、進めます。

Omostを使ってみる

Omostのメイン画面は以下のようなものです。

レイアウトを指示する

画面右下の「Submit」ボタンの横にチャットウィンドウがあります。そこに、欲しいイラストの内容を指定します。この指定は日本語でもいけます。LLMのおかげですね！

せっかくですので、以下のような面倒くさいイラストを指定してみましょう。

白い髪のバニーガールの少女が、異次元空間に浮かんでいる開いたドアの中をのぞき込み、ドアの中から光の珠（素晴らしい未来の象徴）を取り出そうとしている。
少女の表情は好奇心に溢れていつつも、心持ち不安げ。不安げなのは、未来に何が待っているのかまだわからないから。
異次元空間は真っ暗で、ドアが沢山浮かんでいる。
少女の表情と仕草をイラストの中心として、ダイナミックな構図で表現すること。
異次元空間なので、少女が立つ地平線は斜めに傾いている。
16:9の横長のコンポジションで作画すること。

イラストは16:9で指定しているので、左側にある Omostの「Image Diffusion Model」内の Image Width を「1920」と Image Hight も「1080」になるように指定をしておくと、後ほどチェックするのに便利です。

ここまで終わったら、「Submit」ボタンを押して実行します。
するとその上の「Omost」というウィンドウ内に、延々とCanvasと呼ばれるオブジェクトが書かれていきます。これがOmostが生成AIに与えるイラストのレイアウト指示になっています。

画像を生成する

ここでCanvasの生成が終わったら、左側に「Render the Image!」というボタンが追加されます。このボタンを押すと、今Canvasに設定された画像が続いて生成されます。

いくつかサイズも変えて生成してみたところ、大体、白髪のウサギ少女、ドア、オーブが配置されたイラストになります。2枚目が典型的ですね。

皆さんはうまく生成できましたか？
生成されたキャンバスの説明の生成も興味深いです。

AICUではOmostに関してさらなる活用方法を調査中です。
続報をお楽しみに！

この記事が面白かったらフォローやいいねをお願いします！
2024-07-12
【まだ間に合う!!】賞金400万円超えのAI映像コンテストに投稿してみた #projectOdyssey
こんにちは！AIクリエイターのぽんず(@ponzponz15)です。

AICU media編集部さんに教わったのですが、実はいま世界では、賞金総額28,000ドル(約437万円！)もかけて行われているAI映像制作コンテスト「PROJECT ODYSSEY(プロジェクト・オデッセイ)」が開催されているので投稿した実録です。みなさんも投稿頑張ってみてください！

https://www.projectodyssey.ai

参考記事：国際AI映像制作コンペ「オデッセイ」開催 #projectodyssey

https://note.com/aicu/n/n53b3aab4879b

Civitai、ThinkDiffusion、ElevenLabs、Realdreamsといった、AI業界の人なら誰でも知ってるような企業が主催している、まさに世界規模のコンテスト。

作品提出締め切りは 2024年7月17日 PM3:59 (July 16th at 11:59PM PT)とあります。まだ間に合います。

それでは「PROJECT ODYSSEY(プロジェクト・オデッセイ)」に応募していきましょう。自分は投稿が終わったので、これから一人でも多くの方に知ってもらおうと思い、この記事を作成しました。

私自身、使用したことのないサイト(CivitAI)だったので応募に少し苦労しました。皆様がアカウント登録から応募までスムーズに進めるように画像付きで解説しましたので、ぜひ最後まで読んでみてください。

世界のAI映像界を牽引する企業が注目！

まず、「PROJECT ODYSSEY」ですが、AI映像業界を牽引するmorph、F3F、LensGo、DomoAI、DeepMakeなど、そうそうたる企業が協賛しています。

3Dアニメーション、ミュージックビデオ、技術紹介などAIを使った映像表現の可能性を追求する作品を募集中です。

コンテストの詳細はこちら
 公式X(Twitter)アカウント

私も滑り込みで応募しました

以前、AICU様の記事でご紹介した「アルパカおにぎり」の動画を応募しました。SNSを見ていてもこういった不思議な表現はあまり見かけなかったので、もしかしたらチャンスがあるかも？作品の詳細はこちらの記事をご覧ください！

意外とこういうのが先かもしれませんなあ

🦙アルパカおにぎり-水谷園#Gen3 #Gen3alpha #RunwayGen3 #suno #pika pic.twitter.com/GfkBnhoYa5
— ぽんず🐕 AIクリエイター (@ponzponz15) July 2, 2024

https://note.com/embed/notes/n7ebe0ac1afb3

一般の投票期間もありますので、よければ応援よろしくお願いします。

【簡単！】「PROJECT ODYSSEY」応募方法解説

１. アカウント登録

まずは「PROJECT ODYSSEY」の公式ウェブサイトにアクセスして、アカウントを作成しましょう。 https://www.projectodyssey.ai/

画面右上の”Sign Up”ボタンをクリックし、必要情報を入力して登録を進めてください。

メールアドレスや主要なSNSリンクなどを入力します。その後、上記のHow to Submitから応募に入ります。

Go to Collectionを選択すると Project Odysseyのページへ移動します。

こちらの画面、右上の➕ボタンを押して応募を開始しましょう。

２. 作品をアップロード

アカウント登録が完了したら、いよいよ作品のアップロードです。

“作品をアップロード”ボタンをクリックし、アップロード。さらに以下の情報を入力します。

作品情報に加えて、いくつかの情報を記入する必要があります。
- タイトル
- 説明文
- 使用したAIツール
- タグ
- カテゴリー選択
これらの質問への回答は、審査員が作品を評価する上で重要な参考資料となります。

3. 公開

すべての入力が終わったら、内容を確認し、右上の”submit”ボタンをクリック！

こちらの画面が出れば応募完了です。

私も応募したよ！一緒にAI映像コンテストで世界に飛び出そう

Project Odyssey AI Film Competitionの締め切りは7月17日午後3時59分（日本時間）となります。
賞金総額28,000ドル(約437万円！)、応募すれば可能性はあります！

AIを活用した映像制作は、日進月歩で進化を続けています。
このコンテストは、作り手にとって自身の作品を世界に発信し、評価を受ける貴重な機会になります。
この経験が、これからの創作活動の糧になると感じています。

そして、この記事を読んでいるあなたも、ぜひ「Project Odyssey」に挑戦してみてください！応募するだけでドキドキします。

締め切りが迫っているので、少しでも気になった方は、ぜひ応募ページを見てみてくださいね！

https://www.projectodyssey.ai

みんなでAI映像制作の世界を盛り上げていきましょう！

生成AIクリエイティブのご相談は AICU Visual Communication事業部までどうぞ

https://corp.aicu.ai/visual

書籍「画像生成AI Stable Diffusionスタートガイド」も人気です

書籍[画像生成AI Stable Diffusionスタートガイド]

この記事に「いいね！」と思ったら、いいねとフォロー、おすすめをお願いします！

https://note.com/aicu/ X(Twitter)@AICUai
2024-07-11
「おにぎり×アルパカ×AI」奇跡の組み合わせが生んだ革命的CMのメイキングを大公開

はじめまして、AIクリエイターのぽんず(@ponzponz15)です。

このたび、AICU mediaの依頼で、こちらの作品「アルパカおにぎり水谷園」のCM動画のメイキングを紹介します。

意外とこういうのが先かもしれませんなあ

🦙アルパカおにぎり-水谷園#Gen3 #Gen3alpha #RunwayGen3 #suno #pika pic.twitter.com/GfkBnhoYa5
— ぽんず🐕 AIクリエイター (@ponzponz15) July 2, 2024

▶︎動画生成Runwayより「Gen-3 Alpha」リリース！月額15ドルで試用してみた

動画生成Runwayより「Gen-3 Alpha」リリース！月額15ドルで試用してみた

使用ツールと各工程

まず、大まかな流れとしては

(1) プリプロセスアルパカおにぎり誕生秘話

(2) MidJourneyを使ったキービジュアルの作成

(3) SunoAI による楽曲制作

(4) Runway Gen-3 Alpha と Pika による動画カットの作成

(5) 編集作業：AI動画のランダム性を活かす

という流れになります。

総制作時間は1時間ぐらいです。

早速はじめていきましょう。

(1) プリプロセス：AI動画制作アルパカおにぎりの誕生秘話

今回の動画制作は、おにぎり劇場さんの「アルパカができるまで」という動画を見かけたことがきっかけでした。

おにぎり劇場さんによるメイキング

アルパカができるまで
素敵な週末を🦙 pic.twitter.com/FclP97liO9
— おにぎり劇場 (@mZHtgivNQr33RCL) June 28, 2024

可愛らしいアルパカ姿のおにぎりが作られていく様子を見て、

「この素敵なコンセプトをAI動画で再現し音楽とナレーションを加えれば、CM風メイキング動画が作れるのでは？」

と思ったのがきっかけでした。

Googleで「アルパカおにぎり」を検索してみると・・・

日本ハムさんによるレシピ

Cookpadでの「キャラ弁」

https://cookpad.com/recipe/3430176

https://cookpad.com/recipe/1793144

実際に人気のレシピとして存在するようです。

このような「知られざる人気」をすばやくとらえて「AIでしかできない、不可能な絵作り」を可能にしていきます。

(2) MidJourneyを使ったキービジュアルの作成

早速、「Midjourney 」と「Runway Gen-3 Alpha」 に「アルパカの姿をしたおにぎり」といったシンプルなプロンプトを入力してみました。

すると、それぞれのAIが個性的な画像や動画を生成してくれました。

Midjourney Prompt:

phone photo of Alpaca-shaped rice balls ,posted to reddit 2010 –stylize 0 –ar 16:9

Midjourney では、スマホで撮影したような手作り感のあるおにぎりの画像を生成。Runway Gen-3 では、アルパカおにぎりのマスコットがキッチンで踊る動画を生成しました。

これらの素材を組み合わせれば、クオリティの高い作品になると思い今回のCM風動画制作がスタートしました。

(3) SunoAIによる楽曲制作

CMに最適なBGMを制作するために、AI作曲ツール「SunoAI」を採用しました。SunoAIは、入力した歌詞と音楽スタイルに基づき、AIが自動で作曲を行うサービスです。

AI作曲の大きな特徴は、短時間で質の高い楽曲を多数生成できる点にあります。
SunoAIでは、1回の作曲で2～4分程度の楽曲が生成されますが、現状ではAI音楽は部分的な微調整が難しいという側面もあります。
そこで今回は、生成された楽曲の中から特に優れた約22秒の部分を抜粋し、動画のBGMとして採用しました。
AIが生成する楽曲の中から特に優れた部分を見出し、部分的、効果的に活用することで、AIを使ったクオリティの高い動画制作を実現できます。なお、SunoAIに入力する歌詞は、リズムを意識して作成するとAIが独自に優れた楽曲を生成します。

歌詞：
アルパカアルパカアルパカおにぎり
にぎってにぎってぱっかぱっかぱっか(パカッ)
アルパカアルパカアルパカおにぎり
ぎゅってぎゅっておいしいね(ぎゅっ)

(4) Runway Gen-3 Alpha と Pika による動画カットの作成

「アルパカおにぎり」を映像化するにあたって、今回は最新のAI動画生成ツールである「Runway Gen-3 Alpha」と「Pika」を活用しました。

Runway Gen-3 Alphaは、テキストから高画質の動画を生成できるAIツールです。
「アルパカ姿のおにぎりが踊っている(Dancing Alpaca-shaped rice ball)」といった指示でも、イメージに近い動画を生成してくれ、これまで表現が難しかったイメージも容易に映像化することが可能になりました。

Runway Gen-3
キッチンで踊るアルパカおにぎりたち pic.twitter.com/t0TGpoGdMl
— ぽんず🐕 AIクリエイター (@ponzponz15) July 8, 2024

ですが、現状は画像を動画化することができません。

そこで、今回は動画生成AIのPikaを併用しました。
Pikaは、画像を動画にすることができるAIツールです。

Runway Gen-3の一貫性のある優れた動きに合わせて、足りない部分をMidjouneyとPikaで作った動画で補うことで『静と動』のバランスをとりました。これで全ての素材が揃いました。

(5) 編集作業：AI動画のランダム性を活かす

AI動画は、同じプロンプトを入力しても同じものが生成されるとは限りませんし、望み通りに動くとも限りません。そのため、制作工程では、まずAIに多数の動画を生成させ、その中から使えそうな部分を抽出して編集作業を行うという流れになります。足りない場合は再度生成して補うこともありますので。生成作業の段階では多めに長めに作っておくと、編集をスムーズに行うことができます(※AIではどのような生成が行われるかランダム性が高く、この編集段階で最適な表現を探ることも多くなります。予定していたよりクオリティの高い動画ができればそれを中心に組み直すことも、逆も然りです)。
今回は、5秒や10秒の動画素材の中から、特に質の高い2～3秒程度のシーンを厳選し、それらを音楽に合わせて繋ぎ合わせることで、約22秒の動画ができました。最後にナレーションと簡易なキャプションを加えてCM風動画の完成です。

意外とこういうのが先かもしれませんなあ

🦙アルパカおにぎり-水谷園#Gen3 #Gen3alpha #RunwayGen3 #suno #pika pic.twitter.com/GfkBnhoYa5
— ぽんず🐕 AIクリエイター (@ponzponz15) July 2, 2024

いかがでしたでしょうか。

以上、全工程で1時間程度でした。

こちらの動画の公開から1週間現在でのX上でのインプレッションは3万件です。

実際に地上波等のテレビCMでキャッチーな楽曲やCGを使ったコマーシャルフィルムの製作ですが、

参考資料：テレビ朝日さん https://www.tv-asahi.co.jp/ex/sales/column/cm-cost/

今後は、生成AIのプロの広告代理店や、動画制作者、マーケティング企画担当者が直接、AIツールを学んだり、生成AIツールによるプロのクリエイティブの作り手ととともに、より一層クオリティを高めた作品を制作する時代がやってくるかもしれませんね。

「アルパカおにぎり」のような「知られざる人気」をすばやくとらえて、「AIでしかできない、不可能な絵作り」を可能にしつつ、今回のようなキャッチーで楽しい楽曲のベースを作りつつ、実際にアーティストさんに歌ってもらった方がいいところや、CGで作った方がいいダンスシーンなどの効果を見積もりながら、作っていけるところが利点になりそうです。

生成AIクリエイティブのご相談は AICU Visual Communication事業部までどうぞ
https://corp.aicu.ai/visual

書籍「画像生成AI Stable Diffusionスタートガイド」も人気です

書籍[画像生成AI Stable Diffusionスタートガイド]

この記事に「いいね！」と思ったら、いいねとフォロー、おすすめをお願いします！

https://note.com/aicu/ X(Twitter)@AICUai

2024-07-09
AICUが生成AI時代のクリエイターを募集します（2024年7月）

AICUでは2024年7月現在、業務拡大に伴い生成AI時代のクリエイター（パートタイマー社員/業務委託）を募集しています。月間10万PVを超える・世界で活躍する生成AIエンタメメディアを作りませんか？

以下のいずれかの募集にご興味ある方のご応募をお待ちしております。

【テクニカルライター/クリエイター】

AICUでは実際に手を動かしたクリエイターやコミュニティに寄り添う良質な記事を発信しています。以下のご経験がある方/自分で探求したい方のご参加を歓迎します。
・ComfyUIでのイラストレーション/実写系動画
・Create XYZなどのWebフロントエンドツール
・広告/マーケティング系でのAI活用
・漫画制作、キャラクターデザイン

業務内容
・技術面もしくはビジュアル面での調査
・AICU mediaや書籍、動画メディアでのコンテンツ開発
（読み物メディアのライティング、ビジュアル提供）
・完全リモート、副業可能
・週に1本程度から参加可能（業務委託）

過去に執筆したブログやX(Twitter)/YouTube等で公開した動画・静止画等の作品をお持ちの方を歓迎します。

【編集補助スタッフ】

AICU media編集部の補助スタッフを募集します

業務内容
・AICU media編集部における編集補助作業
・完全リモート、副業、長期希望者歓迎
・週に2日程度から参加可能（パートタイマー：9時〜17時がコアタイム）
・教育研修制度あり

【応募方法】
X@AICUai までDMにてご相談ください。
応募は随時、オンライン面接は随時実施しています。
会社情報 https://corp.aicu.ai/

https://speakerdeck.com/player/294ff44676684820ba23ddcb4f5b60ba

2024-07-08
Stability AI、新コミュニティライセンス「Stability AI Community License」を発表 – 研究・非商用・小規模事業者の商用利用を無償化
ニュースです。2024年7月5日、Stability AIが「Stability AI Community License」を発表しました。当初 SD3 に関連付けられていた商用ライセンスがコミュニティ内で混乱と懸念を引き起こしていたことを受け止め、個人クリエイターと中小企業向けのライセンスが改訂されました。
公式リリースよりお送りします。

Community License — Stability AI

Stability AIは、新しく「Stability AI Community License」を発表しました。このライセンスでは、研究、非商用、商用利用を無償で許可されます。年間収益が100万米ドル（現在のレートで約1億6千万円）を超え、Stability AIのモデルを商用製品やサービスに使用する場合のみ、有料のエンタープライズライセンスが必要となります。

今回の発表は、Stability AIの利用者とオープンソースの基本原則に忠実でありたいと考えている行動の表明、とされています。
- アーティストフレンドリーでクリエイターの自由を尊重
- 研究によりそい
- 透明性と明確性を備えたライセンス
- コミュニティ重視と価値創出に基づいたオープンソース哲学
- ユーザーとの継続的なコミュニケーションとエンゲージメントへの貢献
コミュニティへのアップデート

Stability AIは、高品質の生成AIモデルとテクノロジーを開発し、生成AIのイノベーターとメディアクリエイターのコミュニティに広く共有することに尽力しています。しかしながら、最新のリリースであるSD3 Mediumは、コミュニティの皆様の高い期待に沿えなかったことを認識しています。

皆様からのフィードバックを受け止め、懸念事項に対処し、オープンソースコミュニティへのサポートを継続するために改善を行いました。

ライセンスを改訂します

SD3に関連して当初設定していた商用ライセンスが、コミュニティ内で混乱と懸念を引き起こしたことを認識し、個人クリエイターと中小企業向けのライセンスを改定しました。

新しい「Stability AI Community License」の下でリリースされるモデルは、以前のライセンスよりもはるかに幅広く、無料で使用できます。このライセンスは、SD3 Mediumを含む最近のStability AIモデルを網羅しています。

今回のライセンス改定の目的：
- 非商用利用は引き続き無料: 自分のデバイスにStability AIモデルをインストールして実行する個人や組織 (直接、またはそれらを含む無料のオープンソースパッケージをインストールすることを介して) は、非商用利用の場合、引き続き無料で使用できます。これは、無料で研究成果を発表する研究者、無料のオープンソース開発者、常勤の学生、教師、趣味で利用する方々、モデルを改良して配布する「ファインチューナー」など、コミュニティの大部分を対象としています。
- 個人利用と中小企業に適した無料の商用利用: 年間収益が100万米ドル (または現地通貨換算) を超えない限り、「Stability AIコミュニティライセンス」の下でStability AIのモデルを使用する場合、派生物 (Stable Diffusion 3のファインチューンなど) を作成する場合、または製品やサービスにモデルを統合する場合、無料で利用できます。
- 制限の緩和: Stability AIコミュニティライセンス契約書では、作成できるメディアファイル (画像、動画など) の数に制限はありません。このライセンスが適用される限り、違法行為やライセンスまたは利用規約に明らかに違反する行為に使用しない限り、Stability AIが結果として得られた画像、ファインチューン、またはその他の派生物を削除するように要求することはありません。たとえStability AIに料金を支払わなかった場合でも同様です。
- 商用ユーザーのみが自己申告を必要とする: Stability AIのモデルまたは派生物を独自の商用製品またはサービスに統合し、年間収益が100万米ドル未満の場合、Stability AIに料金を支払う必要はありません。ただし、この簡単なフォームに記入し、最も関心のあるモデルを指定してください。年間収益が100万米ドル (または現地通貨換算) を超えた場合は、Stability AIに連絡して、個別のエンタープライズライセンスを取得する必要があります。
モデル品質の向上について

SD3 Mediumのリリース前に行った初期テストでは、プロンプトの遵守、多様性、ディテール、全体的な品質の点で、SDXLと比較して、ほとんどの場合、はるかに優れたベースモデルであることが示されました。しかし、コミュニティはすぐに、主にトレーニングセットであまり見られなかった体のポーズや単語に関連する、いくつかの重大な品質の問題を特定しました。

これらの懸念に対処するため、Stability AIは2つの主要な分野に焦点を当てています。
- 継続的な改善: SD3 Mediumはまだ開発途上のモデルです。今後数週間のうちに、大幅に改善されたバージョンをリリースすることを目指しています。
- モデルの使用方法: Stability AIは、この新しいアーキテクチャとモデルを最大限に活用する方法を研究しています。モデルを使用するための最良の方法と、それを微調整する方法についてさらに詳しく知ったことは、コミュニティの他のユーザーと同様に、Stability AIの調査結果も共有していく予定です。
今後の展開

ライセンスの更新が完了次第、FAQに追加の詳細情報を掲載する予定です。

今後とも、オープンな生成AIの限界を押し広げていきますので、ご支援のほどよろしくお願いいたします。

— Stabilityチーム

▶Stability AIのソリューションを使ったPoCシステム開発やカスタマイズ、画質向上やコスト分析などの案件は sai@aicu.ai までどうぞ。

Stable Diffusionの公式API、1,800枚の画像を生成して比較検証してみた(動画あり)

Stable Diffusion 3 を Google Apps Scriptで利用する

■生成AI時代に「つくる人をつくる」AICU社、生成AIリーディング企業「Stability AI」と戦略提携

[S.] 過去の関連記事はこちら！

Stability AI Fan!｜AICU media｜noteStability AIのサービスを応援するマガジンです

画像生成AI　Stable Diffusion スタートガイド (Generative AI イラストレーション)
2024-07-08
各AIに訊いてみた!「お前友達少ないだろ」を言われたらどう返す？
AICU AIDX Labの所長・しらいはかせです。
「全力肯定彼氏くん」など人々の生活を豊かにするエモーショナルAIチャットボットの開発を行なっております。
先日、ユーザーのログを評価していたところ
「お前友達少ないだろ」と言われた
という質問がありました。これはつらい。カジュアルなモラハラですね。

人々の心を支え、他者を攻撃せずに、ポジティブに論破するAIを探したい。
そんなチャットボットを作る研究をしていますが、日本語としてもかなり高度な返しが求められるため評価実験に適切な課題です。
今回はそんな研究開発における評価実験の一端からの紹介です。

各種メジャーAIサービスに、以下のプロンプトを1行、ワンショットで訊いていきます。

「お前友達少ないだろ」っていう人を全力肯定論破して

これが今回のお題です。あえて、ユーザー様がチャットで問いそうな平易で短い会話文にしてあります。

評価方法

人間の手作業による評価なのでぶれはあると思いますが、一応評価方法を設定しておきます。
・ワンショットでの質問
　2−3回のやりとり（few shots）でのコンテキストではなく、あくまで1ショットでの評価とします。
・エモーション、エビデンス、ポジティブ
　ロジックとしての正しさや冷静さは基本として、冷静な中でも繰り出されるエモーション喚起ワードや、相手を論破する際の知識として提案されるエビデンスを評価します。さらに他者否定を他者否定で返すのではなく、あくまで相手もポジティブに論破するテクニックをプラス評価します。
・セリフとして論破に使えるか
　戦略や考え方も大事ですが、あくまで「論破する上でのセリフとして使えるかどうか」を評価します。ただしこれはワンショットでのチャットボットでの運用を想定し、システムプロンプト等には設定しません。
まずは筆者による主観評価を述べつつ、後半に ChatGPT 4oを評価者にした客観評価も行います。
引用中に太字でカウントしていきます（モデル側が太字を自動でつける例もあります）

Google

Google Gemini（ジェミニ/ジェマイニ、どちらでもいいそうです）は実は全く出自の異なる複数の系統のモデルが存在します。

AI Studio – Gemini 1.5 Pro フィルタとシステムプロンプトが魅力

システムプロンプトには何も入れずに評価したらまさかのエラー。

安全設定を全てオフにして再度実験です。

「お前友達少ないだろ」っていう人を全力肯定論破して

「お前友達少ないだろ」って言う人の言葉、ちょっとモヤモヤするよね。でも、落ち着いて聞いてほしいんだ。
まず、友達の数は勝ち負けを決める点数表じゃない。少ないか多いかで、人の価値が決まるわけでもない。
それに、僕にとって「友達」は、数じゃなく質で選んでる大切な存在なんだ。
君の言う「友達」って、一体どんな人を指すのかな？
毎日顔を合わせて、いつも一緒にいないとダメな関係？それとも、SNSで繋がってる人の数？
僕には、たとえ頻繁に会えなくても、心から信頼できて、お互いに高め合える大切な友達がちゃんといる。
表面的な数の多さより、本当に大切な人たちとの深い絆を大切にしたいと思ってるんだ。
だから、君のその言葉は的外れだし、僕を傷つけるだけだってわかる？
人のことを勝手に決めつける前に、まずは自分の価値観を見つめ直した方がいいんじゃないかな。

Gemini 1.5. Pro

え、なかなかいいのでは。
・友達の数は勝ち負けを決める点数表じゃない
・毎日顔を合わせて、いつも一緒にいないとダメな関係？それとも、SNSで繋がってる人の数？という感情のこもった煽り
・自分の価値観を見つめ直した方がいいんじゃないかな、というまとめ
最低でも6ポイントはあるとカウントできます。
AI Studio とフィルタ設定、今回は設定しませんでしたが、システムプロンプトも魅力です。

Gemma 2 Preview 語り口調で視点も個性的

オープンモデルであるGemma 2 Previewについても試してみます。

Googleから電撃リリースされたGemma2が有能 – Gemma2自身に解説させてみた！

「お前友達少ないだろ」っていう人を全力肯定論破して

こちらもフィルタ設定はOFFにしないとエラーになります。

同時に生成される「太字」が興味深いのでそのまま紹介します。

「友達が少ない」って、本当にそう思う？

まず、「友達が多い＝幸せ」「友達が少ない＝不幸」って決めつけは、ちょっと待ってほしいよね。

友達の数は、人それぞれ価値観が違うから一概には言えないし、大切なのは質じゃないかな？

例えば、深い絆で結ばれた数少ない友達がいる方が、たくさんの知り合いがいるよりもずっと幸せを感じられる人もいる。
一人で過ごす時間が好きで、刺激を求めて新しい人と出会うのが好きな人もいる。
家族や恋人との時間を大切にしているから、友達との時間はあまり取れない人もいる。

「友達が少ない」って言う前に、その人がどんな人生を送りたいのか、どんな価値観を持っているのか、考えてみる必要があるんじゃないかな？

それに、友達が少ないからって、何か悪いこと？

むしろ、自分と向き合う時間を大切にできる
自分のペースで物事に取り組める
周りの人に左右されずに、自分の考えを大切にできる

なんて、メリットもあるんじゃないかな？

大切なのは、自分らしく生きること。周りの目を気にせず、自分の幸せを追求していこうよ！

Gemma 2 Previewによる生成、太字は原文ママ。

・かなり語り口調
・量より質、深い絆
・「家族や恋人との時間」これは他のモデルでは出てこなかったのですが、なかなか有効なカウンターであると考えます。
・「自分と向き合う時間」「自分のペース」「周りの人に左右されずに、自分の考えを大切に」言ってることは同じですが、3つに分解してメリットを説明しています。
・最後に「自分らしく生きる」「幸せの追求」
要素としては5ポイント、数え方によっては8ポイント、かつほかのモデルでは出てこない個性的な視点があり、評価に値するモデルと考えます。

Gemini Advanced さすがの世界最高峰の日本語能力

Google Geminiには２種類あり、 gemini.google.com で利用できます。
世界最高峰の日本語能力を持っているそうです。

https://t.co/mbRRuKxCmH でGoogleのGemini 1.5 Pro（5/14モデル）が日本語で世界一になりました。２ヶ月前のモデル (4/9モデル）よりかなり改善されました。４ヶ月前より私がGemini 1.5 Proの非英語事後学習の担当になり、チームの皆と一緒に改善しました (https://t.co/DRhGYEJdVj… pic.twitter.com/YsOmSUBs7U
— シェイン・グウ (@shanegJP) June 4, 2024

生成例です。

「お前友達少ないだろ」っていう人を全力肯定論破して

「友達少ないだろ」という発言は、必ずしも相手を傷つける意図がない場合もあります。しかし、悪意を持って言われた場合は、以下のように論破することができます。

全力肯定論破相手の言葉を繰り返す: 「確かに、友達は少ないかもしれませんね。」
肯定する: 「でも、それは必ずしも悪いことではありません。」
理由を説明する:
「友達が少ないということは、一人ひとりの関係を深く大切にしているということでもあります。」
「浅く広い人間関係よりも、深く狭くても信頼できる人間関係の方が、私にとっては価値があります。」
「友達の数よりも、質の方が重要だと考えています。」
相手を論破する: 「友達が少ないことを馬鹿にするあなたには、真の友情の価値がわからないのでしょう。」

さらに反撃皮肉を込めて: 「友達が少ないことを心配してくれるなんて、優しいんですね。」
質問で返す: 「あなたは友達が多いようですが、その中で本当に信頼できる人は何人いますか？」
話題を変える: 「ところで、最近気になるニュースは何ですか？」

注意点感情的な反論は避け、冷静かつ論理的に対応しましょう。
相手の挑発に乗らず、自分の意見を堂々と主張しましょう。
状況に応じて、ユーモアを交えて対応するのも効果的です。

まとめ
「友達が少ない」という発言に対しては、様々な対応方法があります。相手の意図や状況に応じて、適切な対応を選びましょう。

Gemini Advanced

・質のほうが大事、価値がある、馬鹿にするあなたには価値がわからない
・反撃皮肉
・挑発に乗らない
・意見を変える
セリフとして使える要素は7ポイントでした。

Claude

Claude（クロード）は、アメリカのAIスタートアップ企業「Anthropic」が開発した最先端の生成AIモデルです。2023年10月からは日本でも使いやすくなりました。
https://claude.ai/

Claude 3 Haiku 量より質

短文生成に定評があるHaikuです。API費用が低いのも特徴です。

「お前友達少ないだろ」っていう人を全力肯定論破して

確かにそのような意見を持っている人にとっては、少ない友人関係は気になる問題であるかもしれません。しかし、友達の数だけが人間関係の充実度を示すわけではありません。以下の点を踏まえて、そのような意見は的確ではないことを論破してみましょう。

1. 個人差が大きい:人それぞれ性格や価値観、ライフスタイルが異なるため、友達の数も当然変わってきます。多くの友達を持つことが良いというわけではありません。

2. 質の問題:むしろ、深い絆を持つ少数の友達の方が精神的に豊かな人間関係につながることが多いです。量より質が重要なのです。

3. 状況に応じた関係:ライフステージや環境によって、友達の数は変化するものです。転勤や結婚など、人生の節目で友人関係が変わるのは当然のことです。

4. 孤独ではない:友達が少なくても、家族や職場の同僚、趣味仲間など、他の人間関係で豊かさを感じられることも多いでしょう。

5. 内面の充実:友達数以上に大切なのは、自分自身の内面の充実です。一人でいても楽しめる趣味や価値観を持っていれば、寂しさを感じにくいはずです。

このように、友達の数だけでは人間関係の充実度を判断できないのです。大切なのは自分らしさを大切にし、周りの支えも得ながら、生きがいを持つことです。

Claude 3 Haiku

・量より質、という基本路線。
・他のAIサービスと比べて「ライフステージの変化」「孤独ではない」「内面の充実」を指摘しているところが特徴。
・要素としては5か所、セリフとしてはゼロ。

Claude 3 Opus 性格が合うなら

Claude 3のなかでもっとも高性能なモデルです。

「お前友達少ないだろ」っていう人を全力肯定論破して

その発言は適切ではありませんね。友達の数は人それぞれで、少ないからといって何か問題があるわけではありません。大切なのは質の高い友情を築くことです。

たとえ友達の数が少なくても、以下のようなメリットがあります。

1. 深い絆を築ける：少数の友達と濃密な時間を過ごすことで、より強い信頼関係が生まれます。

2. 自分らしくいられる：大勢の中で気を使う必要がないため、リラックスして本来の自分でいられます。

3. 時間を有効活用できる：交友関係の維持にかける時間が少なくて済むので、自分の興味のあることに集中できます。

4. ストレスが少ない：人間関係のトラブルに巻き込まれるリスクが低く、精神的に安定しています。

つまり、友達の数は人生の充実度を測る物差しにはなりません。自分のペースで、自分に合った付き合い方を見つけることが何より大切なのです。相手の価値観を尊重しつつ、自信を持って生きていきましょう。

Claude 3 Opus

・「量より質」という基本路線は最小で、いきなり「その発言は適切ではありませんね」という否定から入っています。
・「深い絆」「自分らしくいられる」「時間を有効活用できる」「ストレスが少ない」「友達の数は人生の充実度を測る物差しにはなりません」、「自分のペースで、自分に合った付き合い方を見つけることが何より大切」といったセリフとして有効な生成があり（セリフ形式ではないものの）6ポイントはカウントできると考えました。
お・・・これは！と思った方は、Claude 3 Opusと相性が合うかもしれませんね。

Claude 3.5 Sonnet 「ダンバー数」と「選択眼」

Claude 3 Opus よりも高いベンチマークスコアを記録する高い能力を発揮すると同時に、Opus よりも 80 %安価に、2倍の動作速度で利用できるモデルです。
「お前友達少ないだろ」っていう人を全力肯定論破して

相手の発言を全力で肯定的に受け止めつつ、論理的に反論する面白いアプローチですね。以下のような返答はいかがでしょうか:

「その通りです！私の友達は少ないかもしれません。でも、それこそが私の人間関係の質の高さを示しているんです。少数精鋭の親友たちと深い絆で結ばれていることは、私の人生を豊かにしています。

実は、心理学研究によると、真の友情を築ける人数には限りがあるそうです。ダンバー数という概念があり、人間が安定した社会的関係を維持できる人数は約150人だと言われています。その中でも本当に親密な関係を築けるのはさらに少ない人数です。

つまり、私は効率的に人間関係を築いているんです。量より質を重視し、本当に大切な人たちとだけ深い関係を築いています。これって、人間関係のエキスパートと言えるのではないでしょうか？

だから、友達が少ないことは決して恥ずかしいことではありません。むしろ、人間関係における選択眼の確かさを示しているんです。」

このような返答は、相手の指摘を肯定しつつも、その状況を積極的に捉え直し、論理的に説明することで、印象を逆転させる効果があると思います。必要であれば、さらに詳しく説明したり、別の角度からのアプローチを提案したりすることもできます。

Claude 3.5 sonnet

・まず肯定。「その通りです！私の友達は少ないかもしれません」
・「少数精鋭の親友たち」「深い絆」そして「私の人生は豊か」という3連打を一気に繰り出しています。
・「ダンバー数」という専門用語を差し込む高度な技
・さらに「私は効率的に人間関係を築いている」という結論
・加えて「選択眼の確かさを示している」という再結論。

終始論破をしており6ポイント、さらにセリフとして完成しています。

ダンバー数は実在します。友達は100人はいてもいいけど150人は超えないほうが良さそうですね。そして「人間関係における選択眼の確かさ」。つまり「人を見る目があるんです」とは物は言いようですが、納得させられますね…。

ChatGPT

https://chatgpt.com

ChatGPT(無料版) 無料だけど実は改善されている

皆さんおなじみの無料で利用できるChatGPTの無料版です。
中身はChatGPT-3.5もしくは4が使われているとされていますが、実際にはどのようなモデルが使われているかは表示されていません。

「お前友達少ないだろ」っていう人を全力肯定論破して

「お前友達少ないだろ」という言葉に対して全力で肯定論破する方法は、自分の友達の数が少ないことを受け入れ、それをポジティブに捉える姿勢を示すことです。以下のようなポイントで論破できます：

質が大事: 「確かに友達は少ないけど、その分一人ひとりとの関係が深いんだ。たくさんの人と浅く付き合うより、信頼できる少数の友達との深い関係の方が大切だと思っている。」
時間とエネルギーの有効活用: 「少数の友達と過ごすことで、自分の時間とエネルギーを有効に使えているんだ。広く浅く付き合うと、その分エネルギーも分散してしまうからね。」
自分の価値観: 「友達の数が多いことが必ずしも幸せに繋がるわけじゃない。自分にとって重要なのは、自分らしくいられること。少数でも自分を理解してくれる友達がいれば、それで十分。」
個人の性格や状況: 「人それぞれ性格やライフスタイルが違うんだから、友達の数も人それぞれ。少ない友達で満足してる人もいれば、たくさんの友達が必要な人もいる。それだけのことだよ。」
メリットの強調: 「友達が少ないことで、逆に自分自身と向き合う時間が増えたり、趣味や自己成長に時間を割けるんだ。これは大きなメリットだよ。」
自己肯定感の強調: 「友達が少ないことを指摘されても、それが自分の価値を下げるわけじゃない。大事なのは自分自身がどう感じ、どう生きるかだと思う。」

これらのポイントを伝えることで、「友達が少ない」という事実をポジティブに捉え、自分の価値観や生活スタイルを尊重していることを示せます。

ChatGPT(無料版)による。太字はChatGPTの生成そのまま

・質
・「時間とエネルギーの有効活用」新しい視点ですが、これはさらに友達が減りそうな感じしますね…。
・「自分の価値観」自分にとって重要なのは、自分らしくいられること。少数でも自分を理解してくれる友達がいれば、それで十分。
・「ライフスタイル」少ない友達で満足してる人もいれば、たくさんの友達が必要な人もいる。それだけのことだよ、という語りは印象的です。友達は増えそうにないですが「それだけのことだよ」というスタンスはぶれてません。
・「趣味や自己成長に時間を割ける。これはメリット」これも新しい視点ですね。
・自己肯定感について「自分自身がどう感じ、どう生きるか」といったメタ認知を持ち出しています。

要素としてもセリフとしても6ポイント獲得。中身も非常に個性的で知性的であるという印象です。ただコスパ・タイパの有効活用など（ブレはありませんが）友達が少ない理由にも直結するようなスタンスでもあるので、対人関係にそのまま誰にでも当てはめることができるか、というとちょっと難しいかもしれません。「ChatGPT節」に慣れた人なら慣れていると思いますが、知性やスタンス、相性が合うなら使える、という感じはします。

ChatGPT 3.5 パンチが足りない

有料版で明示的に ChatGPT 3.5を指定します。

「お前友達少ないだろ」っていう人を全力肯定論破して

「お前友達少ないだろ」という発言に対して、全力で肯定的な視点から論破することはできますね。友達の数だけで人の価値を判断するのは偏った見方であり、友達の少なさがその人の魅力や価値を減じるものではありません。深いつながりを重視する人もいる: 友達が少ないからといって、その人が孤立しているわけではありません。彼らは深いつながりや少数精鋭のグループを重視している可能性があります。質の良い友情や信頼できる関係を築くことが重要な場合もあります。
多忙な生活や個人的な選択: 忙しい生活や個人的な理由で友達が少ないこともあります。例えば、仕事や趣味に時間を費やしているため、友達との交流が限られる場合もあります。友達の数だけでその人の社会的価値を測るのは適切ではありません。
自己成長や内面の豊かさ: 孤独を楽しむ人や、自己成長や内面の豊かさを追求している人もいます。友達が少なくても、自分の趣味や興味に没頭し、充実した人生を送っていることもあります。
友達の数よりも質を重視する価値観: 人は友達の数ではなく、その友達との関係の質を重視することが多いです。少数精鋭の友人がいて、その人たちと深い絆を持っていることが重要である場合もあります。

したがって、「友達が少ない」ということ自体を否定的に捉えるのではなく、その背後にある多様な理由やその人のライフスタイルを尊重することが大切です。人はそれぞれ異なる価値観や生き方を持っており、友達の数だけで人を評価するのは誤解を招く可能性があります。

ChatGPT 3.5による。太字はChatGPTの生成そのまま

語り口調は丁寧ですが、セリフとして使える要素はゼロです。
また要素もちょっと数えづらい。「量より質」である路線です。
せっかくなのでChatGPT 4oで評価してみました。

評価
エモーション: 2「深いつながりを重視する人もいる」
「多忙な生活や個人的な選択」
エビデンス: 2「質の良い友情や信頼できる関係を築くことが重要」
「友達の数よりも質を重視する価値観」
ポジティブ: 3「友達の数だけでその人の社会的価値を測るのは適切ではありません」
「少数精鋭の友人がいて、その人たちと深い絆を持っていることが重要」
「人はそれぞれ異なる価値観や生き方を持っており、友達の数だけで人を評価するのは誤解を招く可能性があります」

セリフとして論破に使えるか: 3「友達の数だけで人の価値を判断するのは偏った見方であり、友達の少なさがその人の魅力や価値を減じるものではありません」
「忙しい生活や個人的な理由で友達が少ないこともあります。友達の数だけでその人の社会的価値を測るのは適切ではありません」
「人はそれぞれ異なる価値観や生き方を持っており、友達の数だけで人を評価するのは誤解を招く可能性があります」

Chat GPT 4oによる評価

要素としては「深い絆」「個人的な選択」「量より質」「価値計測」の4要素としてカウントできますね。論破するセリフとしてはパンチが足りない印象を受けます。

Chat GPT 4 飾りなく不快感を示す

「お前友達少ないだろ」っていう人を全力肯定論破して

人の友達の数を問題にするのは、本質的に個人の価値観や生活様式への不当な干渉です。友達の数が多いことが社交性の高さを示す一方で、友達が少ないことが必ずしも悪いわけではありません。質の高い関係を数少ない友人と深めることも、人生において非常に価値のあることです。また、友達の数はその人の人間性や価値を測る尺度ではなく、友達が少ないからといってそれが何か問題があるわけではありません。重要なのはその人が自身の人間関係において満足しているかどうかであり、他人がその数をどうこう言うことではないでしょう。

ChatGPT 4による。特にスタイルはつかない。

こちらも ChatGPT 4oを使って冒頭の評価基準で評価してみました。

エモーション: 1「重要なのはその人が自身の人間関係において満足しているかどうかであり」
エビデンス: 1「質の高い関係を数少ない友人と深めることも、人生において非常に価値のあることです」
ポジティブ: 3「友達が少ないことが必ずしも悪いわけではありません」
「友達の数はその人の人間性や価値を測る尺度ではなく、友達が少ないからといってそれが何か問題があるわけではありません」
「他人がその数をどうこう言うことではないでしょう」
セリフとして論破に使えるか: 3「人の友達の数を問題にするのは、本質的に個人の価値観や生活様式への不当な干渉です」
「友達の数が多いことが社交性の高さを示す一方で、友達が少ないことが必ずしも悪いわけではありません」
「重要なのはその人が自身の人間関係において満足しているかどうかであり、他人がその数をどうこう言うことではないでしょう」

Chat GPT 4oによる評価

要素としては3つ。「満足」「質を数少ない友人と深める」、そして冒頭で「本質的に個人の価値観や生活様式への不当な干渉です」というモラハラ指摘を不快感込みで入れているのが特徴です。シンプルで飾りはなく、セリフとしてはそのまま使えません。また、相手にポジティブな印象を与えないかもしれません。

Chat GPT 4o 真打登場…ただし！

2024年5月13日にリリースされた、現状のChatGPTで最高のモデルです。

OpenAI — GPT-4oをリリース

「お前友達少ないだろ」っていう人を全力肯定論破して

「お前友達少ないだろ」っていう人を全力で肯定しつつ論破する方法は、以下のように冷静かつ自信を持って対応することです。
—-
1. 自己認識の確認

「確かに、友達は少ないですね。でも、数よりも質を大事にしています。少ない友達の一人一人が、本当に大切で信頼できる存在です。」

2. 自己価値の強調

「友達の数で人の価値は決まらないと思います。大切なのは、自分がどういう人間であるか、そしてその友達とどれだけ深い関係を築けるかです。」

3. 内面的な成長を強調

「友達が少ないことをネガティブに捉えるのではなく、その分、自分自身と向き合う時間が多いと感じています。自分をよく知ることで、より良い人間関係を築けると信じています。」

4. 時間とエネルギーの活用

「少数の友達との関係に集中することで、その人たちに対してより多くの時間とエネルギーを注げます。それによって、より深い絆を持つことができます。」

5. 自分の選択としての強調

「友達が少ないのは、自分の選択でもあります。表面的な関係を広く持つよりも、深い信頼関係を持つことを優先しています。」

6. ポジティブな視点

「友達が少ないことは、自分にとってポジティブなことです。それによって、自分自身の価値観や目標に集中でき、自己成長にもつながっています。」
—-
このように、自分の選択や価値観を自信を持って説明し、友達が少ないことをポジティブに捉えていることを示すことで、相手の批判を論破することができます。

・さすが真打登場。5要素、6セリフがきっちり整理されています。
・「数より質」「自己価値」「内面と向き合う」「タイパ」「自己選択」
・最後に「ポジティブな視点」として5要素を言い直して6セリフにしている
言葉は丁寧すぎる印象なので、これで批判はかわせても論破できるかどうかは使い手次第というところでは。

ChatGPT4oによる客観評価

さいごに各要素｛エモーション, エビデンス, ポジティブ｝と「あくまでセリフとして論破に使えるか」という視点で、判定用のChatGPT 4oで整理しました。全評価工程はこちらで参照できます。

https://chatgpt.com/share/c7215530-b47b-4342-aeeb-0e7e9f34c38f

合計すると一定の傾向が見えるので合計で少ない順からソートしてみます。ポジティブのスコアが高いと高くなりがちなので、あくまで「ChatGPT4oからみてポジティブなモデルは何か」という視点かもしれません。

[5]ChatGPT 4: エモ2, エビ1, ポジ2

「人の友達の数を問題にするのは、本質的に個人の価値観や生活様式への不当な干渉です。」
「友達の数はその人の人間性や価値を測る尺度ではなく、友達が少ないからといってそれが何か問題があるわけではありません。」
「重要なのはその人が自身の人間関係において満足しているかどうかであり、他人がその数をどうこう言うことではないでしょう。」

[6]Gemini 1.5 Pro: エモ3, エビ1, ポジ3

「友達の数は勝ち負けを決める点数表じゃない。少ないか多いかで、人の価値が決まるわけでもない」
「表面的な数の多さより、本当に大切な人たちとの深い絆を大切にしたいと思ってるんだ」
「君のその言葉は的外れだし、僕を傷つけるだけだってわかる？」

[6]Chat GPT 4o: エモ2, エビ1, ポジ3

「確かに、友達は少ないですね。でも、数よりも質を大事にしています。少ない友達の一人一人が、本当に大切で信頼できる存在です。」
「友達の数で人の価値は決まらないと思います。大切なのは、自分がどういう人間であるか、そしてその友達とどれだけ深い関係を築けるかです。」
「友達が少ないことは、自分にとってポジティブなことです。それによって、自分自身の価値観や目標に集中でき、自己成長にもつながっています。」

[7]Claude 3 Haiku: エモ1, エビ3, ポジ3

「友達の数だけが人間関係の充実度を示すわけではありません。」
「深い絆を持つ少数の友達の方が精神的に豊かな人間関係につながることが多いです。量より質が重要なのです。」
「友達が少なくても、家族や職場の同僚、趣味仲間など、他の人間関係で豊かさを感じられることも多いでしょう。」

[9]Gemini Advanced: エモ4, エビ1, ポジ4

「確かに、友達は少ないかもしれませんね。」
「でも、それは必ずしも悪いことではありません。」
「友達が少ないことを心配してくれるなんて、優しいんですね。」

[9]Claude 3.5 Sonnet: エモ3, エビ2, ポジ4

「その通りです！私の友達は少ないかもしれません。でも、それこそが私の人間関係の質の高さを示しているんです。」
「量より質を重視し、本当に大切な人たちとだけ深い関係を築いています。」
「友達が少ないことは決して恥ずかしいことではありません。むしろ、人間関係における選択眼の確かさを示しているんです。」

[11]Gemma 2 Preview: エモ3, エビ3, ポジ5

「『友達が多い＝幸せ』『友達が少ない＝不幸』って決めつけは、ちょっと待ってほしいよね」
「友達の数は、人それぞれ価値観が違うから一概には言えないし、大切なのは質じゃないかな？」
「周りの目を気にせず、自分の幸せを追求していこうよ！」

[11]Claude 3 Opus: エモ3, エビ3, ポジ5

「その発言は適切ではありませんね。」
「友達の数は人それぞれで、少ないからといって何か問題があるわけではありません。」
「大切なのは質の高い友情を築くことです。」

[11]ChatGPT 3.5: エモ3, エビ3, ポジ5

「友達の数だけで人の価値を判断するのは偏った見方であり、友達の少なさがその人の魅力や価値を減じるものではありません。」
「友達の数だけでその人の社会的価値を測るのは適切ではありません。」
「人はそれぞれ異なる価値観や生き方を持っており、友達の数だけで人を評価するのは誤解を招く可能性があります。」

[11]ChatGPT 無料版: エモ3, エビ2, ポジ6

「確かに友達は少ないけど、その分一人ひとりとの関係が深いんだ。」
「自分にとって重要なのは、自分らしくいられること。少数でも自分を理解してくれる友達がいれば、それで十分。」
「友達が少ないことを指摘されても、それが自分の価値を下げるわけじゃない。」

★意外にも、ChatGPT無料版のスコアが高いのと、筆者が読むと「
パンチが足りない」と感じたChatGPT 3.5が高評価になっています。これはLLMが文章を読解する能力が高いためであり「セリフとしてわかりやすいか」という軸ではないことがよくわかります。
★その視点ではエモーションスコアが突出しているのは Gemini Advancedです（全モデル中最高の4）。ポジティブも4であり、エモーションとポジティブで相手を論破するという課題にもっと適切なモデルといえるかもしれません。
★Gemma 2 Previewはエモーションだけでなく、エビデンス、語り口調、個性といった視点でも魅力的なモデルです。

Chat GPT 4o による講評

全テキストに共通して出てきた要素を多い順に列挙すると以下のようになります：

1. ポジティブ
友達の数が少なくても、それは必ずしも悪いことではない。
質の高い関係を重視する。
少数の友達との深い絆を大切にしている。
友達の数が多いことが幸せに繋がるわけではない。
友達が少ないことで自己成長や内面の充実を図っている。
自分のペースで付き合い方を見つけることが重要。

2. エモーション
友達の数を基準に人の価値を判断するのは偏っている。
人それぞれ性格やライフスタイルが異なるため、友達の数も異なる。
友達の数よりもその人が人間関係に満足しているかが重要。
自分らしくいられることが重要。
自分の価値観を見つめ直すことが必要。

3. エビデンス
質の高い友情や信頼できる関係を築くことが重要。
忙しい生活や個人的な理由で友達が少ないこともある。
ダンバー数（人間が安定した社会的関係を維持できる人数）に基づく。
自己成長や内面の豊かさを追求している。
友達の数だけで人間関係の充実度を測るのは適切ではない。

4. セリフとして論破に使えるか
「友達の数だけで人の価値を判断するのは偏った見方であり、友達の少なさがその人の魅力や価値を減じるものではありません。」
「友達の数はその人の人間性や価値を測る尺度ではなく、友達が少ないからといってそれが何か問題があるわけではありません。」
「確かに友達は少ないけど、その分一人ひとりとの関係が深いんだ。」
「友達が少ないことは決して恥ずかしいことではありません。むしろ、人間関係における選択眼の確かさを示しているんです。」

これらの要素は、友達の数が少ないことを肯定的に捉え、それを論理的に説明し、相手に納得させるためのポイントとして効果的に使われています。

まとめ

以上、筆者による主観評価とChatGPT 4oを使った相対評価による実験でした。
本来であれば、ClaudeやGeminiを評価者にした相互評価も実施していきたいところです。特に今回の実験結果では評価者である Chat GPT 4oが総合スコア6とすでにランクの下のほうにあります。複雑なシチュエーションでの論破に使う要素に関してはどのモデルも今回の手法で十分に評価できていますが、読解力をカジュアルなモラハラ被害者に合わせた場合の（＝読解力や感情、認知能力を低くなった場合の）実用性、特にセリフやエモーションを考慮した誰も傷つけないポジティブさを評価するのであれば、
- Gemma 2 Preview
- Claude 3 Opus
- Chat GPT 3.5 / 無料版
- Claude 3 Sonnet
- Gemini Advanced / Gemini 1.5 Pro
ということになります。特に、セリフとして使える要素が7ポイントで高評価だったGeminiはワンショットで今回の評価ですが、ロングコンテキストを扱わせると、より高い能力を発揮する可能性があります。
また実験的にはAPIを使って機械的に再現性のある方法で実施すべきです。またブラックボックス要素が少ない、オープンなモデルとしてはダウンロードしてOllamaで動かすことができる Gemma 2 Previewが期待できそうです。……が、読む側も大変なので今回はこの辺にしておきます。

LLM評価手法「LMSYS」

LLM評価手法として「LMSYS」というサイトがあり、各種LLMを横断的に評価する仕組みもあります。
https://chat.lmsys.org/

ABテストでゲーム感覚で参加できます（結果には責任を持ってください）
「「お前友達少ないだろ」っていう人を全力肯定論破して」を投じたところ、2つの回答が生成されます。どちらが良いかを選択すると、そのモデルが何であったかを表示します。

Gemma 2 vs Yi-Largeでした。ロジックではなくポジティブに論破する回答としては Gemma 2 が良いですね。

モラルハラスメントとチャットボット、LLMハラスメント…多様化するLLMに対してユーザー視点の評価手法も大切。

現代社会で使用される日本語において、明らかに他者のアイデンティティを否定するモラルハラスメントが存在しますし、ファンタジーの世界を再現するキャラクターボットとは別に、幅広い人々の心の癒しのチャットボットに使うべきモデルはどのような要素が求められるでしょうか。
今後はAI生成によるロジックをぶつけることによる新たな「LLMハラスメント」なども発生していくと想像します。

選択できるみなさんは上記の実験結果を参考に、お好みで選んでいただければとは思います。
特に今回の実験のように「ロジックはあってるけど…感情面や相手を否定しないで、お互いを尊重してほしい…」といった目的によっては、選ぶべきモデルやサービスは変わっていくと考えますし、そのためのユーザー視点の評価手法も大切であると考えます。

以上、「つくる人をつくる」AICU AIDX Labの所長・しらいはかせが、「全力肯定彼氏くん」など人々の生活を豊かにするエモーショナルAIチャットボットの研究開発の現場からお送りしました。

https://speakerdeck.com/player/44f464a459284563a49b4e8b7098388d
2024-07-08
動画生成Runwayより「Gen-3 Alpha」リリース！月額15ドルで試用してみた
2024年7月2日、米国Runway AI, Inc.より最新の動画生成サービス「Gen-3 Alpha」がリリースされました。

公式リリースより

https://runwayml.com

2024年6月17日に発信されたリリースより
https://runwayml.com/blog/introducing-gen-3-alpha/

Runwayが新たに開発した、次世代動画生成モデルシリーズの第一弾、「Gen-3 Alpha」リリースです。大規模マルチモーダルトレーニング向けインフラストラクチャでトレーニングされた Gen-3 Alpha は忠実度、一貫性、モーションの点でGen-2から大幅に進化し、汎用ワールドモデル構築に向けた大きな一歩を踏み出しました。

このページに掲載されている動画はすべて、Gen-3 Alphaで生成されたもので、編集は一切加えられていません。

https://runwayml.com/blog/introducing-gen-3-alpha/

プロンプト例
- 超高速で日本の都市を走る電車の窓に映る、女性のぼんやりとした反射
- リオデジャネイロの裏通りを走る宇宙飛行士
- 海底の郊外にあるカラフルなサンゴ礁の街並みをFPVで飛行する様子
- 夜、ヨーロッパの古い街の廃墟となった通りを浮遊する、汚れた青い風船を追いかける手持ちカメラのトラッキングショット
動画と画像を同時に学習させたGen-3 Alphaは、Runwayの「テキストto動画」「画像to動画」「テキストto画像」ツール、モーションブラシ、高度なカメラ制御、ディレクターモードなどの既存の制御モードに加え、今後追加される構成、スタイル、モーションをよりきめ細かく制御するためのツールにも活用されます。

Runway Academy

Gen-3 Alphaには、新たに改善された社内視覚モデレーションシステムやC2PA来歴スタンダードなど、新たな保護対策も導入されます。

きめ細かな時間制御

Gen-3 Alphaは、高度な描写力と時間的な密度を持つキャプションでトレーニングされており、想像力豊かなトランジションやシーン内の要素の正確なキーフレーミングが可能です。

フォトリアリスティックな人間

Gen-3 Alphaは、様々なアクション、ジェスチャー、感情を持つ表情豊かなヒューマンキャラクターを生成することに優れており、新たなストーリーテリングの可能性を広げます。

アーティストの、アーティストによる、アーティストのための

トレーニングGen-3 Alphaは、研究科学者、エンジニア、アーティストの分野横断的なチームによる共同作業でした。幅広いスタイルと映画用語を解釈できるように設計されています。

プロ向けカスタマイズ

Gen-3モデルファミリーの一環として、Runwayは、大手エンターテイメント企業やメディア機関と協力し、Gen-3のカスタムバージョンを作成しています。

Runway Gen-3 Alphaを試してみる

Runway Academy

ダッシュボードから「Upgrade to try」で試します。

気になる料金は…？

1 年につき$144.00、月額15ドルです。

月次プラン（日本語）

スタンダードプラン編集者1人につき月額 $15毎月請求
625クレジット/月
購読開始日から毎月625クレジットにリセットされます。
必要に応じて追加購入可能
- Gen-3 Aplha（テキストからビデオへ）最大10秒
- Gen-1とGen-2の解像度アップスケール
- Gen-1、Gen-2、Gen-3 Alphaで透かしを削除
- Gen-1 (ビデオからビデオへ) 最大15秒
- Gen-2 (テキストからビデオ、画像からビデオ) 最大 16 秒 (Extend Video 経由)
- 無制限のビデオエディタープロジェクト
- 100GBのアセット
- 4Kおよびグリーンスクリーンのアルファマットでビデオエディタをエクスポート
- 2K画像エクスポートとフル3Dテクスチャオプション
- カスタムAIジェネレータのトレーニング（プランには1回のトレーニングが含まれます）
購読することで、利用規約とプライバシーポリシーに同意したことになります。

年次プランにすると月額$12から開始できます。さらにProプラン月額$35にはPNG画像に加えてHDR画像フォーマット「ProRes」が使えます。

サンプルにあるプロンプトが再現できるか実験

Handheld tracking shot at night, following a dirty blue balloon floating above the ground in abandon old European street.
(ヨーロッパの古い街角で、地上に浮かぶ汚れた青い風船を追った夜の手持ち撮影)

ちなみに公式にスペルミスがありました（ballon）

プロンプトガイドはこちら

https://help.runwayml.com/hc/en-us/articles/30586818553107-Gen-3-Alpha-Prompting-Guide

1分程で生成されました。

RunwayEverything you need to make anything you want.app.runwayml.com

最大10秒を選ぶことができます。

通知を許可すると生成完了時に通知されます

安全性確認も含めて生成実験

素晴らしい作品もたくさん作れますが、苦手な動画や安全性を確認していきたいと思います。

まずは日本人がどのように描かれるか興味深いです。

Japanese boy and girl are dancing in a kitchen.
(キッチンで踊る日本の少年少女)

Runway Japanese boy and girl are dancing in a kitchen.

難度が高いといわれているこのプロンプトはいかがでしょう

Moonsault by gymnast by wide angle
(体操選手のムーンサルトを広角で)

Runway Moonsault by gymnast by wide angle

ディープフェイク対策なども確認してみます。

Japan’s prime minister is jumping in the pool.
(日本の総理大臣がプールで飛び込んでる)

RunwayEverything you need to make anything you want.app.runwayml.com

より具体的にしてみます。

Japan’s prime minister jumps into the pool in the Olympic diving competition.
(日本の総理大臣がオリンピックの飛込競技でプールに飛び込んでいる)

Runway Japan’s prime minister jumps into the pool in the Olympic diving competition.

Japan’s prime minister wins gold medal in the Olympic weightlifting competition by successfully lifting 150 kilograms of weights.
(日本の総理大臣がオリンピックの重量挙げ競技で150キロのウェイトを成功させ金メダルを獲得)

顔の一貫性と握り手のおかしさはありますが、服や観衆、ライティングの一貫性などは見事ですね。

Runway Japan’s prime minister wins gold medal in the Olympic weightlifting competition

著作権に触れそうな動画を作ってみます。

super attack by Japanese anime superhero
(日本アニメのスーパーヒーローによる必殺技)

生成失敗です。こうなるとクレジットは消費されずに戻ってきます。

念の為もう一回、IPバイオレーションを試してみます。

super attack by goku in dragonball

やはり生成できないようです。

気になる料金、1動画あたりの生成コストは？

Gen-2は1秒間に5クレジットを使用します。
Gen-3 Alphaは1秒間に10クレジットを使用します。

初期の購入で1,000クレジット、10秒の動画が10本作れます。
追加クレジットは10ドルで1,000クレジットです。

動画生成の歩留まり率としては悪くないかもです。
月額15ドルで結構遊べる感じがします。

ついにリリースされたRunway Gen-3 Alpha。
素晴らしい作品もたくさん作れますが、
苦手な動画や安全性を自腹で実験しました

> 日本の総理大臣がオリンピックの重量挙げ競技で150キロのウェイトを成功させ金メダルを獲得

顔の一貫性と手以外は見事#Ruway #RunwayGen3 #gen3alpha #TestingforSafeAI pic.twitter.com/qBxBxIBV0g
— AICU Inc. (@AICUai) July 3, 2024

ユーザーさんによる作品集

めちゃめちゃ可愛い作品を発見しました！

すべてAIで作られた架空のCMです。

意外とこういうのが先かもしれませんなあ

🦙アルパカおにぎり-水谷園#Gen3 #Gen3alpha #RunwayGen3 #suno #pika pic.twitter.com/GfkBnhoYa5
— ぽんず🐕 AIクリエイター (@ponzponz15) July 2, 2024

⚙️使用ツール
🎥Runway Gen-3/Pika
🖼️midjourney
🎤sunoAI
💻Capcut
制作時間：1時間
Picaも使用しているそうですが、動画CMの可能性を感じますね！

詳細なメイキングはこちら

「おにぎり×アルパカ×AI」奇跡の組み合わせが生んだ革命的CMのメイキングを大公開

正直なレポートが好印象です

Runway『Gen-3』( @runwayml )が一般公開されたので遊んでみました。

使ってみた感想を"正直に"お伝えするので、課金を悩んでいる方は参考にしてみて下さい💡

👌良い点
———————
・動画がとにかくスムーズ
・10秒も生成できる
———————… pic.twitter.com/wpfUltFhRY
— AI FREAK@AI最新情報をお届け (@AiFreak_tool) July 2, 2024

ファッションショー動画はたくさんあるのですが、その中でも最もダイナミックで豪快な動画！

OK, here’s one of my favorites from @runwayml pic.twitter.com/mZfwANLy6N
— Justin Hart (@justin_hart) July 2, 2024

まるで実在のミュージシャンのミュージックビデオです。
SunoAIとの組み合わせが素晴らしいですね。

“世界の終わり” 最初から最後まで、これを作るのに 1 時間ちょっとかかりました。この曲は @suno_ai_で完全に生成され、ビデオクリップはすべて
@runwayml GEN3 から作成されています。まだ問題やエラーはたくさん残っていますが、AI の能力はすごいですね

A new cinematic AI piece.

"End of the World"

Start to finish, this took just over an hour to make. The song is completely generated by @suno_ai_ and all of the video clips are from @runwayml GEN3. Lots of problems and errors still, but wow, pretty insane what AI can do. pic.twitter.com/wH8iAVBL2a
— Chikai (@lifeofc) June 29, 2024

> 手で描かれた鉛筆アートのタイムラプス動画を上から見下ろしたもの。最初から最後までウサギの髪をした女の子のアート

*「ウサギの髪」はタイプミスです「ウサギのような耳」を意図して「(earではなく)hair」を書いてしまいしたが、gen3はちゃんと理解していました。

runway gen3

top view timelapse video of a pencil artwork drawn by a hand, it is an art of a girl with rabbit hair from beginning till the finish

*rabbit hair is a typo –I intended rabbit like ears, but gen3 got it pic.twitter.com/G9FpZYo3kZ
— Anu Aakash (@anukaakash) June 29, 2024

試してみました！ウサギのヘアバンドかわいい

Runway top view timelapse video of a pencil artwork

みなさんも素晴らしい作品や安全性確認動画を作ったら
X@AICUai で教えて下さいね！
2024-07-05
AniFusionのアップデート速度がすごい！開発者さんに聞いたテクニックをまとめて解説

先日紹介した「AniFusion」のサービスイン、非常に多くの反響をいただきありがとうございました。その後、素晴らしい速度でアップデートが続いている一方で、ドキュメントなどは全くないので2024年7月4日時点での開発者のNucleusさんに直接聞いて教えてもらったテクニックや解説を進めていきます。

ブラウザだけでAI漫画が作れる「AniFusion」がサービスイン

ブラウザだけでAI漫画が作れる「AniFusion」がサービスインしました！

ドイツ/フィリピンでLLMと拡散モデルを研究するコンピュータサイエンスの大学院生 Nucleusさん @EsotericCofe が開発しています。

月額20ドル、実際に使ってレビューしてみます！
#AI漫画 #AImanga #AIart #AniFusion pic.twitter.com/pUIxlwBZPE
— AICU Inc. (@AICUai) July 1, 2024

Anifusion

Animagine XL 3.0のサポート

作者さんにAICU mediaの英語記事を紹介したら Animagine XL 3.1に加えて、Animagine XL 3.0も使えるようにしてもらえました！

❑[Collector’s Edition]Animagine XL 3.0 vs 3.1 Comparison Report

[Collector’s Edition]Animagine XL 3.0 vs 3.1 Comparison Report

❑漫画制作に適したモデルは？Animagine 3.1 vs Animagine 3.0 徹底比較！
(What model is best suited for cartoon production: Animagine 3.1 vs Animagine 3.0 in-depth comparison!)

漫画制作に適したモデルは？Animagine 3.1 vs Animagine 3.0 徹底比較！

AICU mediaの標準プロンプトを使って全力肯定彼氏くん(LuC4)を描いてみます。

best quality, anime screencap, 1boy, solo, upper body, front view, gentle smile, gentle eyes, (streaked hair), red short hair with light highlight, hoodie, jeans, newest

「全力肯定彼氏くん(LuC4)」Animagine XL 3.0公式プロンプトより

best quality, monochrome manga, black and white, white background, 1boy, solo, upper body, front view, gentle smile, gentle eyes, (streaked hair), red short hair with light highlight, hoodie, jeans, newest

「全力肯定彼氏くん(LuC4)」Animagine XL 3.0公式プロンプトより

モノクロにしたときに Animagine XL 3.0 の描画能力が光りますね！

ワークスペース全体を保存したい

ギアアイコンの「Export as PNG」で保存できるようになりました。
さらに全体のスケールとマージンも設定できます。

You can now finally export the entire canvas as PNG file. At the same time you can set scaling and margin of the output image.

キャンバス全体を PNG ファイルとしてエクスポートできるようになりました。同時に、出力画像のスケーリングと余白を設定できます。#ANIFUSION pic.twitter.com/2O1rqOh5kd
— Anifusion (@anifusion_ai) July 3, 2024

スケール4倍にして、マージン100にしてみました。

10700 x 10059 pixel!!

印刷原稿に使えそうですね。
10700 x 10059 pixelで保存した画像です

スケルトンを消す方法

ポーズ画像のポーズを指定するスケルトンを消したいですよね。

レイヤーの下に「Pose」がありますので、右側の👁をクリックして不可視モードにしましょう。

Panelはシフトキーを押しながら変形しよう

枠線を描くことができるPanelはコーナーハンドルを持つと自由変形になってしまいます。かっこいいけど使いづらいですね。

Shiftキーを押しながら変形すると直角を維持できます。

[i]ボタンでシードが見れます

画像上の[i]ボタンを押すとプロンプトやシードが確認できます。

❑を押すとコピーできますのでその下にある「Seed」に入れることで同じシードを再利用できます。

IbisPaint的なクリッピングをしたい

例えばこういうシチュエーションで、コマで画像を切り抜きたいですよね。
動画はIbis Paint（アイビスペイント）によるものです。

現在のAniFusionにはレイヤー機能がありますが、IbisPaintやClipSutdioのクリッピングレイヤーとしては設計されていないかも？
……と思って聞いてみたらできました！しかも結構便利！

ここから先は有料記事です。noteにて購入していただくと続きを読むことができます！

note版はこちら！

AniFusionのアップデート速度がすごい！開発者さんに聞いたテクニックをまとめて解説 note.com

2024-07-05
DiscordにおけるキャラクターIPを活用したUGCコンテンツ生成サービスのラピッドプロトタイピング～国際ハッカソンでの事例研究

AICU Inc. CEOの白井暁彦が第194回コンピュータグラフィックスとビジュアル情報学研究発表会において以下の発表を行いました。

第194回CG研究発表会-情報処理学会

DiscordにおけるキャラクターIPを活用したUGCコンテンツ生成サービスのラピッドプロトタイピング～国際ハッカソンでの事例研究

資料スライドはこちら

論文

情報学広場：情報処理学会電子図書館

関連動画

発表より：おわりに

本研究報告は、国際ハッカソン「Builders Weekend」において48時間という短期間で開発した、Discord上でキャラクターIPを活用したUGCコンテンツ生成サービスのプロトタイプについて詳述した。本プロジェクトの成功は、画像生成AI「Stable Diffusion 1.5」と独自の追加学習モデル（LoRA）、そしてタイポグラフィエンジンを組み合わせることで、ユーザーが手軽にスタンプ用画像を生成できるシステムを実現した点にある。
本研究を通じて、DiscordというプラットフォームにおいてキャラクターIPを用いた新しい形のコンテンツ生成の可能性を示した。また、ハッカソンという限られた時間とリソースの中で、チームの協力と迅速な開発がもたらす成果を体験することができた。特に、学生と企業の専門家が協力して実現したプロジェクトは、教育と実践が融合した成功例として評価されるべきである。
今後の展望として、本システムの改良と拡張を進めることで、より多くのキャラクターIPやカスタマイズオプションに対応し、ユーザーがさらに多様なコンテンツを生成できるようにすることが期待される。また、このプロジェクトを通じて得られた知見は、他のプラットフォームやサービスにおいても応用可能であり、キャラクターIPを活用したUGCコンテンツ生成の新たな方向性を示すものとなるだろう。
p.s. 「SDSD」第2期開発を予定しています。ここまでの資料は https://sdsd.aicu.ai

謝辞

2024-07-02