投稿者: admin

  • Stability AI が Discordで利用できる多機能メディア生成サービス「Stable Artisan」をリリース!早速試してみた

    Stability AI が Discordで利用できる多機能メディア生成サービス「Stable Artisan」をリリース!早速試してみた


    Stability AI が Discordで利用できる多機能メディア生成サービス「Stable Artisan」をリリース!早速試してみた

    Stable Artisanとは? Discord内で高品質の画像や動画を生成・編集できるDiscordボットです。Stable Diffusion 3、Stable Video Diffusion、Stable Image Coreのパワーを活用しています。

    登録・利用はこちら https://stability.ai/stable-artisan

    メディア生成に加え、Stable Artisanには、検索と置換、背景の削除、クリエイティブ・アップスケール、アウトペインティングなど、作品を編集するためのツールが用意されています。

    使い方は簡単、/dreamコマンドで。

    まず、 https://stability.ai/stable-artisan でアカウントを作成し、artisan-1、artisan-2、artisan-3、artisan-4、artisan-5 のいずれかのチャンネルにアクセスして、/dream を使って制作を始めてください

    チャンネルの中で、入力できるチャンネルを探してください。
    (たとえば artisan-2 が利用できました)

    スラッシュコマンド「/dream」と入力すると、こんな感じにオプションが表示されます。
    ・プロンプト
    ・ネガティブプロンプト
    ・縦横比
    ・モデル(コアモデルとSD3が選べます)
    ・シード指定
    ・画像生成枚数
    不要な要素は省略して構いません!

    気になる料金は

    スラッシュコマンド「/credits」で確認できます。

    今月は 1/200 のクレジットが残っています。 Stability Artisan 機能のクレジットレート: 
    Image Core 3 SD3 6.5 Creative Upscale 25 Search & Replace 4 Outpaint 4 Remove Background 2 Sketch Control 3 Structure Control 3 Video 20
     Info クレジットは、成功した個々の生成ごとに計算されます。 たとえば、/image を使用して 2 つの画像を取得した場合、2x 3、つまり合計 6 クレジットを使用します。 これはまた、生成に失敗した場合(エラーや自動フィルタリングなどによる)、失敗した生成分のクレジットが返金されることを意味します。

    Platform APIサービスの詳細については、こちらをご覧ください: https://platform.stability.ai/docs/getting-started/stable-image

    もし行き詰まったら、Artisanチャンネルで/helpを使えば、Stable Artisanの使い方についてより詳しいヘルプが得られます

    関連:Stable Assistantと間違えないように…

    4月にリリースされたStable Assistantと間違えないようにしましょう。

    間違って登録したプランをキャンセルするには?

    ウェブサイト(https://assistant.stability.ai/login)からアカウントにログインし、メールアドレスの頭文字が表示されている右上のボタンをクリックします。 次に、”Manage Subscription “をクリックし、右上の “Cancel plan “をクリックします。 “プランのキャンセル “をクリックしてキャンセルを確定します。

    利用規定

    利用規約はこちら https://stability.ai/terms-of-use

    それでは、良い作品作りを!
    https://youtu.be/MWfb30kWqTM


    Originally published at https://note.com on May 9, 2024.

  • 漫画制作に適したモデルは?Animagine 3.1 vs Animagine 3.0 徹底比較!

    漫画制作に適したモデルは?Animagine 3.1 vs Animagine 3.0 徹底比較!

    4月に入り、X や kindle インディーズで AI で漫画を見かける機会が増えてきました。最近のイラスト系画像生成 AI では、漫画が流行の兆しを見せてきているようです。

    参考:SD黄色本

    書籍[画像生成AI Stable Diffusionスタートガイド] – つくる人をつくる AICU Inc.ja.aicu.ai

    参考:人気AI漫画家・けいすけ氏の「マンガの作り方」

    Amazon.co.jp: AIとCanvaでできる!マンガの作り方 みんなのマンガ物語 eBook : けいすけ: Kindleストア

    そこで AICU media では、「AI で漫画を作ってみたいけど、どのモデルを使えばいいんだろう…」という方向けに、白黒漫画制作に適した Stable Diffusion のモデルを調査しました!

    Animagine 3.1

    まずはアニメ系 SDXL の主流モデルとなっている「Animagine」の最新バージョンである Animagine 3.1 でモノクロイラストを生成してみましょう。

    プロンプト「best quality , monochrome , lineart,1girl, bob cut, flat chest , short hair , school uniform, round_eyewear, hand on hip,looking at viewer,open mouth,white background」

    ネガティブプロンプト「worst quality, low quality,blush, lowres, bad anatomy, bad hands」

    画像
    画像
    カワイイ女子高生は腰に手を当てているだけでカワイイ

    プロンプト通りの要素が生成されていて、質も良いですね!
    インク溜まりのような表現と、影部分の塗りつぶしがかわいいです。

    Animagine 3.0

    試しにひとつ前のバージョンである Animagine 3.0 でも生成してみましょう。
    プロンプトは前回と同様です。

    画像
    画像

    皆さん、気が付きましたか?
    Animagine 3.0 で生成した方が、線がとても綺麗に生成されています!

    画像
    3.0(左)と3.1(右)

    線の解像度が全く違うことがわかります。
    Animagine を使用する場合は、最新バージョンの 3.1 よりもひとつ前の世代の 3.0 を使用するのが良さそうですね。

    Animagine の年代タグを試す

    ここまで Animagine のバージョンを変えて試してみましたが、Animagine というと特徴的なのは年代タグです。年代タグというのは、絵柄の古さを調節できるタグのことです。

    詳しい比較、解説はこちらで行っています。

    https://note.com/embed/notes/n70122ef250d9

    Animagine の年代タグは、Animagine 3.1 の方が効果が反映されやすい感覚がありましたが、漫画を制作するとなるとどの程度絵柄に影響が出るのでしょうか。

    まず、Animagine 3.1 の「oldest(最も古い)」と「newest(最も新しい)」を試してみます。

    プロンプト「best quality , monochrome, lineart, 1girl, school uniform, smile, looking at viewer,open mouth,white background, (年代タグ)」

    oldest (Animagine3.1)

    画像

    Animagine3.1の「oldest」は 「2005 to 2010」とあります。たしかにそういう雰囲気があります。
    シンプルな目や影の濃い鼻、等幅の髪の毛がモノクロにも落とし込まれていますね。

    newest (Animagine3.1)

    画像


    「newest」も、流行りの華やかですっきりとした雰囲気が出ています(2022 to 2023)。

    また年代タグを指定していない時よりも、線が綺麗に生成されているような印象を受けます。そういう特性があるのでしょうか。

    次に、Animagine 3.0 の「oldest」と「masterpiece」を試してみましょう。プロンプトは同じです。

    oldest (Animagine3.0)

    画像

    masterpiece (Animagine3.0)

    画像

    Animagine 3.1 と比較すると、やはり線はこちらの方が若干綺麗であるものの、絵柄の差があまり出ていませんね。Animagine 3.1 の方が「oldest」のインパクトがあります。

    結果発表!

    生成して比較した結果、

    単純に漫画のようなモノクロ画像を生成したい場合:Animagine 3.0
    絵柄を古くしたりなど、年代タグを使いたい場合:Animagine 3.1

    という結果になりました!

    場合によって使い分けるのが最も有効だという結果は予想していなかったので、とても面白い実験になりました。

    公式のモデルカードを調べてみると年代タグについては以下のように微妙に異なりました。

    Animagine 3.0 Year Modifier
    Year Tag Year Range
    newest 2022 to 2023
    late 2019 to 2021
    mid 2015 to 2018
    early 2011 to 2014
    oldest 2005 to 2010

    年号修飾子 また、特定の現代アニメやヴィンテージアニメのアートスタイルにより正確に結果を導くために、年号の範囲を再定義しました。このアップデートでは、現在と過去の時代との関連性に焦点を当て、範囲を簡素化しました。

    Year Tag Year Range
    newest 2021 to 2024
    recent 2018 to 2020
    mid 2015 to 2017
    early 2011 to 2014
    oldest 2005 to 2010

    おまけ

    プロンプトに「comic」を入れて生成すると、漫画っぽい画像が生成できます!画像生成AIあるあるの「文字風の線」も生成されます。興味のある方は試してみてください。

    画像
    上目遣いかわいい!
    画像
    ちょっとこわいけどかわいい

    生成した画像を加工すれば、漫画にも使えますね。

    アイビスペイントを使った漫画の描き方については、
    デジタルハリウッド大学大学院「クリエイティブAIラボ」が技術書典に同人誌としてまとめいらっしゃいますのでこちらもご参考まで。


    メタバースで(ともいき)漫画を描く:DHGS_CAIL デジハリ大学院「クリエイティブAIラボ」
    「メタバースで(ともいき)漫画を描く」 著者: しらいはかせ・Kotone・Itsuki・Lucas・傷だらけのキューティtechbookfest.org

    漫画制作に適したモデルは?Animagine 3.1 vs Animagine 3.0 徹底比較! | AICU media @AICUai #note https://note.com/aicu/n/n393f2cebfc75


    #AI漫画 #AICU #つくる人をつくる #SD黄色本

    画像
    カワイイけど何言ってるかわからない!
  • AI の価値は「技術」にあらず?トークセッション「AIファースト時代の広告代理店のマネタイズ戦略を考える」#Web3BB

    AI の価値は「技術」にあらず?トークセッション「AIファースト時代の広告代理店のマネタイズ戦略を考える」#Web3BB

    2024年4月25日、26日に国立新美術館で開催された Web3 AIマーケティングBB(Beyond Borders)は、東京と米国シリコンバレーに法人をもつ Pivot Tokyo が主催・運営する、最先端テクノロジーとマーケティングの融合を探求するイベントです。

    Day1 のレポートはこちら

    Day2 に開催されたNVIDIA基調講演はこちら

    この記事では、Day2 の 11:00 ごろから行われたセッション、
    「AIファースト時代の広告代理店のマネタイズ戦略を考える」
    にて、AIファースト時代の広告代理店が実際にどのような試行錯誤をしているか、興味深い議論が交わされた様子をレポートしていきます。

    画像

    写真右から
    [モデレーター]  小山 隼司 (社長執行役員CEO, アドイノベーション株式会社)
    山田 翔(代表取締役, 株式会社アドウェイズ)
    柴山 大(Hakuhodo DY ONE / 博報堂テクノロジーズ執行役員)
    山内 大輔(代表取締役, 株式会社 ID Cruise)

    トークセッションは、以下のトピックに沿って進みました。

    画像

    トピック1: 正直、AI 活用フルで出来てますか?

    小山(アドイノベーション) – では、「正直、AI 活用フルで出来てますか?」のテーマから始めましょうか。
    私の会社ではまだまだ通常業務での AI フル活用はできていないと感じるのですが、お三方はいかがでしょうか?

    柴山(博報堂) – 博報堂では業務にかなり AI を組み込んでいます。
    検索連動型広告ってすごく量が多いじゃないですか。ビッグワードやミドルワードに対してそれぞれ広告を入れる。AI なしには運用できないですね。
    やっぱり人間が書いた方が情緒に溢れてるんですけど、クリック数が多いキャッチコピーはAIの方が良く知っているんです。
    カスタマージャーニーやペルソナも AI が企画しています。社内では年間 2000 ~ 3000 ペルソナが生み出されています。欠かせない存在ですね。

    小山 – では、業務効率もかなり上がっているんですね?

    柴山 – そうですね。暇になるわけではありませんが、ペルソナを作る際に、資料をみながら考える時間がかなり減りました。

    小山 – ありがとうございます。山田さん(アドウェイズ)はメディア事業も行われていますが、その点いかがですか?

    山田(アドウェイズ)– まだ横断した組織を作れておらず、AI のフル活用はできていないですね。
    それぞれの部署で AI は使用していて、ぺルソナ作りやブランディングには使用しています。業務の効率化、標準化は進みましたが、AI によって新たな価値が生まれるところまでには至っていません。現在は各部門の AI が得意な人を集めて、中央集権的に仕組みを作ろうとしています。

    小山 – ありがとうございます。山内さん(ID Cruise)は AI 開発を行っているので、やはり業務でも AI を活用されているんですか?

    山内(ID Cruise)– そうですね、コードを書く作業は ChatGPT を活用しています。エンジニアの業務削減にはなっていますが、活用できるかどうかはアイデア次第ですね。

    トピック2 : AI 時代の広告代理店の価値

    小山 – これから AI に強い代理店が必要になっていったり、効率化により1人で代理店が経営できる世界になるかもしれません。またデータの質も重視されるようになると思います。数年後まで見た時、代理店は何を求められるのでしょうか?

    山田 – 運用型広告はAIにとってかわられ、販売代理店などはしんどくなるのではないかと感じています。
    顧客のマーケットをどれだけ広げられるかが伸びるかどうかの分岐点なので、そこにどれだけ AI を活用できるかが勝負です。従来の広告代理店の、人数に頼った運営をできるだけ早く脱却しなくてはいけません。

    小山 – なるほど。柴山さんはどうですか?

    柴山 – AI はマーケターというよりオペレーターですよね。代理店の価値はマーケターを増やすことだと考えています。
    マーケターの教育は人間がやらなければいけないことで、大きなコストがかかる。その質を担保するのが代理店の役割になると思います。
    また、新しいメディアを横断的に運用、情報収集することは代理店の仕事ですね。
    これからの AI は集合知が加速するだろうことに注目が必要です。

    小山 – 難しいところですよね。データが少ない代理店はゲームや EC など専門分野に特化するしかなくなるとは思いつつ、クライアントの要望を見極めることも重要ですね。
    山内さんは開発者として問い合わせが多く来ると思いますが、どういった要望が多いのですか?

    山内 – そうですね、広告運用だけでなく、会社やクライアントを巻き込み売り上げを上げるための商流などをふまえて、売り上げ向上の手伝いを求められるようになりましたね。

    トピック3 : 広告主側のメリット、ニーズ

    小山 – 最近は「生成 AI で楽ができるのは代理店だけ」という意見を聞くことがあり、クライアントにが生成 AI でどのような利益を得られるのか説明が必要なシーンがあります。皆さんは業務に AI を使用することを顧客にどう説明していますか。

    山田 – 私は、AI がどこでどう使われているかは説明する必要がないと思っています。商品自体の価値が大切かと。
    ただ、「このデータは AI が分析しました」のように説得力をアピールすれば、気難しいお客さんの説得材料として有用ですね。

    トピック4 : AI 活性化による脅威

    小山 – Google が生成 AI を活用、制作しているなど、生成 AI によって代理店の仕事が脅かされる懸念があるのではないかと思います。皆さんは AI 活性化による脅威をどう捉えていますか?

    柴山 – ほとんどないんじゃないですかね。Google は広告のことを良く知っていますが、OpenAI は「いい広告」のデータを入手できない。
    僕は彼らのことをパートナーとして考えています。技術や自社の情報を組み合わせて新たな機会をつくれそうです。

    小山 – ありがとうございます。山田さんいかがですか?

    山田 – 広告プラットフォームはセルサイドなので、どう売るかという視点で AI を作ってきます。でも代理店はバイサイドなので、プラットフォームを横断してどう買うかという目線でものをつくります。なので全く違うものであることは生成 AI が活性化してもかわらないと思います。
    しかし少し前まで AI は使わなくても良かったのですが、今はもう「やらなくてはいけないもの」になりました。波に乗らないことが大きな脅威ですね。

    トピック5 : AI でのマネタイズ

    小山 – 自分は AI 単体でのマネタイズは難しいと思っていて、価値提供の仕方が大切だと思っています。皆様事例や考え方はありますか?

    柴山 – おっしゃる通り、 AI ツール単体で売るのは超劣等種なんですよね。OpenAI のおかげで安く全員キャッチアップできるので、ツール紹介は代理店としてはありえないです。
    しかし、ツールを使ったうえでどのような判断をするか、何を選択するか、AB テストのようなものはマネタイズできると思います。

    小山 – ありがとうございます。山内さんは開発したものを売っている立場からみていかがですか?

    山内 – AIツールの需要はありますね。また、依頼時に手数料の一部でバナーを制作するといった悪い慣習をなくしたいです。まだ課題が残りますね。

    小山 – ありがとうございます。アドウェイズさんは今後のマネタイズ戦略などありますか?

    山田 – 先ほども触れましたが、現在代理店用の内部システムを開発中で、プラットフォームの提供などを進めたいです。中身の一部が AI になるという形で価値を提供したいですね。

    小山 – ありがとうございました。まだまだお話したいところではありますが、時間が来てしまったので、今回のセッションは終了させていただきます。ありがとうございました。

    (拍手)

    取材後の AICU media の感想

    皆さんの意見が、「AI 技術自体ではなく、それをどう活用するかが価値で、マネタイズすべき箇所」というところで一致していたことが印象深かったです。すごい AI 技術を「すごい」で終わりにせず、セルサイド、バイサイドでみて、何に使用すると価値が生じるかを考え、売ることが AI 時代のマネタイズだと感じました。

    引き続き2日目の講演のレポートを行っていきます!

    Day1 のレポートはこちら

    Day2 に開催されたNVIDIA基調講演はこちら

  • NVIDIA井崎氏の基調講演 – ロレアルでのAIポリシーに見る生成AI時代のブランディング #Web3BB

    NVIDIA井崎氏の基調講演 – ロレアルでのAIポリシーに見る生成AI時代のブランディング #Web3BB

    2024年4月25日、26日に行われたAIマーケティングBB(Beyond Borders)は、東京と米国シリコンバレーに法人をもつ Pivot Tokyo が主催・運営する、最先端テクノロジーとマーケティングの融合を探求するイベントです。

    この記事では、Day2の最初の講演、NVIDIAエンタープライズ事業本部 事業本部長の井崎 武士さんによるキーノート
    「マーケティングカンファレンス初登壇!AI時代のイノベーションリーダーNVIDIA が考える リテール/マーケティングの未来: 生成AIがもたらす変革とは?」
    についてレポートしていきます。

    Day1のレポート、イベントの詳細はこちらです。

    【キーノート】
    AI時代のイノベーションリーダーNVIDIA が考えるリテール/マーケティングの未来: 生成AIがもたらす変革とは?

    NVIDIA の強み – 潤沢な GPU 資源

    講演は、NVIDIA が現在進めているプロジェクトや業績から始まりました。

    井崎 武士 氏

    半導体事業で広く知られる NVIDIA ですが、その管理している GPU の質と量を生かし、近年では AI に関わる事業も数多く運営しています。

    例を挙げると、グラフィックスの領域で使用される流体シミュレーションや、学術面での推論、学習、またコンピューティングプラットフォームの提供が主になっています。

    大規模言語モデルの推論やファインチューニング、最適化エンジン、マイクロサーバーの開発等にも着手しており、NVIDIA が本格的に生成 AI 事業を進めていることがわかります。

    また、他の企業と連携した生成 AI 事業も数多く紹介されました。
    Adobe と共同開発した Adobe Firefly は Adobe の新技術である画像生成 AI で、これからのクリエイティブ領域に大きく期待されています。

    画像

    またパートナー企業が進めているプロジェクトの例として、手術、看護の面で活躍する医療補助ロボットや、自動運転技術開発のための映像生成と学習、音楽、音声生成なども挙げられました。

    画像
    遠隔でカウンセリングを行う看護AIのイメージ動画

    全てが AI 化されるのが最善の未来なのか?化粧品会社 L’Oréal のポリシー

    講演は NVIDIA 社から見た生成 AI の可能性と、私たちが何をするべきかという話題に移ります。

    まず、生成 AI の業界に大きな影響を与えた ChatGPT について、NVIDIA 井崎さんはこう述べました。
    「 iPhone はデジタル機器の民主化を果たしました。今、ChatGPT は AIの民主化を叶えようとしています」

    生成的 AI は、商品開発、マーケティング分析、広告、顧客サービスなどすべての業務に影響を与えています。

    参考:NVIDIA Picasso AI Foundry

    画像

    参考:NVIDIA Edify が 3D 生成 AI、ビジュアル コンテンツ プロバイダー向けの新しいイメージ コントロールを利用可能に(2024/4/3)

    画像

    大手企業でも様々な分野での生成 AI 導入は進んでおり、Amazon が対話型 AI アシスタントを導入したり、スポーツウェアブランドでの例といった大規模な例も挙げられました。

    画像
    スポーツウェアでの例

    画像
    流暢なアバターとの対話によるショッピング

    しかし AI を導入するにあたって企業が大切にしなければならないのはポリシーや倫理観であり、すべてを AI 化することが必ずしも良いわけではない、と井崎さんは結論付けます。

    L’Oréal でのAIポリシーに見る生成AI時代のブランディング

    例えば化粧品会社の L’Oréal では、AI の使用に関するガイドラインを設定し、積極的にAIエージェントなどを構築、宣材映像を生成しています。
    しかし広告の主体となるモデルには画像生成 AI を使用しないというポリシーを持っており、実際のモデルの写真を使用しています。

    「人の美しさはアバターでは表せない」というプロとしての意識が、L’Oréalのブランドを保っています。

    画像

    しかし生成 AI を使用すべき箇所の線引きは明確に行っており、化粧をした顔のシミュレーションやアイデア出しには画像生成 AI を使用しています。

    画像
    化粧のシミュレーションを画像生成で行うデモ

    関連:GTC2024での配信動画

    このようにポリシーやガイドラインのもと、効果的に生成 AI を使用することが生成 AI 時代の企業に求められています。

    以上、AI Marketing BB 2日目キーノート「NVIDIA が考えるリテール / マーケティングの未来」でした。

    引き続き2日目の講演のレポートを行っていきます!

    Day1はこちら

  • AI Marketing BB東京 Day1レポート – CivitaiのエクゼクティブプロデューサーMatty Shimuraの基調講演 #Web3BB

    AI Marketing BB東京 Day1レポート – CivitaiのエクゼクティブプロデューサーMatty Shimuraの基調講演 #Web3BB

    AI Marketing BB とは

    AIマーケティングBB(Beyond Borders)は、東京と米国シリコンバレーに法人をもつ Pivot Tokyo が主催・運営する、最先端テクノロジーとマーケティングの融合を探求するイベントです。

    また、AIがマーケティングにもたらす革新を追求し、参加者がその変革に積極的に関与し、ビジネスに活かすための知識やアイデアを共有する場ともなっています。
    イベント公式サイト→https://web3bb2024.pivot-tokyo.com/

    このサミットは、年間3回の定期的な開催を通じて、国内外の最新トレンドや事例を紹介し、参加者が自社の事業に生かす機会を提供しています。2024年4月の春開催では、AIとマーケティングに焦点を当てたセミナーやワークショップ型のゼミ講座が予定されています。

    さらに、リスキリングや新年度に伴う新しいチームの研修、新しいパートナーとの出会いをサポートする場でもあります。

    参加者が自らの成長とビジネスの展望を広げるためのプラットフォームとして位置づけられています。BBサミットは、AIとマーケティングの未来を共に創造するために、皆さんの積極的な参加を呼びかけています。

    カンファレンス責任者からのメッセージ

    河野 友香 Yuka Kawano AI&Marketing BB ディレクター

    これまでエージェンシー、事業主側と双方でマーケティングに数十年携わってきました。日本企業と外資系企業を経験しましたが、目の前のKPIに追われる日々を送っていました。日本のマーケティングの現状と未来を考えた時、危機感が芽生えました。務めていた会社を辞め、何か業界変革に携わることがしたいと独立し、BBチームへ参画しました。マーケティングに特化したカンファレンスを立ち上げ、今の日本のマーケティングを根本から変えたい。実践の場にいたからこそわかる課題感などを反映して実践的なプログラムを提供したい。そう思って作っています。「このままで良いのだろうか?」と少しでも感じている方にぜひご参加いただきたいです。
    皆さんも、私と一緒に日本のマーケティングを変えていきませんか?

    河野 友香さん 開催にあたって-カンファレンス責任者からのメッセージ 
    https://web3bb2024.pivot-tokyo.com/

    参加予定企業(一部紹介)

    株式会社セブン&アイ・ホールディングス/野村アセットマネジメント株式会社/ルイ・ヴィトン ジャパン株式会社/日本生命保険相互会社/パナソニック コネクト株式会社/味の素株式会社/株式会社ベネッセホールディングス/ヤンマーホールディングス株式会社/株式会社ファンケル/株式会社リクルート/カシオ計算機株式会社/良品計画/J.フロント リテイリング株式会社/エスエス製薬株式会社/株式会社フェリシモ/株式会社コーセー/株式会社オートバックスセブン/株式会社そごう・西武/(株)三陽商会/SBCマーケティング株式会社/トヨタ自動車/パーソルキャリア株式会社/株式会社ベルーナ/資生堂インタラクティブビューティー株式会社/雪印メグミルク株式会社/株式会社ジャパネットメディアエージェンシー/日本空港ビルデング/日本アイ・ビー・エム/株式会社マネーフォワード/ソニーマーケティング株式会社/森永乳業株式会社/マネーフォワード/ビザワールドワイドジャパン/エヌビディア合同会社/三井住友海上火災保険株式会社/LVMH モエ ヘネシー・ルイ ヴィトン・ジャパン合同会社/エン・ジャパン株式会社/ヤマハ株式会社/日本生命保険相互会社/積水化学工業株式会社/株式会社ポーラ/TSI Holdings/ソフトバンク株式会社/富士通株式会社/TSI Holdings/株式会社ニトリホールディングス/トヨタ自動車株式会社/武田薬品工業株式会社/コスモ石油マーケティング株式会社/株式会社講談社 (52社)

    Day1 プログラム

    13:30~13:40 オープニングリマークス サマリー

    13:40~14:10 [M-1] オープニングキーノート:世界アクセストップ10 Civitaiのプロデューサー初来日!AIは次世代のクリエイティブをどう変革するのか? サマリー

    14:10~14:40

    • [M-2]【公式】オープニングキーノート:Generative AIの世界では何が起こっているのか。産業実装における現在と未来。 サマリー
    • [AI-1] カスタマーサービス・オートメーションの未来:生成AI活用によるCX向上の挑戦 サマリー
    • [WS-1] AIガバナンスと倫理的視点のチェックリスト サマリー

    14:50~15:20

    • [M-3] 多様性の時代における、経済学を使った顧客理解とプライシング サマリー
    • [AI-2]【公式】ディスカッション:AIとImmersiveテクノロジーの融合による新しいコミュニケーションデザインの可能性 サマリー
    • [WS-2] ゼミ講座概論 いまさら聞けないAI基礎知識 「AI進化の最前線:人工知能(AI)とは?従来型AIから生成AI、AGIまで」Powered by 日本ディープラーニング協会 サマリー

    15:20~15:50

    • [M-4] CMOが考えるAI時代のマーケティング戦略の成功の鍵とは? サマリー
    • [AI-3] リテールAI研究会プレゼンツ:日本のリテーラーの課題とAI革命への道筋 サマリー
    • [WS-3] スペシャルゼミ講座:AIトレンド総復習 グラフと動画で一気に理解する生成AI サマリー

    16:00~16:30

    16:30-17:00

    • [M-6] 「AIとメディアの未来:ブランドセーフティな生成AIコンテンツの可能性と課題」 サマリー
    • [AI-5]生成AI旋風によるゲームチェンジ。企業経営の常識はどう変わるか サマリー
    • [WS- 5] AIデジタル生産性協会 プレゼンツ AI教育コンサルタントが活用法をレクチャー!マーケターが業務で使えるGPTs&ツール事例紹介 サマリー

    17:00 – 17:30

    • [M-7] [クロージングキーノート] 味の素のマーケティング改革における生成AIの活用 サマリー

    18:00 – 20:00【公式ネットワーキングパーティー】

    セッション抜粋紹介

    世界アクセストップ10 Civitaiのプロデューサー初来日!AIは次世代のクリエイティブをどう変革するのか?

    このセッションでは、クリエイティブ産業におけるAIの変革的役割を探ります。AIは人間の創造性を補完し、新たな可能性のためのコラボレーションを促進することができるのか?著作権や偏見といった倫理的な問題にも触れ、責任あるAIの利用を提唱します。AIと人間の創造性が相乗効果を発揮し、イノベーションを生み出す未来を描くには?
    [スピーカー] Matty Shimura (Executive Producer of AI Film and TV, Civitai)
    [M] 三浦 謙太郎(創業者兼 CEO, DouZen, Inc)

    Civitaiのプロデューサー初来日です!

    画像

    Shimura氏は日系のお名前ですが、日本語はわからないそうで、コンピュータ生成による不思議な感覚の音声合成が披露されました。

    最後の部分が非常に印象的でしたので紹介します。
    「どのツールが 長期的に最適な ソリューションになるかは誰 にもわからないと。ツールに関係なくインパクトを 生み出せる ことが今後 ますます 重要になる だろう。その上で、AI が人間の創造性を代替するので はなく、どのように普及できるかを考えてみて欲しい。映画・テレビ・マーケティング キャンペーンなどでは使用されるテクノロジーにかかわらず、その背後には常に優れたアイデアが必要だ。アーティストとなくして芸術 は なく 、人々が共感するこメッセージがなければ、聴衆はいないでしょう。」

    ・米国シリコンバレーから世界アクセストップ10にランクインしている
    ・ギルドと組合を中心としたマーケティングメディア。
    ・特に著作権に関しては。
    ・ギーク・エコノミーではなく、こういった新しいタイプのキャリアで人々が給料を得られているか?
    ・多くのA.I.企業は、雇用がどのように変わるかについて話していますが、実際の解決策を提示していない。
    ・コミュニティ・イニシアチブ、インキュベーター・プログラム、アーティスト・イン・レジデンス・プログラムを通じて、Civitaiは、これらのツールを実際に使って、仕事の流れに適用し、価値を見出すことができるように、人々に資金を提供する方法を証明しようとしている
    ・やろうとしているのは、A Iリソース、ワークフロー、教育、アート処理を作成できるプラットフォームを提供することで、クリエイティブなプロセスを民主化することです。
    ・将来的には、このような難しいスキルの多くはそれほど重要ではなくなり、最高のアイデアを持つ人が最高のアウトプットを出せるようになると思います。
    ・テレビ番組を見る方法や、映画館で映画を見る方法、スマホでソーシャルメディアコンテンツを見る方法など、参入障壁を下げると同時に誰でも素晴らしいストーリーを作れるようになったら、どうなるんでしょうね。
    ・しかし、それはまた、次のレベルを解き放つことができるよう、トップの人たちを後押しするのです。つまり、それがあなたのアイデアであり、ストーリーテリングなのです。

    三浦氏:Matty Shimura氏はアーティスト出身だそうですが、クリエイティブなコミュニティに入ってくる若い人たちや、エグゼクティブの人たちに対して、どんなアドバイスがありますか。

    ・若い人たち、特に今学校で伝統的な映画制作のプロセスを学んでいるクリエイターたちにとっては。授業で学んでいる道具が、毎日、リリースから時代遅れにされているというのは、チャレンジだと思います。そして、紙にペンで書くという技術から、創作という行為、そしてそのプロセスを人間らしくすることができるように、それを再構築しなければならない方法があると思います。そうすれば、より多くの採用につながると思います。

    ・知財保有者であれ、クリエイティブ・エージェンシーであれ、プロダクションのワークフローにA.I.を統合しようと考えている企業のための管理について教えてください。たとえプロダクションで使うつもりがないとしても、投資を始める時期が来ていると思います。ですから、特に変化に対してオープンマインドでいられることだと思います。それが私のおすすめです。

    そして最後にもう一つ、A rvrnft暗号のバブルがありました。しかし、私たちがこの半年ですでに目にした価値は、それがここにとどまり、さらに良くなっていることを示していると思います。ですから、今、統合できることは、私のプレゼンテーションにおいて、将来的に多くの見返りをもたらすでしょう。

    APAC地域だけでなく、欧米全土にローカライズすることで、言葉や文化の障壁のためにリーチできなかった、まったく新しいオーディエンスや市場層にリーチすることができます。

    AICU mediaからの質問:有料プランを導入でどのような判断があったのでしょうか。

    以前は無料の世代がありましたが、今は独自のバズエコノミーがあります。モデルやLoRAなど、すべてのリソースの世代を作るために使えるクレジットは、誰でもこれらのツールにアクセスできるように、無料で提供しています。そして将来的には、みんなが集まり、仕事を共有し、コミュニケーションやコミュニティを持てるような「タウンスクエア」になろうとしています。モデルやツールは無料で利用できるのですね。サブスクリプションについて、人々は何にお金を払っているのでしょうか?これらの画像を作るのに必要な計算能力の生成時間や、電気代などです。

    Day2のレポートに続きます!

  • Stable Diffusion 3 を Google Apps Scriptで利用する

    Stable Diffusion 3 を Google Apps Scriptで利用する

    つくる人をつくる!AICU mediaのしらいはかせです

    先日、APIが先行して公開された Stable Diffusion 3ですが、色々試していたらわりと簡単にコマンドラインでも、Google Apps Scriptでも Stable Diffusion 3のパワフルな画像生成機能を利用できることがわかったので紹介いたします。
    ちょっとした画像を生成するアプリを開発するのに便利です。

    Stability AI の API キーの入手

    まずは Stability AI のプラットフォームでAPIキーを入手しましょう。
    https://platform.stability.ai/

    右上のアカウントアイコンから「API Keys」を確認できます。
    作成したらクリップボードにコピーします。

    0.0065USD=約1円ぐらいです。

    curlコマンドで使う Stable Diffusion 3

    Windowsで標準的にインストールされているコマンドラインツール「curl」を使ってAPIを叩くことができます。まずはこれを使って試してみましょう。

    curl -f -sS "https://api.stability.ai/v2beta/stable-image/generate/sd3" -H "authorization: Bearer sk-????" -H "accept: image/*" -F prompt="Lighthouse on a cliff overlooking the ocean" -F output_format="jpeg" -o "./lighthouse.jpeg"
    
    
    
    
    

    分解して解説するとこんな感じです。
    curl -f -sS “https://api.stability.ai/v2beta/stable-image/generate/sd3→SD3のAPIエンドポイントです。v2betaとあるので変更されるかも?
    -H “authorization: Bearer sk-????” -H “accept: image/*” -F
    →ベアラーのあとの sk-???? のところにAPIキーを貼り付けてください。
    prompt=”Lighthouse on a cliff overlooking the ocean” -F
    →ここがプロンプトです
    output_format=”jpeg” -o “./lighthouse.jpeg”
    →ここが出力ファイル形式です。Webp形式なんかも使えます。

    うまく行かないひとは「Windows cURLインストール」などで調べてみてください。けっこういろんな方法があるのですが、自分の環境ではこんな cURL が動いてました。

    curl — version
    curl 8.4.0 (Windows) libcurl/8.4.0 Schannel WinIDN
    Release-Date: 2023–10–11
    Protocols: dict file ftp ftps http https imap imaps pop3 pop3s smtp smtps telnet tftp
    Features: AsynchDNS HSTS HTTPS-proxy IDN IPv6 Kerberos Largefile NTLM SPNEGO SSL SSPI threadsafe Unicode UnixSockets

    “curl — version”とコマンドラインで打ち込むと表示されます

    Google Apps Script で使う Stable Diffusion 3

    これがうまく行ったら次は、Google Apps Scriptで実装します。
    Google Driveを開いて、新規→その他→Google Apps Scriptで新しいスクリプトを作ります。

    // Stable Diffusion 3 を Google Apps Scriptで利用する|AICU media @AICUai #note https://note.com/aicu/n/ne2fe8a0073b0
    
    const STABILITY_KEY = PropertiesService.getScriptProperties().getProperty("STABILITY_KEY");
    
    function saveImageToDrive() {
      var url = "https://api.stability.ai/v2beta/stable-image/generate/sd3";
      var token = "Bearer "+ STABILITY_KEY; // 本番環境ではセキュリティを考慮して保管してください
      var boundary = "-------314159265358979323846";
      var data = "--" + boundary + "\r\n" +
                 "Content-Disposition: form-data; name=\"prompt\"\r\n\r\n" +
                 "shibuya crossing, animetic, with graffiti 'AICU media'\r\n" +
                 "--" + boundary + "\r\n" +
                 "Content-Disposition: form-data; name=\"output_format\"\r\n\r\n" +
                 "png\r\n" +
                 "--" + boundary + "\r\n" +
                 "Content-Disposition: form-data; name=\"aspect_ratio\"\r\n\r\n" +
                 "16:9\r\n" +
                 "--" + boundary + "--";
    
      var options = {
        "method": "post",
        "contentType": "multipart/form-data; boundary=" + boundary,
        "headers": {
          "Authorization": token,
          "Accept": "image/*"
        },
        "payload": data,
        "muteHttpExceptions": true
      };
    
      var response = UrlFetchApp.fetch(url, options);
      
      if (response.getResponseCode() == 200) {
        var blob = response.getBlob();
        blob.setName("SD3.png");
        var file = DriveApp.createFile(blob);
        Logger.log('Image saved to Drive with ID: ' + file.getId());
      } else {
        Logger.log('Failed to fetch image: ' + response.getResponseCode());
      }
    }

    GitHubにも置いておきます。
    https://github.com/aicuai/GenAI-Steam/blob/main/SD3Text2Img.gs

    このコードは上記の cURL でのリクエストを単純に置き換えたものですが、APIキーをハードコードしたりGitHubに晒したくはないので、スクリプトプロパティに保存しています。

    const STABILITY_KEY = PropertiesService.getScriptProperties().getProperty(“STABILITY_KEY”);

    スクリプトの左側「⚙プロジェクトの設定」からスクリプトプロパティを設定することができます。

    「スクリプトプロパティを追加」ボタンを押して「STABILITY_KEY」というプロパティを追加して、値として、冒頭で取得した「sk-」から始まるAPIキーを貼り付けて「スクリプトプロパティを保存」ボタンを押してコード編集に戻りましょう。

    これでコードにAPIキーを保存しなくてすみますね!
    さて、関数「saveImageToDrive」を実行していきます。

    コードの上部にある「デバッグ」を押すと実行できますが、初回は権限設定と確認が必要です。

    こんな感じの警告が出ますが、自分のGmailの権限でGoogle Driveに画像を生成するだけなので特に害はありません。左下の「SD3(安全ではないページ)に移動」を押して進めます。

    ドライブへの権限を設定したらもう一度デバッグを押して実行します。

    数秒で実行ログに「Image saved to Drive with ID: 1xxxxxx」と表示されたら成功です。Google Driveの「最近使用したアイテム」を見てみてください。

    「SD3.png」が生成されています。

    実行する度に様々な画像が生成されます。
    なお、このスクリプトではプロンプトとアスペクト比を12~17行で設定しています。

    “shibuya crossing, animetic, with graffiti ‘AICU media’\r\n”
    →ここがプロンプトです。ちゃんと文字「AICU media」が描けています。
    “Content-Disposition: form-data; name=”aspect_ratio”\r\n\r\n” + “16:9\r\n”
    →縦横比「16:9」を指定しています。1:1の場合は1024×1024、16:9にした場合は 1344×768 の画像が生成されました。

    APIマニュアルはこちら

    https://platform.stability.ai/docs/api-reference#tag/Generate

    せっかくなので翻訳していきます。

    prompt プロンプト:必須

    文字列 [ 1 … 10000 ] 文字
    出力画像に表示したい内容。要素、色、被写体を明確に定義した、強く説明的なプロンプトがより良い結果を導きます。

    aspect_ratio アスペクト比:文字列

    デフ ォ ル ト : 1:1
    列挙 : 16:9 1:1 21:9 2:3 3:2 4:5 5:4 9:16 9:21
    生成画像のアスペクト比を制御します。

    mode モード:文字列 (生成モード)

    デフォル ト : text-to-image
    「text-to-image」か「image-to-image」(画像パラメータ が必要かどうか)を制御します。

    text-to-image
    このモー ド では、 必須パラメータ は prompt だけです。このモードでは、生成される画像の縦横比を制御するために、aspect_ratioパラメータをオプションで使用することができます。

    image-to-imageモードでは、さらに2つのパラメータを指定する必要があります: image — ランダムノイズの代わりに、生成の開始点として使用されます。 strength — 画像が拡散プロセスに与える影響を制御するために使用されます。また他の指定できるパラメータもかわります。

    negative_prompt 
    文字列 <= 10000文字
    出力画像で見たくないものを説明するテキスト。これは高度な機能です。
    このパラメータは sd3-turbo では動作しません。

    model モデル:文字列
    デフォルト: sd3
    列挙型: sd3 sd3-turbo
    生成に使用するモデル。
    sd3 は生成あたり 6.5 クレジットを必要とします。
    sd3-turbo は1生成あたり4クレジット必要です。
    ★100クレジット=1USDです。だいたい10円ぐらいです。安っ!

    seed シード: 数値 
    [ 0 .. 4294967294 ]。
    デフォルト: 0
    生成の’ランダム性’を導くために使用される特定の値。(このパラメータを省略するか、0を渡すとランダムなシードを使用します)。

    output_format 出力形式 
    文字列
    デ フ ォル ト : png
    列挙型: jpeg png
    生成画像のコンテントタイプを指定します。WebPも使えるようです。

    Image to Image、アップスケール、そしてエディット機能、さらに「Control」と書かれた機能がドキュメントに存在します。

    Stability AI の 画像サービスには、4つのカテゴリがあります。

    生成

    最高のテキスト画像生成サービスです。これらのサービスは、Stability AIが提供する最新のStable Diffusionモデルを活用し、専門家による微調整とマイクロサービスをワークフローに組み込んでいます。その中でも、Stable Image Coreは、迅速なエンジニアリングを必要とせず、多様なスタイルで高品質の画像を得ることができるフラッグシップサービスです。

    アップスケール

    標準的で昔からあるアップスケールから、画像を4Kの傑作に変えるクリエイティブモードまで、クラス最高の画像アップスケールです。中でもCreative Upscaleは、低画質入力からフォトリアリスティックな画像を作成するためのフラッグシップの手法です。

    エディット

    マスク(生成的塗りつぶし)や文字によるインペイントを含む、最も効果的なAIベースの画像編集サービス。背景除去などの基本的なツールだけでなく、商品配置や広告用のニッチなツールも含まれています。

    コントロール(まだ未公開)

    最高の画像から画像へのサービス。プロンプト、マップ、その他のガイドが必要な場合があります。これらのサービスは、ControlNetsやStable Diffusionモデルに基づいて構築された同様の技術を活用しています。

    色んな機能が出てきて楽しみです。
    しかも1生成あたり6~10円となると気軽に使えますね。
    本記事のGoogle Apps Scriptでの活用について、 X(Twitter)@AICUai でご感想いただければ幸いです。色々開発してみたいと思います。

    AICU Inc.は Stability AI 公式パートナーです。
    様々なアプリ開発のご相談も承っております!

    https://corp.aicu.ai/ja/stability-ai

    https://corp.aicu.ai/ja/stability-ai-membership


    Originally published at https://note.com on April 23, 2024.

  • 「生成AIなんでも展示会」がすごかった!!を一気紹介 #生成AIなんでも展示会

    「生成AIなんでも展示会」がすごかった!!を一気紹介 #生成AIなんでも展示会

    2024年4月21日に開催された「生成AIなんでも展示会」での魅力的な展示内容を一気紹介。AIを使った新たな体験、グラフィック制作や、ネットワーク接続が不要なAI Tuber、独自モデル、日本語VLMの展示など、最新の個人による技術が集結したイベントの様子をお届けします。


    2024年4月21日に渋谷ABEMAタワーで開催された「生成AIなんでも展示会」、登録者限定で500人を超える予約者で実施されたこのイベントですが「会場に行きたいけどいけない!」という人も多かったものと想像します。

    「つくる人をつくる」をビジョンに活動するAICUメディアが勝手取材させていただきました。全部を扱えずにすみません。
    (ご迷惑な写真等がございましたら削除いたします X(Twitter)@AICUai までお伝え下さい)

    ★場所や分野に関係なくランダムで紹介させていただきます

    猩々 博士 @Mega_Gorilla_

    作品予告には「言語」って書いてあったけど展示されていたのは動画。

    いや、これすごいですよ、手、服、顔、髪を Segment Anything を使ってレイヤーにして描き直しをしているそうです。

    本当はプロジェクションマッピングで服を着せたかったらしいんですが、電源が足りなかったそうで…。

    新清士 @kiyoshi_shin

    生成AIとLookingGlassPortraitを組み合わせた裸眼立体視

    新さん、最近はゲーム作ってるんだそうです。

    とよふく @Yeq6X

    イラスト添削AI

    AIによる漫画生成

    すごい好きな漫画の作者に会えました

    開発工程

    AIキャラクターで使える自然な音声合成

    Nanase Watanabe @nanase_ja

    その他 AIを用いたキャラクター、アニメ、PV
    これすごかったんだけど、すごいガチなお話されている方がいて近づけなかった…(小心者)

    ローカルAIや複数LLM統合型AIキャラのデモ(めぐ&さくら)

    ここはガチなハードウェア実装とキャラクターUXが融合していて本当にすごい。

    ガチな紙コップスピーカーとアンプ。

    Ubuntu Desktopで高速に動くコンソールとデモ画面

    RTX A6000 (68万円)が剥き晒しの筐体で組まれているのかっこいい

    フロントの実装もしっかり。しかもネットワーク不要と見た。
    これで次世代カーナビ作れるじゃん・・・

    高解像度画像が入力可能な日本語LVLM

    高性能な日本語VLMを展示されておりました

    VLMについて解説した過去記事はこちら

    期間限定のデモもあります!

    眞泥魚太 @ MudddyWWater

    までぃうぉーたさん
    生成AIを用いたグラフィック制作とワークフロー

    Stable Diffusion Web UIのDynamic Prompts→Photoshop・クリスタ→Krita AI Diffusion→クリスタ・Photoshopというフローだそうです。

    #SD黄色本 もご購入いただいたそうで、ありがとうございます!

    直接取材できなかったみなさま

    混みすぎていてきちんと取材したくても難しかった方々など!

    ネットで見かけた感想

    業界の有名人も!

    みょーすけさん、シェイン・グウさん、ショーティーさん、しらいはかせ

    Stability AIのJerry Chiさんもいらっしゃいました

    主催のひとり、さるどらさん

    関係者の皆様お疲れ様でした!

    事後報告編はこちら

    https://note.com/aicu/n/n44ad7b02f175


    Originally published at https://note.com on April 21, 2024.

  • AIと作るWeb体験「Create.XYZ」 今すぐ始めるインタラクティブなサイト開発

    AIと作るWeb体験「Create.XYZ」 今すぐ始めるインタラクティブなサイト開発

    プロンプトからサイトが作れる!?話題の「Create.xyz」を使ってみた!

    さいきん話題の「Create.xyz」というサービスをご存じですか?

    Web サイト開発に関わる様々な AI 技術を提供しており、ノーコード Web 開発、Web サイトの情報の収集、ダッシュボード、LP 、サインインページの開発などがとても手軽に行える柔軟性の高いサービスとなっています。

    今回は、様々なことができる Create.xyz の中から、基本的なレビューと「プロンプトを入力するだけでWeb サイトを作る機能」を実際に試してご紹介します!

    料金プラン

    気になる使用料金ですが、2024年4月13日現在では、無料で生成、20プロジェクトまでの保存が可能です。試しに何か数個プロジェクトを作るぐらいなら無料でできてしまいます。

    プロプラン(月額19ドル)API を利用したり、ChatGPT 以外の強力なテキスト生成 AIモデルや、強力なエディター機能が利用できます。

    使っている人のお話を聞く限りでは「Web制作を生業としてらっしゃる方ならしばらくPro版で評価してみて良いかも」とのことでした。

    サイトを生成してみる

    それでは、実際にサイトを作ってみましょう。
    まず、マイページから「New Project」を選択し、新たなプロジェクトを作りましょう。

    そして「New Component」を選択します。これで準備は終了です。

    ここからの手順はとても簡単で、作って欲しいサイトの説明をテキストで入力し、生成するだけです。

    サイトを生成するウィンドウの右の欄にプロンプトを入力します。

    今回は、「 『AICU』という大きな虹色のテキストと『create people who create』という文字を表示して、カラフルな線をつけて、背景を暗くする 」というような内容をリクエストしました。

    プロンプトを入力したら、右下の青い「Generate」ボタンを押して生成を開始します。
    すると数秒でサイトが完成します!

    「Generate」やその隣の回る矢印アイコンを選択することで、何度も同じプロンプトで生成することができます。
    生成回数は無制限なので、何度も生成してみましょう!

    またウィンドウ上部のメニューで、PC、スマホの表示を切り替えることもできます。

    また、ウィンドウ上部メニューから <> を選択することで、生成されたサイトの React のコードを確認、コピペすることができます。

    プロンプトからビジュアル制作、コーディングまでできるのはとても便利ですね!

    細部を再生成する

    また文字などを選択し、「Convert to Component」を選択すると、その部分のみのプロンプトを編集し、生成しなおすことができます。

    試しに、文字を「AICU media」に変更してみます。

    スタイルをそのままに、表示されている文字を変更することができました!
    これをルールベースのフォーム入力などではなくプロンプトで行っているのがすごいですね。

    以上、プロンプトから Web サイトが製作可能な Web 開発ツール「Create.xyz」の紹介でした。

    ぜひプロジェクトの Web サイト制作や、最新技術の体験に試してみてください!

  • AUTOMATIC1111 v1.9.0リリース

    AUTOMATIC1111 v1.9.0リリース

    2024年4月13日、シンプルな UI で幅広く使われるオープンソース画像生成WebUI「AUTOMATIC1111/Stable Diffusion WebUI」の最新版v1.9.0 がリリースされました。

    主要なリリース日本語訳

    • サンプリングステップではなく、モデルのタイムステップに基づいてリファイナーを切り替えるようにした。
    • ツリービューの代わりに古いスタイルのディレクトリビューを表示するオプションを追加した。
    • コールバックの順序を変更するためのUIを追加し、拡張メタデータでコールバックの順序を指定できるようにした。
    • SDXL-Lightningモデル用のSgm統一スケジューラを整備した。
    • メインUIでのスケジューラ選択をできるようにした。
    • “open images directory “ボタンが実際のディレクトリを開くようにした。

    詳細リリース&修正 日本語訳

    • LyCORIS BOFTネットワークの推論をサポート
    • 追加ネットワークカードの説明をデフォルトでプレーンテキストに
    • 追加ネットワークのハンドルのサイズを変更
    • cmd args: と ( — unix-filenames-sanitization — filenames-max-length)
    • 余分なネットワークのパラメータを生のJSONではなくHTMLテーブルで表示するようにしました
    • LoRA/LHA/LoKrに対するDoRA(weight-decompose)のサポートを追加
    • 最終世代のプロンプト履歴を無効にするコマンド引数’ — no-prompt-history’を追加
    • 置換プレビューのプレビューを更新
    • エクステンションのアクティブなgitブランチの更新のみを取得するようにした
    • アップスケールの後処理UIをアコーディオンにした
    • URLをドラッグドロップしてインフォテキストを読み込めるようにした
    • キャッシュにdiskcacheライブラリを使用
    • エクストラタブでPNG-RGBAを使用可能に
    • safetensorsメタデータに埋め込まれたカバー画像をサポート
    • NNアップスケール使用時の割り込みを高速化
    • エクストラアップスケーラー: 出力画像の最大辺の長さを制限する入力フィールドを追加
    • Extrasタブにポストプロセッシングオプションを非表示にするオプションを追加。

    API関係リリース日本語訳

    • ResizeHandleRow — 列のスケールパラメータをオーバーライド可能に
    • script_callbacks.ui_settings_callbackをより早く呼び出すようにした。extra-options-section組み込みの拡張機能で、存在しない設定を使用した場合にuiが強制終了するのを修正。
    • zoom.jsをwebuiのコンテキスト外で使用できるようにしました。
    • metadata.iniで拡張機能名のバリアントを許可するようにした
    • UIスクリプトのリロードをオプションにし、デフォルトではオフにする。
    • txt2imgと同様に、img2img関数の最初にrequest: gr.Requestを追加。
    • utilとしてのopen_folder
    • 拡張機能のスクリプトファイルをインポートできるようにした (import scripts.<ファイル名>)

    AUTOMATIC1111ユーザー分析

    最近は、Stable Diffusion を使用している人の中で ComfyUI や Fooocus といった Web UI も広く使われてきていますが、A1111 も多くのユーザーに愛されています。

    あわせて Stability Matrix も自動アップデート対応

    原稿執筆時点の最新版 Stability Matrix v.2.10.1においても自動アップデートで対応済みでした。

    A1111の下部にこのように表示されています。

    目立ったUI変更はなさそうです。

    サンプリングステップではなく、モデルのタイムステップに基づいてリファイナーを切り替える点とSDXLのスケジューラーは画作りに微妙な影響がありそうです。
    📁ボタンによって画像保存先が開けるようになったのは嬉しいですね。

    AUTOMATIC1111 で画像生成を学ぶ、Stable Diffusion 解説書はこちら!


    Originally published at https://note.com on April 19, 2024.

  • Adobe Premiereにサードパーティモデルの生成AIが登場

    Adobe Premiereにサードパーティモデルの生成AIが登場

    Photoshop、Illustrator、Webで生成AIソリューション「Adobe Firefly」を展開している米Adobeが新たな動画編集ソリューションを公開しました。

    公式ティザー動画のナレーション全文翻訳をお送りします

    Generative AI in Premiere Pro powered by Adobe Firefly

    アドビはジェネレーティブAIの力を使って、Premiere Pro史上最も先進的で正確な編集ツールを提供します。編集者の作業方法を変える、新しいAdobe Fireflyビデオモデルを搭載した近日公開予定の機能を見てみましょう。

    ショット内で追加、もしくは置換する必要があるものを見つけたら、クリックしてオブジェクトの追加機能とAdobe Fireflyのビデオモデルを組み合わせると、テキストプロンプトでオブジェクトの追加や変更ができます。

    選択範囲を作って、プロンプトを書いて、想像できるものすべてを追加します。

    このダイヤモンドは現在開発中であるFireFlyビデオモデルによって作成されています。

    オブジェクトの追加だけでなく、オブジェクトの削除も簡単に行えます。

    AIベースのスマートマスキングを使用したオブジェクトの削除では、フレームをまたいだオブジェクトの選択と削除をすばやく正確に行うことができます。

    ここではこの邪魔なユーティリティボックスが FireFlyによって削除されます。

    不要な小道具、スタッフ、ギア、ブランドロゴなどのコピーライトで保護された要素を削除します。

    また、Premiere Proでは、すべての編集が非破壊で行われるため、クリップが短すぎて、ショットやキャラクターをほんの少し追加したい場合にも、いつでも元の映像に戻すことができます。

    ジェネレーティブな拡張は、Fireflyを使ってフレームをインテリジェントに追加します。

    女性のショットを数フレーム拡張したいとき…こんなふうにフッテージを生成して追加することができます。

    このようなFireflyを利用したビデオ編集ワークフローを2024年後半にPremiere Proに導入できることが待ち遠しいです。

    私達はコンテンツ認証情報とモデルの透明性についても取り組んでいます。メディアの作成にAIが使われているかどうかを常に知ることができます。Fireflyを活用したビデオ編集ワークフローをPremiere Proに導入するのが待ちきれません。

    そして…!Adobe と サードパーティモデル

    さらに、制作者が映像に最適なモデルを使用する選択肢を提供出来るようにするための探求を共有できることを嬉しく思います。

    これは生成拡張機能を強化する初期の例です。サードパーティの生成モデル「Pika」、このモデルがPremiere Pro内でどのように見えるのか、紹介します。

    OpenAIの初期研究中のモデル「Sora」は、シンプルなテキストプロンプトを通して、あらゆるシーンのB-Rollを生成します。

    ★「 B-Roll」とはメインショットにインターカットされる補足または代替のフッテージ。転じて動画素材をまとめた映像資料のこと。

    Runway aiのビデオモデルを使用して、新しいビデオクリップを生成し、タイムラインに簡単に追加することができます。

    タイムラインに入れて瞬時に追加するだけ。

    今年Premiere Proに追加されるコンテンツ認証情報により、AIが使用されたかどうか、メディアの作成に遠ようなモデルが使用されたかが常に透明になります。

    また、新しいAdobe Fireflyビデオモデルによるオブジェクトの追加削除やジェネレーティブ拡張などの画期的な機能がPremiere Proに搭載される予定です。

    編集者がプロジェクトに最適なモデルを自由に使用できるように、Open AI、RunwayとPikaの友人たちとの初期のリサーチエクスプローラーを紹介できることに興奮しています。Adobe Premiere ProがAIでパワーアップ!

    Originally published at https://note.com on April 16, 2024.