画像生成AI「Stable Diffusion」で画像の部分修正を行うマスクを文字列から自動で作成してくれる「txt2mask for Stable Diffusion」の導入&使い方まとめ
画像生成AI「Stable Diffusion」をウェブブラウザから簡単に操作できる「AUTOMATIC1111版Stable Diffusion web UI」用のアドオンで、画像から画像を生成する「img2img」モードで文字列に応じて自動的に画像を部分修正するためのマスクを作成してくれるのが「txt2mask for Stable Diffusion」です。このアドオンを導入することで、ブラシツールで画像を選択してマスクを作成する必要がなくなります。
画像生成AI「Stable Diffusion」をブラウザ上で簡単に操作できるウェブUIパッケージ「AUTOMATIC1111版Stable Diffusion web UI」は、超解像アルゴリズムのESRGANを使って低解像度の画像を高解像度にしながら拡大するアップコンバートの機能「Extras」が搭載されています。また、アルゴリズムに利用できるESRGANにはさまざまな種類があり、簡単に追加することも可能。そこで、実際に公開されているReal-ESRGANを導入して、手元にある画像がどれだけキレイに拡大できるか試してみました。
「Stable Diffusion Concepts Library」に独自のファインチューニングモデルを登録してみたので、まとめました。 ・Stable Diffusion v1.4 ・Diffusers v0.3.0 登録したファインチューニングモデルは、以下で参照できます。 ・ sd-concepts-library/sorami-style · Hugging Face We’re on a journey to advance and democratize artificial inte huggingfac
2022年8月に一般公開されたAI「Stable Diffusion」は、「an astronaut riding a horse(馬に乗る宇宙飛行士)」や「elon musk as dr strange(ドクターストレンジの格好をしたイーロン・マスク)」などの文字列を入力すると、それに応じた画像を自動で生成してくれます。そんなStable Diffusionを使ってムービーを作成できる「stable-diffusion-videos」が公開されたので、実際に使ってみました。
画像生成AIに自分の作品が勝手に使われたかどうかを検索できる「Have I Been Trained?」
入力した文章に沿った画像を生成してくれるAI「Stable Diffusion」は、手軽に好みの画像を生成できることから大きな注目を集めています。一方で、AIの学習時に「実在のアーティストが描いたイラスト」が使われている点について「アーティストの権利を侵害している」という意見も寄せられており、「自分の作品が学習に使われていないかな?」と心配している人も多いはず。Stable Diffusionの学習には58億枚超えの画像を収録した大規模データセット「LAION-5B」が使われているのですが、このLAION-5Bに含まれる画像を検索できるウェブアプリ「Have I Been Trained?」が公開されていたので、実際に使ってみました。