画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2587 bookmarks

Custom sorting

画像生成AI「Stable Diffusion」にたった数枚のイラストから絵柄や画風を追加学習できる「Dream Booth」が簡単に使える「Dreambooth Gui」レビュー

画像生成AI「Stable Diffusion」はあらかじめ学習したデータセットを基にして、プロンプトあるいは呪文と呼ばれる入力文字列に沿った画像を自動で生成します。そのStable DiffusionのAIモデルに画像を追加で学習させる「Dream Booth」という手法があるのですが、コマンド入力による操作が必要で、演算処理に何十GBものVRAMを必要としました。しかし、Dream BoothをGUIで、しかもNVIDIA製グラボであれば10GB程度の環境でも使える「Dreambooth Gui」がリリースされたので、実際に使ってみました。

·gigazine.net·Nov 3, 2022

画像生成AI「Stable Diffusion」にたった数枚のイラストから絵柄や画風を追加学習できる「Dream Booth」が簡単に使える「Dreambooth Gui」レビュー

「画像が他の画像へ変化するまでの過程」を画像生成AI「Stable Diffusion」で生成できるスクリプト「Interpolate」の導入手順＆使い方まとめ

画像生成AI「Stable Diffusion」には参考画像を指定して構図や雰囲気の似た画像を生成する「img2img」と呼ばれる機能が備わっています。そんなimg2imgを活用して「始まりの画像」と「終わりの画像」を指定するだけで両者の中間画像を生成できるスクリプト「Interpolate」がStable Diffusionの多機能UI「Stable Diffusion web UI(AUTOMATIC1111版)」向けに公開されていたので、実際に導入する方法や使い方をまとめてみました。

·gigazine.net·Nov 3, 2022

「画像が他の画像へ変化するまでの過程」を画像生成AI「Stable Diffusion」で生成できるスクリプト「Interpolate」の導入手順＆使い方まとめ

Google、AIで解像度が高い動画生成 1000言語の翻訳も

【シリコンバレー=奥平和行】米グーグルは2日、人工知能（AI）の開発や活用に関する説明会を開いた。文章をもとに解像度が高い動画を作成できる技術を披露し、1000言語に対応する翻訳システムを開発すると明らかにした。AIをめぐる大手テクノロジー企業やスタートアップ企業による競争が激しくなっている。「AI@」と題した研究部門が主催するイベントを米ニューヨーク市で開き、一部をウェブ中継した。スンダー・

·nikkei.com·Nov 3, 2022

Google、AIで解像度が高い動画生成 1000言語の翻訳も

AIを用いて制作された絵画や彫刻作品の美術展がニューヨークのギャラリーで開かれる

近年は高精度な画像生成AIが発達したことにより、AIが描いた絵が美術品評会で1位を取ってしまい物議を醸しているほか、AI作品を取り巻く著作権の問題も盛んに議論されています。そんな中、アメリカ・ニューヨーク市のBitforms galleryが、AIを使って制作された絵画や彫刻作品を集めた「Artificial Imagination」という美術展を、2022年10月26日～12月29日の日程で開催しています。

·gigazine.net·Nov 2, 2022

AIを用いて制作された絵画や彫刻作品の美術展がニューヨークのギャラリーで開かれる

画像生成AI「Stable Diffusion」AUTOMATIC1111版でプロンプト・呪文からアニメーションを自動生成できる拡張機能「Deforum」

画像生成AI「Stable Diffusion」はプロンプトあるいは呪文と呼ばれる入力した文章から画像を自動で生成することができます。このStable Diffusionで生成した画像をフレームにしたアニメーションを生成できる「Deforum」を、ウェブUIの決定版といえるAUTOMATIC1111版Stable Diffusion web UIの拡張機能で追加できるようになったので、実際にアニメーションを生成してみました。

·gigazine.net·Nov 2, 2022

画像生成AI「Stable Diffusion」AUTOMATIC1111版でプロンプト・呪文からアニメーションを自動生成できる拡張機能「Deforum」

画像生成AIで画風や絵柄を再現できる「Dream Booth」で実際にAIモデルにされた著名イラストレーターとAIモデルの作成者自身にインタビューした貴重な記録

Stable DiffusionやDALL・E2のような画像生成AIは、ニューラルネットワークの学習のために大規模な画像データセットを使っています。しかし、こうしたデータセットに含まれる画像は著作権の問題をクリアしていないケースが多く、問題視する声もあがっています。そんな中、自分のイラストがAIモデルの追加学習に勝手に使われたというイラストレーターと、そのモデルの追加学習を行った本人へのインタビューが公開されています。

·gigazine.net·Nov 2, 2022

画像生成AI「Stable Diffusion」AUTOMATIC1111版でイラストの画風・絵柄を学習＆適用できる「Aesthetic Gradients」使い方まとめ

画像生成AI「Stable Diffusion」をブラウザ上で簡単に使えるウェブUIの中でも最も精力的に開発が行われ、もはやStable DiffusionのGUIとして決定版ともいえる「AUTOMATIC1111版Stable Diffusion webUI」に、AIの画像生成に特定の方向付けができる「Aesthetic Gradients」機能が追加されたので、実際に使ってみました。

·gigazine.net·Nov 1, 2022

画像生成AI「Stable Diffusion」AUTOMATIC1111版でイラストの画風・絵柄を学習＆適用できる「Aesthetic Gradients」使い方まとめ

テキストで命令するだけで画像や動画を自動で加工してくれる「Text2LIVE」

画像や動画のオブジェクトを違う色にしたり、特殊な効果を付けたりといった加工をする場合、通常は画像・動画編集ソフトを用いてオブジェクトを指定したり、加工するエフェクトをオブジェクトに合わせて調整したりと、面倒な操作が必要です。そのような画像や動画の加工を、機械学習を用いて「テキストで指定するだけ」で行うことができる「Text2LIVE」がGitHubで公開されています。

·gigazine.net·Oct 31, 2022

テキストで命令するだけで画像や動画を自動で加工してくれる「Text2LIVE」

画像に含まれる不要物を違和感なく完全削除できる無料ツール「Lama Cleaner」のインストール手順＆使い方まとめ

写真に写り込んだ不要な被写体や、画像の中に含まれる邪魔な文字など、画像の一部を消したい状況は多く発生します。画像の中の不要な部分をキレイに削除できる無料ツール「Lama Cleaner」を見つけたので、PCへの導入方法や使い方をまとめてみました。

·gigazine.net·Oct 31, 2022

画像に含まれる不要物を違和感なく完全削除できる無料ツール「Lama Cleaner」のインストール手順＆使い方まとめ

AIイラスト専用投稿サイト「chichi-pui」が登場閲覧無料、会員登録でプロンプト開示運営は個人

AIイラスト専用の投稿サイト「chichi-pui」（ちちぷい）が10月30日にリリースされた。運営者は個人で、Twitterアカウント「ちちぷい / AIイラストの専用投稿サイト」（＠chi2pui）を名乗っている。

·itmedia.co.jp·Oct 31, 2022

AIイラスト専用投稿サイト「chichi-pui」が登場閲覧無料、会員登録でプロンプト開示運営は個人

【AIイラスト】1万枚生成して分かった「できる事」と「できない事」【絵師失業？】 | しぐにゃもブログ

できる事は「40～80点のイラストの量産」と「アイコンイラスト制作」と「キャラ作画用のフォトバッシュの素材」と「自然系の背景」の制作。できない事は「キャラ似せ」と「細部」の描画。また0からテーマやメッセージ性のある評価される絵は作れません。

·signyamo.blog·Oct 30, 2022

【AIイラスト】1万枚生成して分かった「できる事」と「できない事」【絵師失業？】 | しぐにゃもブログ

声だけで「カメラONのウェブ会議」に参加できる新機能--話し姿をAIが自動生成

MacやWindows向けバーチャルカメラアプリ「xpression camera」を提供するEmbodyMeは、声だけで「カメラON」のウェブ会議に参加できる新機能「xpression camera Voice2Face」をリリースした。家事や子供の面倒を見ながらビデオチャットが可能になる

·japan.cnet.com·Oct 29, 2022

声だけで「カメラONのウェブ会議」に参加できる新機能--話し姿をAIが自動生成

画像生成AI「Stable Diffusion」のAUTOMATIC1111版がPhotoshopとKritaで使えるプラグイン「defuser」

2022年8月にオープンソースで一般公開された画像生成AI「Stable Diffusion」は通常コマンドラインで入力や制御を行いますが、初心者でも簡単に操作できるStable Diffusion向けGUIが数多く登場しています。その中でもブラウザから使えるウェブUIであるAUTOMATIC1111版Stable Diffusion web UIは特に開発が活発で精力的に更新されており、もはや画像生成AI向けGUIの決定版ともいえる存在です。そのAUTOMATIC1111版Stable Diffusion web UIをAdobe PhotoshopやKritaから使えるようになるプラグイン「defuser」が公開されています。

·gigazine.net·Oct 28, 2022

画像生成AI「Stable Diffusion」のAUTOMATIC1111版がPhotoshopとKritaで使えるプラグイン「defuser」

1枚の画像をテキストだけで編集できるAIの「Imagic」がすごすぎる

テキストプロンプトで画像を編集できるAI技術がよく話題になっていますが、それらは編集タイプが限定されていたり、複数の画像の入力が必要だったりするものがほとんどです。しかし、2022年10月17日にプレプリントサーバーのarXivで発表された「Imagic」は、画像の修正箇所を手動で指示したり別の画像を入力したりしなくても、1枚の画像とテキストプロンプトだけで複雑な画像の編集が可能とのことで、論文に掲載されている画像を見るだけでもそのすさまじさを実感することができます。

·gigazine.net·Oct 28, 2022

1枚の画像をテキストだけで編集できるAIの「Imagic」がすごすぎる

画像生成AI「Stable Diffusion」をブラウザから簡単に使える＆ネガティブプロンプトの設定も可能な「Mage」

高精度な画像生成AI「Stable Diffusion」をブラウザから簡単に使うことができるウェブサービス「Mage」が登場しました。Mageはブラウザから直接アクセスして無料でStable Diffusionを使えるだけでなく、生成される画像に含んで欲しくない要素を指定するネガティブプロンプトの設定もできるほか、成人向け描写を規制するセーフティーフィルターも解除されているとのことで、実際に使い勝手を確かめてみました。

·gigazine.net·Oct 28, 2022

画像生成AI「Stable Diffusion」をブラウザから簡単に使える＆ネガティブプロンプトの設定も可能な「Mage」

深層学習が持つ「生成」の力とは

深層学習はものづくりやデザインの分野でも活用が始まっています。物体を認識するだけではなくて、物をつくり出す力すらも、深層学習が持ち始めているわけです。

·business.nikkei.com·Oct 26, 2022

深層学習が持つ「生成」の力とは

画像生成AI「DALL・E」を開発する「OpenAI」と写真素材・ストックフォト最大手の1つ「Shutterstock」が提携し今後数か月以内に画像生成機能をユーザーに提供＆学習元素材の作者に報奨金を支払う仕組みの構築へ

近年、文章や参考画像を入力することで好みの画像を生成できるAIの開発が活発に行われており、中には画像生成AIで出力した絵が人間の絵を差し置いてコンテストで入賞を果たすなど、社会的な影響も出始めています。この状況の中、世界中のイラスト投稿サイトがAIが生成してイラストの投稿に制限を設けるなど、AIによって出力された画像に対するルール作りが急速に進んでいます。新たに、ストックフォト最大手の一角である「Shutterstock」が画像生成AI「DALL・E」を開発したことで知られるAI研究団体「OpenAI」と提携し、ShutterstockにAI画像生成機能を追加することを発表しました。同時に、AIの学習に貢献したコンテンツの作者に対して報奨金を与える仕組みの作成も発表されています。

·gigazine.net·Oct 26, 2022

ディープフェイクを用いて有名人を許可なく宣伝・広告映像に用いる事例が続々登場

画像合成技術「ディープフェイク」は極めて高精度な合成が可能で、Disney＋配信のドラマ「マンダロリアン」では、俳優マーク・ハミルが若かったころの姿が登場するのですが、YouTuberがディープフェイクで本編よりクオリティの高い映像を作ったのでルーカスフィルムが雇用する事例まで出ています。一方、俳優の顔をポルノ映像に合成するような使い方もあり、直近では有名人を許可なく宣伝・広告映像に用いる事例が確認されています。

·gigazine.net·Oct 26, 2022

ディープフェイクを用いて有名人を許可なく宣伝・広告映像に用いる事例が続々登場

Simejiに新機能「AIイラスト」言葉の入力だけで画像を自動生成してくれる

バイドゥが開発・運営を行なっている日本語入力アプリ「Simeji」に、言葉を入力するだけで、画像を自動生成してくれる新機能「AIイラスト」が登場した。ネットでは続々と「AIイラスト」で生成した画像の共有が行われ、賑わっている。

·news.mynavi.jp·Oct 26, 2022

Simejiに新機能「AIイラスト」言葉の入力だけで画像を自動生成してくれる

イラスト特化画像生成AI「NovelAI」に入力するプロンプト・呪文を日本語の選択肢から簡単に作成できるウェブアプリ「Magic Generator」の使い方まとめ

近年、文章(プロンプト)を入力するだけで画像を生成してくれるAIに大きな注目が集まっており、有志の開発によって誰でも簡単に画像生成AIを利用できる状況が整いつつあります。しかし、プロンプトは基本的に英語で入力する必要があるため、英語が苦手な人にとっては扱いにくく感じます。そんな中、高品質なアニメ画像を出力できる画像生成AI「NovelAI」向けに、生成したい画像の特徴を選択するだけでプロンプトを作成してくれる日本語ウェブアプリ「Magic Generator」が公開されました。

·gigazine.net·Oct 25, 2022

イラスト特化画像生成AI「NovelAI」に入力するプロンプト・呪文を日本語の選択肢から簡単に作成できるウェブアプリ「Magic Generator」の使い方まとめ

AIが作った画像か判別するAIを4hで作ったらまあまあの精度出たのでWebサービスとして公開した件

AIが作った画像か判断するAIを作りました ※機械学習やったことない人が書いてます Why 新卒同期などが雑多に集まるディスコードに貼られたピクシブのお気持ち表明だったピクシブのお気持ち表明記事の「AI生成作品のフィルタリ...

·qiita.com·Oct 25, 2022

AIが作った画像か判別するAIを4hで作ったらまあまあの精度出たのでWebサービスとして公開した件

画像生成AI「Stable Diffusion」バージョン1.5のリリースが遅れている理由とは？

近年、文章を入力するだけで好みの画像を出力できる画像生成AIが大きな注目を集めています。数ある画像生成AIの中でもAIスタートアップのStability AIが開発した「Stable Diffusion」は、2022年8月のオープンソース化されたことを切っ掛けに複数のGUIアプリが開発されるなど非常に活発なコミュニティが生まれています。そんなStable Diffusionのバージョン1.5のリリースが遅れている理由について、Stability AIの最高情報責任者を務めるダニエル・ジェフリーズ氏が説明しています。

·gigazine.net·Oct 24, 2022

画像生成AI「Stable Diffusion」バージョン1.5のリリースが遅れている理由とは？

画像編集ソフトの覆い焼きやソフトライトといった「レイヤー合成モード」は一体何をしているのか？

Photoshopなどのデジタル画像編集ソフトウェアでは、「覆い焼き」や「ソフトライト」といったさまざまなブレンドモード(レイヤー合成モード)を用いて画像を編集することが可能です。このレイヤー合成モードは一体何をしているのかを、プロダクトデザイナーのダン・ホリック氏が解説しています。

·gigazine.net·Oct 24, 2022

画像編集ソフトの覆い焼きやソフトライトといった「レイヤー合成モード」は一体何をしているのか？

まるで透明マント。監視カメラでAIが認識しないアグリー・セーターが作られる

目立つ柄だけど社会的に消えます。伝統的に冬になると欧米人が着る、ダッサい柄の｢アグリー・セーター｣。マイクロソフトも毎年新作をリリースし、音楽業界ではアイアン・メイデンやガンズ・アンド・ローゼズがオリジナルを作っていましたね。さて、今年もそろそろアグリー・セーターの時期が到来しようという頃合いですが、ニューヨーク州にあるコーネル大学では、監視カメラでAIが認識しない｢アグリー・セーター｣が爆誕し

·gizmodo.jp·Oct 22, 2022

まるで透明マント。監視カメラでAIが認識しないアグリー・セーターが作られる

まるで魔法みたい。Adobeが｢Sneaks｣で研究技術を公開…フォトショなどの未来機能か

·businessinsider.jp·Oct 22, 2022

まるで魔法みたい。Adobeが｢Sneaks｣で研究技術を公開…フォトショなどの未来機能か

【純粋にスゴイ】AIイラスト生成アプリ『AIピカソ』に同僚たちの似顔絵を描いてもらったらこうなった！

なんか「AIイラスト」の世界がスゴイことになっているらしい。本当にクオリティが高いらしく、“絵師たちの仕事を奪うかも” みたいなことを言っている人もいるとかいない …

·rocketnews24.com·Oct 22, 2022

【純粋にスゴイ】AIイラスト生成アプリ『AIピカソ』に同僚たちの似顔絵を描いてもらったらこうなった！

「画像生成AIの対価を人間の絵描きは受け取っていない」と専門家が懸念、AIの発展の中で置き去りにされている問題点を鋭く解説

「AIか哲学者か」を見分けることは専門家でも難しいと言われたり、Googleのエンジニアが「AIが感情や知性を獲得した」と発言したりと、人工知能の技術は目覚ましく成長しています。しかしその進歩の一方で、AIが言語をマスターすることは困難であるとされています。AIと言語習得の関係とAIが抱える問題点について、「画像生成AI」の問題とも絡めながら、ニューヨーク大学のゲイリー・マーカス名誉教授が科学メディアのUndark Magazineのインタビューに応えています。

·gigazine.net·Oct 21, 2022

「画像生成AIの対価を人間の絵描きは受け取っていない」と専門家が懸念、AIの発展の中で置き去りにされている問題点を鋭く解説

画像生成AI「Stable Diffusion」のデイリーアクティブユーザーが1000万人に到達、「DreamStudio」のユーザーは150万人超え

オープンソースの画像生成AI「Stable Diffusion」の開発を主導するAI企業・Stablity AIが、1億100万ドル(約150億円)の資金調達に成功したと発表しました。さらにStablity AIは、1日あたり1000万人以上のユーザーがStable Diffusionを利用しており、Stable Diffusionをブラウザから使える有償サービス「DreamStudio」のユーザー数は150万人以上であることを明らかにしています。

·gigazine.net·Oct 19, 2022

画像生成AI「Stable Diffusion」のデイリーアクティブユーザーが1000万人に到達、「DreamStudio」のユーザーは150万人超え

自撮り動画をAIで解析して本当に18歳以上か判別するInstagramの年齢確認プログラムが拡大中

Instagramは2022年6月、アカウントの生年月日を編集して年齢設定を18歳未満から18歳以上にしようとするユーザーに対し、「自撮り動画をAIで解析して本当に18歳以上かどうか判別するプログラム」のテストをアメリカで開始しました。新たに、このプログラムを4億人もの月間アクティブユーザーを抱えるブラジルとインドにも拡大することが発表されています。

·gigazine.net·Oct 19, 2022

自撮り動画をAIで解析して本当に18歳以上か判別するInstagramの年齢確認プログラムが拡大中

NVIDIAが超高性能ディープフェイク生成AI「Implicit Warping」をひっそり開発している

特定の人物の写真をAIに学習させて実際に撮影したわけではない偽のムービーを作り出す技術「ディープフェイク」は、「俳優を現地に呼ばずに映像作品を作成する」といった有用な使い方の他に、「ポルノ映像に他人の顔を重ねる」「架空の人物としてリモートワークの採用面接を受ける」といった悪用事例も多数報告されています。そんな中、NVIDIAがひっそりと公開していた映像補間AI「Implicit Warping」が高品質なディープフェイク生成に使えるとして話題になっています。

·gigazine.net·Oct 19, 2022

NVIDIAが超高性能ディープフェイク生成AI「Implicit Warping」をひっそり開発している