画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2550 bookmarks
Custom sorting
イラスト画像から逆向きに画像生成AIのプロンプト用にDanbooruタグを見つける「Deep Danbooru」を「AUTOMATIC1111版Stable Diffusion web UI」で使う方法まとめ
イラスト画像から逆向きに画像生成AIのプロンプト用にDanbooruタグを見つける「Deep Danbooru」を「AUTOMATIC1111版Stable Diffusion web UI」で使う方法まとめ
Stable Diffusionなどの画像生成AIは、「プロンプト」と呼ばれる文字条件から画像を生成します。Waifu-DiffusionやNovelAIなど、二次元イラストに特化した画像生成AIは、二次元イラストサイトのDanbooruにアップロードされた画像で学習しています。そこで、Stable DiffusionではなくDanbooruのタグで画像を生成する手助けになる機能「Deep Danbooru」が、Stable DiffusionのウェブUIの決定版である「AUTOMATIC1111版Stable Diffusion web UI」で簡単に利用できるようになったので、実際に使ってみました。
·gigazine.net·
イラスト画像から逆向きに画像生成AIのプロンプト用にDanbooruタグを見つける「Deep Danbooru」を「AUTOMATIC1111版Stable Diffusion web UI」で使う方法まとめ
「Osmo Action 3」のブレ補正性能を徹底検証、格安アクションカメラは実用的なのか?
「Osmo Action 3」のブレ補正性能を徹底検証、格安アクションカメラは実用的なのか?
2022年9月に登場したアクションカメラ「Osmo Action 3」は、4万円台という比較的安価な価格ながら頑丈なボディや水深16mまでの防水性能などアクションカメラとして申し分ない耐環境性能を備えています。そんなOsmo Action 3が編集部にやってきたので、外観チェックに続いてブレ補正性能や水中での色合いの変化などを徹底的に検証してみました。
·gigazine.net·
「Osmo Action 3」のブレ補正性能を徹底検証、格安アクションカメラは実用的なのか?
従業員監視のためにウェブカメラをオンにさせるのはプライバシーに反するので人権侵害だという判決が下る
従業員監視のためにウェブカメラをオンにさせるのはプライバシーに反するので人権侵害だという判決が下る
リモートワークの普及に伴って、「従業員の仕事をウェブカメラを通して監視する」という仕組みを導入する企業も増えていますが、ウェブカメラによる監視を不快に思う人も多いはず。オランダでは、「ウェブカメラでの監視を拒否した」という理由で従業員を解雇した企業に対して、プライバシー侵害や不当解雇の補償として合計約7万5000ユーロ(約1000万円)の支払いを命じる判決が下りました。
·gigazine.net·
従業員監視のためにウェブカメラをオンにさせるのはプライバシーに反するので人権侵害だという判決が下る
超高精度なイラストを生成できると話題の「NovelAI」は本家Stable Diffusionにどんな改善を加えたのか?
超高精度なイラストを生成できると話題の「NovelAI」は本家Stable Diffusionにどんな改善を加えたのか?
Stable Diffusionよりもはるかに高い精度でイラストを生成できる画像生成AIサービス「NovelAI」のAIモデルについて、NovelAIの開発チームが自身のブログで解説しています。
·gigazine.net·
超高精度なイラストを生成できると話題の「NovelAI」は本家Stable Diffusionにどんな改善を加えたのか?
画像生成AI「Stable Diffusion」がどのような仕組みでテキストから画像を生成するのかを詳しく図解
画像生成AI「Stable Diffusion」がどのような仕組みでテキストから画像を生成するのかを詳しく図解
高精度な画像を生成できることで話題となっている「Stable Diffusion」が、どのように入力されたテキスト(プロンプト)からイラストを生成しているのかについて、機械学習関連のトピックについての解説動画などを投稿しているジェイ・アラマー氏が解説しています。
·gigazine.net·
画像生成AI「Stable Diffusion」がどのような仕組みでテキストから画像を生成するのかを詳しく図解
画像生成AIでキリスト教の「聖句」を呪文にして絵画を生成するとこうなる
画像生成AIでキリスト教の「聖句」を呪文にして絵画を生成するとこうなる
画像生成AIの「DALL・E 2」で、生成する画像を指示するテキストプロンプト、いわゆる呪文としてキリスト教の聖書の文言を使った画像集が公開されています。古代から伝わる教典と最新のAI技術のコラボレーションにより生まれた画像の中には、中世の名画を再現しているものや現代風のポップアートになってしまった画像などもあるので、特に印象的なものをピックアップしてみました。
·gigazine.net·
画像生成AIでキリスト教の「聖句」を呪文にして絵画を生成するとこうなる
AIが生成した写真と他人のプロフィールのコピーを組み合わせたLinkedInの偽アカウントが人事部門を悩ませている
AIが生成した写真と他人のプロフィールのコピーを組み合わせたLinkedInの偽アカウントが人事部門を悩ませている
ビジネスSNS・LinkedInで、AIが生成した写真と他のアカウントからコピーした内容を組み合わせた偽のプロフィールが急増しており、LinkedInで採用を行っている企業が大きな打撃を受けていると報告されています。
·gigazine.net·
AIが生成した写真と他人のプロフィールのコピーを組み合わせたLinkedInの偽アカウントが人事部門を悩ませている
初代バーチャファイターのカクカクポリゴンを画像生成AI「Stable Diffusion」で今風のリアル3DCGに高画質化するとすごい
初代バーチャファイターのカクカクポリゴンを画像生成AI「Stable Diffusion」で今風のリアル3DCGに高画質化するとすごい
画像生成AIのStable Diffusionは「潜在拡散モデル」と呼ばれるタイプのモデルとなっており、与えられた指示に従って画像を生成するだけでなく、低解像度の画像を高解像度にアップコンバートしたり、画質を保ったまま画像を圧縮したりすることも得意とされています。そんなStable Diffusionを使って、カクカクポリゴンのキャラクターで知られている初代バーチャファイターを今風のリアルな3DCGに変換した画像が話題となっています。
·gigazine.net·
初代バーチャファイターのカクカクポリゴンを画像生成AI「Stable Diffusion」で今風のリアル3DCGに高画質化するとすごい
イラスト自動生成AI「NovelAI」について学習元となったDanbooru公式が声明を発表
イラスト自動生成AI「NovelAI」について学習元となったDanbooru公式が声明を発表
Stable DiffusionやMidjourneyなどの画像生成AIは、大量の画像で構成されたデータセットで学習を行っています。高精度の二次元イラストを生成できるとして話題になったNovelAIも、学習したデータセットに海外の二次元画像サイト・Danbooruの画像を多く含んでいるといわれています。そんなDanbooruの公式運営チームが、NovelAIについて声明を発表しました。
·gigazine.net·
イラスト自動生成AI「NovelAI」について学習元となったDanbooru公式が声明を発表
部屋の写真から自動的にインテリアのアイデアを提案するAI「INTERIOR AI」
部屋の写真から自動的にインテリアのアイデアを提案するAI「INTERIOR AI」
AIの発達により、テキストを入力するだけで3Dモデルを生成したり、ワンクリックでこの世に存在しない家の写真を生成したりするなど「画像」に関するさまざまな恩恵を受けられるようになっています。新たに、部屋の写真をアップロードするだけで自動的にインテリアを考えてくれる「INTERIOR AI」が登場したので実際に使ってみました。
·gigazine.net·
部屋の写真から自動的にインテリアのアイデアを提案するAI「INTERIOR AI」
画像生成AI「Stable Diffusion」でいろいろ特化した使えるモデルデータいろいろまとめ
画像生成AI「Stable Diffusion」でいろいろ特化した使えるモデルデータいろいろまとめ
画像生成AIのStable Diffusionは、ノイズを除去することで画像を生成する「潜在拡散モデル」で、オープンソースで開発されて2022年8月に一般公開されたため、学習用のデータセットを変えることで特定の画像を生成するのに特化したフォークモデルが多数存在します。そんなStable Diffusionから派生して生まれた特化型モデルとその特徴や生成例をまとめてみました。
·gigazine.net·
画像生成AI「Stable Diffusion」でいろいろ特化した使えるモデルデータいろいろまとめ
「iPhone 14 Pro Max」で手振れを補正する「アクションモード」などビデオ撮影のいろいろな機能を試してみた
「iPhone 14 Pro Max」で手振れを補正する「アクションモード」などビデオ撮影のいろいろな機能を試してみた
2022年9月16日に発売された「iPhone 14」シリーズは最大4K60fpsでの動画撮影が可能なほか、新たに撮影時の手振れを補正する機能「アクションモード」が利用可能になるなど、ビデオ撮影機能も充実しています。そんなビデオ撮影の実力を実際に映像を撮影して確かめて見ました。
·gigazine.net·
「iPhone 14 Pro Max」で手振れを補正する「アクションモード」などビデオ撮影のいろいろな機能を試してみた
ブルース・ウィリスがディープフェイクを使って映画や広告で自身を使用する権利を売却
ブルース・ウィリスがディープフェイクを使って映画や広告で自身を使用する権利を売却
「ダイ・ハード」シリーズや「アルマゲドン」、「シックス・センス」など数々の映画で活躍してきた俳優のブルース・ウィリスは、2022年3月に失語症を理由に俳優業を引退しました。そんなブルース・ウィリスが、「ディープフェイクを使って自身のデジタルツインを映画や広告に出演させる権利」を売却したことが明らかになりました。
·gigazine.net·
ブルース・ウィリスがディープフェイクを使って映画や広告で自身を使用する権利を売却
テキストを入力するだけで3Dモデルを生成できる3D自動生成AI「DreamFusion」
テキストを入力するだけで3Dモデルを生成できる3D自動生成AI「DreamFusion」
入力したテキストをベースに画像を出力する「Stable Diffusion」のような拡散モデルが流行していますが、このアプローチを進化させて「テキストから3Dモデルの生成」を実現する3D自動生成AI(人工知能)「DreamFusion」の開発にGoogle Researchやカリフォルニア大学バークレー校の研究者たちが取り組んでいます。
·gigazine.net·
テキストを入力するだけで3Dモデルを生成できる3D自動生成AI「DreamFusion」
テキストを基にする動画生成AI「Phenaki」を匿名の研究者が公開、宇宙飛行士が踊ったりテディベアが泳いだりするサンプル動画も
テキストを基にする動画生成AI「Phenaki」を匿名の研究者が公開、宇宙飛行士が踊ったりテディベアが泳いだりするサンプル動画も
近年は画像生成AIの「Stable Diffusion」がクオリティの高さを見せつけて話題となっていますが、新たに匿名の研究者がテキストを基に動画を生成するAI「Phenaki」を発表しました。
·gigazine.net·
テキストを基にする動画生成AI「Phenaki」を匿名の研究者が公開、宇宙飛行士が踊ったりテディベアが泳いだりするサンプル動画も
CodeFormerで、低画質の顔画像を高画質化する
CodeFormerで、低画質の顔画像を高画質化する
今回ご紹介するのは、Transfomer ベースの予測ネットワークを使うことによって、低画質の顔画像を高画質化する CodeFormer という技術です。
·cedro3.com·
CodeFormerで、低画質の顔画像を高画質化する
画像生成AI「DALL・E」が誰でも簡単に利用可能になったので登録手順や使い方をまとめてみた
画像生成AI「DALL・E」が誰でも簡単に利用可能になったので登録手順や使い方をまとめてみた
2022年8月に画像生成AI「Stable Diffusion」が一般公開されて以降、誰でも簡単に画像生成AIを利用できるシステムが開発されたり、画像生成AIを便利に使うためのサービスが続々と開発されたりと、大きな盛り上がりを見せています。新たに、AI研究団体のOpenAIが2021年1月に発表していた画像生成AI「DALL・E」を一般公開しました。これにより、これまで順番待ちが必要だったDALL・Eを誰でもすぐに利用可能となったので、利用登録の手順や使い方をまとめてみました。
·gigazine.net·
画像生成AI「DALL・E」が誰でも簡単に利用可能になったので登録手順や使い方をまとめてみた
画像生成AI「Stable Diffusion」がTensorFlowとKerasCVで約30%高速になることが判明
画像生成AI「Stable Diffusion」がTensorFlowとKerasCVで約30%高速になることが判明
機械学習プラットフォームのTensorFlowで実行される、Pythonで記述されたディープラーニング用APIが「Keras」です。このKerasを拡張して画像分類、物体検出、画像分割、画像データ補強などを行うためのモジュール式ビルディングブロック「KerasCV」を使うと、画像生成AIのStable Diffusionが約30%高速になるという報告が、KerasCVの開発者による研究チームからあがっています。
·gigazine.net·
画像生成AI「Stable Diffusion」がTensorFlowとKerasCVで約30%高速になることが判明
画像生成AI「Stable Diffusion(AUTOMATIC1111版)」で一度に1000枚以上作ったりデフォルトのファイル名を変更したり生成が終わったらプッシュ通知したり知っておくといろいろ便利な設定方法まとめ
画像生成AI「Stable Diffusion(AUTOMATIC1111版)」で一度に1000枚以上作ったりデフォルトのファイル名を変更したり生成が終わったらプッシュ通知したり知っておくといろいろ便利な設定方法まとめ
2022年8月に一般公開された画像生成AI「Stable Diffusion」をユーザーインターフェース(UI)で操作できる「AUTOMATIC1111版Stable Diffusion web UI」は非常に多機能で頻繁にアップデートされており、Stable DiffusionのUIツールとしては記事作成時点で決定版ともいえる存在です。そんなAUTOMATIC1111版Stable Diffusion web UIで一度に大量の画像を生成したり画像生成をプッシュ通知させたりといった、より便利に使うための設定方法をまとめてみました。
·gigazine.net·
画像生成AI「Stable Diffusion(AUTOMATIC1111版)」で一度に1000枚以上作ったりデフォルトのファイル名を変更したり生成が終わったらプッシュ通知したり知っておくといろいろ便利な設定方法まとめ
画像生成AI「Stable Diffusion」でどれぐらいプロンプト・呪文の指示に従うかを決める「CFG(classifier-free guidance)」とは一体何なのか?
画像生成AI「Stable Diffusion」でどれぐらいプロンプト・呪文の指示に従うかを決める「CFG(classifier-free guidance)」とは一体何なのか?
入力したプロンプトを基に画像を生成するAI「Stable Diffusion」は一般公開以降、世界中の人々から注目を浴びており、さまざまなツールや応用方法も発表されています。そんなStable Diffusionで画像を生成する際の設定項目には、「画像生成でどれだけプロンプトに従うか」を決める「CFG(classifier-free guidance)スケール」という値があります。
·gigazine.net·
画像生成AI「Stable Diffusion」でどれぐらいプロンプト・呪文の指示に従うかを決める「CFG(classifier-free guidance)」とは一体何なのか?
「Stable Diffusion」のような画像生成AIに自分の顔写真が使われている可能性は決して低くないとの警告
「Stable Diffusion」のような画像生成AIに自分の顔写真が使われている可能性は決して低くないとの警告
インターネットユーザーの中には、「一度ネット上に公開したものは簡単には削除できないので、不用意に自分の顔写真などをアップロードしてはいけない」という忠告を見聞きしたことがある人も多いはず。Stable DiffusionやDALL・Eやといった画像生成AIの流行により、インターネットとプライバシーの問題がさらに深刻で複雑なものになったと指摘されています。
·gigazine.net·
「Stable Diffusion」のような画像生成AIに自分の顔写真が使われている可能性は決して低くないとの警告
画像生成AIで自分が作りたいイメージから類似画像を見つけてプロンプト・呪文を次々に探していける「KREA」
画像生成AIで自分が作りたいイメージから類似画像を見つけてプロンプト・呪文を次々に探していける「KREA」
画像生成AI「Stable Diffusion」は「プロンプト」として文字列を入力することで、その文字列の内容に沿った絵や写真を自動で生成してくれます。しかし、自分の理想により近い画像を生成してもらうためには、多種多様な文字列を大量にプロンプトとして入力する必要があり、この複雑なプロンプトを探ることが画像を生成する工程の中でも特に大変な作業の1つです。「KREA」はAIで生成された画像とそのプロンプトをまとめたデータベースで、自分が理想とする画像を生成するためのプロンプトを探る作業がはかどります。
·gigazine.net·
画像生成AIで自分が作りたいイメージから類似画像を見つけてプロンプト・呪文を次々に探していける「KREA」
静岡県の水害巡りフェイク画像が拡散 画像生成AIを利用 投稿者はデマと認めるも「ざまあw」と開き直り
静岡県の水害巡りフェイク画像が拡散 画像生成AIを利用 投稿者はデマと認めるも「ざまあw」と開き直り
台風15号による水害被害が発生している静岡県を巡って、フェイク画像がTwitter上で拡散されている。「ドローンで撮影された静岡県の水害」という画像という画像は、画像生成AIで作成したフェイク画像だった。
·itmedia.co.jp·
静岡県の水害巡りフェイク画像が拡散 画像生成AIを利用 投稿者はデマと認めるも「ざまあw」と開き直り
神絵を描くAI「Midjourney」にナントカ風のイラストを描かせてみる…興味深い結果に【使い方・AI比較】
神絵を描くAI「Midjourney」にナントカ風のイラストを描かせてみる…興味深い結果に【使い方・AI比較】
「絵を描くAI」として注目を集めている「Midjourney」に様々な"〇〇風"のイラストを描かせてみました。ちょっとした指示の変化でどう変わるのでしょうか?
·businessinsider.jp·
神絵を描くAI「Midjourney」にナントカ風のイラストを描かせてみる…興味深い結果に【使い方・AI比較】