画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2306 bookmarks
Custom sorting
ポーズや構図を指定してサクッと好みのイラスト画像を生成しまくれる「ControlNet」&「Stable Diffusion」の合わせ技を試してみたよレビュー
ポーズや構図を指定してサクッと好みのイラスト画像を生成しまくれる「ControlNet」&「Stable Diffusion」の合わせ技を試してみたよレビュー
Stable Diffusionなどの画像生成AIの登場によって、手軽に好みの画像を出力できる環境が整いつつありますが、テキスト(プロンプト)による指示だけで好みのポーズのイラストを生成するには長い時間や経験が必要です。新たに開発された「ControlNet」を画像生成AIと併用すれば、好みのポーズを指定したイラストを簡単に生成できるとのことなので、実際にインストールして使い方を確かめてみました。
·gigazine.net·
ポーズや構図を指定してサクッと好みのイラスト画像を生成しまくれる「ControlNet」&「Stable Diffusion」の合わせ技を試してみたよレビュー
「Stable Diffusion」のような画像生成AIにバックドアを設けることを義務化するよう呼びかける論文が発表される
「Stable Diffusion」のような画像生成AIにバックドアを設けることを義務化するよう呼びかける論文が発表される
最新の論文で、Stable Diffusionのような画像生成AIに「バックドア」を設けることを義務化すべきとマサチューセッツ工科大学(MIT)の研究者たちが呼びかけました。画像生成AIにバックドアを設けることで、これらを開発する企業は規制当局と協力してAIアプリが同意のないディープフェイクの作成に利用されることを防ぐことができるようになると主張しています。
·gigazine.net·
「Stable Diffusion」のような画像生成AIにバックドアを設けることを義務化するよう呼びかける論文が発表される
砂場の高さを測定して色を投影する拡張現実サンドボックス用オープンソースソフトウェア「Magic-Sand」
砂場の高さを測定して色を投影する拡張現実サンドボックス用オープンソースソフトウェア「Magic-Sand」
子どもの頃に砂場で山や谷、海などで自分だけの世界を作って遊んだ人もいるはず。「Magic-Sand」はカリフォルニア大学デービス校が開発した拡張現実(AR)サンドボックスから着想を得て開発されたツールで、実際に指定した砂場で作った山や海の高さを計測し、プロジェクションマッピングで地図のように着色するためのオープンソースソフトウェアです。
·gigazine.net·
砂場の高さを測定して色を投影する拡張現実サンドボックス用オープンソースソフトウェア「Magic-Sand」
Azureも障害、東南アジアで 冷却装置がダウン
Azureも障害、東南アジアで 冷却装置がダウン
「Microsoft Azure」の東南アジアリージョンで、2月8日午前5時19分ごろから障害が発生している。データセンターの一つで過剰な電力供給があり、冷却装置がオフラインになったという。
·itmedia.co.jp·
Azureも障害、東南アジアで 冷却装置がダウン
Google画像検索がデフォルトで「ポルノ・暴力・流血」関連画像にぼかしをかけるよう仕様を変更
Google画像検索がデフォルトで「ポルノ・暴力・流血」関連画像にぼかしをかけるよう仕様を変更
2023年2月7日のセーファーインターネットデーに、Googleはセキュリティとプライバシーに重点を置いたさまざまな取り組みを紹介しました。この中で、Google画像検索がデフォルトでポルノ・暴力・流血関連の画像にぼかしをかけるよう仕様を変更することが明らかになっています。
·gigazine.net·
Google画像検索がデフォルトで「ポルノ・暴力・流血」関連画像にぼかしをかけるよう仕様を変更
容疑者の似顔絵を警察の代わりに生成するAIが登場、専門家は捜査への悪影響を懸念
容疑者の似顔絵を警察の代わりに生成するAIが登場、専門家は捜査への悪影響を懸念
2人の開発者がOpenAIの画像生成モデル「DALL・E2」を使い、ユーザーの入力に基づいて容疑者の超リアルな似顔絵を作成するプログラムを作成しました。開発者は通常2~3時間かかるスケッチの時間を短縮できるとしましたが、専門家はリアルであることがむしろ捜査の妨げになる可能性を指摘しました。
·gigazine.net·
容疑者の似顔絵を警察の代わりに生成するAIが登場、専門家は捜査への悪影響を懸念
AIが生成した画像のもとになった画像の帰属を示すサービス「Stable Attribution」
AIが生成した画像のもとになった画像の帰属を示すサービス「Stable Attribution」
画像生成AIは、無から画像を生み出しているわけではなく、膨大なデータセットで学習した内容から求められた画像を出力しています。そこで、出力された画像をもとにして、データセット内のどういった画像がもとになったのかわかるサービスが「Stable Attribution」です。
·gigazine.net·
AIが生成した画像のもとになった画像の帰属を示すサービス「Stable Attribution」
「似た雰囲気の画像」を直感的に絞り込んでスタイリッシュで美麗な画像を検索できる画像特化検索エンジン「Same Energy」
「似た雰囲気の画像」を直感的に絞り込んでスタイリッシュで美麗な画像を検索できる画像特化検索エンジン「Same Energy」
Googleなどの画像検索を利用したことがある人は多いはずですが、表示される画像は玉石混交であり、単語だけで自分にとって理想の画像を見つけ出すのは至難の業です。そこで、機械学習を利用して「同じような雰囲気の画像」を表示するシステムを採用し、スタイリッシュで美麗な画像の検索に特化した検索エンジンが「Same Energy」です。
·gigazine.net·
「似た雰囲気の画像」を直感的に絞り込んでスタイリッシュで美麗な画像を検索できる画像特化検索エンジン「Same Energy」
全カットの背景にAI生成画像を用いたアニメ「犬と少年」をNetflixが公開
全カットの背景にAI生成画像を用いたアニメ「犬と少年」をNetflixが公開
AIが生成した画像を背景に使用した実験的アニメ「犬と少年」をNetflixが公開しました。Netflixはこのアニメについて「クリエイターを補助するツールとして、画像生成の技術をアニメ制作の背景画に活用することを試みたプロジェクト」であると説明しています。
·gigazine.net·
全カットの背景にAI生成画像を用いたアニメ「犬と少年」をNetflixが公開
画像や文章の生成などを行う「ジェネレーティブAI」はなぜ急に発展したのか?
画像や文章の生成などを行う「ジェネレーティブAI」はなぜ急に発展したのか?
文章(プロンプト)を入力するだけで高精度な画像を生成できる「Stable Diffusion」や対話形式で高精度な文章を作成する「ChatGPT」などのいわゆる「ジェネレーティブAI」がしばしば話題になっています。近年急速に発展したように見えるジェネレーティブAIはどのような仕組みで、なぜ急速に広まっているのか、投資家・起業家のハオミャオ・ファン氏が解説しています。
·gigazine.net·
画像や文章の生成などを行う「ジェネレーティブAI」はなぜ急に発展したのか?
本物にしか見えないトム・クルーズのディープフェイク動画が圧巻
本物にしか見えないトム・クルーズのディープフェイク動画が圧巻
有名人のディープフェイクムービーというと、顔が浮かんで見えるような不自然な映像が思い浮かぶ人も少なくないはず。しかし、俳優のマイルズ・フィッシャーとVFXアーティストのChris Umé氏がタッグを組んで作成したムービーを再生すると、偽物だと言われなければ本物だと思ってしまいそうなトム・クルーズがパリス・ヒルトンと言葉を交わしているのを見ることができます。
·gigazine.net·
本物にしか見えないトム・クルーズのディープフェイク動画が圧巻
画像生成AI「Stable Diffusion」を最速で実行できるGPUはどれなのか?
画像生成AI「Stable Diffusion」を最速で実行できるGPUはどれなのか?
文章(プロンプト)を入力するだけで高精度な画像を生成できるAI「Stable Diffusion」が話題となっていますが、Stable Diffusionは基本的にNVIDIA製GPUを使用することが想定されて設計されているため、使用するGPUによって実行速度が変動してしまいます。そこで、テクノロジー系メディアのTom's Hardwareでライターを務めるJarred Walton氏が、「どのGPUだと最も速くStable Diffusionを実行できるのか?」について調査を行いました。
·gigazine.net·
画像生成AI「Stable Diffusion」を最速で実行できるGPUはどれなのか?
AppleのMRヘッドセット「Reality Pro(仮称)」は視線や手の動きの追跡、3DのiOSライクなUI、Mac外部ディスプレイ機能など搭載か
AppleのMRヘッドセット「Reality Pro(仮称)」は視線や手の動きの追跡、3DのiOSライクなUI、Mac外部ディスプレイ機能など搭載か
Appleが開発を進めているMRヘッドセット「Reality Pro(仮称)」で、ハウジング内のセンサーを用いた視線追跡や、複数のカメラを用いた手の動きの追跡が行われ、外部端末なしで3DのiOS風UIを操作することになるといった詳細な情報が報じられています。
·gigazine.net·
AppleのMRヘッドセット「Reality Pro(仮称)」は視線や手の動きの追跡、3DのiOSライクなUI、Mac外部ディスプレイ機能など搭載か
一般家庭にあるWi-Fiルーターで人間の3D画像を生成することが可能
一般家庭にあるWi-Fiルーターで人間の3D画像を生成することが可能
Wi-Fiルーターを使用して人間の位置や体勢を検出・認識し、3D画像を生成する方法をカーネギーメロン大学の研究者が発表しました。誰でも簡単に入手可能なWi-Fiルーターで3D画像を生成することができるということで、ヘルスケア・セキュリティ・ゲーム(VR)などの分野にとってのブレイクスルーとなる可能性が指摘されています。
·gigazine.net·
一般家庭にあるWi-Fiルーターで人間の3D画像を生成することが可能
リアルタイムで「常にカメラ目線」状態に調整する「Eye Contact」機能をNVIDIAがリリース
リアルタイムで「常にカメラ目線」状態に調整する「Eye Contact」機能をNVIDIAがリリース
適度なアイコンタクトは他人に良い印象を与えると言われており、会話を円滑に進めるためにもアイコンタクトは重要とされています。NVIDIAが提供する配信向けツール「NVIDIA Broadcast 1.4」では、AIを利用する事で視線を追跡し、常にカメラ目線にすることでアイコンタクトを維持する機能「Eye Contact」が追加されました。
·gigazine.net·
リアルタイムで「常にカメラ目線」状態に調整する「Eye Contact」機能をNVIDIAがリリース
画像生成AI「Midjourney」をオープンソースで再現する「OpenJourney」が登場
画像生成AI「Midjourney」をオープンソースで再現する「OpenJourney」が登場
入力した文字列(プロンプト)から画像を自動で生成するAI・Midjourneyと同等のものをオープンソースで人々に提供することを目的としたプロジェクトが「OpenJourney」です。OpenJourneyは同じ画像生成AIでオープンソースで開発されるStable Diffusion v1.5を調整し、Midjourneyに近い動作をするように開発されており、オンラインAIプラットフォームのHugging Faceにリポジトリが公開されています。
·gigazine.net·
画像生成AI「Midjourney」をオープンソースで再現する「OpenJourney」が登場
AIの力で「手書き文字」を生成できる無料ウェブアプリ「Calligrapher.ai」レビュー
AIの力で「手書き文字」を生成できる無料ウェブアプリ「Calligrapher.ai」レビュー
イラストやスライド資料の作成中に「英語の手書き文字」を使いたくなった経験がある人は多いはず。無料で使えるウェブアプリ「Calligrapher.ai」なら、入力した文章を手書き文字にサクッと変換してくれるとのことなので、実際に使ってみました。
·gigazine.net·
AIの力で「手書き文字」を生成できる無料ウェブアプリ「Calligrapher.ai」レビュー
AIで画像のウォーターマークを無料で削除できるツール「Watermark Remover」が登場して新たな議論が勃発
AIで画像のウォーターマークを無料で削除できるツール「Watermark Remover」が登場して新たな議論が勃発
インターネットに公開されている画像には、透かしとして小さな図案や文字が「ウォーターマーク」として入っていることがあります。このウォーターマークは画像の著作権表示などに使われていますが、このウォーターマークをAIの力で画像からキレイに消し去るウェブアプリ「Watermark Remover」が登場して議論を招いています。
·gigazine.net·
AIで画像のウォーターマークを無料で削除できるツール「Watermark Remover」が登場して新たな議論が勃発
Microsoft、GitHub、OpenAIが「AIツールによる著作権侵害訴訟」の棄却を裁判所に要請
Microsoft、GitHub、OpenAIが「AIツールによる著作権侵害訴訟」の棄却を裁判所に要請
Microsoft、GitHub、OpenAIの3社が人工知能(AI)をトレーニングするためにオープンソースのコードを使用することで、「オープンソースプログラマーの仕事から利益を得ている」として集団訴訟を提起されています。これに対して、Microsoft、GitHub、OpenAIの3社は裁判所に対して訴訟の棄却を求めていることが明らかになりました。
·gigazine.net·
Microsoft、GitHub、OpenAIが「AIツールによる著作権侵害訴訟」の棄却を裁判所に要請
経産省とIPAがデジタルスキル標準を公開、見えた2つの「やってはいけない」
経産省とIPAがデジタルスキル標準を公開、見えた2つの「やってはいけない」
「DX(デジタルトランスフォーメーション)推進には社員にどんなスキルを身に付けさせるべきか。どんな人材を外部から採用すればよいか」。こんな企業の悩みの解消に経済産業省とIPAが2022年12月に公開した「デジタルスキル標準」が役立つ。しかし活用の際に「やってはいけない」2つの点が見えてきた。
·xtech.nikkei.com·
経産省とIPAがデジタルスキル標準を公開、見えた2つの「やってはいけない」
ASCII.jp:「AIトレパク」が問題に (1/3)
ASCII.jp:「AIトレパク」が問題に (1/3)
趣都・アキハバラの最新情報をお届けする角川アスキー総合研究所の情報サイト。PC/ITからテクノロジー、サイエンスまで、オタク、マニアの心を鷲づかみ。
·ascii.jp·
ASCII.jp:「AIトレパク」が問題に (1/3)
画像生成AI「Stable Diffusion」による画像生成や顔面高解像化などをコマンド一発で実行できる「ImaginAIry」
画像生成AI「Stable Diffusion」による画像生成や顔面高解像化などをコマンド一発で実行できる「ImaginAIry」
画像生成AI「Stable Diffusion」は文章(プロンプト)を入力するだけで好みの画像を生成してくれますが、ローカル環境でStable Diffusionを使う場合は複雑な初期設定が必要です。オープンソースで開発されているPythonパッケージ「ImaginAIry」なら、Stable Diffusionを用いた画像生成環境をpipで簡単に構築可能で、画像生成以外にもプロンプトによる画像編集や超解像機能も利用できてめちゃくちゃ便利そうなので、その機能をまとめてみました。
·gigazine.net·
画像生成AI「Stable Diffusion」による画像生成や顔面高解像化などをコマンド一発で実行できる「ImaginAIry」
画像生成AI「Stable Diffusion」開発元のStability AIがかつてGoogleを和解に持ち込ませたこともあるストックフォトサイトのGetty Imagesに訴えられる
画像生成AI「Stable Diffusion」開発元のStability AIがかつてGoogleを和解に持ち込ませたこともあるストックフォトサイトのGetty Imagesに訴えられる
ロイヤリティフリーの写真や画像といったコンテンツを有料で配信しているサービス「Getty Images」が画像生成AI「Stable Diffusion」開発元のStability AIがGetty Imagesの知的財産権を侵害したとして、法的手続きを開始したことを明らかにしました。
·gigazine.net·
画像生成AI「Stable Diffusion」開発元のStability AIがかつてGoogleを和解に持ち込ませたこともあるストックフォトサイトのGetty Imagesに訴えられる
Google Cloudが商品棚の在庫状況を天井カメラ・ロボット・店員からの動画や画像を分析することで追跡できるAIツールを発表
Google Cloudが商品棚の在庫状況を天井カメラ・ロボット・店員からの動画や画像を分析することで追跡できるAIツールを発表
Googleのクラウドコンピューティング部門であるGoogle Cloudが、2023年1月13日(金)にVertex AI Vision上に最先端のAIソリューションを構築し、小売店の店内在庫を認識・追跡することができるAIツールを発表しました。
·gigazine.net·
Google Cloudが商品棚の在庫状況を天井カメラ・ロボット・店員からの動画や画像を分析することで追跡できるAIツールを発表
無実の男性が顔認識システムの誤りのせいで1週間投獄される
無実の男性が顔認識システムの誤りのせいで1週間投獄される
機械学習を用いた顔認識システムは地下鉄の運賃や食堂の支払いを自動で行うといったシステムのほか、政府による監視網や犯罪の捜査に用いられています。一方で、顔認識システムの正確性やプライバシー面での是非も議論されており、イタリア規制当局が一部の犯罪捜査・抑止目的以外には利用を禁止したり、アメリカの大都市が相次いで当局による使用を禁止したりしています。特に有色人種の認識で誤認を起こしやすいことが確認されており、2022年末ごろに無実の黒人男性が顔認識システムの間違いにより不当に逮捕されたケースを弁護士が発表しています。
·gigazine.net·
無実の男性が顔認識システムの誤りのせいで1週間投獄される
防犯カメラ映像をリアルタイムで改ざんする政府御用達の恐るべき企業「Toka」の実態とは?
防犯カメラ映像をリアルタイムで改ざんする政府御用達の恐るべき企業「Toka」の実態とは?
防犯カメラによる映像は、事件の発生を抑制する監視の目になると同時に、実際に事件や事故が起きた際の状況や犯人を理解するためにも役立ちます。しかし、そんな防犯カメラの映像を、リアルタイムのものから過去の映像記録までハッキングして改ざんしてしまう知られざる企業「Toka」について、中東に関連するニュースを提供するHaaretz.comが解説しています。
·gigazine.net·
防犯カメラ映像をリアルタイムで改ざんする政府御用達の恐るべき企業「Toka」の実態とは?
AIでポルノ画像を作成するプロジェクト「Unstable Diffusion」がKickstarterでの出資募集をブロックされる
AIでポルノ画像を作成するプロジェクト「Unstable Diffusion」がKickstarterでの出資募集をブロックされる
画像生成AIの「Stable Diffusion」を使ってポルノコンテンツを作成するコミュニティ「Unstable Diffusion」が、クラウドファンディングサイト・Kickstarterのガイドライン変更に伴い、同サイトで行っていた出資を募るプロジェクトを停止されました。
·gigazine.net·
AIでポルノ画像を作成するプロジェクト「Unstable Diffusion」がKickstarterでの出資募集をブロックされる