画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2711 bookmarks
Custom sorting
私たちの目がどのように見たものを捉えて処理しているのかを視覚化したムービー
私たちの目がどのように見たものを捉えて処理しているのかを視覚化したムービー
私たちの目は、水晶体で集めた光の焦点を光彩で合わせ、網膜に像を投影して捉えたものを見ています。ただし、目に映った像をそのまま見ているわけではなく、見たものを脳で画像処理して認識しています。DIY等のムービーを投稿するカナダの家具デザイナーであるマティアス・ヴァンデル氏が、目で見たものを処理するプロセスや目の能力が持つ特色について視覚化したデモンストレーションを、自身のYouTubeチャンネルで解説しています。
·gigazine.net·
私たちの目がどのように見たものを捉えて処理しているのかを視覚化したムービー
画像生成AI・Midjourneyの各バージョンでさまざまなスタイルを出力した画像を集めた「Midlibrary」
画像生成AI・Midjourneyの各バージョンでさまざまなスタイルを出力した画像を集めた「Midlibrary」
画像生成AI「Midjourney」は、チャットツールのDiscordにテキストを入力することで、さまざまなスタイルの写真やイラストを生成してくれます。ビジュアルアーティストのアンドレイ・コバレフ氏をはじめとするMidjourneyユーザーの有志が運営する「Midlibrary」は、Midjourneyの各バージョンで生成したさまざまなスタイルの画像を保存・公開するサイトで、バージョンによる生成結果の違いを見比べることができるので、Midjourneyで画像を生成したい場合の参考になります。
·gigazine.net·
画像生成AI・Midjourneyの各バージョンでさまざまなスタイルを出力した画像を集めた「Midlibrary」
画像に「毒」を盛ることでAIによる画像学習を防止するツール「Nightshade」が一般公開され誰でも使用可能に
画像に「毒」を盛ることでAIによる画像学習を防止するツール「Nightshade」が一般公開され誰でも使用可能に
2024年1月19日、シカゴ大学の研究チームが開発した、AIによる画像の学習を防止するツール「Nightshade」が一般公開され、誰でもダウンロード可能になりました。
·gigazine.net·
画像に「毒」を盛ることでAIによる画像学習を防止するツール「Nightshade」が一般公開され誰でも使用可能に
VRAM容量12GBの「GeForce RTX 4070 SUPER」は画像生成AIでどれだけの性能を発揮するのか?旧世代グラボと徹底比較してみたよレビュー
VRAM容量12GBの「GeForce RTX 4070 SUPER」は画像生成AIでどれだけの性能を発揮するのか?旧世代グラボと徹底比較してみたよレビュー
2024年1月17日に発売した「GeForce RTX 4070 SUPER」はVRAMを12GB搭載しており、画像生成AIなどの生成系AIも快適に動作させられます。GeForce RTX 4070 SUPERのリファレンス実装である「GeForce RTX 4070 SUPER Founders Edition」を借りられたので、実際に画像生成AIを動作させて編集部にある「GeForce RTX 3060」や「GeForce RTX 3090」と処理性能を比較してみました。
·gigazine.net·
VRAM容量12GBの「GeForce RTX 4070 SUPER」は画像生成AIでどれだけの性能を発揮するのか?旧世代グラボと徹底比較してみたよレビュー
NVIDIAがSDRの映像をHDRに変換するAI技術「RTX Video HDR」を全RTXシリーズ向けにリリース
NVIDIAがSDRの映像をHDRに変換するAI技術「RTX Video HDR」を全RTXシリーズ向けにリリース
NVIDIAが、GeForce RTX 4070 Ti SUPERが発売された2024年1月24日に、SDR(標準ダイナミックレンジ)の映像をHDR(ハイダイナミックレンジ)映像に変換する機能「RTX Video HDR」がGeForce RTXシリーズで使えるようになるドライバーアップデートをリリースしました
·gigazine.net·
NVIDIAがSDRの映像をHDRに変換するAI技術「RTX Video HDR」を全RTXシリーズ向けにリリース
Googleが超高品質な動画生成AI「Lumiere」を発表、フレーム同士のつながりが自然で「テキストや画像から動画生成」「写真の一部を動画化」「動画の一部分を指定して加工」などなど機能てんこもり
Googleが超高品質な動画生成AI「Lumiere」を発表、フレーム同士のつながりが自然で「テキストや画像から動画生成」「写真の一部を動画化」「動画の一部分を指定して加工」などなど機能てんこもり
Googleの研究チームが動画生成AI「Lumiere」を2024年1月24日(水)に発表しました。Lumiereではフレーム同士が自然につながった違和感の少ない動画を生成可能で、テキストや画像を入力して動画を生成できるほか、動画の一部分を指定して別の動画に置き換えたり、写真の一部分だけを動かしたりといった操作も可能です。
·gigazine.net·
Googleが超高品質な動画生成AI「Lumiere」を発表、フレーム同士のつながりが自然で「テキストや画像から動画生成」「写真の一部を動画化」「動画の一部分を指定して加工」などなど機能てんこもり
画像生成AI「Stable Diffusion」と「Midjourney」に対する集団訴訟でイギリスの写真家が団結呼びかけ
画像生成AI「Stable Diffusion」と「Midjourney」に対する集団訴訟でイギリスの写真家が団結呼びかけ
画像生成AIのトレーニングに作品を無断利用されたことについて、著作権侵害やデジタルミレニアム著作権法(DMCA)違反であるとして、アメリカの画家らが画像生成AI「Stable Diffusion」や「Midjourney」に対して起こした集団訴訟で、イギリスのアート界も団結しなければならないとの呼びかけが行われています。場合によっては、イギリスで独自の集団訴訟が起こされる可能性も示唆されています。
·gigazine.net·
画像生成AI「Stable Diffusion」と「Midjourney」に対する集団訴訟でイギリスの写真家が団結呼びかけ
最低1枚の元写真があれば、高品質本人画像をすぐに生成できる「PhotoMaker」を試したらお手軽すぎた(CloseBox) | テクノエッジ TechnoEdge
最低1枚の元写真があれば、高品質本人画像をすぐに生成できる「PhotoMaker」を試したらお手軽すぎた(CloseBox) | テクノエッジ TechnoEdge
最低1枚の写真があれば、その人物の画像をいくらでも生成できる。そんな技術が登場したので使ってみた。
·techno-edge.net·
最低1枚の元写真があれば、高品質本人画像をすぐに生成できる「PhotoMaker」を試したらお手軽すぎた(CloseBox) | テクノエッジ TechnoEdge
画像生成AI「Midjourney」のトレーニングに作品が使用されたアーティストが心中を吐露
画像生成AI「Midjourney」のトレーニングに作品が使用されたアーティストが心中を吐露
画像生成AIのMidjourneyのトレーニングに用いられたとされる作品のアーティストをまとめたリストの存在が明らかになりました。ウェブ漫画「Cat and Girl」を発表を発表しているドロシーさんもそのリストに名前が載っていた1人で、その心中を自身のサイトで発表しています。
·gigazine.net·
画像生成AI「Midjourney」のトレーニングに作品が使用されたアーティストが心中を吐露
TikTokの親会社ByteDanceがテキストから高品質かつ忠実な動画を生成するAI「MagicVideo-V2」を発表
TikTokの親会社ByteDanceがテキストから高品質かつ忠実な動画を生成するAI「MagicVideo-V2」を発表
TikTokの親会社であるByteDanceの研究チームが、テキストに忠実かつ高品質な動画を生成するAI「MagicVideo-V2」を発表しました。人間によるパフォーマンス評価では、MagicVideo-V2がテキストから動画を生成するその他の最先端AIよりも優れているという結果が得られたとのことです。
·gigazine.net·
TikTokの親会社ByteDanceがテキストから高品質かつ忠実な動画を生成するAI「MagicVideo-V2」を発表
顔写真を入力して似た顔の画像をサクッと生成できる画像生成AIが無料公開されたので使ってみた
顔写真を入力して似た顔の画像をサクッと生成できる画像生成AIが無料公開されたので使ってみた
人物の顔写真を入力して同じ顔の画像を生成できるAIが、AIオンリーSNS「Chirper」の一機能として追加されました。記事作成時点では画像生成機能を無料で使用可能だったので、実際にどんな画像を生成できるのか確かめてみました。
·gigazine.net·
顔写真を入力して似た顔の画像をサクッと生成できる画像生成AIが無料公開されたので使ってみた
画像を分析してキャプションを自動で生成してくれるオープンソースで商用利用も可能なAIモデル「BLIP-2」をReplicate上で使ってみた
画像を分析してキャプションを自動で生成してくれるオープンソースで商用利用も可能なAIモデル「BLIP-2」をReplicate上で使ってみた
AIモデルを誰でも簡単にデプロイできるサイト「Replicate」にて、画像を分析してキャプションを生成するAIモデルのBLIP-2が簡単に利用できるとのことなので、実際にいくつかの画像を元にキャプションを生成させてみました。
·gigazine.net·
画像を分析してキャプションを自動で生成してくれるオープンソースで商用利用も可能なAIモデル「BLIP-2」をReplicate上で使ってみた
画像生成AI「Midjourney」のデイビッド・ホルツCEOとは何者なのか、2008年に「Leap Motion」を共同設立してからMidjourneyを開発するまで
画像生成AI「Midjourney」のデイビッド・ホルツCEOとは何者なのか、2008年に「Leap Motion」を共同設立してからMidjourneyを開発するまで
テキストから画像を自動生成するAIの「Midjourney」は、同名のAIスタートアップ企業によって運営されています。Midjourney社は設立して約1年半が経過しますが、これまでベンチャーキャピタリストから1円も投資を受けていないにもかかわらず、2億ドル(約290億円)の年間収益を計上しています。このMidjourney社のCEOを務めるのがデイビッド・ホルツ氏で、過去にはLeap Motionを共同設立した経歴もあります。
·gigazine.net·
画像生成AI「Midjourney」のデイビッド・ホルツCEOとは何者なのか、2008年に「Leap Motion」を共同設立してからMidjourneyを開発するまで
GPT-4を無料で使えて画像の詳細も聞けるMicrosoftのチャットAI「Microsoft Copilot」のiOS版が公開されたので使ってみた
GPT-4を無料で使えて画像の詳細も聞けるMicrosoftのチャットAI「Microsoft Copilot」のiOS版が公開されたので使ってみた
MicrosoftのチャットAI「Microsoft Copilot」のiOS向けアプリが2023年12月29日に登場しました。iOS版のMicrosoft Copilotでは文章だけでなく画像を使ったコミュニケーションも可能なほか、アカウント作成不要でGPT-4とのチャットも可能とのこと。実際にiPhoneにMicrosoft Copilotをインストールして使ってみました。
·gigazine.net·
GPT-4を無料で使えて画像の詳細も聞けるMicrosoftのチャットAI「Microsoft Copilot」のiOS版が公開されたので使ってみた
人は直感的に「AIが生成した絵画」より人間の絵を好むことが判明、AI作品は「不気味の谷現象」に陥っている可能性
人は直感的に「AIが生成した絵画」より人間の絵を好むことが判明、AI作品は「不気味の谷現象」に陥っている可能性
画像生成AIが出力した絵画を人間が描いた絵と見比べてもらう実験を行ったところ、どちらが描いた絵なのかわからなくても人間の絵の方が高く評価され、親しみやすく感じられることが確かめられました。
·gigazine.net·
人は直感的に「AIが生成した絵画」より人間の絵を好むことが判明、AI作品は「不気味の谷現象」に陥っている可能性
キヤノン・ニコン・ソニーが写真にデジタル署名を埋め込むカメラ技術を開発中、AIが生成した精巧な偽物と写真を区別するのに役立つ可能性あり
キヤノン・ニコン・ソニーが写真にデジタル署名を埋め込むカメラ技術を開発中、AIが生成した精巧な偽物と写真を区別するのに役立つ可能性あり
AI技術の発展によって、実写と見分けが付かない精巧な画像を作成できるようになりました。しかし、画像生成AIで作成した精巧な画像は偽情報の拡散に用いられる可能性があるため、画像生成AIによって生成した画像とカメラで撮影した本物の写真を正確に見分ける技術の開発が求められています。新たに、キヤノン・ニコン・ソニーといったカメラメーカーが写真に「実写であることを証明するデジタル署名」を埋め込む技術を開発していることが報じられています。
·gigazine.net·
キヤノン・ニコン・ソニーが写真にデジタル署名を埋め込むカメラ技術を開発中、AIが生成した精巧な偽物と写真を区別するのに役立つ可能性あり
YouTubeが「AIで殺人事件の被害者をよみがえらせるディープフェイク映像」の削除を開始すると発表
YouTubeが「AIで殺人事件の被害者をよみがえらせるディープフェイク映像」の削除を開始すると発表
YouTubeがコミュニティガイドラインを改訂し、死亡した未成年や重大な暴力事件の被害者をリアルに再現して事件の一部始終を語らせるコンテンツの取り締まりを2024年1月16日に開始すると発表しました。
·gigazine.net·
YouTubeが「AIで殺人事件の被害者をよみがえらせるディープフェイク映像」の削除を開始すると発表
MidjourneyがAIトレーニングに用いた6歳児を含む1万6000人のアーティストリストの存在が発覚
MidjourneyがAIトレーニングに用いた6歳児を含む1万6000人のアーティストリストの存在が発覚
画像生成AI・Midjourneyのトレーニングに用いられたとされる、合計1万6000人以上のアーティストの名前が入ったリストの存在が明らかになりました。リストにはウォルト・ディズニーや草間彌生、フリーダ・カーロなどの著名アーティストも含まれていました。
·gigazine.net·
MidjourneyがAIトレーニングに用いた6歳児を含む1万6000人のアーティストリストの存在が発覚
AIが作成した偽セレブの詐欺的広告動画がYouTubeで1億9500万回以上再生されている
AIが作成した偽セレブの詐欺的広告動画がYouTubeで1億9500万回以上再生されている
AIを使って作成された著名人などの偽動画・ディープフェイクを用いた詐欺的広告動画が、YouTube上で横行していると指摘されています。ディープフェイクを作成された著名人にはジョー・ローガン、テイラー・スウィフト、アンドリュー・テイト、スティーブ・ハーベイ、ドウェイン・ジョンソン、オプラ・ウィンフリーなどが名を連ねており、ディープフェイク広告動画はYouTube上で合計1億9500万回以上再生されているようです。
·gigazine.net·
AIが作成した偽セレブの詐欺的広告動画がYouTubeで1億9500万回以上再生されている
写真撮影後に表情を入れ替えてしまうGoogle Pixel 8のAI機能「ベストテイク」が物議を醸す
写真撮影後に表情を入れ替えてしまうGoogle Pixel 8のAI機能「ベストテイク」が物議を醸す
2023年10月に発売されたGoogleの純正スマートフォン「Google Pixel 8」と「Google Pixel 8 Pro」には、被写体の人物それぞれのベストな表情を選択して、1枚の集合写真に合成するAI編集機能「ベストテイク」が搭載されています。そんな「ベストテイク」をめぐって、「本物の写真とは何か」という議論が巻き起こっています。
·gigazine.net·
写真撮影後に表情を入れ替えてしまうGoogle Pixel 8のAI機能「ベストテイク」が物議を醸す
手のジェスチャーで空中に絵を描ける「Airdraw」、ウェブカメラだけで手の動きを認識し特別な機材は不要
手のジェスチャーで空中に絵を描ける「Airdraw」、ウェブカメラだけで手の動きを認識し特別な機材は不要
「指を2本立てて線を描く」「指を3本立てて線を削除」といったように指の本数や動きに応じて絵を描けるウェブアプリが「Airdraw」です。Airdrawはウェブカメラさえあれば使えるとのことなので、実際に試してみました。
·gigazine.net·
手のジェスチャーで空中に絵を描ける「Airdraw」、ウェブカメラだけで手の動きを認識し特別な機材は不要
WebP/AVIF画像をJPEGやPNG形式に変換してダウンロードし保存できるブラウザ拡張「WebP / Avif image converter」レビュー
WebP/AVIF画像をJPEGやPNG形式に変換してダウンロードし保存できるブラウザ拡張「WebP / Avif image converter」レビュー
ページに挿入する画像の形式として「WebP」や「AVIF」を採用するウェブサイトが増えつつあります。しかし、画像ビューワや画像編集ソフトの中にはWebPやAVIFに対応していないものも多く、「ウェブページから画像をダウンロードしたものの、WebP形式の画像だったから編集ソフトやビューワで開けない」といった状況に遭遇した経験がある人も多いはず。ブラウザ向けの拡張機能「WebP / Avif image converter」を使えばWebPやAVIF形式の画像をJEGやPNGなどの扱いやすい形式に変換しつつダウンロード可能とのことなので、実際にインストールする手順や使い方を確かめてみました。
·gigazine.net·
WebP/AVIF画像をJPEGやPNG形式に変換してダウンロードし保存できるブラウザ拡張「WebP / Avif image converter」レビュー
ラファエロの絵は共同制作だった可能性がAIを使った研究で明らかに
ラファエロの絵は共同制作だった可能性がAIを使った研究で明らかに
ルネサンス期を代表するイタリアの画家・ラファエロによる著名作品「バラの聖母」をAIを用いて調査したところ、大部分はラファエロの手によるものだったものの、一部、ラファエロ以外の手が加わっていたことが明らかになりました。
·gigazine.net·
ラファエロの絵は共同制作だった可能性がAIを使った研究で明らかに
Appleが画像を見て質問に答えられる大規模言語モデル「Ferret」を開発、ウェイトの情報が公開される
Appleが画像を見て質問に答えられる大規模言語モデル「Ferret」を開発、ウェイトの情報が公開される
画像とテキストを組み合わせてタスクをこなせるマルチモーダル大規模言語モデルの「Ferret」のウェイト情報をAppleが公開しました。ウェイトのデータはCC-BY-NCライセンスでの提供となっており、研究目的でのみ利用可能です。
·gigazine.net·
Appleが画像を見て質問に答えられる大規模言語モデル「Ferret」を開発、ウェイトの情報が公開される
「YouTubeにはどれだけの動画が保存されていてどれだけの人が見ているのか」を科学的に調査するために開発された手法とは?
「YouTubeにはどれだけの動画が保存されていてどれだけの人が見ているのか」を科学的に調査するために開発された手法とは?
動画配信プラットフォームのYouTubeは今やインターネットユーザーのほとんどが一度はお世話になっているといっても過言ではないサービスとなっており、ソーシャルメディアの中では最大規模を誇ります。マサチューセッツ大学アマースト校で公共政策、コミュニケーション、情報学を教えるイーサン・ザッカーマン准教授が、このYouTubeの規模を科学的に把握するために構築した調査方法を解説しています。
·gigazine.net·
「YouTubeにはどれだけの動画が保存されていてどれだけの人が見ているのか」を科学的に調査するために開発された手法とは?
画像生成AI「Stable Diffusion」などに使われた50億枚超の画像セット「LAION-5B」に1008枚の児童ポルノ画像が入っていることが判明し削除へ
画像生成AI「Stable Diffusion」などに使われた50億枚超の画像セット「LAION-5B」に1008枚の児童ポルノ画像が入っていることが判明し削除へ
スタンフォード大学インターネット天文台(SIO)の調査により、画像生成AI「Stable Diffusion」などのトレーニングに利用されているオープンデータセットの「LAION-5B」に、児童性的虐待画像(CSAM)が含まれていることが明らかになりました。CSAMの疑いのある画像は3226枚で、そのうち1008枚が外部機関の検証によりCSAMであると確認されました。
·gigazine.net·
画像生成AI「Stable Diffusion」などに使われた50億枚超の画像セット「LAION-5B」に1008枚の児童ポルノ画像が入っていることが判明し削除へ
顧客を過去の万引犯と間違える低品質AIを導入したドラッグストアに5年間技術使用禁止の罰が与えられる
顧客を過去の万引犯と間違える低品質AIを導入したドラッグストアに5年間技術使用禁止の罰が与えられる
顧客の顔をデータベースと照合して問題のある人物を特定するAIを導入した大手ドラッグストア「ライト・エイド」に対し、アメリカの連邦取引委員会(FTC)が「監視目的での顔認識技術使用の禁止」を言い渡しました。これによりライト・エイドは技術使用を5年間禁じられ、過去に収集したデータの保護を行う義務も課せられました。
·gigazine.net·
顧客を過去の万引犯と間違える低品質AIを導入したドラッグストアに5年間技術使用禁止の罰が与えられる
チャットAIが出力した文書を画像生成AIで画像化するプロセスを伝言ゲームのように何度も繰り返すと画像がどんな風に変化していくかがわかる「Image Telephone」
チャットAIが出力した文書を画像生成AIで画像化するプロセスを伝言ゲームのように何度も繰り返すと画像がどんな風に変化していくかがわかる「Image Telephone」
「チャットAIに画像を入力してキャプションを付けさせ、これを画像生成AIのDALL-Eで画像化し、再びチャットAIに入力して……」というプロセスを何度も繰り返し、AIが生成する画像がどのように変化していくのかを観察できるのが「Image Telephone」です。作者のelijahbenizzyさんは「自分でやってみたところ結果が非常に興味深いものだったためアプリ化して誰でも気軽に体験できるようにしてみました」と説明しています。
·gigazine.net·
チャットAIが出力した文書を画像生成AIで画像化するプロセスを伝言ゲームのように何度も繰り返すと画像がどんな風に変化していくかがわかる「Image Telephone」