画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2306 bookmarks
Custom sorting
キヤノン・ニコン・ソニーが写真にデジタル署名を埋め込むカメラ技術を開発中、AIが生成した精巧な偽物と写真を区別するのに役立つ可能性あり
キヤノン・ニコン・ソニーが写真にデジタル署名を埋め込むカメラ技術を開発中、AIが生成した精巧な偽物と写真を区別するのに役立つ可能性あり
AI技術の発展によって、実写と見分けが付かない精巧な画像を作成できるようになりました。しかし、画像生成AIで作成した精巧な画像は偽情報の拡散に用いられる可能性があるため、画像生成AIによって生成した画像とカメラで撮影した本物の写真を正確に見分ける技術の開発が求められています。新たに、キヤノン・ニコン・ソニーといったカメラメーカーが写真に「実写であることを証明するデジタル署名」を埋め込む技術を開発していることが報じられています。
·gigazine.net·
キヤノン・ニコン・ソニーが写真にデジタル署名を埋め込むカメラ技術を開発中、AIが生成した精巧な偽物と写真を区別するのに役立つ可能性あり
YouTubeが「AIで殺人事件の被害者をよみがえらせるディープフェイク映像」の削除を開始すると発表
YouTubeが「AIで殺人事件の被害者をよみがえらせるディープフェイク映像」の削除を開始すると発表
YouTubeがコミュニティガイドラインを改訂し、死亡した未成年や重大な暴力事件の被害者をリアルに再現して事件の一部始終を語らせるコンテンツの取り締まりを2024年1月16日に開始すると発表しました。
·gigazine.net·
YouTubeが「AIで殺人事件の被害者をよみがえらせるディープフェイク映像」の削除を開始すると発表
MidjourneyがAIトレーニングに用いた6歳児を含む1万6000人のアーティストリストの存在が発覚
MidjourneyがAIトレーニングに用いた6歳児を含む1万6000人のアーティストリストの存在が発覚
画像生成AI・Midjourneyのトレーニングに用いられたとされる、合計1万6000人以上のアーティストの名前が入ったリストの存在が明らかになりました。リストにはウォルト・ディズニーや草間彌生、フリーダ・カーロなどの著名アーティストも含まれていました。
·gigazine.net·
MidjourneyがAIトレーニングに用いた6歳児を含む1万6000人のアーティストリストの存在が発覚
AIが作成した偽セレブの詐欺的広告動画がYouTubeで1億9500万回以上再生されている
AIが作成した偽セレブの詐欺的広告動画がYouTubeで1億9500万回以上再生されている
AIを使って作成された著名人などの偽動画・ディープフェイクを用いた詐欺的広告動画が、YouTube上で横行していると指摘されています。ディープフェイクを作成された著名人にはジョー・ローガン、テイラー・スウィフト、アンドリュー・テイト、スティーブ・ハーベイ、ドウェイン・ジョンソン、オプラ・ウィンフリーなどが名を連ねており、ディープフェイク広告動画はYouTube上で合計1億9500万回以上再生されているようです。
·gigazine.net·
AIが作成した偽セレブの詐欺的広告動画がYouTubeで1億9500万回以上再生されている
写真撮影後に表情を入れ替えてしまうGoogle Pixel 8のAI機能「ベストテイク」が物議を醸す
写真撮影後に表情を入れ替えてしまうGoogle Pixel 8のAI機能「ベストテイク」が物議を醸す
2023年10月に発売されたGoogleの純正スマートフォン「Google Pixel 8」と「Google Pixel 8 Pro」には、被写体の人物それぞれのベストな表情を選択して、1枚の集合写真に合成するAI編集機能「ベストテイク」が搭載されています。そんな「ベストテイク」をめぐって、「本物の写真とは何か」という議論が巻き起こっています。
·gigazine.net·
写真撮影後に表情を入れ替えてしまうGoogle Pixel 8のAI機能「ベストテイク」が物議を醸す
手のジェスチャーで空中に絵を描ける「Airdraw」、ウェブカメラだけで手の動きを認識し特別な機材は不要
手のジェスチャーで空中に絵を描ける「Airdraw」、ウェブカメラだけで手の動きを認識し特別な機材は不要
「指を2本立てて線を描く」「指を3本立てて線を削除」といったように指の本数や動きに応じて絵を描けるウェブアプリが「Airdraw」です。Airdrawはウェブカメラさえあれば使えるとのことなので、実際に試してみました。
·gigazine.net·
手のジェスチャーで空中に絵を描ける「Airdraw」、ウェブカメラだけで手の動きを認識し特別な機材は不要
WebP/AVIF画像をJPEGやPNG形式に変換してダウンロードし保存できるブラウザ拡張「WebP / Avif image converter」レビュー
WebP/AVIF画像をJPEGやPNG形式に変換してダウンロードし保存できるブラウザ拡張「WebP / Avif image converter」レビュー
ページに挿入する画像の形式として「WebP」や「AVIF」を採用するウェブサイトが増えつつあります。しかし、画像ビューワや画像編集ソフトの中にはWebPやAVIFに対応していないものも多く、「ウェブページから画像をダウンロードしたものの、WebP形式の画像だったから編集ソフトやビューワで開けない」といった状況に遭遇した経験がある人も多いはず。ブラウザ向けの拡張機能「WebP / Avif image converter」を使えばWebPやAVIF形式の画像をJEGやPNGなどの扱いやすい形式に変換しつつダウンロード可能とのことなので、実際にインストールする手順や使い方を確かめてみました。
·gigazine.net·
WebP/AVIF画像をJPEGやPNG形式に変換してダウンロードし保存できるブラウザ拡張「WebP / Avif image converter」レビュー
ラファエロの絵は共同制作だった可能性がAIを使った研究で明らかに
ラファエロの絵は共同制作だった可能性がAIを使った研究で明らかに
ルネサンス期を代表するイタリアの画家・ラファエロによる著名作品「バラの聖母」をAIを用いて調査したところ、大部分はラファエロの手によるものだったものの、一部、ラファエロ以外の手が加わっていたことが明らかになりました。
·gigazine.net·
ラファエロの絵は共同制作だった可能性がAIを使った研究で明らかに
Appleが画像を見て質問に答えられる大規模言語モデル「Ferret」を開発、ウェイトの情報が公開される
Appleが画像を見て質問に答えられる大規模言語モデル「Ferret」を開発、ウェイトの情報が公開される
画像とテキストを組み合わせてタスクをこなせるマルチモーダル大規模言語モデルの「Ferret」のウェイト情報をAppleが公開しました。ウェイトのデータはCC-BY-NCライセンスでの提供となっており、研究目的でのみ利用可能です。
·gigazine.net·
Appleが画像を見て質問に答えられる大規模言語モデル「Ferret」を開発、ウェイトの情報が公開される
「YouTubeにはどれだけの動画が保存されていてどれだけの人が見ているのか」を科学的に調査するために開発された手法とは?
「YouTubeにはどれだけの動画が保存されていてどれだけの人が見ているのか」を科学的に調査するために開発された手法とは?
動画配信プラットフォームのYouTubeは今やインターネットユーザーのほとんどが一度はお世話になっているといっても過言ではないサービスとなっており、ソーシャルメディアの中では最大規模を誇ります。マサチューセッツ大学アマースト校で公共政策、コミュニケーション、情報学を教えるイーサン・ザッカーマン准教授が、このYouTubeの規模を科学的に把握するために構築した調査方法を解説しています。
·gigazine.net·
「YouTubeにはどれだけの動画が保存されていてどれだけの人が見ているのか」を科学的に調査するために開発された手法とは?
画像生成AI「Stable Diffusion」などに使われた50億枚超の画像セット「LAION-5B」に1008枚の児童ポルノ画像が入っていることが判明し削除へ
画像生成AI「Stable Diffusion」などに使われた50億枚超の画像セット「LAION-5B」に1008枚の児童ポルノ画像が入っていることが判明し削除へ
スタンフォード大学インターネット天文台(SIO)の調査により、画像生成AI「Stable Diffusion」などのトレーニングに利用されているオープンデータセットの「LAION-5B」に、児童性的虐待画像(CSAM)が含まれていることが明らかになりました。CSAMの疑いのある画像は3226枚で、そのうち1008枚が外部機関の検証によりCSAMであると確認されました。
·gigazine.net·
画像生成AI「Stable Diffusion」などに使われた50億枚超の画像セット「LAION-5B」に1008枚の児童ポルノ画像が入っていることが判明し削除へ
顧客を過去の万引犯と間違える低品質AIを導入したドラッグストアに5年間技術使用禁止の罰が与えられる
顧客を過去の万引犯と間違える低品質AIを導入したドラッグストアに5年間技術使用禁止の罰が与えられる
顧客の顔をデータベースと照合して問題のある人物を特定するAIを導入した大手ドラッグストア「ライト・エイド」に対し、アメリカの連邦取引委員会(FTC)が「監視目的での顔認識技術使用の禁止」を言い渡しました。これによりライト・エイドは技術使用を5年間禁じられ、過去に収集したデータの保護を行う義務も課せられました。
·gigazine.net·
顧客を過去の万引犯と間違える低品質AIを導入したドラッグストアに5年間技術使用禁止の罰が与えられる
チャットAIが出力した文書を画像生成AIで画像化するプロセスを伝言ゲームのように何度も繰り返すと画像がどんな風に変化していくかがわかる「Image Telephone」
チャットAIが出力した文書を画像生成AIで画像化するプロセスを伝言ゲームのように何度も繰り返すと画像がどんな風に変化していくかがわかる「Image Telephone」
「チャットAIに画像を入力してキャプションを付けさせ、これを画像生成AIのDALL-Eで画像化し、再びチャットAIに入力して……」というプロセスを何度も繰り返し、AIが生成する画像がどのように変化していくのかを観察できるのが「Image Telephone」です。作者のelijahbenizzyさんは「自分でやってみたところ結果が非常に興味深いものだったためアプリ化して誰でも気軽に体験できるようにしてみました」と説明しています。
·gigazine.net·
チャットAIが出力した文書を画像生成AIで画像化するプロセスを伝言ゲームのように何度も繰り返すと画像がどんな風に変化していくかがわかる「Image Telephone」
秒間100枚以上の画像を生成できる爆速画像生成パイプライン「StreamDiffusion」が登場
秒間100枚以上の画像を生成できる爆速画像生成パイプライン「StreamDiffusion」が登場
ソースからのデータ入力、機械学習モデルへのデータ出力、学習パターンの調整といった一連の処理構造「パイプライン」をリアルタイム画像生成のために最適化した「StreamDiffusion」が登場しました。
·gigazine.net·
秒間100枚以上の画像を生成できる爆速画像生成パイプライン「StreamDiffusion」が登場
プーチン大統領のディープフェイクが本物のプーチン大統領と公開質疑で対面し本人に「影武者はいるの?」と質問
プーチン大統領のディープフェイクが本物のプーチン大統領と公開質疑で対面し本人に「影武者はいるの?」と質問
2023年12月14日にロシアのウラジーミル・プーチン大統領が年末恒例の質疑応答イベントを開催しました。このイベントの中で国民からの質問として「プーチン大統領の外見や声を再現したディープフェイクがプーチン大統領に質問する映像」が映し出され、プーチン大統領が自身のディープフェイクに対して応答する一幕がありました。
·gigazine.net·
プーチン大統領のディープフェイクが本物のプーチン大統領と公開質疑で対面し本人に「影武者はいるの?」と質問
AIモデルは「網膜の写真」だけで子どもが自閉症かどうか100%見分けられるという研究結果
AIモデルは「網膜の写真」だけで子どもが自閉症かどうか100%見分けられるという研究結果
コミュニケーションや行動などに特徴がみられる自閉症スペクトラム症(ASD)の子どもを「網膜の写真」だけで100%の精度で見分けられるディープラーニングAIモデルを、韓国の延世大学医学部の研究チームが開発しました。ASDの子どもを早期診断する客観的なスクリーニングツールとして、AIが有望な選択肢になる可能性があると期待されています。
·gigazine.net·
AIモデルは「網膜の写真」だけで子どもが自閉症かどうか100%見分けられるという研究結果
Facebookは既に画像生成AIが作ったパクリ投稿で埋め尽くされている
Facebookは既に画像生成AIが作ったパクリ投稿で埋め尽くされている
2019年に、FacebookがAIでプロフィール画像を合成した偽アカウントを削除したと発表したことが報道されるなど、AIは以前からソーシャルメディアの頭痛の種でしたが、これまでAI画像を見破るのは難しいことではありませんでした。ところが、リアルな画像を大量に出力できる生成AIの発達により、かつて予言されていた「生成AIが大量生産したゴミコンテンツが生身の人間の努力を圧倒する」という未来が既に現実のものとなっていると、IT系ニュースサイトの404 Mediaが報じました。
·gigazine.net·
Facebookは既に画像生成AIが作ったパクリ投稿で埋め尽くされている
簡単なテキストから写実的な動画を生成する拡散モデル「W.A.L.T」が登場
簡単なテキストから写実的な動画を生成する拡散モデル「W.A.L.T」が登場
スタンフォード大学やGoogleの研究チームが、テキストから写実的な動画を生成する拡散モデルである「W.A.L.T」を発表しました。実際に「W.A.L.T」を使用して生成した動画も多数公開されています。
·gigazine.net·
簡単なテキストから写実的な動画を生成する拡散モデル「W.A.L.T」が登場
たった1枚の画像から高品質なアニメーションを作成できる技術が登場、人型のイラストや写真が1枚あれば自由自在に振付を付与できる
たった1枚の画像から高品質なアニメーションを作成できる技術が登場、人型のイラストや写真が1枚あれば自由自在に振付を付与できる
元となる画像データと「動作」のデータを入力することで元の画像を動作データの通りにアニメーションさせる技術の論文がAlibabaの研究チームから発表されました。「Animate Anyone」と名付けられたこの技術を使用することで、ちらつきの少ない高品質なアニメーションが生成可能です。
·gigazine.net·
たった1枚の画像から高品質なアニメーションを作成できる技術が登場、人型のイラストや写真が1枚あれば自由自在に振付を付与できる
画像生成AIでさまざまなだまし絵を自動生成する「Visual Anagrams」
画像生成AIでさまざまなだまし絵を自動生成する「Visual Anagrams」
見る方向や絵の形を変えることで、意味や見た目が変わってしまう「だまし絵」を、拡散モデルの画像生成AIで自動生成する技術「Visual Anagrams」をミシガン大学の研究チームが発表しました。
·gigazine.net·
画像生成AIでさまざまなだまし絵を自動生成する「Visual Anagrams」
iPhoneが100万分の1の確率で偶然撮影してしまった「あまりにも不思議で奇妙な写真」とは?
iPhoneが100万分の1の確率で偶然撮影してしまった「あまりにも不思議で奇妙な写真」とは?
AppleのiPhoneやGoogleのPixelなど、ハイエンドスマートフォンには高機能なカメラが搭載されており、誰でも簡単にいつでも美麗な写真を撮影できます。そんなiPhoneのカメラで「決して現実では起こり得ない光景」が偶然撮影できてしまった非常に珍しい例を、カメラ関連のニュースサイトであるPetaPixelが紹介しています。
·gigazine.net·
iPhoneが100万分の1の確率で偶然撮影してしまった「あまりにも不思議で奇妙な写真」とは?
世界初の「スマホで自撮りできる巨大なカメラ・オブスキュラ」とはどんなカメラなのか?
世界初の「スマホで自撮りできる巨大なカメラ・オブスキュラ」とはどんなカメラなのか?
小さな穴を使ってスクリーンに目の前の光景を投影する「カメラ・オブスキュラ」という装置は、写真を撮影するカメラの元祖といえます。イギリスのファルマス大学で写真学を教えるデビッド・ホワイト氏が約2メートル四方の巨大な「自撮り用カメラ・オブスキュラ」を開発したと、写真やカメラに関するニュースサイト・PetaPixelが紹介しています。
·gigazine.net·
世界初の「スマホで自撮りできる巨大なカメラ・オブスキュラ」とはどんなカメラなのか?
画像を見て質問に答えられるオープンソースなGPT-4レベルのAI「LLaVA-1.5」をGCP上で動作させてみた
画像を見て質問に答えられるオープンソースなGPT-4レベルのAI「LLaVA-1.5」をGCP上で動作させてみた
Microsoftやウィスコンシン大学マディソン校などの研究チームが開発し、2023年4月17日に公開した「LLaVA」は「視覚」を持つAIで、画像を入力するとその画像に基づいて返答を行うことができます。2023年10月5日に登場したLLaVA-1.5はさらにクオリティが向上しているとのことなので、実際にGoogleのクラウドコンピューティングサービス「Google Cloud Platform(GCP)」上で動作させてみました。
·gigazine.net·
画像を見て質問に答えられるオープンソースなGPT-4レベルのAI「LLaVA-1.5」をGCP上で動作させてみた
Metaが画像生成AI「Imagine」を無料で使えるウェブアプリをリリース、Emuモデルを利用しプロンプトごとに4つの画像を生成可能
Metaが画像生成AI「Imagine」を無料で使えるウェブアプリをリリース、Emuモデルを利用しプロンプトごとに4つの画像を生成可能
Metaが画像生成AI「Imagine」を無料で使えるウェブアプリ「Imagine With Meta AI」を公開しました。Imagine With Meta AIは無料で利用可能で、文章(プロンプト)を入力するだけで画像を4枚生成できるとのこと。すでに海外メディアが作例を公開しています。
·gigazine.net·
Metaが画像生成AI「Imagine」を無料で使えるウェブアプリをリリース、Emuモデルを利用しプロンプトごとに4つの画像を生成可能
文字・音楽・画像を同時に処理する「マルチモーダルAI」の性能がよく分かるGoogleの「Gemini」ハウツー動画11種を解説
文字・音楽・画像を同時に処理する「マルチモーダルAI」の性能がよく分かるGoogleの「Gemini」ハウツー動画11種を解説
2023年12月6日、Googleが文字・音楽・画像を同時に処理するマルチモーダルAI「Gemini」をリリースしました。リリースに合わせてGeminiの使い方解説動画がアップロードされていたので確認してみました。
·gigazine.net·
文字・音楽・画像を同時に処理する「マルチモーダルAI」の性能がよく分かるGoogleの「Gemini」ハウツー動画11種を解説
AI生成顔写真で人間になりすましたAIライターの記事を老舗スポーツメディアが掲載
AI生成顔写真で人間になりすましたAIライターの記事を老舗スポーツメディアが掲載
AIの性能は日々進歩しており、大手メディアが記事作成に文章生成AIを導入した事例もあります。新たに、大手スポーツ関連メディアの「Sports Illustrated」が人間が作成したように見せかけたAI生成記事を公開していたことが明らかになりました。Sports IllustratedはAI生成記事の存在が報じられた後に当該記事を削除しています。
·gigazine.net·
AI生成顔写真で人間になりすましたAIライターの記事を老舗スポーツメディアが掲載
ついにWindowsの「ペイント」に画像生成AIが搭載されイラスト生成や写真生成が可能に
ついにWindowsの「ペイント」に画像生成AIが搭載されイラスト生成や写真生成が可能に
Windowsの標準お絵描きアプリ「ペイント」に画像生成機能を追加するアップデートが実施されました。画像生成機能はOpenAIが開発した画像生成AI「DALL-E」を用いて実現されており、すでに海外メディアが高品質なイラストの生成例を公開しています。
·gigazine.net·
ついにWindowsの「ペイント」に画像生成AIが搭載されイラスト生成や写真生成が可能に
Amazonがプロンプトからさまざまな画像を生成できる画像生成AI「Titan Image Generator」のプレビュー版をAmazon Bedrockユーザー向けにリリース
Amazonがプロンプトからさまざまな画像を生成できる画像生成AI「Titan Image Generator」のプレビュー版をAmazon Bedrockユーザー向けにリリース
2023年11月27日から12月1日にかけてアメリカのラスベガスで開催されているAWSのカンファレンスイベント「AWS re:Invent」において、Amazonが画像生成AI「Titan Image Generator」のプレビュー版をAWSの顧客向けに発表しました。
·gigazine.net·
Amazonがプロンプトからさまざまな画像を生成できる画像生成AI「Titan Image Generator」のプレビュー版をAmazon Bedrockユーザー向けにリリース