画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2587 bookmarks
Custom sorting
Appleが空中に人の顔が浮かぶApple Vision Proの「空間ペルソナ」のパブリックベータ版をリリース
Appleが空中に人の顔が浮かぶApple Vision Proの「空間ペルソナ」のパブリックベータ版をリリース
Appleは2024年4月2日に、visionOS 1.1がインストールされたApple Vision Pro向けに「空間ペルソナ」を導入しました。この空間ペルソナを実際に試した複数のメディアが、その使用感をレビューしています。
·gigazine.net·
Appleが空中に人の顔が浮かぶApple Vision Proの「空間ペルソナ」のパブリックベータ版をリリース
音声を盗んだりアーティストを置き換えたりする「略奪的AI」を非難する書簡にビリー・アイリッシュやスティーヴィー・ワンダーなど200人以上の著名人が署名
音声を盗んだりアーティストを置き換えたりする「略奪的AI」を非難する書簡にビリー・アイリッシュやスティーヴィー・ワンダーなど200人以上の著名人が署名
近年ではAIの発展により、人間のアーティストの歌声などを学習して新たな楽曲を作り出す技術が登場しています。アーティストの権利団体「Artist Rights Alliance(ARA)」は2024年4月2日、「人間のアーティストの権利を侵害し、音楽の価値を下げかねないAIの使用は控えるべき」との書簡を発表しました。この書簡には、ビリー・アイリッシュ氏やスティーヴィー・ワンダー氏など、200名以上の著名アーティストが署名しています。
·gigazine.net·
音声を盗んだりアーティストを置き換えたりする「略奪的AI」を非難する書簡にビリー・アイリッシュやスティーヴィー・ワンダーなど200人以上の著名人が署名
AppleにiPhoneの「写真」アプリを代替するサードパーティー製アプリを認めるようにEUが要求する可能性
AppleにiPhoneの「写真」アプリを代替するサードパーティー製アプリを認めるようにEUが要求する可能性
EUの競争政策担当委員であるマルグレーテ・ベステアー氏が、iPhoneのユーザーがiPhoneにプリインストールされている「写真」アプリの代わりとなるサードパーティー製アプリをAppleに認めるように要求する可能性を示唆したと報じられています。
·gigazine.net·
AppleにiPhoneの「写真」アプリを代替するサードパーティー製アプリを認めるようにEUが要求する可能性
無料&ブラウザ上でPDF・JPEG・PNG・GIFファイルからOCRによるテキスト抽出ができる「OCR PDFs and images directly in your browser」
無料&ブラウザ上でPDF・JPEG・PNG・GIFファイルからOCRによるテキスト抽出ができる「OCR PDFs and images directly in your browser」
PNG・JPEG・GIFといった画像ファイルやPDFファイルから、TesseractによるOCR(光学文字認識)でテキストを抽出できる「OCR PDFs and images directly in your browser」をエンジニアのサイモン・ウィルソン氏が公開しました。OCR PDFs and images directly in your browserはすべての処理をブラウザ上で実行するため、ファイルをどこかのサーバーにアップロードすることがないというのが大きな特徴です。
·gigazine.net·
無料&ブラウザ上でPDF・JPEG・PNG・GIFファイルからOCRによるテキスト抽出ができる「OCR PDFs and images directly in your browser」
Googleが「生成AIを使った検索機能」の有料化を検討している
Googleが「生成AIを使った検索機能」の有料化を検討している
Googleが生成AIを活用した新しい「プレミアム」機能の有料化を検討していると、イギリス経済紙のFinancial Timesが報じています。GoogleがOpenAIやMicrosoftなどの競合への対応に追われる中で、Googleの主力である検索事業の収益モデルを見直す動きといえます。
·gigazine.net·
Googleが「生成AIを使った検索機能」の有料化を検討している
MetaのAIでアジア人が一時生成不可に、「アジア人と白人のカップル」を出力できない問題で
MetaのAIでアジア人が一時生成不可に、「アジア人と白人のカップル」を出力できない問題で
「アジア人男性と白人女性のカップル」など画像が生成ができないことが取り沙汰されたMetaの画像生成AIが、一時的にアジア人の出力をすべて一律に停止したことがわかりました。
·gigazine.net·
MetaのAIでアジア人が一時生成不可に、「アジア人と白人のカップル」を出力できない問題で
Googleが高品質なJPEG画像の圧縮率を35%向上させる新たなコーディングライブラリ「Jpegli」を発表
Googleが高品質なJPEG画像の圧縮率を35%向上させる新たなコーディングライブラリ「Jpegli」を発表
Googleが2024年4月3日、新たなJPEGのコーディングライブラリである「Jpegli」を発表しました。Jpegliは高い下位互換性を維持しながら機能が強化されており、高品質の圧縮設定で圧縮率を35%も向上したとのことです。
·gigazine.net·
Googleが高品質なJPEG画像の圧縮率を35%向上させる新たなコーディングライブラリ「Jpegli」を発表
Metaの画像生成AIは「アジア人男性と白人女性のカップル」をイメージできないという報告
Metaの画像生成AIは「アジア人男性と白人女性のカップル」をイメージできないという報告
Metaは画像生成AI「Imagine」を無料で使えるウェブアプリ「Imagine with Meta AI」を公開しています。The Vergeの記者がこのImagine with Meta AIで「アジア人と白人のカップル」を生成しようと試みたものの、成功しなかったと報告しています。
·gigazine.net·
Metaの画像生成AIは「アジア人男性と白人女性のカップル」をイメージできないという報告
AI生成の偽情報と戦う非営利団体「TrueMedia.org」がディープフェイク検出器を公開
AI生成の偽情報と戦う非営利団体「TrueMedia.org」がディープフェイク検出器を公開
2024年のアメリカ合衆国大統領選に向けて、非営利団体のTrueMedia.orgがディープフェイクの検出技術を発表しました。検出ツールはこれまでに公開されたことがないAI技術に基づく前例のないモデルを試用し、メディアが操作された兆候を調査することができます。
·gigazine.net·
AI生成の偽情報と戦う非営利団体「TrueMedia.org」がディープフェイク検出器を公開
YouTubeのCEOが「AIのトレーニングへの利用はルール違反」「大事なのはクリエイターがYouTubeで成功すること」と語る
YouTubeのCEOが「AIのトレーニングへの利用はルール違反」「大事なのはクリエイターがYouTubeで成功すること」と語る
YouTubeのニール・モハンCEOがBloombergのエミリー・チャン氏によるインタビューの中で、OpenAIが2024年2月に公開した動画生成AI「Sora」について、もしYouTubeの動画を用いてトレーニングしたのであればルール違反にあたると述べました。
·gigazine.net·
YouTubeのCEOが「AIのトレーニングへの利用はルール違反」「大事なのはクリエイターがYouTubeで成功すること」と語る
従来の技術だと2時間はかかるところわずか4分で高解像度の脳画像を撮影するMRI「イズールト」が開発される
従来の技術だと2時間はかかるところわずか4分で高解像度の脳画像を撮影するMRI「イズールト」が開発される
11.7T(テスラ)の磁場強度を持ち、わずか4分で高解像度の脳画像を撮影することが可能なMRI「イズールト(Iseult)」が開発され、初めて人間の脳がスキャンされました。
·gigazine.net·
従来の技術だと2時間はかかるところわずか4分で高解像度の脳画像を撮影するMRI「イズールト」が開発される
IEEEの学会誌が「1972年のアダルト雑誌のヌード写真」を使った論文を禁止へ
IEEEの学会誌が「1972年のアダルト雑誌のヌード写真」を使った論文を禁止へ
電気・電子工学分野で世界最大の学会であるアメリカの電気電子学会(IEEE)が、1972年に発刊された成人向け雑誌・プレイボーイに掲載されたヌードモデルのレーナ・フォセーン氏の写真を使用した論文の受理の停止を発表しました。当該画像は、長らく情報技術におけるデジタル画像処理の標準テスト画像として使われてきましたが、かねてから「アダルト雑誌の写真を学術的な場で使用するのは女性への配慮が欠けている」との批判がなされていました。
·gigazine.net·
IEEEの学会誌が「1972年のアダルト雑誌のヌード写真」を使った論文を禁止へ
人はよく似た絵がAI製なのか人間のものなのかを区別できず「AIだと思った絵」に嫌悪感を抱く
人はよく似た絵がAI製なのか人間のものなのかを区別できず「AIだと思った絵」に嫌悪感を抱く
AIが生成した絵に異様なまでの忌避感を示す人がいますが、いざよく似た絵を見せられたとき、人間はその絵が誰(何)によって描かれたのかを判別できない可能性があることがわかりました。さらに、人間はAI製だと思い込んだ人間の絵に根拠もなく悪い評価を与えることも判明しています。
·gigazine.net·
人はよく似た絵がAI製なのか人間のものなのかを区別できず「AIだと思った絵」に嫌悪感を抱く
Amazonが一部の実店舗でレジなし精算が可能な「Just Walk Out」を廃止
Amazonが一部の実店舗でレジなし精算が可能な「Just Walk Out」を廃止
店から商品を持ち出すだけで自動的に決済するAmazonのテクノロジー「Just Walk Out」が食料品店から撤去され始めていることがわかりました。カメラで顧客の動きを監視することに膨大なコストがかかっていたことが原因で、今後は顧客に商品のスキャンを任せる「Dash Cart」が採用される見込みです。
·gigazine.net·
Amazonが一部の実店舗でレジなし精算が可能な「Just Walk Out」を廃止
YouTubeが「リアルなAI生成コンテンツ」にラベル付けするためのツールを展開して生成AI使用の開示を動画クリエイターに要求
YouTubeが「リアルなAI生成コンテンツ」にラベル付けするためのツールを展開して生成AI使用の開示を動画クリエイターに要求
生成AIの発展によりまるで本物のようなコンテンツを生成できるようになった現代では、一般のネットユーザーが「見ている画像や動画が本物なのか、それともAIによって生成されたコンテンツなのか」を見分けることが難しくなっています。そこでYouTubeは現地時間の2024年3月18日、動画クリエイターが生成AIで作られたリアルなコンテンツにラベル付けするためのツールを展開しました。
·gigazine.net·
YouTubeが「リアルなAI生成コンテンツ」にラベル付けするためのツールを展開して生成AI使用の開示を動画クリエイターに要求
Googleがたった1枚の写真と音声から「身ぶり手ぶりを交えて話すリアルな動画」を生成するAI「VLOGGER」を発表
Googleがたった1枚の写真と音声から「身ぶり手ぶりを交えて話すリアルな動画」を生成するAI「VLOGGER」を発表
Googleの研究チームが、写真1枚と音声を入力することで「音声に合わせて身ぶり手ぶりを交えて話すリアルな動画」を生成できるAIフレームワーク「VLOGGER」を発表しました。
·gigazine.net·
Googleがたった1枚の写真と音声から「身ぶり手ぶりを交えて話すリアルな動画」を生成するAI「VLOGGER」を発表
AIなどのニューラルネットワークによる画像圧縮はどれぐらいまで実現しつつあるのか?
AIなどのニューラルネットワークによる画像圧縮はどれぐらいまで実現しつつあるのか?
画像や動画のファイルサイズを圧縮することはインターネットトラフィックを削減することにつながるため、多数の技術者によって圧縮技術の見直しが図られてきています。いくつかの技術開発を経て誕生した「ニューラルネットワーク」を使用する圧縮方法は2024年時点でどこまで進化しているのかについて、Microsoftでリアルタイム動画圧縮技術の開発に取り組むマルティン・ルミステ氏が解説しました。
·gigazine.net·
AIなどのニューラルネットワークによる画像圧縮はどれぐらいまで実現しつつあるのか?
国連がAIに関する初の世界決議を全会一致で採択、個人情報の保護・AIのリスク監視など
国連がAIに関する初の世界決議を全会一致で採択、個人情報の保護・AIのリスク監視など
2024年3月21日、国連総会がAIに関する初の世界決議を全会一致で採択しました。この決議は個人情報保護の促進、プライバシーポリシーの強化、AIのリスク監視を通じて人権を擁護するというもので、アメリカが提案して121カ国が賛同しました。
·gigazine.net·
国連がAIに関する初の世界決議を全会一致で採択、個人情報の保護・AIのリスク監視など
画像生成AI開発で知られるStability AIの共同創業者エマド・モスタク氏がCEOと取締役を辞任、理由は「分散型AI追求のため」
画像生成AI開発で知られるStability AIの共同創業者エマド・モスタク氏がCEOと取締役を辞任、理由は「分散型AI追求のため」
画像生成AI「Stable Diffusion」の開発元として知られるスタートアップ・Stability AIが、共同創業者であるエマド・モスタク氏のCEOおよび取締役の辞任を発表しました。
·gigazine.net·
画像生成AI開発で知られるStability AIの共同創業者エマド・モスタク氏がCEOと取締役を辞任、理由は「分散型AI追求のため」
画像生成AIで「文字の出力」が難しいのは「外国人の謎漢字タトゥー」と似た原因という指摘
画像生成AIで「文字の出力」が難しいのは「外国人の謎漢字タトゥー」と似た原因という指摘
Stable DiffusionやDALL-E 3などの画像生成AIを使っていると「文字の代わりに謎の模様が出力される」「短い単語なのにスペルが違う」といった問題に遭遇しがちです。画像生成AIが「文字の出力」を苦手とする理由について、ソーシャルニュースサイトのHacker Newsで激論が交わされています。
·gigazine.net·
画像生成AIで「文字の出力」が難しいのは「外国人の謎漢字タトゥー」と似た原因という指摘
4K対応の大型センサーや3Dノイズリダクションを搭載したロジクール最上位ウェブカメラ「MX Brio」はどれだけ進化しているのか?「Brio C1000s」と比較してみた
4K対応の大型センサーや3Dノイズリダクションを搭載したロジクール最上位ウェブカメラ「MX Brio」はどれだけ進化しているのか?「Brio C1000s」と比較してみた
ロジクールのPCパワーユーザー向けフラッグシップデバイスブランド「MXシリーズ」から、初の4K対応ウェブカメラ「MX Brio」が2024年3月22日に登場しました。ロジクールが過去にリリースした4K対応カメラ「Brio C1000s」と比較しながら、MX Brioがどれだけ進化したのかをチェックしてみました。
·gigazine.net·
4K対応の大型センサーや3Dノイズリダクションを搭載したロジクール最上位ウェブカメラ「MX Brio」はどれだけ進化しているのか?「Brio C1000s」と比較してみた
アーティストをAIに関する不正使用から保護することを目的とした肖像音声画像セキュリティ法「ELVIS」が可決される
アーティストをAIに関する不正使用から保護することを目的とした肖像音声画像セキュリティ法「ELVIS」が可決される
近年ではAIの発展により、人間のアーティストの歌声などを学習して新たな楽曲を作り出す技術が登場しています。パフォーマンス目的でのAI音声の不正使用を防止し、AIによる無断学習からアーティストを保護するための「2024年肖像・画像セキュリティ保護法」、通称「ELVIS法」がアメリカ・テネシー州で可決され、ビル・リー州知事が署名しました。
·gigazine.net·
アーティストをAIに関する不正使用から保護することを目的とした肖像音声画像セキュリティ法「ELVIS」が可決される
Appleが中国の百度(Baidu)と「生成AI技術の使用」について協議を重ねている
Appleが中国の百度(Baidu)と「生成AI技術の使用」について協議を重ねている
AppleがiOSの次期バージョンであるiOS 18から生成AI機能を強化するため、GoogleやOpenAIと協議を重ねているとウワサされています。アメリカの経済紙であるThe Wall Street Journalが、Appleが中国最大のIT企業である百度(Baidu)とも協議を重ねていると新たに報じました。
·gigazine.net·
Appleが中国の百度(Baidu)と「生成AI技術の使用」について協議を重ねている
OpenAIがハリウッドにムービー生成AI「Sora」を売り込んでいると報道される
OpenAIがハリウッドにムービー生成AI「Sora」を売り込んでいると報道される
大規模言語モデルのGPTや画像生成AIモデルのDALL-Eを開発するOpenAIが、テキストからムービーを生成するAIの「Sora」を2024年2月に発表しました。そんなSoraについて、OpenAIはハリウッドの映画スタジオやメディア幹部、タレントエージェンシーと会合をして、Soraを映画制作に使うよう売り込んでいるとBloombergが報じています。
·gigazine.net·
OpenAIがハリウッドにムービー生成AI「Sora」を売り込んでいると報道される
「人間の顔がまるで悪魔のように見える」という奇妙な症例が報告される、実際に見えている顔の再現画像も公開
「人間の顔がまるで悪魔のように見える」という奇妙な症例が報告される、実際に見えている顔の再現画像も公開
アメリカのテネシー州クラークスビルに住むヴィクター・シャラーさんという男性は、ある日を境に人々がまるで「悪魔のような顔」に見えるようになってしまいました。シャラーさんを襲った「Prosopometamorphopsia:相貌変形視」という特殊な視覚障害について、医学誌のThe Lancetで報告されています。
·gigazine.net·
「人間の顔がまるで悪魔のように見える」という奇妙な症例が報告される、実際に見えている顔の再現画像も公開
OpenAIが動画生成AI「Sora」でどんな動画を作れるか示す作例を大量公開
OpenAIが動画生成AI「Sora」でどんな動画を作れるか示す作例を大量公開
ChatGPTの開発元として知られるOpenAIは、テキストを入力するだけで高画質な動画を生成できるAI「Sora」の開発も進めています。新たに、Soraを用いて作成された動画の実例が大量に公開されました。
·gigazine.net·
OpenAIが動画生成AI「Sora」でどんな動画を作れるか示す作例を大量公開
Adobe Summit 2024において画像生成AI「Firefly」のアップデートや新たなイノベーションの発表が行われる
Adobe Summit 2024において画像生成AI「Firefly」のアップデートや新たなイノベーションの発表が行われる
Adobeが2024年3月26日から27日にかけて開催しているデジタルエクスペリエンスカンファレンス「Adobe Summit 2024」において「Adobe Experience Platform AI Assistant」「Federated Audience Composition」「Adobe Real-Time Customer Data Platform (CDP) Collaboration」という3つのイノベーションを発表しました。また、画像生成AIの「Firefly」でもアップデートが行われています。
·gigazine.net·
Adobe Summit 2024において画像生成AI「Firefly」のアップデートや新たなイノベーションの発表が行われる
AIによる画像生成を30倍高速化する手法をマサチューセッツ工科大学が開発
AIによる画像生成を30倍高速化する手法をマサチューセッツ工科大学が開発
DALL-E 3やStable Diffusionといった人気の画像生成AIの拡散モデルを簡素化し、生成される画像の品質を維持しつつ生成スピードを最大で30倍加速させる技術を、アメリカ・マサチューセッツ工科大学(MIT)の研究チームが公開しました。
·gigazine.net·
AIによる画像生成を30倍高速化する手法をマサチューセッツ工科大学が開発
イスラエル当局が「Googleフォト」等を利用してパレスチナ人の大規模監視を行っていたことが明らかに
イスラエル当局が「Googleフォト」等を利用してパレスチナ人の大規模監視を行っていたことが明らかに
イスラエルの軍事諜報部門がガザ地区で実験的な顔認識プログラムを展開し、人工知能プログラムを用いて指名手配犯を捜索していることが明らかになりました。軍は民間企業の技術のほか、Googleフォトも利用していると報じられています。
·gigazine.net·
イスラエル当局が「Googleフォト」等を利用してパレスチナ人の大規模監視を行っていたことが明らかに