画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2306 bookmarks
Custom sorting
AIは顔を見ただけで「保守派」「リベラル派」などの政治思想を特定できる可能性
AIは顔を見ただけで「保守派」「リベラル派」などの政治思想を特定できる可能性
「この人は保守派だ」「この人はリベラル政党を支持している」といった傾向を判断するには、通常はその人の言動などを分析する必要があります。しかし、スタンフォード大学経営大学院の研究チームが、顔認識技術とAIを組み合わせることで、顔を見るだけでその人の政治的指向を正確に評価できると主張しています。
·gigazine.net·
AIは顔を見ただけで「保守派」「リベラル派」などの政治思想を特定できる可能性
ストーリー性のあるマンガを自動生成するAIモデル「StoryDiffusion」
ストーリー性のあるマンガを自動生成するAIモデル「StoryDiffusion」
AIで生成した画像を使った漫画の著作権がアメリカで物議を醸したり、漫画の設定やあらすじを提案してくれるAIサービスが登場したりと、AIは絵やイラストの生成だけでなく漫画作品の制作にも活用されるようになってきています。中国のByteDanceと南開大学の研究チームが、ストーリーのある漫画を出力できるAIモデル「StoryDiffusion」を発表しました。
·gigazine.net·
ストーリー性のあるマンガを自動生成するAIモデル「StoryDiffusion」
Reolinkの4Kセキュリティカメラ「TrackMix PoE」と「RLC-833A」のできることの違いを比較してみた&Synology NASにつないでみた
Reolinkの4Kセキュリティカメラ「TrackMix PoE」と「RLC-833A」のできることの違いを比較してみた&Synology NASにつないでみた
4K・25FPSで撮影が可能でナイトビジョンで夜間の撮影もバッチリなReolinkのセキュリティカメラ「TrackMix PoE」と「RLC-833A」をゲットしたので、両者の比較およびSynologyのNASにつないでみる手順を確認してみました。
·gigazine.net·
Reolinkの4Kセキュリティカメラ「TrackMix PoE」と「RLC-833A」のできることの違いを比較してみた&Synology NASにつないでみた
無料でハイクオリティなCC0の3Dモデルやテクスチャをダウンロードしまくれる「ShareTextures」
無料でハイクオリティなCC0の3Dモデルやテクスチャをダウンロードしまくれる「ShareTextures」
写真家とアセットクリエイターによるサイト「ShareTextures」では、実際に撮影した写真やロイヤリティフリーの写真から作成した3Dモデルやテクスチャを配布しています。コンテンツはすべてCC0ライセンスのため、個人・商業問わず自由にダウンロードして活用することができます。
·gigazine.net·
無料でハイクオリティなCC0の3Dモデルやテクスチャをダウンロードしまくれる「ShareTextures」
あらゆる自動車を個別に追跡できる恐るべき公道監視カメラネットワークに対する批判
あらゆる自動車を個別に追跡できる恐るべき公道監視カメラネットワークに対する批判
アメリカのノースカロライナ州では、民間企業が提供する自動車のナンバープレートを読み取るカメラシステムを導入しています。このシステムは通過する全ての車両のナンバープレートや特徴をキャプチャし、犯罪に関連する車両だけでなく一般市民の車両のデータも収集することができ、州内外の法執行機関のみが捜査目的でアクセスできるようになっています。しかし、このカメラシステムについて、プライバシー擁護派からは厳しい批判の目が向けられています。
·gigazine.net·
あらゆる自動車を個別に追跡できる恐るべき公道監視カメラネットワークに対する批判
AI生成の外務省報道官「ヴィクトリア・シー」をウクライナが発表、まるで本物の人間のように話す紹介動画も公開中
AI生成の外務省報道官「ヴィクトリア・シー」をウクライナが発表、まるで本物の人間のように話す紹介動画も公開中
ウクライナ外務省は現地時間の2024年5月1日、外務省を代表してメディアに向けて公式声明を発信するAI報道官「Вікторія Ші(ヴィクトリア・シー)」を発表しました。報道にAI生成のデジタルパーソンを使用することにより、人間の外交官の時間を節約するのが狙いとのことです。
·gigazine.net·
AI生成の外務省報道官「ヴィクトリア・シー」をウクライナが発表、まるで本物の人間のように話す紹介動画も公開中
写真共有サイト「EyeEm」が「投稿された写真はAIトレーニングに利用する」と表明
写真共有サイト「EyeEm」が「投稿された写真はAIトレーニングに利用する」と表明
15万人近いユーザーと約1億6000枚の写真を抱えているという写真共有サイト「EyeEm」の利用規約が改定され、「EyeEmコミュニティにアップロードされた写真をAIのトレーニングに利用する」旨が追記されたことがわかりました。30日以内に削除しないと、サイトに残っている写真は規約に基づいて、あらゆる使用がOKとなるライセンスが付与されることになります。
·gigazine.net·
写真共有サイト「EyeEm」が「投稿された写真はAIトレーニングに利用する」と表明
まだ「MPEG-2 TS」が存在する理由、どういう点でメリットがあり置き換えが難しいのか?
まだ「MPEG-2 TS」が存在する理由、どういう点でメリットがあり置き換えが難しいのか?
動画や音声を圧縮する国際標準の1つであるMoving Picture Experts Group(MPEG)には、MPEG-1、MPEG-2、MPEG-4などの規格が存在します。このうち、MPEG-2は主にテレビ放送やDVDに使われており、特にデジタルテレビ放送用のコンテナとして使われているのが「MPEG-2 TS」です。標準規格制定から四半世紀以上が経つMPEG-2 TSがなぜ今もなお放送業界で使われているのかについて、ブロードキャストツールを開発するイギリス企業のOpen Broadcast Systemsが解説しています。
·gigazine.net·
まだ「MPEG-2 TS」が存在する理由、どういう点でメリットがあり置き換えが難しいのか?
画像生成AI「Stable Diffusion」開発元が自然な文章から画像を生成できる「DeepFloyd IF」を発表
画像生成AI「Stable Diffusion」開発元が自然な文章から画像を生成できる「DeepFloyd IF」を発表
文章(プロンプト)から画像を生成するAI「Stable Diffusion」を開発したStability AIが、新しい画像生成AI「DeepFloyd IF」をリリースしました。画像内に正しい文字を反映させる処理などの性能が向上しています。
·gigazine.net·
画像生成AI「Stable Diffusion」開発元が自然な文章から画像を生成できる「DeepFloyd IF」を発表
ムービーを高品質な3Dデータに変換できる手法が登場
ムービーを高品質な3Dデータに変換できる手法が登場
画像・映像を立体に変換する技術「Neural Radiance Fields(NeRF)」で「カメラが移動しながら撮影した長めの映像」を扱うのは難しく、どうしても品質に難がありましたが、韓国科学技術院や国立台湾大学、Meta、メリーランド大学カレッジパーク校の研究者らが、長めの映像からでも品質の高い3Dデータをレンダリングできるようになる手法を編み出しました。
·gigazine.net·
ムービーを高品質な3Dデータに変換できる手法が登場
レンズがなくても位置データと画像生成AIを使って撮影する不思議なカメラ「Paragraphica」
レンズがなくても位置データと画像生成AIを使って撮影する不思議なカメラ「Paragraphica」
写真は被写体に当たって反射した光をレンズで集約し、デジタルセンサーやフィルムに当てることで撮影できます。しかし、オランダ在住のデザイナーであるビョルン・カルマン氏が開発した「Paragraphica」は写真撮影に必要なレンズがなく、位置データと画像生成AIを使って風景写真を生成するカメラとなっています。
·gigazine.net·
レンズがなくても位置データと画像生成AIを使って撮影する不思議なカメラ「Paragraphica」
たった1枚の写真から高解像度の3DCGモデルをAIで生成できる「Human-SGD」が発表される
たった1枚の写真から高解像度の3DCGモデルをAIで生成できる「Human-SGD」が発表される
写真から3DCGモデルを作成するにはさまざまな方向から被写体を何枚も撮影する必要があります。クウェート大学・Meta・メリーランド大学の研究者が、たった1枚の写真から高解像度のCGモデルを生成する「Human-SGD」を発表しました。
·gigazine.net·
たった1枚の写真から高解像度の3DCGモデルをAIで生成できる「Human-SGD」が発表される
手描きからデジタルへと映画の背景技術はどのように進化してきたのか、そしてAI時代にどうなっていくのか?
手描きからデジタルへと映画の背景技術はどのように進化してきたのか、そしてAI時代にどうなっていくのか?
テキストを入力するだけで高品質な画像や動画を出力できる生成AIの登場により、AIが中国でイラストレーターの仕事を奪い始めているというレポートや、生成AIはゲーム開発のあり方を大きく変えつつあるとする報道など、高度な仕事のレベルで生成AIが活用されるケースも多数確認されています。映像制作においては、実写映像と背景画を合成する「マット」という技術を用いたマットペイントから3DCG背景の合成と進化してきましたが、AIが業界を変える新たなステップになる可能性が高まっています。映画の背景技術に関する進化の歴史と、AIがそれをどのように変革しうるかについて、オンラインメディアのVoxがムービーで解説しています。
·gigazine.net·
手描きからデジタルへと映画の背景技術はどのように進化してきたのか、そしてAI時代にどうなっていくのか?
Microsoftが顔写真と音声ファイルからリアルに話す映像を作成できるAIモデル「VASA-1」公開
Microsoftが顔写真と音声ファイルからリアルに話す映像を作成できるAIモデル「VASA-1」公開
Microsoftの研究機関であるMicrosoft Researchが、1枚の顔写真と音声ファイルから「本物の人間そっくりな話し顔」を生成することができるAIモデルの「VASA-1」を発表しました。VASA-1は音声ファイルとリップシンクしながら、顔写真の表情を自然に変化させ、生き生きとした「話し顔」を生成することができます。
·gigazine.net·
Microsoftが顔写真と音声ファイルからリアルに話す映像を作成できるAIモデル「VASA-1」公開
Googleが開発した画像分類タスクが可能な機械学習モデル「Vision Transformers」の仕組みとは?
Googleが開発した画像分類タスクが可能な機械学習モデル「Vision Transformers」の仕組みとは?
Googleの機械学習モデル「Transformer」は、データを時系列に処理しなくても、自然言語などのデータを翻訳やテキスト要約することが可能で、ChatGPTなどの自然な会話が可能なチャットAIのベースとなっています。また、Transformerの手法を画像分野に応用したモデルが「Vision Transformer」です。ソフトウェアエンジニアのデニス・タープ氏が、「Vision Transformer」のコンポーネントがどのように機能し、データはどのような流れをたどるのか、ビジュアル化して解説しています
·gigazine.net·
Googleが開発した画像分類タスクが可能な機械学習モデル「Vision Transformers」の仕組みとは?
AI生成の児童ポルノが爆増しており児童搾取に関する報告システムが機能不全に陥る恐れがあるとインターネット監視団が警告
AI生成の児童ポルノが爆増しており児童搾取に関する報告システムが機能不全に陥る恐れがあるとインターネット監視団が警告
1998年から運営されている児童性的虐待ホットライン「CyberTipline」が十分に機能しておらず、今後、「AI生成の児童ポルノ」が増えると、本物の虐待被害者を見つけることはさらに難しくなっていくと、専門家が指摘しています。
·gigazine.net·
AI生成の児童ポルノが爆増しており児童搾取に関する報告システムが機能不全に陥る恐れがあるとインターネット監視団が警告
AIは実際の人間の顔よりリアルに見える顔を作るという「ハイパーリアリズム」現象が含む大きな問題点とは?
AIは実際の人間の顔よりリアルに見える顔を作るという「ハイパーリアリズム」現象が含む大きな問題点とは?
AIは実在していない人間の顔写真を生成することができ、その精度はすさまじい勢いで高まっています。AI製のスパイや実在しないエンジニアを活用したと疑われる例も報じられているほか、AIの生成した顔は本物の顔と区別がつかないだけではなく「本物の顔より信頼性が高い」とされる研究もあります。オーストラリア国立大学の上級講師であるエイミー・ダウェル氏は「AIは、本物の人間の顔よりも本物らしく見える顔を作成できる」ことを示した上で、そのようなAIの能力「ハイパーリアリズム」について解説しています。
·gigazine.net·
AIは実際の人間の顔よりリアルに見える顔を作るという「ハイパーリアリズム」現象が含む大きな問題点とは?
Adobeが基本無料で使える高品質かつ高速な日本語対応画像生成AI「Firefly Image 3」を公開したので使ってみた
Adobeが基本無料で使える高品質かつ高速な日本語対応画像生成AI「Firefly Image 3」を公開したので使ってみた
Adobeが画像生成AIモデル「Adobe Firefly Image 3 Foundation モデル(ベータ版)」を2024年4月23日に発表しました。既にウェブ版Adobe Fireflyで同モデルを用いた画像生成が可能になっていたので、実際に使ってどんな画像を生成できるのか確認してみました。
·gigazine.net·
Adobeが基本無料で使える高品質かつ高速な日本語対応画像生成AI「Firefly Image 3」を公開したので使ってみた
向きをリモートで変え自動追跡できるReolinkの4Kセキュリティ監視カメラ「TrackMix PoE」レビュー、双方向通話・赤外線ナイトビジョン・カラーナイトビジョンなど超多機能
向きをリモートで変え自動追跡できるReolinkの4Kセキュリティ監視カメラ「TrackMix PoE」レビュー、双方向通話・赤外線ナイトビジョン・カラーナイトビジョンなど超多機能
香港に拠点を置くReolinkの「TrackMix PoE」は、対象を自動追跡して広範囲を撮影可能な4Kセキュリティカメラです。双方向通話、人体・車両検知、赤外線ナイトビジョンにカラーナイトビジョンと多機能さがウリ。今回はReolinkから直接提供してもらったので、前回レビューした「RLC-833A」と同じように性能や使い勝手をいろいろ確認してみることにしました。
·gigazine.net·
向きをリモートで変え自動追跡できるReolinkの4Kセキュリティ監視カメラ「TrackMix PoE」レビュー、双方向通話・赤外線ナイトビジョン・カラーナイトビジョンなど超多機能
映像のディテールを復活させながらアップスケールできるAI「VideoGigaGAN」をAdobeの研究チームが開発
映像のディテールを復活させながらアップスケールできるAI「VideoGigaGAN」をAdobeの研究チームが開発
Adobeが映像のアップスケールが可能なAI「VideoGigaGAN」を発表しました。VideoGigaGANは既存の映像アップスケールAIと比べてクッキリとした描写が可能なほか、フレーム間のチラつきも抑えられています。
·gigazine.net·
映像のディテールを復活させながらアップスケールできるAI「VideoGigaGAN」をAdobeの研究チームが開発
高機能フォトグラメトリーソフトが“無料”に Epic Games、「RealityCapture 1.4」公開
高機能フォトグラメトリーソフトが“無料”に Epic Games、「RealityCapture 1.4」公開
米Epic Gamesは4月23日(現地時間)、複数の画像やレーザースキャンデータをもとに、現実空間を3D空間上に構築するフォトグラメトリ(写真測量)ソフト「Reality Capture 1.4」を公開した。以前のバージョンからプラン体系を刷新、年間収益が100万ドルを超えない個人・法人なら無料で使えるようになった。
·itmedia.co.jp·
高機能フォトグラメトリーソフトが“無料”に Epic Games、「RealityCapture 1.4」公開
生成AIに国際枠組み、岸田首相が創設表明へ…発信者明示技術の推進を支援
生成AIに国際枠組み、岸田首相が創設表明へ…発信者明示技術の推進を支援
【読売新聞】 岸田首相は、5月上旬に開かれる経済協力開発機構(OECD)の会合で、生成AI(人工知能)の規律と活用の両立に向けた国際枠組みの創設を表明する。40か国以上の参加を見込んでおり、日本として国際ルール作りを主導する狙いがあ
·yomiuri.co.jp·
生成AIに国際枠組み、岸田首相が創設表明へ…発信者明示技術の推進を支援
話題のAIベンチャー「Sakana AI」が画像生成AIを公開 “自律進化”技術で、推論速度が約10倍高速に
話題のAIベンチャー「Sakana AI」が画像生成AIを公開 “自律進化”技術で、推論速度が約10倍高速に
AIベンチャーのSakana AIは、画像生成AI「EvoSDXL-JP」を公開した。同社が提案する生成AIの開発手法「進化的モデルマージ」によって構築したAIモデルで、従来の日本語AIモデルと比べて10倍速く画像を生成できるという。
·itmedia.co.jp·
話題のAIベンチャー「Sakana AI」が画像生成AIを公開 “自律進化”技術で、推論速度が約10倍高速に
AIの需要増加によりデータセンターの消費電力が爆増してAI開発のボトルネックになっている
AIの需要増加によりデータセンターの消費電力が爆増してAI開発のボトルネックになっている
近年は大手テクノロジー企業が生成AIツールの開発に多額の投資を行っており、AI用データセンターの建築プロジェクトが世界各国で進められています。ところが、AIバブルによってデータセンターの消費電力が急激に増加しており、電力供給の問題がAIの成長を脅かすボトルネックになっていると経済紙のフィナンシャル・タイムズが報じています。
·gigazine.net·
AIの需要増加によりデータセンターの消費電力が爆増してAI開発のボトルネックになっている
Adobe Premiere Proに生成AIで「映像内のオブジェクト追加・削除」「フレームの追加」「映像素材の生成」を実行する機能が2024年中に搭載される予定
Adobe Premiere Proに生成AIで「映像内のオブジェクト追加・削除」「フレームの追加」「映像素材の生成」を実行する機能が2024年中に搭載される予定
Adobeが動画編集ソフトのPremiere Proに「生成AIを活用した新機能」を2024年中に導入すると発表しました。Adobeの生成AIであるFireflyのVideo Modelに加えて、OpenAIのSoraやRunwayML、Pikaなどのサードパーティー製AIモデルも利用できるのがポイントです。
·gigazine.net·
Adobe Premiere Proに生成AIで「映像内のオブジェクト追加・削除」「フレームの追加」「映像素材の生成」を実行する機能が2024年中に搭載される予定
古い写真・低画質アニメ画像・イラストなどを簡単に高画質化できる「Winxvideo AI」でいろんな画像をハッキリクッキリアップグレードさせてみたレビュー
古い写真・低画質アニメ画像・イラストなどを簡単に高画質化できる「Winxvideo AI」でいろんな画像をハッキリクッキリアップグレードさせてみたレビュー
最先端のAI技術を利用して自動で動画を高画質化・フレーム補間・手ぶれ補正することができるソフトウェア「Winxvideo AI」は、動画だけでなく画像の高画質化も可能です。低画質な画像を鮮明に補正することができるということで、Winxvideo AIを使っていろんな画像を高画質化しまくってみました。
·gigazine.net·
古い写真・低画質アニメ画像・イラストなどを簡単に高画質化できる「Winxvideo AI」でいろんな画像をハッキリクッキリアップグレードさせてみたレビュー
InstagramとFacebookで有名人が画像を改変されたAIディープフェイクポルノ事件をMetaの監督委員会が調査へ
InstagramとFacebookで有名人が画像を改変されたAIディープフェイクポルノ事件をMetaの監督委員会が調査へ
2024年4月16日、Metaのプラットフォーム上で削除されるコンテンツについて監視を行う第三者組織の監督委員会がFacebookとInstagramで起こったディープフェイクポルノに関する事例2件について調査を開始したことを明らかにし、「Metaのポリシーと施行慣行がディープフェイクポルノに対処するのに効果的かどうかを評価する」と発表しました。
·gigazine.net·
InstagramとFacebookで有名人が画像を改変されたAIディープフェイクポルノ事件をMetaの監督委員会が調査へ
Amazonがレジなし決済システム「Just Walk Out」の採用店舗を2024年中に倍増させる方針を発表
Amazonがレジなし決済システム「Just Walk Out」の採用店舗を2024年中に倍増させる方針を発表
Amazonはレジ不要の実店舗システム「Just Walk Out」を開発しており、Just Walk OutはAmazonの自社店舗以外に数多くのサードパーティー事業者の店舗で採用されています。新たに、AmazonがJust Walk Out の導入店舗を2024年中に倍増させる方針を発表しました。
·gigazine.net·
Amazonがレジなし決済システム「Just Walk Out」の採用店舗を2024年中に倍増させる方針を発表
大田区、NECに賠償金480万円を請求 10月のシステム障害巡り SSD3台の同時故障想定できず
大田区、NECに賠償金480万円を請求 10月のシステム障害巡り SSD3台の同時故障想定できず
大田区は、2023年10月に発生したシステム障害の検証結果を発表した。システムの運用・保守を担っていたNECからの情報共有が不十分だったことなどが原因にあるとし、同社に対して損害賠償金486万8437円を請求した。
·itmedia.co.jp·
大田区、NECに賠償金480万円を請求 10月のシステム障害巡り SSD3台の同時故障想定できず