画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2587 bookmarks
Custom sorting
GoogleがAI生成コンテンツに電子透かしを入れてフェイク拡散を防ぐ「SynthID」をテキストと動画にも拡張、一体どうやって文章に透かしを入れるのか?
GoogleがAI生成コンテンツに電子透かしを入れてフェイク拡散を防ぐ「SynthID」をテキストと動画にも拡張、一体どうやって文章に透かしを入れるのか?
GoogleのAI研究部門であるGoogle DeepMindが現地時間の2024年5月14日に、AI生成コンテンツにウォーターマーク(電子透かし)を入れてフェイク画像の拡散を防止するツール「SynthID」を、従来の画像だけでなくテキストと動画にも拡張することを発表しました。
·gigazine.net·
GoogleがAI生成コンテンツに電子透かしを入れてフェイク拡散を防ぐ「SynthID」をテキストと動画にも拡張、一体どうやって文章に透かしを入れるのか?
バグ・エラー・不具合を動画と画像とメタデータで再現可能にして開発者とサクッと簡単にブラウザの拡張機能で共有できる「Jam」レビュー
バグ・エラー・不具合を動画と画像とメタデータで再現可能にして開発者とサクッと簡単にブラウザの拡張機能で共有できる「Jam」レビュー
「Jam」はボタン一発でスクリーンショットや動画の撮影を行い、OSやブラウザのバージョンなどのメタデータと一緒にまとめて共有できる状態にしてくれるChrome・Edge・Arc・Brave・Operaなど各ブラウザ向けの拡張機能です。ユーザーからのバグ報告を受けるのに便利そうだったので実際に使い勝手を試してみました。
·gigazine.net·
バグ・エラー・不具合を動画と画像とメタデータで再現可能にして開発者とサクッと簡単にブラウザの拡張機能で共有できる「Jam」レビュー
GIMPで画像生成AIを使えるようにしてNPUでの処理も可能にするOpenVINOプラグイン「OpenVINO AI Plugins for GIMP」レビュー
GIMPで画像生成AIを使えるようにしてNPUでの処理も可能にするOpenVINOプラグイン「OpenVINO AI Plugins for GIMP」レビュー
Intel製CPU搭載を搭載したPCでGPUなしでもStable Diffusionを用いた画像生成を可能にするGIMP用プラグイン「OpenVINO AI Plugins for GIMP」がGitHubに公開されています。特徴的なのは、AIの演算処理に特化したプロセッサ「NPU」に対応しており、NPUを使った画像生成が可能だという点。ちょうどNPUを搭載したXPS 13とXPS 14をDellから借りていたので、導入から実際に使うところまでをまとめてみました。
·gigazine.net·
GIMPで画像生成AIを使えるようにしてNPUでの処理も可能にするOpenVINOプラグイン「OpenVINO AI Plugins for GIMP」レビュー
数枚の2D画像から3D空間を再現する「Toon3D」
数枚の2D画像から3D空間を再現する「Toon3D」
数枚の漫画・アニメの手描きの画像から「もっともらしい3D構造」を再現するツール「Toon3D」が公開されました。
·gigazine.net·
数枚の2D画像から3D空間を再現する「Toon3D」
MicrosoftがYouTubeなどの動画を吹き替えや字幕でリアルタイム翻訳するEdge向けの新AI機能を公開
MicrosoftがYouTubeなどの動画を吹き替えや字幕でリアルタイム翻訳するEdge向けの新AI機能を公開
現地時間の2024年5月20日、MicrosoftがウェブブラウザのMicrosoft Edge向けに、YouTubeなどのサイトに投稿された動画をAIを活用してリアルタイム翻訳し、吹き替えと字幕を提供する機能を発表しました。
·gigazine.net·
MicrosoftがYouTubeなどの動画を吹き替えや字幕でリアルタイム翻訳するEdge向けの新AI機能を公開
中国のスマホメーカー「HONOR」がGoogleのAIアシスタント「Gemini」や画像生成AI「Imagen 2」を自社製スマホで利用可能にする計画を発表
中国のスマホメーカー「HONOR」がGoogleのAIアシスタント「Gemini」や画像生成AI「Imagen 2」を自社製スマホで利用可能にする計画を発表
中国に拠点を置くデバイスメーカーのHONORが、自社製スマートフォンにGoogleのAI機能を統合することを2024年5月22日(水)に発表しました。加えて、HONORは自社製スマートフォンでAIアシスタント「Gemini」や画像生成AI「Imagen 2」を利用可能にする計画も明かしています。
·gigazine.net·
中国のスマホメーカー「HONOR」がGoogleのAIアシスタント「Gemini」や画像生成AI「Imagen 2」を自社製スマホで利用可能にする計画を発表
Windows 11の標準お絵描きアプリ「ペイント」の画像生成AI機能「Cocreator」にユーザーの描いたイラストを基にリアルタイムで画像生成する機能が発表される
Windows 11の標準お絵描きアプリ「ペイント」の画像生成AI機能「Cocreator」にユーザーの描いたイラストを基にリアルタイムで画像生成する機能が発表される
2023年11月にMicrosoftは、Windows 11の標準お絵描きアプリ「ペイント」に画像生成機能「Cocreator」を追加するアップデートを実施しました。さらにMicrosoftは2024年5月20日に、NPU搭載のPC「Copilot+ PC」向けに、Cocreatorでイラストを描きながらリアルタイムで画像を生成する機能を発表しました。
·gigazine.net·
Windows 11の標準お絵描きアプリ「ペイント」の画像生成AI機能「Cocreator」にユーザーの描いたイラストを基にリアルタイムで画像生成する機能が発表される
性的虐待につながるAI画像の生成・拡散・収益化を抑制するための自主的な取り組みをホワイトハウスが企業や連邦議会に呼びかけ
性的虐待につながるAI画像の生成・拡散・収益化を抑制するための自主的な取り組みをホワイトハウスが企業や連邦議会に呼びかけ
AIなどの技術を悪用した画像ベースの性的虐待が近年急増しており、特に女性や少女、LGBTQI+のコミュニティが標的となることが多く深刻な問題となっています。この問題に取り組むために、政府はテクノロジー企業や市民社会に協力を呼びかけ、画像ベースの性的虐待を防止・軽減するための自主的な取り組みを促しています。
·gigazine.net·
性的虐待につながるAI画像の生成・拡散・収益化を抑制するための自主的な取り組みをホワイトハウスが企業や連邦議会に呼びかけ
「アート投稿サービスのDeviantArtはAI作品とボットが宣伝と収益の仕組みを独占している」とアーティストから怒りの声
「アート投稿サービスのDeviantArtはAI作品とボットが宣伝と収益の仕組みを独占している」とアーティストから怒りの声
イラストなどのアート作品を投稿できる大手コミュニティサービス「DeviantArt」では、投稿されたイラストや3Dモデルなどを購入できる仕組みがあり、その販売数や作品への評価などに応じて、トップページに表示されたり公式SNSで宣伝されたりしてより多くのユーザーの目に付きやすくなります。しかし、この仕組みを悪用するボットが大量発生しており、DeviantArtはそれらに対応しようとしていないとアーティストから非難の声が上がっています。
·gigazine.net·
「アート投稿サービスのDeviantArtはAI作品とボットが宣伝と収益の仕組みを独占している」とアーティストから怒りの声
無料でGIFアニメをサイズやfpsを調整しながら作成できるオープンソースソフト「gifski」
無料でGIFアニメをサイズやfpsを調整しながら作成できるオープンソースソフト「gifski」
ムービーをGIFに変換できるソフト「gifski」は、PNG画像用のファイル圧縮アルゴリズムであるpngquantの機能を活用することで、ムービーの品質を可能な限り保ったハイクオリティなものから、ファイルサイズを抑えたものまで、目的に合わせてクオリティを調整したGIFアニメーションを作成することができます。無料でダウンロードできる&簡単操作で変換可能とのことなので、実際にGIFアニメーションを作成してみました。
·gigazine.net·
無料でGIFアニメをサイズやfpsを調整しながら作成できるオープンソースソフト「gifski」
プロ仕様なのに初心者でも使いやすい本格的なiPhone向け動画撮影アプリ「Kino」を使ってみたレビュー
プロ仕様なのに初心者でも使いやすい本格的なiPhone向け動画撮影アプリ「Kino」を使ってみたレビュー
iPhone向けにプロ仕様のカメラアプリを開発するHalideが、動画撮影アプリ「Kino」を2024年5月29日にリリースしました。細かい設定が可能でプロのニーズにも応える本格的な動画撮影ができ、なおかつ初心者でも簡単に操作できるのが売りとのことで、実際に「Kino」を使ってみました。
·gigazine.net·
プロ仕様なのに初心者でも使いやすい本格的なiPhone向け動画撮影アプリ「Kino」を使ってみたレビュー
AIは顔を見ただけで「保守派」「リベラル派」などの政治思想を特定できる可能性
AIは顔を見ただけで「保守派」「リベラル派」などの政治思想を特定できる可能性
「この人は保守派だ」「この人はリベラル政党を支持している」といった傾向を判断するには、通常はその人の言動などを分析する必要があります。しかし、スタンフォード大学経営大学院の研究チームが、顔認識技術とAIを組み合わせることで、顔を見るだけでその人の政治的指向を正確に評価できると主張しています。
·gigazine.net·
AIは顔を見ただけで「保守派」「リベラル派」などの政治思想を特定できる可能性
ストーリー性のあるマンガを自動生成するAIモデル「StoryDiffusion」
ストーリー性のあるマンガを自動生成するAIモデル「StoryDiffusion」
AIで生成した画像を使った漫画の著作権がアメリカで物議を醸したり、漫画の設定やあらすじを提案してくれるAIサービスが登場したりと、AIは絵やイラストの生成だけでなく漫画作品の制作にも活用されるようになってきています。中国のByteDanceと南開大学の研究チームが、ストーリーのある漫画を出力できるAIモデル「StoryDiffusion」を発表しました。
·gigazine.net·
ストーリー性のあるマンガを自動生成するAIモデル「StoryDiffusion」
Reolinkの4Kセキュリティカメラ「TrackMix PoE」と「RLC-833A」のできることの違いを比較してみた&Synology NASにつないでみた
Reolinkの4Kセキュリティカメラ「TrackMix PoE」と「RLC-833A」のできることの違いを比較してみた&Synology NASにつないでみた
4K・25FPSで撮影が可能でナイトビジョンで夜間の撮影もバッチリなReolinkのセキュリティカメラ「TrackMix PoE」と「RLC-833A」をゲットしたので、両者の比較およびSynologyのNASにつないでみる手順を確認してみました。
·gigazine.net·
Reolinkの4Kセキュリティカメラ「TrackMix PoE」と「RLC-833A」のできることの違いを比較してみた&Synology NASにつないでみた
無料でハイクオリティなCC0の3Dモデルやテクスチャをダウンロードしまくれる「ShareTextures」
無料でハイクオリティなCC0の3Dモデルやテクスチャをダウンロードしまくれる「ShareTextures」
写真家とアセットクリエイターによるサイト「ShareTextures」では、実際に撮影した写真やロイヤリティフリーの写真から作成した3Dモデルやテクスチャを配布しています。コンテンツはすべてCC0ライセンスのため、個人・商業問わず自由にダウンロードして活用することができます。
·gigazine.net·
無料でハイクオリティなCC0の3Dモデルやテクスチャをダウンロードしまくれる「ShareTextures」
あらゆる自動車を個別に追跡できる恐るべき公道監視カメラネットワークに対する批判
あらゆる自動車を個別に追跡できる恐るべき公道監視カメラネットワークに対する批判
アメリカのノースカロライナ州では、民間企業が提供する自動車のナンバープレートを読み取るカメラシステムを導入しています。このシステムは通過する全ての車両のナンバープレートや特徴をキャプチャし、犯罪に関連する車両だけでなく一般市民の車両のデータも収集することができ、州内外の法執行機関のみが捜査目的でアクセスできるようになっています。しかし、このカメラシステムについて、プライバシー擁護派からは厳しい批判の目が向けられています。
·gigazine.net·
あらゆる自動車を個別に追跡できる恐るべき公道監視カメラネットワークに対する批判
AI生成の外務省報道官「ヴィクトリア・シー」をウクライナが発表、まるで本物の人間のように話す紹介動画も公開中
AI生成の外務省報道官「ヴィクトリア・シー」をウクライナが発表、まるで本物の人間のように話す紹介動画も公開中
ウクライナ外務省は現地時間の2024年5月1日、外務省を代表してメディアに向けて公式声明を発信するAI報道官「Вікторія Ші(ヴィクトリア・シー)」を発表しました。報道にAI生成のデジタルパーソンを使用することにより、人間の外交官の時間を節約するのが狙いとのことです。
·gigazine.net·
AI生成の外務省報道官「ヴィクトリア・シー」をウクライナが発表、まるで本物の人間のように話す紹介動画も公開中
写真共有サイト「EyeEm」が「投稿された写真はAIトレーニングに利用する」と表明
写真共有サイト「EyeEm」が「投稿された写真はAIトレーニングに利用する」と表明
15万人近いユーザーと約1億6000枚の写真を抱えているという写真共有サイト「EyeEm」の利用規約が改定され、「EyeEmコミュニティにアップロードされた写真をAIのトレーニングに利用する」旨が追記されたことがわかりました。30日以内に削除しないと、サイトに残っている写真は規約に基づいて、あらゆる使用がOKとなるライセンスが付与されることになります。
·gigazine.net·
写真共有サイト「EyeEm」が「投稿された写真はAIトレーニングに利用する」と表明
まだ「MPEG-2 TS」が存在する理由、どういう点でメリットがあり置き換えが難しいのか?
まだ「MPEG-2 TS」が存在する理由、どういう点でメリットがあり置き換えが難しいのか?
動画や音声を圧縮する国際標準の1つであるMoving Picture Experts Group(MPEG)には、MPEG-1、MPEG-2、MPEG-4などの規格が存在します。このうち、MPEG-2は主にテレビ放送やDVDに使われており、特にデジタルテレビ放送用のコンテナとして使われているのが「MPEG-2 TS」です。標準規格制定から四半世紀以上が経つMPEG-2 TSがなぜ今もなお放送業界で使われているのかについて、ブロードキャストツールを開発するイギリス企業のOpen Broadcast Systemsが解説しています。
·gigazine.net·
まだ「MPEG-2 TS」が存在する理由、どういう点でメリットがあり置き換えが難しいのか?
画像生成AI「Stable Diffusion」開発元が自然な文章から画像を生成できる「DeepFloyd IF」を発表
画像生成AI「Stable Diffusion」開発元が自然な文章から画像を生成できる「DeepFloyd IF」を発表
文章(プロンプト)から画像を生成するAI「Stable Diffusion」を開発したStability AIが、新しい画像生成AI「DeepFloyd IF」をリリースしました。画像内に正しい文字を反映させる処理などの性能が向上しています。
·gigazine.net·
画像生成AI「Stable Diffusion」開発元が自然な文章から画像を生成できる「DeepFloyd IF」を発表
ムービーを高品質な3Dデータに変換できる手法が登場
ムービーを高品質な3Dデータに変換できる手法が登場
画像・映像を立体に変換する技術「Neural Radiance Fields(NeRF)」で「カメラが移動しながら撮影した長めの映像」を扱うのは難しく、どうしても品質に難がありましたが、韓国科学技術院や国立台湾大学、Meta、メリーランド大学カレッジパーク校の研究者らが、長めの映像からでも品質の高い3Dデータをレンダリングできるようになる手法を編み出しました。
·gigazine.net·
ムービーを高品質な3Dデータに変換できる手法が登場
レンズがなくても位置データと画像生成AIを使って撮影する不思議なカメラ「Paragraphica」
レンズがなくても位置データと画像生成AIを使って撮影する不思議なカメラ「Paragraphica」
写真は被写体に当たって反射した光をレンズで集約し、デジタルセンサーやフィルムに当てることで撮影できます。しかし、オランダ在住のデザイナーであるビョルン・カルマン氏が開発した「Paragraphica」は写真撮影に必要なレンズがなく、位置データと画像生成AIを使って風景写真を生成するカメラとなっています。
·gigazine.net·
レンズがなくても位置データと画像生成AIを使って撮影する不思議なカメラ「Paragraphica」
たった1枚の写真から高解像度の3DCGモデルをAIで生成できる「Human-SGD」が発表される
たった1枚の写真から高解像度の3DCGモデルをAIで生成できる「Human-SGD」が発表される
写真から3DCGモデルを作成するにはさまざまな方向から被写体を何枚も撮影する必要があります。クウェート大学・Meta・メリーランド大学の研究者が、たった1枚の写真から高解像度のCGモデルを生成する「Human-SGD」を発表しました。
·gigazine.net·
たった1枚の写真から高解像度の3DCGモデルをAIで生成できる「Human-SGD」が発表される
手描きからデジタルへと映画の背景技術はどのように進化してきたのか、そしてAI時代にどうなっていくのか?
手描きからデジタルへと映画の背景技術はどのように進化してきたのか、そしてAI時代にどうなっていくのか?
テキストを入力するだけで高品質な画像や動画を出力できる生成AIの登場により、AIが中国でイラストレーターの仕事を奪い始めているというレポートや、生成AIはゲーム開発のあり方を大きく変えつつあるとする報道など、高度な仕事のレベルで生成AIが活用されるケースも多数確認されています。映像制作においては、実写映像と背景画を合成する「マット」という技術を用いたマットペイントから3DCG背景の合成と進化してきましたが、AIが業界を変える新たなステップになる可能性が高まっています。映画の背景技術に関する進化の歴史と、AIがそれをどのように変革しうるかについて、オンラインメディアのVoxがムービーで解説しています。
·gigazine.net·
手描きからデジタルへと映画の背景技術はどのように進化してきたのか、そしてAI時代にどうなっていくのか?
Microsoftが顔写真と音声ファイルからリアルに話す映像を作成できるAIモデル「VASA-1」公開
Microsoftが顔写真と音声ファイルからリアルに話す映像を作成できるAIモデル「VASA-1」公開
Microsoftの研究機関であるMicrosoft Researchが、1枚の顔写真と音声ファイルから「本物の人間そっくりな話し顔」を生成することができるAIモデルの「VASA-1」を発表しました。VASA-1は音声ファイルとリップシンクしながら、顔写真の表情を自然に変化させ、生き生きとした「話し顔」を生成することができます。
·gigazine.net·
Microsoftが顔写真と音声ファイルからリアルに話す映像を作成できるAIモデル「VASA-1」公開
Googleが開発した画像分類タスクが可能な機械学習モデル「Vision Transformers」の仕組みとは?
Googleが開発した画像分類タスクが可能な機械学習モデル「Vision Transformers」の仕組みとは?
Googleの機械学習モデル「Transformer」は、データを時系列に処理しなくても、自然言語などのデータを翻訳やテキスト要約することが可能で、ChatGPTなどの自然な会話が可能なチャットAIのベースとなっています。また、Transformerの手法を画像分野に応用したモデルが「Vision Transformer」です。ソフトウェアエンジニアのデニス・タープ氏が、「Vision Transformer」のコンポーネントがどのように機能し、データはどのような流れをたどるのか、ビジュアル化して解説しています
·gigazine.net·
Googleが開発した画像分類タスクが可能な機械学習モデル「Vision Transformers」の仕組みとは?
AI生成の児童ポルノが爆増しており児童搾取に関する報告システムが機能不全に陥る恐れがあるとインターネット監視団が警告
AI生成の児童ポルノが爆増しており児童搾取に関する報告システムが機能不全に陥る恐れがあるとインターネット監視団が警告
1998年から運営されている児童性的虐待ホットライン「CyberTipline」が十分に機能しておらず、今後、「AI生成の児童ポルノ」が増えると、本物の虐待被害者を見つけることはさらに難しくなっていくと、専門家が指摘しています。
·gigazine.net·
AI生成の児童ポルノが爆増しており児童搾取に関する報告システムが機能不全に陥る恐れがあるとインターネット監視団が警告
AIは実際の人間の顔よりリアルに見える顔を作るという「ハイパーリアリズム」現象が含む大きな問題点とは?
AIは実際の人間の顔よりリアルに見える顔を作るという「ハイパーリアリズム」現象が含む大きな問題点とは?
AIは実在していない人間の顔写真を生成することができ、その精度はすさまじい勢いで高まっています。AI製のスパイや実在しないエンジニアを活用したと疑われる例も報じられているほか、AIの生成した顔は本物の顔と区別がつかないだけではなく「本物の顔より信頼性が高い」とされる研究もあります。オーストラリア国立大学の上級講師であるエイミー・ダウェル氏は「AIは、本物の人間の顔よりも本物らしく見える顔を作成できる」ことを示した上で、そのようなAIの能力「ハイパーリアリズム」について解説しています。
·gigazine.net·
AIは実際の人間の顔よりリアルに見える顔を作るという「ハイパーリアリズム」現象が含む大きな問題点とは?
Adobeが基本無料で使える高品質かつ高速な日本語対応画像生成AI「Firefly Image 3」を公開したので使ってみた
Adobeが基本無料で使える高品質かつ高速な日本語対応画像生成AI「Firefly Image 3」を公開したので使ってみた
Adobeが画像生成AIモデル「Adobe Firefly Image 3 Foundation モデル(ベータ版)」を2024年4月23日に発表しました。既にウェブ版Adobe Fireflyで同モデルを用いた画像生成が可能になっていたので、実際に使ってどんな画像を生成できるのか確認してみました。
·gigazine.net·
Adobeが基本無料で使える高品質かつ高速な日本語対応画像生成AI「Firefly Image 3」を公開したので使ってみた
向きをリモートで変え自動追跡できるReolinkの4Kセキュリティ監視カメラ「TrackMix PoE」レビュー、双方向通話・赤外線ナイトビジョン・カラーナイトビジョンなど超多機能
向きをリモートで変え自動追跡できるReolinkの4Kセキュリティ監視カメラ「TrackMix PoE」レビュー、双方向通話・赤外線ナイトビジョン・カラーナイトビジョンなど超多機能
香港に拠点を置くReolinkの「TrackMix PoE」は、対象を自動追跡して広範囲を撮影可能な4Kセキュリティカメラです。双方向通話、人体・車両検知、赤外線ナイトビジョンにカラーナイトビジョンと多機能さがウリ。今回はReolinkから直接提供してもらったので、前回レビューした「RLC-833A」と同じように性能や使い勝手をいろいろ確認してみることにしました。
·gigazine.net·
向きをリモートで変え自動追跡できるReolinkの4Kセキュリティ監視カメラ「TrackMix PoE」レビュー、双方向通話・赤外線ナイトビジョン・カラーナイトビジョンなど超多機能