画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

ソニーがAIモデルの公平性を評価するためのデータセット「Fair Human-Centric Image Benchmark(FHIBE)」を公開
ソニーがAIモデルの公平性を評価するためのデータセット「Fair Human-Centric Image Benchmark(FHIBE)」を公開
コンピュータービジョンは自動運転車やスマートフォンなどさまざまな分野に活用されていますが、多くのデータセットは依然としてバイアスや多様性の欠如、倫理的に責任のある方法で収集されていない、つまりは被写体の同意なしに写真がAIトレーニングに利用されているなどの問題を抱えています。人間中心のコンピュータービジョンタスクにおける公平性を評価するために特別に構築された、多様性に富んだ、被写体の同意に基づいた初めての公開データセットが「Fair Human-Centric Image Benchmark(FHIBE)」です。
·gigazine.net·
ソニーがAIモデルの公平性を評価するためのデータセット「Fair Human-Centric Image Benchmark(FHIBE)」を公開
【66%オフ】AIによる画像の高精細化・ノイズ除去・ピンボケ補正などが簡単ワンタッチで可能な「Aiarty Image Enhancer」を使ってみた
【66%オフ】AIによる画像の高精細化・ノイズ除去・ピンボケ補正などが簡単ワンタッチで可能な「Aiarty Image Enhancer」を使ってみた
AI技術を活用して簡単にAI生成画像・荒い写真・圧縮されたJPEG画像からノイズを除去したり、ピンボケを補正したり、ロスレス拡大したり、高精細化したりすることができるというソフトウェアが「Aiarty Image Enhancer」です。Aiarty Image Enhancerを特価で購入できるコラボキャンペーン実施中ということで、実際にどんなことができるのか確かめてみました。
·gigazine.net·
【66%オフ】AIによる画像の高精細化・ノイズ除去・ピンボケ補正などが簡単ワンタッチで可能な「Aiarty Image Enhancer」を使ってみた
テキスト・画像・動画から3Dワールドを生成するマルチモーダルワールドモデル「Marble」が一般公開される
テキスト・画像・動画から3Dワールドを生成するマルチモーダルワールドモデル「Marble」が一般公開される
現地時間の2025年11月12日、スタンフォード人工知能研究所で所長を務めたコンピューターサイエンスの権威であるフェイフェイ・リ氏らが立ち上げたAI企業のWorld Labsが、独自のマルチモーダルワールドモデル「Marble」を発表しました。
·gigazine.net·
テキスト・画像・動画から3Dワールドを生成するマルチモーダルワールドモデル「Marble」が一般公開される
OpenAIが故キング牧師に似たディープフェイク動画を生成するSoraの機能を一時停止、一部のユーザーが「無礼な描写」を作成し遺産管理団体から停止要請があったため
OpenAIが故キング牧師に似たディープフェイク動画を生成するSoraの機能を一時停止、一部のユーザーが「無礼な描写」を作成し遺産管理団体から停止要請があったため
OpenAIは2025年10月16日に、ソーシャルアプリ「Sora」上でマーティン・ルーサー・キング・ジュニア牧師のディープフェイク動画の作成を一時停止したと発表しました。これは、キング牧師を題材にしたAI動画が大量に生成されたことに対し、キング牧師の遺産管理団体と遺族から苦情があったためです。
·gigazine.net·
OpenAIが故キング牧師に似たディープフェイク動画を生成するSoraの機能を一時停止、一部のユーザーが「無礼な描写」を作成し遺産管理団体から停止要請があったため
トイレの便器に取り付けて排せつ物の写真を撮影できるカメラ「Dekoda」が登場
トイレの便器に取り付けて排せつ物の写真を撮影できるカメラ「Dekoda」が登場
人間の排せつ物はさまざまな健康のバロメーターになることが知られており、排せつ物からユーザーの健康状態を管理するスマートトイレの開発も進められています。新たに、キッチン&バス用品メーカーのKohlerが、トイレの便器に取り付けて排せつ物の写真を撮影できるカメラ「Dekoda」を発表しました。
·gigazine.net·
トイレの便器に取り付けて排せつ物の写真を撮影できるカメラ「Dekoda」が登場
DeepSeekが視覚情報を使用してテキスト入力を圧縮するマルチモーダルAIモデル「DeepSeek-OCR」をリリース
DeepSeekが視覚情報を使用してテキスト入力を圧縮するマルチモーダルAIモデル「DeepSeek-OCR」をリリース
DeepSeekが新しいマルチモーダルAIモデル「DeepSeek-OCR」をリリースしました。「OCR」は書類のスキャンなどに用いられる光学文字認識(Optical Character Recognition)のことで、トークンを大幅に削減しつつ、大規模で複雑なドキュメントを処理できるモデルだとのことです。
·gigazine.net·
DeepSeekが視覚情報を使用してテキスト入力を圧縮するマルチモーダルAIモデル「DeepSeek-OCR」をリリース
YouTubeで顔を勝手に使われていないか探す「類似性検出」機能はどのように使うのか?
YouTubeで顔を勝手に使われていないか探す「類似性検出」機能はどのように使うのか?
AI生成コンテンツが増加して、中には、「その人が言っていないことを、さも言っていたかのように見せかける」ような映像も生み出されていて、問題になっています。こうした問題に対処するため、YouTubeが以前から取り組んでいたクリエイター向けの肖像検出ツールを正式に展開することを発表しました。ツールを使うと、勝手に自分の顔を使っているコンテンツを検出して削除依頼を出すことができます。
·gigazine.net·
YouTubeで顔を勝手に使われていないか探す「類似性検出」機能はどのように使うのか?
あらゆる画像生成AIの性能を測定できるベンチマーク「ImagenWorld」登場、画像生成や画像編集の精度を評価し苦手分野を特定可能
あらゆる画像生成AIの性能を測定できるベンチマーク「ImagenWorld」登場、画像生成や画像編集の精度を評価し苦手分野を特定可能
画像生成AIの性能は「他のAIと比べてキレイな画像を生成できる」といった数値化しにくい形式で評価されることが多いです。「ImagenWorld」はウォータールー大学やComfy.orgの研究チームが開発したベンチマークで、各種AIに画像生成や画像編集などのタスクを課して性能を定量的に評価することができます。
·gigazine.net·
あらゆる画像生成AIの性能を測定できるベンチマーク「ImagenWorld」登場、画像生成や画像編集の精度を評価し苦手分野を特定可能
Amazonが配達ドライバー向けAIスマートグラスを発表、配達先までのナビをレンズに投影して荷物スキャンや配達完了手続きも自動化
Amazonが配達ドライバー向けAIスマートグラスを発表、配達先までのナビをレンズに投影して荷物スキャンや配達完了手続きも自動化
Amazonが、配達する荷物のスキャンや届け先までのルート案内、配達証明の取得などを行える配達ドライバー向けのAI搭載スマートグラスを開発したと発表しました。Amazonはアメリカ・カナダの配達ドライバーを対象にこのメガネの試験運用を行っており、より広範囲に展開する前に技術を改良する予定としています。
·gigazine.net·
Amazonが配達ドライバー向けAIスマートグラスを発表、配達先までのナビをレンズに投影して荷物スキャンや配達完了手続きも自動化
ショート動画を爆速で作成できる無料でオープンソースのAIモデル「Ovi」誕生、「テキスト」「テキスト+画像」で動画と音声を同時に生成可能
ショート動画を爆速で作成できる無料でオープンソースのAIモデル「Ovi」誕生、「テキスト」「テキスト+画像」で動画と音声を同時に生成可能
テキスト単体、あるいはテキスト+画像で5秒の動画を作成できるAIモデル「Ovi」が誕生しました。オープンソースで公開されており、自分で環境を構築すれば無料で使用することができます。
·gigazine.net·
ショート動画を爆速で作成できる無料でオープンソースのAIモデル「Ovi」誕生、「テキスト」「テキスト+画像」で動画と音声を同時に生成可能
1枚のイラストや写真から3D空間を生成できるAIモデル「HunyuanWorld-Mirror」が登場、マルチアングル入力や動画入力にも対応し競合モデルより高品質
1枚のイラストや写真から3D空間を生成できるAIモデル「HunyuanWorld-Mirror」が登場、マルチアングル入力や動画入力にも対応し競合モデルより高品質
中国の大手テクノロジー企業であるテンセントが生成AIモデル「Hunyuan World 1.1(HunyuanWorld-Mirror)」を公開しました。HunyuanWorld-Mirrorは画像を元に深度を再現した3D空間を生成することが可能。さらに、単一の画像だけでなく複数のアングルからの画像や動画の入力にも対応しています。
·gigazine.net·
1枚のイラストや写真から3D空間を生成できるAIモデル「HunyuanWorld-Mirror」が登場、マルチアングル入力や動画入力にも対応し競合モデルより高品質
画像認識AIモデル「Qwen3-VL」の軽量版が登場したので使ってみた、低いVRAM使用量で高性能を実現
画像認識AIモデル「Qwen3-VL」の軽量版が登場したので使ってみた、低いVRAM使用量で高性能を実現
Qwen3-VLの軽量版であるQwen3-VL-4BおよびQwen3-VL-8Bが公開されました。これらのモデルは、Qwen3-VLの全機能が保持されており、従来のモデルに比べて大幅にVRAM使用量を削減しつつ、Qwen2.5-VL-72Bに匹敵する性能を発揮するとのことで試しにローカルPCにインストールして使ってみました。
·gigazine.net·
画像認識AIモデル「Qwen3-VL」の軽量版が登場したので使ってみた、低いVRAM使用量で高性能を実現
AI生成画像じゃないことを証明できるカメラ「Roc Camera」
AI生成画像じゃないことを証明できるカメラ「Roc Camera」
画像生成AIの進歩は急速に進んでおり、すでに実写と見分けがつかない画像を誰でも簡単に生成できるようになっています。そんな中、カメラで撮影した本物の写真であることを証明できる仕組みを内蔵した「Roc Camera」が登場しました。
·gigazine.net·
AI生成画像じゃないことを証明できるカメラ「Roc Camera」
画像生成AIがテキスト指示による画像編集でどれだけ指示を守ることができるかを実際の生成画像を見て評価できる「GenAI Image Editing Showdown」
画像生成AIがテキスト指示による画像編集でどれだけ指示を守ることができるかを実際の生成画像を見て評価できる「GenAI Image Editing Showdown」
「GenAI Image Showdown」は複数の画像生成AIに同じプロンプトを入力した結果をまとめたウェブサイトで、どの画像生成AIがプロンプトに忠実な画像を生成できるのかを比較して評価することができます。さらに、画像生成ではなくテキスト指示での「編集」を行う場合、どれくらい指示を守って忠実に画像を修正するのかモデル別に比較することができるのが「GenAI Image Editing Showdown」です。
·gigazine.net·
画像生成AIがテキスト指示による画像編集でどれだけ指示を守ることができるかを実際の生成画像を見て評価できる「GenAI Image Editing Showdown」
2億画素の望遠カメラ&7500mAhの大容量バッテリーを搭載したスマホ「OPPO Find X9 Pro」が登場、10倍光学ズームを実現する外付けテレコンもあり
2億画素の望遠カメラ&7500mAhの大容量バッテリーを搭載したスマホ「OPPO Find X9 Pro」が登場、10倍光学ズームを実現する外付けテレコンもあり
OPPOが「Find X9」と「Find X9 Pro」を2025年10月29日に発表しました。Find X9 ProはHasselbladと共同開発した200メガピクセル(2億画素)の望遠カメラを搭載しており、光学ズーム倍率を10倍に引き上げるテレコンバーターも用意されています。
·gigazine.net·
2億画素の望遠カメラ&7500mAhの大容量バッテリーを搭載したスマホ「OPPO Find X9 Pro」が登場、10倍光学ズームを実現する外付けテレコンもあり
AdobeがPhotoshopやPremiereなど向けのAIツールを発表、画像生成AIのFirefly Image Model 5ではネイティブ4MP解像度での画像生成が可能に
AdobeがPhotoshopやPremiereなど向けのAIツールを発表、画像生成AIのFirefly Image Model 5ではネイティブ4MP解像度での画像生成が可能に
現地時間の2025年10月28日、Adobeが世界最大のクリエイティブカンファレンスである「Adobe MAX 2025」を開催しました。Adobeは主力製品であるAdobe ExpressやAdobe Firefly、Adobe Photoshopといったソフトウェア全体に、AI機能やAIアシスタントを導入すると発表しています。
·gigazine.net·
AdobeがPhotoshopやPremiereなど向けのAIツールを発表、画像生成AIのFirefly Image Model 5ではネイティブ4MP解像度での画像生成が可能に
YouTubeがAIを使ってフルHD未満のアップロード動画をHD画質に高画質化する新機能を導入、近い将来に4Kへのアップスケールも計画中でクリエイターはオプトアウトすることも可能
YouTubeがAIを使ってフルHD未満のアップロード動画をHD画質に高画質化する新機能を導入、近い将来に4Kへのアップスケールも計画中でクリエイターはオプトアウトすることも可能
YouTubeはスマートフォンやPCなどさまざまなデバイスで視聴可能ですが、「テレビでの動画再生から6桁(数千万円)以上の収益を上げているYouTubeチャンネル」の数は前年比で45%以上増加しているそうです。この需要に合わせた「テレビを使っているユーザー」向けのアップデートを、YouTubeが発表しました。
·gigazine.net·
YouTubeがAIを使ってフルHD未満のアップロード動画をHD画質に高画質化する新機能を導入、近い将来に4Kへのアップスケールも計画中でクリエイターはオプトアウトすることも可能
Photoshop代替として注目されるAffinityが無料化される、写真編集・ベクター編集・レイアウトを単一アプリで実行可能
Photoshop代替として注目されるAffinityが無料化される、写真編集・ベクター編集・レイアウトを単一アプリで実行可能
Affinityが開発するデザインツール群はPhotoshopやIllustratorといったサブスクリプション型のAdobe製品と違って買い切り型のライセンスモデルを採用しており、Adobe製品からの乗り換え先として注目を集めていました。そんなAffinityのデザインツール群が「Affinity」という名称の単一アプリにまとまり、無料で使えるようになったことが発表されました。
·gigazine.net·
Photoshop代替として注目されるAffinityが無料化される、写真編集・ベクター編集・レイアウトを単一アプリで実行可能
Metaがエロ動画をAIのトレーニングに使ったとアダルトサイトから訴えられるも「個人利用」だとして反論
Metaがエロ動画をAIのトレーニングに使ったとアダルトサイトから訴えられるも「個人利用」だとして反論
Metaは2025年7月に、「成人向け映像約2396本を不正にダウンロードし、AIモデルのトレーニングに無断で用いた」として、アダルト映画制作会社から提訴されました。これに対しMetaは、「当該ダウンロードはAIのトレーニング目的ではなく、従業員やサイト利用者らによる私的な個人利用」だと主張し、AIのトレーニングに成人向けコンテンツを使用していないと反論しています。
·gigazine.net·
Metaがエロ動画をAIのトレーニングに使ったとアダルトサイトから訴えられるも「個人利用」だとして反論
動画生成AI「Sora 2」でのキャラ使用についてスタジオジブリやコンテンツ産業の業界団体「CODA」が学習拒否および著作権への真摯な対応を求める要望書を提出
動画生成AI「Sora 2」でのキャラ使用についてスタジオジブリやコンテンツ産業の業界団体「CODA」が学習拒否および著作権への真摯な対応を求める要望書を提出
OpenAIが開発した動画生成AI「Sora 2」はピカチュウやマリオなどの人気キャラクターを含む動画を簡単に作れてしまいます。この状況を受けて、一般社団法人コンテンツ海外流通促進機構(CODA)がOpenAIに対して要望書を提出しました。
·gigazine.net·
動画生成AI「Sora 2」でのキャラ使用についてスタジオジブリやコンテンツ産業の業界団体「CODA」が学習拒否および著作権への真摯な対応を求める要望書を提出
動画生成AIアプリ「Sora」のAndroid版が登場
動画生成AIアプリ「Sora」のAndroid版が登場
OpenAIが動画生成AIアプリ「Sora」のAndroid版を2025年11月5日にリリースしました。日本からもダウンロード可能で、動画を生成したり世界中のユーザーが作成した動画を閲覧したりできます。
·gigazine.net·
動画生成AIアプリ「Sora」のAndroid版が登場
画像生成AI「Stable Diffusion」をGetty Imagesが著作権侵害で訴えた訴訟は商標権侵害のみ認定、両者が勝利を宣言
画像生成AI「Stable Diffusion」をGetty Imagesが著作権侵害で訴えた訴訟は商標権侵害のみ認定、両者が勝利を宣言
写真素材の有料配信を行っているストックフォトサービスの「Getty Images(ゲッティ・イメージズ)」が、画像生成AIの「Stable Diffusion」によって知的財産権が侵害されているとして起こした訴訟で、ロンドンの高等法院による判決が下りました。内容は、AIモデルによる著作権侵害の主張については「著作権侵害のコピーではない」と却下する一方、透かしに関する商標権侵害についての主張は認めるもので、Getty Imagesからも、Stabile Diffusionを運営するStability AIからも実質的な勝利宣言が出されています。
·gigazine.net·
画像生成AI「Stable Diffusion」をGetty Imagesが著作権侵害で訴えた訴訟は商標権侵害のみ認定、両者が勝利を宣言
Microsoftが初となる自社開発の画像生成AIモデル「MAI-Image-1」を発表
Microsoftが初となる自社開発の画像生成AIモデル「MAI-Image-1」を発表
MicrosoftのAI部門であるMicrosoft AIが、自社で設計・開発した初の画像生成モデル「MAI-Image-1」を発表しました。MicrosoftはこのMAI-Image-1を「私たちの旅の次のステップ」と呼んでいます。
·gigazine.net·
Microsoftが初となる自社開発の画像生成AIモデル「MAI-Image-1」を発表
シンプルな原理とユニークな特性を持つ新しい生成AIモデル「DDN(Discrete Distribution Networks)」
シンプルな原理とユニークな特性を持つ新しい生成AIモデル「DDN(Discrete Distribution Networks)」
シンプルな原理とユニークな特性を持った新しい生成AIモデルの「DDN(Discrete Distribution Networks:離散分布ネットワーク)」を、コンピュータービジョンや大規模言語モデル(LLM)の研究者であるレイ・ヤン氏が発表しました。
·gigazine.net·
シンプルな原理とユニークな特性を持つ新しい生成AIモデル「DDN(Discrete Distribution Networks)」
日本政府がアニメやゲームなどの日本の知的財産を「かけがえのない宝」と呼んでOpenAIに著作権を侵害しないよう正式に要請したことが海外で話題に
日本政府がアニメやゲームなどの日本の知的財産を「かけがえのない宝」と呼んでOpenAIに著作権を侵害しないよう正式に要請したことが海外で話題に
OpenAIが2025年10月1日にリリースした動画生成AI「Sora 2」で、日本のゲームやアニメなどの著作権で保護されたコンテンツを含む動画が大量に生成されて問題となりました。この事態に対して、日本政府がOpenAIに対して「著作権侵害となるような行為を行わないように要請した」ことが海外で話題になっています。
·gigazine.net·
日本政府がアニメやゲームなどの日本の知的財産を「かけがえのない宝」と呼んでOpenAIに著作権を侵害しないよう正式に要請したことが海外で話題に
iPhoneやMacで重量級画像生成AIをローカル実行できる「Draw Things」を使ってみたよレビュー、Qwen Imageのような大型モデルも実行可能
iPhoneやMacで重量級画像生成AIをローカル実行できる「Draw Things」を使ってみたよレビュー、Qwen Imageのような大型モデルも実行可能
「Draw Things」はiPhone・iPad・macOSに対応した無料の画像生成AIアプリで、多様なモデルを用いてローカルで生成処理を実行できます。Qwen Imageなどの大型モデルもiPhoneでローカル動作させられるとのことなので、実際に使ってみました。
·gigazine.net·
iPhoneやMacで重量級画像生成AIをローカル実行できる「Draw Things」を使ってみたよレビュー、Qwen Imageのような大型モデルも実行可能