画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2722 bookmarks
Newest
Netflixが映像クリエイター向けに生成AIの使用に関するルールを公開
Netflixが映像クリエイター向けに生成AIの使用に関するルールを公開
映像ストリーミングサービスのNetflixは、自社プラットフォームで配信されるオリジナルコンテンツの制作者に対し、生成AIを使用する上で守って欲しいいくつかの指針を公開しました。Netflixは映像制作側が生成AIを使用することを歓迎していますが、デリケートな分野であるため守ってほしい指針があるとしています。
·gigazine.net·
Netflixが映像クリエイター向けに生成AIの使用に関するルールを公開
一見無害な画像の中に文字列を埋め込んでAIを攻撃する恐るべき手法が発見される
一見無害な画像の中に文字列を埋め込んでAIを攻撃する恐るべき手法が発見される
画像に一見しただけではわからない「隠された文字列」を埋め込み、被害者がこの画像を大規模言語モデルに読み込ませることで、AIエージェントに対するプロンプトインジェクション攻撃が発動するという攻撃手法が発見されました。この攻撃手法を作成して確認するためのツールも、GitHubで公開されています。
·gigazine.net·
一見無害な画像の中に文字列を埋め込んでAIを攻撃する恐るべき手法が発見される
趣味で研究が進められた「AIを使った絵画修復」に関する論文が美術界を震撼させる
趣味で研究が進められた「AIを使った絵画修復」に関する論文が美術界を震撼させる
芸術作品は時間が経つにつれて劣化するため、作品を後世に残すためには、修復作業が必要です。しかし、芸術作品の修復失敗事件は多数発生しており、「素人修復家にアート修復を任せるべきではない」と訴えられることもあります。そんな中で、マサチューセッツ工科大学(MIT)で機械工学を専攻する大学院研究員が、芸術分野では素人にもかかわらず、AIを利用して絵画を修復する新しい方法を提案して美術界に衝撃を与えました。
·gigazine.net·
趣味で研究が進められた「AIを使った絵画修復」に関する論文が美術界を震撼させる
FFmpeg 8.0「Huffman」リリース、文字起こしAI「Whisper」やVulkanベースのコーデックへの正式対応など過去最大級のメジャーアップデート
FFmpeg 8.0「Huffman」リリース、文字起こしAI「Whisper」やVulkanベースのコーデックへの正式対応など過去最大級のメジャーアップデート
マルチメディアフレームワークであるFFmpegのバージョン8.0「Huffman」が2025年8月22日にリリースされました。このバージョンではオープンソースのAI音声認識モデルであるWhisperフィルターが新たに追加され、FFmpeg単体で自動音声認識が可能になり、ライブ字幕の生成や文字起こしといった機能が利用できるようになります。
·gigazine.net·
FFmpeg 8.0「Huffman」リリース、文字起こしAI「Whisper」やVulkanベースのコーデックへの正式対応など過去最大級のメジャーアップデート
YouTube運営が無許可で動画をAI処理して見た目を変えていたことが判明、YouTube側は「生成AIではなく機械学習でボケやノイズを低減」と説明
YouTube運営が無許可で動画をAI処理して見た目を変えていたことが判明、YouTube側は「生成AIではなく機械学習でボケやノイズを低減」と説明
「YouTubeのショート動画が投稿者の許可無くAI処理され、見た目が変化する」という事態が発生していることが明らかになりました。YouTubeはショート動画への処理を認めており、処理内容を説明しています。
·gigazine.net·
YouTube運営が無許可で動画をAI処理して見た目を変えていたことが判明、YouTube側は「生成AIではなく機械学習でボケやノイズを低減」と説明
知覚的に均一になるように設計された新しいカラーモデル「OKLCH」とは?
知覚的に均一になるように設計された新しいカラーモデル「OKLCH」とは?
色の表現方法であるカラーモデルにはCMYKやRGBといったものがありますが、知覚的に均一になるよう設計された新しいカラーモデルの「OKLCH」は、人間の色認識の精度が大幅に向上し、色彩の扱いがはるかに容易になるという利点を持っているそうです。このOKLCHとは一体どういったものなのかについて、OpenSeaのデザイナー兼デザインエンジニアのヤクブ・クレヘル氏が解説しています。
·gigazine.net·
知覚的に均一になるように設計された新しいカラーモデル「OKLCH」とは?
Googleが無料の超高品質な画像編集AI「Gemini 2.5 Flash Image」をリリース、日本語で指示できて実写からアニメキャラへの変換も可能
Googleが無料の超高品質な画像編集AI「Gemini 2.5 Flash Image」をリリース、日本語で指示できて実写からアニメキャラへの変換も可能
Googleが優れた画像編集能力を持つ「Gemini 2.5 Flash Image」をGeminiに統合しました。Gemini 2.5 Flash Imageは画像の特徴を維持しながら編集することが得意で、AIの画像編集能力を測定するテストではOpenAIの画像生成AIやFluxシリーズを大きく超えるスコアを示しています。
·gigazine.net·
Googleが無料の超高品質な画像編集AI「Gemini 2.5 Flash Image」をリリース、日本語で指示できて実写からアニメキャラへの変換も可能
「AIで100倍ズーム」はどれだけキレイなのか実際にPixel 10 Proのカメラで撮影してみたよレビュー、AIによる謎補正例もあり
「AIで100倍ズーム」はどれだけキレイなのか実際にPixel 10 Proのカメラで撮影してみたよレビュー、AIによる謎補正例もあり
Google製スマートフォン「Pixel 10 Pro」と「Pixel 10 Pro XL」のカメラには最大100倍までズームできる「超解像ズームPro」という機能が備わっています。公式ページには「アップグレードされた望遠レンズと新開発のAI画像技術により、これまでにないくっきりと鮮やかなアップ写真の撮影が可能」と記されていたので、実際に撮影してどれだけキレイな写真を撮影できるのか確かめてみました。
·gigazine.net·
「AIで100倍ズーム」はどれだけキレイなのか実際にPixel 10 Proのカメラで撮影してみたよレビュー、AIによる謎補正例もあり
「100倍ズームできるPixel 10 Pro」&「無印モデルで3眼カメラなPixel 10」のカメラ性能を徹底比較してみた、ごはん撮影や夜間撮影など実際に撮影した作例多数
「100倍ズームできるPixel 10 Pro」&「無印モデルで3眼カメラなPixel 10」のカメラ性能を徹底比較してみた、ごはん撮影や夜間撮影など実際に撮影した作例多数
Google製スマートフォン「Pixel 10」「Pixel 10 Pro」「Pixel 10 Pro XL」が2025年8月28日に発売されました。GIGAZINE編集部で実際に買った3モデルのベンチマークテストを実施した結果、プロセッサの処理性能には大きな差がないことが判明。そうなると「カメラ性能の違い」が購入モデルを決める際の大きなポイントとなります。というわけで、無印モデルとProモデルのカメラ性能の違いを徹底的に検証してみました。
·gigazine.net·
「100倍ズームできるPixel 10 Pro」&「無印モデルで3眼カメラなPixel 10」のカメラ性能を徹底比較してみた、ごはん撮影や夜間撮影など実際に撮影した作例多数
上手な写真撮影のアドバイスをGoogleのAI「Gemini」が教えてくれる新機能「カメラコーチ」は本当に効果があるのかPixel 10で実際に使ってみたよレビュー
上手な写真撮影のアドバイスをGoogleのAI「Gemini」が教えてくれる新機能「カメラコーチ」は本当に効果があるのかPixel 10で実際に使ってみたよレビュー
Google製スマートフォンのPixel 10シリーズのカメラアプリには、AIが被写体を読み取って適切な撮影方法を教えてくれる「カメラコーチ」という機能が備わっています。カメラ初心者でもAIの指示に従って見栄えのいい写真を撮影できるとのことなので、実際に使ってみました。
store
·gigazine.net·
上手な写真撮影のアドバイスをGoogleのAI「Gemini」が教えてくれる新機能「カメラコーチ」は本当に効果があるのかPixel 10で実際に使ってみたよレビュー
AI生成か実写かわかる「C2PA」が自動的に撮影した写真へ埋め込まれるPixel 10でいろいろ確認してみたレビュー、どんな情報が残るのか&どうすれば消えるのか
AI生成か実写かわかる「C2PA」が自動的に撮影した写真へ埋め込まれるPixel 10でいろいろ確認してみたレビュー、どんな情報が残るのか&どうすれば消えるのか
画像生成AIの技術向上に伴って、実写と区別が付かないほどリアルなフェイク画像が作られるようになりました。「C2PA」は画像にコンテンツ認証情報を埋め込む技術で、「どのカメラで撮影されて、どのアプリで編集されたか」ということを証明することで実写画像かフェイク画像かを見分けられるようにします。2025年8月28日に登場したPixel 10シリーズもC2PAに対応しており、撮影した写真や編集した写真にコンテンツ認証情報を埋め込むことが可能。文章の説明だけだとよく分からないので、実際にコンテンツ認証情報を見る方法や効果をまとめてみました。
·gigazine.net·
AI生成か実写かわかる「C2PA」が自動的に撮影した写真へ埋め込まれるPixel 10でいろいろ確認してみたレビュー、どんな情報が残るのか&どうすれば消えるのか
キャラクターを維持したまま別のシチュエーションに描き直せる画像編集AI「Qwen-Image-Edit」が登場、文字の描き直しや「被写体の回転」も可能
キャラクターを維持したまま別のシチュエーションに描き直せる画像編集AI「Qwen-Image-Edit」が登場、文字の描き直しや「被写体の回転」も可能
中国のIT企業・アリババ(阿里巴巴)のAI開発チームが、画像生成AI「Qwen-Image」に基づいて画像編集タスクを拡張し、キャラクターの元の見た目を維持したまま別の情景を描き出すことができる「Qwen-Image-Edit」を発表しました。
·gigazine.net·
キャラクターを維持したまま別のシチュエーションに描き直せる画像編集AI「Qwen-Image-Edit」が登場、文字の描き直しや「被写体の回転」も可能
NVIDIAがロボット開発のための仮想世界構築ツールを大幅アップデート&ロボットに世界を認識させるための視覚言語モデル(VLM)もリリース
NVIDIAがロボット開発のための仮想世界構築ツールを大幅アップデート&ロボットに世界を認識させるための視覚言語モデル(VLM)もリリース
NVIDIAはロボット開発や自動運転車などの開発に役立つ仮想世界構築プラットフォーム「Omniverse」を展開しています。新たに、CGに関する国際会議「SIGGRAPH」の開催に合わせて、Omniverseのアップデートが発表されました。
·gigazine.net·
NVIDIAがロボット開発のための仮想世界構築ツールを大幅アップデート&ロボットに世界を認識させるための視覚言語モデル(VLM)もリリース
Metaが視覚言語モデル「DINOv3」を発表、ラベルなし画像から自己教師学習してさまざまなタスクで高いパフォーマンスを発揮可能
Metaが視覚言語モデル「DINOv3」を発表、ラベルなし画像から自己教師学習してさまざまなタスクで高いパフォーマンスを発揮可能
画像生成AIや画像を分析するためのAIをトレーニングするためには、ネコの画像に「ネコ」「歩いている」「しま模様」というようなラベルを手作業で大量につけたデータが必要です。しかし、Metaが発表した「DINOv3」というモデルは、ラベルなしの画像17億枚を使ってトレーニングされており、ラベルに縛られないさまざまなタスクを人間の介入なしに専門のモデル以上の性能でこなすことができます。
·gigazine.net·
Metaが視覚言語モデル「DINOv3」を発表、ラベルなし画像から自己教師学習してさまざまなタスクで高いパフォーマンスを発揮可能
小鳥は超高速で点滅する光を認識する能力が人間の2倍以上も優れている
小鳥は超高速で点滅する光を認識する能力が人間の2倍以上も優れている
空を飛ぶ鳥は、視界の中を高速で移動する昆虫や障害物などに素早く気づき、その正体を見分けて追跡する必要があります。スウェーデンの研究者らが2016年に発表した論文では、野生の小鳥がヒトの2倍以上もの視覚的な時間分解能(一定時間内に起きた視覚的変化を感知する能力)を持っていることが報告されています。
·gigazine.net·
小鳥は超高速で点滅する光を認識する能力が人間の2倍以上も優れている
画像生成AI「Qwen-Image」登場、OpenAIやFlux超えの高品質画像を生成可能で「複数行の漢字」を自然に描写できる驚異的テキスト描画性能をアピール
画像生成AI「Qwen-Image」登場、OpenAIやFlux超えの高品質画像を生成可能で「複数行の漢字」を自然に描写できる驚異的テキスト描画性能をアピール
AlibabaのAI開発チームであるQwenが画像生成AI「Qwen-Image」を2025年8月4日(月)に発表しました。Qwen-Imageは既存の画像生成AIが苦手とする「テキストの正確な描画」を得意としており、「複数行にわたる中国語の文章を含む画像」や「英語と中国語の両方を含む画像」を正確に描画できます。また、一般的な画像生成や画像編集も高品質であることがアピールされています。
·gigazine.net·
画像生成AI「Qwen-Image」登場、OpenAIやFlux超えの高品質画像を生成可能で「複数行の漢字」を自然に描写できる驚異的テキスト描画性能をアピール
Grokに動画生成機能「Imagine」が追加される&短編動画アプリ「Vine」の消えたはずのアーカイブが見つかったとイーロン・マスクが表明
Grokに動画生成機能「Imagine」が追加される&短編動画アプリ「Vine」の消えたはずのアーカイブが見つかったとイーロン・マスクが表明
X(旧Twitter)に搭載されているAIアシスタント「Grok」に、新しく6秒の音声付き動画を生成する「Imagine」機能が追加されました。Xのオーナーであるイーロン・マスク氏は、このGrok Imagineをかつて存在したショート動画共有アプリの「Vine」の名で呼んだ上で、最近発掘されたというVineのアーカイブを復活させる方針を明らかにしています。
·gigazine.net·
Grokに動画生成機能「Imagine」が追加される&短編動画アプリ「Vine」の消えたはずのアーカイブが見つかったとイーロン・マスクが表明
テキストを入力するだけでグリグリ移動可能な仮想世界を作り出せるAI「Genie 3」をGoogleが発表、ゲーム開発やロボット研究などに革新をもたらすかも
テキストを入力するだけでグリグリ移動可能な仮想世界を作り出せるAI「Genie 3」をGoogleが発表、ゲーム開発やロボット研究などに革新をもたらすかも
Googleがインタラクティブな仮想世界を生成できる世界モデル「Genie 3」を2025年8月5日に発表しました。Genie 3で生成された世界は3Dゲームのように移動したりカメラを動かすことが可能で、ゲーム開発やロボット研究、災害シミュレーションといった分野での活用が期待されています。
·gigazine.net·
テキストを入力するだけでグリグリ移動可能な仮想世界を作り出せるAI「Genie 3」をGoogleが発表、ゲーム開発やロボット研究などに革新をもたらすかも
Grokの生成AI「Imagine」にはポルノなど規制対象のコンテンツを積極的に生成できる「スパイシー」機能が存在、早速有名人のディープフェイクが作成されて問題に
Grokの生成AI「Imagine」にはポルノなど規制対象のコンテンツを積極的に生成できる「スパイシー」機能が存在、早速有名人のディープフェイクが作成されて問題に
XのAIアシスタント「Grok」に新しく追加された「Imagine」は、テキストから画像を生成したり、画像から6秒の音声付き動画を生成したりすることができます。通常、生成AIではユーザーによる不適切なコンテンツの生成をブロックするセーフガードがかけられていますが、Imagineの「スパイシー」というモードを使うと、プロンプトで指定していないのにセクシーなコンテンツを生成できてしまうと問題視されています。
·gigazine.net·
Grokの生成AI「Imagine」にはポルノなど規制対象のコンテンツを積極的に生成できる「スパイシー」機能が存在、早速有名人のディープフェイクが作成されて問題に
ライブ動画をリアルタイムで変換するAI動画モデル「MirageLSD」リリース、実例はこんな感じ
ライブ動画をリアルタイムで変換するAI動画モデル「MirageLSD」リリース、実例はこんな感じ
AIスタートアップのDecartが、テキストプロンプトに基づいて動画編集を高速かつ制御可能に行うために設計された、新しい拡散ベースのAI動画編集モデル「MirageLSD」を発表しました。MirageLSDは、テキストから動画を生成する従来の動画生成AIと異なり、カメラで撮影した映像やゲームの実況配信をリアルタイムで全く異なるスタイルに「変換」することが可能です。
·gigazine.net·
ライブ動画をリアルタイムで変換するAI動画モデル「MirageLSD」リリース、実例はこんな感じ
YouTubeとGoogleフォトに動画生成AI「Veo 2」を利用した「写真から動画への変換機能」が登場
YouTubeとGoogleフォトに動画生成AI「Veo 2」を利用した「写真から動画への変換機能」が登場
GoogleのAIアシスタント「Gemini」に動画生成AI「Veo 2」を利用した動画生成機能が追加されたのに続いて、YouTubeとGoogleフォトにも「Veo 2」を利用した「写真から動画への変換機能」が搭載されました。
·gigazine.net·
YouTubeとGoogleフォトに動画生成AI「Veo 2」を利用した「写真から動画への変換機能」が登場
Appleが精度と効率の両方を高水準でこなす独自の視覚言語モデル「FastVLM」を発表、オンデバイスでのリアルタイムビジュアルクエリ処理に最適
Appleが精度と効率の両方を高水準でこなす独自の視覚言語モデル「FastVLM」を発表、オンデバイスでのリアルタイムビジュアルクエリ処理に最適
Appleが独自の視覚言語モデル(VLM)となる「FastVLM」を発表しました。従来のVLMは精度が高くなると効率性が低下するという問題を抱えていたのですが、FastVLMは高い精度を保ちながら効率の面でも優れた性能を発揮しており、オンデバイスでのリアルタイムビジュアルクエリ処理に適したAIモデルになっているとのことです。
·gigazine.net·
Appleが精度と効率の両方を高水準でこなす独自の視覚言語モデル「FastVLM」を発表、オンデバイスでのリアルタイムビジュアルクエリ処理に最適
Photoshopに生成AIを使った新しい画像編集機能が追加、最大8メガピクセルまで高画質化する「生成アップスケール」機能や数クリックで自然な合成を可能にする「調和」機能など
Photoshopに生成AIを使った新しい画像編集機能が追加、最大8メガピクセルまで高画質化する「生成アップスケール」機能や数クリックで自然な合成を可能にする「調和」機能など
Adobeが画像編集ソフト・Photoshopの7月期アップデートを発表し、生成AIを使って画像を最大8メガピクセルまで高画質化できる「生成アップスケール」機能や画像オブジェクトを分析して自動調整する「調和」機能などの新機能を導入したと発表しました。
·gigazine.net·
Photoshopに生成AIを使った新しい画像編集機能が追加、最大8メガピクセルまで高画質化する「生成アップスケール」機能や数クリックで自然な合成を可能にする「調和」機能など
Googleが地球環境マッピングAI「AlphaEarth Foundations」を発表、農作物や森林破壊などの状況を迅速にマッピング可能
Googleが地球環境マッピングAI「AlphaEarth Foundations」を発表、農作物や森林破壊などの状況を迅速にマッピング可能
Google DeepMindが、膨大な量の地球観測データを統合して地球規模の地図を作成できるAIモデル「AlphaEarth Foundations」を発表しました。また、AlphaEarth Foundationsによって作成されたデータを「Satellite Embedding V1」としてデータセットにまとめ、Google Earth Engineで公開しています。
·gigazine.net·
Googleが地球環境マッピングAI「AlphaEarth Foundations」を発表、農作物や森林破壊などの状況を迅速にマッピング可能
AIツールで動画を生成して総再生回数1億回を超えた動画制作スタジオ「Dor Brothers」とは?
AIツールで動画を生成して総再生回数1億回を超えた動画制作スタジオ「Dor Brothers」とは?
記事作成時点では生成AIテクノロジーの発達により、テキストや画像を元に滑らかな動画を生成することも可能となっています。そんなAIツールのみを使って動画を制作し、オンライン上の総再生回数が1億回を突破したという動画制作スタジオ「Dor Brothers」について、大手日刊紙のニューヨーク・タイムズが報じています。
·gigazine.net·
AIツールで動画を生成して総再生回数1億回を超えた動画制作スタジオ「Dor Brothers」とは?
AIっぽさから脱却した実写のような美麗画像をテキストから生成できる画像生成AI「FLUX.1 Krea [dev]」が登場
AIっぽさから脱却した実写のような美麗画像をテキストから生成できる画像生成AI「FLUX.1 Krea [dev]」が登場
画像生成AI「Stable Diffusion」のオリジナル開発陣が立ち上げたAI企業「Black Forest Labs」が、写真のようなリアルな画像をテキストから生成できる最先端のオープンウェイトモデル「FLUX.1 Krea [dev]」をリリースしました。
·gigazine.net·
AIっぽさから脱却した実写のような美麗画像をテキストから生成できる画像生成AI「FLUX.1 Krea [dev]」が登場
簡単3ステップで古いホームビデオのような低解像度動画を高画質化&ノイズ除去できるAI動画高画質化ソフト「Aiarty Video Enhancer」を使ってみた
簡単3ステップで古いホームビデオのような低解像度動画を高画質化&ノイズ除去できるAI動画高画質化ソフト「Aiarty Video Enhancer」を使ってみた
AIを駆使して古いホームビデオのような低解像度動画を4K高画質動画に変換したり、スローモーション動画に変換したり、音声ノイズを除去したりすることができるAI動画高画質化ソフトウェアが「Aiarty Video Enhancer」です。「動画をアップロード→AIモデルを選択→プレビュー&出力」という簡単3ステップで動画を手軽に処理できるということで、実際に使ってみました。
·gigazine.net·
簡単3ステップで古いホームビデオのような低解像度動画を高画質化&ノイズ除去できるAI動画高画質化ソフト「Aiarty Video Enhancer」を使ってみた
AIデイープフェイクを用いた「実在の人物を簡単にヌード化するサービス」が数億円規模の稼ぎを得ている
AIデイープフェイクを用いた「実在の人物を簡単にヌード化するサービス」が数億円規模の稼ぎを得ている
AIを用いて動画や写真に含まれる人物の顔や体を別人のものに置き換える技術は「デイープフェイク」と呼ばれており、ポルノコンテンツの生成や政治的扇動コンテンツの作成などに悪用されています。中でもデイープフェイクを用いてポルノコンテンツを生成するウェブサービスはかなりのユーザー数を抱えており、収益は数億円規模に達しているそうです。
·gigazine.net·
AIデイープフェイクを用いた「実在の人物を簡単にヌード化するサービス」が数億円規模の稼ぎを得ている
Netflixが人気オリジナル作品でコスト削減のために生成AIを使ったことを明かす
Netflixが人気オリジナル作品でコスト削減のために生成AIを使ったことを明かす
2025年4月に公開されたNetflixのオリジナルドラマシリーズ「エテルナウタ」では、あるシーンの制作に生成AIが活用されていることが明らかになりました。制作に生成AIが活用されたのは、Netflixオリジナル作品としては初です。
·gigazine.net·
Netflixが人気オリジナル作品でコスト削減のために生成AIを使ったことを明かす