画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2708 bookmarks
Custom sorting
小鳥は超高速で点滅する光を認識する能力が人間の2倍以上も優れている
小鳥は超高速で点滅する光を認識する能力が人間の2倍以上も優れている
空を飛ぶ鳥は、視界の中を高速で移動する昆虫や障害物などに素早く気づき、その正体を見分けて追跡する必要があります。スウェーデンの研究者らが2016年に発表した論文では、野生の小鳥がヒトの2倍以上もの視覚的な時間分解能(一定時間内に起きた視覚的変化を感知する能力)を持っていることが報告されています。
·gigazine.net·
小鳥は超高速で点滅する光を認識する能力が人間の2倍以上も優れている
画像生成AI「Qwen-Image」登場、OpenAIやFlux超えの高品質画像を生成可能で「複数行の漢字」を自然に描写できる驚異的テキスト描画性能をアピール
画像生成AI「Qwen-Image」登場、OpenAIやFlux超えの高品質画像を生成可能で「複数行の漢字」を自然に描写できる驚異的テキスト描画性能をアピール
AlibabaのAI開発チームであるQwenが画像生成AI「Qwen-Image」を2025年8月4日(月)に発表しました。Qwen-Imageは既存の画像生成AIが苦手とする「テキストの正確な描画」を得意としており、「複数行にわたる中国語の文章を含む画像」や「英語と中国語の両方を含む画像」を正確に描画できます。また、一般的な画像生成や画像編集も高品質であることがアピールされています。
·gigazine.net·
画像生成AI「Qwen-Image」登場、OpenAIやFlux超えの高品質画像を生成可能で「複数行の漢字」を自然に描写できる驚異的テキスト描画性能をアピール
Grokに動画生成機能「Imagine」が追加される&短編動画アプリ「Vine」の消えたはずのアーカイブが見つかったとイーロン・マスクが表明
Grokに動画生成機能「Imagine」が追加される&短編動画アプリ「Vine」の消えたはずのアーカイブが見つかったとイーロン・マスクが表明
X(旧Twitter)に搭載されているAIアシスタント「Grok」に、新しく6秒の音声付き動画を生成する「Imagine」機能が追加されました。Xのオーナーであるイーロン・マスク氏は、このGrok Imagineをかつて存在したショート動画共有アプリの「Vine」の名で呼んだ上で、最近発掘されたというVineのアーカイブを復活させる方針を明らかにしています。
·gigazine.net·
Grokに動画生成機能「Imagine」が追加される&短編動画アプリ「Vine」の消えたはずのアーカイブが見つかったとイーロン・マスクが表明
テキストを入力するだけでグリグリ移動可能な仮想世界を作り出せるAI「Genie 3」をGoogleが発表、ゲーム開発やロボット研究などに革新をもたらすかも
テキストを入力するだけでグリグリ移動可能な仮想世界を作り出せるAI「Genie 3」をGoogleが発表、ゲーム開発やロボット研究などに革新をもたらすかも
Googleがインタラクティブな仮想世界を生成できる世界モデル「Genie 3」を2025年8月5日に発表しました。Genie 3で生成された世界は3Dゲームのように移動したりカメラを動かすことが可能で、ゲーム開発やロボット研究、災害シミュレーションといった分野での活用が期待されています。
·gigazine.net·
テキストを入力するだけでグリグリ移動可能な仮想世界を作り出せるAI「Genie 3」をGoogleが発表、ゲーム開発やロボット研究などに革新をもたらすかも
Grokの生成AI「Imagine」にはポルノなど規制対象のコンテンツを積極的に生成できる「スパイシー」機能が存在、早速有名人のディープフェイクが作成されて問題に
Grokの生成AI「Imagine」にはポルノなど規制対象のコンテンツを積極的に生成できる「スパイシー」機能が存在、早速有名人のディープフェイクが作成されて問題に
XのAIアシスタント「Grok」に新しく追加された「Imagine」は、テキストから画像を生成したり、画像から6秒の音声付き動画を生成したりすることができます。通常、生成AIではユーザーによる不適切なコンテンツの生成をブロックするセーフガードがかけられていますが、Imagineの「スパイシー」というモードを使うと、プロンプトで指定していないのにセクシーなコンテンツを生成できてしまうと問題視されています。
·gigazine.net·
Grokの生成AI「Imagine」にはポルノなど規制対象のコンテンツを積極的に生成できる「スパイシー」機能が存在、早速有名人のディープフェイクが作成されて問題に
ライブ動画をリアルタイムで変換するAI動画モデル「MirageLSD」リリース、実例はこんな感じ
ライブ動画をリアルタイムで変換するAI動画モデル「MirageLSD」リリース、実例はこんな感じ
AIスタートアップのDecartが、テキストプロンプトに基づいて動画編集を高速かつ制御可能に行うために設計された、新しい拡散ベースのAI動画編集モデル「MirageLSD」を発表しました。MirageLSDは、テキストから動画を生成する従来の動画生成AIと異なり、カメラで撮影した映像やゲームの実況配信をリアルタイムで全く異なるスタイルに「変換」することが可能です。
·gigazine.net·
ライブ動画をリアルタイムで変換するAI動画モデル「MirageLSD」リリース、実例はこんな感じ
YouTubeとGoogleフォトに動画生成AI「Veo 2」を利用した「写真から動画への変換機能」が登場
YouTubeとGoogleフォトに動画生成AI「Veo 2」を利用した「写真から動画への変換機能」が登場
GoogleのAIアシスタント「Gemini」に動画生成AI「Veo 2」を利用した動画生成機能が追加されたのに続いて、YouTubeとGoogleフォトにも「Veo 2」を利用した「写真から動画への変換機能」が搭載されました。
·gigazine.net·
YouTubeとGoogleフォトに動画生成AI「Veo 2」を利用した「写真から動画への変換機能」が登場
Appleが精度と効率の両方を高水準でこなす独自の視覚言語モデル「FastVLM」を発表、オンデバイスでのリアルタイムビジュアルクエリ処理に最適
Appleが精度と効率の両方を高水準でこなす独自の視覚言語モデル「FastVLM」を発表、オンデバイスでのリアルタイムビジュアルクエリ処理に最適
Appleが独自の視覚言語モデル(VLM)となる「FastVLM」を発表しました。従来のVLMは精度が高くなると効率性が低下するという問題を抱えていたのですが、FastVLMは高い精度を保ちながら効率の面でも優れた性能を発揮しており、オンデバイスでのリアルタイムビジュアルクエリ処理に適したAIモデルになっているとのことです。
·gigazine.net·
Appleが精度と効率の両方を高水準でこなす独自の視覚言語モデル「FastVLM」を発表、オンデバイスでのリアルタイムビジュアルクエリ処理に最適
Photoshopに生成AIを使った新しい画像編集機能が追加、最大8メガピクセルまで高画質化する「生成アップスケール」機能や数クリックで自然な合成を可能にする「調和」機能など
Photoshopに生成AIを使った新しい画像編集機能が追加、最大8メガピクセルまで高画質化する「生成アップスケール」機能や数クリックで自然な合成を可能にする「調和」機能など
Adobeが画像編集ソフト・Photoshopの7月期アップデートを発表し、生成AIを使って画像を最大8メガピクセルまで高画質化できる「生成アップスケール」機能や画像オブジェクトを分析して自動調整する「調和」機能などの新機能を導入したと発表しました。
·gigazine.net·
Photoshopに生成AIを使った新しい画像編集機能が追加、最大8メガピクセルまで高画質化する「生成アップスケール」機能や数クリックで自然な合成を可能にする「調和」機能など
Googleが地球環境マッピングAI「AlphaEarth Foundations」を発表、農作物や森林破壊などの状況を迅速にマッピング可能
Googleが地球環境マッピングAI「AlphaEarth Foundations」を発表、農作物や森林破壊などの状況を迅速にマッピング可能
Google DeepMindが、膨大な量の地球観測データを統合して地球規模の地図を作成できるAIモデル「AlphaEarth Foundations」を発表しました。また、AlphaEarth Foundationsによって作成されたデータを「Satellite Embedding V1」としてデータセットにまとめ、Google Earth Engineで公開しています。
·gigazine.net·
Googleが地球環境マッピングAI「AlphaEarth Foundations」を発表、農作物や森林破壊などの状況を迅速にマッピング可能
AIツールで動画を生成して総再生回数1億回を超えた動画制作スタジオ「Dor Brothers」とは?
AIツールで動画を生成して総再生回数1億回を超えた動画制作スタジオ「Dor Brothers」とは?
記事作成時点では生成AIテクノロジーの発達により、テキストや画像を元に滑らかな動画を生成することも可能となっています。そんなAIツールのみを使って動画を制作し、オンライン上の総再生回数が1億回を突破したという動画制作スタジオ「Dor Brothers」について、大手日刊紙のニューヨーク・タイムズが報じています。
·gigazine.net·
AIツールで動画を生成して総再生回数1億回を超えた動画制作スタジオ「Dor Brothers」とは?
AIっぽさから脱却した実写のような美麗画像をテキストから生成できる画像生成AI「FLUX.1 Krea [dev]」が登場
AIっぽさから脱却した実写のような美麗画像をテキストから生成できる画像生成AI「FLUX.1 Krea [dev]」が登場
画像生成AI「Stable Diffusion」のオリジナル開発陣が立ち上げたAI企業「Black Forest Labs」が、写真のようなリアルな画像をテキストから生成できる最先端のオープンウェイトモデル「FLUX.1 Krea [dev]」をリリースしました。
·gigazine.net·
AIっぽさから脱却した実写のような美麗画像をテキストから生成できる画像生成AI「FLUX.1 Krea [dev]」が登場
簡単3ステップで古いホームビデオのような低解像度動画を高画質化&ノイズ除去できるAI動画高画質化ソフト「Aiarty Video Enhancer」を使ってみた
簡単3ステップで古いホームビデオのような低解像度動画を高画質化&ノイズ除去できるAI動画高画質化ソフト「Aiarty Video Enhancer」を使ってみた
AIを駆使して古いホームビデオのような低解像度動画を4K高画質動画に変換したり、スローモーション動画に変換したり、音声ノイズを除去したりすることができるAI動画高画質化ソフトウェアが「Aiarty Video Enhancer」です。「動画をアップロード→AIモデルを選択→プレビュー&出力」という簡単3ステップで動画を手軽に処理できるということで、実際に使ってみました。
·gigazine.net·
簡単3ステップで古いホームビデオのような低解像度動画を高画質化&ノイズ除去できるAI動画高画質化ソフト「Aiarty Video Enhancer」を使ってみた
AIデイープフェイクを用いた「実在の人物を簡単にヌード化するサービス」が数億円規模の稼ぎを得ている
AIデイープフェイクを用いた「実在の人物を簡単にヌード化するサービス」が数億円規模の稼ぎを得ている
AIを用いて動画や写真に含まれる人物の顔や体を別人のものに置き換える技術は「デイープフェイク」と呼ばれており、ポルノコンテンツの生成や政治的扇動コンテンツの作成などに悪用されています。中でもデイープフェイクを用いてポルノコンテンツを生成するウェブサービスはかなりのユーザー数を抱えており、収益は数億円規模に達しているそうです。
·gigazine.net·
AIデイープフェイクを用いた「実在の人物を簡単にヌード化するサービス」が数億円規模の稼ぎを得ている
Netflixが人気オリジナル作品でコスト削減のために生成AIを使ったことを明かす
Netflixが人気オリジナル作品でコスト削減のために生成AIを使ったことを明かす
2025年4月に公開されたNetflixのオリジナルドラマシリーズ「エテルナウタ」では、あるシーンの制作に生成AIが活用されていることが明らかになりました。制作に生成AIが活用されたのは、Netflixオリジナル作品としては初です。
·gigazine.net·
Netflixが人気オリジナル作品でコスト削減のために生成AIを使ったことを明かす
AMDが画像生成AI「Nitro-T」をリリース、32基のInstinct MI300Xでゼロから1日未満でトレーニング可能
AMDが画像生成AI「Nitro-T」をリリース、32基のInstinct MI300Xでゼロから1日未満でトレーニング可能
半導体大手のAMDが、独自の画像生成AIである「Nitro-T」を発表しました。Nitro-Tは高効率な学習に重点を置いた、テキストから画像を生成することができるDiffusion Transformerモデル(DiTモデル)です。AMDは自社GPUであるInstinct MI300Xを32基使うことで、Nitro-Tをゼロからわずか1日未満でトレーニングすることができたとアピールしています。
·gigazine.net·
AMDが画像生成AI「Nitro-T」をリリース、32基のInstinct MI300Xでゼロから1日未満でトレーニング可能
無料のRAW現像ソフト「RapidRAW」を使ってみた、非破壊編集が可能でGPUアクセラレーションにも対応
無料のRAW現像ソフト「RapidRAW」を使ってみた、非破壊編集が可能でGPUアクセラレーションにも対応
「RapidRAW」はオープンソースで開発されているRAW現像アプリで、非破壊編集に対応しているほか、GPUアクセラレーションを用いた高速処理が可能なこともアピールされています。便利そうなので実際に使ってみました。
·gigazine.net·
無料のRAW現像ソフト「RapidRAW」を使ってみた、非破壊編集が可能でGPUアクセラレーションにも対応
AI搭載のヌード化アプリ「Clothoff」の知られざる詳細を内部告発者が暴露、運営は旧ソ連圏に関係している可能性
AI搭載のヌード化アプリ「Clothoff」の知られざる詳細を内部告発者が暴露、運営は旧ソ連圏に関係している可能性
実在の人物の画像から偽のヌード画像(フェイクヌード)を作ることができるアプリ「Clothoff」は、アメリカやスペインで男子生徒らが女子生徒のヌード画像を生成し共有するという事件が発生するなど、問題を引き起こしています。そんなClothoffの運営者はAIでCEOの顔を生成するなど匿名を守っていますが、社内情報にアクセスできたという元従業員が、Clothoffの体制やプロジェクトについて内部告発しています。
·gigazine.net·
AI搭載のヌード化アプリ「Clothoff」の知られざる詳細を内部告発者が暴露、運営は旧ソ連圏に関係している可能性
AIによってバーチャルアバターや顔出ししないナレーションの作成が容易になってVTuberやTikTokクリエイターの新たな波が押し寄せている
AIによってバーチャルアバターや顔出ししないナレーションの作成が容易になってVTuberやTikTokクリエイターの新たな波が押し寄せている
バーチャルYouTuber(Vtuber)は2017年ごろから日本で流行したコンテンツで、もともとはアーティストが作成したイラストやLive2D、3Dモデルなどのキャラクターをアバターやアイコンとして用いて、動画投稿や配信を行う形態として広がりました。生成AIの発展により、キャラクターを生み出せるだけではなく声や動画、キャラクターが話す文章もAIが生成できるようになったため、VTuberの制作がかつてないほど容易になり、「新しいバーチャルクリエイターの波が巻き起こっている」とアメリカの大手放送局であるCNBCが報じています。
·gigazine.net·
AIによってバーチャルアバターや顔出ししないナレーションの作成が容易になってVTuberやTikTokクリエイターの新たな波が押し寄せている
YouTubeやニコニコ動画の動画を簡単にダウンロードできるアプリ「Tartube」レビュー、高機能ダウンローダー「yt-dlp」の機能をマウス操作で使える
YouTubeやニコニコ動画の動画を簡単にダウンロードできるアプリ「Tartube」レビュー、高機能ダウンローダー「yt-dlp」の機能をマウス操作で使える
「Tartube」はYouTubeやニコニコ動画といった動画サイトのコンテンツを簡単にダウンロードできる無料アプリです。複数動画の一括ダウンロードやチャンネルごとのダウンロード機能など高度な機能をコマンド不要で実行可能とのこと。かなり便利そうだったので、実際にPCにインストールして動画をダウンロードするまでの流れをまとめてみました。
·gigazine.net·
YouTubeやニコニコ動画の動画を簡単にダウンロードできるアプリ「Tartube」レビュー、高機能ダウンローダー「yt-dlp」の機能をマウス操作で使える
「GIMP 3.1.2」がリリース、新しいペイントモードやPhotoshopのプリセット対応などGIMP 3.2に向けた早期開発版
「GIMP 3.1.2」がリリース、新しいペイントモードやPhotoshopのプリセット対応などGIMP 3.2に向けた早期開発版
オープンソースの画像編集アプリ「GIMP」のバージョン3.1.2がリリースされました。GIMP 3.1.2はGIMP 3.2に向けた最初の開発リリースで、新しいペイントモードやテキストオプション、印刷時に便利なCMYKの設定、Photoshopパターンのインポートへの対応などが含まれています。
·gigazine.net·
「GIMP 3.1.2」がリリース、新しいペイントモードやPhotoshopのプリセット対応などGIMP 3.2に向けた早期開発版
「Google Earth」20周年を記念して「過去のストリートビューを確認する機能」が追加予定、過去の衛星画像も見放題なので夢洲や高速道路建設地などいろいろ見てみた
「Google Earth」20周年を記念して「過去のストリートビューを確認する機能」が追加予定、過去の衛星画像も見放題なので夢洲や高速道路建設地などいろいろ見てみた
Googleの3D地図サービス「Google Earth」が登場から20周年を迎えました。Googleは20周年を記念して過去のマップをタイムラプスで鑑賞できる特設サイトを公開しているほか、「過去のストリートビューを簡単に確認できる機能」の追加も告知しています。
·gigazine.net·
「Google Earth」20周年を記念して「過去のストリートビューを確認する機能」が追加予定、過去の衛星画像も見放題なので夢洲や高速道路建設地などいろいろ見てみた
Googleが好きな服をバーチャル試着できるアプリ「Doppl」をリリース、服を着た自分が動く様子もチェック可能
Googleが好きな服をバーチャル試着できるアプリ「Doppl」をリリース、服を着た自分が動く様子もチェック可能
Googleが現地時間の2025年6月26日、アップロードした自分の全身画像を好きな服の写真と組み合わせ、バーチャルで試着できる実験的アプリ「Doppl」をリリースしました。Dopplのバーチャル試着機能を使えば、手元にない服でも自分に似合うかどうかを視覚的にチェックすることが可能となっています。
·gigazine.net·
Googleが好きな服をバーチャル試着できるアプリ「Doppl」をリリース、服を着た自分が動く様子もチェック可能
高品質な画像編集AI「FLUX.1 Kontext [dev]」が登場、元の画像を保ったまま指示通りに加工できるオープンモデル
高品質な画像編集AI「FLUX.1 Kontext [dev]」が登場、元の画像を保ったまま指示通りに加工できるオープンモデル
高品質な画像生成AIの開発企業として知られるBlack Forest Labsが、画像編集に特化したオープンウェイトモデル「FLUX.1 Kontext [dev]」を2025年6月26日(木)にリリースしました。
·gigazine.net·
高品質な画像編集AI「FLUX.1 Kontext [dev]」が登場、元の画像を保ったまま指示通りに加工できるオープンモデル
「二次創作作品を無断でAIトレーニング用のデータセットにする行為」や「AI生成による二次創作」といったAI動向に対する海外勢の反対意見はどうなっているのか?
「二次創作作品を無断でAIトレーニング用のデータセットにする行為」や「AI生成による二次創作」といったAI動向に対する海外勢の反対意見はどうなっているのか?
生成AIの登場によって、誰でも簡単に文章やイラストを作ることができるようになりましたが、AIの学習元となっているデータセットの中にはインターネット上から無断で収集されたものも多く、著作権を巡って大きな議論となっています。IT系ニュースサイトのThe Vergeが、インターネット上に公開されている二次創作作品のスクレイピングを巡って海外のファンコミュニティで巻き起こった騒動について、当事者たちの意見をまとめています。
·gigazine.net·
「二次創作作品を無断でAIトレーニング用のデータセットにする行為」や「AI生成による二次創作」といったAI動向に対する海外勢の反対意見はどうなっているのか?
わずか2GBのメモリ使用量でスマホでの実行もOKな軽量オープンウェイトモデル「Gemma 3n」をGoogleが正式リリース、音声や動画の入力にも対応し日本語ももちろんOK
わずか2GBのメモリ使用量でスマホでの実行もOKな軽量オープンウェイトモデル「Gemma 3n」をGoogleが正式リリース、音声や動画の入力にも対応し日本語ももちろんOK
Googleが軽量かつ高性能なマルチモーダルAIモデル「Gemma 3n」を2025年6月26日(木)に正式リリースしました。正式リリースに合わせて詳細な仕様やベンチマーク結果が公開されています。
·gigazine.net·
わずか2GBのメモリ使用量でスマホでの実行もOKな軽量オープンウェイトモデル「Gemma 3n」をGoogleが正式リリース、音声や動画の入力にも対応し日本語ももちろんOK
Alibabaが画像生成AI「Qwen VLo」を発表、プログレッシブ生成手法を採用しテレビの走査線みたいに上から順に描画される
Alibabaが画像生成AI「Qwen VLo」を発表、プログレッシブ生成手法を採用しテレビの走査線みたいに上から順に描画される
AlibabaのAI開発チームであるQwenが画像生成AI「Qwen VLo」を2025年6月26日(木)に発表しました。Qwen VLoは画像内に含まれるコンテンツ理解力が高く、正確な画像編集が可能とのこと。また、プログレッシブ生成手法を採用しており、左上から順番に画像が生成されるのも大きな特徴です。
·gigazine.net·
Alibabaが画像生成AI「Qwen VLo」を発表、プログレッシブ生成手法を採用しテレビの走査線みたいに上から順に描画される
デンマークがディープフェイク対策で国民に自身の身体・顔・声に対する権利を与えるよう著作権法を改正すると発表
デンマークがディープフェイク対策で国民に自身の身体・顔・声に対する権利を与えるよう著作権法を改正すると発表
2025年6月26日、デンマーク政府が著作権法を改正し、誰もが自分の身体・顔の特徴・声に対する権利を持てるようにすることで、AIなどを用いて生成された偽画像や偽映像を指すディープフェイクを取り締まる予定であると発表しました。
·gigazine.net·
デンマークがディープフェイク対策で国民に自身の身体・顔・声に対する権利を与えるよう著作権法を改正すると発表