画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2703 bookmarks
Custom sorting
ライブ動画をリアルタイムで変換するAI動画モデル「MirageLSD」リリース、実例はこんな感じ
ライブ動画をリアルタイムで変換するAI動画モデル「MirageLSD」リリース、実例はこんな感じ
AIスタートアップのDecartが、テキストプロンプトに基づいて動画編集を高速かつ制御可能に行うために設計された、新しい拡散ベースのAI動画編集モデル「MirageLSD」を発表しました。MirageLSDは、テキストから動画を生成する従来の動画生成AIと異なり、カメラで撮影した映像やゲームの実況配信をリアルタイムで全く異なるスタイルに「変換」することが可能です。
·gigazine.net·
ライブ動画をリアルタイムで変換するAI動画モデル「MirageLSD」リリース、実例はこんな感じ
YouTubeとGoogleフォトに動画生成AI「Veo 2」を利用した「写真から動画への変換機能」が登場
YouTubeとGoogleフォトに動画生成AI「Veo 2」を利用した「写真から動画への変換機能」が登場
GoogleのAIアシスタント「Gemini」に動画生成AI「Veo 2」を利用した動画生成機能が追加されたのに続いて、YouTubeとGoogleフォトにも「Veo 2」を利用した「写真から動画への変換機能」が搭載されました。
·gigazine.net·
YouTubeとGoogleフォトに動画生成AI「Veo 2」を利用した「写真から動画への変換機能」が登場
Appleが精度と効率の両方を高水準でこなす独自の視覚言語モデル「FastVLM」を発表、オンデバイスでのリアルタイムビジュアルクエリ処理に最適
Appleが精度と効率の両方を高水準でこなす独自の視覚言語モデル「FastVLM」を発表、オンデバイスでのリアルタイムビジュアルクエリ処理に最適
Appleが独自の視覚言語モデル(VLM)となる「FastVLM」を発表しました。従来のVLMは精度が高くなると効率性が低下するという問題を抱えていたのですが、FastVLMは高い精度を保ちながら効率の面でも優れた性能を発揮しており、オンデバイスでのリアルタイムビジュアルクエリ処理に適したAIモデルになっているとのことです。
·gigazine.net·
Appleが精度と効率の両方を高水準でこなす独自の視覚言語モデル「FastVLM」を発表、オンデバイスでのリアルタイムビジュアルクエリ処理に最適
Photoshopに生成AIを使った新しい画像編集機能が追加、最大8メガピクセルまで高画質化する「生成アップスケール」機能や数クリックで自然な合成を可能にする「調和」機能など
Photoshopに生成AIを使った新しい画像編集機能が追加、最大8メガピクセルまで高画質化する「生成アップスケール」機能や数クリックで自然な合成を可能にする「調和」機能など
Adobeが画像編集ソフト・Photoshopの7月期アップデートを発表し、生成AIを使って画像を最大8メガピクセルまで高画質化できる「生成アップスケール」機能や画像オブジェクトを分析して自動調整する「調和」機能などの新機能を導入したと発表しました。
·gigazine.net·
Photoshopに生成AIを使った新しい画像編集機能が追加、最大8メガピクセルまで高画質化する「生成アップスケール」機能や数クリックで自然な合成を可能にする「調和」機能など
Googleが地球環境マッピングAI「AlphaEarth Foundations」を発表、農作物や森林破壊などの状況を迅速にマッピング可能
Googleが地球環境マッピングAI「AlphaEarth Foundations」を発表、農作物や森林破壊などの状況を迅速にマッピング可能
Google DeepMindが、膨大な量の地球観測データを統合して地球規模の地図を作成できるAIモデル「AlphaEarth Foundations」を発表しました。また、AlphaEarth Foundationsによって作成されたデータを「Satellite Embedding V1」としてデータセットにまとめ、Google Earth Engineで公開しています。
·gigazine.net·
Googleが地球環境マッピングAI「AlphaEarth Foundations」を発表、農作物や森林破壊などの状況を迅速にマッピング可能
AIツールで動画を生成して総再生回数1億回を超えた動画制作スタジオ「Dor Brothers」とは?
AIツールで動画を生成して総再生回数1億回を超えた動画制作スタジオ「Dor Brothers」とは?
記事作成時点では生成AIテクノロジーの発達により、テキストや画像を元に滑らかな動画を生成することも可能となっています。そんなAIツールのみを使って動画を制作し、オンライン上の総再生回数が1億回を突破したという動画制作スタジオ「Dor Brothers」について、大手日刊紙のニューヨーク・タイムズが報じています。
·gigazine.net·
AIツールで動画を生成して総再生回数1億回を超えた動画制作スタジオ「Dor Brothers」とは?
AIっぽさから脱却した実写のような美麗画像をテキストから生成できる画像生成AI「FLUX.1 Krea [dev]」が登場
AIっぽさから脱却した実写のような美麗画像をテキストから生成できる画像生成AI「FLUX.1 Krea [dev]」が登場
画像生成AI「Stable Diffusion」のオリジナル開発陣が立ち上げたAI企業「Black Forest Labs」が、写真のようなリアルな画像をテキストから生成できる最先端のオープンウェイトモデル「FLUX.1 Krea [dev]」をリリースしました。
·gigazine.net·
AIっぽさから脱却した実写のような美麗画像をテキストから生成できる画像生成AI「FLUX.1 Krea [dev]」が登場
簡単3ステップで古いホームビデオのような低解像度動画を高画質化&ノイズ除去できるAI動画高画質化ソフト「Aiarty Video Enhancer」を使ってみた
簡単3ステップで古いホームビデオのような低解像度動画を高画質化&ノイズ除去できるAI動画高画質化ソフト「Aiarty Video Enhancer」を使ってみた
AIを駆使して古いホームビデオのような低解像度動画を4K高画質動画に変換したり、スローモーション動画に変換したり、音声ノイズを除去したりすることができるAI動画高画質化ソフトウェアが「Aiarty Video Enhancer」です。「動画をアップロード→AIモデルを選択→プレビュー&出力」という簡単3ステップで動画を手軽に処理できるということで、実際に使ってみました。
·gigazine.net·
簡単3ステップで古いホームビデオのような低解像度動画を高画質化&ノイズ除去できるAI動画高画質化ソフト「Aiarty Video Enhancer」を使ってみた
AIデイープフェイクを用いた「実在の人物を簡単にヌード化するサービス」が数億円規模の稼ぎを得ている
AIデイープフェイクを用いた「実在の人物を簡単にヌード化するサービス」が数億円規模の稼ぎを得ている
AIを用いて動画や写真に含まれる人物の顔や体を別人のものに置き換える技術は「デイープフェイク」と呼ばれており、ポルノコンテンツの生成や政治的扇動コンテンツの作成などに悪用されています。中でもデイープフェイクを用いてポルノコンテンツを生成するウェブサービスはかなりのユーザー数を抱えており、収益は数億円規模に達しているそうです。
·gigazine.net·
AIデイープフェイクを用いた「実在の人物を簡単にヌード化するサービス」が数億円規模の稼ぎを得ている
Netflixが人気オリジナル作品でコスト削減のために生成AIを使ったことを明かす
Netflixが人気オリジナル作品でコスト削減のために生成AIを使ったことを明かす
2025年4月に公開されたNetflixのオリジナルドラマシリーズ「エテルナウタ」では、あるシーンの制作に生成AIが活用されていることが明らかになりました。制作に生成AIが活用されたのは、Netflixオリジナル作品としては初です。
·gigazine.net·
Netflixが人気オリジナル作品でコスト削減のために生成AIを使ったことを明かす
AMDが画像生成AI「Nitro-T」をリリース、32基のInstinct MI300Xでゼロから1日未満でトレーニング可能
AMDが画像生成AI「Nitro-T」をリリース、32基のInstinct MI300Xでゼロから1日未満でトレーニング可能
半導体大手のAMDが、独自の画像生成AIである「Nitro-T」を発表しました。Nitro-Tは高効率な学習に重点を置いた、テキストから画像を生成することができるDiffusion Transformerモデル(DiTモデル)です。AMDは自社GPUであるInstinct MI300Xを32基使うことで、Nitro-Tをゼロからわずか1日未満でトレーニングすることができたとアピールしています。
·gigazine.net·
AMDが画像生成AI「Nitro-T」をリリース、32基のInstinct MI300Xでゼロから1日未満でトレーニング可能
無料のRAW現像ソフト「RapidRAW」を使ってみた、非破壊編集が可能でGPUアクセラレーションにも対応
無料のRAW現像ソフト「RapidRAW」を使ってみた、非破壊編集が可能でGPUアクセラレーションにも対応
「RapidRAW」はオープンソースで開発されているRAW現像アプリで、非破壊編集に対応しているほか、GPUアクセラレーションを用いた高速処理が可能なこともアピールされています。便利そうなので実際に使ってみました。
·gigazine.net·
無料のRAW現像ソフト「RapidRAW」を使ってみた、非破壊編集が可能でGPUアクセラレーションにも対応
AI搭載のヌード化アプリ「Clothoff」の知られざる詳細を内部告発者が暴露、運営は旧ソ連圏に関係している可能性
AI搭載のヌード化アプリ「Clothoff」の知られざる詳細を内部告発者が暴露、運営は旧ソ連圏に関係している可能性
実在の人物の画像から偽のヌード画像(フェイクヌード)を作ることができるアプリ「Clothoff」は、アメリカやスペインで男子生徒らが女子生徒のヌード画像を生成し共有するという事件が発生するなど、問題を引き起こしています。そんなClothoffの運営者はAIでCEOの顔を生成するなど匿名を守っていますが、社内情報にアクセスできたという元従業員が、Clothoffの体制やプロジェクトについて内部告発しています。
·gigazine.net·
AI搭載のヌード化アプリ「Clothoff」の知られざる詳細を内部告発者が暴露、運営は旧ソ連圏に関係している可能性
AIによってバーチャルアバターや顔出ししないナレーションの作成が容易になってVTuberやTikTokクリエイターの新たな波が押し寄せている
AIによってバーチャルアバターや顔出ししないナレーションの作成が容易になってVTuberやTikTokクリエイターの新たな波が押し寄せている
バーチャルYouTuber(Vtuber)は2017年ごろから日本で流行したコンテンツで、もともとはアーティストが作成したイラストやLive2D、3Dモデルなどのキャラクターをアバターやアイコンとして用いて、動画投稿や配信を行う形態として広がりました。生成AIの発展により、キャラクターを生み出せるだけではなく声や動画、キャラクターが話す文章もAIが生成できるようになったため、VTuberの制作がかつてないほど容易になり、「新しいバーチャルクリエイターの波が巻き起こっている」とアメリカの大手放送局であるCNBCが報じています。
·gigazine.net·
AIによってバーチャルアバターや顔出ししないナレーションの作成が容易になってVTuberやTikTokクリエイターの新たな波が押し寄せている
YouTubeやニコニコ動画の動画を簡単にダウンロードできるアプリ「Tartube」レビュー、高機能ダウンローダー「yt-dlp」の機能をマウス操作で使える
YouTubeやニコニコ動画の動画を簡単にダウンロードできるアプリ「Tartube」レビュー、高機能ダウンローダー「yt-dlp」の機能をマウス操作で使える
「Tartube」はYouTubeやニコニコ動画といった動画サイトのコンテンツを簡単にダウンロードできる無料アプリです。複数動画の一括ダウンロードやチャンネルごとのダウンロード機能など高度な機能をコマンド不要で実行可能とのこと。かなり便利そうだったので、実際にPCにインストールして動画をダウンロードするまでの流れをまとめてみました。
·gigazine.net·
YouTubeやニコニコ動画の動画を簡単にダウンロードできるアプリ「Tartube」レビュー、高機能ダウンローダー「yt-dlp」の機能をマウス操作で使える
「GIMP 3.1.2」がリリース、新しいペイントモードやPhotoshopのプリセット対応などGIMP 3.2に向けた早期開発版
「GIMP 3.1.2」がリリース、新しいペイントモードやPhotoshopのプリセット対応などGIMP 3.2に向けた早期開発版
オープンソースの画像編集アプリ「GIMP」のバージョン3.1.2がリリースされました。GIMP 3.1.2はGIMP 3.2に向けた最初の開発リリースで、新しいペイントモードやテキストオプション、印刷時に便利なCMYKの設定、Photoshopパターンのインポートへの対応などが含まれています。
·gigazine.net·
「GIMP 3.1.2」がリリース、新しいペイントモードやPhotoshopのプリセット対応などGIMP 3.2に向けた早期開発版
「Google Earth」20周年を記念して「過去のストリートビューを確認する機能」が追加予定、過去の衛星画像も見放題なので夢洲や高速道路建設地などいろいろ見てみた
「Google Earth」20周年を記念して「過去のストリートビューを確認する機能」が追加予定、過去の衛星画像も見放題なので夢洲や高速道路建設地などいろいろ見てみた
Googleの3D地図サービス「Google Earth」が登場から20周年を迎えました。Googleは20周年を記念して過去のマップをタイムラプスで鑑賞できる特設サイトを公開しているほか、「過去のストリートビューを簡単に確認できる機能」の追加も告知しています。
·gigazine.net·
「Google Earth」20周年を記念して「過去のストリートビューを確認する機能」が追加予定、過去の衛星画像も見放題なので夢洲や高速道路建設地などいろいろ見てみた
Googleが好きな服をバーチャル試着できるアプリ「Doppl」をリリース、服を着た自分が動く様子もチェック可能
Googleが好きな服をバーチャル試着できるアプリ「Doppl」をリリース、服を着た自分が動く様子もチェック可能
Googleが現地時間の2025年6月26日、アップロードした自分の全身画像を好きな服の写真と組み合わせ、バーチャルで試着できる実験的アプリ「Doppl」をリリースしました。Dopplのバーチャル試着機能を使えば、手元にない服でも自分に似合うかどうかを視覚的にチェックすることが可能となっています。
·gigazine.net·
Googleが好きな服をバーチャル試着できるアプリ「Doppl」をリリース、服を着た自分が動く様子もチェック可能
高品質な画像編集AI「FLUX.1 Kontext [dev]」が登場、元の画像を保ったまま指示通りに加工できるオープンモデル
高品質な画像編集AI「FLUX.1 Kontext [dev]」が登場、元の画像を保ったまま指示通りに加工できるオープンモデル
高品質な画像生成AIの開発企業として知られるBlack Forest Labsが、画像編集に特化したオープンウェイトモデル「FLUX.1 Kontext [dev]」を2025年6月26日(木)にリリースしました。
·gigazine.net·
高品質な画像編集AI「FLUX.1 Kontext [dev]」が登場、元の画像を保ったまま指示通りに加工できるオープンモデル
「二次創作作品を無断でAIトレーニング用のデータセットにする行為」や「AI生成による二次創作」といったAI動向に対する海外勢の反対意見はどうなっているのか?
「二次創作作品を無断でAIトレーニング用のデータセットにする行為」や「AI生成による二次創作」といったAI動向に対する海外勢の反対意見はどうなっているのか?
生成AIの登場によって、誰でも簡単に文章やイラストを作ることができるようになりましたが、AIの学習元となっているデータセットの中にはインターネット上から無断で収集されたものも多く、著作権を巡って大きな議論となっています。IT系ニュースサイトのThe Vergeが、インターネット上に公開されている二次創作作品のスクレイピングを巡って海外のファンコミュニティで巻き起こった騒動について、当事者たちの意見をまとめています。
·gigazine.net·
「二次創作作品を無断でAIトレーニング用のデータセットにする行為」や「AI生成による二次創作」といったAI動向に対する海外勢の反対意見はどうなっているのか?
わずか2GBのメモリ使用量でスマホでの実行もOKな軽量オープンウェイトモデル「Gemma 3n」をGoogleが正式リリース、音声や動画の入力にも対応し日本語ももちろんOK
わずか2GBのメモリ使用量でスマホでの実行もOKな軽量オープンウェイトモデル「Gemma 3n」をGoogleが正式リリース、音声や動画の入力にも対応し日本語ももちろんOK
Googleが軽量かつ高性能なマルチモーダルAIモデル「Gemma 3n」を2025年6月26日(木)に正式リリースしました。正式リリースに合わせて詳細な仕様やベンチマーク結果が公開されています。
·gigazine.net·
わずか2GBのメモリ使用量でスマホでの実行もOKな軽量オープンウェイトモデル「Gemma 3n」をGoogleが正式リリース、音声や動画の入力にも対応し日本語ももちろんOK
Alibabaが画像生成AI「Qwen VLo」を発表、プログレッシブ生成手法を採用しテレビの走査線みたいに上から順に描画される
Alibabaが画像生成AI「Qwen VLo」を発表、プログレッシブ生成手法を採用しテレビの走査線みたいに上から順に描画される
AlibabaのAI開発チームであるQwenが画像生成AI「Qwen VLo」を2025年6月26日(木)に発表しました。Qwen VLoは画像内に含まれるコンテンツ理解力が高く、正確な画像編集が可能とのこと。また、プログレッシブ生成手法を採用しており、左上から順番に画像が生成されるのも大きな特徴です。
·gigazine.net·
Alibabaが画像生成AI「Qwen VLo」を発表、プログレッシブ生成手法を採用しテレビの走査線みたいに上から順に描画される
デンマークがディープフェイク対策で国民に自身の身体・顔・声に対する権利を与えるよう著作権法を改正すると発表
デンマークがディープフェイク対策で国民に自身の身体・顔・声に対する権利を与えるよう著作権法を改正すると発表
2025年6月26日、デンマーク政府が著作権法を改正し、誰もが自分の身体・顔の特徴・声に対する権利を持てるようにすることで、AIなどを用いて生成された偽画像や偽映像を指すディープフェイクを取り締まる予定であると発表しました。
·gigazine.net·
デンマークがディープフェイク対策で国民に自身の身体・顔・声に対する権利を与えるよう著作権法を改正すると発表
適切なライセンスを受けた素材でのみトレーニングされた動画生成AI「Marey」とは?
適切なライセンスを受けた素材でのみトレーニングされた動画生成AI「Marey」とは?
生成AIによるコンテンツは、SNSや作品投稿サイトで見ない日がほとんどないほどあふれていますが、著作権の問題や従来のクリエイターの機会を奪う可能性など、商業作品に取り入れるには依然として多くの問題を抱えています。映画監督のブリン・ムーザー氏が立ち上げた製作会社「Asteria」は適切にライセンスされた素材のみで学習された「倫理的な生成AI」である「Marey」を構築しており、その特徴とそれでも存在している問題についてムーザー氏が語っています。
·gigazine.net·
適切なライセンスを受けた素材でのみトレーニングされた動画生成AI「Marey」とは?
観葉植物界隈がAI生成画像による詐欺に注意喚起
観葉植物界隈がAI生成画像による詐欺に注意喚起
AIによる画像生成は功罪相半ばするものですが、観葉植物界隈では、存在しない植物の画像を用いて愛好家を呼び込む詐欺が発生していると注意喚起が行われています。
·gigazine.net·
観葉植物界隈がAI生成画像による詐欺に注意喚起
中国の監視カメラメーカーHikvisionに対してカナダ政府が国内での事業停止を命令、国家安全保障上の懸念から
中国の監視カメラメーカーHikvisionに対してカナダ政府が国内での事業停止を命令、国家安全保障上の懸念から
監視カメラをはじめとしたセキュリティ機器を扱う中国・杭州のHikvision Digital Technologyに対して、カナダのメラニー・ジョリー産業大臣は「国家安全保障上の懸念がある」として、カナダ国内での事業を停止するよう命じたことを明らかにしました。
·gigazine.net·
中国の監視カメラメーカーHikvisionに対してカナダ政府が国内での事業停止を命令、国家安全保障上の懸念から
VRAM容量の少ない安めのグラボでも画像生成AI「FLUX.1 Kontext [dev]」を動かせる省メモリ高速版をNVIDIAが開発、VRAM使用量を24GBから7GBまで削減し2.1倍高速動作
VRAM容量の少ない安めのグラボでも画像生成AI「FLUX.1 Kontext [dev]」を動かせる省メモリ高速版をNVIDIAが開発、VRAM使用量を24GBから7GBまで削減し2.1倍高速動作
「FLUX.1 Kontext [dev]」は自然言語で画像を編集可能な画像生成AIモデルで、2025年6月26日にリリースされました。このFLUX.1 Kontext [dev]にはNVIDIAと共同開発したNVIDIA製GPU最適化版が存在しており、基本モデルと比べてVRAM使用量を大幅に削減しつつ処理を高速化することに成功しています。
·gigazine.net·
VRAM容量の少ない安めのグラボでも画像生成AI「FLUX.1 Kontext [dev]」を動かせる省メモリ高速版をNVIDIAが開発、VRAM使用量を24GBから7GBまで削減し2.1倍高速動作
AIベンチマーク「自転車に乗ったペリカンを描く」をLLama 3.3 70BやGPT 4.1にやってもらうとこうなる
AIベンチマーク「自転車に乗ったペリカンを描く」をLLama 3.3 70BやGPT 4.1にやってもらうとこうなる
AIの性能を測るベンチマークはいろいろとありますが、その中でちょっと変わったものがエンジニアのサイモン・ウィリソン氏考案による「自転車に乗ったペリカンを描かせる」というもの。2025年6月に開催されたAIエンジニアワールドフェアの基調講演で、ウィリソン氏が最新の「自転車に乗ったペリカン」を報告しています。
·gigazine.net·
AIベンチマーク「自転車に乗ったペリカンを描く」をLLama 3.3 70BやGPT 4.1にやってもらうとこうなる