画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2692 bookmarks
Custom sorting
AMDが画像生成AI「Nitro-T」をリリース、32基のInstinct MI300Xでゼロから1日未満でトレーニング可能
AMDが画像生成AI「Nitro-T」をリリース、32基のInstinct MI300Xでゼロから1日未満でトレーニング可能
半導体大手のAMDが、独自の画像生成AIである「Nitro-T」を発表しました。Nitro-Tは高効率な学習に重点を置いた、テキストから画像を生成することができるDiffusion Transformerモデル(DiTモデル)です。AMDは自社GPUであるInstinct MI300Xを32基使うことで、Nitro-Tをゼロからわずか1日未満でトレーニングすることができたとアピールしています。
·gigazine.net·
AMDが画像生成AI「Nitro-T」をリリース、32基のInstinct MI300Xでゼロから1日未満でトレーニング可能
無料のRAW現像ソフト「RapidRAW」を使ってみた、非破壊編集が可能でGPUアクセラレーションにも対応
無料のRAW現像ソフト「RapidRAW」を使ってみた、非破壊編集が可能でGPUアクセラレーションにも対応
「RapidRAW」はオープンソースで開発されているRAW現像アプリで、非破壊編集に対応しているほか、GPUアクセラレーションを用いた高速処理が可能なこともアピールされています。便利そうなので実際に使ってみました。
·gigazine.net·
無料のRAW現像ソフト「RapidRAW」を使ってみた、非破壊編集が可能でGPUアクセラレーションにも対応
AI搭載のヌード化アプリ「Clothoff」の知られざる詳細を内部告発者が暴露、運営は旧ソ連圏に関係している可能性
AI搭載のヌード化アプリ「Clothoff」の知られざる詳細を内部告発者が暴露、運営は旧ソ連圏に関係している可能性
実在の人物の画像から偽のヌード画像(フェイクヌード)を作ることができるアプリ「Clothoff」は、アメリカやスペインで男子生徒らが女子生徒のヌード画像を生成し共有するという事件が発生するなど、問題を引き起こしています。そんなClothoffの運営者はAIでCEOの顔を生成するなど匿名を守っていますが、社内情報にアクセスできたという元従業員が、Clothoffの体制やプロジェクトについて内部告発しています。
·gigazine.net·
AI搭載のヌード化アプリ「Clothoff」の知られざる詳細を内部告発者が暴露、運営は旧ソ連圏に関係している可能性
AIによってバーチャルアバターや顔出ししないナレーションの作成が容易になってVTuberやTikTokクリエイターの新たな波が押し寄せている
AIによってバーチャルアバターや顔出ししないナレーションの作成が容易になってVTuberやTikTokクリエイターの新たな波が押し寄せている
バーチャルYouTuber(Vtuber)は2017年ごろから日本で流行したコンテンツで、もともとはアーティストが作成したイラストやLive2D、3Dモデルなどのキャラクターをアバターやアイコンとして用いて、動画投稿や配信を行う形態として広がりました。生成AIの発展により、キャラクターを生み出せるだけではなく声や動画、キャラクターが話す文章もAIが生成できるようになったため、VTuberの制作がかつてないほど容易になり、「新しいバーチャルクリエイターの波が巻き起こっている」とアメリカの大手放送局であるCNBCが報じています。
·gigazine.net·
AIによってバーチャルアバターや顔出ししないナレーションの作成が容易になってVTuberやTikTokクリエイターの新たな波が押し寄せている
YouTubeやニコニコ動画の動画を簡単にダウンロードできるアプリ「Tartube」レビュー、高機能ダウンローダー「yt-dlp」の機能をマウス操作で使える
YouTubeやニコニコ動画の動画を簡単にダウンロードできるアプリ「Tartube」レビュー、高機能ダウンローダー「yt-dlp」の機能をマウス操作で使える
「Tartube」はYouTubeやニコニコ動画といった動画サイトのコンテンツを簡単にダウンロードできる無料アプリです。複数動画の一括ダウンロードやチャンネルごとのダウンロード機能など高度な機能をコマンド不要で実行可能とのこと。かなり便利そうだったので、実際にPCにインストールして動画をダウンロードするまでの流れをまとめてみました。
·gigazine.net·
YouTubeやニコニコ動画の動画を簡単にダウンロードできるアプリ「Tartube」レビュー、高機能ダウンローダー「yt-dlp」の機能をマウス操作で使える
「GIMP 3.1.2」がリリース、新しいペイントモードやPhotoshopのプリセット対応などGIMP 3.2に向けた早期開発版
「GIMP 3.1.2」がリリース、新しいペイントモードやPhotoshopのプリセット対応などGIMP 3.2に向けた早期開発版
オープンソースの画像編集アプリ「GIMP」のバージョン3.1.2がリリースされました。GIMP 3.1.2はGIMP 3.2に向けた最初の開発リリースで、新しいペイントモードやテキストオプション、印刷時に便利なCMYKの設定、Photoshopパターンのインポートへの対応などが含まれています。
·gigazine.net·
「GIMP 3.1.2」がリリース、新しいペイントモードやPhotoshopのプリセット対応などGIMP 3.2に向けた早期開発版
「Google Earth」20周年を記念して「過去のストリートビューを確認する機能」が追加予定、過去の衛星画像も見放題なので夢洲や高速道路建設地などいろいろ見てみた
「Google Earth」20周年を記念して「過去のストリートビューを確認する機能」が追加予定、過去の衛星画像も見放題なので夢洲や高速道路建設地などいろいろ見てみた
Googleの3D地図サービス「Google Earth」が登場から20周年を迎えました。Googleは20周年を記念して過去のマップをタイムラプスで鑑賞できる特設サイトを公開しているほか、「過去のストリートビューを簡単に確認できる機能」の追加も告知しています。
·gigazine.net·
「Google Earth」20周年を記念して「過去のストリートビューを確認する機能」が追加予定、過去の衛星画像も見放題なので夢洲や高速道路建設地などいろいろ見てみた
Googleが好きな服をバーチャル試着できるアプリ「Doppl」をリリース、服を着た自分が動く様子もチェック可能
Googleが好きな服をバーチャル試着できるアプリ「Doppl」をリリース、服を着た自分が動く様子もチェック可能
Googleが現地時間の2025年6月26日、アップロードした自分の全身画像を好きな服の写真と組み合わせ、バーチャルで試着できる実験的アプリ「Doppl」をリリースしました。Dopplのバーチャル試着機能を使えば、手元にない服でも自分に似合うかどうかを視覚的にチェックすることが可能となっています。
·gigazine.net·
Googleが好きな服をバーチャル試着できるアプリ「Doppl」をリリース、服を着た自分が動く様子もチェック可能
高品質な画像編集AI「FLUX.1 Kontext [dev]」が登場、元の画像を保ったまま指示通りに加工できるオープンモデル
高品質な画像編集AI「FLUX.1 Kontext [dev]」が登場、元の画像を保ったまま指示通りに加工できるオープンモデル
高品質な画像生成AIの開発企業として知られるBlack Forest Labsが、画像編集に特化したオープンウェイトモデル「FLUX.1 Kontext [dev]」を2025年6月26日(木)にリリースしました。
·gigazine.net·
高品質な画像編集AI「FLUX.1 Kontext [dev]」が登場、元の画像を保ったまま指示通りに加工できるオープンモデル
「二次創作作品を無断でAIトレーニング用のデータセットにする行為」や「AI生成による二次創作」といったAI動向に対する海外勢の反対意見はどうなっているのか?
「二次創作作品を無断でAIトレーニング用のデータセットにする行為」や「AI生成による二次創作」といったAI動向に対する海外勢の反対意見はどうなっているのか?
生成AIの登場によって、誰でも簡単に文章やイラストを作ることができるようになりましたが、AIの学習元となっているデータセットの中にはインターネット上から無断で収集されたものも多く、著作権を巡って大きな議論となっています。IT系ニュースサイトのThe Vergeが、インターネット上に公開されている二次創作作品のスクレイピングを巡って海外のファンコミュニティで巻き起こった騒動について、当事者たちの意見をまとめています。
·gigazine.net·
「二次創作作品を無断でAIトレーニング用のデータセットにする行為」や「AI生成による二次創作」といったAI動向に対する海外勢の反対意見はどうなっているのか?
わずか2GBのメモリ使用量でスマホでの実行もOKな軽量オープンウェイトモデル「Gemma 3n」をGoogleが正式リリース、音声や動画の入力にも対応し日本語ももちろんOK
わずか2GBのメモリ使用量でスマホでの実行もOKな軽量オープンウェイトモデル「Gemma 3n」をGoogleが正式リリース、音声や動画の入力にも対応し日本語ももちろんOK
Googleが軽量かつ高性能なマルチモーダルAIモデル「Gemma 3n」を2025年6月26日(木)に正式リリースしました。正式リリースに合わせて詳細な仕様やベンチマーク結果が公開されています。
·gigazine.net·
わずか2GBのメモリ使用量でスマホでの実行もOKな軽量オープンウェイトモデル「Gemma 3n」をGoogleが正式リリース、音声や動画の入力にも対応し日本語ももちろんOK
Alibabaが画像生成AI「Qwen VLo」を発表、プログレッシブ生成手法を採用しテレビの走査線みたいに上から順に描画される
Alibabaが画像生成AI「Qwen VLo」を発表、プログレッシブ生成手法を採用しテレビの走査線みたいに上から順に描画される
AlibabaのAI開発チームであるQwenが画像生成AI「Qwen VLo」を2025年6月26日(木)に発表しました。Qwen VLoは画像内に含まれるコンテンツ理解力が高く、正確な画像編集が可能とのこと。また、プログレッシブ生成手法を採用しており、左上から順番に画像が生成されるのも大きな特徴です。
·gigazine.net·
Alibabaが画像生成AI「Qwen VLo」を発表、プログレッシブ生成手法を採用しテレビの走査線みたいに上から順に描画される
デンマークがディープフェイク対策で国民に自身の身体・顔・声に対する権利を与えるよう著作権法を改正すると発表
デンマークがディープフェイク対策で国民に自身の身体・顔・声に対する権利を与えるよう著作権法を改正すると発表
2025年6月26日、デンマーク政府が著作権法を改正し、誰もが自分の身体・顔の特徴・声に対する権利を持てるようにすることで、AIなどを用いて生成された偽画像や偽映像を指すディープフェイクを取り締まる予定であると発表しました。
·gigazine.net·
デンマークがディープフェイク対策で国民に自身の身体・顔・声に対する権利を与えるよう著作権法を改正すると発表
適切なライセンスを受けた素材でのみトレーニングされた動画生成AI「Marey」とは?
適切なライセンスを受けた素材でのみトレーニングされた動画生成AI「Marey」とは?
生成AIによるコンテンツは、SNSや作品投稿サイトで見ない日がほとんどないほどあふれていますが、著作権の問題や従来のクリエイターの機会を奪う可能性など、商業作品に取り入れるには依然として多くの問題を抱えています。映画監督のブリン・ムーザー氏が立ち上げた製作会社「Asteria」は適切にライセンスされた素材のみで学習された「倫理的な生成AI」である「Marey」を構築しており、その特徴とそれでも存在している問題についてムーザー氏が語っています。
·gigazine.net·
適切なライセンスを受けた素材でのみトレーニングされた動画生成AI「Marey」とは?
観葉植物界隈がAI生成画像による詐欺に注意喚起
観葉植物界隈がAI生成画像による詐欺に注意喚起
AIによる画像生成は功罪相半ばするものですが、観葉植物界隈では、存在しない植物の画像を用いて愛好家を呼び込む詐欺が発生していると注意喚起が行われています。
·gigazine.net·
観葉植物界隈がAI生成画像による詐欺に注意喚起
中国の監視カメラメーカーHikvisionに対してカナダ政府が国内での事業停止を命令、国家安全保障上の懸念から
中国の監視カメラメーカーHikvisionに対してカナダ政府が国内での事業停止を命令、国家安全保障上の懸念から
監視カメラをはじめとしたセキュリティ機器を扱う中国・杭州のHikvision Digital Technologyに対して、カナダのメラニー・ジョリー産業大臣は「国家安全保障上の懸念がある」として、カナダ国内での事業を停止するよう命じたことを明らかにしました。
·gigazine.net·
中国の監視カメラメーカーHikvisionに対してカナダ政府が国内での事業停止を命令、国家安全保障上の懸念から
VRAM容量の少ない安めのグラボでも画像生成AI「FLUX.1 Kontext [dev]」を動かせる省メモリ高速版をNVIDIAが開発、VRAM使用量を24GBから7GBまで削減し2.1倍高速動作
VRAM容量の少ない安めのグラボでも画像生成AI「FLUX.1 Kontext [dev]」を動かせる省メモリ高速版をNVIDIAが開発、VRAM使用量を24GBから7GBまで削減し2.1倍高速動作
「FLUX.1 Kontext [dev]」は自然言語で画像を編集可能な画像生成AIモデルで、2025年6月26日にリリースされました。このFLUX.1 Kontext [dev]にはNVIDIAと共同開発したNVIDIA製GPU最適化版が存在しており、基本モデルと比べてVRAM使用量を大幅に削減しつつ処理を高速化することに成功しています。
·gigazine.net·
VRAM容量の少ない安めのグラボでも画像生成AI「FLUX.1 Kontext [dev]」を動かせる省メモリ高速版をNVIDIAが開発、VRAM使用量を24GBから7GBまで削減し2.1倍高速動作
AIベンチマーク「自転車に乗ったペリカンを描く」をLLama 3.3 70BやGPT 4.1にやってもらうとこうなる
AIベンチマーク「自転車に乗ったペリカンを描く」をLLama 3.3 70BやGPT 4.1にやってもらうとこうなる
AIの性能を測るベンチマークはいろいろとありますが、その中でちょっと変わったものがエンジニアのサイモン・ウィリソン氏考案による「自転車に乗ったペリカンを描かせる」というもの。2025年6月に開催されたAIエンジニアワールドフェアの基調講演で、ウィリソン氏が最新の「自転車に乗ったペリカン」を報告しています。
·gigazine.net·
AIベンチマーク「自転車に乗ったペリカンを描く」をLLama 3.3 70BやGPT 4.1にやってもらうとこうなる
まるで本当に目の前に相手がいるかのように感じられる超リアルなGoogleの3Dビデオ会議技術を採用した「HP Dimension with Google Beam」が登場、65インチのライトフィールドディスプレイ搭載で価格は約360万円
まるで本当に目の前に相手がいるかのように感じられる超リアルなGoogleの3Dビデオ会議技術を採用した「HP Dimension with Google Beam」が登場、65インチのライトフィールドディスプレイ搭載で価格は約360万円
現地時間の2025年6月11日、HPがバーチャルコラボレーションを次のレベルに引き上げるためのAI搭載の超絶リアルな3D動画コミュニケーションツールとして「HP Dimension with Google Beam」を発表しました。ヘッドセットやメガネ、ウェアラブル機器を必要とせず、実際に対面しているかのような没入感を実現することが可能な65インチディスプレイを搭載しています。
·gigazine.net·
まるで本当に目の前に相手がいるかのように感じられる超リアルなGoogleの3Dビデオ会議技術を採用した「HP Dimension with Google Beam」が登場、65インチのライトフィールドディスプレイ搭載で価格は約360万円
ディズニーとユニバーサルが画像生成AIのMidjourneyを「盗作の底なし沼」と痛烈に批判して訴える
ディズニーとユニバーサルが画像生成AIのMidjourneyを「盗作の底なし沼」と痛烈に批判して訴える
2025年6月11日(水)、ディズニーとユニバーサルが著作権で保護されているはずの人気キャラクターたちを勝手に利用しているとして、画像生成AIのMidjourneyを提訴しました。ディズニーおよびユニバーサルはMidjourneyを「盗作の底なし沼」と痛烈に批判しています。
·gigazine.net·
ディズニーとユニバーサルが画像生成AIのMidjourneyを「盗作の底なし沼」と痛烈に批判して訴える
MetaがMeta AI&Editsアプリに生成AIによる動画編集機能を追加、期間限定無料でユーザーは50以上のプリセットプロンプトを使用して最大10秒の動画を編集可能に
MetaがMeta AI&Editsアプリに生成AIによる動画編集機能を追加、期間限定無料でユーザーは50以上のプリセットプロンプトを使用して最大10秒の動画を編集可能に
MetaがMeta AIのアプリとウェブ版、そして動画編集アプリのEditsで生成AIを用いた動画編集機能をリリースすると発表しました。
·gigazine.net·
MetaがMeta AI&Editsアプリに生成AIによる動画編集機能を追加、期間限定無料でユーザーは50以上のプリセットプロンプトを使用して最大10秒の動画を編集可能に
AmazonがAI広告動画の自動生成機能を提供開始、商品が現実世界で使用される様子を描写する無料AIツール
AmazonがAI広告動画の自動生成機能を提供開始、商品が現実世界で使用される様子を描写する無料AIツール
Amazonの広告管理ツール「Amazon Ads」に実装されていた動画生成ツール「Video Generator」の機能が強化され、正式提供が始まりました。広告主は1枚の商品画像からさまざまなAI動画を生成することができます。
·gigazine.net·
AmazonがAI広告動画の自動生成機能を提供開始、商品が現実世界で使用される様子を描写する無料AIツール
画像生成AI「Stable Diffusion 3.5 Large」の18GBを超えるVRAM使用量を40%も削減して11GBにする新技術をNVIDIAが公開
画像生成AI「Stable Diffusion 3.5 Large」の18GBを超えるVRAM使用量を40%も削減して11GBにする新技術をNVIDIAが公開
生成AIのパフォーマンスは日々向上していますが、より優れたAIを動かすためには、より多くのVRAM(ビデオランダムアクセスメモリ)が必要になります。例えば画像生成AIのStable Diffusion 3.5のうち、80億のパラメータを持つ最も強力な「Large」を実行する場合、基本モデルは18GBのVRAMを使用します。このVRAM使用量を削減して、より効率的なパフォーマンスで実行できる技術をNVIDIAが公開しました。
·gigazine.net·
画像生成AI「Stable Diffusion 3.5 Large」の18GBを超えるVRAM使用量を40%も削減して11GBにする新技術をNVIDIAが公開
NBAファイナルで放送されたAI生成広告の制作費は約29万円で従来の動画広告から95%のコスト削減を実現
NBAファイナルで放送されたAI生成広告の制作費は約29万円で従来の動画広告から95%のコスト削減を実現
現地時間の2025年6月11日に開催されたNBAファイナルの第3戦で、AIを用いて生成された動画広告が流れました。NBAファイナルの視聴者に大きなインパクトを与えたこの動画ですが、制作費はわずか2000ドル(約28万8000円)と従来の動画広告と比べて95%もコスト削減を実現しており、制作時間もたったの2日であることが明らかになっています。
·gigazine.net·
NBAファイナルで放送されたAI生成広告の制作費は約29万円で従来の動画広告から95%のコスト削減を実現
Adobeが画像生成AI「Firefly」のAndroid・iOS用アプリを公開、Googleの画像生成AI「Imagen」・動画生成AI「Veo」・OpenAIの画像生成AIも利用可能
Adobeが画像生成AI「Firefly」のAndroid・iOS用アプリを公開、Googleの画像生成AI「Imagen」・動画生成AI「Veo」・OpenAIの画像生成AIも利用可能
Adobeの生成AI「Firefly」が、AndroidおよびiOS向けのモバイルアプリとしてリリースされました。テキストからの画像や動画の生成、Adobe Photoshopにも搭載されている生成塗りつぶし機能や生成拡張機能が使用可能で、Adobe Fireflyのモバイルアプリで生成されたものはすべてユーザーのCreative Cloudアカウントに自動的に同期されるため、ウェブやAdobeのデスクトップアプリでの作業が簡単になります。
·gigazine.net·
Adobeが画像生成AI「Firefly」のAndroid・iOS用アプリを公開、Googleの画像生成AI「Imagen」・動画生成AI「Veo」・OpenAIの画像生成AIも利用可能
Midjourneyが初の動画生成AIモデル「V1」を発表、1枚の画像から最大21秒の動画生成が可能
Midjourneyが初の動画生成AIモデル「V1」を発表、1枚の画像から最大21秒の動画生成が可能
画像生成AIを開発するMidjourneyが、Discord経由で利用できる動画生成AIモデル「V1」をリリースしたと発表しました。V1はアップロードした画像、あるいはMidjourneyの他のモデルで生成された画像を使用するだけで、その画像に基づいて5秒間の動画4本を生成することが可能です。
·gigazine.net·
Midjourneyが初の動画生成AIモデル「V1」を発表、1枚の画像から最大21秒の動画生成が可能
GoogleはYouTubeにアップロードされた動画をAIのトレーニングに使用しているがクリエイターはあまり把握していないことが判明
GoogleはYouTubeにアップロードされた動画をAIのトレーニングに使用しているがクリエイターはあまり把握していないことが判明
Googleは、チャットAIのGeminiや最大4Kまでの解像度の動画を作成できる動画生成モデルの「Veo 3」を展開するにあたり、YouTubeにアップロードされた膨大なライブラリをトレーニングに活用していますが、その事実をクリエイターの多くはあまり認識していないことが明らかになりました。YouTubeは動画クリエイターの権利を保護する姿勢を表明していますが、一部の専門家は投稿動画をAIのトレーニングに使うことは知的財産の危機につながる可能性があると指摘しています。
·gigazine.net·
GoogleはYouTubeにアップロードされた動画をAIのトレーニングに使用しているがクリエイターはあまり把握していないことが判明
AdobeがPixelカメラの元開発者によるiPhone用カメラアプリ「Project Indigo」をリリース、計算写真技術とAIを駆使して高ダイナミックレンジと低ノイズを両立し「一眼レフ」並に自然な写真を追求
AdobeがPixelカメラの元開発者によるiPhone用カメラアプリ「Project Indigo」をリリース、計算写真技術とAIを駆使して高ダイナミックレンジと低ノイズを両立し「一眼レフ」並に自然な写真を追求
AdobeがiPhone向けのカメラアプリ「Project Indigo」を発表しました。このアプリの開発者の1人であるマーク・ルヴォイ氏は、Google Pixelの純正カメラに搭載されているコンピューティショナルフォトグラフィー技術の開発に携わった人物として知られています。
·gigazine.net·
AdobeがPixelカメラの元開発者によるiPhone用カメラアプリ「Project Indigo」をリリース、計算写真技術とAIを駆使して高ダイナミックレンジと低ノイズを両立し「一眼レフ」並に自然な写真を追求