画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2839 bookmarks
Custom sorting
ショート動画を爆速で作成できる無料でオープンソースのAIモデル「Ovi」誕生、「テキスト」「テキスト+画像」で動画と音声を同時に生成可能
ショート動画を爆速で作成できる無料でオープンソースのAIモデル「Ovi」誕生、「テキスト」「テキスト+画像」で動画と音声を同時に生成可能
テキスト単体、あるいはテキスト+画像で5秒の動画を作成できるAIモデル「Ovi」が誕生しました。オープンソースで公開されており、自分で環境を構築すれば無料で使用することができます。
·gigazine.net·
ショート動画を爆速で作成できる無料でオープンソースのAIモデル「Ovi」誕生、「テキスト」「テキスト+画像」で動画と音声を同時に生成可能
1枚のイラストや写真から3D空間を生成できるAIモデル「HunyuanWorld-Mirror」が登場、マルチアングル入力や動画入力にも対応し競合モデルより高品質
1枚のイラストや写真から3D空間を生成できるAIモデル「HunyuanWorld-Mirror」が登場、マルチアングル入力や動画入力にも対応し競合モデルより高品質
中国の大手テクノロジー企業であるテンセントが生成AIモデル「Hunyuan World 1.1(HunyuanWorld-Mirror)」を公開しました。HunyuanWorld-Mirrorは画像を元に深度を再現した3D空間を生成することが可能。さらに、単一の画像だけでなく複数のアングルからの画像や動画の入力にも対応しています。
·gigazine.net·
1枚のイラストや写真から3D空間を生成できるAIモデル「HunyuanWorld-Mirror」が登場、マルチアングル入力や動画入力にも対応し競合モデルより高品質
画像認識AIモデル「Qwen3-VL」の軽量版が登場したので使ってみた、低いVRAM使用量で高性能を実現
画像認識AIモデル「Qwen3-VL」の軽量版が登場したので使ってみた、低いVRAM使用量で高性能を実現
Qwen3-VLの軽量版であるQwen3-VL-4BおよびQwen3-VL-8Bが公開されました。これらのモデルは、Qwen3-VLの全機能が保持されており、従来のモデルに比べて大幅にVRAM使用量を削減しつつ、Qwen2.5-VL-72Bに匹敵する性能を発揮するとのことで試しにローカルPCにインストールして使ってみました。
·gigazine.net·
画像認識AIモデル「Qwen3-VL」の軽量版が登場したので使ってみた、低いVRAM使用量で高性能を実現
AI生成画像じゃないことを証明できるカメラ「Roc Camera」
AI生成画像じゃないことを証明できるカメラ「Roc Camera」
画像生成AIの進歩は急速に進んでおり、すでに実写と見分けがつかない画像を誰でも簡単に生成できるようになっています。そんな中、カメラで撮影した本物の写真であることを証明できる仕組みを内蔵した「Roc Camera」が登場しました。
·gigazine.net·
AI生成画像じゃないことを証明できるカメラ「Roc Camera」
画像生成AIがテキスト指示による画像編集でどれだけ指示を守ることができるかを実際の生成画像を見て評価できる「GenAI Image Editing Showdown」
画像生成AIがテキスト指示による画像編集でどれだけ指示を守ることができるかを実際の生成画像を見て評価できる「GenAI Image Editing Showdown」
「GenAI Image Showdown」は複数の画像生成AIに同じプロンプトを入力した結果をまとめたウェブサイトで、どの画像生成AIがプロンプトに忠実な画像を生成できるのかを比較して評価することができます。さらに、画像生成ではなくテキスト指示での「編集」を行う場合、どれくらい指示を守って忠実に画像を修正するのかモデル別に比較することができるのが「GenAI Image Editing Showdown」です。
·gigazine.net·
画像生成AIがテキスト指示による画像編集でどれだけ指示を守ることができるかを実際の生成画像を見て評価できる「GenAI Image Editing Showdown」
2億画素の望遠カメラ&7500mAhの大容量バッテリーを搭載したスマホ「OPPO Find X9 Pro」が登場、10倍光学ズームを実現する外付けテレコンもあり
2億画素の望遠カメラ&7500mAhの大容量バッテリーを搭載したスマホ「OPPO Find X9 Pro」が登場、10倍光学ズームを実現する外付けテレコンもあり
OPPOが「Find X9」と「Find X9 Pro」を2025年10月29日に発表しました。Find X9 ProはHasselbladと共同開発した200メガピクセル(2億画素)の望遠カメラを搭載しており、光学ズーム倍率を10倍に引き上げるテレコンバーターも用意されています。
·gigazine.net·
2億画素の望遠カメラ&7500mAhの大容量バッテリーを搭載したスマホ「OPPO Find X9 Pro」が登場、10倍光学ズームを実現する外付けテレコンもあり
AdobeがPhotoshopやPremiereなど向けのAIツールを発表、画像生成AIのFirefly Image Model 5ではネイティブ4MP解像度での画像生成が可能に
AdobeがPhotoshopやPremiereなど向けのAIツールを発表、画像生成AIのFirefly Image Model 5ではネイティブ4MP解像度での画像生成が可能に
現地時間の2025年10月28日、Adobeが世界最大のクリエイティブカンファレンスである「Adobe MAX 2025」を開催しました。Adobeは主力製品であるAdobe ExpressやAdobe Firefly、Adobe Photoshopといったソフトウェア全体に、AI機能やAIアシスタントを導入すると発表しています。
·gigazine.net·
AdobeがPhotoshopやPremiereなど向けのAIツールを発表、画像生成AIのFirefly Image Model 5ではネイティブ4MP解像度での画像生成が可能に
YouTubeがAIを使ってフルHD未満のアップロード動画をHD画質に高画質化する新機能を導入、近い将来に4Kへのアップスケールも計画中でクリエイターはオプトアウトすることも可能
YouTubeがAIを使ってフルHD未満のアップロード動画をHD画質に高画質化する新機能を導入、近い将来に4Kへのアップスケールも計画中でクリエイターはオプトアウトすることも可能
YouTubeはスマートフォンやPCなどさまざまなデバイスで視聴可能ですが、「テレビでの動画再生から6桁(数千万円)以上の収益を上げているYouTubeチャンネル」の数は前年比で45%以上増加しているそうです。この需要に合わせた「テレビを使っているユーザー」向けのアップデートを、YouTubeが発表しました。
·gigazine.net·
YouTubeがAIを使ってフルHD未満のアップロード動画をHD画質に高画質化する新機能を導入、近い将来に4Kへのアップスケールも計画中でクリエイターはオプトアウトすることも可能
Photoshop代替として注目されるAffinityが無料化される、写真編集・ベクター編集・レイアウトを単一アプリで実行可能
Photoshop代替として注目されるAffinityが無料化される、写真編集・ベクター編集・レイアウトを単一アプリで実行可能
Affinityが開発するデザインツール群はPhotoshopやIllustratorといったサブスクリプション型のAdobe製品と違って買い切り型のライセンスモデルを採用しており、Adobe製品からの乗り換え先として注目を集めていました。そんなAffinityのデザインツール群が「Affinity」という名称の単一アプリにまとまり、無料で使えるようになったことが発表されました。
·gigazine.net·
Photoshop代替として注目されるAffinityが無料化される、写真編集・ベクター編集・レイアウトを単一アプリで実行可能
Metaがエロ動画をAIのトレーニングに使ったとアダルトサイトから訴えられるも「個人利用」だとして反論
Metaがエロ動画をAIのトレーニングに使ったとアダルトサイトから訴えられるも「個人利用」だとして反論
Metaは2025年7月に、「成人向け映像約2396本を不正にダウンロードし、AIモデルのトレーニングに無断で用いた」として、アダルト映画制作会社から提訴されました。これに対しMetaは、「当該ダウンロードはAIのトレーニング目的ではなく、従業員やサイト利用者らによる私的な個人利用」だと主張し、AIのトレーニングに成人向けコンテンツを使用していないと反論しています。
·gigazine.net·
Metaがエロ動画をAIのトレーニングに使ったとアダルトサイトから訴えられるも「個人利用」だとして反論
動画生成AI「Sora 2」でのキャラ使用についてスタジオジブリやコンテンツ産業の業界団体「CODA」が学習拒否および著作権への真摯な対応を求める要望書を提出
動画生成AI「Sora 2」でのキャラ使用についてスタジオジブリやコンテンツ産業の業界団体「CODA」が学習拒否および著作権への真摯な対応を求める要望書を提出
OpenAIが開発した動画生成AI「Sora 2」はピカチュウやマリオなどの人気キャラクターを含む動画を簡単に作れてしまいます。この状況を受けて、一般社団法人コンテンツ海外流通促進機構(CODA)がOpenAIに対して要望書を提出しました。
·gigazine.net·
動画生成AI「Sora 2」でのキャラ使用についてスタジオジブリやコンテンツ産業の業界団体「CODA」が学習拒否および著作権への真摯な対応を求める要望書を提出
動画生成AIアプリ「Sora」のAndroid版が登場
動画生成AIアプリ「Sora」のAndroid版が登場
OpenAIが動画生成AIアプリ「Sora」のAndroid版を2025年11月5日にリリースしました。日本からもダウンロード可能で、動画を生成したり世界中のユーザーが作成した動画を閲覧したりできます。
·gigazine.net·
動画生成AIアプリ「Sora」のAndroid版が登場
画像生成AI「Stable Diffusion」をGetty Imagesが著作権侵害で訴えた訴訟は商標権侵害のみ認定、両者が勝利を宣言
画像生成AI「Stable Diffusion」をGetty Imagesが著作権侵害で訴えた訴訟は商標権侵害のみ認定、両者が勝利を宣言
写真素材の有料配信を行っているストックフォトサービスの「Getty Images(ゲッティ・イメージズ)」が、画像生成AIの「Stable Diffusion」によって知的財産権が侵害されているとして起こした訴訟で、ロンドンの高等法院による判決が下りました。内容は、AIモデルによる著作権侵害の主張については「著作権侵害のコピーではない」と却下する一方、透かしに関する商標権侵害についての主張は認めるもので、Getty Imagesからも、Stabile Diffusionを運営するStability AIからも実質的な勝利宣言が出されています。
·gigazine.net·
画像生成AI「Stable Diffusion」をGetty Imagesが著作権侵害で訴えた訴訟は商標権侵害のみ認定、両者が勝利を宣言
Microsoftが初となる自社開発の画像生成AIモデル「MAI-Image-1」を発表
Microsoftが初となる自社開発の画像生成AIモデル「MAI-Image-1」を発表
MicrosoftのAI部門であるMicrosoft AIが、自社で設計・開発した初の画像生成モデル「MAI-Image-1」を発表しました。MicrosoftはこのMAI-Image-1を「私たちの旅の次のステップ」と呼んでいます。
·gigazine.net·
Microsoftが初となる自社開発の画像生成AIモデル「MAI-Image-1」を発表
シンプルな原理とユニークな特性を持つ新しい生成AIモデル「DDN(Discrete Distribution Networks)」
シンプルな原理とユニークな特性を持つ新しい生成AIモデル「DDN(Discrete Distribution Networks)」
シンプルな原理とユニークな特性を持った新しい生成AIモデルの「DDN(Discrete Distribution Networks:離散分布ネットワーク)」を、コンピュータービジョンや大規模言語モデル(LLM)の研究者であるレイ・ヤン氏が発表しました。
·gigazine.net·
シンプルな原理とユニークな特性を持つ新しい生成AIモデル「DDN(Discrete Distribution Networks)」
日本政府がアニメやゲームなどの日本の知的財産を「かけがえのない宝」と呼んでOpenAIに著作権を侵害しないよう正式に要請したことが海外で話題に
日本政府がアニメやゲームなどの日本の知的財産を「かけがえのない宝」と呼んでOpenAIに著作権を侵害しないよう正式に要請したことが海外で話題に
OpenAIが2025年10月1日にリリースした動画生成AI「Sora 2」で、日本のゲームやアニメなどの著作権で保護されたコンテンツを含む動画が大量に生成されて問題となりました。この事態に対して、日本政府がOpenAIに対して「著作権侵害となるような行為を行わないように要請した」ことが海外で話題になっています。
·gigazine.net·
日本政府がアニメやゲームなどの日本の知的財産を「かけがえのない宝」と呼んでOpenAIに著作権を侵害しないよう正式に要請したことが海外で話題に
iPhoneやMacで重量級画像生成AIをローカル実行できる「Draw Things」を使ってみたよレビュー、Qwen Imageのような大型モデルも実行可能
iPhoneやMacで重量級画像生成AIをローカル実行できる「Draw Things」を使ってみたよレビュー、Qwen Imageのような大型モデルも実行可能
「Draw Things」はiPhone・iPad・macOSに対応した無料の画像生成AIアプリで、多様なモデルを用いてローカルで生成処理を実行できます。Qwen Imageなどの大型モデルもiPhoneでローカル動作させられるとのことなので、実際に使ってみました。
·gigazine.net·
iPhoneやMacで重量級画像生成AIをローカル実行できる「Draw Things」を使ってみたよレビュー、Qwen Imageのような大型モデルも実行可能
xAIが動画生成AI「Imagine v0.9」を発表、規制の緩さで話題の「Grokの動画生成機能」がアップデートされる
xAIが動画生成AI「Imagine v0.9」を発表、規制の緩さで話題の「Grokの動画生成機能」がアップデートされる
イーロン・マスク氏が率いるAI開発企業のxAIが動画生成AI「Imagine v0.9」を2025年10月8日に発表しました。Imagine v0.9はこれまで使用可能だったImagine v0.1と比べてダイナミックな動きなどの品質が向上しており、動画の動きに合わせて音声を生成することも可能です。
·gigazine.net·
xAIが動画生成AI「Imagine v0.9」を発表、規制の緩さで話題の「Grokの動画生成機能」がアップデートされる
なつかしのコピペを「Sora 2」に動画化させまくってみた 「もぅマヂ無理」「猫の喧嘩」など……どんな映像になる?
なつかしのコピペを「Sora 2」に動画化させまくってみた 「もぅマヂ無理」「猫の喧嘩」など……どんな映像になる?
Sora 2の性能を分かりやすく確認するため、昔はやった“なつかしのコピペ”をそのままプロンプトとして入力。Sora 2がどんな映像を出してくるか確認してみる。
·itmedia.co.jp·
なつかしのコピペを「Sora 2」に動画化させまくってみた 「もぅマヂ無理」「猫の喧嘩」など……どんな映像になる?
動画生成AI「Sora 2」でキャラクター動画が作られまくっている状況の改善をサム・アルトマンCEOが約束、特に日本のコンテンツに言及し権利者への収益分配を示唆
動画生成AI「Sora 2」でキャラクター動画が作られまくっている状況の改善をサム・アルトマンCEOが約束、特に日本のコンテンツに言及し権利者への収益分配を示唆
2025年9月30日に登場した動画生成AI「Sora 2」は非常に高精度な音声付き動画を生成可能なのですが、「ポケモンやマリオなどの著作権で保護されたキャラクターの動画を大量生成できてしまう」という問題も抱えています。この状況について、Sora 2の開発元であるOpenAIのサム・アルトマンCEOが改善を約束するブログ記事を投稿しました。さらに、実在の人物を動画内に登場させるカメオ機能についてもアップデートが告知されています。
·gigazine.net·
動画生成AI「Sora 2」でキャラクター動画が作られまくっている状況の改善をサム・アルトマンCEOが約束、特に日本のコンテンツに言及し権利者への収益分配を示唆
「動画におけるGPT-3.5」──OpenAI、「Sora 2」発表 インスタ風ソーシャルAI動画アプリもiOS向けに提供
「動画におけるGPT-3.5」──OpenAI、「Sora 2」発表 インスタ風ソーシャルAI動画アプリもiOS向けに提供
米OpenAIが動画生成AI「Sora 2」を発表した。Sora 1に比べ物理法則を学び、オリンピックの体操競技やパドルボートの上でのバク転など、これまでの動画生成AIでは難しかったシーンの生成ができるようになったという。また、InstagramやTikTokのようなUIのソーシャル動画アプリ「Sora」も公開した。まずは米国とカナダで提供を始める。
·itmedia.co.jp·
「動画におけるGPT-3.5」──OpenAI、「Sora 2」発表 インスタ風ソーシャルAI動画アプリもiOS向けに提供
「ドラゴンボール」「NARUTO」もそっくり再現 Sora 2使った日本のアニメ風動画がXに続々 自民・塩崎衆院議員は「重大な問題」と指摘
「ドラゴンボール」「NARUTO」もそっくり再現 Sora 2使った日本のアニメ風動画がXに続々 自民・塩崎衆院議員は「重大な問題」と指摘
米OpenAIが公開した最新の動画生成AI「Sora 2」を用いた、日本の人気アニメ作品風の動画の投稿がX上で相次いでいる。SNSでは驚きとともに、著作権の侵害を懸念する声が広がっている。
·itmedia.co.jp·
「ドラゴンボール」「NARUTO」もそっくり再現 Sora 2使った日本のアニメ風動画がXに続々 自民・塩崎衆院議員は「重大な問題」と指摘
OpenAI「Sora2」提供開始で世界に衝撃:オプトアウトで著作権はどうなるの?
OpenAI「Sora2」提供開始で世界に衝撃:オプトアウトで著作権はどうなるの?
OpenAIが発表した最新の動画生成AI「Sora2」のクオリティに驚嘆の声があがっている。テキストから高品質な映像を作るだけでなく、セリフや効果音まで自然に同期させて生成できるモデルだ。現実と区別がつかないほどのリアルな動きや、多様なスタ…
·agora-web.jp·
OpenAI「Sora2」提供開始で世界に衝撃:オプトアウトで著作権はどうなるの?
iPhone 17のカメラ性能を徹底検証してみたよレビュー、48メガピクセルにアップグレードされた超広角カメラの実力はいかに
iPhone 17のカメラ性能を徹底検証してみたよレビュー、48メガピクセルにアップグレードされた超広角カメラの実力はいかに
「iPhone 17」には無印モデルとして初めて48メガピクセルの超広角カメラが搭載されており、画角の広いダイナミックな高画質写真を記録できます。いったいどんな写真を記録できるのか気になったので、実際にiPhone 17を持ち出していろいろ撮影してみました。
·gigazine.net·
iPhone 17のカメラ性能を徹底検証してみたよレビュー、48メガピクセルにアップグレードされた超広角カメラの実力はいかに
5万円以下なのに4K・60fps動画を撮影できる軽量&コンパクトなDJIのアクションカメラ「Osmo Nano」で動画を撮影したりデータを転送したりしてみた
5万円以下なのに4K・60fps動画を撮影できる軽量&コンパクトなDJIのアクションカメラ「Osmo Nano」で動画を撮影したりデータを転送したりしてみた
ドローンやアクションカメラのメーカーであるDJIから、小型のウェアラブルアクションカメラ「Osmo Nano」が2025年9月23日(火)に登場しました。マグネットでカメラ本体を分離できるモジュラーデザインとなっており、カメラ部分は重量わずか65gと軽量かつコンパクト、そして最大4K・60fpsの映像を撮影可能となっています。そんなOSMO Nanoに一足早く触ることができたので、設定などをチェックしつつ、実際に動画を撮影してみました。
·gigazine.net·
5万円以下なのに4K・60fps動画を撮影できる軽量&コンパクトなDJIのアクションカメラ「Osmo Nano」で動画を撮影したりデータを転送したりしてみた
OpenAIが動画生成AI「Sora 2」を発表、同時リリースのiOS向けソーシャルアプリ「Sora」ではSora 2で自分や友人の顔から動画を生成可能
OpenAIが動画生成AI「Sora 2」を発表、同時リリースのiOS向けソーシャルアプリ「Sora」ではSora 2で自分や友人の顔から動画を生成可能
OpenAIが新しい最先端の動画・音声生成モデルである「Sora 2」を2025年9月30日に発表しました。また、Sora 2を利用できるソーシャル動画共有アプリ「Sora」がiOS向けに無料でリリースされました。
·gigazine.net·
OpenAIが動画生成AI「Sora 2」を発表、同時リリースのiOS向けソーシャルアプリ「Sora」ではSora 2で自分や友人の顔から動画を生成可能
動画編集ソフト「Adobe Premiere」のiPhone版をAdobeがリリースしたので実際に使ってみた、一般的な編集は無料だがAI生成機能には課金が必要
動画編集ソフト「Adobe Premiere」のiPhone版をAdobeがリリースしたので実際に使ってみた、一般的な編集は無料だがAI生成機能には課金が必要
Adobeが、iPhone向けの動画編集アプリ「Adobe Premiere」をリリースしました。iPhoneで撮影した動画をその場ですぐに編集できるほか、生成AI機能を利用したり、デスクトップ版のPremiere Proにクラウド経由でプロジェクトファイルを共有したりすることが可能です。
·gigazine.net·
動画編集ソフト「Adobe Premiere」のiPhone版をAdobeがリリースしたので実際に使ってみた、一般的な編集は無料だがAI生成機能には課金が必要
Alibabaがリアルタイムで音声会話できるAIモデル「Qwen3-Omni」やGPT-5と同等性能の画像認識AIモデル「Qwen3-VL」を公開、他にも言語モデルや画像編集モデルを一挙大量公開
Alibabaがリアルタイムで音声会話できるAIモデル「Qwen3-Omni」やGPT-5と同等性能の画像認識AIモデル「Qwen3-VL」を公開、他にも言語モデルや画像編集モデルを一挙大量公開
中国に拠点を置く大手テクノロジー企業「Alibaba」のAI研究チーム「Qwen」が、自然言語でリアルタイム応答できるAIモデル「Qwen3-Omni」を2025年9月22日に発表しました。さらに、9月22日~24日の短期間に「Qwen3-VL」「Qwen3-TTS」「Qwen-Image-Edit-2509」「Qwen3-VL」「Qwen3-LiveTranslate-Flash」「Qwen3-Max」といったAIモデルが続々と発表されています。
·gigazine.net·
Alibabaがリアルタイムで音声会話できるAIモデル「Qwen3-Omni」やGPT-5と同等性能の画像認識AIモデル「Qwen3-VL」を公開、他にも言語モデルや画像編集モデルを一挙大量公開