画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2790 bookmarks
Custom sorting
xAIが動画生成AI「Imagine v0.9」を発表、規制の緩さで話題の「Grokの動画生成機能」がアップデートされる
xAIが動画生成AI「Imagine v0.9」を発表、規制の緩さで話題の「Grokの動画生成機能」がアップデートされる
イーロン・マスク氏が率いるAI開発企業のxAIが動画生成AI「Imagine v0.9」を2025年10月8日に発表しました。Imagine v0.9はこれまで使用可能だったImagine v0.1と比べてダイナミックな動きなどの品質が向上しており、動画の動きに合わせて音声を生成することも可能です。
·gigazine.net·
xAIが動画生成AI「Imagine v0.9」を発表、規制の緩さで話題の「Grokの動画生成機能」がアップデートされる
なつかしのコピペを「Sora 2」に動画化させまくってみた 「もぅマヂ無理」「猫の喧嘩」など……どんな映像になる?
なつかしのコピペを「Sora 2」に動画化させまくってみた 「もぅマヂ無理」「猫の喧嘩」など……どんな映像になる?
Sora 2の性能を分かりやすく確認するため、昔はやった“なつかしのコピペ”をそのままプロンプトとして入力。Sora 2がどんな映像を出してくるか確認してみる。
·itmedia.co.jp·
なつかしのコピペを「Sora 2」に動画化させまくってみた 「もぅマヂ無理」「猫の喧嘩」など……どんな映像になる?
動画生成AI「Sora 2」でキャラクター動画が作られまくっている状況の改善をサム・アルトマンCEOが約束、特に日本のコンテンツに言及し権利者への収益分配を示唆
動画生成AI「Sora 2」でキャラクター動画が作られまくっている状況の改善をサム・アルトマンCEOが約束、特に日本のコンテンツに言及し権利者への収益分配を示唆
2025年9月30日に登場した動画生成AI「Sora 2」は非常に高精度な音声付き動画を生成可能なのですが、「ポケモンやマリオなどの著作権で保護されたキャラクターの動画を大量生成できてしまう」という問題も抱えています。この状況について、Sora 2の開発元であるOpenAIのサム・アルトマンCEOが改善を約束するブログ記事を投稿しました。さらに、実在の人物を動画内に登場させるカメオ機能についてもアップデートが告知されています。
·gigazine.net·
動画生成AI「Sora 2」でキャラクター動画が作られまくっている状況の改善をサム・アルトマンCEOが約束、特に日本のコンテンツに言及し権利者への収益分配を示唆
「動画におけるGPT-3.5」──OpenAI、「Sora 2」発表 インスタ風ソーシャルAI動画アプリもiOS向けに提供
「動画におけるGPT-3.5」──OpenAI、「Sora 2」発表 インスタ風ソーシャルAI動画アプリもiOS向けに提供
米OpenAIが動画生成AI「Sora 2」を発表した。Sora 1に比べ物理法則を学び、オリンピックの体操競技やパドルボートの上でのバク転など、これまでの動画生成AIでは難しかったシーンの生成ができるようになったという。また、InstagramやTikTokのようなUIのソーシャル動画アプリ「Sora」も公開した。まずは米国とカナダで提供を始める。
·itmedia.co.jp·
「動画におけるGPT-3.5」──OpenAI、「Sora 2」発表 インスタ風ソーシャルAI動画アプリもiOS向けに提供
「ドラゴンボール」「NARUTO」もそっくり再現 Sora 2使った日本のアニメ風動画がXに続々 自民・塩崎衆院議員は「重大な問題」と指摘
「ドラゴンボール」「NARUTO」もそっくり再現 Sora 2使った日本のアニメ風動画がXに続々 自民・塩崎衆院議員は「重大な問題」と指摘
米OpenAIが公開した最新の動画生成AI「Sora 2」を用いた、日本の人気アニメ作品風の動画の投稿がX上で相次いでいる。SNSでは驚きとともに、著作権の侵害を懸念する声が広がっている。
·itmedia.co.jp·
「ドラゴンボール」「NARUTO」もそっくり再現 Sora 2使った日本のアニメ風動画がXに続々 自民・塩崎衆院議員は「重大な問題」と指摘
OpenAI「Sora2」提供開始で世界に衝撃:オプトアウトで著作権はどうなるの?
OpenAI「Sora2」提供開始で世界に衝撃:オプトアウトで著作権はどうなるの?
OpenAIが発表した最新の動画生成AI「Sora2」のクオリティに驚嘆の声があがっている。テキストから高品質な映像を作るだけでなく、セリフや効果音まで自然に同期させて生成できるモデルだ。現実と区別がつかないほどのリアルな動きや、多様なスタ…
·agora-web.jp·
OpenAI「Sora2」提供開始で世界に衝撃:オプトアウトで著作権はどうなるの?
iPhone 17のカメラ性能を徹底検証してみたよレビュー、48メガピクセルにアップグレードされた超広角カメラの実力はいかに
iPhone 17のカメラ性能を徹底検証してみたよレビュー、48メガピクセルにアップグレードされた超広角カメラの実力はいかに
「iPhone 17」には無印モデルとして初めて48メガピクセルの超広角カメラが搭載されており、画角の広いダイナミックな高画質写真を記録できます。いったいどんな写真を記録できるのか気になったので、実際にiPhone 17を持ち出していろいろ撮影してみました。
·gigazine.net·
iPhone 17のカメラ性能を徹底検証してみたよレビュー、48メガピクセルにアップグレードされた超広角カメラの実力はいかに
5万円以下なのに4K・60fps動画を撮影できる軽量&コンパクトなDJIのアクションカメラ「Osmo Nano」で動画を撮影したりデータを転送したりしてみた
5万円以下なのに4K・60fps動画を撮影できる軽量&コンパクトなDJIのアクションカメラ「Osmo Nano」で動画を撮影したりデータを転送したりしてみた
ドローンやアクションカメラのメーカーであるDJIから、小型のウェアラブルアクションカメラ「Osmo Nano」が2025年9月23日(火)に登場しました。マグネットでカメラ本体を分離できるモジュラーデザインとなっており、カメラ部分は重量わずか65gと軽量かつコンパクト、そして最大4K・60fpsの映像を撮影可能となっています。そんなOSMO Nanoに一足早く触ることができたので、設定などをチェックしつつ、実際に動画を撮影してみました。
·gigazine.net·
5万円以下なのに4K・60fps動画を撮影できる軽量&コンパクトなDJIのアクションカメラ「Osmo Nano」で動画を撮影したりデータを転送したりしてみた
OpenAIが動画生成AI「Sora 2」を発表、同時リリースのiOS向けソーシャルアプリ「Sora」ではSora 2で自分や友人の顔から動画を生成可能
OpenAIが動画生成AI「Sora 2」を発表、同時リリースのiOS向けソーシャルアプリ「Sora」ではSora 2で自分や友人の顔から動画を生成可能
OpenAIが新しい最先端の動画・音声生成モデルである「Sora 2」を2025年9月30日に発表しました。また、Sora 2を利用できるソーシャル動画共有アプリ「Sora」がiOS向けに無料でリリースされました。
·gigazine.net·
OpenAIが動画生成AI「Sora 2」を発表、同時リリースのiOS向けソーシャルアプリ「Sora」ではSora 2で自分や友人の顔から動画を生成可能
動画編集ソフト「Adobe Premiere」のiPhone版をAdobeがリリースしたので実際に使ってみた、一般的な編集は無料だがAI生成機能には課金が必要
動画編集ソフト「Adobe Premiere」のiPhone版をAdobeがリリースしたので実際に使ってみた、一般的な編集は無料だがAI生成機能には課金が必要
Adobeが、iPhone向けの動画編集アプリ「Adobe Premiere」をリリースしました。iPhoneで撮影した動画をその場ですぐに編集できるほか、生成AI機能を利用したり、デスクトップ版のPremiere Proにクラウド経由でプロジェクトファイルを共有したりすることが可能です。
·gigazine.net·
動画編集ソフト「Adobe Premiere」のiPhone版をAdobeがリリースしたので実際に使ってみた、一般的な編集は無料だがAI生成機能には課金が必要
Alibabaがリアルタイムで音声会話できるAIモデル「Qwen3-Omni」やGPT-5と同等性能の画像認識AIモデル「Qwen3-VL」を公開、他にも言語モデルや画像編集モデルを一挙大量公開
Alibabaがリアルタイムで音声会話できるAIモデル「Qwen3-Omni」やGPT-5と同等性能の画像認識AIモデル「Qwen3-VL」を公開、他にも言語モデルや画像編集モデルを一挙大量公開
中国に拠点を置く大手テクノロジー企業「Alibaba」のAI研究チーム「Qwen」が、自然言語でリアルタイム応答できるAIモデル「Qwen3-Omni」を2025年9月22日に発表しました。さらに、9月22日~24日の短期間に「Qwen3-VL」「Qwen3-TTS」「Qwen-Image-Edit-2509」「Qwen3-VL」「Qwen3-LiveTranslate-Flash」「Qwen3-Max」といったAIモデルが続々と発表されています。
·gigazine.net·
Alibabaがリアルタイムで音声会話できるAIモデル「Qwen3-Omni」やGPT-5と同等性能の画像認識AIモデル「Qwen3-VL」を公開、他にも言語モデルや画像編集モデルを一挙大量公開
「微細な手ぶれを利用して12回撮影した画像から高解像度写真を生成する」という特殊機能「ハイレゾショット」の実力をOM-5 Mark IIで試してみた
「微細な手ぶれを利用して12回撮影した画像から高解像度写真を生成する」という特殊機能「ハイレゾショット」の実力をOM-5 Mark IIで試してみた
OMデジタルソリューションズのデジタルカメラには極短時間で複数枚の写真を撮影して合成することで高解像度な写真を作り出す「ハイレゾショット」という機能が備わっています。このハイレゾショットの性能がどれほどのものか気になったので、「OM-5 Mark II」で実際に試してみました。
·gigazine.net·
「微細な手ぶれを利用して12回撮影した画像から高解像度写真を生成する」という特殊機能「ハイレゾショット」の実力をOM-5 Mark IIで試してみた
ついにPhotoshop内でGoogle製画像生成AI「Nano Banana」とBlack Forest Labsの「FLUX.1 Kontext [pro]」が使用可能に
ついにPhotoshop内でGoogle製画像生成AI「Nano Banana」とBlack Forest Labsの「FLUX.1 Kontext [pro]」が使用可能に
定番画像編集アプリのPhotoshopには、画像生成AIを用いて新規画像を生成したり画像の不足部分を補ったりできるAI機能「生成塗りつぶし」が搭載されています。この生成塗りつぶしでGoogleの「Gemini 2.5 Flash Image(Nano Banana)」とBlack Forest Labsの「FLUX.1 Kontext [pro]」が利用可能になることが発表されました。
·gigazine.net·
ついにPhotoshop内でGoogle製画像生成AI「Nano Banana」とBlack Forest Labsの「FLUX.1 Kontext [pro]」が使用可能に
NVIDIAが音声から3Dアバターの顔アニメーションを生成する「Audio2Face」をオープンソース化、音声にぴったり合うリップシンクを実現
NVIDIAが音声から3Dアバターの顔アニメーションを生成する「Audio2Face」をオープンソース化、音声にぴったり合うリップシンクを実現
NVIDIAが、音声に基づいて3Dアバターのリアルな顔アニメーションを生成するAI搭載ツール「Audio2Face」をオープンソース化しました。これにより、開発者はAudio2Faceとその基盤となるフレームワークを利用して、ゲームやアプリ向けのリアルな3Dキャラクターを作成できるようになります。
·gigazine.net·
NVIDIAが音声から3Dアバターの顔アニメーションを生成する「Audio2Face」をオープンソース化、音声にぴったり合うリップシンクを実現
AIはまだ放射線科医に取って代わるものではない、人間の放射線科医の需要がかつてないほど高まることに
AIはまだ放射線科医に取って代わるものではない、人間の放射線科医の需要がかつてないほど高まることに
人間よりも高い精度で肺炎を検出できるAIが2017年から存在しているなどの実績がある放射線医学は、早くからAIに置き換わるのではないかと期待されていた分野でした。ところが、実際はまだ人間の力が必要とされているとして、医療系の慈善団体で働くディーナ・ムーサ氏が詳しく解説しています。
·gigazine.net·
AIはまだ放射線科医に取って代わるものではない、人間の放射線科医の需要がかつてないほど高まることに
Googleフォト10周年記念で画像編集機能が刷新されアルバム共有QRコード発行機能が追加、Googleフォト上の画像と動画の総数は9兆を超える
Googleフォト10周年記念で画像編集機能が刷新されアルバム共有QRコード発行機能が追加、Googleフォト上の画像と動画の総数は9兆を超える
Googleの写真管理サービス「Googleフォト」が2025年5月28日で登場から10周年を迎えました。10周年に合わせ複数の新機能も発表されています。
·gigazine.net·
Googleフォト10周年記念で画像編集機能が刷新されアルバム共有QRコード発行機能が追加、Googleフォト上の画像と動画の総数は9兆を超える
アットホームが洗濯物にモザイクかけるAI、膨大な物件画像から教師データ厳選
アットホームが洗濯物にモザイクかけるAI、膨大な物件画像から教師データ厳選
アットホームが「不適切画像検出・加工AI(洗濯物)」を発表した。物件の画像に写り込んだ洗濯物にモザイクをかけるものだ。実装の背景には、物件画像を扱う不動産業者の強いニーズがあった。
·xtech.nikkei.com·
アットホームが洗濯物にモザイクかけるAI、膨大な物件画像から教師データ厳選
顔写真から肌状態などAI診断→楽天市場のコスメ提案「ビューティアドバイザー」
顔写真から肌状態などAI診断→楽天市場のコスメ提案「ビューティアドバイザー」
楽天は、AIを活用してパーソナルカラー(似合う色)や肌の状態、顔の輪郭を診断し、ユーザーに適したコスメを「楽天市場」の商品から提案する「ビューティアドバイザー」の提供を始めた。
·itmedia.co.jp·
顔写真から肌状態などAI診断→楽天市場のコスメ提案「ビューティアドバイザー」
5000万画素センサー&4基のカメラを搭載したNothing Phone (3)で撮影した写真いろいろまとめ
5000万画素センサー&4基のカメラを搭載したNothing Phone (3)で撮影した写真いろいろまとめ
2025年8月28日に登場したNothing Phone (3)には背面に3つ、前面に1つのカメラが搭載されています。1/1.3インチ・5000万画素のセンサーを採用し、最大4K・60fpsの動画撮影に対応、さらに画像処理エンジン「TrueLens Engine 4」を搭載しているとのことで、Phone (3)でいろいろと撮影してどんな写真が撮れるのかを確かめてみました。
·gigazine.net·
5000万画素センサー&4基のカメラを搭載したNothing Phone (3)で撮影した写真いろいろまとめ
【ControlNetの次に来る技術】“見た目”を完全固定する最新AI「Wan 2.2 VACE」がヤバい。ポーズではなく“魂”をコピペする革命的仕組みとは?|ハカセ アイ (Ai-Hakase)🐱YouTube × 記事でトレンドAIを解説する為のnote🐾
【ControlNetの次に来る技術】“見た目”を完全固定する最新AI「Wan 2.2 VACE」がヤバい。ポーズではなく“魂”をコピペする革命的仕組みとは?|ハカセ アイ (Ai-Hakase)🐱YouTube × 記事でトレンドAIを解説する為のnote🐾
どうも皆さん! 葉加瀬あい(ハカセアイ) です! ということで今回ご紹介するのは、AIで動画を作る全てのクリエイターが、喉から手が出るほど欲しかったはずの… 「キャラクターを、完全に固定する」 ための、魔法のような最新AI技術、 `Wan 2.2 VACE` です!   「AIで動画を作ると、キャラクターの顔が途中で別人になっちゃう…」 「同じキャラで色々なシーンを作りたいけど、そのたびに何時間もかけてLoRA学習するのは、もう限界…」 そんな、AI動画制作における “最大”の悩み に、今日、 “最終的”な答え が出ます。 今回の記事を読めば… AI動画制作における 最大
·note.com·
【ControlNetの次に来る技術】“見た目”を完全固定する最新AI「Wan 2.2 VACE」がヤバい。ポーズではなく“魂”をコピペする革命的仕組みとは?|ハカセ アイ (Ai-Hakase)🐱YouTube × 記事でトレンドAIを解説する為のnote🐾
YouTubeショートへの動画生成AI「Veo 3 Fast」導入などクリエイターを支援する新機能が多数加わった「Made on YouTube 2025」発表内容まとめ
YouTubeショートへの動画生成AI「Veo 3 Fast」導入などクリエイターを支援する新機能が多数加わった「Made on YouTube 2025」発表内容まとめ
YouTubeが、YouTubeショートやYouTube Studioの改良など、「今後10年間を見据えた」という新機能やイノベーションを「Made on YouTube 2025」でまとめて発表しました。
·gigazine.net·
YouTubeショートへの動画生成AI「Veo 3 Fast」導入などクリエイターを支援する新機能が多数加わった「Made on YouTube 2025」発表内容まとめ
「こういう製品が欲しい!」と思って検索した内容からAIが自動で架空の製品を作り出してくれる「Anycrap」
「こういう製品が欲しい!」と思って検索した内容からAIが自動で架空の製品を作り出してくれる「Anycrap」
日常生活の中で「こんな製品があればもっと便利なのに」と思ったものの、あまりに奇抜すぎてどこにも存在していなかったという経験がある人もいるかもしれません。「こういう製品が欲しい!」という願望を生成AIを使ってかなえてくれるウェブサービスが「Anycrap」です。
·gigazine.net·
「こういう製品が欲しい!」と思って検索した内容からAIが自動で架空の製品を作り出してくれる「Anycrap」
人の「色の見え方」は脳のレベルで共通している可能性
人の「色の見え方」は脳のレベルで共通している可能性
「赤」や「青」といった色は人によって同じように見えているのか、という問いは人の認識に関する哲学や科学で古くから議論されています。ドイツの研究者らが2025年9月8日に発表した研究では、他人の脳活動から「何色を見ているのか」の分析を試みることで、人間が色を見たときの脳の反応パターンに共通性があるかどうか検証した結果が示されました。
·gigazine.net·
人の「色の見え方」は脳のレベルで共通している可能性
ByteDanceが画像生成AI「Seedream 4.0」をリリース、4K解像度の画像を生成可能&画像編集機能も備えてGoogleやOpenAIを一部テストで上回る
ByteDanceが画像生成AI「Seedream 4.0」をリリース、4K解像度の画像を生成可能&画像編集機能も備えてGoogleやOpenAIを一部テストで上回る
TikTok運営元のByteDanceが画像生成AI「Seedream 4.0」をリリースしました。Seedream 4.0は最大4Kの画像を生成可能で、単純な「テキストからの画像生成」だけでなくモデルの知識や推論を活用した画像生成にも対応しています。さらに、高品質な画像編集機能も備えており、各種ベンチマークではGoogleやOpenAIの製品を上回るスコアを記録しています。
·gigazine.net·
ByteDanceが画像生成AI「Seedream 4.0」をリリース、4K解像度の画像を生成可能&画像編集機能も備えてGoogleやOpenAIを一部テストで上回る
YouTubeが2年間の試験運用を経て複数言語音声機能を導入開始、動画の視聴時間の25%以上が主要言語以外の言語での視聴によるもの
YouTubeが2年間の試験運用を経て複数言語音声機能を導入開始、動画の視聴時間の25%以上が主要言語以外の言語での視聴によるもの
YouTubeは、動画に多言語の吹き替えを追加できる「複数言語音声機能」を数百万人のクリエイターに向けて正式に展開すると2025年9月10日に発表しました。
·gigazine.net·
YouTubeが2年間の試験運用を経て複数言語音声機能を導入開始、動画の視聴時間の25%以上が主要言語以外の言語での視聴によるもの
AI学習目的のスクレイピングに対して利用条件や利用料金を通知する仕組み「RSL」が開発される、すでにYahoo・Reddit・オライリーなどが採用を表明
AI学習目的のスクレイピングに対して利用条件や利用料金を通知する仕組み「RSL」が開発される、すでにYahoo・Reddit・オライリーなどが採用を表明
AIの開発には膨大なデータが必要であり、AI開発企業はインターネット上に存在するありとあらゆる情報を自動ボット(スクレイパー)を用いて収集しています。このスクレイパーに対して利用条件や利用料金を提示できる仕組み「Really Simple Licensing(RSL)」が開発されました。開発にはRSSの開発陣やO’Reilly Mediaの創業者であるティム・オライリー氏などが関わっており、すでにYahooやReddit、O’Reilly Media、Quora、Mediumなどのサービスが採用を表明しています。
·gigazine.net·
AI学習目的のスクレイピングに対して利用条件や利用料金を通知する仕組み「RSL」が開発される、すでにYahoo・Reddit・オライリーなどが採用を表明
Googleの画像生成AI「Nano-banana」をめちゃくちゃ活用できるプロンプトとサンプル画像実例まとめ
Googleの画像生成AI「Nano-banana」をめちゃくちゃ活用できるプロンプトとサンプル画像実例まとめ
Googleが2025年8月に公開した画像生成AI「Gemini 2.5 Flash Image(Nano Banana)」は、入力した画像の特徴を維持しながら編集することが得意で、無料ユーザーでも1日100枚まで画像を生成することが可能です。そんなNano Bananaで使えるプロンプトとその実例をまとめたGitHubのページが有志によって公開されていたので、いくつかピックアップしてみました。
·gigazine.net·
Googleの画像生成AI「Nano-banana」をめちゃくちゃ活用できるプロンプトとサンプル画像実例まとめ
【永久ライセンスセール中】簡単にAIで自動的に動画の高解像度化・フレーム補間・音声ノイズ除去ができる「Aiarty Video Enhancer」レビュー、古い動画も見違えるほどキレイに変換可能
【永久ライセンスセール中】簡単にAIで自動的に動画の高解像度化・フレーム補間・音声ノイズ除去ができる「Aiarty Video Enhancer」レビュー、古い動画も見違えるほどキレイに変換可能
古いスマートフォンやビデオカメラで撮影した映像は解像度が低く、フルハイビジョンや4Kなどの高解像度ディスプレイでそのまま再生すると、あまりにも画質が悪くなって視聴に耐えられないことがよくあります。「Aiarty Video Enhancer」はAI技術によって低解像度の動画を高解像度にアップコンバートできるソフトで、誰でも簡単に古い動画を高解像度化することが可能。なんと今回GIGAZINEとのコラボレーションでAiarty Video Enhancerの永久ライセンスが税込9780円で購入できるキャンペーンが開催されるので、Aiarty Video Enhancerがどんなソフトなのかを確かめるべく実際に使ってみました。
·gigazine.net·
【永久ライセンスセール中】簡単にAIで自動的に動画の高解像度化・フレーム補間・音声ノイズ除去ができる「Aiarty Video Enhancer」レビュー、古い動画も見違えるほどキレイに変換可能