画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2708 bookmarks
Custom sorting
適切なライセンスを受けた素材でのみトレーニングされた動画生成AI「Marey」とは?
適切なライセンスを受けた素材でのみトレーニングされた動画生成AI「Marey」とは?
生成AIによるコンテンツは、SNSや作品投稿サイトで見ない日がほとんどないほどあふれていますが、著作権の問題や従来のクリエイターの機会を奪う可能性など、商業作品に取り入れるには依然として多くの問題を抱えています。映画監督のブリン・ムーザー氏が立ち上げた製作会社「Asteria」は適切にライセンスされた素材のみで学習された「倫理的な生成AI」である「Marey」を構築しており、その特徴とそれでも存在している問題についてムーザー氏が語っています。
·gigazine.net·
適切なライセンスを受けた素材でのみトレーニングされた動画生成AI「Marey」とは?
観葉植物界隈がAI生成画像による詐欺に注意喚起
観葉植物界隈がAI生成画像による詐欺に注意喚起
AIによる画像生成は功罪相半ばするものですが、観葉植物界隈では、存在しない植物の画像を用いて愛好家を呼び込む詐欺が発生していると注意喚起が行われています。
·gigazine.net·
観葉植物界隈がAI生成画像による詐欺に注意喚起
中国の監視カメラメーカーHikvisionに対してカナダ政府が国内での事業停止を命令、国家安全保障上の懸念から
中国の監視カメラメーカーHikvisionに対してカナダ政府が国内での事業停止を命令、国家安全保障上の懸念から
監視カメラをはじめとしたセキュリティ機器を扱う中国・杭州のHikvision Digital Technologyに対して、カナダのメラニー・ジョリー産業大臣は「国家安全保障上の懸念がある」として、カナダ国内での事業を停止するよう命じたことを明らかにしました。
·gigazine.net·
中国の監視カメラメーカーHikvisionに対してカナダ政府が国内での事業停止を命令、国家安全保障上の懸念から
VRAM容量の少ない安めのグラボでも画像生成AI「FLUX.1 Kontext [dev]」を動かせる省メモリ高速版をNVIDIAが開発、VRAM使用量を24GBから7GBまで削減し2.1倍高速動作
VRAM容量の少ない安めのグラボでも画像生成AI「FLUX.1 Kontext [dev]」を動かせる省メモリ高速版をNVIDIAが開発、VRAM使用量を24GBから7GBまで削減し2.1倍高速動作
「FLUX.1 Kontext [dev]」は自然言語で画像を編集可能な画像生成AIモデルで、2025年6月26日にリリースされました。このFLUX.1 Kontext [dev]にはNVIDIAと共同開発したNVIDIA製GPU最適化版が存在しており、基本モデルと比べてVRAM使用量を大幅に削減しつつ処理を高速化することに成功しています。
·gigazine.net·
VRAM容量の少ない安めのグラボでも画像生成AI「FLUX.1 Kontext [dev]」を動かせる省メモリ高速版をNVIDIAが開発、VRAM使用量を24GBから7GBまで削減し2.1倍高速動作
AIベンチマーク「自転車に乗ったペリカンを描く」をLLama 3.3 70BやGPT 4.1にやってもらうとこうなる
AIベンチマーク「自転車に乗ったペリカンを描く」をLLama 3.3 70BやGPT 4.1にやってもらうとこうなる
AIの性能を測るベンチマークはいろいろとありますが、その中でちょっと変わったものがエンジニアのサイモン・ウィリソン氏考案による「自転車に乗ったペリカンを描かせる」というもの。2025年6月に開催されたAIエンジニアワールドフェアの基調講演で、ウィリソン氏が最新の「自転車に乗ったペリカン」を報告しています。
·gigazine.net·
AIベンチマーク「自転車に乗ったペリカンを描く」をLLama 3.3 70BやGPT 4.1にやってもらうとこうなる
まるで本当に目の前に相手がいるかのように感じられる超リアルなGoogleの3Dビデオ会議技術を採用した「HP Dimension with Google Beam」が登場、65インチのライトフィールドディスプレイ搭載で価格は約360万円
まるで本当に目の前に相手がいるかのように感じられる超リアルなGoogleの3Dビデオ会議技術を採用した「HP Dimension with Google Beam」が登場、65インチのライトフィールドディスプレイ搭載で価格は約360万円
現地時間の2025年6月11日、HPがバーチャルコラボレーションを次のレベルに引き上げるためのAI搭載の超絶リアルな3D動画コミュニケーションツールとして「HP Dimension with Google Beam」を発表しました。ヘッドセットやメガネ、ウェアラブル機器を必要とせず、実際に対面しているかのような没入感を実現することが可能な65インチディスプレイを搭載しています。
·gigazine.net·
まるで本当に目の前に相手がいるかのように感じられる超リアルなGoogleの3Dビデオ会議技術を採用した「HP Dimension with Google Beam」が登場、65インチのライトフィールドディスプレイ搭載で価格は約360万円
ディズニーとユニバーサルが画像生成AIのMidjourneyを「盗作の底なし沼」と痛烈に批判して訴える
ディズニーとユニバーサルが画像生成AIのMidjourneyを「盗作の底なし沼」と痛烈に批判して訴える
2025年6月11日(水)、ディズニーとユニバーサルが著作権で保護されているはずの人気キャラクターたちを勝手に利用しているとして、画像生成AIのMidjourneyを提訴しました。ディズニーおよびユニバーサルはMidjourneyを「盗作の底なし沼」と痛烈に批判しています。
·gigazine.net·
ディズニーとユニバーサルが画像生成AIのMidjourneyを「盗作の底なし沼」と痛烈に批判して訴える
MetaがMeta AI&Editsアプリに生成AIによる動画編集機能を追加、期間限定無料でユーザーは50以上のプリセットプロンプトを使用して最大10秒の動画を編集可能に
MetaがMeta AI&Editsアプリに生成AIによる動画編集機能を追加、期間限定無料でユーザーは50以上のプリセットプロンプトを使用して最大10秒の動画を編集可能に
MetaがMeta AIのアプリとウェブ版、そして動画編集アプリのEditsで生成AIを用いた動画編集機能をリリースすると発表しました。
·gigazine.net·
MetaがMeta AI&Editsアプリに生成AIによる動画編集機能を追加、期間限定無料でユーザーは50以上のプリセットプロンプトを使用して最大10秒の動画を編集可能に
AmazonがAI広告動画の自動生成機能を提供開始、商品が現実世界で使用される様子を描写する無料AIツール
AmazonがAI広告動画の自動生成機能を提供開始、商品が現実世界で使用される様子を描写する無料AIツール
Amazonの広告管理ツール「Amazon Ads」に実装されていた動画生成ツール「Video Generator」の機能が強化され、正式提供が始まりました。広告主は1枚の商品画像からさまざまなAI動画を生成することができます。
·gigazine.net·
AmazonがAI広告動画の自動生成機能を提供開始、商品が現実世界で使用される様子を描写する無料AIツール
画像生成AI「Stable Diffusion 3.5 Large」の18GBを超えるVRAM使用量を40%も削減して11GBにする新技術をNVIDIAが公開
画像生成AI「Stable Diffusion 3.5 Large」の18GBを超えるVRAM使用量を40%も削減して11GBにする新技術をNVIDIAが公開
生成AIのパフォーマンスは日々向上していますが、より優れたAIを動かすためには、より多くのVRAM(ビデオランダムアクセスメモリ)が必要になります。例えば画像生成AIのStable Diffusion 3.5のうち、80億のパラメータを持つ最も強力な「Large」を実行する場合、基本モデルは18GBのVRAMを使用します。このVRAM使用量を削減して、より効率的なパフォーマンスで実行できる技術をNVIDIAが公開しました。
·gigazine.net·
画像生成AI「Stable Diffusion 3.5 Large」の18GBを超えるVRAM使用量を40%も削減して11GBにする新技術をNVIDIAが公開
NBAファイナルで放送されたAI生成広告の制作費は約29万円で従来の動画広告から95%のコスト削減を実現
NBAファイナルで放送されたAI生成広告の制作費は約29万円で従来の動画広告から95%のコスト削減を実現
現地時間の2025年6月11日に開催されたNBAファイナルの第3戦で、AIを用いて生成された動画広告が流れました。NBAファイナルの視聴者に大きなインパクトを与えたこの動画ですが、制作費はわずか2000ドル(約28万8000円)と従来の動画広告と比べて95%もコスト削減を実現しており、制作時間もたったの2日であることが明らかになっています。
·gigazine.net·
NBAファイナルで放送されたAI生成広告の制作費は約29万円で従来の動画広告から95%のコスト削減を実現
Adobeが画像生成AI「Firefly」のAndroid・iOS用アプリを公開、Googleの画像生成AI「Imagen」・動画生成AI「Veo」・OpenAIの画像生成AIも利用可能
Adobeが画像生成AI「Firefly」のAndroid・iOS用アプリを公開、Googleの画像生成AI「Imagen」・動画生成AI「Veo」・OpenAIの画像生成AIも利用可能
Adobeの生成AI「Firefly」が、AndroidおよびiOS向けのモバイルアプリとしてリリースされました。テキストからの画像や動画の生成、Adobe Photoshopにも搭載されている生成塗りつぶし機能や生成拡張機能が使用可能で、Adobe Fireflyのモバイルアプリで生成されたものはすべてユーザーのCreative Cloudアカウントに自動的に同期されるため、ウェブやAdobeのデスクトップアプリでの作業が簡単になります。
·gigazine.net·
Adobeが画像生成AI「Firefly」のAndroid・iOS用アプリを公開、Googleの画像生成AI「Imagen」・動画生成AI「Veo」・OpenAIの画像生成AIも利用可能
Midjourneyが初の動画生成AIモデル「V1」を発表、1枚の画像から最大21秒の動画生成が可能
Midjourneyが初の動画生成AIモデル「V1」を発表、1枚の画像から最大21秒の動画生成が可能
画像生成AIを開発するMidjourneyが、Discord経由で利用できる動画生成AIモデル「V1」をリリースしたと発表しました。V1はアップロードした画像、あるいはMidjourneyの他のモデルで生成された画像を使用するだけで、その画像に基づいて5秒間の動画4本を生成することが可能です。
·gigazine.net·
Midjourneyが初の動画生成AIモデル「V1」を発表、1枚の画像から最大21秒の動画生成が可能
GoogleはYouTubeにアップロードされた動画をAIのトレーニングに使用しているがクリエイターはあまり把握していないことが判明
GoogleはYouTubeにアップロードされた動画をAIのトレーニングに使用しているがクリエイターはあまり把握していないことが判明
Googleは、チャットAIのGeminiや最大4Kまでの解像度の動画を作成できる動画生成モデルの「Veo 3」を展開するにあたり、YouTubeにアップロードされた膨大なライブラリをトレーニングに活用していますが、その事実をクリエイターの多くはあまり認識していないことが明らかになりました。YouTubeは動画クリエイターの権利を保護する姿勢を表明していますが、一部の専門家は投稿動画をAIのトレーニングに使うことは知的財産の危機につながる可能性があると指摘しています。
·gigazine.net·
GoogleはYouTubeにアップロードされた動画をAIのトレーニングに使用しているがクリエイターはあまり把握していないことが判明
AdobeがPixelカメラの元開発者によるiPhone用カメラアプリ「Project Indigo」をリリース、計算写真技術とAIを駆使して高ダイナミックレンジと低ノイズを両立し「一眼レフ」並に自然な写真を追求
AdobeがPixelカメラの元開発者によるiPhone用カメラアプリ「Project Indigo」をリリース、計算写真技術とAIを駆使して高ダイナミックレンジと低ノイズを両立し「一眼レフ」並に自然な写真を追求
AdobeがiPhone向けのカメラアプリ「Project Indigo」を発表しました。このアプリの開発者の1人であるマーク・ルヴォイ氏は、Google Pixelの純正カメラに搭載されているコンピューティショナルフォトグラフィー技術の開発に携わった人物として知られています。
·gigazine.net·
AdobeがPixelカメラの元開発者によるiPhone用カメラアプリ「Project Indigo」をリリース、計算写真技術とAIを駆使して高ダイナミックレンジと低ノイズを両立し「一眼レフ」並に自然な写真を追求
「16歳未満SNS利用禁止」のための顔スキャン年齢確認がうまくいっていない
「16歳未満SNS利用禁止」のための顔スキャン年齢確認がうまくいっていない
世界初の「16歳未満のSNS利用を禁止する法律」が成立したオーストラリアでは、未成年にSNSを使わせないための年齢確認ツールの試験運用が進められていますが、実際のところ年齢確認があまりうまくできていない実態が明らかになりました。ティーンエイジャーを37歳だと認識した事例が報告されているほか、業者が過度に個人情報を収集しようとするケースも見つかっているとのことです。
·gigazine.net·
「16歳未満SNS利用禁止」のための顔スキャン年齢確認がうまくいっていない
防水で3K動画が撮影可能なアスリート向けスマートグラス「Oakley Meta HSTN」をMetaが発表
防水で3K動画が撮影可能なアスリート向けスマートグラス「Oakley Meta HSTN」をMetaが発表
Metaがサングラスブランド「Oakley(オークリー)」とコラボしたスマートグラス「Oakley Meta HSTN」を発表しました。アスリートやファンに向けた製品だとのことで、IPX4の防水性能を備えています。
·gigazine.net·
防水で3K動画が撮影可能なアスリート向けスマートグラス「Oakley Meta HSTN」をMetaが発表
ついにAndroid版Photoshopのベータ版が登場、無料でAIによる画像生成やレイヤー編集を利用可能
ついにAndroid版Photoshopのベータ版が登場、無料でAIによる画像生成やレイヤー編集を利用可能
2025年6月3日(火)に、Adobeが画像編集アプリ「Photoshop」のAndroid版をリリースしました。記事作成時点ではべータ版の扱いで、無料でレイヤーを用いた画像編集機能やAIによる画像生成機能を利用できます。すでに日本でもダウンロード可能だったので実際に使ってみました。
·gigazine.net·
ついにAndroid版Photoshopのベータ版が登場、無料でAIによる画像生成やレイヤー編集を利用可能
無料で超絶リアルな3DCGキャラを作成&動かせるゲーム開発ツール「MetaHuman」の一部がUnreal Engine 5.6に統合
無料で超絶リアルな3DCGキャラを作成&動かせるゲーム開発ツール「MetaHuman」の一部がUnreal Engine 5.6に統合
Epic Gamesが開発するリアルで感情表現豊かなデジタルヒューマン(MetaHuman)を作成・アニメートできるフレームワークが「MetaHuman」です。そんなMetaHumanが早期アクセスを終了し、より幅広いユーザーの間で利用可能となりました。また、MetaHumanを作成するツールであるMetaHuman Creatorが、Unreal Enginに完全に統合されています。
·gigazine.net·
無料で超絶リアルな3DCGキャラを作成&動かせるゲーム開発ツール「MetaHuman」の一部がUnreal Engine 5.6に統合
AI生成動画に「心臓の鼓動」が反映されるようになりディープフェイクの検出が一層困難に
AI生成動画に「心臓の鼓動」が反映されるようになりディープフェイクの検出が一層困難に
Googleが人の声も付けられる動画生成AI「Veo 3」を発表するなど動画に関連するAI技術は日々進歩しており、人の目ではもはやAI製と見抜けられないほど精度の高い動画が出回り始めています。研究者らはAI製の動画を検出するために、動画に映った人物の「心臓の鼓動」を手がかりにしようとしましたが、AI製の動画にも心臓の鼓動が反映されていることがわかったそうです。
·gigazine.net·
AI生成動画に「心臓の鼓動」が反映されるようになりディープフェイクの検出が一層困難に
MetaがAIスマートグラス「Aria Gen 2」の詳細を発表、カメラやセンサーの最先端技術を説明
MetaがAIスマートグラス「Aria Gen 2」の詳細を発表、カメラやセンサーの最先端技術を説明
機械知覚、コンテクスチュアルAI、ロボティクスの分野における最先端の研究を推進することを目的としたMetaのスマートグラス「Aria Gen 2」について、Metaが詳細なスペックを自社ブログで発表しました。
·gigazine.net·
MetaがAIスマートグラス「Aria Gen 2」の詳細を発表、カメラやセンサーの最先端技術を説明
HonorがGoogleのVeo 2搭載のAI動画ジェネレーターを発表、5月22日発売のHonor 400シリーズで利用可能に
HonorがGoogleのVeo 2搭載のAI動画ジェネレーターを発表、5月22日発売のHonor 400シリーズで利用可能に
中国のスマートフォンメーカーであるHonorが、Googleの「Veo 2」モデルを搭載した画像から動画を生成するAIジェネレーターを発表しました。このAIジェネレーターは2025年5月22日に発売予定の「Honor 400」および「Honor 400 Pro」で先行提供されます。
·gigazine.net·
HonorがGoogleのVeo 2搭載のAI動画ジェネレーターを発表、5月22日発売のHonor 400シリーズで利用可能に
「AI企業がトレーニングに使った著作物の公開を義務づける修正案」をイギリス貴族院が可決、無断使用OKとの政府方針を拒否
「AI企業がトレーニングに使った著作物の公開を義務づける修正案」をイギリス貴族院が可決、無断使用OKとの政府方針を拒否
AI開発企業が著作権で保護されたコンテンツをAIモデルのトレーニングに使っていることが問題視される中、イギリス政府は「権利保有者がオプトアウト(拒否の姿勢を明示)しない限り、企業が無許可でコンテンツをAIモデルのトレーニングに利用することを認める」ことを提案しています。この提案に対しては企業やアーティストから反対の声が上がっており、イギリス議会の上院に相当する貴族院も、政府の提案に反対するデータ法案の修正案を可決しました。
·gigazine.net·
「AI企業がトレーニングに使った著作物の公開を義務づける修正案」をイギリス貴族院が可決、無断使用OKとの政府方針を拒否
写真を見て西暦何年の写真なのかを当てる「Which Year」
写真を見て西暦何年の写真なのかを当てる「Which Year」
1枚の写真を見て、写真の具合やそこに映っているものから写真が撮影された西暦を推測するクイズ「Which Year」は、毎日更新される問題に無料で挑戦してスコアを試すことができます。
·gigazine.net·
写真を見て西暦何年の写真なのかを当てる「Which Year」
無料で使える高性能動画編集ソフトの「VideoProc Converter AI」でAI動画高画質化・AIフレーム補間・AI手ぶれ補正機能を使ってみたレビュー
無料で使える高性能動画編集ソフトの「VideoProc Converter AI」でAI動画高画質化・AIフレーム補間・AI手ぶれ補正機能を使ってみたレビュー
動画編集やDVDリッピンングができる高性能動画編集ソフト「VideoProc Converter AI」で、AIを用いた動画の高画質化やフレーム補間、手ぶれ補正が可能になったということで、実際に使ってみました。
·gigazine.net·
無料で使える高性能動画編集ソフトの「VideoProc Converter AI」でAI動画高画質化・AIフレーム補間・AI手ぶれ補正機能を使ってみたレビュー
Googleが動画生成AI「Veo 3」を発表、4K出力可能で音声も同時に生成できる
Googleが動画生成AI「Veo 3」を発表、4K出力可能で音声も同時に生成できる
Googleが動画生成モデルの「Veo 3」を発表しました。最大4Kまでの解像度の動画を作成できる過去モデル「Veo 2」の品質を向上させただけでなく、Googleの動画生成AIとして初めて「音声付き」の動画生成が実現しています。
·gigazine.net·
Googleが動画生成AI「Veo 3」を発表、4K出力可能で音声も同時に生成できる
GoogleがAIで映画を作れるツール「Flow」を発表、画像生成AI「Imagen」や動画生成AI「Veo」を統合しシーン生成からカット編集まで実行可能
GoogleがAIで映画を作れるツール「Flow」を発表、画像生成AI「Imagen」や動画生成AI「Veo」を統合しシーン生成からカット編集まで実行可能
GoogleがAIを活用した映画制作ツール「Flow」を日本時間の2025年5月21日に発表しました。Flowには動画生成AIの「Veo 3」や画像生成AIの「Imagen 4」が統合されており、各シーンの生成からカット編集までの一連の流れを1つのアプリで実行できます。
·gigazine.net·
GoogleがAIで映画を作れるツール「Flow」を発表、画像生成AI「Imagen」や動画生成AI「Veo」を統合しシーン生成からカット編集まで実行可能