画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2692 bookmarks
Custom sorting
デジタル庁が生成AIガイドライン、機密情報も学習可能に
デジタル庁が生成AIガイドライン、機密情報も学習可能に
デジタル庁は2025年5月をめどに、中央官庁などの政府機関が生成AI(人工知能)を調達・利用する際に順守すべきガイドラインの運用を始める。これまでは慎重に扱っていた一定の機密性が求められる非公開情報も、リスクを適切に管理して学習に使うことを認める。これにより、専門性が高い行政事務を学習させたAIを構築することが可能になる。地方自治体を含め行政機関が米オープンAI(OpenAI)の「ChatGP
·nikkei.com·
デジタル庁が生成AIガイドライン、機密情報も学習可能に
PinterestがAIで生成または編集された画像を示す「AI修正」ラベルを展開、メタデータと独自のAI分類器で識別
PinterestがAIで生成または編集された画像を示す「AI修正」ラベルを展開、メタデータと独自のAI分類器で識別
Pinterestはウェブ上の画像や動画をコレクション化して共有できるソーシャルメディアで、さまざまなファッションや風景、料理のレシピ、インテリア、旅行先などのアイデアを得る場として人気を集めています。新たにPinterestが、AIで生成または編集された画像を示す「AI修正」ラベルを全世界で展開したと発表しました。
·gigazine.net·
PinterestがAIで生成または編集された画像を示す「AI修正」ラベルを展開、メタデータと独自のAI分類器で識別
ロイヤリティフリーで圧縮効率も改善した動画圧縮コーデック「AV1」がなかなか普及しないのは一体なぜなのか?
ロイヤリティフリーで圧縮効率も改善した動画圧縮コーデック「AV1」がなかなか普及しないのは一体なぜなのか?
「AV1」はNetflix、YouTube、Googleなどの大手テック企業が推進する動画圧縮コーデックで、従来のHEVC(H.265)やVP9と比べて約30%の効率向上が期待され、ロイヤリティフリーであることから注目を集めました。しかし、記事作成時点だとAV1は業界全体に広く普及しているとはいえず、その理由をテクノロジー系ニュースサイトのThe Vergeが解説しています。
·gigazine.net·
ロイヤリティフリーで圧縮効率も改善した動画圧縮コーデック「AV1」がなかなか普及しないのは一体なぜなのか?
画像を拡大・縮小するアルゴリズム「バイリニア補間」は一体何をしているのか?
画像を拡大・縮小するアルゴリズム「バイリニア補間」は一体何をしているのか?
画像の拡大・縮小を行う時、そのままシンプルに処理を行うと画質が荒くなってしまいます。そこで、画像を滑らかにして比較的キレイな画質を保ったまま拡大・縮小を行うためにはアルゴリズムが必要となります。そんなアルゴリズムの1つである「バイリニア補間」はいったいどういうものなのかについて、NVIDIA Researchでグラフィックス関連のソフトウェアエンジニアとして働くバート・ロンスキー氏が解説しています。
·gigazine.net·
画像を拡大・縮小するアルゴリズム「バイリニア補間」は一体何をしているのか?
1億画素超えのスナップカメラとして使える富士フイルムのレンズ一体型デジカメ「GFX100RF」実写レビュー、大量の作例付きでどんな写真を撮影できるのか分かる
1億画素超えのスナップカメラとして使える富士フイルムのレンズ一体型デジカメ「GFX100RF」実写レビュー、大量の作例付きでどんな写真を撮影できるのか分かる
富士フイルムが2025年4月10日に発売したデジタルカメラ「GFX100RF」は、フルサイズセンサーよりも大きいラージフォーマットセンサーを搭載しており、約1億2000万画素の写真を撮影可能です。そんなGFX100RFを借りられたので、実際に屋外に持ち出していろいろ撮影してみました。
·gigazine.net·
1億画素超えのスナップカメラとして使える富士フイルムのレンズ一体型デジカメ「GFX100RF」実写レビュー、大量の作例付きでどんな写真を撮影できるのか分かる
AMDプロセッサ向けに最適化された画像生成AIと動画生成AIを含むAIアート作成ツール「Amuse 3.0」がリリースされる、ローカルで画像&動画を生成可能
AMDプロセッサ向けに最適化された画像生成AIと動画生成AIを含むAIアート作成ツール「Amuse 3.0」がリリースされる、ローカルで画像&動画を生成可能
AMDとAI開発企業「TensorStack.AI」が共同開発したAIアート作成ツール「Amuse 3.0」のベータ版がリリースされました。Amuse 3.0には画像生成AIの「Stable Diffusion 3.5」や「FLUX.1」、動画生成AIも含まれており、AMD製プロセッサを搭載したPCでローカル動作します。
·gigazine.net·
AMDプロセッサ向けに最適化された画像生成AIと動画生成AIを含むAIアート作成ツール「Amuse 3.0」がリリースされる、ローカルで画像&動画を生成可能
MetaがVR/AR部門「Reality Labs」のOculus Studios従業員数十名をレイオフ、ハードウェア事業の従業員も人員整理の対象か
MetaがVR/AR部門「Reality Labs」のOculus Studios従業員数十名をレイオフ、ハードウェア事業の従業員も人員整理の対象か
Metaが、VR/AR部門であるReality LabsのOculus Studiosに含まれる一部スタジオの従業員数十名をレイオフしたと報じられました。Metaの広報担当者は「いくつかのチームで、チーム規模に影響を与える構造と役割の変更が行われている」と認めています。
·gigazine.net·
MetaがVR/AR部門「Reality Labs」のOculus Studios従業員数十名をレイオフ、ハードウェア事業の従業員も人員整理の対象か
Adobeの画像生成AI「Firefly Image Model 4」がリリース&動画生成AI「Firefly Video Model」の正式版も登場&Adobe製品でOpenAIなど他社の生成AIも利用可能に
Adobeの画像生成AI「Firefly Image Model 4」がリリース&動画生成AI「Firefly Video Model」の正式版も登場&Adobe製品でOpenAIなど他社の生成AIも利用可能に
画像やエフェクトを生成できるAdobeのAI「Firefly」がモデルをアップグレードし、多数の新機能を導入しました。このほか、モバイル版Fireflyなど新しい製品もリリースされています。
·gigazine.net·
Adobeの画像生成AI「Firefly Image Model 4」がリリース&動画生成AI「Firefly Video Model」の正式版も登場&Adobe製品でOpenAIなど他社の生成AIも利用可能に
とにかく見た目がカッコイイ「Sigma BF」はどんな写真を撮影できるカメラなのか?実際に外に持ち出していろいろ撮影してみた作例まとめ
とにかく見た目がカッコイイ「Sigma BF」はどんな写真を撮影できるカメラなのか?実際に外に持ち出していろいろ撮影してみた作例まとめ
シグマがフルサイズセンサーを搭載したミラーレスカメラ「Sigma BF」を2025年4月24日(木)に発売しました。Sigma BFは金属の塊っぽさ全開の独特な外観を特徴とするカメラで、メモリーカードスロットを搭載せず230GBの内蔵ストレージを搭載していたり、ボタンの数が極端に少なかったりと面白いスペックを備えています。そんなSigma BFを外に持ち出していろいろ撮影してみました。
·gigazine.net·
とにかく見た目がカッコイイ「Sigma BF」はどんな写真を撮影できるカメラなのか?実際に外に持ち出していろいろ撮影してみた作例まとめ
アカデミー賞が「生成AIが映画に使われているかどうかはプラスにもマイナスにもならない」と公式のガイドラインに明記
アカデミー賞が「生成AIが映画に使われているかどうかはプラスにもマイナスにもならない」と公式のガイドラインに明記
アカデミー賞の選考・授与を行う映画芸術科学アカデミーは2025年4月22日に、新たな条項を付け加えた映画の応募資格ガイドラインを発表しました。付け加えられたルールには生成AIについての言及があり、初めて生成AIについて規則で明文化された形になりました。
·gigazine.net·
アカデミー賞が「生成AIが映画に使われているかどうかはプラスにもマイナスにもならない」と公式のガイドラインに明記
GPT-4oやo1より高性能な推論モデル「Qwen3」をAlibabaが発表、フラグシップモデルの「Qwen3-235B-A22B」はパラメーター数2350億&アクティブパラメーター数220億
GPT-4oやo1より高性能な推論モデル「Qwen3」をAlibabaが発表、フラグシップモデルの「Qwen3-235B-A22B」はパラメーター数2350億&アクティブパラメーター数220億
中国のAlibabaが開発する大規模言語モデル(LLM)ファミリーのQwenに、「Qwen3」が登場しました。Qwen3には2つの混合エキスパート(MoE)モデルと、6つのDenseモデルが含まれており、パラメーターサイズは6億から2350億までと非常に幅広いです。
·gigazine.net·
GPT-4oやo1より高性能な推論モデル「Qwen3」をAlibabaが発表、フラグシップモデルの「Qwen3-235B-A22B」はパラメーター数2350億&アクティブパラメーター数220億
AdobeがAIで動画を最大2秒延長する「生成延長」機能をPremiere Pro向けにリリース、4K品質でバックグラウンドオーディオ付きでクリップを最大2秒延長可能
AdobeがAIで動画を最大2秒延長する「生成延長」機能をPremiere Pro向けにリリース、4K品質でバックグラウンドオーディオ付きでクリップを最大2秒延長可能
Adobeが、動画編集ソフトのPremiere Proと映像制作ソフトのAfter Effectsのバージョン25.2を正式リリースしたと2025年4月2日に発表しました。バージョン25.2のアップデートでは、生成AIによる素材の延長が可能になったり、自動でタグ付けされた素材の管理、字幕の自動翻訳など、AIを活用した新機能が目玉となっています。
·gigazine.net·
AdobeがAIで動画を最大2秒延長する「生成延長」機能をPremiere Pro向けにリリース、4K品質でバックグラウンドオーディオ付きでクリップを最大2秒延長可能
ハッセルブラッドのカメラを搭載した折りたたみスマホ「Find N5」で写真や動画を撮影しまくってみたよレビュー
ハッセルブラッドのカメラを搭載した折りたたみスマホ「Find N5」で写真や動画を撮影しまくってみたよレビュー
OPPOが2025年2月に発売した折りたたみ式スマートフォン「Find N5」には名門カメラメーカー「ハッセルブラッド」の名を冠した3眼カメラが搭載されています。どんな写真や映像を撮影できるのか確かめるべく、実際に外に持ち出してみました。
·gigazine.net·
ハッセルブラッドのカメラを搭載した折りたたみスマホ「Find N5」で写真や動画を撮影しまくってみたよレビュー
OpenAIが話題の画像生成機能・4o Image Generationに「ウォーターマーク(透かし)」を導入するテストを実施中
OpenAIが話題の画像生成機能・4o Image Generationに「ウォーターマーク(透かし)」を導入するテストを実施中
2025年3月26日にOpenAIは、ChatGPTで利用可能な画像生成機能として「4o Image Generation」を実装しました。新たに、OpenAIが4o Image Generationで生成された画像にウォーターマーク(透かし)を入れるテストを行っていることが報じられています。
·gigazine.net·
OpenAIが話題の画像生成機能・4o Image Generationに「ウォーターマーク(透かし)」を導入するテストを実施中
画像生成AI「Midjourney V7」のアルファテストが始まる、音声での指示に従って画像を爆速で生成可能なドラフトモードも搭載
画像生成AI「Midjourney V7」のアルファテストが始まる、音声での指示に従って画像を爆速で生成可能なドラフトモードも搭載
画像生成AI「Midjourney」のバージョン7(Midjourney V7)のアルファテストが2025年4月4日に始まりました。Midjourney V7は前バージョンと比べて手や体などの描画品質が向上しているほか、音声での指示に高速応答できる「ドラフトモード」も搭載されています。
·gigazine.net·
画像生成AI「Midjourney V7」のアルファテストが始まる、音声での指示に従って画像を爆速で生成可能なドラフトモードも搭載
Metaが次世代マルチモーダルAI「Llama 4」をリリース、MoEアーキテクチャ採用で競合モデルに匹敵する高性能を誇る
Metaが次世代マルチモーダルAI「Llama 4」をリリース、MoEアーキテクチャ採用で競合モデルに匹敵する高性能を誇る
Metaが次世代AIモデル「Llama 4」シリーズを正式に発表しました。Llama 4シリーズは、性能や規模、応用範囲の異なる複数のモデルで構成されており、前世代から大幅な性能向上を実現し、競合する他社のAIモデルに比肩する性能を持っているとのこと。最大の特徴は、「Mixture of Experts(MoE)」と呼ばれる効率的なモデルアーキテクチャと、新しく開発された事前学習方法にあります。
·gigazine.net·
Metaが次世代マルチモーダルAI「Llama 4」をリリース、MoEアーキテクチャ採用で競合モデルに匹敵する高性能を誇る
Google レンズで「カメラに写るものをAIで分析して深く掘り下げた情報を調べる機能」が一部ユーザーで利用可能に
Google レンズで「カメラに写るものをAIで分析して深く掘り下げた情報を調べる機能」が一部ユーザーで利用可能に
GoogleはGoogle One AIプレミアムプランの加入者に向けて、高度な推論や思考、マルチモーダル機能を備えたAI検索機能「AIモード」を提供しています。新たにAIモードの一環として、「カメラに写ったものをAIで分析して深く掘り下げた情報を調べられるマルチモーダル機能」が、Google レンズに追加されました。
·gigazine.net·
Google レンズで「カメラに写るものをAIで分析して深く掘り下げた情報を調べる機能」が一部ユーザーで利用可能に
「RAW画像のファイル形式が各社でバラバラな理由」をキヤノンやソニーなどに質問した結果は?
「RAW画像のファイル形式が各社でバラバラな理由」をキヤノンやソニーなどに質問した結果は?
キヤノンやニコン、ソニー、パナソニックなど、カメラメーカーが異なるとRAW画像のファイル形式も違うものになります。なぜ独自のファイル形式を採用しているのかについて各カメラメーカーに質問した結果を、海外メディアのThe Vergeが公開しています。
·gigazine.net·
「RAW画像のファイル形式が各社でバラバラな理由」をキヤノンやソニーなどに質問した結果は?
YouTubeがAI生成画像も検出できるような肖像権管理技術のテスト対象を拡大へ、「NO FAKES法」支持も表明
YouTubeがAI生成画像も検出できるような肖像権管理技術のテスト対象を拡大へ、「NO FAKES法」支持も表明
YouTubeがクリエイターのコミュニティを守るために開発した、肖像権管理のためのAIツールを一部YouTuberを対象にしてテスト中で、さらに拡大予定であることがわかりました。また、YouTubeが「NO FAKES法」を支持し、支援していくことも明らかになっています。
·gigazine.net·
YouTubeがAI生成画像も検出できるような肖像権管理技術のテスト対象を拡大へ、「NO FAKES法」支持も表明
OpenAIが「自社史上最も高度な推論モデル」と評価する「o3」と「o4-mini」を発表、テキストと同様に画像も使って考える「Thinking with images」が可能
OpenAIが「自社史上最も高度な推論モデル」と評価する「o3」と「o4-mini」を発表、テキストと同様に画像も使って考える「Thinking with images」が可能
OpenAIが新しいAI推論モデルとなる「o3」「o4-mini」のリリースを発表しました。OpenAIは特にo3を「OpenAIで史上最も高度な推論モデル」と称し、数学やコーディング、推論、科学、視覚理解能力を測定するベンチマークで従来モデルを上回る性能を発揮したとアピールしています。
·gigazine.net·
OpenAIが「自社史上最も高度な推論モデル」と評価する「o3」と「o4-mini」を発表、テキストと同様に画像も使って考える「Thinking with images」が可能
Raspberry PiとLiDARセンサーで360度3Dパノラマスキャナーを自作するオープンソースプロジェクト「PiLiDAR」
Raspberry PiとLiDARセンサーで360度3Dパノラマスキャナーを自作するオープンソースプロジェクト「PiLiDAR」
「PiLiDAR」は、シングルボードコンピューターのRaspberry PiとLiDARセンサーを活用した自作360度3Dパノラマスキャナーを開発するオープンソースプロジェクトで、比較的低コストで誰でも構築可能なポータブル3Dスキャンシステムを構築できます。
·gigazine.net·
Raspberry PiとLiDARセンサーで360度3Dパノラマスキャナーを自作するオープンソースプロジェクト「PiLiDAR」
GoogleのAIモデル「Gemini 2.0 Flash」の画像生成機能で画像からウォーターマーク(透かし)を削除できると話題に
GoogleのAIモデル「Gemini 2.0 Flash」の画像生成機能で画像からウォーターマーク(透かし)を削除できると話題に
2025年2月に一般公開されたGoogleのAIモデルである「Gemini 2.0 Flash」には、3月12日に画像生成機能が開発者向けに試験導入されました。この機能を使い、フォトストックサービスが配信する画像からウォーターマーク(透かし)を削除できることが明らかになっており、問題視されています。
·gigazine.net·
GoogleのAIモデル「Gemini 2.0 Flash」の画像生成機能で画像からウォーターマーク(透かし)を削除できると話題に
Robloxが3Dオブジェクトを自動生成するAIモデル「Cube 3D」をオープンソースで公開
Robloxが3Dオブジェクトを自動生成するAIモデル「Cube 3D」をオープンソースで公開
ユーザーがゲームを作成したり、他人の作成したゲームを遊んだりすることができるオンラインゲーミングプラットフォームの「Roblox」が、テキストプロンプトを用いて3Dオブジェクトを生成できるAIモデル「Cube 3D」をオープンソースで公開しました。
·gigazine.net·
Robloxが3Dオブジェクトを自動生成するAIモデル「Cube 3D」をオープンソースで公開
AI生成の粗雑な動画がInstagramやTikTokのアルゴリズムをハックする「インターネットへのブルートフォース攻撃」が起きているという指摘
AI生成の粗雑な動画がInstagramやTikTokのアルゴリズムをハックする「インターネットへのブルートフォース攻撃」が起きているという指摘
近年は生成AIの発達により、インターネット上でAI生成の画像や動画を投稿してインプレッションを稼ぎ、広告収益を得ようとするスパムアカウントが急増しています。海外メディア・404 Mediaの記者であるジェイソン・ケブラー氏が、スパマーが大量のAI生成動画を投稿してInstagramやTikTokのアルゴリズムをハックし、「インターネットへのブルートフォース攻撃」を仕掛けていると指摘しました。
·gigazine.net·
AI生成の粗雑な動画がInstagramやTikTokのアルゴリズムをハックする「インターネットへのブルートフォース攻撃」が起きているという指摘
「AIが生成した芸術作品は著作権で保護できない」とアメリカの控訴裁判所が判断
「AIが生成した芸術作品は著作権で保護できない」とアメリカの控訴裁判所が判断
2025年3月18日に、アメリカの連邦控訴裁判所がAIが生成した芸術作品に対する著作権保護を求める裁判を棄却しました。裁判所は「人間の入力なしにAIによって生成された芸術作品は、アメリカの著作権法では保護できない」と判断しています。
·gigazine.net·
「AIが生成した芸術作品は著作権で保護できない」とアメリカの控訴裁判所が判断
ついに「GIMP 3.0」がリリースされる、編集内容を後から変更できる「非破壊フィルター」やGTK 3への対応など新機能盛りだくさんで新たな公式ロゴも登場
ついに「GIMP 3.0」がリリースされる、編集内容を後から変更できる「非破壊フィルター」やGTK 3への対応など新機能盛りだくさんで新たな公式ロゴも登場
2025年3月16日(日)にオープンソースの画像編集アプリ「GIMP」のバージョン3.0がリリースされました。GIMP 2.10のリリースから実に7年ぶりのメジャーバージョンアップで、GTK 3への対応や非破壊フィルターの実装など複数の大きな変更が加わっています。
·gigazine.net·
ついに「GIMP 3.0」がリリースされる、編集内容を後から変更できる「非破壊フィルター」やGTK 3への対応など新機能盛りだくさんで新たな公式ロゴも登場
2D画像を入力するだけで遠近感のある没入型3D動画を生成できる動画生成AI「Stable Virtual Camera」をStability AIが発表
2D画像を入力するだけで遠近感のある没入型3D動画を生成できる動画生成AI「Stable Virtual Camera」をStability AIが発表
Stable Diffusionなどの生成AIを開発するStability AIが、2D画像をリアルな奥行きと遠近感を備えた没入型3D動画に変換できる動画生成AIの「Stable Virtual Camera」を発表しました。
·gigazine.net·
2D画像を入力するだけで遠近感のある没入型3D動画を生成できる動画生成AI「Stable Virtual Camera」をStability AIが発表