画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2722 bookmarks

Custom sorting

デジタル庁が生成AIガイドライン、機密情報も学習可能に

デジタル庁は2025年5月をめどに、中央官庁などの政府機関が生成AI（人工知能）を調達・利用する際に順守すべきガイドラインの運用を始める。これまでは慎重に扱っていた一定の機密性が求められる非公開情報も、リスクを適切に管理して学習に使うことを認める。これにより、専門性が高い行政事務を学習させたAIを構築することが可能になる。地方自治体を含め行政機関が米オープンAI（OpenAI）の「ChatGP

·nikkei.com·May 4, 2025

デジタル庁が生成AIガイドライン、機密情報も学習可能に

PinterestがAIで生成または編集された画像を示す「AI修正」ラベルを展開、メタデータと独自のAI分類器で識別

Pinterestはウェブ上の画像や動画をコレクション化して共有できるソーシャルメディアで、さまざまなファッションや風景、料理のレシピ、インテリア、旅行先などのアイデアを得る場として人気を集めています。新たにPinterestが、AIで生成または編集された画像を示す「AI修正」ラベルを全世界で展開したと発表しました。

·gigazine.net·May 2, 2025

PinterestがAIで生成または編集された画像を示す「AI修正」ラベルを展開、メタデータと独自のAI分類器で識別

ロイヤリティフリーで圧縮効率も改善した動画圧縮コーデック「AV1」がなかなか普及しないのは一体なぜなのか？

「AV1」はNetflix、YouTube、Googleなどの大手テック企業が推進する動画圧縮コーデックで、従来のHEVC(H.265)やVP9と比べて約30％の効率向上が期待され、ロイヤリティフリーであることから注目を集めました。しかし、記事作成時点だとAV1は業界全体に広く普及しているとはいえず、その理由をテクノロジー系ニュースサイトのThe Vergeが解説しています。

·gigazine.net·Apr 30, 2025

ロイヤリティフリーで圧縮効率も改善した動画圧縮コーデック「AV1」がなかなか普及しないのは一体なぜなのか？

画像を拡大・縮小するアルゴリズム「バイリニア補間」は一体何をしているのか？

画像の拡大・縮小を行う時、そのままシンプルに処理を行うと画質が荒くなってしまいます。そこで、画像を滑らかにして比較的キレイな画質を保ったまま拡大・縮小を行うためにはアルゴリズムが必要となります。そんなアルゴリズムの1つである「バイリニア補間」はいったいどういうものなのかについて、NVIDIA Researchでグラフィックス関連のソフトウェアエンジニアとして働くバート・ロンスキー氏が解説しています。

·gigazine.net·Apr 30, 2025

画像を拡大・縮小するアルゴリズム「バイリニア補間」は一体何をしているのか？

1億画素超えのスナップカメラとして使える富士フイルムのレンズ一体型デジカメ「GFX100RF」実写レビュー、大量の作例付きでどんな写真を撮影できるのか分かる

富士フイルムが2025年4月10日に発売したデジタルカメラ「GFX100RF」は、フルサイズセンサーよりも大きいラージフォーマットセンサーを搭載しており、約1億2000万画素の写真を撮影可能です。そんなGFX100RFを借りられたので、実際に屋外に持ち出していろいろ撮影してみました。

·gigazine.net·Apr 30, 2025

動画の編集から透かしなしの出力まで無料でこなせるアプリ「Edits」をMetaがリリース

動画作成から公開までに必要な作業をこなせるクリエイター向けアプリ「Edits」を、Metaがリリースしました。

·gigazine.net·Apr 30, 2025

動画の編集から透かしなしの出力まで無料でこなせるアプリ「Edits」をMetaがリリース

AMDプロセッサ向けに最適化された画像生成AIと動画生成AIを含むAIアート作成ツール「Amuse 3.0」がリリースされる、ローカルで画像＆動画を生成可能

AMDとAI開発企業「TensorStack.AI」が共同開発したAIアート作成ツール「Amuse 3.0」のベータ版がリリースされました。Amuse 3.0には画像生成AIの「Stable Diffusion 3.5」や「FLUX.1」、動画生成AIも含まれており、AMD製プロセッサを搭載したPCでローカル動作します。

·gigazine.net·Apr 30, 2025

AMDプロセッサ向けに最適化された画像生成AIと動画生成AIを含むAIアート作成ツール「Amuse 3.0」がリリースされる、ローカルで画像＆動画を生成可能

MetaがVR／AR部門「Reality Labs」のOculus Studios従業員数十名をレイオフ、ハードウェア事業の従業員も人員整理の対象か

Metaが、VR／AR部門であるReality LabsのOculus Studiosに含まれる一部スタジオの従業員数十名をレイオフしたと報じられました。Metaの広報担当者は「いくつかのチームで、チーム規模に影響を与える構造と役割の変更が行われている」と認めています。

·gigazine.net·Apr 30, 2025

MetaがVR／AR部門「Reality Labs」のOculus Studios従業員数十名をレイオフ、ハードウェア事業の従業員も人員整理の対象か

Adobeの画像生成AI「Firefly Image Model 4」がリリース＆動画生成AI「Firefly Video Model」の正式版も登場＆Adobe製品でOpenAIなど他社の生成AIも利用可能に

画像やエフェクトを生成できるAdobeのAI「Firefly」がモデルをアップグレードし、多数の新機能を導入しました。このほか、モバイル版Fireflyなど新しい製品もリリースされています。

·gigazine.net·Apr 30, 2025

Adobeの画像生成AI「Firefly Image Model 4」がリリース＆動画生成AI「Firefly Video Model」の正式版も登場＆Adobe製品でOpenAIなど他社の生成AIも利用可能に

とにかく見た目がカッコイイ「Sigma BF」はどんな写真を撮影できるカメラなのか？実際に外に持ち出していろいろ撮影してみた作例まとめ

シグマがフルサイズセンサーを搭載したミラーレスカメラ「Sigma BF」を2025年4月24日(木)に発売しました。Sigma BFは金属の塊っぽさ全開の独特な外観を特徴とするカメラで、メモリーカードスロットを搭載せず230GBの内蔵ストレージを搭載していたり、ボタンの数が極端に少なかったりと面白いスペックを備えています。そんなSigma BFを外に持ち出していろいろ撮影してみました。

·gigazine.net·Apr 30, 2025

とにかく見た目がカッコイイ「Sigma BF」はどんな写真を撮影できるカメラなのか？実際に外に持ち出していろいろ撮影してみた作例まとめ

MetaのAI「Llama」を国際宇宙ステーションでの研究用に改造した「Space Llama」が軌道上へ配備される

Metaが、同社のオープンソースAIモデル「Llama」を国際宇宙ステーション用に微調整して宇宙に送り込んだことを明らかにしました。

·gigazine.net·Apr 30, 2025

MetaのAI「Llama」を国際宇宙ステーションでの研究用に改造した「Space Llama」が軌道上へ配備される

アカデミー賞が「生成AIが映画に使われているかどうかはプラスにもマイナスにもならない」と公式のガイドラインに明記

アカデミー賞の選考・授与を行う映画芸術科学アカデミーは2025年4月22日に、新たな条項を付け加えた映画の応募資格ガイドラインを発表しました。付け加えられたルールには生成AIについての言及があり、初めて生成AIについて規則で明文化された形になりました。

·gigazine.net·Apr 30, 2025

アカデミー賞が「生成AIが映画に使われているかどうかはプラスにもマイナスにもならない」と公式のガイドラインに明記

GPT-4oやo1より高性能な推論モデル「Qwen3」をAlibabaが発表、フラグシップモデルの「Qwen3-235B-A22B」はパラメーター数2350億＆アクティブパラメーター数220億

中国のAlibabaが開発する大規模言語モデル(LLM)ファミリーのQwenに、「Qwen3」が登場しました。Qwen3には2つの混合エキスパート(MoE)モデルと、6つのDenseモデルが含まれており、パラメーターサイズは6億から2350億までと非常に幅広いです。

·gigazine.net·Apr 30, 2025

AdobeがAIで動画を最大2秒延長する「生成延長」機能をPremiere Pro向けにリリース、4K品質でバックグラウンドオーディオ付きでクリップを最大2秒延長可能

Adobeが、動画編集ソフトのPremiere Proと映像制作ソフトのAfter Effectsのバージョン25.2を正式リリースしたと2025年4月2日に発表しました。バージョン25.2のアップデートでは、生成AIによる素材の延長が可能になったり、自動でタグ付けされた素材の管理、字幕の自動翻訳など、AIを活用した新機能が目玉となっています。

·gigazine.net·Apr 4, 2025

ハッセルブラッドのカメラを搭載した折りたたみスマホ「Find N5」で写真や動画を撮影しまくってみたよレビュー

OPPOが2025年2月に発売した折りたたみ式スマートフォン「Find N5」には名門カメラメーカー「ハッセルブラッド」の名を冠した3眼カメラが搭載されています。どんな写真や映像を撮影できるのか確かめるべく、実際に外に持ち出してみました。

·gigazine.net·Apr 21, 2025

ハッセルブラッドのカメラを搭載した折りたたみスマホ「Find N5」で写真や動画を撮影しまくってみたよレビュー

OpenAIが話題の画像生成機能・4o Image Generationに「ウォーターマーク(透かし)」を導入するテストを実施中

2025年3月26日にOpenAIは、ChatGPTで利用可能な画像生成機能として「4o Image Generation」を実装しました。新たに、OpenAIが4o Image Generationで生成された画像にウォーターマーク(透かし)を入れるテストを行っていることが報じられています。

·gigazine.net·Apr 21, 2025

OpenAIが話題の画像生成機能・4o Image Generationに「ウォーターマーク(透かし)」を導入するテストを実施中

画像生成AI「Midjourney V7」のアルファテストが始まる、音声での指示に従って画像を爆速で生成可能なドラフトモードも搭載

画像生成AI「Midjourney」のバージョン7(Midjourney V7)のアルファテストが2025年4月4日に始まりました。Midjourney V7は前バージョンと比べて手や体などの描画品質が向上しているほか、音声での指示に高速応答できる「ドラフトモード」も搭載されています。

·gigazine.net·Apr 21, 2025

画像生成AI「Midjourney V7」のアルファテストが始まる、音声での指示に従って画像を爆速で生成可能なドラフトモードも搭載

Metaが次世代マルチモーダルAI「Llama 4」をリリース、MoEアーキテクチャ採用で競合モデルに匹敵する高性能を誇る

Metaが次世代AIモデル「Llama 4」シリーズを正式に発表しました。Llama 4シリーズは、性能や規模、応用範囲の異なる複数のモデルで構成されており、前世代から大幅な性能向上を実現し、競合する他社のAIモデルに比肩する性能を持っているとのこと。最大の特徴は、「Mixture of Experts(MoE)」と呼ばれる効率的なモデルアーキテクチャと、新しく開発された事前学習方法にあります。

·gigazine.net·Apr 21, 2025

Metaが次世代マルチモーダルAI「Llama 4」をリリース、MoEアーキテクチャ採用で競合モデルに匹敵する高性能を誇る

Google レンズで「カメラに写るものをAIで分析して深く掘り下げた情報を調べる機能」が一部ユーザーで利用可能に

GoogleはGoogle One AIプレミアムプランの加入者に向けて、高度な推論や思考、マルチモーダル機能を備えたAI検索機能「AIモード」を提供しています。新たにAIモードの一環として、「カメラに写ったものをAIで分析して深く掘り下げた情報を調べられるマルチモーダル機能」が、Google レンズに追加されました。

·gigazine.net·Apr 21, 2025

Google レンズで「カメラに写るものをAIで分析して深く掘り下げた情報を調べる機能」が一部ユーザーで利用可能に

「RAW画像のファイル形式が各社でバラバラな理由」をキヤノンやソニーなどに質問した結果は？

キヤノンやニコン、ソニー、パナソニックなど、カメラメーカーが異なるとRAW画像のファイル形式も違うものになります。なぜ独自のファイル形式を採用しているのかについて各カメラメーカーに質問した結果を、海外メディアのThe Vergeが公開しています。

·gigazine.net·Apr 21, 2025

「RAW画像のファイル形式が各社でバラバラな理由」をキヤノンやソニーなどに質問した結果は？

YouTubeがAI生成画像も検出できるような肖像権管理技術のテスト対象を拡大へ、「NO FAKES法」支持も表明

YouTubeがクリエイターのコミュニティを守るために開発した、肖像権管理のためのAIツールを一部YouTuberを対象にしてテスト中で、さらに拡大予定であることがわかりました。また、YouTubeが「NO FAKES法」を支持し、支援していくことも明らかになっています。

·gigazine.net·Apr 21, 2025

YouTubeがAI生成画像も検出できるような肖像権管理技術のテスト対象を拡大へ、「NO FAKES法」支持も表明

GoogleのAIアシスタント「Gemini」で動画生成が可能に

Google製AIアシスタント「Gemini」の有料プランで動画生成AI「Veo 2」を用いた動画生成が可能になりました。

·gigazine.net·Apr 21, 2025

GoogleのAIアシスタント「Gemini」で動画生成が可能に

OpenAIが「自社史上最も高度な推論モデル」と評価する「o3」と「o4-mini」を発表、テキストと同様に画像も使って考える「Thinking with images」が可能

OpenAIが新しいAI推論モデルとなる「o3」「o4-mini」のリリースを発表しました。OpenAIは特にo3を「OpenAIで史上最も高度な推論モデル」と称し、数学やコーディング、推論、科学、視覚理解能力を測定するベンチマークで従来モデルを上回る性能を発揮したとアピールしています。

·gigazine.net·Apr 21, 2025

OpenAIが「自社史上最も高度な推論モデル」と評価する「o3」と「o4-mini」を発表、テキストと同様に画像も使って考える「Thinking with images」が可能

Raspberry PiとLiDARセンサーで360度3Dパノラマスキャナーを自作するオープンソースプロジェクト「PiLiDAR」

「PiLiDAR」は、シングルボードコンピューターのRaspberry PiとLiDARセンサーを活用した自作360度3Dパノラマスキャナーを開発するオープンソースプロジェクトで、比較的低コストで誰でも構築可能なポータブル3Dスキャンシステムを構築できます。

·gigazine.net·Apr 21, 2025

Raspberry PiとLiDARセンサーで360度3Dパノラマスキャナーを自作するオープンソースプロジェクト「PiLiDAR」

GoogleのAIモデル「Gemini 2.0 Flash」の画像生成機能で画像からウォーターマーク(透かし)を削除できると話題に

2025年2月に一般公開されたGoogleのAIモデルである「Gemini 2.0 Flash」には、3月12日に画像生成機能が開発者向けに試験導入されました。この機能を使い、フォトストックサービスが配信する画像からウォーターマーク(透かし)を削除できることが明らかになっており、問題視されています。

·gigazine.net·Apr 4, 2025

GoogleのAIモデル「Gemini 2.0 Flash」の画像生成機能で画像からウォーターマーク(透かし)を削除できると話題に

Robloxが3Dオブジェクトを自動生成するAIモデル「Cube 3D」をオープンソースで公開

ユーザーがゲームを作成したり、他人の作成したゲームを遊んだりすることができるオンラインゲーミングプラットフォームの「Roblox」が、テキストプロンプトを用いて3Dオブジェクトを生成できるAIモデル「Cube 3D」をオープンソースで公開しました。

·gigazine.net·Apr 4, 2025

Robloxが3Dオブジェクトを自動生成するAIモデル「Cube 3D」をオープンソースで公開

AI生成の粗雑な動画がInstagramやTikTokのアルゴリズムをハックする「インターネットへのブルートフォース攻撃」が起きているという指摘

近年は生成AIの発達により、インターネット上でAI生成の画像や動画を投稿してインプレッションを稼ぎ、広告収益を得ようとするスパムアカウントが急増しています。海外メディア・404 Mediaの記者であるジェイソン・ケブラー氏が、スパマーが大量のAI生成動画を投稿してInstagramやTikTokのアルゴリズムをハックし、「インターネットへのブルートフォース攻撃」を仕掛けていると指摘しました。

·gigazine.net·Apr 4, 2025

AI生成の粗雑な動画がInstagramやTikTokのアルゴリズムをハックする「インターネットへのブルートフォース攻撃」が起きているという指摘