画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2692 bookmarks
Custom sorting
iOSアプリで初めてテキスト画像認識で機密情報を読み取るマルウェアが発見される
iOSアプリで初めてテキスト画像認識で機密情報を読み取るマルウェアが発見される
セキュリティ企業のKasperskyが、AndroidアプリとiOSアプリでテキスト画像認識機能を持つマルウェアを発見したと報告しています。「SparkCat」と呼ばれるこのマルウェアはユーザーが撮影したスクリーンショットの内容を読み取る機能を持っており、特に仮想通貨ウォレットのリカバリーフレーズを狙っていたとのことです。
·gigazine.net·
iOSアプリで初めてテキスト画像認識で機密情報を読み取るマルウェアが発見される
Googleの画像編集AI「イマジネーション」に生成AIを利用したことを示す電子透かし「SynthID」を埋め込む仕組みが追加される
Googleの画像編集AI「イマジネーション」に生成AIを利用したことを示す電子透かし「SynthID」を埋め込む仕組みが追加される
Pixel 9シリーズには、生成AIを用いて画像の一部を別の物体に置き換える「イマジネーション」という機能が搭載されています。このイマジネーションで加工した画像に対して、生成AIを用いたことを示す電子透かし「SynthID」の埋め込みを開始することが発表されました。
·gigazine.net·
Googleの画像編集AI「イマジネーション」に生成AIを利用したことを示す電子透かし「SynthID」を埋め込む仕組みが追加される
初の「AIアート専門オークション」をクリスティーズが開催へ、ただし出品中止を求める公開書簡あり
初の「AIアート専門オークション」をクリスティーズが開催へ、ただし出品中止を求める公開書簡あり
オークションハウス大手のクリスティーズが「AIアート専門オークション」を開催することを発表しました。クリスティーズにはすでにAIアートを扱った実績がありますが、まるごとAI作品のみで行われるオークションは初となります。なお、オークションに出品予定のアーティストに対して、「著作権のある作品でトレーニングされたAIモデルが使われているのではないか」との懸念から、出品の中止を求める公開書簡が出されています。
·gigazine.net·
初の「AIアート専門オークション」をクリスティーズが開催へ、ただし出品中止を求める公開書簡あり
AIでディープフェイク動画を作られたスカーレット・ヨハンソンがAI規制を訴える
AIでディープフェイク動画を作られたスカーレット・ヨハンソンがAI規制を訴える
女優のスカーレット・ヨハンソン氏が、自身のAIディープフェイク動画がネット上で拡散されたことを受けて政府にAIを規制する法案の可決を最優先課題にするよう要請していることが報じられました。
·gigazine.net·
AIでディープフェイク動画を作られたスカーレット・ヨハンソンがAI規制を訴える
Adobeがウェブアプリ「Adobe Firefly」内で使えるAI動画生成サービス「Firefly Video Model」のパブリックベータ版を公開
Adobeがウェブアプリ「Adobe Firefly」内で使えるAI動画生成サービス「Firefly Video Model」のパブリックベータ版を公開
Adobeが2025年2月13日に、AI動画生成サービス「Firefly Video Model」のパブリックベータ版を公開しました。Firefly Video Modelでは画像またはテキストプロンプトを使って5秒間の動画を誰でも生成することが可能です。
·gigazine.net·
Adobeがウェブアプリ「Adobe Firefly」内で使えるAI動画生成サービス「Firefly Video Model」のパブリックベータ版を公開
Googleが複数画像をミックスして新しいイメージを生み出す画像生成AI「Whisk」を日本含む100カ国以上で利用可能に、モデル・背景・スタイルの3つを画像orテキストで入力するとImagen 3がフュージョンしてくれる
Googleが複数画像をミックスして新しいイメージを生み出す画像生成AI「Whisk」を日本含む100カ国以上で利用可能に、モデル・背景・スタイルの3つを画像orテキストで入力するとImagen 3がフュージョンしてくれる
Googleが複数の入力画像をベースに新しい画像を生成できる画像生成AIの「Whisk」を、日本を含む100カ国以上で利用可能にしています。Whiskは入力画像をGeminiでキャプションに変換し、これをGoogleの画像生成モデルであるImagen 3で画像に変換しているとのことで、実際にどんな画像が生成できるのか気になったので使って確かめてみました。
·gigazine.net·
Googleが複数画像をミックスして新しいイメージを生み出す画像生成AI「Whisk」を日本含む100カ国以上で利用可能に、モデル・背景・スタイルの3つを画像orテキストで入力するとImagen 3がフュージョンしてくれる
YouTubeショートにGoogle製動画生成AI「Veo 2」を用いた動画作成機能が追加される
YouTubeショートにGoogle製動画生成AI「Veo 2」を用いた動画作成機能が追加される
YouTubeショートのAIを用いた動画作成補助機能「Dream Screen」に、Google製動画生成AI「Veo 2」を用いて動画を作る機能が追加されました。ユーザーは動画投稿時にVeo 2を用いて動画や画像を生成し、動画内の1シーンとして使うことができます。
·gigazine.net·
YouTubeショートにGoogle製動画生成AI「Veo 2」を用いた動画作成機能が追加される
バーチャル空間に生きるデジタル生物がゼロから「目」を進化させる様子を観察する研究をMITが行っている
バーチャル空間に生きるデジタル生物がゼロから「目」を進化させる様子を観察する研究をMITが行っている
視覚は人間を含む多くの動物にとって重要な感覚であり、生息環境や生態に応じてさまざまなタイプの「目」が存在しています。そんな生物における目の進化を調べるため、マサチューセッツ工科大学(MIT)がバーチャル空間に生きるデジタル生物を用いて、目の進化を観察する研究を行っています。
·gigazine.net·
バーチャル空間に生きるデジタル生物がゼロから「目」を進化させる様子を観察する研究をMITが行っている
建物の輪郭をAIより正確に認識することで「私はロボットではありません」と証明するオープンソースの「MapTCHA」が登場
建物の輪郭をAIより正確に認識することで「私はロボットではありません」と証明するオープンソースの「MapTCHA」が登場
インターネット上にはボットやスパムが溢れているため、これらへの対策はオンラインプラットフォームにとって大きな課題です。ボット対策として知られるテクノロジーのひとつがCAPTCHAですが、実装にはいくつかの問題があります。そんな中、オープンライセンスの世界地図であるOpenStreetMapを改善するためのオープンソースのCAPTCHAとして、「MapTCHA」が登場しました。
·gigazine.net·
建物の輪郭をAIより正確に認識することで「私はロボットではありません」と証明するオープンソースの「MapTCHA」が登場
なぜ動画で紙吹雪や雪が舞うと画質が落ちるのか?
なぜ動画で紙吹雪や雪が舞うと画質が落ちるのか?
YouTubeの動画で紙吹雪や雪が舞うシーンがあると、途端に画質が落ちてしまうことがあります。これには映像データの圧縮と伸張が関与してくるわけですが、具体的にどうなっているのかについてYouTuberのトム・スコット氏が解説しています。
·gigazine.net·
なぜ動画で紙吹雪や雪が舞うと画質が落ちるのか?
ゲーム生成AIモデル「Muse」をMicrosoftが発表、ビジュアルやプレイヤーのコントローラー操作に基づいて新たなゲームを生成可能
ゲーム生成AIモデル「Muse」をMicrosoftが発表、ビジュアルやプレイヤーのコントローラー操作に基づいて新たなゲームを生成可能
Microsoftが2025年2月19日に、ゲームに特化した生成AIモデル「Muse」を発表しました。Museでは、ゲーム内の物理演算やプレイヤーのコントローラー操作に対するゲームの反応を含めて、3Dゲームの世界をAIが詳細に生成できるとのことです。
·gigazine.net·
ゲーム生成AIモデル「Muse」をMicrosoftが発表、ビジュアルやプレイヤーのコントローラー操作に基づいて新たなゲームを生成可能
現実世界の様子やUIを理解してタスクをこなせるマルチモーダルAIエージェントの基盤モデル「Magma」をMicrosoftが発表
現実世界の様子やUIを理解してタスクをこなせるマルチモーダルAIエージェントの基盤モデル「Magma」をMicrosoftが発表
Microsoftが2025年2月に、現実世界の様子やデバイス上のスクリーンを認識して行動できるマルチモーダルAIエージェントの基盤モデルである「Magma」を発表しました。
·gigazine.net·
現実世界の様子やUIを理解してタスクをこなせるマルチモーダルAIエージェントの基盤モデル「Magma」をMicrosoftが発表
見ているタブ内のページにある全画像をずらっと並べてまとめて一覧表示できるPC&Android用Firefoxアドオン「Image extract」
見ているタブ内のページにある全画像をずらっと並べてまとめて一覧表示できるPC&Android用Firefoxアドオン「Image extract」
「Image extract」は閲覧中のウェブページ内に存在する画像をズラリと一覧表示できるFirefoxアドオンです。PCだけでなくAndroid版Firefoxでも使用可能とのこと。便利そうだったので、実際に使ってみました。
·gigazine.net·
見ているタブ内のページにある全画像をずらっと並べてまとめて一覧表示できるPC&Android用Firefoxアドオン「Image extract」
シグマ製フルサイズミラーレスカメラ「Sigma BF」登場、超シンプルなボディに「230GBの内蔵ストレージ」「振動フィードバック式のボタン」などを詰め込んだユニークなカメラ
シグマ製フルサイズミラーレスカメラ「Sigma BF」登場、超シンプルなボディに「230GBの内蔵ストレージ」「振動フィードバック式のボタン」などを詰め込んだユニークなカメラ
シグマがミラーレスカメラ「Sigma BF」を2025年2月24日(月)に発表しました。Sigma BFはフルサイズセンサーを搭載したLマウントのカメラで、230GBものストレージを内蔵していたり感圧式のハプティックボタン(振動フィードバック式のボタン)を採用していたりと珍しい特徴が満載です。
·gigazine.net·
シグマ製フルサイズミラーレスカメラ「Sigma BF」登場、超シンプルなボディに「230GBの内蔵ストレージ」「振動フィードバック式のボタン」などを詰め込んだユニークなカメラ
AIで労働者を監視し奴隷のように搾取する動画がディストピアすぎて大炎上
AIで労働者を監視し奴隷のように搾取する動画がディストピアすぎて大炎上
ベンチャーキャピタルのY Combinatorが支援するスタートアップ「Optifye.ai」が「AIを使って工場労働者のパフォーマンスを監視するシステム」を開発しています。Y Combinatorがこのデモ映像をソーシャルメディアで公開したところ、大きな批判を受けたため、デモ映像を撤回しました。
·gigazine.net·
AIで労働者を監視し奴隷のように搾取する動画がディストピアすぎて大炎上
MetaがAIスマートグラス「Aria Gen 2」を発表、各種センサーで周囲の様子やユーザーの動きを測定してAI機能を使える
MetaがAIスマートグラス「Aria Gen 2」を発表、各種センサーで周囲の様子やユーザーの動きを測定してAI機能を使える
MetaがAIスマートグラス「Aria Gen 2」を発表しました。Aria Gen 2には周囲の様子やユーザーの動きを測定するセンサーが搭載されており、ユーザーは本体に搭載されたスピーカーから各種情報を受け取ることができます。
·gigazine.net·
MetaがAIスマートグラス「Aria Gen 2」を発表、各種センサーで周囲の様子やユーザーの動きを測定してAI機能を使える
ブラウザ上にマンガやイラストのページをアップロードするだけで簡単に翻訳できるAIサービス「TranslateManga」を使ってみた
ブラウザ上にマンガやイラストのページをアップロードするだけで簡単に翻訳できるAIサービス「TranslateManga」を使ってみた
マンガやイラストのページをアップロードすると、画像の形式を保ったままブラウザ上で他言語に翻訳してくれるAIサービス「TranslateManga」が登場したので、実際に使ってみました。
·gigazine.net·
ブラウザ上にマンガやイラストのページをアップロードするだけで簡単に翻訳できるAIサービス「TranslateManga」を使ってみた
手で物を見ることができるウェアラブルデバイスが開発される
手で物を見ることができるウェアラブルデバイスが開発される
カメラで捉えた物体を触覚に変換して装着者に伝えるウェアラブルデバイスが開発されました。視力の弱い人や盲目の人の日常生活をサポートするものとして期待されています。
·gigazine.net·
手で物を見ることができるウェアラブルデバイスが開発される
アメリカ著作権局が「創造的なプロセスの支援にAIを用いた場合は著作権で保護される」と宣言
アメリカ著作権局が「創造的なプロセスの支援にAIを用いた場合は著作権で保護される」と宣言
生成AIの技術が急速に発展する中で、アメリカ著作権局は2023年2月に「AIが作った芸術作品に著作権はない」「AIで作成したコミックの絵は著作権で保護されない」と宣言したほか、翌月にはAIが生成した絵や文章に著作権は認められるのかについてガイダンスを発表し、「AIで生成したものに著作権保護の基準を満たすような修正を加えている」ことが著作権の発生する条件として挙げました。2025年1月29日にアメリカ著作権局は約2年ぶりにAIに関する著作権に言及し、「単にプロンプトを入力して出力したものに著作性は認められないが、創作過程を支援するAIツールの使用は、作品の著作権を損なうものではない」と宣言しました。
·gigazine.net·
アメリカ著作権局が「創造的なプロセスの支援にAIを用いた場合は著作権で保護される」と宣言
AI自作レビュー、「USBケーブルの種類を見分けるAIモデル」をトレーニングしてAIカメラを作ってみた【Raspberry Pi AI Camera】
AI自作レビュー、「USBケーブルの種類を見分けるAIモデル」をトレーニングしてAIカメラを作ってみた【Raspberry Pi AI Camera】
2024年9月に登場した「Raspberry Pi AI Camera」は、カメラセンサー内にAI処理用のプロセッサを内蔵しており、カメラそのものにAIモデルを読み込ませてAIカメラとして使うことができます。ドキュメントも充実しており、比較的簡単にAIモデルを自作できそうだったので、実際に「USBケーブルの種類を見分けるAIモデル」をトレーニングして実行してみました。
·gigazine.net·
AI自作レビュー、「USBケーブルの種類を見分けるAIモデル」をトレーニングしてAIカメラを作ってみた【Raspberry Pi AI Camera】
【無料コード配布中】AIが写真の背景を完璧に透過してくれる「Aiarty Image Matting」でいろんな人物写真を透過しまくって実力を確かめてみた
【無料コード配布中】AIが写真の背景を完璧に透過してくれる「Aiarty Image Matting」でいろんな人物写真を透過しまくって実力を確かめてみた
写真から人物や製品などの被写体だけを切り抜き、背景をきれいに削除することができる背景透過ツールが「Aiarty Image Matting」です。AIが自動で被写体を検出し、背景を削除してくれるため、面倒な操作は一切なし。複数の画像を一括で処理することも可能ということで、実際に使っていろんな写真を背景透過しまくってみました。
·gigazine.net·
【無料コード配布中】AIが写真の背景を完璧に透過してくれる「Aiarty Image Matting」でいろんな人物写真を透過しまくって実力を確かめてみた
2024年にAI分野で何が起きていたのか振り返り、2023年に市場を席捲したGPT-4を上回るAIモデルが多数登場しコンテキストウィンドウの拡張やマルチモーダルモデルが一般化して価格も急落
2024年にAI分野で何が起きていたのか振り返り、2023年に市場を席捲したGPT-4を上回るAIモデルが多数登場しコンテキストウィンドウの拡張やマルチモーダルモデルが一般化して価格も急落
元Eventbriteのエンジニアリングディレクターであり、オープンソースツール・Datasetteの開発者でもあるサイモン・ウィリソン氏が、2024年に人工知能(AI)分野で起きた出来事をまとめています。
·gigazine.net·
2024年にAI分野で何が起きていたのか振り返り、2023年に市場を席捲したGPT-4を上回るAIモデルが多数登場しコンテキストウィンドウの拡張やマルチモーダルモデルが一般化して価格も急落
MetaがユーザーのAI画像を自動的に生成しInstagramのフィードに挿入する「Imagine Yourself」機能をテスト中
MetaがユーザーのAI画像を自動的に生成しInstagramのフィードに挿入する「Imagine Yourself」機能をテスト中
InstagramがユーザーのAI生成画像をランダムに表示する新機能のテストを開始したと海外メディアの404 Mediaが報じています。あるユーザーはInstagramを閲覧中に、自分自身が「無限の鏡の迷路」の中に立っているAI生成された画像のスライドショーが表示されたとのことです。
·gigazine.net·
MetaがユーザーのAI画像を自動的に生成しInstagramのフィードに挿入する「Imagine Yourself」機能をテスト中
AIツールで銃乱射事件の映像を変換した子ども向けアニメ動画が出回っている、SNSのモデレーションを回避する可能性大
AIツールで銃乱射事件の映像を変換した子ども向けアニメ動画が出回っている、SNSのモデレーションを回避する可能性大
AI技術を使って実在する暴力的な映像を子ども向けアニメーションに変換し、ソーシャルメディアに投稿する「Minion Gore(ミニオンゴア)」と呼ばれる現象が確認されています。投稿された動画群はアニメ映画「ミニオンズ」のキャラクターを無断で用いて暴力的な実写映像を加工したもので、プラットフォームの監視をすり抜けて拡散されている実態が報告されています。
·gigazine.net·
AIツールで銃乱射事件の映像を変換した子ども向けアニメ動画が出回っている、SNSのモデレーションを回避する可能性大
テキストから複数の図形で構成されたベクター画像を生成可能なAIツール「NeuralSVG」をMITの研究チームが発表
テキストから複数の図形で構成されたベクター画像を生成可能なAIツール「NeuralSVG」をMITの研究チームが発表
テキストのプロンプトに基づいて、複数の図形からなるベクター画像を生成するAIツール「NeuralSVG」を、テルアビブ大学とマサチューセッツ工科大学コンピュータ科学・人工知能研究所の研究チームが発表しました。
·gigazine.net·
テキストから複数の図形で構成されたベクター画像を生成可能なAIツール「NeuralSVG」をMITの研究チームが発表
AIチップ内蔵カメラ「Raspberry Pi AI Camera」レビュー、AI処理をカメラ側で実行するので母艦デバイスが非力でもOK
AIチップ内蔵カメラ「Raspberry Pi AI Camera」レビュー、AI処理をカメラ側で実行するので母艦デバイスが非力でもOK
「Raspberry Pi AI Camera」はソニーのインテリジェントビジョンセンサー「IMX500」を搭載したRaspberry Pi向けカメラモジュールです。IMX500はイメージセンサーとAIアクセラレーターを積層した構造で、母艦デバイスに負荷をかけることなくAI処理をカメラ側で実行可能。そんなRaspberry Pi AI CameraがGIGAZINE編集部に届いたので、実際にRaspberry Pi 5と接続して物体検知AIを実行してみました。
·gigazine.net·
AIチップ内蔵カメラ「Raspberry Pi AI Camera」レビュー、AI処理をカメラ側で実行するので母艦デバイスが非力でもOK