画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2862 bookmarks

Custom sorting

「ペンタゴン近くで爆発」というフェイク画像がTwitter認証済みアカウントに拡散され株式市場が混乱

アメリカ国防総省庁舎(ペンタゴン)付近で爆発が起きたとの一部報道を受け、アメリカ株式市場でダウ工業株30種平均が約80ポイント下落するなど市況が混乱しました。後にこの報道は誤りだったことが分かりました。

·gigazine.net·May 23, 2023

「ペンタゴン近くで爆発」というフェイク画像がTwitter認証済みアカウントに拡散され株式市場が混乱

画像生成AI「Stable Diffusion」をGetty Imagesが著作権侵害で提訴、これで2回目の法的手続き

大手フォトストックサービスのGetty Imagesが2023年2月3日に、画像生成AI「Stable Diffusion」を手がけるAI企業のStability AIに対する訴訟をアメリカの裁判所に提起しました。Getty ImagesがStability AIを相手に法的手続きに踏み切ったのは、2023年1月にイギリスで訴訟前通告書を発行したのに続き今回で2回目です。

·gigazine.net·May 23, 2023

画像生成AI「Stable Diffusion」をGetty Imagesが著作権侵害で提訴、これで2回目の法的手続き

画像生成AIやChatGPTなどのジェネレーティブAIはゲーム開発のあり方を大きく変えつつある

ジェネレーティブAIは画像や文章を人間よりも素早く生成できるため、ジェネレーティブAIを運用することで作業を大幅に効率化することが可能です。このAIによる効率化はゲーム開発の現場でも取り入れられていると、The New York Timesが報じています。

·gigazine.net·May 23, 2023

画像生成AIやChatGPTなどのジェネレーティブAIはゲーム開発のあり方を大きく変えつつある

GoogleのAIが黒人を「ゴリラ」と分類した事件から8年が経過してもGoogle・Apple・Amazon・MicrosoftのAIはゴリラのラベル付けを避けている

2015年、Googleの写真アプリであるGoogleフォトが黒人の写真を「ゴリラ」とラベル付けしてしまう事件が発生し、「AIが持つバイアス」の論争が巻き起こりました。この事件から8年が経過した記事作成時点ではAIテクノロジーが格段に進歩していますが、いまだにGoogle・Apple・Amazon・Microsoftなどの画像認識AIは「ゴリラ」とラベル付けするのを避けていると、アメリカの日刊紙ニューヨーク・タイムズが報じています。

·gigazine.net·May 23, 2023

GoogleのAIが黒人を「ゴリラ」と分類した事件から8年が経過してもGoogle・Apple・Amazon・MicrosoftのAIはゴリラのラベル付けを避けている

ついにPhotoshopへ驚異的AI機能「ジェネレーティブ塗りつぶし」追加へ、「画像の続きを生成する機能」「被写体を生成して画像内に追加」などができベータ版で利用OK

Adobeが画像編集アプリ「Photoshop」にジェネレーティブAI「Firefly」を統合し、AI機能「ジェネレーティブ塗りつぶし」を追加することを発表しました。「ジェネレーティブ塗りつぶし」では「画像の続きを生成」「画像の一部をAIで生成した画像に置き換え」といった操作を実現可能です。

·gigazine.net·May 23, 2023

イラストや実写画像を「拡大してもぼやけないSVG画像」に変換できるAIツール「Vectorizer.AI」を使ってみた

イラストや実写画像を大きく拡大すると輪郭がぼやけてしまいます。無料のウェブアプリ「Vectorizer.AI」を使えばイラストや実写画像を無限に拡大可能なSVG形式に変換できるとのことなので、実際に使ってみました。

·gigazine.net·May 13, 2023

イラストや実写画像を「拡大してもぼやけないSVG画像」に変換できるAIツール「Vectorizer.AI」を使ってみた

画像生成AI「Stale Diffusion」開発元がテキストからアニメーションを自動生成できる開発者向けAIツール「Stable Animation SDK」をリリース

画像生成AI「Stale Diffusion」を開発するStability AIが、Stable Diffusionをベースとしてテキストからアニメーションを生成できる開発者向けツール「Stable Animation SDK」をリリースしました。

·gigazine.net·May 12, 2023

画像生成AI「Stale Diffusion」開発元がテキストからアニメーションを自動生成できる開発者向けAIツール「Stable Animation SDK」をリリース

裁判に提出された証拠映像に対して「これはディープフェイクだ」と反論する人々が登場することを専門家が懸念

近年はAIの発達により、簡単に実在の人物が登場するディープフェイクの動画や音声を作成できるようになりました。そんな中、電気自動車メーカー・テスラの弁護団がテスラ車の死亡事故に関する裁判で、「原告が提出した音声はディープフェイクの可能性がある」と主張する事態が発生。裁判の証拠品に対して「これはディープフェイクだ」と反論されることについて、専門家が懸念を表明しています。

·gigazine.net·May 11, 2023

裁判に提出された証拠映像に対して「これはディープフェイクだ」と反論する人々が登場することを専門家が懸念

文字・画像と映像・音・3D深度・熱・動作を統合して現実世界を理解できるAI「ImageBind」をMetaがオープンソースで公開

人が外界を認識する時、「人通りの多い通りを見ながら、車のエンジン音を聞く」というように、視覚・聴覚・触覚・嗅覚・味覚という複数の感覚を同時に使います。MetaのAI開発部門であるMeta AIが、「テキスト」「画像と映像」「音声」「動きを計算する深度(3D)」「赤外線による熱」「慣性測定ユニット(IMU)による動き」という6つのデータを統合するオープンソースのAIモデル「ImageBind」を発表しました。

·gigazine.net·May 11, 2023

文字・画像と映像・音・3D深度・熱・動作を統合して現実世界を理解できるAI「ImageBind」をMetaがオープンソースで公開

プロンプトを入力すると画像内のオブジェクトを異なるシーンに移し替える「Edit Anything」レビュー

「教会にいるネコ」の画像を「オフィスにいるネコ」の画像に変えるといった感じに、画像に写ったオブジェクトの姿形を残したままに周囲の風景だけを別のシーンに差し替えることができる画像編集サービス「Edit Anything」が公開されていたので、実際に試してみました。

·gigazine.net·May 11, 2023

プロンプトを入力すると画像内のオブジェクトを異なるシーンに移し替える「Edit Anything」レビュー

Googleがムービーの自動吹替＆リップシンクAIを開発中、声色を変えずに吹替可能で高性能すぎて悪用注意とのこと

2023年5月11日(木)に開催された「Google I/O 2023」の基調講演で、ムービーの吹替音声を自動生成しつつ口の動きも変化させられるAI技術「Universal Translator」が発表されました。

·gigazine.net·May 11, 2023

Googleがムービーの自動吹替＆リップシンクAIを開発中、声色を変えずに吹替可能で高性能すぎて悪用注意とのこと

「被写体のフレーム外部分を追加」「天気を晴れに変更」などAIによる強力写真編集機能「Magic Editor」の作例をGoogleが公開

Googleフォトには、写真に写り込んだ不要なものを削除する「消しゴムマジック(Magic Eraser)」や、撮影時に入ったボケやぶれを取り除いて鮮明な写真にしてくれる「ボケ補整(Photo Unblur)」といった機能がありますが、新たに、AIによって写真を再構築し、簡単に編集できる「Magic Editor」が搭載されることになりました。

·gigazine.net·May 11, 2023

「被写体のフレーム外部分を追加」「天気を晴れに変更」などAIによる強力写真編集機能「Magic Editor」の作例をGoogleが公開

ライカと共同開発した1インチセンサー高性能カメラ搭載スマホ「Xiaomi 13 Ultra」はスマホカメラの常識を変えるのか？

2023年4月18日に、Xiaomiが「1インチセンサー採用メインカメラ」や「焦点距離120mmの超望遠カメラ」など4個のカメラを搭載したスマートフォン「Xiaomi 13 Ultra」を発表しました。Xiaomi 13 Ultraに搭載されているカメラはライカと共同開発されたもので、スマートフォン付属カメラとしては信じられないほどの高スペックカメラに仕上がっています。

·gigazine.net·May 4, 2023

ライカと共同開発した1インチセンサー高性能カメラ搭載スマホ「Xiaomi 13 Ultra」はスマホカメラの常識を変えるのか？

画像生成AI「Stable Diffusion」開発元がチャットAI「StableVicuna」をリリース

Stable Diffusionの開発元であるStability AIが、オープンソースのチャットボットAI「StableVicuna」のリリースを発表しました。StableVicunaは、Metaが開発した大規模言語モデルのLLaMA 13BをベースとするチャットボットAI「Vicuna-13B」をさらに調整して訓練したチャットボットAIです。

·gigazine.net·May 4, 2023

画像生成AI「Stable Diffusion」開発元がチャットAI「StableVicuna」をリリース

無料でAIがイラストを自動で色別レイヤーに分割してPhotoshopやクリスタで読み込めるようにしてくれる便利ツール「layerdivider」インストール＆使い方まとめ

AIによって1枚のイラストを色や明るさに応じて自動でレイヤーにわけてくれるツール「layerdivider」を、抹茶もなかさんが無償で公開しています。ブラウザのUIにイラストを読み込ませてボタンをクリックするだけでレイヤー分けしてくれるだけでなく、Adobe PhotoshopやCLIP STUDIO PAINTで読み込めるPSD形式のデータにも出力してくれるとのことで、実際にローカルPCにインストールして使う方法をまとめてみました。

·gigazine.net·May 4, 2023

画像をキレイに拡大できるイメージアップスケーリングAPIを画像生成AI「Stable Diffusion」の開発元Stability AIが公開

画像生成AIのStable Diffusionを開発するStability AIが、画像の鮮明さを損なわずに画像のサイズを拡大できるイメージアップスケーリングAPIのリリースを発表しました。

·gigazine.net·May 1, 2023

画像をキレイに拡大できるイメージアップスケーリングAPIを画像生成AI「Stable Diffusion」の開発元Stability AIが公開

画像生成AIによる作品の無許可使用を主張した写真家が逆に損害賠償を請求される

人間が撮影した写真には著作権や肖像権などさまざまな法律による規制が課せられています。しかし、急速に発展・普及するAIの分野では法律による規制が追いついていないのが実情です。そんな中、自身の写真をAIの学習に使用されたと主張する写真家が、逆に損害賠償を請求されていることを明かしています。

·gigazine.net·May 1, 2023

画像生成AIによる作品の無許可使用を主張した写真家が逆に損害賠償を請求される

完全フルオートで夜間でも明るいムービーを撮影可能なソニーの動画特化ミラーレス「VLOGCAM ZV-E1」で撮影した作例ムービーを大量公開

2023年4月にソニーから登場した動画特化カメラ「VLOGCAM ZV-E1」はフルサイズセンサーを搭載しつつ小型軽量ボディを実現しています。そんなVLOGCAM ZV-E1を借りられたので、撮影性能を検証するべく多様なシチュエーションでムービーを撮影しまくってみました。

·gigazine.net·May 1, 2023

完全フルオートで夜間でも明るいムービーを撮影可能なソニーの動画特化ミラーレス「VLOGCAM ZV-E1」で撮影した作例ムービーを大量公開

イーロン・マスクの発言は「ディープフェイクで作られた可能性がある」とテスラ側の弁護団が主張

カリフォルニア州のサンタクララ郡高等裁判所で行われているテスラの電気自動車による死亡事故を巡る裁判で、被告側のテスラが、原告側から提出された「イーロン・マスクCEOが2016年に発表した声明のムービー」をディープフェイクの可能性があると主張しました。これを受けて、裁判官はマスク氏に対して、実際に特定の発言をしたかについて宣誓した上で証言するように命じました。

·gigazine.net·May 1, 2023

イーロン・マスクの発言は「ディープフェイクで作られた可能性がある」とテスラ側の弁護団が主張

4K時代の動画コーデック「HEVC」「AV1」「VVC」を比較して評価するとこうなる、最も将来に期待できるコーデックはどれか？

データや信号を一定の規則に基づいて変換することをエンコード、元に戻すことをデコードといい、このエンコードとデコードを行う規格が「コーデック」です。動画は静止画の連続であり、さらに音声を含めるとどうしてもファイルサイズが大きくなってしまいますが、コーデックによってファイルサイズを圧縮することができます。4K解像度が当たり前になりつつある時代に登場したコーデック「HEVC」「AV1」「VVC」について、ハードウェア系ニュースサイトのChips and Cheeseが比較検証を行っています。

·gigazine.net·Apr 22, 2023

4K時代の動画コーデック「HEVC」「AV1」「VVC」を比較して評価するとこうなる、最も将来に期待できるコーデックはどれか？

MRIの解像度を従来より6400万倍向上させる技術が登場

X線では写りにくい、水分の多い柔らかい組織を可視化するのに用いられる磁気共鳴法(MRI)で、1ボクセル(立方体の最小単位)がわずか5ミクロンと、従来より6400万分の1という細かいディテールまで表現できる技術が開発されました。

·gigazine.net·Apr 22, 2023

MRIの解像度を従来より6400万倍向上させる技術が登場

画像を認識して年齢推測可能＆人名クイズにも正答できる無料の高性能チャットAI「LLaVA」を使ってみた

チャットAIに関する研究が活発に行われている中、誰でも無料で使えるオープンソースのチャットAIも数多く登場しています。Microsoftやウィスコンシン大学マディソン校などの研究チームが開発した「LLaVA」は、画像を入力することで画像をお題にした会話を楽しめるとのこと。どんな会話ができるのか、実際に使って確かめてみました。

·gigazine.net·Apr 22, 2023

画像を認識して年齢推測可能＆人名クイズにも正答できる無料の高性能チャットAI「LLaVA」を使ってみた

PhotoshopとLightroomに追加されたAIノイズ除去機能がメチャクチャ高性能なので使い方まとめ＆前後比較してみたよレビュー

暗いシーンなどに対応するためにISO感度を上げた状態で写真を撮影すると、画面内に大量のノイズが生み出されてしまいます。Adobeの写真管理・編集アプリ「Adobe Lightroom」やPhotoshopに付属しているRAW現像アプリ「Adobe Camera Raw」に追加されたAIを用いたノイズ除去機能を使ってみたところ、画質を保ちつつノイズをキレイに取り除けたので、使い方やノイズ除去前後比較をまとめてみました。

·gigazine.net·Apr 22, 2023

PhotoshopとLightroomに追加されたAIノイズ除去機能がメチャクチャ高性能なので使い方まとめ＆前後比較してみたよレビュー

NVIDIAがテキストから高解像度の映像を生成するAIモデル「VideoLDM」を発表

NVIDIAが、アメリカのコーネル大学と共同で開発したAIモデル「Video Latent Diffusion Model(VideoLDM)」を発表しました。VideoLDMは、テキストで入力した説明に基づき、最大2048×1280ピクセルの解像度、24fpsの動画を最長4.7秒生成することができます。

·gigazine.net·Apr 22, 2023

NVIDIAがテキストから高解像度の映像を生成するAIモデル「VideoLDM」を発表

スーパー「オーケー」がピザ焼き色判定にAI導入！直面した思わぬ落とし穴とは

1都3県で展開するスーパーマーケットの「オーケー」は、一般の販売品を安く販売しているだけでなく、店内のベーカリーで焼き上げるパンやピザも人気が高い。そんなオーケーでは今、AIのユニークな活用法に取り組んでいる。それは「ピザの焼き色を判定するAI」。なぜ経営ではなく、現場のためのAIシステムを開発しているのだろうか。また、AIに「いい焼き色」を理解させるために、2000枚のピザの画像を地道に教えた。当初1000枚の画像を学習させたところ、ある理由で精度が低かったというのだ。その理由とは……。

·diamond.jp·Apr 19, 2023

スーパー「オーケー」がピザ焼き色判定にAI導入！直面した思わぬ落とし穴とは

AdobeがジェネレーティブAI「Firefly」による動画編集の一部を明らかに、色の変更・効果音生成・絵コンテの自動生成が可能

Adobeが独自に開発したジェネレーティブAIの「Firefly」は、著作権が失効したコンテンツやライセンスフリーのコンテンツのみで学習しており、画像やテキストエフェクトを自動で生成することができます。AdobeがFireflyをCreative Cloudに導入し、動画編集や音声編集に使えるようにするために開発を進めていることを明らかにしました。

·gigazine.net·Apr 18, 2023

AdobeがジェネレーティブAI「Firefly」による動画編集の一部を明らかに、色の変更・効果音生成・絵コンテの自動生成が可能

画像をテーマにAIとおしゃべりできる「Minigpt-4」が登場

ChatGPT匹敵する精度とされるチャットAI「Vicuna-13B」と、画像にキャプションを付けられる「BLIP-2」を組み合わせることで、アップロードした画像についてAIと会話できるようにした「Minigpt-4」が、公開されました。

·gigazine.net·Apr 18, 2023

画像をテーマにAIとおしゃべりできる「Minigpt-4」が登場

画像生成AIで作った画像が写真コンテストで優勝、制作者は「AI画像は写真ではない」と述べ賞を辞退

ソニーが支援する写真コンテスト「ソニーワールドフォトグラフィーアワード(SWPA)」にAIで生成された画像が出品され、クリエイティブ部門の総合優勝作品として選ばれる事態が起こりました。出品者は「AIで生成された画像のための別の部門を作るプロセスを加速させるために出品した」と語り、受賞を辞退しました。

·gigazine.net·Apr 17, 2023

画像生成AIで作った画像が写真コンテストで優勝、制作者は「AI画像は写真ではない」と述べ賞を辞退

クボタ、3DモデルやARを活用した建設機械の故障診断アプリ「Kubota Diagnostics」

クボタは12月21日、建設機械の故障診断アプリ「Kubota Diagnostics」を開発したと発表した。故障診断のプロセスを効率化して、故障した機械の停止時間（ダウンタイム）を削減するとともに、故障内容の情報を効率的に収集することで、アフターサービスの品質向上に役立てていくとのこと。12月18日から米国で導入開始し、2021年以降に日本を含む世界各地の市場に順次展開していく予定。

·car.watch.impress.co.jp·Apr 17, 2023

クボタ、3DモデルやARを活用した建設機械の故障診断アプリ「Kubota Diagnostics」

PCとウェブカメラだけで簡単にVTuberになれるツール「VMagicMirror」レビュー、ゲームコントローラーでアバターを操作することも可能

3Dアバターとウェブカメラがあれば誰でもバーチャルYouTuber(VTuber)になれるツール「VMagicMirror」を、獏星(ばくすたー)さんが公開しています。基本無料で使うことができ、リップシンク機能やハンドトラッキング機能を搭載しているほか、ゲームコントローラーでアバターを操作することも可能となっています。

·gigazine.net·Apr 16, 2023

PCとウェブカメラだけで簡単にVTuberになれるツール「VMagicMirror」レビュー、ゲームコントローラーでアバターを操作することも可能