画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2550 bookmarks

Custom sorting

ライカと共同開発した1インチセンサー高性能カメラ搭載スマホ「Xiaomi 13 Ultra」はスマホカメラの常識を変えるのか？

2023年4月18日に、Xiaomiが「1インチセンサー採用メインカメラ」や「焦点距離120mmの超望遠カメラ」など4個のカメラを搭載したスマートフォン「Xiaomi 13 Ultra」を発表しました。Xiaomi 13 Ultraに搭載されているカメラはライカと共同開発されたもので、スマートフォン付属カメラとしては信じられないほどの高スペックカメラに仕上がっています。

·gigazine.net·May 4, 2023

ライカと共同開発した1インチセンサー高性能カメラ搭載スマホ「Xiaomi 13 Ultra」はスマホカメラの常識を変えるのか？

画像生成AI「Stable Diffusion」開発元がチャットAI「StableVicuna」をリリース

Stable Diffusionの開発元であるStability AIが、オープンソースのチャットボットAI「StableVicuna」のリリースを発表しました。StableVicunaは、Metaが開発した大規模言語モデルのLLaMA 13BをベースとするチャットボットAI「Vicuna-13B」をさらに調整して訓練したチャットボットAIです。

·gigazine.net·May 4, 2023

画像生成AI「Stable Diffusion」開発元がチャットAI「StableVicuna」をリリース

無料でAIがイラストを自動で色別レイヤーに分割してPhotoshopやクリスタで読み込めるようにしてくれる便利ツール「layerdivider」インストール＆使い方まとめ

AIによって1枚のイラストを色や明るさに応じて自動でレイヤーにわけてくれるツール「layerdivider」を、抹茶もなかさんが無償で公開しています。ブラウザのUIにイラストを読み込ませてボタンをクリックするだけでレイヤー分けしてくれるだけでなく、Adobe PhotoshopやCLIP STUDIO PAINTで読み込めるPSD形式のデータにも出力してくれるとのことで、実際にローカルPCにインストールして使う方法をまとめてみました。

·gigazine.net·May 4, 2023

画像をキレイに拡大できるイメージアップスケーリングAPIを画像生成AI「Stable Diffusion」の開発元Stability AIが公開

画像生成AIのStable Diffusionを開発するStability AIが、画像の鮮明さを損なわずに画像のサイズを拡大できるイメージアップスケーリングAPIのリリースを発表しました。

·gigazine.net·May 1, 2023

画像をキレイに拡大できるイメージアップスケーリングAPIを画像生成AI「Stable Diffusion」の開発元Stability AIが公開

画像生成AIによる作品の無許可使用を主張した写真家が逆に損害賠償を請求される

人間が撮影した写真には著作権や肖像権などさまざまな法律による規制が課せられています。しかし、急速に発展・普及するAIの分野では法律による規制が追いついていないのが実情です。そんな中、自身の写真をAIの学習に使用されたと主張する写真家が、逆に損害賠償を請求されていることを明かしています。

·gigazine.net·May 1, 2023

画像生成AIによる作品の無許可使用を主張した写真家が逆に損害賠償を請求される

完全フルオートで夜間でも明るいムービーを撮影可能なソニーの動画特化ミラーレス「VLOGCAM ZV-E1」で撮影した作例ムービーを大量公開

2023年4月にソニーから登場した動画特化カメラ「VLOGCAM ZV-E1」はフルサイズセンサーを搭載しつつ小型軽量ボディを実現しています。そんなVLOGCAM ZV-E1を借りられたので、撮影性能を検証するべく多様なシチュエーションでムービーを撮影しまくってみました。

·gigazine.net·May 1, 2023

完全フルオートで夜間でも明るいムービーを撮影可能なソニーの動画特化ミラーレス「VLOGCAM ZV-E1」で撮影した作例ムービーを大量公開

イーロン・マスクの発言は「ディープフェイクで作られた可能性がある」とテスラ側の弁護団が主張

カリフォルニア州のサンタクララ郡高等裁判所で行われているテスラの電気自動車による死亡事故を巡る裁判で、被告側のテスラが、原告側から提出された「イーロン・マスクCEOが2016年に発表した声明のムービー」をディープフェイクの可能性があると主張しました。これを受けて、裁判官はマスク氏に対して、実際に特定の発言をしたかについて宣誓した上で証言するように命じました。

·gigazine.net·May 1, 2023

イーロン・マスクの発言は「ディープフェイクで作られた可能性がある」とテスラ側の弁護団が主張

4K時代の動画コーデック「HEVC」「AV1」「VVC」を比較して評価するとこうなる、最も将来に期待できるコーデックはどれか？

データや信号を一定の規則に基づいて変換することをエンコード、元に戻すことをデコードといい、このエンコードとデコードを行う規格が「コーデック」です。動画は静止画の連続であり、さらに音声を含めるとどうしてもファイルサイズが大きくなってしまいますが、コーデックによってファイルサイズを圧縮することができます。4K解像度が当たり前になりつつある時代に登場したコーデック「HEVC」「AV1」「VVC」について、ハードウェア系ニュースサイトのChips and Cheeseが比較検証を行っています。

·gigazine.net·Apr 22, 2023

4K時代の動画コーデック「HEVC」「AV1」「VVC」を比較して評価するとこうなる、最も将来に期待できるコーデックはどれか？

MRIの解像度を従来より6400万倍向上させる技術が登場

X線では写りにくい、水分の多い柔らかい組織を可視化するのに用いられる磁気共鳴法(MRI)で、1ボクセル(立方体の最小単位)がわずか5ミクロンと、従来より6400万分の1という細かいディテールまで表現できる技術が開発されました。

·gigazine.net·Apr 22, 2023

MRIの解像度を従来より6400万倍向上させる技術が登場

画像を認識して年齢推測可能＆人名クイズにも正答できる無料の高性能チャットAI「LLaVA」を使ってみた

チャットAIに関する研究が活発に行われている中、誰でも無料で使えるオープンソースのチャットAIも数多く登場しています。Microsoftやウィスコンシン大学マディソン校などの研究チームが開発した「LLaVA」は、画像を入力することで画像をお題にした会話を楽しめるとのこと。どんな会話ができるのか、実際に使って確かめてみました。

·gigazine.net·Apr 22, 2023

画像を認識して年齢推測可能＆人名クイズにも正答できる無料の高性能チャットAI「LLaVA」を使ってみた

PhotoshopとLightroomに追加されたAIノイズ除去機能がメチャクチャ高性能なので使い方まとめ＆前後比較してみたよレビュー

暗いシーンなどに対応するためにISO感度を上げた状態で写真を撮影すると、画面内に大量のノイズが生み出されてしまいます。Adobeの写真管理・編集アプリ「Adobe Lightroom」やPhotoshopに付属しているRAW現像アプリ「Adobe Camera Raw」に追加されたAIを用いたノイズ除去機能を使ってみたところ、画質を保ちつつノイズをキレイに取り除けたので、使い方やノイズ除去前後比較をまとめてみました。

·gigazine.net·Apr 22, 2023

PhotoshopとLightroomに追加されたAIノイズ除去機能がメチャクチャ高性能なので使い方まとめ＆前後比較してみたよレビュー

NVIDIAがテキストから高解像度の映像を生成するAIモデル「VideoLDM」を発表

NVIDIAが、アメリカのコーネル大学と共同で開発したAIモデル「Video Latent Diffusion Model(VideoLDM)」を発表しました。VideoLDMは、テキストで入力した説明に基づき、最大2048×1280ピクセルの解像度、24fpsの動画を最長4.7秒生成することができます。

·gigazine.net·Apr 22, 2023

NVIDIAがテキストから高解像度の映像を生成するAIモデル「VideoLDM」を発表

スーパー「オーケー」がピザ焼き色判定にAI導入！直面した思わぬ落とし穴とは

1都3県で展開するスーパーマーケットの「オーケー」は、一般の販売品を安く販売しているだけでなく、店内のベーカリーで焼き上げるパンやピザも人気が高い。そんなオーケーでは今、AIのユニークな活用法に取り組んでいる。それは「ピザの焼き色を判定するAI」。なぜ経営ではなく、現場のためのAIシステムを開発しているのだろうか。また、AIに「いい焼き色」を理解させるために、2000枚のピザの画像を地道に教えた。当初1000枚の画像を学習させたところ、ある理由で精度が低かったというのだ。その理由とは……。

·diamond.jp·Apr 19, 2023

スーパー「オーケー」がピザ焼き色判定にAI導入！直面した思わぬ落とし穴とは

AdobeがジェネレーティブAI「Firefly」による動画編集の一部を明らかに、色の変更・効果音生成・絵コンテの自動生成が可能

Adobeが独自に開発したジェネレーティブAIの「Firefly」は、著作権が失効したコンテンツやライセンスフリーのコンテンツのみで学習しており、画像やテキストエフェクトを自動で生成することができます。AdobeがFireflyをCreative Cloudに導入し、動画編集や音声編集に使えるようにするために開発を進めていることを明らかにしました。

·gigazine.net·Apr 18, 2023

AdobeがジェネレーティブAI「Firefly」による動画編集の一部を明らかに、色の変更・効果音生成・絵コンテの自動生成が可能

画像をテーマにAIとおしゃべりできる「Minigpt-4」が登場

ChatGPT匹敵する精度とされるチャットAI「Vicuna-13B」と、画像にキャプションを付けられる「BLIP-2」を組み合わせることで、アップロードした画像についてAIと会話できるようにした「Minigpt-4」が、公開されました。

·gigazine.net·Apr 18, 2023

画像をテーマにAIとおしゃべりできる「Minigpt-4」が登場

画像生成AIで作った画像が写真コンテストで優勝、制作者は「AI画像は写真ではない」と述べ賞を辞退

ソニーが支援する写真コンテスト「ソニーワールドフォトグラフィーアワード(SWPA)」にAIで生成された画像が出品され、クリエイティブ部門の総合優勝作品として選ばれる事態が起こりました。出品者は「AIで生成された画像のための別の部門を作るプロセスを加速させるために出品した」と語り、受賞を辞退しました。

·gigazine.net·Apr 17, 2023

画像生成AIで作った画像が写真コンテストで優勝、制作者は「AI画像は写真ではない」と述べ賞を辞退

クボタ、3DモデルやARを活用した建設機械の故障診断アプリ「Kubota Diagnostics」

クボタは12月21日、建設機械の故障診断アプリ「Kubota Diagnostics」を開発したと発表した。故障診断のプロセスを効率化して、故障した機械の停止時間（ダウンタイム）を削減するとともに、故障内容の情報を効率的に収集することで、アフターサービスの品質向上に役立てていくとのこと。12月18日から米国で導入開始し、2021年以降に日本を含む世界各地の市場に順次展開していく予定。

·car.watch.impress.co.jp·Apr 17, 2023

クボタ、3DモデルやARを活用した建設機械の故障診断アプリ「Kubota Diagnostics」

PCとウェブカメラだけで簡単にVTuberになれるツール「VMagicMirror」レビュー、ゲームコントローラーでアバターを操作することも可能

3Dアバターとウェブカメラがあれば誰でもバーチャルYouTuber(VTuber)になれるツール「VMagicMirror」を、獏星(ばくすたー)さんが公開しています。基本無料で使うことができ、リップシンク機能やハンドトラッキング機能を搭載しているほか、ゲームコントローラーでアバターを操作することも可能となっています。

·gigazine.net·Apr 16, 2023

PCとウェブカメラだけで簡単にVTuberになれるツール「VMagicMirror」レビュー、ゲームコントローラーでアバターを操作することも可能

ジェスチャーを読み取ってダンスでキー入力ができる「全身キーボード」が登場

カメラの前でポーズを取り、それに応じたキー入力をすることで、あたかもダンスをしているように連続でジェスチャーをして文章をタイピングできる「full-body keyboard(全身キーボード)」を、YouTuberのFletcher Heisler氏が公開しました。

·gigazine.net·Apr 15, 2023

ジェスチャーを読み取ってダンスでキー入力ができる「全身キーボード」が登場

画像生成AI「Stable Diffusion」をMulti ControlNetで制御して「実写映像を忠実にアニメ化」したムービーがすごい

Stable Diffusionなどの事前学習済みモデルに対して、輪郭線や深度、画像の領域区分(セグメンテーション)情報などを追加して出力をサポートする技術が「ControlNet」です。このControlNetを使うことで、別途に読み込ませた画像に写っている線画や人の姿勢などを出力結果に強く反映させることが可能です。このControlNetを複数使用する「Multi ControlNet」で実写の映像を忠実にアニメ化したムービーが、オンライン掲示板のRedditで公開されました。

·gigazine.net·Apr 15, 2023

画像生成AI「Stable Diffusion」をMulti ControlNetで制御して「実写映像を忠実にアニメ化」したムービーがすごい

無料でキャラクターイラスト1枚からぬるぬる動くアニメーションを作成するAI「Animated Drawings」をMeta AIがリリース

Metaの人工知能(AI)研究所であるMeta AIのFundamental AI Research(FAIR)チームは、手描きのキャラクターをアニメーションに変換するオープンソースプロジェクト「Animated Drawings」を2023年4月14日にリリースしました。Animated Drawingsは無料でブラウザから体験することができ、頭と体と手足がハッキリしていれば、かなり雑な落書きでも超簡単に動かすことができます。また、Animated Drawingsはオープンソースで公開されているため、GitHubからダウンロードしてより詳細なオプションを設定することも可能です。

·gigazine.net·Apr 15, 2023

無料でキャラクターイラスト1枚からぬるぬる動くアニメーションを作成するAI「Animated Drawings」をMeta AIがリリース

史上初めて撮影されたブラックホールの画像を機械学習で再構築しさらに忠実なものに新生

2019年に史上初めてブラックホールが撮影されました。このときの画像はかなりぼやけたものでしたが、PRIMO(主成分干渉モデリング)と呼ばれる新たな機械学習技術を用いることで、はっきりとブラックホールの姿がわかる、現実の姿により近い忠実な画像の再構築が行われたことが発表されました。

·gigazine.net·Apr 15, 2023

史上初めて撮影されたブラックホールの画像を機械学習で再構築しさらに忠実なものに新生

「映像から文字起こししたテキストを編集するだけで元の映像も編集できる機能」がAdobe Premiere Proに追加される

Adobeが、2023年4月15日～19日にラスベガスで開催される放送・メディア関連カンファレンス兼展示会「2023 NAB Show」に先駆け、映像編集ソフトのAdobe Premiere Proの新しいバージョンを2023年4月13日(木)に発表しました。この新しいバージョンでは、AIによってテキストのコピー＆ペーストで簡単に動画編集ができる「文字起こしベースの編集」や異なるカメラの映像をミックスしてもカラーやコントラストの整合性を維持できる「自動トーンマッピング」などの機能が盛り込まれます。

·gigazine.net·Apr 15, 2023

「映像から文字起こししたテキストを編集するだけで元の映像も編集できる機能」がAdobe Premiere Proに追加される

AIが中国で既にイラストレーターの仕事を奪い始めている、現場の悲鳴と実際にどのようにAIが用いられているのかをまとめたレポートが公開

Stable DiffusionやMidjourneyの登場により、画像生成AIに対する期待は爆発的に高まっており、今やWindowsの標準ブラウザであるEdgeにも画像生成AI機能が搭載されています。そんな画像生成AIの活躍により、中国のゲーム業界ではさっそくイラストレーターたちが仕事を奪われつつあると、テクノロジーメディアのRest of Worldが報じました。

·gigazine.net·Apr 12, 2023

AIが中国で既にイラストレーターの仕事を奪い始めている、現場の悲鳴と実際にどのようにAIが用いられているのかをまとめたレポートが公開

Windows標準ブラウザ「Edge」に写真もイラストも作れる画像生成AIが搭載されたので使ってみた

Windowsに標準搭載されているウェブブラウザ「Edge」に、AIを用いた画像生成機能「Image Creator」のプレビュー版が追加されました。Image Creatorは多くの環境で利用可能となっており、誰でも簡単に実写風画像やイラストを生成できるとのこと。編集部のPCでも使えるようになっていたので、実際に画像を生成する手順を確かめてみました。

·gigazine.net·Apr 8, 2023

Windows標準ブラウザ「Edge」に写真もイラストも作れる画像生成AIが搭載されたので使ってみた

11歳の少女が白内障などの目の病気を70％の精度で検出するAIを用いたアプリを開発

白内障や翼状片をはじめとする目の病気の診断には、基本的に専門的な医師による検査が必要とされています。しかしアラブ首長国連邦のドバイに住む11歳のリーナ・ラフィークさんが、AIを用いた独自のスキャン方法で目の病気やその他の状態を検出するiPhone向けアプリ「Ogler EyeScan」を開発しました。

·gigazine.net·Apr 8, 2023

11歳の少女が白内障などの目の病気を70％の精度で検出するAIを用いたアプリを開発

Meta、画像からあらゆるオブジェクトを切り出すAIモデル

Meta AIは、画像の中のオブジェクトを特定するセグメンテーションを行なう専用AIモデル「Segment Anything Model(SAM)」と、そのデータセットとなる10億マスクのデータセット(SA-1B)を公開した。データセットは研究目的のもと、Apache 2.0ライセンスで利用可能。また、WebブラウザでSAMを体験できるデモページ「Try the Segment Anything」も用意している。

·watch.impress.co.jp·Apr 8, 2023

Meta、画像からあらゆるオブジェクトを切り出すAIモデル

話題の画像生成AIにはどういうものがある？商用利用や著作権に対するスタンスは？ジャンルごとに紹介 | おたくま経済新聞

テキストを入力することで、自動的に画像を生成してくれる画像生成AI。多くのサービスやアプリ、また生成された画像のギャラリーなどが存在しています。どのようなサービスやアプリがあるのか、そしてユーザーコミュニティなど、画像生成AIに関する様々なサイトをまとめてみました。

·otakei.otakuma.net·Apr 6, 2023

話題の画像生成AIにはどういうものがある？商用利用や著作権に対するスタンスは？ジャンルごとに紹介 | おたくま経済新聞

Galaxy S23 Ultraご自慢のカメラがめちゃくちゃ楽しかった

凄すぎて思わず声が出ました。今年2月のSamsung新製品イベントで発表されたGalaxy S23シリーズ。なかでも最強モデルのGalaxy S23 Ultraに関しては、広角カメラが約2億画素になったり、夜景モードが強化されたりと、見た目はほぼ同じながらも着実に進化を遂げたモデルに仕上がっているのが特徴です。国内では4月20日（木）に発売予定のGalaxy S23シリーズですが、今回発売前にG

·gizmodo.jp·Apr 6, 2023

Galaxy S23 Ultraご自慢のカメラがめちゃくちゃ楽しかった

従来のStable Diffusionより大幅に強化された画像生成AI「Stable Diffusion XL」のベータ版がテスト公開されたので使ってみた

Stable Diffusionを開発したAI研究企業のStability AIが、従来の画像生成AIを大幅に強化した「Stable Diffusion XL(#SDXL)」をテストしていることが明らかになりました。Stability AIのウェブサービスである「DreamStudio」で、実際に「Stable Diffusion XL」のベータ版を使うことができたので、新たな画像生成モデルがどれほどの性能なのか試してみました。

·gigazine.net·Apr 5, 2023

従来のStable Diffusionより大幅に強化された画像生成AI「Stable Diffusion XL」のベータ版がテスト公開されたので使ってみた