画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2306 bookmarks
Custom sorting
ランダムに再生されるYouTubeにあるロンドンのアーカイブ映像を見て一体何年の映像かを当てる「The Great When? A London-through-time quiz」
ランダムに再生されるYouTubeにあるロンドンのアーカイブ映像を見て一体何年の映像かを当てる「The Great When? A London-through-time quiz」
イギリスの首都であるロンドンは古くから芸術や商業、娯楽、ファッションなどの分野で強い影響力を持ち、「世界一革新的な都市」と呼ばれることもあります。そんなロンドンでは19世紀以降、ムービーの撮影が活発に行われるようになり、YouTube上には多数のロンドンを撮影したアーカイブ映像がアップロードされています。ランダムに表示されるロンドンのアーカイブ映像を見て、西暦何年の映像かを当てるクイズが「The Great When? A London-through-time quiz」です。
·gigazine.net·
ランダムに再生されるYouTubeにあるロンドンのアーカイブ映像を見て一体何年の映像かを当てる「The Great When? A London-through-time quiz」
YouTubeが最適なサムネイルを選ぶためのA/Bテスト機能を実験中
YouTubeが最適なサムネイルを選ぶためのA/Bテスト機能を実験中
YouTubeが複数のサムネイルの中から最もパフォーマンスの高いサムネイルを選べるようになる「Test&Compare」機能の初期テストを行っていることを明らかにしました。
·gigazine.net·
YouTubeが最適なサムネイルを選ぶためのA/Bテスト機能を実験中
「顔を右に」「口を開く」など画像の動かしたい部分をAIがいい感じに修正してくれるツール「DragGAN」のソースコード&デモが公開される
「顔を右に」「口を開く」など画像の動かしたい部分をAIがいい感じに修正してくれるツール「DragGAN」のソースコード&デモが公開される
AIを使って画像を生成する時、「ちょっとだけ修正を加えたい」と思うことは多いもの。そんな人たちの夢をかなえるツールが「DragGAN」です。DragGANは画像の中で動かしたいポイントを指示するだけでAIが自動で修正してくれるというもので、2023年5月に論文だけが提出されていましたが、2023年6月22日にソースコードが公開され、同時にデモも登場しました。
·gigazine.net·
「顔を右に」「口を開く」など画像の動かしたい部分をAIがいい感じに修正してくれるツール「DragGAN」のソースコード&デモが公開される
画像生成AI「Stable Diffusion」「Adobe Firefly」「Midjourney」の特徴が一発で分かる「同じテキスト」から生成した画像たち - GIGAZINE
画像生成AI「Stable Diffusion」「Adobe Firefly」「Midjourney」の特徴が一発で分かる「同じテキスト」から生成した画像たち - GIGAZINE
無料で使える「Stable Diffusion」やAdobeが提供する「Adobe Firefly」など手軽に使える画像生成AIが続々と登場しています。画像生成AIは基本的に「生成したい画像を説明するテキスト(プロンプト)を入力する」という形式で使用可能ですが、AIの種類やモデルデータが変化すると生成結果もまったく別物に変化します。テクノロジー関連ライターのMuhammad Usman氏は「Adobe Firefly」「DALL・E2」「OpenJourney」「Stable Diffusion」「Midjourney」といった主要な画像生成AIに同じプロンプトを入力した際の生成結果をまとめています。
·gigazine.net·
画像生成AI「Stable Diffusion」「Adobe Firefly」「Midjourney」の特徴が一発で分かる「同じテキスト」から生成した画像たち - GIGAZINE
なぜAIは「手」を描くことを苦手としているのかをアートと工学の専門家が解説
なぜAIは「手」を描くことを苦手としているのかをアートと工学の専門家が解説
カリフォルニアのスタートアップであるStability AIによる「Stable Diffusion」や、Discordのコマンドを利用する「Midjourney」、アニメなどのイラストに特化した「NovelAI」のほか、Adobeが発表した著作権的にクリアな「Adobe Firefly」など、さまざまな画像生成AIが普及しています。画像生成AIはプロンプトを入力するだけでかなりリアルな人物や高クオリティなキャラクターイラストを生成できますが、AIが苦手としている表現やパーツもあり、中でも「人間の手」を描くのに失敗するケースが多くなっています。なぜAIは手を正しく描くことが得意ではないのかというメカニズムを、オンラインメディアのVoxが解説しています。
·gigazine.net·
なぜAIは「手」を描くことを苦手としているのかをアートと工学の専門家が解説
Googleの「StyleDrop」は文字列から好みのスタイルの画像を生み出せる
Googleの「StyleDrop」は文字列から好みのスタイルの画像を生み出せる
配色や陰影、デザインパターンなど、ユーザーが提示したスタイルの中身を的確にとらえた上で、そのスタイルで求められた画像を出力できる「StyleDrop」をGoogleが開発しました。入力された文字列をもとにして画像を生成することは画像生成AI「Stable Diffusion」などでも可能ですが、特定のスタイルに基づく出力は困難でした。「StyleDrop」はこの問題点を克服しています。
·gigazine.net·
Googleの「StyleDrop」は文字列から好みのスタイルの画像を生み出せる
「スパイダーバース」が3DCGアニメーションをいかに進化させたか
「スパイダーバース」が3DCGアニメーションをいかに進化させたか
別世界のスパイダーマンたちが一堂に会して活躍するアニメ映画「スパイダーマン:スパイダーバース」は、3DCGアニメーションを手描きで仕上げることでアメコミ特有のタッチを再現していたり、ストーリーに合わせたサイケデリックな演出があったりと、革新的なビジュアルも特徴的です。従来の3DCGアニメとは異なる手法を用いた「スパイダーバース」がアニメーションに与えた強い影響について、オンラインメディアのVoxがムービーにまとめています。
·gigazine.net·
「スパイダーバース」が3DCGアニメーションをいかに進化させたか
iPhoneで顔の動きをキャプチャして「数分」でアニメーションにできる「MetaHuman Animator」をEpic Gamesがリリース、フル活用した映像作品も実例としてメイキング付きで公開
iPhoneで顔の動きをキャプチャして「数分」でアニメーションにできる「MetaHuman Animator」をEpic Gamesがリリース、フル活用した映像作品も実例としてメイキング付きで公開
Epic GamesがiPhoneで顔を撮影するだけで表情や口の動きを高精度にキャプチャできるシステム「MetaHuman Animator」を正式公開しました。MetaHuman Animatorを用いると顔の動きを簡単にUnreal Engineへ取り込めるため、専用の機材を用意せずともゲームやムービーにフェイストラッキング技術を適用できるようになります。
·gigazine.net·
iPhoneで顔の動きをキャプチャして「数分」でアニメーションにできる「MetaHuman Animator」をEpic Gamesがリリース、フル活用した映像作品も実例としてメイキング付きで公開
映画「マトリックス」で有名な特殊効果「バレットタイム」の撮影環境を中古カメラやRaspberry Piで構築した記録
映画「マトリックス」で有名な特殊効果「バレットタイム」の撮影環境を中古カメラやRaspberry Piで構築した記録
1999年公開の映画「マトリックス」で大きな話題となった「時間がスローもしくは静止した状態でカメラだけは主人公を中心に円を描くように動き続ける」という表現は「バレットタイム」と呼ばれており、数多くの映像作品で用いられています。そんなバレットタイムを結婚式の思い出ムービーに活用するべく機材調達やシステム構築を行った記録を、物理学者やソフトウェアエンジニアとして活躍するセバスチャン・スタックス氏が公開しています。
·gigazine.net·
映画「マトリックス」で有名な特殊効果「バレットタイム」の撮影環境を中古カメラやRaspberry Piで構築した記録
AI成果物が急増したことで「AI生成コンテンツをAIが学習するループ」が発生し「モデルの崩壊」が起きつつあると研究者が警告
AI成果物が急増したことで「AI生成コンテンツをAIが学習するループ」が発生し「モデルの崩壊」が起きつつあると研究者が警告
Adobeが権利的にクリアなトレーニングモデルを用いた画像生成AI「Firefly」を発表したり、Microsoftの検索エンジンであるEdgeで対話型AIのChatGPTが活躍していたり、世界的なコンサル企業が「社員の50%は業務にジェネレーティブAIを活用している」と明らかにしたりと、ジェネレーティブAIは社会に広がり続けています。しかし、AIを使用してコンテンツを作成・公開する人が増えていることで、新たな問題として「AIが生成したコンテンツがインターネット上にあふれ、それをAIが学習することで、重大な欠陥が生まれている」ということが研究者グループから指摘されています。
·gigazine.net·
AI成果物が急増したことで「AI生成コンテンツをAIが学習するループ」が発生し「モデルの崩壊」が起きつつあると研究者が警告
次世代の画像ファイル形式「JPEG XL」はAVIF形式よりもファイルサイズが11%小さく画質は13%高いことが報告される
次世代の画像ファイル形式「JPEG XL」はAVIF形式よりもファイルサイズが11%小さく画質は13%高いことが報告される
「JPEG XL(JXL)」は、独自の圧縮アルゴリズムを使用して、画像やイラスト、スクリーンショットを圧縮することができる次世代のJPEG形式です。そんなJPEG XLは従来の圧縮率が高い画像ファイルフォーマットである「AV1 Image File Format(AVIF)」よりもファイルのサイズが約11%削減されるだけでなく、画質の面でも約13%AVIFよりも優れていることが報告されています。
·gigazine.net·
次世代の画像ファイル形式「JPEG XL」はAVIF形式よりもファイルサイズが11%小さく画質は13%高いことが報告される
画像生成AI「Stable Diffusion」でスマホでもわずか1枚2秒という爆速で画像生成ができる「SnapFusion」
画像生成AI「Stable Diffusion」でスマホでもわずか1枚2秒という爆速で画像生成ができる「SnapFusion」
画像生成AIのStable Diffusionは、文章を入力するだけでイラストや写真を自動で生成してくれます。しかし、この画像生成のプロセスは複雑な処理を何度も行うため、ハイスペックなGPUを搭載したマシンが必要となります。そんなStable Diffusionをスマートフォン上で、1枚2秒未満という速度で画像生成できるようにした「SnapFusion」を開発したと、ノースイースタン大学と写真共有アプリ・Snapchatの開発企業であるSnapの研究者が発表しました。
·gigazine.net·
画像生成AI「Stable Diffusion」でスマホでもわずか1枚2秒という爆速で画像生成ができる「SnapFusion」
名盤のジャケットをPhotoshopの「ジェネレーティブ塗りつぶし」で補完したら「そう来るか」な光景が広がりまくって面白い
名盤のジャケットをPhotoshopの「ジェネレーティブ塗りつぶし」で補完したら「そう来るか」な光景が広がりまくって面白い
Adobeが2023年5月23日に発表した「ジェネレーティブ塗りつぶし」は、AIにより既存の画像の続きを生成できるPhotoshopの新機能です。そんなジェネレーティブ塗りつぶしを使って、マイケル・ジャクソンの「スリラー」を始めとする有名アルバムのジャケットの続きを描かせてみた結果がTwitterに投稿されています。
·gigazine.net·
名盤のジャケットをPhotoshopの「ジェネレーティブ塗りつぶし」で補完したら「そう来るか」な光景が広がりまくって面白い
画像生成AIによるイラスト学習をカラフルなウォーターマークで簡単に妨害できる「RGBWatermark」を使ってみた
画像生成AIによるイラスト学習をカラフルなウォーターマークで簡単に妨害できる「RGBWatermark」を使ってみた
Stable DiffusionやMidjourneyのような画像生成AIは、既存のイラストや写真で構成されたデータセットから学習した重みデータを基に、画像を自動で生成することができます。しかし、学習用データセットを構成するイラストや写真はウェブスクレイピングで収集されたものが多いため、知らないうちに自分の写真やイラストがデータセットに収録されていたということも十分あり得ます。これを防ぐ手段の1つとして、ネットに公開するイラストや写真にウォーターマーク(透かし)を入れるというのがあります。「RGBWatermark」はカラフルなウォーターマークを簡単に入れることができるサイトで、アニメーションGIFやMP4動画の形で保存することもできます。
·gigazine.net·
画像生成AIによるイラスト学習をカラフルなウォーターマークで簡単に妨害できる「RGBWatermark」を使ってみた
「人を検知したらメール送信」などのオートメーションをSynologyのIPカメラ「BC500」と自動化サービスの「IFTTT」を連携させて構築してみた
「人を検知したらメール送信」などのオートメーションをSynologyのIPカメラ「BC500」と自動化サービスの「IFTTT」を連携させて構築してみた
SynologyのIPカメラ「BC500」は、自動化サービスの「IFTTT」と連携させてさまざまなオートメーションを組むことができます。今回は「人物および車両を検出したときにメールを送信する」と「スマートフォンのウィジェットをタップしたときに録画を開始する」の2種類のオートメーションを作成。それぞれ設定方法がやや異なるので、1つずつ試していきます。
·gigazine.net·
「人を検知したらメール送信」などのオートメーションをSynologyのIPカメラ「BC500」と自動化サービスの「IFTTT」を連携させて構築してみた
監視カメラ映像のYouTube同時ライブ配信がSynology製IPカメラ「BC500」と監視ツール「Surveillance Station」を使えば超絶単純に設定できるので実際にやってみた
監視カメラ映像のYouTube同時ライブ配信がSynology製IPカメラ「BC500」と監視ツール「Surveillance Station」を使えば超絶単純に設定できるので実際にやってみた
過去の録画を月額利用料なしで一括管理できるSynology製IPカメラ「BC500」について、これまで動体検知機能や自動化サービスのIFTTTとの連携といった複数の機能に触れてきましたが、今度はBC500の映像をライブ放送するための設定を行います。BC500とYouTubeを連携して配信を開始するための手順をまとめてみました。
·gigazine.net·
監視カメラ映像のYouTube同時ライブ配信がSynology製IPカメラ「BC500」と監視ツール「Surveillance Station」を使えば超絶単純に設定できるので実際にやってみた
無料でブラウザとウェブカメラがあれば誰でも簡単にVRM形式の3Dアバターで表情と手指の動きをトラッキングして動かせる「OpenLive3D」を使ってみた
無料でブラウザとウェブカメラがあれば誰でも簡単にVRM形式の3Dアバターで表情と手指の動きをトラッキングして動かせる「OpenLive3D」を使ってみた
自分の動きを3Dアバターに反映させるためには、高価なトラッキング機材やカメラを必要となります。そこで、ウェブカメラで体や顔の動きをキャプチャする方法が有志によって開発されています。「OpenLive3D」はオープンソースで開発されているキャプチャシステムで、ウェブカメラがあれば簡単に顔と手の動きをトラッキングできます。
·gigazine.net·
無料でブラウザとウェブカメラがあれば誰でも簡単にVRM形式の3Dアバターで表情と手指の動きをトラッキングして動かせる「OpenLive3D」を使ってみた
スマホとは一線を画す撮影が可能なVlogカメラ「PowerShot V10」で自撮りムービーや食事ムービーを撮影しまくってみたよレビュー
スマホとは一線を画す撮影が可能なVlogカメラ「PowerShot V10」で自撮りムービーや食事ムービーを撮影しまくってみたよレビュー
2023年6月下旬発売予定のVlogカメラ「PowerShot V10」は、液晶モニターを180度回転させて自撮りに特化させたり、可動式スタンドを使って固定撮影したりといった多様な撮影方式に対応できます。そんなPowerShot V10を一足早く入手できたので、外観の徹底チェックに続いて昼夜問わず色んなシチュエーションでムービーを撮影しまくってみました。
·gigazine.net·
スマホとは一線を画す撮影が可能なVlogカメラ「PowerShot V10」で自撮りムービーや食事ムービーを撮影しまくってみたよレビュー
画像生成AI「Stable Diffusion」で美麗イラストとQRコードを融合させる試み
画像生成AI「Stable Diffusion」で美麗イラストとQRコードを融合させる試み
決済手段としても用いられるようになっている「QRコード」は、一部が破損・汚損していたり読み取り時に隠れていても大丈夫なように誤り訂正機能が盛り込まれています。これを活用して、QRコードと美麗なイラストを融合させる試みが行われています。
·gigazine.net·
画像生成AI「Stable Diffusion」で美麗イラストとQRコードを融合させる試み
文章を入力するだけで実在の人物やアニメキャラクターの頭部3Dモデルを生成できるAI「HeadSculpt」
文章を入力するだけで実在の人物やアニメキャラクターの頭部3Dモデルを生成できるAI「HeadSculpt」
テキスト入力するだけで頭部の3Dモデルを生成できるAI「HeadSculpt」が開発されました。HeadSculpでは既存のAIと比べて違和感の少ないモデル生成が可能で、アニメやゲームのキャラクターにも対応している他、編集機能も搭載しています。
·gigazine.net·
文章を入力するだけで実在の人物やアニメキャラクターの頭部3Dモデルを生成できるAI「HeadSculpt」
AIはフォトストック業界を殺すのか?
AIはフォトストック業界を殺すのか?
AIの発達により多くの職業が影響を受けると予想されており、すでにゲーム開発者やイラストレーターの働き方や収入に大きな変化が出始めています。本物の写真と見分けがつかないような画像を生み出せるようになってきたジェネレーティブAIが、ストック写真を扱う業界にどのような影響を与えるのかについて、フォトストックサービスの比較分析を行う企業・Stock Performerの共同設立者であるオリバー・キューデル氏が解説しました。
·gigazine.net·
AIはフォトストック業界を殺すのか?
画像の枠外を新たに描き足せるAIアプリ「Uncrop」が無料公開されたので使ってみた
画像の枠外を新たに描き足せるAIアプリ「Uncrop」が無料公開されたので使ってみた
資料や作品を作成していると、「この写真の縦幅を広げたい」といった状況に遭遇しがちです。あの画像生成AI「Stable Diffusion」を用いた無料ウェブアプリ「Uncrop」を使えば、簡単に写真の枠外部分を生成して幅を広げられるとのことなので、実際に使ってみました。
·gigazine.net·
画像の枠外を新たに描き足せるAIアプリ「Uncrop」が無料公開されたので使ってみた
Adobeが画像生成AI「Firefly エンタープライズ版」で作った画像で訴訟された場合は全額補償すると発表、自社AIは権利侵害していないという自信の表れ
Adobeが画像生成AI「Firefly エンタープライズ版」で作った画像で訴訟された場合は全額補償すると発表、自社AIは権利侵害していないという自信の表れ
Adobeが2023年6月8日に、独自のジェネレーティブAIを企業など法人向けに提供する「Adobe Firefly エンタープライズ版」を発表しました。Fireflyは、Adobeが権利を保有する画像やパブリックドメインの画像など著作権的にクリアな画像のみでトレーニングされており、Adobeは「Fireflyで画像を作った企業が権利侵害で訴訟を起こされた場合には法的に補償する」としています。
·gigazine.net·
Adobeが画像生成AI「Firefly エンタープライズ版」で作った画像で訴訟された場合は全額補償すると発表、自社AIは権利侵害していないという自信の表れ
「描いたイラストをリアルタイムでAIに手直ししてもらえる環境」を「Stable Diffusion」と「Redream」の組み合わせで実現する方法まとめ、ControlNetも使って高品質な画像を生成可能
「描いたイラストをリアルタイムでAIに手直ししてもらえる環境」を「Stable Diffusion」と「Redream」の組み合わせで実現する方法まとめ、ControlNetも使って高品質な画像を生成可能
画像生成AI「Stable Diffusion」の登場以来、コミュニティの有志たちによって多くのAIツールが開発されています。コミュニティ製ツールの1つである「Redream」は「PCの画面内の一部を常にキャプチャし、キャプチャした画像をimg2imgに流し込んで画像を生成し続ける」という機能を持っています。Redreamを使ってみたところ「描いたイラストをリアルタイムでAIに手直ししてもらえる環境」というメチャクチャ便利な環境を構築できたので、インストール手順や使い方をまとめてみました。
·gigazine.net·
「描いたイラストをリアルタイムでAIに手直ししてもらえる環境」を「Stable Diffusion」と「Redream」の組み合わせで実現する方法まとめ、ControlNetも使って高品質な画像を生成可能
無料&リアルタイムで顔・手・全身の動きを3Dアバターに反映できるモーションキャプチャー技術「SysMocap」
無料&リアルタイムで顔・手・全身の動きを3Dアバターに反映できるモーションキャプチャー技術「SysMocap」
VTuber(バーチャルYouTuber)・AR・VR向けに、ウェブカメラで撮影した顔や手や全身の動きを3Dアバターにリアルタイムで反映させるモーションキャプチャー技術「SysMocap」が公開されています。Windows・macOS・Linuxで動作し、ローカル環境に無料で簡単に導入できるので、実際に使ってみました。
·gigazine.net·
無料&リアルタイムで顔・手・全身の動きを3Dアバターに反映できるモーションキャプチャー技術「SysMocap」
セクハラ抗議で警察に連行された女子レスリング選手の「笑顔」が加工によるものと判明、うわべだけの抗議活動との印象操作
セクハラ抗議で警察に連行された女子レスリング選手の「笑顔」が加工によるものと判明、うわべだけの抗議活動との印象操作
2023年5月28日、インドのレスリング選手であるビネシュ・フォガト氏ら数人が未成年を含む少なくとも7人の女子レスリング選手へのセクハラ疑惑に抗議し、警察に拘束されました。SNSでは連行されるフォガト氏らが笑顔で映っている写真が拡散されていますが、これは笑顔に加工したフェイク画像であることを、複数のメディアが指摘しています。
·gigazine.net·
セクハラ抗議で警察に連行された女子レスリング選手の「笑顔」が加工によるものと判明、うわべだけの抗議活動との印象操作
「異物を検出」「カメラがふさがれると検出」といった複数のタイプを指定して録画が可能なSynologyのIPカメラ「BC500」の検出機能をチェックしてみた
「異物を検出」「カメラがふさがれると検出」といった複数のタイプを指定して録画が可能なSynologyのIPカメラ「BC500」の検出機能をチェックしてみた
SynologyのNASと監視ツールのSurveillance Stationを組み合わせ、設定や過去の録画の管理などを月額利用料なしで利用できるSynologyのIPカメラが「BC500」です。外観撮影とセットアップ、実際にどんな映像が撮れるのかの確認をこれまで行ってきたので、今度はBC500に搭載されたモーション検出機能を深掘りするべく、ライブ映像にさまざまな検出タイプを設定して「何をどのように検出するのか」を詳しく決めることができるSurveillance Stationの「ライブビュー分析」を使ってみました。
·gigazine.net·
「異物を検出」「カメラがふさがれると検出」といった複数のタイプを指定して録画が可能なSynologyのIPカメラ「BC500」の検出機能をチェックしてみた