画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2839 bookmarks
Custom sorting
「動物の表情を別の動物に当てはめるAI」をNVIDIAが開発、デモ用のウェブサイトも公開中
「動物の表情を別の動物に当てはめるAI」をNVIDIAが開発、デモ用のウェブサイトも公開中
人間は頭の中で、「飼っているネコのようにあくびをするライオン」や「柴犬のように笑うオオカミ」の顔を想像することができますが、コンピューターにとっては動物の表情を認識し、別の動物に当てはめて画像を生成する作業は困難だそうです。高性能なGPUを開発・販売することで知られるNVIDIAは、このタスクを実現する「GANimal」という新たなAIを開発しました。
·gigazine.net·
「動物の表情を別の動物に当てはめるAI」をNVIDIAが開発、デモ用のウェブサイトも公開中
Photoshopのカメラアプリ「Photoshop Camera」は自作イラストをレンズフィルターとして利用可能、詳細はこんな感じ
Photoshopのカメラアプリ「Photoshop Camera」は自作イラストをレンズフィルターとして利用可能、詳細はこんな感じ
すべての「つくる人」に力を、ということで、Adobeが新たにPhotoshopの効果をリアルタイムで体験できるカメラアプリ「Photoshop Camera」を現地時間の2019年11月4日付で発表しました。Adobeの人工知能である「Adobe Sensei」はカメラが何を撮影しているかを瞬時に認識してレコメンデーションを提示し画像処理をその場で提供。さらに、ダイナミックレンジや色調など被写体の特徴も理解して画像調整を自動的に提供するとのこと。
·gigazine.net·
Photoshopのカメラアプリ「Photoshop Camera」は自作イラストをレンズフィルターとして利用可能、詳細はこんな感じ
「撮影後に光の方向を変える技術」や「一瞬で人物を合成する技術」などフォトショやイラレに実装されるかもなAdobe MAX「SNEAKS」まとめ
「撮影後に光の方向を変える技術」や「一瞬で人物を合成する技術」などフォトショやイラレに実装されるかもなAdobe MAX「SNEAKS」まとめ
PhotoshopやIllustratorを開発するAdobeが年に一度開催するお祭り「Adobe MAX」では新製品発表や開発者の講演などのほかに、開発中の最新技術をチラ見せする「SNEAKS」というイベントが行われます。このSNEAKSで「イラストの中に『光源』を埋め込む技術」「写真が撮影された時間を後から巻き戻したり進めたりする技術」「音声中の『あー』『うー』という部分だけを一瞬で全て取り除く技術」「修正された画像を見抜いて速攻で元の形に戻す技術」などが発表されたので、まとめてみました。
·gigazine.net·
「撮影後に光の方向を変える技術」や「一瞬で人物を合成する技術」などフォトショやイラレに実装されるかもなAdobe MAX「SNEAKS」まとめ
「画像検索はここまで来たのか」とすさまじさを実感するAdobeのAI「Adobe Sensei」の秘密を開発者が解説
「画像検索はここまで来たのか」とすさまじさを実感するAdobeのAI「Adobe Sensei」の秘密を開発者が解説
近年はソフトウェア開発の場の多くで人工知能(AI)が利用されており、その活用の場は1日1000個のA/Bテストを行う「Booking.com」や配車アプリLyftのマーケティングを自動化までさまざまです。Photoshopの開発元であるAdobeのAI「Adobe Sensei」も機械学習を利用していますが、「他とは違う独特のデータ」を持っているがゆえに、画像検索や動画編集などのレベルがすさまじいことになっています。
·gigazine.net·
「画像検索はここまで来たのか」とすさまじさを実感するAdobeのAI「Adobe Sensei」の秘密を開発者が解説
巨大写真データセット「ImageNet」で攻撃的・差別的なカテゴリー分類タグ付けが判明し人物写真の半数以上を削除
巨大写真データセット「ImageNet」で攻撃的・差別的なカテゴリー分類タグ付けが判明し人物写真の半数以上を削除
2009年から運用されている膨大なサイズの写真データセット「ImageNet」の「人物」カテゴリーで、人種差別的・女性蔑視的なものを含むカテゴリー分類がなされていることが明らかになり、120万人分の写真のうち半数以上が削除されることになりました。
·gigazine.net·
巨大写真データセット「ImageNet」で攻撃的・差別的なカテゴリー分類タグ付けが判明し人物写真の半数以上を削除
500円のギフト券でホームレスをだましてGoogleの顔認証改良用3Dデータが収集されていたことが明らかに
500円のギフト券でホームレスをだましてGoogleの顔認証改良用3Dデータが収集されていたことが明らかに
Pixel 4の顔認証機能を改良するため、Googleの下請け企業がお金に困窮するホームレスや学生を対象に、ギフトカードと引き替えに顔の3Dスキャンデータを収集するという戦略を取っていたことがわかりました。3Dスキャンはまるで「ゲーム」や「調査」かのように説明されており、主に肌の色が暗い人を対象としたものだったことが明らかにされています。
·gigazine.net·
500円のギフト券でホームレスをだましてGoogleの顔認証改良用3Dデータが収集されていたことが明らかに
Googleがスマホのカメラで手の動きを高精度でリアルタイムトラッキングする技術を開発
Googleがスマホのカメラで手の動きを高精度でリアルタイムトラッキングする技術を開発
GoogleのAI開発チームは、コンピュータービジョンに関する国際会議のCVPR 2019において、リアルタイムで手の動きをトラッキングする機械学習システムを、Googleが提供するオープンソースフレームワークであるMediaPipeに実装すると発表しました。手や指の動きを追跡する既存のハンドトラッキングシステムは、高性能なデスクトップ環境に依存してきましたが、Googleは新たにスマートフォンのカメラでリアルタイムのトラッキングを可能にした上に、複数の手もトラッキングできると説明しています。
·gigazine.net·
Googleがスマホのカメラで手の動きを高精度でリアルタイムトラッキングする技術を開発
キーワードを入力するだけで自動でAIがイメージに合わせたロゴを作成してくれる「Designwithai」
キーワードを入力するだけで自動でAIがイメージに合わせたロゴを作成してくれる「Designwithai」
ロゴを作成したい製品やブランドの名称と、イメージが当てはまるキーワードを入力するだけで、人工知能(AI)が自動で素早くロゴを生成してくれるサービスが「Designwithai」です。ロゴは自動で複数種類生成され、そのままダウンロードしてもよし、フォントや各要素の配置を微調整可能なカスタマイズツールを使ってもよしとなっています。
·gigazine.net·
キーワードを入力するだけで自動でAIがイメージに合わせたロゴを作成してくれる「Designwithai」
商用利用可能な二次元キャラを好みに合わせて描いてくれるAI「彩」にイラストを描いてもらった
商用利用可能な二次元キャラを好みに合わせて描いてくれるAI「彩」にイラストを描いてもらった
機械学習の進歩に伴ってさまざまな画像を生成するAIが作られており、「マジック:ザ・ギャザリング」のカードを自動で生成してくれるAIや、架空のアイドルを自動生成してくれるAIなどが誕生しています。AIイラストレーター「彩(さい)」は、数クリックするだけで好みの顔のイラストを描いてくれるウェブサービスで、描かれたイラストをダウンロードして商用利用することも可能となっています。
·gigazine.net·
商用利用可能な二次元キャラを好みに合わせて描いてくれるAI「彩」にイラストを描いてもらった
無料で使えるGoogleの軽量&オフラインで写真管理可能なアプリ「Gallery Go」レビュー
無料で使えるGoogleの軽量&オフラインで写真管理可能なアプリ「Gallery Go」レビュー
Googleが写真を簡単に管理できるギャラリーアプリ「Gallery Go」をリリースしました。クラウドストレージサービスの「Google フォト」と異なり、ローカルに保存された写真のみを扱うので通信が発生せず、動作も軽量でサクサク使用できるとのことなので、実際に使い勝手を確認してみました。
·gigazine.net·
無料で使えるGoogleの軽量&オフラインで写真管理可能なアプリ「Gallery Go」レビュー
AIが自分好みのアニメ美少女を自動生成してくれる「Waifu Labs」で「俺の嫁」を作ってみた
AIが自分好みのアニメ美少女を自動生成してくれる「Waifu Labs」で「俺の嫁」を作ってみた
自分の好みに合わせて人工知能(AI)が二次元の美少女イラストを無料で生成してくれるサービスが「Waifu Labs」です。Waifu Labsは、2019年7月上旬にアメリカ・ロサンゼルスで開催された「Anime Expo 2019」に出展して話題となった「Waifu Vending Machine(俺の嫁自動販売機)」のシステムで、開発したSizigi Studiosによって無償公開されています。
·gigazine.net·
AIが自分好みのアニメ美少女を自動生成してくれる「Waifu Labs」で「俺の嫁」を作ってみた
地球温暖化を招くメタンガスの排出を人工衛星から監視する取り組みが民間企業主体で始まっている
地球温暖化を招くメタンガスの排出を人工衛星から監視する取り組みが民間企業主体で始まっている
天然ガスの主成分であるメタンガスは、二酸化炭素の80倍以上の温室効果を持つといわれています。メタンガスは化石燃料の生産や消費だけではなく、埋め立て地や大規模牧場で飼育される牛のげっぷからも発生しますが、そんなメタンガスの排出量を人工衛星からモニタリングするというサービスを提供する民間企業が出てきていると、科学系メディアのScientific Americanが報じています。
·gigazine.net·
地球温暖化を招くメタンガスの排出を人工衛星から監視する取り組みが民間企業主体で始まっている
女性の写真を1クリックで裸にしてしまう「DeepNude」が登場
女性の写真を1クリックで裸にしてしまう「DeepNude」が登場
AIを用いて有名女優のポルノ映像を作成するという「フェイクポルノ」が2017年末から2018年にかけて大流行しましたが、これと同じようにAIやニューラルネットワークを用いることで、女性の写真から服だけを削除して裸にしてしまうという凶悪なアプリケーション「DeepNude」が登場しています。
·gigazine.net·
女性の写真を1クリックで裸にしてしまう「DeepNude」が登場
フェイクポルノを正式に違法とする地域が初めて登場
フェイクポルノを正式に違法とする地域が初めて登場
元交際相手や元配偶者の日常での画像・映像とポルノムービーを合成させる「フェイクポルノ」は、リベンジポルノとして使われる可能性が問題視されています。ターゲットとなった相手を精神的にも社会的にも傷つけるフェイクポルノを、正式に規制した法律がアメリカ・バージニア州で2019年7月1日(月)から施行されました。
·gigazine.net·
フェイクポルノを正式に違法とする地域が初めて登場
2000年以上にわたって科学者を悩ませた「レンズの収差問題」がついに解決される
2000年以上にわたって科学者を悩ませた「レンズの収差問題」がついに解決される
「古代ギリシャの科学者であるアルキメデスが凹面鏡で太陽光を集めて敵艦を焼き払った」という伝説がある通り、光学の歴史の始まりは2000年以上前に遡ります。そんな光学の歴史上で人類が2000年以上も解決できなかった「レンズの収差の解消」という難問をメキシコの大学院生が数学的に解決したと報じられています。
·gigazine.net·
2000年以上にわたって科学者を悩ませた「レンズの収差問題」がついに解決される
Googleが映像からリアルタイムで動く人物を消し去る技術を開発、ムービーが公開中
Googleが映像からリアルタイムで動く人物を消し去る技術を開発、ムービーが公開中
ディープラーニングを用いて静止画から物体を取り除いて補正する技術などは既に実現していますが、Googleはさらに映像の「奥行き」に着目することで、ムービーから人や物を消したり、実際には存在しないオブジェクトを合成する技術の開発を進めています。
·gigazine.net·
Googleが映像からリアルタイムで動く人物を消し去る技術を開発、ムービーが公開中
GoogleのAIが「ムービーの最初と最後のコマ」から途中のコマを生成することに成功
GoogleのAIが「ムービーの最初と最後のコマ」から途中のコマを生成することに成功
GoogleのAI研究チームが査読前論文の公開サイトarXivに掲載した論文によれば、新たに開発したAIでムービーの最初と最後のコマだけを手がかりに、抜け落ちた途中のコマを生成することに成功したそうです。
·gigazine.net·
GoogleのAIが「ムービーの最初と最後のコマ」から途中のコマを生成することに成功
「声」から話者の顔画像を生成するAIが開発される
「声」から話者の顔画像を生成するAIが開発される
話している人の「声」だけでも、性別・年齢や、ときには出身地などの情報が判別できます。「Speech2Face」は人の声と話し方から話者の顔を予想して画像を生成するというAIで、音声から人の身体的特徴を導き出すために開発されています。
·gigazine.net·
「声」から話者の顔画像を生成するAIが開発される
AIを駆使してPhotoshopで加工された画像を識別&元の画像に戻すことができるツールをAdobeが作成
AIを駆使してPhotoshopで加工された画像を識別&元の画像に戻すことができるツールをAdobeが作成
画像編集ソフトウェアとして有名な「Adobe Photoshop」は、上手く使えば画像の原型をとどめないレベルのスーパー魔改造が行えるほど有能なソフト。素人目で写真がPhotoshopで加工されているかどうかを見抜くのは、非常に困難なレベルにまで進化しています。そんなPhotoshopで加工された画像を、ニューラルネットワークを用いて判別するという試みをAdobeが自ら行っています。
·gigazine.net·
AIを駆使してPhotoshopで加工された画像を識別&元の画像に戻すことができるツールをAdobeが作成
ニューラルネットワークで「DOOM」の主人公を「リアル化」して笑顔を取り戻すことに成功
ニューラルネットワークで「DOOM」の主人公を「リアル化」して笑顔を取り戻すことに成功
あるRedditユーザーが大手半導体メーカーのNVIDIAが開発した「StyleGAN」を活用したStyleGANエンコーダーを使って、1993年発売の名作ゲーム「DOOM」の主人公Doomguyのアイコンを現代風のリアルな表現に進化させるという試みが行われています。
·gigazine.net·
ニューラルネットワークで「DOOM」の主人公を「リアル化」して笑顔を取り戻すことに成功
「料理画像からレシピを生成するAI」を体験できるウェブアプリが登場
「料理画像からレシピを生成するAI」を体験できるウェブアプリが登場
2018年12月にオープンアクセスの論文公開サービスであるarXiv上で公開された論文の中で、「写真に写った料理のレシピを自動生成するAI」が発表されました。このAIを手軽に体験できるウェブアプリ「料理画像からレシピを生成するAI」が公開されています。
·gigazine.net·
「料理画像からレシピを生成するAI」を体験できるウェブアプリが登場
Adobeがゴッホやフェルメールの「絵筆のタッチ」を学習して技法を再現するAIを開発
Adobeがゴッホやフェルメールの「絵筆のタッチ」を学習して技法を再現するAIを開発
AIは写真などの画像の認識や生成に強みを持っていて、「AI作の肖像画が5000万円で落札される」など、芸術分野においても目覚ましい発達を遂げています。そんな中、絵画における「絵筆のタッチ」を学習し、ダ・ヴィンチやゴッホ、フェルメールの名画にみられる技法を再現するAIをAdobeが開発しています。
·gigazine.net·
Adobeがゴッホやフェルメールの「絵筆のタッチ」を学習して技法を再現するAIを開発
ハッブル望遠鏡の捉えた渦状銀河の高画質画像をネットで公開
ハッブル望遠鏡の捉えた渦状銀河の高画質画像をネットで公開
M101という星雲らしいですが、Photoshopで作ったみたいにキレイに撮影できてますね。というか、たぶん可視画像になるように加工したあとのモノだとは思うのですが、それにしても巨大さを感じさせるあたり、さすが本物。
·gigazine.net·
ハッブル望遠鏡の捉えた渦状銀河の高画質画像をネットで公開
食べ物の写真をおいしそうに自動補正してくれる無料ウェブサービス「超!美味しく変換」
食べ物の写真をおいしそうに自動補正してくれる無料ウェブサービス「超!美味しく変換」
以前紹介したデジカメ写真を自動的においしそうに補正してくれるウェブサービス「美味しく変換」がバージョンアップし、今日2月1日(月)から「超!美味しく変換」としてリリースされました。
·gigazine.net·
食べ物の写真をおいしそうに自動補正してくれる無料ウェブサービス「超!美味しく変換」
マルチコア対応で画像リサイズ・フォーマット変換などの一括高速処理が可能なフリーソフト「Ralpha」
マルチコア対応で画像リサイズ・フォーマット変換などの一括高速処理が可能なフリーソフト「Ralpha」
JPEG/TIFF/PNG/BMP/GIF/ICO/HD PhotoをJPEG/PNG/BMPへ変換、回転/トリミング/縁取り/色調補正/アンシャープマスク/文字入れなどの加工、Exif情報とICCプロファイルの引継ぎ、連番や写真の撮影日を使用したリネーム、SIMD化とマルチコア対応による高速な一括処理、αチャンネル付き画像対応、Lanczos/Spline36/Bicubicなど9種類のリサイズアルゴリズム搭載、Susie Plug-in/WIC(Windows Imaging Component)対応といったことができるソフトが「Ralpha」です。
·gigazine.net·
マルチコア対応で画像リサイズ・フォーマット変換などの一括高速処理が可能なフリーソフト「Ralpha」
食べ物の大きさを変えることで満腹感をもたらすダイエット装置
食べ物の大きさを変えることで満腹感をもたらすダイエット装置
「満腹感」は現実の摂取量だけでなく見た目や周辺状況から総合的に判断される、ということが近年の研究によって分かってきましたが、それを元に、食べる量を調整するのではなく食べ物の大きさを変えることで視覚から満腹感を得ようというのが拡張満腹感の研究。カメラを通して食べ物を見ることで食べ物の大きさを自由に調整できるヘッドセットが開発されており、Digital Content Epo 2012で実際に使用している様子がYouTubeにアップされています。
·gigazine.net·
食べ物の大きさを変えることで満腹感をもたらすダイエット装置
画像の捏造を見抜くソフトウェア「LP-exam」が不正を検出している仕組みはこんな感じ
画像の捏造を見抜くソフトウェア「LP-exam」が不正を検出している仕組みはこんな感じ
東京大学の生命科学の研究者が中心となって2014年3月に設立したベンチャー企業「LPixel(エルピクセル)」が、最先端の画像処理技術を応用して「切り貼りや加工などの不自然な箇所がないか」を検出するソフトウェア「LP-exam」を開発しました。現在、サイト上でオンライン版が無料公開されていて、Natureに掲載されたSTAP論文を実例としてどのように不正を検出しているのかを解説するムービーも公開されています。
·gigazine.net·
画像の捏造を見抜くソフトウェア「LP-exam」が不正を検出している仕組みはこんな感じ