画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2587 bookmarks

Custom sorting

リアル写真と判別不能なレベルの偽画像をAIが生成可能になるGANs向けアーキテクチャをNVIDIAが作成

NVIDIAの研究者たちが、敵対的生成ネットワーク(GANs)のための新しいスタイルベースのジェネレーターアーキテクチャを提案する論文を公開しました。このアーキテクチャは、教師なし分類における高レベルの属性(例えば、人の顔を学習させた場合のポーズやアイデンティティ)や、生成された画像(例えば髪の毛)の確率的変化などを使いやすいものにし、スケール特有の合成制御を可能にするためのものだそうです。

·gigazine.net·May 28, 2020

リアル写真と判別不能なレベルの偽画像をAIが生成可能になるGANs向けアーキテクチャをNVIDIAが作成

機械学習によって衛星写真からソーラーパネルの位置と規模を正確に特定する「DeepSolar」

建物の屋上から屋外の大規模施設まで、さまざまな場所で太陽光発電の運用が可能なソーラーパネルは世界各地で利用されています。そんな太陽光発電の出力を正確に把握するために、人工衛星から撮影した画像をAIで分析することで太陽光パネルの位置と規模を正確に把握する「DeepSolar」をスタンフォード大学が進めています

·gigazine.net·May 28, 2020

機械学習によって衛星写真からソーラーパネルの位置と規模を正確に特定する「DeepSolar」

無料で画像の編集やリサイズなどの一括処理プログラムを作れる「ImBatch」を使ってみた

無料のソフトでも画像の編集やリサイズなどはできますが、大量の画像ファイルをひとつずつ処理するのは大変です。「ImBatch」は画像に「テキストを入れる」「明るさを変える」「画像を一定の大きさにリサイズする」などの処理を組み合わせて、自分だけのバッチ処理を作ることができるフリーソフトです。

·gigazine.net·May 28, 2020

無料で画像の編集やリサイズなどの一括処理プログラムを作れる「ImBatch」を使ってみた

無料でウェブ画像から物体を切り抜き透過PNGを作成できるChrome拡張「物体認識切り抜きで透過画像作成」

画像の中から特定の物体だけを切り抜く作業を手動で行うのはかなりおっくうなものです。Google Chromeの拡張機能「物体認識切り抜きで透過画像作成」を使えば、画像ファイルやウェブページの画像から対象の物体だけを自動で切り出して、透過型PNGファイルを出力できます。

·gigazine.net·May 28, 2020

無料でウェブ画像から物体を切り抜き透過PNGを作成できるChrome拡張「物体認識切り抜きで透過画像作成」

リアルタイムでムービーから自分の背景を削除して合成できる「XSplit VCam」レビュー

Skypeなどのサービスを利用すれば、インターネットを介してリアルタイムに相手の顔を見ながら会話することができますが、生活感あふれるお部屋が映ったり、カメラに余計なものが入ったりするのは避けたいもの。通話の相手が友達や家族ではなく職場の同僚やビジネスの相手ならなおさらです。「XSplit VCam」はグリーンバックなどの機材や編集が不要でリアルタイムに自分の背景を消したり、別の風景に差し替えたりできる便利なソフトとのことなので、実際にインストールして使ってみました。

·gigazine.net·May 28, 2020

リアルタイムでムービーから自分の背景を削除して合成できる「XSplit VCam」レビュー

スマホのカメラを生物に向けると自動的＆速攻で名前や生態が表示される「LINNÉ LENS」で世界に一つだけの生き物図鑑を作ってみた

スマホをかざすだけで生き物の名前がわかるだけでなく、生態や絶滅危険度などの詳細を表示してくれるiOS向けのアプリが「LINNÉ LENS」です。日本の動物園や水族館の生き物の9割以上を認識し、自分だけの生き物図鑑を作ることができるとのことなので、実際に水族館に行って試してみました。

·gigazine.net·May 28, 2020

スマホのカメラを生物に向けると自動的＆速攻で名前や生態が表示される「LINNÉ LENS」で世界に一つだけの生き物図鑑を作ってみた

サムスンが一眼レフ撮影のストック写真を使って「スマホでボカシ撮影」の画像を作成していたことが判明

Samsungが販売しているスマートフォン「Galaxy A8 Star」の商品紹介ページで「背景ボカシ」の例として使用されている写真が、実際には実機ではなく一眼レフのデジタルカメラで撮影した画像素材を加工して作成されていたことが明らかになりました。画像の流用を発見したのは、写真のモデルにもなっている撮影者本人です。

·gigazine.net·May 28, 2020

サムスンが一眼レフ撮影のストック写真を使って「スマホでボカシ撮影」の画像を作成していたことが判明

AIでリアル映像から3DCGのバーチャル世界を生成する方法をNVIDIAが公開、3D環境構築のコストが大幅カット可能に

NVIDIAが世界で初めて「現実世界の映像から3DCGのバーチャル環境を構築」可能なAIを開発することに成功しました。AIが生成する3DCGの仮想環境は、自動運転カーの訓練やゲーム、VRにも利用可能であり、従来の方法よりも3D環境を構築するために必要となる時間とコストが格段に削減できるようになります。

·gigazine.net·May 28, 2020

AIでリアル映像から3DCGのバーチャル世界を生成する方法をNVIDIAが公開、3D環境構築のコストが大幅カット可能に

成人コンテンツを禁止したTumblrのガバガバ過ぎるAIがポルノ画像と判定してしまった健全な画像まとめ

アダルトコンテンツの投稿禁止を新ガイドラインに設けたミニブログサービス・Tumblrが、独自の人工知能(AI)を利用してTumblr上に投稿された画像の中からアダルトコンテンツに相当するものを自動で選別し、警告を送り出しています。しかし、このアルゴリズムの判定があまりにもお粗末なために、健全な画像もポルノ判定を下されまくっていると話題になっていて、Twitterでは次々と報告があがっています。

·gigazine.net·May 28, 2020

成人コンテンツを禁止したTumblrのガバガバ過ぎるAIがポルノ画像と判定してしまった健全な画像まとめ

クリックするだけで性別・年齢・髪型などを自然に変化させてリアルな顔写真を生成できる「TL-GAN」

機械学習の技術が進むことで、特徴を記述するだけでコンピューターがぴったりの画像を生成してくれる画像生成モデルが開発されています。従来のように巨大なマシンパワーを使うことなく、効率的に顔の特徴を自由に変更できる画像生成モデル「TL-GAN」をニューラルネットワーク研究者のシャオボ・グアン氏が開発しています。

·gigazine.net·May 28, 2020

クリックするだけで性別・年齢・髪型などを自然に変化させてリアルな顔写真を生成できる「TL-GAN」

何の変哲もない画像にAIが自動で幽霊を合成してくれるシステム「AI Spirits」を学生が開発

不可思議な存在を信じて心霊写真の撮影に熱意を燃やす心霊愛好家は、夜中に心霊スポットや墓地に出向いてカメラを回し、「幽霊」や「死者の魂」といったものが映り込むことを期待します。心霊現象が撮れたと思ったものの多くは、微妙な光をカメラセンサーが捉えてぼやけた光が映り込んだだけの単なる勘違いですが、マサチューセッツ工科大学の学生が普通の画像に幽霊を合成するシステム「AI Spirits」を開発しました。

·gigazine.net·May 28, 2020

何の変哲もない画像にAIが自動で幽霊を合成してくれるシステム「AI Spirits」を学生が開発

握って操作できる「Active Edge」やGoogleレンズなど、Google Pixel 3の新機能をいろいろ触ってみた

2018年11月1日に日本国内でも発売された「Pixel 3」はQualcommのチップセット「Snapdragon 845」と握って操作できる「Active Edge」を搭載し、人工知能(AI)がさまざまな機能をサポートしてくれるというGoogle純正のハイエンドスマートフォンです。そんなPixel 3ではいったいどんなことができるのか、実際にいろいろ触ってみました。

·gigazine.net·May 28, 2020

握って操作できる「Active Edge」やGoogleレンズなど、Google Pixel 3の新機能をいろいろ触ってみた

「歩き方だけで個人を識別する」監視システムが中国で注目されている

社会の安全を保つための監視システムでは機械が個人の顔を見分けるようなことも一般的になっていますが、顔が隠されていたり解像度が高くないと判別しにくかったりと欠点も多くあります。そんな欠点をカバーする新しい施策として、「歩き方解析」を押し進めていると中国当局が発表しました。

·gigazine.net·May 28, 2020

「歩き方だけで個人を識別する」監視システムが中国で注目されている

銀河が衝突しブラックホールが急成長する瞬間の様子が捉えられる

回転する銀河の中心にある銀河核が2つ存在する銀河の写真がハッブル宇宙望遠鏡とW・M・ケック天文台によって撮影されました。これは銀河と銀河が衝突合体する時のみ発生する現象で、2つの銀河核の存在によって、2つのブラックホールが急速に成長している様子が観測されています。

·gigazine.net·May 28, 2020

銀河が衝突しブラックホールが急成長する瞬間の様子が捉えられる

Scale AIが自動運転車の開発向けに無料のLIDARデータセットをリリース

Scale AIはソフトウェアと人間の力を合わせて、機械学習アルゴリズムを開発する企業向けに画像、LIDAR、地図データを処理し、ラベルを付けるスタートアップだ。Scale AIの顧客基盤の大半は自動運転車技術に取り組む企業が占めている。

·jp.techcrunch.com·May 28, 2020

Scale AIが自動運転車の開発向けに無料のLIDARデータセットをリリース

このニューラルネットワークは、白黒写真に正しい色の「幻覚」を起こさせる

機械が支配する未来は、歴史から白黒写真を排除してしまうかもしれない。必要なのは、バークレーのコンピュータ科学者、Richard Zhangの作ったこのシステムだけだ。魂のないシリコンの感性があらゆるモノクロ写真に色の「幻覚」を起こさせる。

·jp.techcrunch.com·May 28, 2020

このニューラルネットワークは、白黒写真に正しい色の「幻覚」を起こさせる

Apple、iPhoneに顔認識と物体認識を導入

何年か前にレストランで撮ったあの写真を覚えているだろうか？バーで友達に見せたい、あのすてきなデザートは？これまでは何千枚もの写真をスクロールして探さなくてはならなかった。iOS 10の新しい写真アプリで、Appleは高度なコンピュータビジョン技術を駆使して、写真の発見やグループ分けを容易にした。

·jp.techcrunch.com·May 28, 2020

Apple、iPhoneに顔認識と物体認識を導入

顔認識システム、百万人の顔データベースに大苦戦

遍在するビデオカメラと高度な顔認識技術によって可能になる恐怖の監視国家を心配している人は多い ― しかし最新の研究によると、最高のアルゴリズムでも、百万人以上の顔を区別するとなると絶対確実からはほど遠いようだ。

·jp.techcrunch.com·May 28, 2020

顔認識システム、百万人の顔データベースに大苦戦

IBMとMIT、視覚と聴覚を人間のように理解するAIを共同研究

人間は何かが起きたのを見たり聞いたりした時、すぐにそれを言葉で表現できる。「青いシャツの女の子が、野球選手の投げたボールをキャッチした」とか「犬が海辺を走っている」とか。私たちにとっては簡単なしごとだが、コンピューターにとっては恐ろしく大変だ ― 幸い、IBMとMITが協力して、それを少しやさしくする方法を検討している。

·jp.techcrunch.com·May 28, 2020

IBMとMIT、視覚と聴覚を人間のように理解するAIを共同研究

GoogleはTensorFlowによる画像キャプションモデルをオープンソースに、物認識から状況認識への進化をねらう

ぼくの世代〔John Mannes, 1995/11生〕は、ほぼ全員がInstagramにはまっている。でもぼくは、2015年にこのプラットホームを去った（ごめんなさい）。理由は単純で、どの写真をポストするか、なかなか決められないこと、そして、簡潔で魅力的なキャプションを考えるのに、いつも苦労するからだ。でも、ぼくと同じ問題を抱えているひま人は、Google TensorFlow〔昨年オー…

·jp.techcrunch.com·May 28, 2020

GoogleはTensorFlowによる画像キャプションモデルをオープンソースに、物認識から状況認識への進化をねらう

いまさら聞けないコンピュータービジョン入門

部屋の向こうから誰かがあなたにボールを投げて、あなたがそれをキャッチする。実にシンプルだ。実のところ、これは私たちが理解しようとしてきたプロセスの中でも最も複雑なものの1つだ – ましてや再現は困難だ。私たちが見るように見ることができるマシンを発明することは、見かけ以上に困難な仕事だ、コンピューターにそれをやらせることが難しいというだけでなく、そもそも私たち自身がそれをどのように…

·jp.techcrunch.com·May 28, 2020

いまさら聞けないコンピュータービジョン入門

あの鳥は何だろう？と思ったら写真を撮って鳥認識アプリMerlinに見せよう、数秒で分かる

あれはヒメハジロかな？それともオオバン？アビじゃないの？ではなるべく近くで写真を撮り、鳥の種を確認するアプリMerlinに見せよう。数秒で教えてくれるから、まるでそれは、鳥類学者になりたいきみのためのShazamだね。

·jp.techcrunch.com·May 28, 2020

あの鳥は何だろう？と思ったら写真を撮って鳥認識アプリMerlinに見せよう、数秒で分かる

コンピュータービジョンで家具を特定するGrokstyleは200万ドルを調達済

いつもこんな技術があればいいのにと思っていたことの1つは、携帯電話を何かに向けて写真を撮れば、それが何かと、どこでそれが買えるかを教えてくれるような能力だ。そんな私の贅沢な大量消費の夢が叶い始めているようだ。Grokstyleはその夢の実現に取組んでいる企業の1つだが、同社の技術はどんな角度の写真からでも家具や家庭の装飾品を自動的に特定してくれる。基本的なアイデアは以下のようなものだ。アプ…

·jp.techcrunch.com·May 28, 2020

コンピュータービジョンで家具を特定するGrokstyleは200万ドルを調達済

VarCityは、オンラインで集めた画像から都市の3Dマップを作る

今や世界中の主要都市では、いつでもあらゆる角度から写真やビデオが撮影されている。理論的には、十分な数が集まれば道路や建物の配置がわかる ―― 待て、理論的に？いや実際に、だ。VarCityというプロジェクトがスイスのチューリッヒを再現するデモを見せてくれた。複数年にわたるこの取り組みは、数多くのオンライン資源 ―― ソーシャルメディア、公開ウェブカメラ、車載カメラ、空中写真など ―― か…

·jp.techcrunch.com·May 28, 2020

VarCityは、オンラインで集めた画像から都市の3Dマップを作る

この顔認識システムは、映画の観客が喜んでいるかどうかを追跡する

映画制作がアートと同じくらいサイエンスになってきた今、映画会社は観客の反応を測定するためにかつてない方法を必要としている。喜んでくれたのだろうか？どのくらい…正確には？42分の時点で？カリフォルニア工科大学とDisney Researchは、表情認識ニューラルネットワークを使って、観客の反応を知り、予測しようとしている。次世代のニールセンレーティングの基盤になるかもしれない。

·jp.techcrunch.com·May 28, 2020

この顔認識システムは、映画の観客が喜んでいるかどうかを追跡する

GoogleがコンピュータービジョンアプリFabbyを作ったAIMatterを買収、広告技術のイノベーションに利用か

【抄訳】 Googleがベラルーシで生まれたコンピュータービジョンのスタートアップAIMatterを買収した。同社は、画像の検出と処理をモバイルデバイスの上で高速に行うニューラルネットワークベースのAIプラットホームおよびSDKと、その技術の概念実証のような写真/ビデオ編集アプリFabbyを作っている。

·jp.techcrunch.com·May 28, 2020

GoogleがコンピュータービジョンアプリFabbyを作ったAIMatterを買収、広告技術のイノベーションに利用か

TechCrunch fait désormais partie de Verizon Media

·jp.techcrunch.com·May 28, 2020

TechCrunch fait désormais partie de Verizon Media

即答せよ！このシステムは問題に答える顔を見て人間であることを確認する

ボットとの戦いに終りはない。しかし、誰もが密かに想像しているスカイネットのようなシナリオでは終わらないことを望みたい。ちなみに、今重要なのはスパムを退治することで、組織的殺人を防ぐことではない。それでも、機会はますます賢くなり、単純な顔認識だけでは人間の識別に十分ではないこともある。今や機械は顔を作ることもできる —— しかし、質問に答えるときの顔を作るのは不得意のよ…

·jp.techcrunch.com·May 28, 2020

即答せよ！このシステムは問題に答える顔を見て人間であることを確認する

ローエンド車載CPUでも実現可能な自動運転技術

高価でかさばるハードウエアに依存しないコンピュータービジョン技術を提供する方法を開発したあるスタートアップが資金調達に成功した。

·jp.techcrunch.com·May 28, 2020

ローエンド車載CPUでも実現可能な自動運転技術

写真に写ってるものを音声で聞けるマイクロソフトのSeeing AIアプリ

Seeing AIは、目の不自由な人が視覚データをオーディオに変換できるアプリだが、今回便利な機能がひとつ増えた。

·jp.techcrunch.com·May 28, 2020

写真に写ってるものを音声で聞けるマイクロソフトのSeeing AIアプリ