画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2306 bookmarks
Custom sorting
握って操作できる「Active Edge」やGoogleレンズなど、Google Pixel 3の新機能をいろいろ触ってみた
握って操作できる「Active Edge」やGoogleレンズなど、Google Pixel 3の新機能をいろいろ触ってみた
2018年11月1日に日本国内でも発売された「Pixel 3」はQualcommのチップセット「Snapdragon 845」と握って操作できる「Active Edge」を搭載し、人工知能(AI)がさまざまな機能をサポートしてくれるというGoogle純正のハイエンドスマートフォンです。そんなPixel 3ではいったいどんなことができるのか、実際にいろいろ触ってみました。
·gigazine.net·
握って操作できる「Active Edge」やGoogleレンズなど、Google Pixel 3の新機能をいろいろ触ってみた
「歩き方だけで個人を識別する」監視システムが中国で注目されている
「歩き方だけで個人を識別する」監視システムが中国で注目されている
社会の安全を保つための監視システムでは機械が個人の顔を見分けるようなことも一般的になっていますが、顔が隠されていたり解像度が高くないと判別しにくかったりと欠点も多くあります。そんな欠点をカバーする新しい施策として、「歩き方解析」を押し進めていると中国当局が発表しました。
·gigazine.net·
「歩き方だけで個人を識別する」監視システムが中国で注目されている
銀河が衝突しブラックホールが急成長する瞬間の様子が捉えられる
銀河が衝突しブラックホールが急成長する瞬間の様子が捉えられる
回転する銀河の中心にある銀河核が2つ存在する銀河の写真がハッブル宇宙望遠鏡とW・M・ケック天文台によって撮影されました。これは銀河と銀河が衝突合体する時のみ発生する現象で、2つの銀河核の存在によって、2つのブラックホールが急速に成長している様子が観測されています。
·gigazine.net·
銀河が衝突しブラックホールが急成長する瞬間の様子が捉えられる
Scale AIが自動運転車の開発向けに無料のLIDARデータセットをリリース
Scale AIが自動運転車の開発向けに無料のLIDARデータセットをリリース
Scale AIはソフトウェアと人間の力を合わせて、機械学習アルゴリズムを開発する企業向けに画像、LIDAR、地図データを処理し、ラベルを付けるスタートアップだ。Scale AIの顧客基盤の大半は自動運転車技術に取り組む企業が占めている。
·jp.techcrunch.com·
Scale AIが自動運転車の開発向けに無料のLIDARデータセットをリリース
このニューラルネットワークは、白黒写真に正しい色の「幻覚」を起こさせる
このニューラルネットワークは、白黒写真に正しい色の「幻覚」を起こさせる
機械が支配する未来は、歴史から白黒写真を排除してしまうかもしれない。必要なのは、バークレーのコンピュータ科学者、Richard Zhangの作ったこのシステムだけだ。魂のないシリコンの感性があらゆるモノクロ写真に色の「幻覚」を起こさせる。
·jp.techcrunch.com·
このニューラルネットワークは、白黒写真に正しい色の「幻覚」を起こさせる
Apple、iPhoneに顔認識と物体認識を導入
Apple、iPhoneに顔認識と物体認識を導入
何年か前にレストランで撮ったあの写真を覚えているだろうか?バーで友達に見せたい、あのすてきなデザートは? これまでは何千枚もの写真をスクロールして探さなくてはならなかった。iOS 10の新しい写真アプリで、Appleは高度なコンピュータビジョン技術を駆使して、写真の発見やグループ分けを容易にした。
·jp.techcrunch.com·
Apple、iPhoneに顔認識と物体認識を導入
顔認識システム、百万人の顔データベースに大苦戦
顔認識システム、百万人の顔データベースに大苦戦
遍在するビデオカメラと高度な顔認識技術によって可能になる恐怖の監視国家を心配している人は多い ― しかし最新の研究によると、最高のアルゴリズムでも、百万人以上の顔を区別するとなると絶対確実からはほど遠いようだ。
·jp.techcrunch.com·
顔認識システム、百万人の顔データベースに大苦戦
IBMとMIT、視覚と聴覚を人間のように理解するAIを共同研究
IBMとMIT、視覚と聴覚を人間のように理解するAIを共同研究
人間は何かが起きたのを見たり聞いたりした時、すぐにそれを言葉で表現できる。「青いシャツの女の子が、野球選手の投げたボールをキャッチした」とか「犬が海辺を走っている」とか。私たちにとっては簡単なしごとだが、コンピューターにとっては恐ろしく大変だ ― 幸い、IBMとMITが協力して、それを少しやさしくする方法を検討している。
·jp.techcrunch.com·
IBMとMIT、視覚と聴覚を人間のように理解するAIを共同研究
GoogleはTensorFlowによる画像キャプションモデルをオープンソースに、物認識から状況認識への進化をねらう
GoogleはTensorFlowによる画像キャプションモデルをオープンソースに、物認識から状況認識への進化をねらう
ぼくの世代〔John Mannes, 1995/11生〕は、ほぼ全員がInstagramにはまっている。でもぼくは、2015年にこのプラットホームを去った(ごめんなさい)。理由は単純で、どの写真をポストするか、なかなか決められないこと、そして、簡潔で魅力的なキャプションを考えるのに、いつも苦労するからだ。 でも、ぼくと同じ問題を抱えているひま人は、Google TensorFlow〔昨年オー…
·jp.techcrunch.com·
GoogleはTensorFlowによる画像キャプションモデルをオープンソースに、物認識から状況認識への進化をねらう
いまさら聞けないコンピュータービジョン入門
いまさら聞けないコンピュータービジョン入門
部屋の向こうから誰かがあなたにボールを投げて、あなたがそれをキャッチする。実にシンプルだ。実のところ、これは私たちが理解しようとしてきたプロセスの中でも最も複雑なものの1つだ – ましてや再現は困難だ。私たちが見るように見ることができるマシンを発明することは、見かけ以上に困難な仕事だ、コンピューターにそれをやらせることが難しいというだけでなく、そもそも私たち自身がそれをどのように…
·jp.techcrunch.com·
いまさら聞けないコンピュータービジョン入門
あの鳥は何だろう?と思ったら写真を撮って鳥認識アプリMerlinに見せよう、数秒で分かる
あの鳥は何だろう?と思ったら写真を撮って鳥認識アプリMerlinに見せよう、数秒で分かる
あれはヒメハジロかな? それともオオバン? アビじゃないの? ではなるべく近くで写真を撮り、鳥の種を確認するアプリMerlinに見せよう。数秒で教えてくれるから、まるでそれは、鳥類学者になりたいきみのためのShazamだね。
·jp.techcrunch.com·
あの鳥は何だろう?と思ったら写真を撮って鳥認識アプリMerlinに見せよう、数秒で分かる
コンピュータービジョンで家具を特定するGrokstyleは200万ドルを調達済
コンピュータービジョンで家具を特定するGrokstyleは200万ドルを調達済
いつもこんな技術があればいいのにと思っていたことの1つは、携帯電話を何かに向けて写真を撮れば、それが何かと、どこでそれが買えるかを教えてくれるような能力だ。そんな私の贅沢な大量消費の夢が叶い始めているようだ。Grokstyleはその夢の実現に取組んでいる企業の1つだが、同社の技術はどんな角度の写真からでも家具や家庭の装飾品を自動的に特定してくれる。 基本的なアイデアは以下のようなものだ。アプ…
·jp.techcrunch.com·
コンピュータービジョンで家具を特定するGrokstyleは200万ドルを調達済
VarCityは、オンラインで集めた画像から都市の3Dマップを作る
VarCityは、オンラインで集めた画像から都市の3Dマップを作る
今や世界中の主要都市では、いつでもあらゆる角度から写真やビデオが撮影されている。理論的には、十分な数が集まれば道路や建物の配置がわかる ―― 待て、理論的に? いや実際に、だ。VarCityというプロジェクトがスイスのチューリッヒを再現するデモを見せてくれた。 複数年にわたるこの取り組みは、数多くのオンライン資源 ―― ソーシャルメディア、公開ウェブカメラ、車載カメラ、空中写真など ―― か…
·jp.techcrunch.com·
VarCityは、オンラインで集めた画像から都市の3Dマップを作る
この顔認識システムは、映画の観客が喜んでいるかどうかを追跡する
この顔認識システムは、映画の観客が喜んでいるかどうかを追跡する
映画制作がアートと同じくらいサイエンスになってきた今、映画会社は観客の反応を測定するためにかつてない方法を必要としている。喜んでくれたのだろうか? どのくらい…正確には?42分の時点で? カリフォルニア工科大学とDisney Researchは、表情認識ニューラルネットワークを使って、観客の反応を知り、予測しようとしている。次世代のニールセンレーティングの基盤になるかもしれない。
·jp.techcrunch.com·
この顔認識システムは、映画の観客が喜んでいるかどうかを追跡する
GoogleがコンピュータービジョンアプリFabbyを作ったAIMatterを買収、広告技術のイノベーションに利用か
GoogleがコンピュータービジョンアプリFabbyを作ったAIMatterを買収、広告技術のイノベーションに利用か
【抄訳】 Googleがベラルーシで生まれたコンピュータービジョンのスタートアップAIMatterを買収した。同社は、画像の検出と処理をモバイルデバイスの上で高速に行うニューラルネットワークベースのAIプラットホームおよびSDKと、その技術の概念実証のような写真/ビデオ編集アプリFabbyを作っている。
·jp.techcrunch.com·
GoogleがコンピュータービジョンアプリFabbyを作ったAIMatterを買収、広告技術のイノベーションに利用か
即答せよ! このシステムは問題に答える顔を見て人間であることを確認する
即答せよ! このシステムは問題に答える顔を見て人間であることを確認する
ボットとの戦いに終りはない。しかし、誰もが密かに想像しているスカイネットのようなシナリオでは終わらないことを望みたい。ちなみに、今重要なのはスパムを退治することで、組織的殺人を防ぐことではない。それでも、機会はますます賢くなり、単純な顔認識だけでは人間の識別に十分ではないこともある。今や機械は顔を作ることもできる —— しかし、質問に答えるときの顔を作るのは不得意のよ…
·jp.techcrunch.com·
即答せよ! このシステムは問題に答える顔を見て人間であることを確認する
ローエンド車載CPUでも実現可能な自動運転技術
ローエンド車載CPUでも実現可能な自動運転技術
高価でかさばるハードウエアに依存しないコンピュータービジョン技術を提供する方法を開発したあるスタートアップが資金調達に成功した。
·jp.techcrunch.com·
ローエンド車載CPUでも実現可能な自動運転技術
コンピュータービジョン技術で細胞を分析し病原体を見つけるPathAIが67億円超を調達
コンピュータービジョン技術で細胞を分析し病原体を見つけるPathAIが67億円超を調達
コンピュータービジョンの技術で病原体を見つけるPathAIのサービスは、臨床現場での実用化まではまだ1年あまりと言われるが、同社は最近の資金調達ラウンドで6000万ドル(約67億円)を獲得した。
·jp.techcrunch.com·
コンピュータービジョン技術で細胞を分析し病原体を見つけるPathAIが67億円超を調達
顔の変形、手振り、服装チェックまでカバーしたFacebookの最新機械学習モデル
顔の変形、手振り、服装チェックまでカバーしたFacebookの最新機械学習モデル
Facebookのいちばん新しい機械学習モデルの研究は、我々からすればなんとも平凡な仕事をさせるものだが、コンピューターにとっては今でもめちゃくちゃ難しい仕事だ。このプロジェクトの目的は、顔の匿名化と、手の動きを即興で作ること、そしておそらくもっとも難しいであろう、適切な服装のアドバイスだ。
·jp.techcrunch.com·
顔の変形、手振り、服装チェックまでカバーしたFacebookの最新機械学習モデル
コンピュータービジョンを利用して製品写真を重要な属性へと分解するGlisten
コンピュータービジョンを利用して製品写真を重要な属性へと分解するGlisten
今日この時代になっても、新しい服を探すための最善の方法が、いくつかのチェックボックスをクリックして、果てしなく続く写真をスクロールしていくやり方だというのには驚かされる。Glistenは、まさにこの課題を解決しようとしているスタートアップだ。そ
·jp.techcrunch.com·
コンピュータービジョンを利用して製品写真を重要な属性へと分解するGlisten
音声AIがスマホカメラに映る映像を解析して質問にズバリ答えられるようにするWorldGaze
音声AIがスマホカメラに映る映像を解析して質問にズバリ答えられるようにするWorldGaze
音声アシスタントがアホすぎてイラつくのは、誰もが経験すること。カーネギーメロン大学の研究者たちは、Appleの機械学習エンジニアGierad Laput氏と共同で、スマートフォンに内蔵されているAIに手を貸して、というか頭を貸して、賢くするソフトウェアを開発した。
·jp.techcrunch.com·
音声AIがスマホカメラに映る映像を解析して質問にズバリ答えられるようにするWorldGaze
コンピュータビジョンを利用して動画の特定部分のみにエフェクトをかけられるスマホ向け編集アプリ「Vochi」
コンピュータビジョンを利用して動画の特定部分のみにエフェクトをかけられるスマホ向け編集アプリ「Vochi」
ベラルーシを拠点とするスタートアップのVochiが、150万ドル(約1億6000万円)のシード資金の調達に成功した。同社は、スマートフォン向けにコンピュータービジョンベースのビデオ編集・エフェクトアプリを開発している。
·jp.techcrunch.com·
コンピュータビジョンを利用して動画の特定部分のみにエフェクトをかけられるスマホ向け編集アプリ「Vochi」
コンピュータービジョンで製造作業員の動きのエラーを検知、トヨタも手を組むInvisible AI
コンピュータービジョンで製造作業員の動きのエラーを検知、トヨタも手を組むInvisible AI
Invisible AIは、高度に最適化されたコンピュータービジョンアルゴリズムを用いてカメラに映る人々の動きを追跡する、内蔵型のカメラコンピューターユニットを製造している。作業員の動きを模範的な動き(作業が正しく実行されている場合の様子)と比較することにより、システムがミスを監視したり、不足パーツや怪我などワークフローにおける問題を特定したりすることができる。
·jp.techcrunch.com·
コンピュータービジョンで製造作業員の動きのエラーを検知、トヨタも手を組むInvisible AI
ドローンとマルチスペクトル画像で森林の健康状態を観測するUCバークレーのテストプロジェクト
ドローンとマルチスペクトル画像で森林の健康状態を観測するUCバークレーのテストプロジェクト
干ばつ、気候変動、森林破壊により世界中の森林がリスクにさらされている。これまで以上に森林のエコシステムについて研究することが重要だ。しかし、シエラネバダ山脈のエコシステムを研究するのに、すべての木に登って調査するのは骨が折れる。ドローンと先進の画像技術を使うことは、木を登るよりはるかに実用的な方法であるとカリフォルニア大学バークレー校のプロジェクトは示している。
·jp.techcrunch.com·
ドローンとマルチスペクトル画像で森林の健康状態を観測するUCバークレーのテストプロジェクト
新型コロナによる非接触需要でスキャン技術のScanditが約86億円調達
新型コロナによる非接触需要でスキャン技術のScanditが約86億円調達
企業向けバーコードスキャナーのScandit(スキャンディット)が8000万ドル(約86億円)のシリーズCラウンドをクローズした。本ラウンドはシリコンバレーのVCファームG2VPがリードし、Atomico、GV、Kreos、NGP Capital、Salesforce Ventures、Swisscom Venturesも参加。Scanditの累計調達額は1億2300万ドル(約132億円)と…
·jp.techcrunch.com·
新型コロナによる非接触需要でスキャン技術のScanditが約86億円調達
動画中の顔をぼかして本人同定を不可能にするプライバシー技術のD-IDが14.5億円を調達
動画中の顔をぼかして本人同定を不可能にするプライバシー技術のD-IDが14.5億円を調達
D-IDは「de-identification(匿名化)」という意味で、一見すると単純明快だが実はきわめて複雑高度な技術を使ってデジタル画像にぼかしを入れて、画像内の人物を特定できないようにする。現在、新型コロナウイルス(COVID-19)パンデミックにより世界中の政府や民間企業が監視技術の利用機会を増やしているため、このような対抗技術の出番が来たといえるだろう。
·jp.techcrunch.com·
動画中の顔をぼかして本人同定を不可能にするプライバシー技術のD-IDが14.5億円を調達
医療スタートアップLyfebinの医療用画像が野ざらし状態に
医療スタートアップLyfebinの医療用画像が野ざらし状態に
医療スタートアップのLyfebinは、患者の医用画像データを保護されていない誰にでもアクセス可能に保管していた。質問を繰り返すうちに、同社はTechCrunchを訴えると言い出した。
·jp.techcrunch.com·
医療スタートアップLyfebinの医療用画像が野ざらし状態に