画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

画像認識、コンピュータビジョン、画像処理に関連する記事へのリンク集

2306 bookmarks
Custom sorting
CGへの扉 Vol.17:描画を進化させるTensorFlow Graphicsの真価 | モリカトロンAIラボ
CGへの扉 Vol.17:描画を進化させるTensorFlow Graphicsの真価 | モリカトロンAIラボ
そもそも画像認識の元となる学習データは正しいのか?先日オンラインで開催された「画像の認識・理解シンポジウム MIRU2020」で発表されたセッション「大規模画像データセットが含む"疑わしい画像"の専門家のワークショップを通した収集と分析」が大変話題になりました。MIRU 2020 プログラム一覧これは人工知能を活用した画像解析の学習データとして一般的に使われている ImageNet という巨大データセットの正確性を疑うものです。近年「Are we done with ImageNet?」という2020年の論文から ImageNet の正確性への疑問が注目されました。論文「Are we done with ImageNet?」は 、2009年頃から画像認識の大規模データセットとして使われてきた ImageNet の正確性、評価に疑いをもって調べ、またその正当性をあげるための提言を述べた研究論文です。ImageNetは、スタンフォード大学が画像認識研究のために公開している巨大なデータベースで、世界中の研究者が利用しています。そこでは約1,420万枚の画像と、そこに何が写っているのかがデータ化されています。例えばある写真に「ダルメシアン」という品種の犬が写っていることが画像とデータとセットで保持されていることにより、機械学習の学習データとしてわざわざ研究者がゼロから集めることなしに研究に集中することができるため、大変重宝されてきました。ところが、ImageNet の画像には、1枚の画像にひとつのラベルしかつけることができないため、画像に適切なラベルをつけるには限定的すぎること、ある特定の作業者がつけたラベルを過信してしまっているため、データ全体に間違いが紛れ込んでしまっていることが最近課題として指摘されました。ImageNet の中で「バイク」とラベルが付いた画像一覧(一部)、写真の中にオブジェクトが明確にひとつだけ写り込んでいる場合はほとんど問題が生じないMIRU2020で発表された「大規模画像データセットが含む"疑わしい画像"の専門家のワークショップを通した収集と分析」では、ImageNet を題材とした画像認識のコンペティションILSVRC 2012のデータセットを元ネタとし、30人ほどのコンピュータビジョン研究の専門家が3日間、目視で28
·morikatron.ai·
CGへの扉 Vol.17:描画を進化させるTensorFlow Graphicsの真価 | モリカトロンAIラボ
映像から音源を特定して効果音を生成するAI「AutoFoley」:月刊エンタメAIニュース vol.8 | モリカトロンAIラボ
映像から音源を特定して効果音を生成するAI「AutoFoley」:月刊エンタメAIニュース vol.8 | モリカトロンAIラボ
エンタメにおいてもAIは日進月歩で進歩しており、新しい研究成果や試みが次々と発表されています。こちらの連載では、過去1か月間、主に海外で公開された注目すべきゲームAIやエンタメAIに関連したニュース、論文などを紹介していきます。StarCraftⅡを攻略するゲームプレイAIは、生態系を模倣する科学系メディア「Massive Science」は7月20日、Google傘下のAI研究機関DeepMindが開発したゲームプレイAI「AlphaStar」が進化論の研究に活用されていることを報じました。人気RTS『StarCraftⅡ』の攻略を目的として開発された同AIは、2019年10月、人間のプレイヤーと同等のプレイ条件下で対戦した結果、上位0.2%にランクインされたことによりグランドマスターの称号を得ています。AlphaStarはStarCraftⅡを攻略するために、3つの課題を効率的に解決できるように学習しました。まずプレイヤーが操作するユニットの生産に関しては、序盤は低コストのユニットを数多く生産して領地を確保した後、中盤以降は優れた能力を持つ高コストのユニットを生産して勢力を広げます。ゲームフィールドで利用できる資源は有限なので、同種族ユニットへの資源供給と異種族からの資源奪取を両立させなければなりません。そして、生存競争に勝ち残るには異種族の増強に相応した同種族の強化が求められます。こうした課題は、実のところ、それぞれ「r-K戦略」「資源配分」「進化的軍拡競争」として進化論の研究において論じられているものなのです。AlphaStarが解決する課題が偶然にも進化論におけるそれと同様であることから、科学者たちは同AIを進化論研究におけるシミュレーターとして活用することを提案した論文を発表しました。同AIは、時として人間プレイヤーが思いつかないような型破りな戦略を実行することで知られています。同AIを進化論シミュレーターとして活用した場合、科学者たちが思いつかなかったような生存戦略を実行することによって、研究に寄与することが期待されています。【論文】Artificial Intelligence Accidentally Learned Ecology through Video Games「フォーリーアーティストAI」を開発する試み科学系メディア「IEEE
·morikatron.ai·
映像から音源を特定して効果音を生成するAI「AutoFoley」:月刊エンタメAIニュース vol.8 | モリカトロンAIラボ
統合失調症か発達障害かを画像解析で鑑別できるAIを開発、判別率最高で70% 東京大学と浜松医大 | Med IT Tech
統合失調症か発達障害かを画像解析で鑑別できるAIを開発、判別率最高で70% 東京大学と浜松医大 | Med IT Tech
東京大学、浜松医科大学の研究グループは、慢性期統合失調症と発達障害の患者の磁気共鳴画像(MRI)データを用いて機械学習を行い、それぞれの疾患を鑑別できるAIを開発したと発表した。判別率は最高70%で、今後多施設共同研究等で臨床応用に向けた研究を加速させる。「どちらの疾患か」を鑑別するAIは世界初成果を発表したのは、東京大学大学院総合文化研究科附属進化認知科学研究センターの小池進介准教授、東京大学医学部附属病院精神神経科・笠井清登教授、浜松医科大学医学部精神医学講座・山末英典教授らの研究グループ。精神疾患の診断は現在も精神科医による問診が主な判断基準となっており、血液や画像などを用いた客観的な診
·medit.tech·
統合失調症か発達障害かを画像解析で鑑別できるAIを開発、判別率最高で70% 東京大学と浜松医大 | Med IT Tech
顔画像解析AIで現場作業員の健康管理をスムーズに、大豊建設がAlgoageと新システム
顔画像解析AIで現場作業員の健康管理をスムーズに、大豊建設がAlgoageと新システム
AI(人工知能)関連サービスのAlgoage(東京・文京)は2020年8月6日、大豊建設向けに顔画像解析AIを使った現場作業員の健康管理システムの構築を始めたと発表した。2020年9月中に構築を完了する予定という。
·xtech.nikkei.com·
顔画像解析AIで現場作業員の健康管理をスムーズに、大豊建設がAlgoageと新システム
キヤノンメディカルシステムズUSA – Zebra Medical Visionと提携しAI画像診断を提供 | 医療とAIのニュース・最新記事 - The Medical AI Times
キヤノンメディカルシステムズUSA – Zebra Medical Visionと提携しAI画像診断を提供 | 医療とAIのニュース・最新記事 - The Medical AI Times
キヤノンメディカルシステムズの北米拠点 Canon Medical Systems USAについて、以前にはCT画像を再構成する独自AI技術のFDA承認を紹介した(過去記事)。同社はこのほど、イスラエルの医療AIスタートアップであるZebra Medical Visionと提携し、新しい画像解析ソリューションの提供を開始することを公表した。 Canon Medical Systems
·aitimes.media·
キヤノンメディカルシステムズUSA – Zebra Medical Visionと提携しAI画像診断を提供 | 医療とAIのニュース・最新記事 - The Medical AI Times
光沢のある製品も検査可能、教示ペンダントも不要なAI外観検査システム
光沢のある製品も検査可能、教示ペンダントも不要なAI外観検査システム
住友重機械工業は表面上に光沢のある検査品でも欠陥検出が可能な、独自の画像処理AI(人工知能)アルゴリズムを組み込んだ3D外観検査システム「KITOV-ONE(キトフワン)」の取り扱いを開始した。検査品の撮影画像をアルゴリズムで処理することで、ハレーションが生じた画像からも傷やへこみなどの工夫などが盛り込まれている。
·monoist.atmarkit.co.jp·
光沢のある製品も検査可能、教示ペンダントも不要なAI外観検査システム
ニューラルポケット、AIで画像解析
ニューラルポケット、AIで画像解析
独自の人工知能(AI)で交通や広告効果の画像解析を請け負っている。2018年の創業で、交流サイトの投稿写真から流行のファッションを分析するサービスを始めた。最近は渋滞予測や駐車場管理、商業施設などの
·nikkei.com·
ニューラルポケット、AIで画像解析
ドローンとAIを活用 橋を効率的に点検/岩手 | IBC NEWS
ドローンとAIを活用 橋を効率的に点検/岩手 | IBC NEWS
全国的に橋の老朽化が進んでいて、岩手県内の多くの橋はそのほとんどが今後10年で築50年を超えると言います。その安全点検の効率化を目指し、ドローンとAIを駆使した新たな方法の実証実験が行われました...
·news.ibc.co.jp·
ドローンとAIを活用 橋を効率的に点検/岩手 | IBC NEWS
MITの研究者が画像にパターンをコピペできるAIツール、「GANpaint 」を発表! | Techable(テッカブル)
MITの研究者が画像にパターンをコピペできるAIツール、「GANpaint 」を発表! | Techable(テッカブル)
MITの研究者は、深層生成モデルのGANを利用してパンターンをコピペする技術を開発した。同技術を利用すれば、たとえば画像の中の馬に帽子を被らせることができる。 また、同技術を利用した画像編集ツール「GANpaint 」が...
·techable.jp·
MITの研究者が画像にパターンをコピペできるAIツール、「GANpaint 」を発表! | Techable(テッカブル)
医療用画像の機械学習を効率化するアノテーションツールを開発、医師による高精度のAI開発を促進~DeepEyeVisionとMENOU、協業による機能拡張~
医療用画像の機械学習を効率化するアノテーションツールを開発、医師による高精度のAI開発を促進~DeepEyeVisionとMENOU、協業による機能拡張~
株式会社インディージャパンのプレスリリース(2020年8月3日 08時30分)医療用画像の機械学習を効率化するアノテーションツールを開発、医師による高精度のAI開発を促進~DeepEyeVisionとMENOU、協業による機能拡張~
·prtimes.jp·
医療用画像の機械学習を効率化するアノテーションツールを開発、医師による高精度のAI開発を促進~DeepEyeVisionとMENOU、協業による機能拡張~
AI画像処理を組み込みできる——コンピュータービジョン開発キット「OpenCV AI Kit」|fabcross
AI画像処理を組み込みできる——コンピュータービジョン開発キット「OpenCV AI Kit」|fabcross
OpenCVのコンピュータービジョン開発キット「OpenCV AI Kit」がKickstarterでクラウドファンディング中だ。Myriad Xビジョンプロセシングユニット搭載で、ホストコンピューターに負荷をかけずにAIベースの画像処理ができる。
·fabcross.jp·
AI画像処理を組み込みできる——コンピュータービジョン開発キット「OpenCV AI Kit」|fabcross
東芝の「AI顔認証技術」、技術開発賞を受賞 (2020年8月25日) - エキサイトニュース
東芝の「AI顔認証技術」、技術開発賞を受賞 (2020年8月25日) - エキサイトニュース
日本映画テレビ技術協会の技術開発賞を受賞顔認識システムとは「画像データ上にある人の顔から自動的に情報を読み取ることができるシステム」を指し、近年AI技術により、本人適合率が格段に向上している。株式会社...
·excite.co.jp·
東芝の「AI顔認証技術」、技術開発賞を受賞 (2020年8月25日) - エキサイトニュース
写真を「ゴッホ風に」「ピカソっぽく」AIが自動加工 12種類の画風に対応 (2020年8月26日) - エキサイトニュース
写真を「ゴッホ風に」「ピカソっぽく」AIが自動加工 12種類の画風に対応 (2020年8月26日) - エキサイトニュース
AIベンチャーのラディウス・ファイブ(東京都新宿区)は8月26日、AIが写真をゴッホやピカソの絵画風に自動で加工するサービス「Enpainter」を始めた。AIはゴッホなど著名な画家の作品を約1万件学...
·excite.co.jp·
写真を「ゴッホ風に」「ピカソっぽく」AIが自動加工 12種類の画風に対応 (2020年8月26日) - エキサイトニュース
AIを活用した3密リスクを低減する避難所運営の実証実験
AIを活用した3密リスクを低減する避難所運営の実証実験
東北大学災害科学国際研究所、東京大学地震研究所、富士通、川崎市は8月24日、新型コロナウイルス禍での自然災害を想定した避難所運営の実証実験を同31日に川崎市川崎区にて実施すると発表した。
·news.mynavi.jp·
AIを活用した3密リスクを低減する避難所運営の実証実験
ToFカメラ向けのデモ用アプリを開発、人物や視線をリアルタイム検出
ToFカメラ向けのデモ用アプリを開発、人物や視線をリアルタイム検出
スワローインキュベートは、CIS製ToFカメラ用に同社の「ヒューマンセンシング技術」を搭載したデモ用アプリを開発した。マーケティング、自動車、ロボット、医療、アミューズメント分野での利用を見込む。
·monoist.atmarkit.co.jp·
ToFカメラ向けのデモ用アプリを開発、人物や視線をリアルタイム検出
自身も視覚障がいを持つ開発者がMicrosoft Seeing AIによるアクセシビリティ改善について語る
自身も視覚障がいを持つ開発者がMicrosoft Seeing AIによるアクセシビリティ改善について語る
マイクロソフトのCEOを務めるサティア・ナデラ氏は2016年のBUILDカンファレンスでエンジニアのシャキブ・シェイク氏を紹介し、彼の情熱と思いやりが「世界を変えるだろう」と述べた。
·jp.techcrunch.com·
自身も視覚障がいを持つ開発者がMicrosoft Seeing AIによるアクセシビリティ改善について語る
資生堂がMS TeamsやZOOMで最新メイクを楽しめるARフィルター提供、カメラアプリ「Snap Camera」経由
資生堂がMS TeamsやZOOMで最新メイクを楽しめるARフィルター提供、カメラアプリ「Snap Camera」経由
資生堂は8月21日、SnapchatのPC用カメラアプリ「Snap Camera」(スナップカメラ)を介して、PC用オンライン会議ツール上でメイクアップブランド「マキアージュ」の最新メイクを楽しめるARフィルターの提供を開始した。Microsoft Teams、ZOOM、Skype、Google Hangoutsで利用できる。
·jp.techcrunch.com·
資生堂がMS TeamsやZOOMで最新メイクを楽しめるARフィルター提供、カメラアプリ「Snap Camera」経由
農業スタートアップのiFarmが4.2億円調達、画像認識と機械学習で約120種類の栽培を屋内垂直農園で自動化
農業スタートアップのiFarmが4.2億円調達、画像認識と機械学習で約120種類の栽培を屋内垂直農園で自動化
垂直農法技術を提供するiFarmは、既存投資家であるGagarin Capitalが主導する400万ドル(約4億2300万円)のシードラウンドで資金を調達した。このラウンドのほかの投資家として、Matrix Capital、Impulse VC、IMI.VC、複数のエンジェル投資家が含まれている。
·jp.techcrunch.com·
農業スタートアップのiFarmが4.2億円調達、画像認識と機械学習で約120種類の栽培を屋内垂直農園で自動化
アップルがイスラエルのARおよびカメラ技術のCameraiを密かに買収していた
アップルがイスラエルのARおよびカメラ技術のCameraiを密かに買収していた
アップルは事業拡大のために小規模スタートアップを買収することでよく知られている。このニュースはその種の買収の最新のものだが、買収からほぼ2年経っている。2018年から2019年のどこかで、iPhoneの巨人がイスラエルを拠点とする拡張現実とコンピュータービジョンの会社であるCameraiを買収し、同社は閉鎖されたと報じられた。
·jp.techcrunch.com·
アップルがイスラエルのARおよびカメラ技術のCameraiを密かに買収していた
病理AIソリューション「PidPort」開発のメドメインが11億円調達、病理医不足をAIと画像認識で支援
病理AIソリューション「PidPort」開発のメドメインが11億円調達、病理医不足をAIと画像認識で支援
病理AIソリューション「PidPort」を開発するメドメインは8月24日、総額11億円の資金調達を発表した。第三者割当増資による調達となる。なお今回、同社への出資を目的とした専用ファンドをHike Venturesが組成し、病院経営者をはじめとした複数のリミテッドパートナーから調達するSPV(Special Purpose Vehicle)スキームを採用した。
·jp.techcrunch.com·
病理AIソリューション「PidPort」開発のメドメインが11億円調達、病理医不足をAIと画像認識で支援
AIが映像と音声を解析して字幕作成、大日本印刷ら開発 - Engadget 日本版
AIが映像と音声を解析して字幕作成、大日本印刷ら開発 - Engadget 日本版
大日本印刷株式会社(以下DNP)とNHKテクノロジーズは、映像と音声をAI(人工知能)で解析し、内容や感情にふさわしい字幕を表示する「感情表現字幕システム」のプロトタイプを共同開発しました。字幕放送(オープンキャプション)での実用化を目指します。
·japanese.engadget.com·
AIが映像と音声を解析して字幕作成、大日本印刷ら開発 - Engadget 日本版
世界初・画面上にカメラ穴のないアンダーディスプレイカメラ技術搭載スマホ「Axon 20 5G」をZTEが発表
世界初・画面上にカメラ穴のないアンダーディスプレイカメラ技術搭載スマホ「Axon 20 5G」をZTEが発表
中国・広東省深圳市に本社を置くスマートフォンメーカー・ZTEが、世界で初めて「アンダーディスプレイカメラ」技術を搭載した5G対応スマートフォン「Axon 20 5G」の発売イベントを2020年9月1日に開催すると発表しました。
·gigazine.net·
世界初・画面上にカメラ穴のないアンダーディスプレイカメラ技術搭載スマホ「Axon 20 5G」をZTEが発表
MRIスキャンをAIで高速化する技術「fastMRI」でスキャン時間を4分の1にまで短縮できたとFacebookが発表
MRIスキャンをAIで高速化する技術「fastMRI」でスキャン時間を4分の1にまで短縮できたとFacebookが発表
FacebookのAI研究部門であるFacebok AI Research(FAIR)とニューヨーク大学ランゴーン医療センターは、体の断層画像を撮影する「MRI」にAIの技術を活用することで、MRIのスキャン速度を最大10倍高速化することを目指す技術「fastMRI」を使って、4倍のスキャン速度で従来とほぼ同じ精度のMRI画像を出力することに成功したと発表しました。
·gigazine.net·
MRIスキャンをAIで高速化する技術「fastMRI」でスキャン時間を4分の1にまで短縮できたとFacebookが発表
ハリソン・フォードに若ソロ姿で「I know」と言わせるディープフェイク映像が登場
ハリソン・フォードに若ソロ姿で「I know」と言わせるディープフェイク映像が登場
画像合成技術「ディープフェイク」を用いて、映画「ハン・ソロ/スター・ウォーズ・ストーリー」でオールデン・エアエンライクが演じた若いときのハン・ソロを、オリジナルの「スター・ウォーズ」シリーズでハン・ソロを演じたハリソン・フォードに置き換えた映像が登場しました。同種のものは2018年にも制作されていますが、今回の映像は明るいシーンもあり、より合成の精度が上がっている印象です。
·gigazine.net·
ハリソン・フォードに若ソロ姿で「I know」と言わせるディープフェイク映像が登場