CGへの扉 Vol.17:描画を進化させるTensorFlow Graphicsの真価 | モリカトロンAIラボ
そもそも画像認識の元となる学習データは正しいのか?先日オンラインで開催された「画像の認識・理解シンポジウム MIRU2020」で発表されたセッション「大規模画像データセットが含む"疑わしい画像"の専門家のワークショップを通した収集と分析」が大変話題になりました。MIRU 2020 プログラム一覧これは人工知能を活用した画像解析の学習データとして一般的に使われている ImageNet という巨大データセットの正確性を疑うものです。近年「Are we done with ImageNet?」という2020年の論文から ImageNet の正確性への疑問が注目されました。論文「Are we done with ImageNet?」は 、2009年頃から画像認識の大規模データセットとして使われてきた ImageNet の正確性、評価に疑いをもって調べ、またその正当性をあげるための提言を述べた研究論文です。ImageNetは、スタンフォード大学が画像認識研究のために公開している巨大なデータベースで、世界中の研究者が利用しています。そこでは約1,420万枚の画像と、そこに何が写っているのかがデータ化されています。例えばある写真に「ダルメシアン」という品種の犬が写っていることが画像とデータとセットで保持されていることにより、機械学習の学習データとしてわざわざ研究者がゼロから集めることなしに研究に集中することができるため、大変重宝されてきました。ところが、ImageNet の画像には、1枚の画像にひとつのラベルしかつけることができないため、画像に適切なラベルをつけるには限定的すぎること、ある特定の作業者がつけたラベルを過信してしまっているため、データ全体に間違いが紛れ込んでしまっていることが最近課題として指摘されました。ImageNet の中で「バイク」とラベルが付いた画像一覧(一部)、写真の中にオブジェクトが明確にひとつだけ写り込んでいる場合はほとんど問題が生じないMIRU2020で発表された「大規模画像データセットが含む"疑わしい画像"の専門家のワークショップを通した収集と分析」では、ImageNet を題材とした画像認識のコンペティションILSVRC 2012のデータセットを元ネタとし、30人ほどのコンピュータビジョン研究の専門家が3日間、目視で28