ベイジアンニューラルネットワークを用いた分布外画像データ検出に関する研究
皆川 昂輝
2024 年度 卒 /修士(情報科学)
修士論文の概要
本研究はベイジアンニューラルネットワークによる分布外画像データの検出手法に関するものである。 学習データとしての多様性確保が困難な類似画像学習タスクへの適用を目的として、より効果的な学習手法及び複数のベイジアンニューラルネットワークの組み合わせを提案し、それらの評価を行うものである。
分布外データの検出は、現代社会の至る所に浸透しつつある人工知能技術が直面している課題である。 分布外データとは学習時に想定していないデータを指しており、AIモデルの推論に対して不確実性を生じさせる。 不確実性はAIに過信や誤りといった不適切な判断をさせてしまう原因であり、AIアプリケーションの安全性を確保するためには避けられない問題である。 とりわけ類似画像の学習は、学習データの多様性確保が困難であり、分布外データ検出を行うために十分な知識が得られないという問題がある。
本研究では、不確実性推定による分布外データ検出手法としてベイジアンニューラルネットワークに焦点を当てており、その基本的な性能の検証、及び検出性能向上の手法の提案と評価を行なっている。 検出性能向上の手法としては大きく2つ、画像の高周波成分を学習に利用する手法と、異なるデータで学習した2つのベイジアンニューラルネットワークを組み合わせる手法を提案している。 前者の手法については手書き文字画像や衣類のグレースケール画像などのベンチマークデータを学習したモデルを用いた検証によって、分布外データの検出性能が向上することが示された。 また後者の手法については、ベンチマークデータよりも難解なタスクとして、類似した画像の学習を対象として検証を行なった。 知識の補完を図るために異なるデータで学習したベイジアンニューラルネットワークを用意し、それらから得られる合計6種類の不確実性を取捨選択する判断方法を提案し、単一モデルとの性能を比較した。 その結果、ベンチマークデータから作成した類似画像学習タスクにおいてだけでなく、実際の検査装置から得られた画像を用いた検証においても高い検出性能が得られた。
これらの検証を通して、ベイジアンニューラルネットワークが高い分布外データ検出性能を持つこと、および後者の提案手法によって類似学習タスクにおける分布外データ検出の可能性を広げたことを結論づけた。