ゲーム理論でAIの視点を可視化 画像認識AIの判断根拠を可視化する新技術

2024年06月20日

研究?産学連携

 正规赌篮球软件大学院情報学研究院の川本一彦教授、計良宥志助教、大学院融合理工学府博士前期課程の住安宏介氏(研究当時)の研究チームは、画像認識AIが画像のどの箇所に注目して判断をしているのかを可視化する、新たな手法を開発しました。従来の手法では、画像ピクセル個々の重要度を考慮していましたが、本手法では画像ピクセル群全体としての重要度を測ることで、より精密な可視化が実現されています。その結果、Vision Transformerなどの代表的な画像認識モデルはほとんどの画像において、わずか4%から16%程度の画像領域のみから画像中の物体等を正確に認識することが可能であるとわかりました。この技術により、画像認識AIの判断根拠をより正確に可視化し、AI利用の信頼性を高めることが期待されます。

 本研究成果は、2024年6月17日からシアトル(アメリカ)で開催される、コンピュータビジョン分野の最上位国際会議IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 注1)で発表されました。

注1)IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR):
AI分野では研究トレンドの変化が迅速であるため、同分野では論文誌における発表を待たず、プレプリントサーバ(例:arXiv)による速やかな成果の公開、続いてCVPRのようなトップ国際会議への投稿?発表という流れが主流。中でもCVPRはコンピュータービジョン分野における世界最高峰の国際会議である。Google Scholarが提供するh5-indexによる2023年のランキングでは、全学術分野で4位(1位 Nature、2位 The New England Journal of Medicine、3位 Science、4位 CVPR)に位置し、その学術的影響力は非常に大きい。