@misc{oai:u-ryukyu.repo.nii.ac.jp:02012385, author = {長嶺, 一輝 and 遠藤, 聡志 and 山田, 孝治 and 當間, 愛晃 and 赤嶺, 有平 and Nagamine, Kazuki and Endo, Satoshi and Yamada, Koji and Toma, Naruaki and Akamine, Yuhei}, month = {Sep}, note = {人間がビデオゲームといったタスクを解くとき、そのタスクに出現するオブジェクトやその位置関係などの視覚的特徴に注視する。画像ベースのゲームタスクにおいて人間並みのパフォーマンスを発揮する、Deep Q Network という深層強化学習アルゴリズムでも同様な事象が起きていると推測できる。そこで、本研究では、DQNが行動価値を計算する際に用いる CNN を Grad-CAM という手法で可視化して、学習過程でどのような特徴を捉えているか分析することを目的とする。, 会議発表用資料}, title = {可視化によるDeep Q Networkの行動価値根拠の分析}, year = {2018} }