DQN | Abstract 第2文
The model is a convolutional neural network, trained with a variant of Q-learning, whose input is raw pixels and whose output is a value function estimating future rewards.
Volodymyr Mnih, et al., "Playing Atari with Deep Reinforcement Learning"
強化学習にディープラーニングを適用して成功した一例であるDQNの論文の"Playing Atari with Deep Reinforcement Learning"のAbstractの第2文について、英語リーディング教本のFrame of Reference(F.o.R.)を使って英文構造を解読します。
「そのモデルは、入力が生のピクセルで、出力が将来の報酬を推定する価値関数である、Q学習の変種によって学習される畳み込みニューラルネットワークである。」
DQNの理論の概要については、こちらの書籍に説明があります。
薬袋善郎先生の公式ウェブサイト