DQN | Abstract 第1文
We present the first deep learning model to successfully learn control policies directly from high-dimensional sensory input using reinforcement learning.
Volodymyr Mnih, et al., "Playing Atari with Deep Reinforcement Learning"
強化学習にディープラーニングを適用して成功した一例であるDQNの論文の"Playing Atari with Deep Reinforcement Learning"のAbstractの第1文について、英語リーディング教本のFrame of Reference(F.o.R.)を使って英文構造を解読します。
「我々は、強化学習を使用して、高次元の知覚入力から直接制御方策をうまく学習するための初めてのディープラーニングモデルを提案する。」
迷った点としましては、usingが現在分詞形容詞用法なのか、分詞構文なのかです。ここでは意味から考えて、分詞構文でlearnにかかると判断いたしました。
usingが現在分詞形容詞用法の場合
- inputにかかるとすると、「強化学習を使用する高次元の知覚入力」
- control policiesにかかるとすると、「強化学習を使用する制御方策」
となるため、強化学習に対する主従関係が逆になっているような気がするので、意味的に不適当かと思います。
usingが分詞構文の場合
- learnにかかり、「強化学習を使用して制御方策を学習する」
となるため、意味として成立します。
DQNの理論の概要については、こちらの書籍に説明があります。
薬袋善郎先生の公式ウェブサイト