AlphaGo Zero | Abstract 第5文
Here we introduce an algorithm based solely on reinforcement learning, without human data, guidance or domain knowledge beyond game rules.
David Silver, et al., "Mastering the game of Go without human knowledge"
囲碁AIであるAlphaGoの後継であり、プロ棋士の打った手を学習に使用せずにAlphaGoに100戦100勝0敗で勝ち越したAlphaGo Zeroの論文である"Mastering the game of Go without human knowledge"のAbstractの第5文について、英語リーディング教本のFrame of Reference(F.o.R.)を使って英文構造を解読します。
「ここで、我々は、人間のデータや指導またはゲームのルール以上のドメイン知識なしで、単に強化学習だけに基づいたアルゴリズムを紹介する。」
Hereは文頭に用いて「ここで」という意味です。前の文まではAlphaGoについて述べられていましたが、この文ではこの論文の本題である提案内容に話を切り替えるためのつなぎとしてHereが用いられています。そのため、文全体を修飾する文修飾の副詞として解釈しました。
introduceは論文の新規提案の内容を「紹介する」ために用いられる頻出単語です。第三文型の他動詞です。ここでの目的語はalgorithmです。
英語「introduce」の意味・使い方・読み方 | Weblio英和辞書
solelyは副詞で、「単に」という意味です。ここでは直後のonから始まる副詞句を修飾しています。AlphaGo Zeroがreinforcement learning「だけ」を使っていることを強調しています。それに対し、先行研究であるAlphaGoは教師あり学習も使っていました。
solelyの意味・使い方・読み方 | Weblio英和辞書
domain knowledgeは名詞で「ドメイン知識または領域知識は、はっきり限定された、ある専門分野に特化した分野の知識であり、一般知識またはドメイン独立の知識と対比される。」という意味です。ここではそのままドメイン知識と訳しました。
domain knowledgeの意味・使い方 - 英和辞典 WEBLIO辞書
beyondは前置詞です。ここでは、「[程度・到達などを表わして] …の範囲を越えて; …以上」の意味です。"beyond game rules"は形容詞句、domain knowledgeを修飾しています。AlphaGo Zeroでは「ゲームのルール以上のドメイン知識」なしで強化学習させています。
beyondの意味・使い方・読み方 | Weblio英和辞書
AlphaGo Zeroに関する概要はこちらの書籍でも丁寧に解説されています。
最強囲碁AI アルファ碁 解体新書 増補改訂版 アルファ碁ゼロ対応 深層学習、モンテカルロ木探索、強化学習から見たその仕組み
薬袋善郎先生の公式ウェブサイト