AlphaGo Zero | Abstract 第4文
These neural networks were trained by supervised learning from human expert moves, and by reinforcement learning from self-play.
David Silver, et al., "Mastering the game of Go without human knowledge"
囲碁AIであるAlphaGoの後継であり、プロ棋士の打った手を学習に使用せずにAlphaGoに100戦100勝0敗で勝ち越したAlphaGo Zeroの論文である"Mastering the game of Go without human knowledge"のAbstractの第4文について、英語リーディング教本のFrame of Reference(F.o.R.)を使って英文構造を解読します。
「これらのニューラルネットワークは、人間の熟練者の手からの教師あり学習と、自己対局からの強化学習によって訓練された。」
"These neural networks"は、直前の文で触れられていたAlphaGoのことです。
AlphaGo Zero | Abstract 第2文 - AI Paper English F.o.R.
AlphaGo Zero | Abstract 第3文 - AI Paper English F.o.R.
構文としては簡単な文です。
neural networks, trained, supervised learning, human expert, reinforcement learning, self-play
といった、機械学習、特に深層強化学習でよく用いられる単語が多数用いられています。
AlphaGo Zeroに関する概要はこちらの書籍でも丁寧に解説されています。
最強囲碁AI アルファ碁 解体新書 増補改訂版 アルファ碁ゼロ対応 深層学習、モンテカルロ木探索、強化学習から見たその仕組み
薬袋善郎先生の公式ウェブサイト