AI Paper English F.o.R.

人工知能(AI)に関する論文を英語リーディング教本のFrame of Reference(F.o.R.)を使いこなして読むブログです。

AlphaGo Zero | Abstract 第5文

Here we introduce an algorithm based solely on reinforcement learning, without human data, guidance or domain knowledge beyond game rules.

 

David Silver, et al., "Mastering the game of Go without human knowledge"

Mastering the game of Go without human knowledge | Nature

囲碁AIであるAlphaGoの後継であり、プロ棋士の打った手を学習に使用せずにAlphaGoに100戦100勝0敗で勝ち越したAlphaGo Zeroの論文である"Mastering the game of Go without human knowledge"のAbstractの第5文について、英語リーディング教本のFrame of Reference(F.o.R.)を使って英文構造を解読します。

 

f:id:AI-paper-FoR:20200119154027p:plain

 

「ここで、我々は、人間のデータや指導またはゲームのルール以上のドメイン知識なしで、単に強化学習だけに基づいたアルゴリズムを紹介する。」 

 

Hereは文頭に用いて「ここで」という意味です。前の文まではAlphaGoについて述べられていましたが、この文ではこの論文の本題である提案内容に話を切り替えるためのつなぎとしてHereが用いられています。そのため、文全体を修飾する文修飾の副詞として解釈しました。

hereの意味・使い方・読み方 | Weblio英和辞書

 

introduceは論文の新規提案の内容を「紹介する」ために用いられる頻出単語です。第三文型の他動詞です。ここでの目的語はalgorithmです。

英語「introduce」の意味・使い方・読み方 | Weblio英和辞書

 

solelyは副詞で、「単に」という意味です。ここでは直後のonから始まる副詞句を修飾しています。AlphaGo Zeroreinforcement learning「だけ」を使っていることを強調しています。それに対し、先行研究であるAlphaGoは教師あり学習も使っていました。

solelyの意味・使い方・読み方 | Weblio英和辞書

 

domain knowledgeは名詞で「ドメイン知識または領域知識は、はっきり限定された、ある専門分野に特化した分野の知識であり、一般知識またはドメイン独立の知識と対比される。」という意味です。ここではそのままドメイン知識と訳しました。

domain knowledgeの意味・使い方 - 英和辞典 WEBLIO辞書

 

beyondは前置詞です。ここでは、「[程度・到達などを表わして] …の範囲を越えて; …以上」の意味です。"beyond game rules"は形容詞句、domain knowledgeを修飾しています。AlphaGo Zeroでは「ゲームのルール以上のドメイン知識」なしで強化学習させています。

beyondの意味・使い方・読み方 | Weblio英和辞書

 

AlphaGo Zeroに関する概要はこちらの書籍でも丁寧に解説されています。

最強囲碁AI アルファ碁 解体新書 増補改訂版 アルファ碁ゼロ対応 深層学習、モンテカルロ木探索、強化学習から見たその仕組み

 


ai-paper-for.hatenablog.com

  

 

薬袋善郎先生の公式ウェブサイト 

http://minai-yoshiro.com


 

AlphaGo Zero | Abstract 第4文

These neural networks were trained by supervised learning from human expert moves, and by reinforcement learning from self-play.

 

David Silver, et al., "Mastering the game of Go without human knowledge"

Mastering the game of Go without human knowledge | Nature

囲碁AIであるAlphaGoの後継であり、プロ棋士の打った手を学習に使用せずにAlphaGoに100戦100勝0敗で勝ち越したAlphaGo Zeroの論文である"Mastering the game of Go without human knowledge"のAbstractの第4文について、英語リーディング教本のFrame of Reference(F.o.R.)を使って英文構造を解読します。

 

f:id:AI-paper-FoR:20200119014345p:plain

 

「これらのニューラルネットワークは、人間の熟練者の手からの教師あり学習と、自己対局からの強化学習によって訓練された。」 

 

"These neural networks"は、直前の文で触れられていたAlphaGoのことです。

AlphaGo Zero | Abstract 第2文 - AI Paper English F.o.R.

AlphaGo Zero | Abstract 第3文 - AI Paper English F.o.R.

 

構文としては簡単な文です。

neural networks, trained, supervised learning, human expert, reinforcement learning, self-play

といった、機械学習、特に深層強化学習でよく用いられる単語が多数用いられています。

 

AlphaGo Zeroに関する概要はこちらの書籍でも丁寧に解説されています。

最強囲碁AI アルファ碁 解体新書 増補改訂版 アルファ碁ゼロ対応 深層学習、モンテカルロ木探索、強化学習から見たその仕組み

 


ai-paper-for.hatenablog.com

  

 

薬袋善郎先生の公式ウェブサイト 

http://minai-yoshiro.com


 

AlphaGo Zero | Abstract 第3文

The tree search in AlphaGo evaluated positions and selected moves using deep neural networks.

 

David Silver, et al., "Mastering the game of Go without human knowledge"

Mastering the game of Go without human knowledge | Nature

囲碁AIであるAlphaGoの後継であり、プロ棋士の打った手を学習に使用せずにAlphaGoに100戦100勝0敗で勝ち越したAlphaGo Zeroの論文である"Mastering the game of Go without human knowledge"のAbstractの第3文について、英語リーディング教本のFrame of Reference(F.o.R.)を使って英文構造を解読します。

 

f:id:AI-paper-FoR:20191117163840p:plain

 

「アルファ碁における木探索は、ディープニューラルネットワークを使って盤面配置と選択された次の手を評価した。」 

 

selectedは英語構文的には準動詞とも述語動詞ともどちらとも解釈可能ですが、AlphaGoの技術内容を考慮するとselectedは準動詞と解釈することが適切だと判断しました。

 

上記のselectedを準動詞とした解釈では、等位接続詞のandは名詞のpositionsとmovesを繋いでいます。どちらも動詞evaluatedの目的語です。準動詞のusingは動詞のevaluatedを修飾しています。

 

なお、selectedは③の過去分詞としても解釈できますが、「選択された」という意味の形容詞としても解釈できます。

selectedの意味・使い方 - 英和辞典 WEBLIO辞書

 

下記は、selectedが述語動詞だと解釈した場合です。

等位接続詞のandは述語動詞のevaluatedとselectedを繋いでいます。準動詞のusingはevaluatedとselectedにかかります。

この場合、evaluatedの目的語がpositionsだけになります。実際には次の一手movesもニューラルネットを使って評価していますので、movesもevaluatedの目的語だと解釈するべきかと思います。そのため、selectedは準動詞としてmovesにかかると判断しました。

 

f:id:AI-paper-FoR:20191117163934p:plain

 

「アルファ碁における木探索は、ディープニューラルネットワークを使って盤面配置を評価し、次の手を選択した。」

 

AlphaGo Zeroに関する概要はこちらの書籍でも丁寧に解説されています。

最強囲碁AI アルファ碁 解体新書 増補改訂版 アルファ碁ゼロ対応 深層学習、モンテカルロ木探索、強化学習から見たその仕組み

 


ai-paper-for.hatenablog.com

  

 

薬袋善郎先生の公式ウェブサイト 

http://minai-yoshiro.com


 

AlphaGo Zero | Abstract 第2文

Recently, AlphaGo became the first program to defeat a world champion in the game of Go.

 

David Silver, et al., "Mastering the game of Go without human knowledge"

Mastering the game of Go without human knowledge | Nature

囲碁AIであるAlphaGoの後継であり、プロ棋士の打った手を学習に使用せずにAlphaGoに100戦100勝0敗で勝ち越したAlphaGo Zeroの論文である"Mastering the game of Go without human knowledge"のAbstractの第2文について、英語リーディング教本のFrame of Reference(F.o.R.)を使って英文構造を解読します。

 

f:id:AI-paper-FoR:20191103164110p:plain

 

「最近、AlphaGoは囲碁のゲームの世界チャンピオンを破った最初のプログラムになった。」 

 

defeatは「破る、負かす」と言う意味の他動詞です。

英語「defeat」の意味・使い方・読み方 | Weblio英和辞書

AlphaGoの論文のAbstractでも人間を破ったことを表現するために、同じくdefeatが用いられています。

AlphaGo | Abstract 第6文 - AI Paper English F.o.R.

AlphaGo | Abstract 第7文 - AI Paper English F.o.R.

 

AlphaGo Zeroに関する概要はこちらの書籍でも丁寧に解説されています。

最強囲碁AI アルファ碁 解体新書 増補改訂版 アルファ碁ゼロ対応 深層学習、モンテカルロ木探索、強化学習から見たその仕組み

 


ai-paper-for.hatenablog.com

  

 

薬袋善郎先生の公式ウェブサイト 

http://minai-yoshiro.com


 

AlphaGo Zero | Abstract 第1文

A long-standing goal of artificial intelligence is an algorithm that learns, tabula rasa, superhuman proficiency in challenging domains.

 

David Silver, et al., "Mastering the game of Go without human knowledge"

Mastering the game of Go without human knowledge | Nature

囲碁AIであるAlphaGoの後継であり、プロ棋士の打った手を学習に使用せずにAlphaGoに100戦100勝0敗で勝ち越したAlphaGo Zeroの論文である"Mastering the game of Go without human knowledge"のAbstractの第1文について、英語リーディング教本のFrame of Reference(F.o.R.)を使って英文構造を解読します。

 

f:id:AI-paper-FoR:20191006132541p:plain

 

「人工知能の積年の目標は、挑戦的な領域で「白紙の状態」から超人的な技能を学習するアルゴリズムである。」 

 

long-standingは形容詞で「積年の、長年の」という意味です。

long-standing とは 意味・読み方・表現 | Weblio英和辞書

 

tabula rasaはラテン語で「白紙の状態」という意味の名詞です。論文では"tabula rasa"が斜体文字になっていて、強調されている言葉であることが伺えます。つまり、AlphaGo Zeroが「ゼロから学ぶ」ということを強調するキーワードです。

ここでは、前置詞を伴わず「白紙の状態から」という副詞的な役割をしているので、副詞的目的格として解釈しました。動詞のlearnsにかかり、「白紙の状態から学習する」という意味です。ただし、前後にカンマをつけて挿入されている扱いですので、これはあまり厳密な意味で正しい解釈ではないかもしれません。

tabula rasaの意味・使い方・読み方 | Weblio英和辞書

タブラ・ラーサ - Wikipedia

 

thatは関係代名詞です。thatから文末のdomainsまでが形容詞節で、algorithmを修飾しています。thatの内側の働きは主語です。

 

superhumanは形容詞で「超人的な」という意味です。

superhuman とは 意味・読み方・表現 | Weblio英和辞書

 

proficiencyは名詞で「熟達、熟練、技能」という意味です。

proficiencyの意味・使い方・読み方 | Weblio英和辞書

 

AlphaGo Zeroに関する概要はこちらの書籍でも丁寧に解説されています。

最強囲碁AI アルファ碁 解体新書 増補改訂版 アルファ碁ゼロ対応 深層学習、モンテカルロ木探索、強化学習から見たその仕組み

 


ai-paper-for.hatenablog.com

  

 

薬袋善郎先生の公式ウェブサイト 

http://minai-yoshiro.com


 

AlphaGo | Abstract 第7文

This is the first time that a computer program has defeated a human professional player in the full-sized game of Go, a feat previously thought to be at least a decade away.

 

David Silver, et al., "Mastering the game of Go with deep neural networks and tree search"

https://www.nature.com/articles/nature16961

2015年10月に人間のプロ囲碁棋士を互先(ハンディキャップなし)で破った初のコンピュータ囲碁プログラムであるAlphaGoの論文の"Mastering the game of Go with deep neural networks and tree search"のAbstractの第7文について、英語リーディング教本のFrame of Reference(F.o.R.)を使って英文構造を解読します。

 

f:id:AI-paper-FoR:20190929195615p:plain

 

「これは、囲碁の普通サイズのゲームにおいてコンピュータプログラムが人間のプロ棋士を破った初めてのことであり、少なくとも10年先になると以前は考えられていた偉業である。」 

 

Thisは前の文を指しています。

AlphaGo | Abstract 第6文 - AI Paper English F.o.R.

 

thatは従属接続詞です。thatからGoまでが名詞節で、直前のtimeと同格になっています。

 

featは名詞で、「偉業」という意味です。Goの直後のカンマで文としては一度成立していますので、feat以降の部分は挿入されたものとなります。そのfeatはthatからGoまでが名詞節と同格になっていると解釈しました。したがって、featは文の構成要素としての名詞の基本的働き(主語・動詞の目的語・前置詞の目的語・補語)は担っていないので、単純に名詞を示すnと図示してあります。

featの意味・使い方・読み方 | Weblio英和辞書

 

full-sizedは「普通サイズの、実物大の」という意味の形容詞です。

fullsize とは 意味・読み方・表現 | Weblio英和辞書

 

"at least"は一つの副詞としました。

at leastの意味・使い方・読み方 | Weblio英和辞書

 

awayは副詞と形容詞がありますが、ここでは形容詞と判断しました。詳細については下記で説明します。

awayの意味・使い方・読み方 | Weblio英和辞書

 

a decadeは副詞的目的格で、awayを修飾しています。副詞的目的格とは「名詞に前置詞を付けず、名詞のままで副詞の働きをさせる現象」です。

つまり、

"a feat previously thought to be at least a decade away."

の骨格は

"a feat previously thought to be ... away."

「以前は・・・先だと考えられていた偉業」

というbeが第二文型の動詞型で、awayは形容詞で補語です。どれくらい先の時間がかかるかを"at least a decade"で表しています。

 

副詞的目的格については、下記の例文を補足として載せておきます。

こちらは、英語リーディング教本の99ページの例文です。

f:id:AI-paper-FoR:20190929200709p:plain


こちらは、コンパスローズ英和辞典 [並装]の119ページの形容詞のawayの例文です。

f:id:AI-paper-FoR:20190929200749p:plain

 

AlphaGoに関する概要はこちらの書籍でも丁寧に解説されています。

最強囲碁AI アルファ碁 解体新書 増補改訂版 アルファ碁ゼロ対応 深層学習、モンテカルロ木探索、強化学習から見たその仕組み

 


ai-paper-for.hatenablog.com

  

 

薬袋善郎先生の公式ウェブサイト 

http://minai-yoshiro.com


 

AlphaGo | Abstract 第6文

Using this search algorithm, our program AlphaGo achieved a 99.8% winning rate against other Go programs, and defeated the human European Go champion by 5 games to 0.

 

David Silver, et al., "Mastering the game of Go with deep neural networks and tree search"

https://www.nature.com/articles/nature16961

2015年10月に人間のプロ囲碁棋士を互先(ハンディキャップなし)で破った初のコンピュータ囲碁プログラムであるAlphaGoの論文の"Mastering the game of Go with deep neural networks and tree search"のAbstractの第6文について、英語リーディング教本のFrame of Reference(F.o.R.)を使って英文構造を解読します。

 

f:id:AI-paper-FoR:20190928132256p:plain

 

「この検索アルゴリズムを用いて、我々のプログラムであるAlphaGoは他の囲碁のプログラムに対して99.8%の勝率を達成し、人間のヨーロッパの囲碁のチャンピオンを5対0で打ち負かした。」 

 

文頭のusingは準動詞で、前の働きは副詞です。つまり分詞構文です。our program以降の文全体を修飾しています。usingの後ろの働きは第三文型の他動詞で、this search algorithmが動詞の目的語です。

 

この文の主語は"our program"です。programとAlphaGoは同格です。

主節の述語動詞はachievedとdefeatedの二つで、等位接続詞のandでつながれています。

 

winningは形容詞で、「勝者である、勝利を得た」という意味です。

winning とは 意味・読み方・表現 | Weblio英和辞書

"winning rate"で「当選率」という意味もあるようですが、ここでは「勝率」という意味が適当だと思います。

winning rateの意味・使い方 - 英和辞典 WEBLIO辞書

 

againstは前置詞です。

againstの意味・使い方・読み方 | Weblio英和辞書

 

AlphaGoに関する概要はこちらの書籍でも丁寧に解説されています。

最強囲碁AI アルファ碁 解体新書 増補改訂版 アルファ碁ゼロ対応 深層学習、モンテカルロ木探索、強化学習から見たその仕組み

 


ai-paper-for.hatenablog.com

  

 

薬袋善郎先生の公式ウェブサイト 

http://minai-yoshiro.com