AI Paper English F.o.R.

人工知能(AI)に関する論文を英語リーディング教本のFrame of Reference(F.o.R.)を使いこなして読むブログです。

Faster R-CNN | Abstract 第6文

We further merge RPN and Fast R-CNN into a single network by sharing their convolutional features—using the recently popular terminology of neural networks with “attention” mechanisms, the RPN component tells the unified network where to look.

 

Shaoqing Ren, et al., "Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks"

https://arxiv.org/abs/1506.01497

物体検出タスクにおいて、2つのネットワーク(RPNとFast R-CNN)で特徴マップを共有することで計算を効率化させたFaster R-CNNの論文である"Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks"のAbstractの第6文について、英語リーディング教本のFrame of Reference(F.o.R.)を使って英文構造を解読します。

 

f:id:AI-paper-FoR:20190505090258p:plain

 

「さらに、我々は畳み込み特徴量を共有することでRPNとFast R-CNNをたった一つのネットワークに併合した。最近評判の良い専門用語であるアテンションメカニズムを用いたニューラルネットワークを使用し、RPNの構成要素は統一されたネットワークがどこを見るべきかということを教える。」

 

ダッシュの後は、ダッシュの前の文の内容を言い換えてより詳しく説明している文と言えそうなので、修飾関係および日本語訳はダッシュの前と後で分けています。ほぼ2つの文が並んでいる状態に近いです。しかしながら、ダッシュでつながっていることを忘れずに意識して意味を理解できれば良いかと思います。

 

そして、この文は実は特殊な英文です。なぜなら、この文はF.o.R.の基本に従わない英文だからです。つまり、英語リーディング教本および英語構文のエッセンス Stage-1に記載されているF.o.R.によって8割の英文は正確に構文を把握することが可能とされていますが、この英文にはその範囲外である2割に該当する構文が用いられています。

 

具体的には、この英文では「従属節の短縮形」が使われており、英語構文のエッセンス Stage-2で説明されている内容です。名詞節、形容詞節、副詞節にはそれぞれ定型的な短縮形があり、ここでは文末の"where to look"が名詞節の短縮形です。

 

[疑問詞 + to -]

 

の形で、直訳すると「疑問詞、-すべきかということ」となります。toをS shouldに置き換えるとわかりやすくなります。この文では名詞節の主語Sはthe unified networkを指しています。したがって、名詞節"where to look"は「the unified networkはどこを見るべきかということ」となります。

 

なお、図解の中でtoを丸で囲ってS shouldの形で置き換える図としましたが、英語構文のエッセンス Stage-2の本の中で正式に使われている記法ではありませんので、ご注意ください。同封の薬袋先生の講義CDの説明から、そのように表記を追加した方が個人的にはわかりやすかったので、そのように致しました。正式にはその表記はする必要はありません。

 

Faster R-CNNの技術の概要については、画像認識 (機械学習プロフェッショナルシリーズ)のChapter 7 (物体検出)に説明があります。

 


ai-paper-for.hatenablog.com

  

 

薬袋善郎先生の公式ウェブサイト 

http://minai-yoshiro.com