Faster R-CNN | Abstract 第7文
For the very deep VGG-16 model, our detection system has a frame rate of 5fps (including all steps) on a GPU, while achieving state-of-the-art object detection accuracy on PASCAL VOC 2007, 2012, and MS COCO datasets with only 300 proposals per image.
Shaoqing Ren, et al., "Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks"
物体検出タスクにおいて、2つのネットワーク(RPNとFast R-CNN)で特徴マップを共有することで計算を効率化させたFaster R-CNNの論文である"Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks"のAbstractの第7文について、英語リーディング教本のFrame of Reference(F.o.R.)を使って英文構造を解読します。
「非常に深いVGG-16モデルでは、我々の検出システムは、PASCAL VOC 2007、 2012およびMS COCOデータセットにおいて一画像あたり300個の提案だけという場合には最先端の物体検出精度を達成しつつも、GPU上で5fps(全ての手順を含む)というフレームレートを誇る。」
この文は実は特殊な英文です。なぜなら、この文はF.o.R.の基本に従わない英文だからです。つまり、英語リーディング教本および英語構文のエッセンス Stage-1に記載されているF.o.R.によって8割の英文は正確に構文を把握することが可能とされていますが、この英文にはその範囲外である2割に該当する構文が用いられています。
具体的には、この英文では「従属節の短縮形」が使われており、英語構文のエッセンス Stage-2で説明されている内容です。名詞節、形容詞節、副詞節にはそれぞれ定型的な短縮形があり、ここではwhileからimageまでの副詞節が短縮形になっています。
when, while, if, thoughなどの副詞節を作る従属節属詞の次に、主語+be動詞が省略されることがあり、それが副詞節の短縮形です。
この文での副詞節では、主語+be動詞であるit isが省略されています。itはour detection systemを指します。F.o.R.の基本ルールだけで読んでしまうと、接続詞whileが作る副詞節の内側に主語と動詞が見つからずに文を成立させることができずに困ることになってしまいます。
なお、英語構文のエッセンス Stage-2のP65にも解説がありますが、「副詞節の短縮形」ではなく、「分詞構文の意味をはっきりさせるために、分詞構文の前に従属接続詞を置いたもの」という捉え方をすることもできます。大抵の場合はどちらの捉え方でも可能です。
Faster R-CNNの技術の概要については、画像認識 (機械学習プロフェッショナルシリーズ)のChapter 7 (物体検出)に説明があります。
薬袋善郎先生の公式ウェブサイト