YOLO | Abstract 第2段落 第3文
A smaller version of the network, Fast YOLO, processes an astounding 155 frames per second while still achieving double the mAP of other real-time detectors.
Joseph Redmon, et al., "You Only Look Once: Unified, Real-Time Object Detection"
物体検出タスクにおいて、CNNのアーキテクチャをシンプルにすることで、Faster R-CNNに比べて識別精度は少し劣るものの検出速度が高速になったYOLOの論文である"You Only Look Once: Unified, Real-Time Object Detection"のAbstractの第2段落の第3文について、英語リーディング教本のFrame of Reference(F.o.R.)を使って英文構造を解読します。
「より小さい版のネットワークであるFast YOLOは、他のリアルタイム検出器の2倍のmAPを達成しつつも、驚異的にも毎秒155フレームを処理する。」
mAPとは、mean Average Precisionのことだそうです。この文では、精度も高い上、同時に検出速度も速いと言っています。
この文の主語はthe networkです。versionではありません。
"A smaller version of"は「種類 + of」の形です。"A smaller version"とofがくっついて形容詞句になり、the networkを修飾しています。
また、この文は特殊な英文です。なぜなら、この文はF.o.R.の基本に従わない英文だからです。つまり、英語リーディング教本および英語構文のエッセンス Stage-1に記載されているF.o.R.によって8割の英文は正確に構文を把握することが可能とされていますが、この英文にはその範囲外である2割に該当する構文が用いられています。
具体的には、この英文では「従属節の短縮形」が使われており、英語構文のエッセンス Stage-2で説明されている内容です。名詞節、形容詞節、副詞節にはそれぞれ定型的な短縮形があり、ここではwhileからdetectorsまでの副詞節が短縮形になっています。
when, while, if, thoughなどの副詞節を作る従属節属詞の次に、主語+be動詞が省略されることがあり、それが副詞節の短縮形です。
この文での副詞節では、主語+be動詞であるit isが省略されています。itはFast YOLOを指します。F.o.R.の基本ルールだけで読んでしまうと、接続詞whileが作る副詞節の内側に主語と動詞が見つからずに文を成立させることができずに困ることになってしまいます。
なお、英語構文のエッセンス Stage-2のP65にも解説がありますが、「副詞節の短縮形」ではなく、「分詞構文の意味をはっきりさせるために、分詞構文の前に従属接続詞を置いたもの」という捉え方をすることもできます。大抵の場合はどちらの捉え方でも可能です。
YOLOの技術の概要については、画像認識 (機械学習プロフェッショナルシリーズ)のChapter 7 (物体検出)に説明があります。
薬袋善郎先生の公式ウェブサイト