YOLO | Abstract 第1段落 第3文
Instead, we frame object detection as a regression problem to spatially separated bounding boxes and associated class probabilities.
Joseph Redmon, et al., "You Only Look Once: Unified, Real-Time Object Detection"
物体検出タスクにおいて、CNNのアーキテクチャをシンプルにすることで、Faster R-CNNに比べて識別精度は少し劣るものの検出速度が高速になったYOLOの論文である"You Only Look Once: Unified, Real-Time Object Detection"のAbstractの第1段落の第3文について、英語リーディング教本のFrame of Reference(F.o.R.)を使って英文構造を解読します。
「その代わりとして、我々は物体検出を、空間的に切り離されたバウンディングボックスと関連するクラスの確率に対する回帰問題として組み立てる。」
図解の2行目には下線が一本引かれているだけですが、これは一行目のtoから二行目最後のprobabilitiesまでが一つの形容詞句であることを示しています。F.o.R.ではあまり事細かに書きすぎてしまうと煩雑になってしまうことがあるため、文の意味を理解するために差し支えないようであれば、ある程度表記が省略されます。
YOLOの技術の概要については、画像認識 (機械学習プロフェッショナルシリーズ)のChapter 7 (物体検出)に説明があります。
薬袋善郎先生の公式ウェブサイト