Grad-CAM | Abstract 第4文
We combine Grad-CAM with existing fine-grained visualizations to create a high-resolution class-discriminative visualization and apply it to image classification, image captioning, and visual question answering (VQA) models, including ResNet-based architectures.
Ramprasaath R. Selvaraju, et al., "Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization"
出力のクラスに対応する判断根拠を可視化できる手法であるGrad-CAMの論文の"Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization"のAbstractの第4文について、英語リーディング教本のFrame of Reference(F.o.R.)を使って英文構造を解読します。
「我々は、高解像度のクラス識別の視覚化を構築するためにGrad-CAMと既存のきめの細かい視覚化と組み合わせ、そしてそれをResNetを基にした構造を含む画像分類、画像キャプショニング、および画像質問応答(VQA)のモデルに適用する。」
applyの前のandは等位接続詞で、combineとapplyをつなぎます。
combineとapplyの主語は文頭のWeです。
itは"Grad-CAM with existing fine-grained visualizations"を指します。
ResNet-basedは形容詞として扱いました。"-based"という接尾語がつくと形容詞が形成されるそうです。
-BASED | meaning in the Cambridge English Dictionary
PythonとKerasによるディープラーニングの「5.4 CNNが学習した内容を可視化する」に、Grad-CAMについてサンプルコード付きの説明があります。
薬袋善郎先生の公式ウェブサイト