論文メモ:Image representations beyond histograms of gradients: The role of Gestalt descriptors
Abstract
HOGやその派生形の改良研究が盛んだが、本論文では、「explicitに中間レベルの形態概念を捉える」新しい特徴量によって、物体認識の精度向上を試みる。
ここでは、4つの新しい画像特徴を提案する。それらは形態の連続性、対称性、閉包性、頻度である。baseline features として、Riesenhuber と Poggio の C1特徴と、DalanとTiggsの HOGを用いる。我々の新しい中間レベル表現形は、検出結果の改良が可能であり、特殊な対価を保障する。
1.Introduction
最近目立っているアプローチは、path similarities と edige orientation statistics である。これらは、複雑で高次の概念を陽には表現していないことは明らかで、複雑で高次な概念は後段の学習ステージが担っている。
我々のゴールは形態学主義をベースとした中間レベルの画像表現形をいくつか実装することである。
新しい特徴量は、一般化ハフ変換に似ている。しかし、多くの大きな相違点がある。それらはモフォロジー操作における「和演算」を置き換えたようなものである。
2.Current state of the art image features
HOGの概説
Patch based featuresの概説3.Continuity based image descriptors (「連続性」がベースの画像記述子)
我々の連続性特徴は、学習に適した長い輪郭線の表現形を得るために開発したものである。
古典的ハフ変換の説明。
古典的ハフ変換の欠点は、長さの違う線分を区別できないこと、画像の最上部の線分と最下部の線分を区別できないことである。
我々の特徴量は、これらの問題を解決しようとするものである。3.1.The min-max continuity descriptor
図1に関して、処理手順を説明。
(1)方向フィルタを掛ける。
(2)矩形化する。
(3)ローカルなダイレーションとエロージョンを交互に実施する。(カーネルは方向指定のもの)
(4)最終的に画像は半分の解像度に落とし込む。
つづく...