HOG関連論文:人物のポーズを要素に分解して認識する

このアイデアはなかなか興味深い。

Christian Thurau and Vaclav Hlavac (CVPR2008) "Pose primitive based human action recognition in videos or still images"
ftp://cmp.felk.cvut.cz/pub/cvl/articles/hlavac/Thurau-HlavacPosePrimitivesCVPR2008.pdf

HOGの特徴ベクトルを、"NMF"という数学的テクニックを使っていくつかの基底ベクトル=基本ポーズ要素に分解して認識しようというアプローチ。

NMFは、Non-Negative Matrix Factorizationの略称で、その名の通り、任意の行列Vを非負要素からなる行列の積W・Hに分解できる。固有値分解と似ているが、非負行列の積になるところが違う。

NMFは初期値依存性のある収束計算で答えを求めるので、当然一意に答えがでるわけではない。上記の論文では、予め用意した基本ポーズ要素から得た特徴ベクトルを並べたものをWと置いて、Hを求めている。Hの中身は各ポーズ要素の重み係数行列のように扱えるらしい。(斜め読みなので、多少間違っているかも。気になる人は原文を解読してみてください。)