CUDA(GPGPU)、少しづつ理解中

CUDAのテキスチャメモリは便利である。拡大縮小を多用する画像処理なら、これだけでも利用価値が高い。

2次元フィルタリング処理でざっくり計測したところでは、ほとんどオーバーヘッドゼロで拡大縮小出来ている模様。
サブピクセルに対してアクセスして原画像の2倍の解像度=画素数4倍で処理しても、所要時間は4倍にしかなっていない。
3倍解像度でもほぼ9倍の所要時間である。
つまり、サブピクセル補間に要する処理オーバヘッド時間が表面には現れてこないのだ。

わずか数万円のボードでこんなことが達成できてしまうなんて、すごい時代になったものだ。