万方数据
万方数据
万方数据
万方数据
万方数据
万方数据
第3期任化敏,等:GPU加速的基于增量式聚类的视频拷贝检测方法455
提高约8倍、31倍、16倍和26倍,整体性能提高约22倍.
虽然速度得到了提升,但这个提升倍数远没有达到我们预期的加速比,其原因是我们的视频分辨率较低,每帧产生的SIFT特征较少,没能让GPU满负荷运行,所以加速比较低.
4)K—means聚类.图4所示为GPU方法相对
于CPU的速度提高比较.实验显示,本文基于流式
缩减的GPU实现方法在聚类51200个数据点时,
相比CPU方法达到73倍的加速比,比GPU的原始实现也有近6倍的加速比.实验中也发现,在数据
量达到102400之后,加速比有轻微的下降,这可能
是由于线程块内的线程数目增加带来了每线程可分配资源的减少,从而影响了GPU方法性能的提高.
流处理器数目比值基本一致.图6所示为Geforce
GTX
260+在不同运行频率下的执行时间,图中模式
1~4的流处理器和显示内存频率分别为1
296MHz
和830MHz,1296MHz和l107MHz,l403MHz和
1107MHz,1504MHz和1107MHz.可以看出,随
着流处理器频率的提升,执行时间相应减少,二者几乎成正比关系,但显示内存频率改变对执行速度几
乎无影响.
图6
GPU在不同运行频率下执行时同
通过以上2个项实验可以认为,本文方法在流处理器数目和运行频率方面具备稳定的可扩展性,
易于扩展到未来更高规格的GPU上.5。6实验结果对比分析
图4
K—means速度比较(纵坐标为对数刻度)
系统各部分方法在CPU和GPU上的执行时
5)前缀和法生成索引.实验显示,对于102
400
间分别如图7a和7b所示,可以看出,增量聚类与
个数据点,使用前缀和法生成特征点索引需要2.8ms,
生成视觉关键词词频向量占用的时间比重比较大?
而GPU的原始循环方式需要12.3ms,前者比后者
以5s为例,在CPU上分别为2228?8s和1959?5
s,
快4倍以上.
在GPU上执行时间分别为30.5s和26.8s.我们在5.5
可扩展性实验
GPU上的基.于增量式聚类的视频拷贝检测方法整体
除比较了本文方法的基础性能,我们也以K—
means聚类为例进行了可扩展性实验.实验中使用
GeforeeGTX260+和Geforce
9500GT分别执行相
同的计算,比较执行时间;再使用GPU频率修改工
具改变GeforceGTX260+的流处理器频率和显示
设备内存执行频率,并进行比较.
图5所示为GeforceGTX260+与Geforce
9500GT的执行时间比值.可以看出,该比值在4~7之间随数据量增大而不断增加,且与2块GPU的
87
丑6瑙5景4
32
/
。。/
.../r。
8
16
32
64
128
256
512
1024
10’2×数据点
图5
GTX260+9500GT的执行时间比值
图7
系统各部分方法在CPU和GPU上的时间分配
万方数据
万方数据
GPU加速的基于增量式聚类的视频拷贝检测方法
作者:任化敏, 张勇东, 林守勋
作者单位:任化敏(中国科学院计算技术研究所前瞻研究实验室,北京,100190;中国科学院研究生院,北京,100049;北京中医药大学信息中心,北京,100029), 张勇东,林守勋(中国科学院计算技术
研究所前瞻研究实验室,北京,100190)
刊名:
计算机辅助设计与图形学学报
英文刊名:JOURNAL OF COMPUTER-AIDED DESIGN & COMPUTER GRAPHICS
年,卷(期):2010,22(3)
参考文献(18条)
1.Lowe D G Object recognition from local scale-invariant features 1999
2.吴恩华图形处理器用于通用计算的技术、现状及其挑战[期刊论文]-软件学报 2004(10)
3.Hillis W D;Steele G L Data parallel algorithms 1986(12)
4.Fang W B;Lau K K;Lu M Parallel data mining on graphics processors 2008
5.Che S;Boyer M;Meng J A performance study of general-purpose applications on graphics processors using CUDA 2008(10)
6.曹锋;周傲英基于图形处理器的数据流快速聚类[期刊论文]-软件学报 2007(02)
7.MacQueen J B Some methods for classification and analysis of multivariate observations 1967
8.Chariot A;Keriven R GPU-boosted online image matching 2008
9.Heymann S;Müller K;Smolic A SIFT implementation and optimization for general-purpose GPU 2007
10.Hao F;Li E;Chen Y Parallelization and characterization of SIFT on multi-core systems 2008
11.Berker B;Cebe M;I ·smet Z Y Very-large scale incremental clustering 2007
12.Ren H M;Lin S X;Zhang D M Visual words based spatiotemporal sequence matching in video copy detection 2009
https://www.doczj.com/doc/549447705.html,w-To J;Buisson O;Gouet-Brunet V Robust voting algorithm based on labels of behavior for video copy detection 2006
14.Joly A;Frelicot C;Buisson O Feature statistical retrieval applied to content based copy identification 2004
15.Hampapur A;Hyun K -H;Bolle R Comparison of sequence matching techniques for video copy detection 2002
16.Hampapur A;Bolle R Feature based indexing for media tracking 2000
17.Sanchez J M;Binefa X;Vitria J Local color analysis for scene break detection applied to tv commercials recognition 1999
https://www.doczj.com/doc/549447705.html,w-To J;Chen L;Joly A Video copy detection:a comparative study 2007
本文链接:https://www.doczj.com/doc/549447705.html,/Periodical_jsjfzsjytxxxb201003013.aspx