Affine real-time face tracking using gabor wavelet networks
- 格式:pdf
- 大小:128.60 KB
- 文档页数:4
人脸追踪算法实时性评估说明人脸追踪算法已经在人工智能和计算机视觉领域得到了广泛的应用。
实时性是此类算法中一个重要的性能指标,指算法能在实际应用中实时追踪人脸的能力。
本文将对人脸追踪算法的实时性进行评估说明,并分析影响实时性的因素。
首先,人脸追踪算法的实时性可以通过算法的处理速度来衡量。
通常情况下,算法应该对视频帧或者图像序列进行快速处理,以便实时地追踪人脸的位置和姿态。
速度的评估可以通过算法的帧率或者处理时间来衡量。
帧率越高,算法的实时性越好。
较好的人脸追踪算法通常能够在较短的时间内处理一帧视频,实现实时追踪效果。
其次,实时性还与算法的复杂程度和计算资源的要求有关。
复杂的算法通常需要更多的计算资源,例如CPU、内存和显卡等。
这些资源的不足可能导致算法无法在实时场景中运行。
因此,在实际应用中,需要根据可用的硬件设备选择适合的人脸追踪算法,以提供较好的实时性能。
影响实时性的因素不仅仅是算法本身,还包括输入数据的大小和分辨率。
一般来说,输入数据越大,算法处理的时间就越长。
因此,为了提高实时性,可以通过控制输入数据的大小和分辨率来降低算法的处理时间。
例如,当视频帧率较低或者图像分辨率较低时,人脸追踪算法的处理速度可能会更快。
此外,人脸追踪算法的实时性还与算法的优化有关。
通过算法的优化,可以提高算法的效率和速度,从而增强算法的实时性能。
例如,可以使用并行计算、流水线处理和硬件加速等技术来提高算法的运行效率。
此外,还可以采用近似方法、子采样和关键点选择等技巧来降低算法的计算复杂度,提高算法的实时性。
最后,实时性评估还需要考虑算法的性能和准确性。
实时性只是其中一个指标,算法的稳定性、准确性和鲁棒性等也是评估指标。
在实际应用中,需要根据不同的需求和场景来平衡实时性和准确性的要求,选择合适的人脸追踪算法。
综上所述,人脸追踪算法的实时性是一个重要的性能指标。
实时性可以通过算法的处理速度来衡量,受到算法复杂程度、计算资源、输入数据、算法的优化等多个因素的影响。
时变时滞随机非线性系统的自适应神经网络跟踪控制余昭旭;杜红彬【摘要】This paper focuses on the adaptive neural control for a class of uncertain stochastic nonlinear strict-feedback systems with time-varying delay. Based on the Razumikhin function approach, a novel adaptive neural controller is de- veloped by using the backstepping technique. The proposed adaptive controller guarantees that all the error variables are 4-moment semi-globally uniformly ultimately bounded in a compact set while the tracking error remains in a neighborhood of the origin. The effectiveness of the proposed design is validated by simulation results.%针对一类具有时变时滞的不确定随机非线性严格反馈系统的自适应跟踪问题,利用Razumikhin引理和backstepping方法,提出一种新的自适应神经网络跟踪控制器.该控制器可保证闭环系统的所有误差变量皆四阶矩半全局一致最终有界,并且跟踪误差可以稳定在原点附近的邻域内.仿真例子表明所提出控制方案的有效性.【期刊名称】《控制理论与应用》【年(卷),期】2011(028)012【总页数】5页(P1808-1812)【关键词】自适应跟踪控制;神经网络(NNs);Razumikhin引理;随机系统;时变时滞【作者】余昭旭;杜红彬【作者单位】华东理工大学自动化系,上海200237;华东理工大学自动化系,上海200237【正文语种】中文【中图分类】TP2731 引言(Introduction)随机干扰广泛地存在于各类实际系统中,因此随机非线性系统的稳定性分析及控制器设计受到越来越多的关注[1~6].特别地,对于严格反馈型随机非线性系统,采用backstepping方法提出了许多控制策略[3~6].然而这些控制策略往往要求系统函数已知或满足匹配条件.如果不能获得系统函数的这些先验知识,那么这些方法显然不适用.由于神经网络和模糊系统对未知非线性函数具有良好的逼近性能,采用自适应神经网络控制和自适应模糊控制能较好地避免前面的限制.然而对具有未知系统函数的随机系统的神经网络控制问题和模糊控制问题的研究结果还比较少[6~10]. 时滞现象大量存在于如计算机网络、核反应器等实际系统中,并且往往会导致系统的不稳定,因此时滞系统一直是研究的热点问题[11].Lyapunov-Krasovskii方法和Lyapunov-Razumikhin方法也广泛地应用于时滞随机非线性系统的稳定性分析和控制器设计.文献[12,13]已将Lyapunov-Razumikhin方法应用到时滞不确定随机非线性系统的稳定性分析.对时滞随机非线性系统的镇定与跟踪问题,大多采用Lyapunov-Krasovskii方法[9,14~16]. 相比Lyapunov-Razumikhin方法,Lyapunov-Krasovskii函数则不易构造,且Lyapunov-Krasovskii函数的复杂性使得稳定性分析与控制器设计也更为复杂.此外Lyapunov-Krasovskii对时滞常常不仅要求有界,而且须满足(t)<ς<1(ς为常数),而Lyapunov-Razumikhin方法仅要求时滞有界.因此针对时变时滞随机非线性系统的跟踪控制问题,采用Lyapunov-Razumikhin方法提出一种新的自适应神经网络控制器设计方法具有重要意义.本文利用Razumikhin引理和backstepping方法,针对一类具有时变时滞的不确定随机非线性严格反馈系统,提出一种新的自适应神经网络跟踪控制策略.所提出的控制器可保证跟踪误差四阶矩半全局一致最终有界.同时由于神经网络参数化[10]的应用,使得自适应控制器中所估计的参数大量减少.2 问题描述及准备(Problem formulation and preliminary results)2.1 预备知识(Preliminary results)考虑以下随机非线性系统:其中:x∈Rn为状态,ω为定义完备概率空间(Ω,F,P)上的r维的标准布朗运动,其中:Ω为采样空间,F为σ域以及P为概率测度;f和h为合适维数的向量值函数或矩阵值函数.针对C2函数V(t,x)定义如下算子L:其中tr(A)为A的迹.Razumikhin引理:考虑时滞随机泛函微分方程(retarded stochastic functional differential equation,RSFDE):dx=f(t,xτ)dt+h(t,xτ)dω,令p > 1,如果存在函数V(t,x)∈ C1,2([−τ,∞]× Rn)和常数ci>0(i=1,2),q>1,满足以下不等式:对所有的t≥0,满足那么RSFDE的具有初值ξ的解x(t,ξ)概率意义下一致最终有界,并且满足其中:|ξ(s)|p,γ=µ1∧.由文献[17]中定理4.1.4取κ =0,ψ(t)=e−t,µ = µ1和ζ(t)= µ2可容易得到以上Razumikhin引理,证明略.本文中考虑p=4.引理1 对于ε>0和任意实数η∈R,存在不等式[18]其中k为常数且满足k=e−(k+1),即k=0.2785.引理2 考虑不等式其中λ为正常数,如果初始条件(0)≥0成立,则对所有t≥0有(t)≥0.本文中,高斯径向基函数(RBF)神经网络用来逼近任意的连续函数g(·):Rn→R,也即=TΦ(Z),其中输入向量Z∈ΩNN⊂Rn,权向量=(w1,···,wl)T ∈ Rl以及核向量Φ(Z)=(s1(Z),s2(Z),···,sl(Z))T;激励函数si(Z)采用高斯函数,即其中:µi=(µi1,···,µin)T为接受域的中心,νi为高斯函数的宽度.通过选择足够多的节点,神经网络在紧集ΩNN⊂Rn上可以逼近任意的连续函数,即“理想”的权向量W∗是为了分析而设想的量,定义为W∗:=arg|g(Z)−Z)|}.假设1 ∀Z∈ΩNN,存在“理想”的常数权向量W∗,使得‖W∗‖∞ ≤ wmax和|δ|≤ δmax,其中上界wmax,δmax > 0.由式(7)容易得到其中:β(Z)==max{δmax,wmax}.2.2 问题描述(Problem formulation)考虑由以下方程描述的时滞随机非线性系统:其中:xi∈R(i=1,···,n)为系统的状态,定义i=[x1···xi]T,x=n;u∈R为控制输入;y∈R为系统的输出;Borel可测函数τ(t):R+→ [0,τ]表示未知的时变时滞;ω与系统(1)定义相同;f(·),g(·),q(·):Rn→ R和h(·):Rn→ Rr皆为未知的非线性光滑函数.本文的主要目的是设计一种自适应状态反馈控制率u(x,θ),=Φ(x,),使得对于某紧集内的初始条件x(0),(0),闭环系统的所有误差变量皆四阶矩半全局一致最终有界,且跟踪误差可以稳定在原点附近的邻域内.假设2 未知非线性函数g(x)的符号已知,且存在正常数bm和bM,满足0<bm≤|g(x)|≤bM<∞,∀x∈Rn.不失一般性,可进一步假设0<bm≤g(x)≤bM<∞.假设3 存在未知k∞类函数Q(·)满足以下不等式:|q(x(t− τ(t)))|≤ Q(‖x(t− τ(t))‖).假设 4 未知非线性函数h(x,x(t−τ(t)))满足以下不等式:‖h(x,x(t− τ(t)))‖2 ≤H1(‖x‖)+H2(‖x(t− τ(t))‖),其中:H1(·)为未知非负光滑函数,H2(·)为未知k∞类函数.(t)皆为连续且有界的.进一步,假定存在常数d,假设 5 参考信号yd(t)及其微分(t),···,使得‖[yd···]T‖ ≤ d.3 控制器设计及稳定性分析(Controller design and stability analysis)这一节,针对系统(9),利用backstepping方法及Razumikhin引理设计一种新的自适应神经网络跟踪控制器.首先,需引入以下误差变量:其中:为待定的虚拟控制函数,.对于1≤i≤n−1,选取Lyapunov函数选取虚拟控制函数为其中:Lαi−1=,ki为待定设计常数.则容易得到以下关系式:其中:p1=k1−3/4>0,pi=ki−1>0(2≤i≤n−1).将式(11)可改写为如下形式:系数di,j为常数.另外,α0(yd)=yd.基于以上的介绍,容易得到下面引理3.引理3 存在正常数ρ,υ,使得其中:Z=[z1···zn:=−θ/bm,表示未知常数θ/bm的估计.下面继续控制器的设计.当i=n时,由Itˆo公式可得其中Lαn−1:=.定义Lyapunov函数由式(2)可得由假设3可得由于Q(·)为k∞类函数,利用引理3及Razumikhin引理可得由引理1,||Fn,其中Fn=Q(2ρq‖Z(t)‖)+Q(2υ),可通过以下不等式进行处理: 由假设4,可得以下不等式:其中:Gn=H2(2ρq‖Z‖)+H2(2υ),ϑ1和ϑ2为任意的正常数.定义一个新的函数在紧集ΩZ中可通过RBF神经网络逼近:其中:Zn=[x[n]]∈ ΩZ,W∗TS(Zn)表示的“理想”神经网络近似,而δ(Zn)表示逼近误差.利用神经网络参数化式(8),可得其中: β(·)==max{δmax,wmax}.构造实际控制器及参数调整算法如下:其中kn,σ与λ为待定的正设计参数.利用不等式θ≥,在控制器(20)(21)的作用下,由式(14)~(19)可得其中pn:=knbm−>0.式(22)可改写为其中: µ :=min{4p1,4p2,···,4pn−1,4pn,λ},ν :=θ2+k(θσ + ε)+由式(23)及Razumikhin引理可知,闭环系统的解四阶矩半全局一致最终有界,且对于足够小的ς>0,存在时间T:=,其中:E|Z(s)|4,γ=µ∧,c1 ≤min{},使得∀t≥T,有E|(y(t)−yd)4|≤ (1+ς)基于以上分析,主要结论可由以下定理描述:定理1 对于满足假设(2)~假设(5)的时变时滞不确定随机非线性系统(9),在控制器(20)和参数自适应率(21)作用下,闭环系统的所有误差信号四阶矩半全局一致最终有界,且跟踪误差稳定在以下集合Ω所定义的区域内:注 1 定义如下紧集:初始值集合Ω0、有界紧集ΩZ、稳态紧集Ωs和神经网络逼近的有效集合ΩNN.在控制器设计过程中为了∀t≥0神经网络逼近皆有效,需保证ΩZ⊆ΩNN.为了阐述方便,由式(23)及Razumikhin引理,可将有界紧集ΩZ和稳态紧集Ωs定义如下:这些集合之间的关系如图1所示.在控制器设计的初始阶段首先定义ΩNN,并且ΩNN与控制器的参数和初始集合Ω0均无关.由式(24)(25)可知:i)初始集合Ω0通过‖ξ‖0影响ΩZ,但与Ωs和ΩNN无关;ii)可通过调整参数ki,λ,σ,ε,ϑ1和ϑ2,使得ΩZ和Ωs足够小.图1 各紧集之间的关系Fig.1 The relationship among compact sets由集合ΩZ和Ωs的界可知,对于给定足够大的ΩNN,存在合适的‖ξ‖0,γ和ν使得ΩZ ⊆ ΩNN和Ωs ⊆ ΩNN. 而由γ和ν的定义可知,γ和ν的值依赖于控制参数ki,λ,σ,ε,ϑ1和ϑ2的选择.因此对于给定足够大的ΩNN和‖ξ‖0=ξmax>0,存在合适的控制参数使得ΩZ⊆ΩNN.定义xi(0),zi(0)和(0)的初始值集合Ω0使得‖ξ‖0<ξmax.这时对于属于Ω0的所有xi(0),zi(0)和(0),∀t>0均有ΩZ⊆ΩNN.4 仿真研究(Simulation example)考虑以下时变时滞不确定随机非线性系统:其中:τ(t)=1+sint,初始条件为x1(0)=0.2和x2(0)=0.1,参考输入信号yd=0.5(sint+sin 0.5t).仿真过程中,采用RBF神经网络来逼近未知函数,W∗TS(Z2)包含729个节点,中心分布在[−5,5]×[− 5,5]×[− 5,5]×[− 5,5]×[− 5,5]×[0,5],宽度为1;其他仿真参数给出如下:k1=4.74,k2=15,λ=5,σ=1.采用定理1中的控制器(20)和参数自适应率(21),其中z1=x1−yd,z2=x2− α1,β = β(Z2).仿真结果由图2~4给出,图2表明所提出的自适应跟踪控制器具有良好的跟踪性能,输出响应y能比较快地跟踪参考输入yd;控制输入如图3所示;图4描述了自适应参数曲线.图2 输出响应y(t)和参考输入yd(t)Fig 2 Output responsey(t)and reference inputyd(t)图3 控制输入u(t)Fig 3 Control inputu(t)图4 自适应参数Fig 4 Adaptive parameter5 结论(Conclusion)本文针对一类具有未知时变时滞的不确定随机非线性严格反馈系统,利用Razumikhin引理和backstepping方法,提出了一种新的神经网络自适应控制器,可以保证跟踪误差四阶矩半全局一致最终有界.所给出的控制器结构简单,易于实现.将该方法推广到更一般的严格反馈型随机非线性系统是下一步工作的方向.参考文献(References):【相关文献】[1]FLORCHINGER P.Lyapunov-like techniques for stochastic stability[J].SIAM Journal on Control and Optimization,1995,33(4):1151–1169.[2]FLORCHINGER P.Feedback stabilization of affine in the control stochastic differential systems by the control Lyapunov function method[J].SIAM Journal on Control and Optimization,1997,35(2):500–511.[3]PAN Z G,BASAR T.Adaptive controller design for tracking and disturbance attenuation in parameter-feedback nonlinear systems[J].IEEE Transactions on AutomaticControl,1998,43(8):1066–1083.[4]DENG H,KRISTIC M.Stochastic nonlinear stabilization:part 1:a backsteppingdesign[J].Systems&Control Letters,1997,32(3):143–150.[5]DENG H,KRISTIC M.Stochastic nonlinear stabilization:part 2:inverseoptimality[J].Systems&Control Letters,1997,32(3):151–159.[6]WANG Y C,ZHANG H G,WANG Y Z.Fuzzy adaptive control of stochastic nonlinearsystems with unknown virtual control gainfunction[J].Acta AutomaticaSinica,2006,32(2):170–178.[7]PSILLAKIS H E,ALEXANDRIDIS.NN-based adaptive tracking control of uncertain nonlinear systems disturbed by unknown covariance noise[J].IEEE Transactions on Neural Networks,2007,18(6):1830–1835.[8]YU J J, ZHANG K J, FEI S M. Direct fuzzy tracking control of a class of nonaffine stochastic nonlinear systems with unknown dead-zone input[C] //Proceedings of the 17th World Congress, the International Federation of Automatic Control. Elseviet: International Federation of Accountants, 2008, 12236 – 12241.[9]谢立,何星,熊刚,等,随机非线性时滞大系统的输出反馈分散镇定[J].控制理论与应用,2003,20(6):825–830.(XIE Li,HE Xing,XIONG Gang,et al.Decentralized output feedback stabilization for large scale stochastic nonlinear system with time delays[J].Control Theory&Applications,2003,20(6):825–830.)[10]GE S S,HUANG C C,LEE T,et al.Stable Adaptive Neural Network Control[M].USA:Kluwer Academic,2002.[11]RICHARD J P.Time-delay systems:an overview of some recent advances and open problems[J].Automatica,2003,39(10):1667–1694.[12]MAO X R.Razumikhin-type theorems on exponential stability of stochastic functional differential equataions[J].Stochastic Process and Their Application,1996,65(2):233–250. [13]JANKOVIC S,RANDJELOVIC J,JOVANOVIC M.Razumikhintype exponential stability criteria of neutral stochastic functional differential equations[J].Journal of Mathematical Analysis and Applications,2009,355(2):811–820.[14]CHEN W S,JIAO L C,liJ,et al.Adaptive NN backstepping output-feedback control for stochastic nonlinear strict-feedback systems with time-varying delays[J].IEEE Transations on System,Man and Cybernetics,Part B:Cybernetics,2010,40(3):939–950.[15]LIU S J,GE S S,ZHANG J F.Robust output-feedback stabilization for a class of uncertain stochastic nonlinear systems with timevarying delays[C]//Proceedings of 2007 IEEE International Conference on Control and Automation.Piscataway,NJ:IEEE,2007:2766–2771.[16]余昭旭,杜红彬.基于NN的不确定随机非线性时滞系统自适应有界镇定[J].控制理论与应用,2010,27(7):855–860.(YU Zhaoxu,DU Hongbin.Neural-network-based bounded adaptive stabilization for uncertain stochastic nonlinear systems with timedelay[J].Control Theory&Applications,2010,27(7):855–860.)[17]胡适耕,黄乘明,吴付科.随机微分方程[M].科学出版社,2008:153–156.(HU Shigeng,HUANG Chengming,WU Fuke.Stochastic Differential Equations[M].Beijing:Science Press,2008:153–156.)[18]PLOLYCARPOU M M.Stable adaptive neural control scheme for nonlinearsystems[J].IEEE Transactions on Automatic Control,1996,41(3):447–451.。
收稿日期:2007207219;修回日期:2007210224 基金项目:国家科技部创新基金资助项目(04c26213401216) 作者简介:蒋建国(19552),男,安徽黄山人,教授,博导,主要研究方向为信号与信息处理、传感与智能控制;孙洪艳(19802),女,硕士研究生,主要研究方向为数字图像处理、DSP 技术及应用(sunhongyan325@ );齐美彬(19692),男,副教授,博士研究生,主要研究方向为分布式人工智能、数字图像处理、DSP 技术及应用.基于m ean 2shift 算法的人脸实时跟踪方法3蒋建国,孙洪艳,齐美彬(合肥工业大学计算机与信息学院,合肥230009)摘 要:复杂环境下实时人脸跟踪方法在视觉监控系统中具有很重要的意义,但目前的跟踪算法普遍存在目标遮挡、尺寸变化等过于敏感的不足,限制了其应用范围。
提出了一种人脸检测、mean 2shift 算法与卡尔曼滤波器相结合的实时全自动人脸跟踪算法。
实验结果表明该算法实时性很强,可以实现对运动人脸的快速跟踪,同时对目标遮挡也有很好的鲁棒性。
关键词:人脸跟踪;mean 2shift 算法;卡尔曼滤波器;目标遮挡中图分类号:TP391 文献标志码:A 文章编号:100123695(2008)0722225203Real 2time algorithm for face tracking based on mean 2shiftJ IANG J ian 2guo,S UN Hong 2yan,Q IMei 2bin(School of Co m puter &Infor m ation,Hefei U niversity of Technology,Hefei 230009,China )Abstract:A real 2ti m e face tracking under comp lex envir on ment has significance in visual surveillance syste m,but one com 2mon p r oble m t o face tracking algorith m s at p resent is their sensitivity t o te mporal occlusi on and scale variati ons,which restrict the m wide app licati on .This paper p r oposed a real 2ti m e aut omatic face tracking algorith m which combined face detecti on and mean 2shift algorith m with Kal m an filter .I n the experi m ents,the results show the p r oposed algorith m can track fastmoving face successfully and have better r obustness of occlusi on .Key words:face tracking;mean 2shift algorith m;Kal m an filter;te mporal occlusi on 在复杂环境下对目标进行实时有效的跟踪是计算机视觉中的关键技术,它涉及到图像处理、模式识别、人工智能以及自适应控制等多领域问题的综合。
人脸检索标准
人脸检索标准是指使用人脸图像进行检索时所遵循的一些标准或方法。
以下是一些常见的人脸检索标准:
1. 特征提取:人脸检索的第一步是提取人脸图像中的关键特征,常用的特征提取方法包括局部二值模式(Local Binary Pattern,LBP)、主成分分析(Principal Component Analysis,PCA)
和人脸识别网络(例如基于深度学习的卷积神经网络)。
2. 检索算法:根据提取到的人脸特征,使用相似度度量算法来计算不同人脸之间的相似性。
常见的相似度度量算法包括欧氏距离、余弦相似度和哈希函数等。
3. 数据集:为了进行有效的人脸检索,需要一个包含大量人脸图像的数据库作为检索的基础。
常用的人脸数据库包括LFW (Labeled Faces in the Wild)、Yale Face Database和CASIA-WebFace等。
4. 准确率评估:为了评估人脸检索系统的准确率,通常使用指标如准确率(Precision)、召回率(Recall)和F1-score等来
度量系统在给定数据库上的性能。
5. 应用场景:人脸检索广泛应用于各个领域,包括人脸识别门禁系统、安全监控系统、图像搜索引擎等。
因此,根据具体的应用场景,可以对人脸检索的标准进行定制,以满足特定需求。
需要注意的是,并没有一个统一的人脸检索标准,因为不同的
应用场景和需求可能需要不同的方法和度量指标。
因此,在实际应用中,需要根据实际情况选择合适的标准和方法。
人脸关键点检测经典算法人脸关键点检测经典算法是计算机视觉领域的一个重要研究方向,它旨在识别和定位人脸图像中的关键点,如眼睛、鼻子、嘴巴等。
本文将介绍人脸关键点检测的基本原理以及三种经典算法:传统机器学习方法、深度学习方法和级联回归方法。
通过分析比较这些算法的优劣势,我们能够更好地理解人脸关键点检测技术的发展和应用。
一、人脸关键点检测基本原理人脸关键点检测的基本原理是将人脸图像中的关键点位置信息映射到特定的坐标系中。
这样一来,我们就可以通过机器学习或深度学习算法来训练模型,使其能够自动识别和定位这些关键点。
具体来说,人脸关键点检测的基本步骤包括以下几个方面:1. 数据准备:从人脸图像或视频中收集一系列标注好的训练样本,其中包含了关键点的位置信息。
2. 特征提取:将人脸图像转换成计算机可以理解的特征向量。
常用的特征包括灰度直方图、梯度直方图和局部二值模式等。
3. 模型训练:使用机器学习或深度学习算法对提取的特征进行训练,以建立关键点检测模型。
4. 模型测试和优化:使用测试集评估模型的性能,并根据需要对模型进行调整和优化。
二、传统机器学习方法传统机器学习方法在人脸关键点检测中有着较长的历史。
常用的传统机器学习方法包括支持向量机(SVM)、随机森林(RandomForest)和神经网络等。
在传统机器学习方法中,特征提取是一个关键问题。
基于传统机器学习方法的人脸关键点检测通常使用手工设计的特征表示,如HOG(Histogram of Oriented Gradients)、SIFT(Scale-Invariant Feature Transform)和SURF(Speeded Up Robust Features)等。
其中,HOG是一种常用的特征表示方法,它通过计算图像中不同方向上梯度的直方图来描述图像的纹理和边缘信息。
SIFT和SURF 则是基于图像局部特征的表示方法,它们可以在尺度、旋转和光照变化下保持特征的稳定性。
人脸关键点检测的ion指标
人脸关键点检测是计算机视觉领域的一个重要任务,它旨在识
别和定位人脸图像中的关键点,如眼睛、鼻子、嘴巴等部位。
在进
行人脸关键点检测时,通常会使用一些指标来评估算法的性能和准
确度。
其中,ION(Inter-Occlusal Normalized Error)指标是评
估人脸关键点检测性能的常用指标之一。
ION指标主要用于衡量检测算法在不同遮挡情况下的性能。
遮
挡是指人脸图像中部分区域被遮挡或者被其他物体遮挡的情况,这
在实际场景中是非常常见的。
ION指标通过对算法输出的关键点与
真实标注的关键点之间的距离进行归一化处理,从而能够客观地评
估算法在遮挡情况下的表现。
具体来说,ION指标首先计算出每个关键点的误差,然后将这
些误差进行归一化处理,以消除不同关键点之间的尺度差异。
最终
得到的ION指标可以反映出算法在处理遮挡情况下的整体性能表现,使得评估更加客观和准确。
除了ION指标外,人脸关键点检测的性能评估还可以采用其他
指标,如平均欧氏距离(Mean Euclidean Distance)、面部覆盖率
(Face Coverage Rate)等。
这些指标可以帮助我们全面地了解算
法在不同场景下的表现,从而为算法改进和优化提供参考。
总之,ION指标作为人脸关键点检测性能评估的重要指标之一,能够有效地评估算法在遮挡情况下的准确度和稳健性,对于提升人
脸关键点检测算法的性能具有重要意义。
视觉定位的关键参数一、视觉特征提取视觉定位的第一个关键参数是视觉特征。
视觉特征是从图像中提取出来的一些能够代表图像内容的信息,例如边缘、角点、纹理等。
常用的视觉特征提取算法包括SIFT、SURF和ORB等。
这些算法可以通过对图像进行滤波、边缘检测和兴趣点提取等操作,得到一组稳定的特征点。
二、特征匹配与跟踪特征匹配与跟踪是视觉定位的第二个关键参数。
在视觉定位中,需要将当前图像中提取的特征点与参考图像中的特征点进行匹配,从而确定当前图像在参考图像中的位置。
常用的特征匹配算法有FLANN、RANSAC等。
这些算法可以通过计算特征点之间的距离和相似度,找到最佳的匹配点,并通过随机采样一致性算法来排除错误匹配。
三、相机内外参数校准相机内外参数校准是视觉定位的第三个关键参数。
相机内参数是指相机自身的参数,例如焦距、畸变系数等;相机外参数是指相机在世界坐标系中的位置和朝向。
在视觉定位中,需要对相机的内外参数进行准确的校准,以保证定位的精确性。
常用的相机校准算法有张正友标定法和Tsai标定法等。
四、地图构建与更新地图构建与更新是视觉定位的第四个关键参数。
在视觉定位中,需要建立一个参考地图,用于对当前图像进行位置估计。
地图可以通过激光雷达、摄像头和惯性导航等多种传感器进行构建。
同时,随着环境的变化,地图也需要进行更新,以适应位置变化和新的特征点。
五、定位算法与优化定位算法与优化是视觉定位的第五个关键参数。
在视觉定位中,需要根据特征匹配结果和地图信息,计算当前图像在世界坐标系中的位置和方向。
常用的定位算法有基于特征匹配的PnP算法、基于滤波器的扩展卡尔曼滤波算法等。
同时,为了提高定位的精度和鲁棒性,还可以采用优化算法,例如非线性最小二乘法和粒子滤波器等。
六、实时性与鲁棒性实时性与鲁棒性是视觉定位的最后两个关键参数。
在实际应用中,视觉定位需要具备较高的实时性,即能够在短时间内完成图像处理和定位计算。
同时,视觉定位还需要具备较好的鲁棒性,即能够在复杂环境中稳定地进行定位。
fisherfacerecognizer参数
FisherFace识别器主要依赖于Fisher线性判别分析(LDA)算法,结合了主成分分析(PCA)和LDA的优点。
在应用FisherFace算法时,主要需要调整以下几个参数:1.训练集和测试集划分:根据待识别图像划分训练集和测试集,确保训练集和测试集具有相似的分布。
2.降维比例:在PCA降维过程中,需要确定降维比例。
通常可以通过计算特征值和贡献率来选择合适的降维比例。
3.特征提取:在LDA特征提取过程中,需要确定最优的投影方向。
这可以通过计算类间距离和类内距离来确定。
4.分类阈值:在LDA算法中,需要确定一个分类阈值。
这可以通过在投影空间中绘制决策边界来实现。
5.识别阈值:在实际应用中,可以根据识别准确率和误识率来调整识别阈值。
6.人脸预处理:对待识别的人脸图像进行预处理,如缩放、灰度化、归一化等操作,以提高识别准确性。
7.特征脸数量:根据实际需求和计算资源,确定特征脸的数量。
较多的特征脸可以提高识别准确性,但会增加计算复杂度。
8.迭代次数:在PCA和LDA算法中,可以根据收敛速度和识别效果调整迭代次数。
请注意,这些参数并非固定不变的,需要根据实际应用场景
进行调整。
在实际应用中,可以尝试不同的参数组合,以获得最佳的识别效果。
Computer Science and Application 计算机科学与应用, 2023, 13(3), 301-310 Published Online March 2023 in Hans. https:///journal/csa https:///10.12677/csa.2023.133029HSANet :混合型自我注意力网络识别 微整容人脸方法帕孜来提·努尔买提,古丽娜孜·艾力木江*伊犁师范大学网络安全与信息技术学院,新疆 伊宁收稿日期:2023年2月5日;录用日期:2023年3月3日;发布日期:2023年3月14日摘 要微整容给在日常生产中给人脸识别技术带来了新的挑战,因人脸特征变化较大导致对原人脸正确识别率较低,针对现象,该实验提出了一种混合型自我注意力块结构,用于识别面部特征变化的人脸,为此自制了26类微整容小样本图片数据集。
将自我注意力融合到残差网络的瓶颈块中,提高了混合型自我注意力块对图片各区域特征的捕获能力,在对小样本微整容数据集的实验表明,该实验提出的混合型自我注意力网络有较高的正确识别率:89.70%,相比ResNet50正确识别率提高了2.65%,改进连接的混合型自我注意力模型比未改进连接的混合型自我注意力模型正确识别率提高了1.12%,网络性能也有所提升。
关键词卷积神经网络,残差网络,瓶颈块,自我注意力,混合型自我注意力网络HSANet: Hybrid Self-Attention Network Recognition Facial Micro Plastic MethodPazilaiti Nuermaiti, Gulinazi Ailimujiang *School of Network Security and Information Technology, Yili Normal University, Yining XinjiangReceived: Feb. 5th , 2023; accepted: Mar. 3rd , 2023; published: Mar. 14th, 2023AbstractDue to the large changes in facial features, the correct recognition rate of the original face is low. In view of the phenomenon, this experiment proposed a hybrid self-attention block structure for recognizing faces with facial features changes. For this reason, 26 kinds of micro-plastic surgery*通讯作者。
Affine Real-Time Face Tracking using Gabor Wavelet Networks V olker Krueger,Alexander Happe and Gerald SommerComputer Science Institute,Christian-Albrechts University KielPreußerstr.1-9,24105Kiel,GermanyTel:++49-431-560496,FAX:++49-431-560481email:vok@rmatik.uni-kiel.deAbstractIn this article we present a method for visual face track-ing that is based on a wavelet representation of a face tem-plate.The wavelet representation allows arbitrary affine deformations of the facial image,it allows to generalize from an individual face template to a rather general face template and it allows to adapt the computational needs of the tracking algorithm to the computational resources available.The method presented was implemented on a Linux Pentium450MHz and runs off-line with25Hz and on-line,using an active camera mount,with22Hz.We present experimentals results on off-line tests on several common image sequences including the salesman-sequence as well as on on-line tests.1IntroductionThis paper addresses the issue of face tracking.Face tracking in real-time(RT)(25Hz)is of major impor-tance for many applications including Human-Computer-Interfaces(HCI),surveillance applications,teleconferenc-ing or teleteaching.Also applications such as gesture-and gaze detection are often stated applications that heavily de-pend on precise tracking algorithms.Yet,the issue of face tracking is far from being solved satisfactorily.Many track-ing systems use color as a clue for tracking but they track imprecisely and they are not capable of distinguishing be-tween faces and non-faces[1;5;8].Other tracking sys-tems use a previously given template(gray value,active contour,etc),while allowing affine variations of the facial image.These systems track precisely as shown in the ex-cellent work of[3],but the templates are either of individ-ual persons[3]or are computationally expensive[2;4]and therefore slow so that tracking is not in RT.In[6]a sys-tem is presented that is able to track faces independent of face orientation and gesture.The system uses a wavelet jet bunch-graph approach and tracks with less than1fps.In this paper we present an approach for RT face tracking that allows arbitrary affine deformations of the facial image in order to compensate for different poses,that is robust to homogenious illumination changes,that is efficient,fast and surprisingly robust.For tracking,we need a gray value face template of the person who should be tracked.However,for the actual tracking,we do not use this ordinary gray value template.Instead,we approximate the discrete face template with a linear combination of continuous2D odd-Gabor wavelet functions.For this,the Gabor wavelets are optimized with respect to their2D parameters position,scale and ing this Gabor wavelet template for tracking has the following major advantages:1.The Gabor wavelet template(GWT)is a discretizisedversion of a continuous function for which continuousderivations can be calculated.2.The Gabor wavelet template can be deformed arbi-traily,i.e.can be continuously translated,rotated,scaled and sheared.3.It is well known that the precision of a wavelet repre-sentation depends on the number of used basis func-ing a GWT allows the user to decide on usinga rather low-frequential general template that workswell on different individuals or a rather precise tem-plate that works well only on the individual person.4.The computer power needed for tracking will dependupon the number of wavelets to evaluate.A trackingprogram may chose the number dynamically with re-spect to the available computer power.By exploiting these advantages,we establish real-time tracking of arbitrary faces by optimizing the affine parame-ters of the entire wavelet representation at each image frame while being able to dynamically adapt the number of used wavelets and with this the computing resources needed.In section2we give a short introduction to Gabor wavelets Networks.In section3,the tracking algorithm is presented.In section4we give experimental results and conclude withfinal remarks in section5.2Introduction to Gabor Wavelet Networks In order tofind a Gabor wavelet template(GWT)that ap-proximates a given face template,we use a Gabor Wavelet Network(GWN).A GWN is defined as follows:1Definition:Let,be a set of odd Gabor wavelets that are given asFigure 2.The images show the positionsof each of thefirst16wavelets after re-parameterization of the GWN(left)andthe corresponding GWT(right).The re-parameterized GWTs show the same orienta-tion,position and size as the ones they wererepositioned on.Definition:Let,be a GWN.A Gabor superwavelet(GSW)is de-fined to be a linear combination of the waveletssuch that(4)where the parameters of vector of the GSW define the dilation matrix,the rotation matrix and the translation vector.To reflect the re-parameterization, the corresponding GWT is denoted by.A Gabor superwavelet is again a wavelet that has the typical wavelet parameters dilation,translationand rotation.Therefore,we can handle it in the same way as we handled each single Gabor wavelet in the previous section,and we may optimize its parameters with respect to the energy function that,in this case,reads:(5)Even though eq.(4)looks similar to the definition of a GWT in eq.(3)we want to point out that eq.(4)refers to a con-tinuous wavelet function,whereas a GWT is a discrete gray value image that is derived from a GWN,or GSW,respec-tively.The degrees of freedom of a wavelet only allow trans-lation,dilation and rotation.But it is straight forward to include also shearing and thus allow any affine deformation of.For this,we enhance the parameter vectorto a six dimensional vectorBy rewriting the scaling matrix,we become able to deform the GSW affinely.In order to minimize(5)and tofind the optimal pa-rameter vector we may elegantly use the same Levenberg-Marquard algorithm as in the preceding section.In several experiments we have found that the initialization that has to be supplied to the gradient decent method maybe within the range of approximately px in position, in scale and in orientation(see below for fur-ther comments).An example of the optimization processcan be seen infig.3:Shown are the initial values of,the values after2and4optimization cycles and thefinal val-ues after8cycles,each marked with the white square.The square refers to the inner face region.Its center position marks the center position of the corresponding GSW.The GSW used infig.3is derived from the person infig.1.It uses thefirst16wavelets only and its GWT looks likeoffig.1.Figure3.The images show the1st,the2th,the4th and the8th(final)step of the gradientdescent method optimizing the parameters ofa GSW.The top left image shows the initialvalues with10px.off from the true position,rotated by and scaled by.The bottomright image shows thefinal result.As GWT, offigure1was used.3.2Re-parameterizing GWNs in Image Se-quences for Affine Face TrackingThe technique of re-parameterizing a GSW with respectto the energy function(5),as it was explained in the pre-ceding subsection,can also be applied to image sequences.This enables us to track affinely.For this,(5)may be rewrit-ten to(6)so that for each frame at time step the GSW is optimized with respect to the energy function(6).As ini-tial values for the optimization the parameters from the preceding frame are used.These initial values were in our experiments always good enough that the optimization procedure always converged quickly(see section4).Initial values for the veryfirst frame are derived from the color blob information.A color blob is given by its mean value and its standard deviation.The mean value gives a clue about the position and afirst clue about the scale and the orientation can be calculated from the standard deviation matrix.For the test sequence offig.4,we have chosen by hand because the sequences is a gray scale sequence.The number of wavelets that make up the GSW can be adapted:The maximum number is given by the numberof wavelets in the GWN,but we are free to use less wavelets.Each wavelet of the GSW has to be evaluated during the re-parameterization process,so that using less wavelets results in a respective speedup.Techniques for affine motion prediction have not yet been incorporated into the tracker.Such techniques should result in a significant speedup.4ExperimentsFor a GWT of pixels we have found in several ex-periments that the initialization values of may vary fromthe correct values by approx.px in and direction,by approx.in scale and by approx.in rotation (see fig.3).We have further tested the positioning procedure on the Yale face database.This database consists of 15different individuals,showing eights different facial expressions,the faces are approximately all of the same size.The GWT in fig.1,that was made up by the first 16Gabor wavelets of the corresponding GWN can be considered as a rather gen-eral face ing this GWT,the positioning proce-dure converged correctly on 13individuals (independent of expression)by just giving the approximate image center as initial values.This shows two things:1.It shows,that the reposition algorithm is quite stable with respect to its initial values.2.It shows,that the wavelet net template is not fixed to one individual and that it is sufficiently general.For face tracking,using color blob information as initial values for seems to be precise enough.We have tested the face tracker within our active camera mount as well as on several sequences,including the salesman sequence (fig4).Figure 4.The images show from left to right frame 11,frame 50,frame 120and frame 137(top)and some active camera images (bot-tom).Off-line tracking is done with Hz,on-line tracking is done with Hz (the difference is due to the frame grab-bing).During tracking,since we track with -Hz,suc-cessive frames are sufficiently similar so that the gradient descent method never needed more than two cycles for each time step until reaching the minimum.The GWT we used in all our experiments was made up by the largest 10wavelets of the corresponding GWN that was trained on the respec-tive person.Experiments were carried out on a 450MHz Linux Pentium.5ConclusionAs the major contribution of this work we presented a novel approach for real-time face tracking where tracking is done with a Gabor wavelet template.The GWT has the advantage that it can be arbitraily translated,rotated,scaled and sheared.This is because the GWT is given by a discrete linear combination of continuous Gabor wavelets whose weights and wavelets are given by its corresponding GWN or GSW,respectively.A further great advantage that comes with the continuity is that we can use a fast gradi-ent decent method to estimate the affine parameters.A next great advantage of the GWT is that it can be made up of different numbers of Gabor wavelets of the corresponding GWN which means that the GWT can describe the face of a template in almost any desired precision.This allows an application of the GWT also to different individuals.We have exploited all these advantages and have de-signed a tracking system that is able to work in real time (-Hz),that is able to cope with perspective defor-mations and that is able,by changing the number of used wavelets,to track either only a special individual or almost any person.References[1]S.Birchfield.Elliptical head tracking using intensity gradi-ents and color histograms.In IEEE puter Vision and Pattern Recognition,CVPR ,pages 232–237,1998.[2] F.d.l.Torre,S.Gong,and S.McKenna.View-based adaptiveaffine tracking.In Proc.Fifth European Conference on Com-puter Vision ,volume 1,pages 828–824,Freiburg,Germany,June 1-5,1998.[3]G.Hager and P.Belhumeur.Efficient region tracking withparametric models of geometry and illumination.IEEE Trans.Pattern Analysis and Machine Intelligence ,20(10):1025–1039,1998.[4]M.Isard and A.Blake.Condensation –conditional den-sity propagation for visual tracking.International Journal of Computer Vision ,1998.[5]V .Kr¨u ger,R.Herpers,K.Daniilidis,and G.Sommer.Tele-conferencing using an attentive camera system.In Int.Conf.on Audio-and Video-based Biometric Person Authentication ,pages 142–147,1999.[6]T.Maurer and C.v.d.Malsburg.Tracking and learning graphson image sequences of faces.In Int.Conf.on Automatic Face-and Gesture-Recognition ,pages 176–181,Killington,Vermont,USA,Oct.14-16,1996.[7]W.Press,B.Flannery,S.Teukolsky,and W.Vetterling.Nu-merical Recipes,The Art of Scientific Computing .Cambridge University Press,Cambridge,UK,1986.[8]Y .Raja,J.McKenna,and S.Gong.Tracking and segment-ing people in varying lighting conditions using color.In Int.Conf.on Automatic Face-and Gesture-Recognition ,pages 228–233,Nara,Japan,April 14-16,1998.[9]H.Szu,B.Telfer,and S.Kadambe.Neural network adaptivewavelets for signal representation and classification.Optical Engineering ,31(9):1907–1961,1992.。