自动人脸识别中的图像质量评价
- 格式:docx
- 大小:95.17 KB
- 文档页数:7
第 1页 共7页
一种基于倒谱的人脸图像清晰度评价方法
杨 飞 苏剑波
1 引 言
人脸识别由于其非接触式、基本无须配合和操作隐蔽性强等优势,被认为是一种可广泛使用的生物 特征识别技术,长期以来一直受到学术界和产业界的广泛关注 [1-4] 。然而,也正因为追求“无须配合”的 实施效果,导致了人脸图像采集的随意性,图像之间差异较大、图像质量参差不齐的情况。采用低质量 的人脸图像进行人脸识别, 必然会导致识别准确率的下降 [2, 4] 。而长期以来, 人脸识别的研究大都是基于 预先准备好的图像质量一般较高的人脸库的,这与现实应用情况有很大的不同。因此尽管实验测试中的 人脸识别准确率已经相当之高,然而在实际应用中的表现却并不尽如人意。为此,近年来有不少研究者 开始着手于研究对各种不同质量人脸图像足够鲁棒的人脸识别技术,目前虽已取得了很大的进展,但离 实用仍有一些差距。一方面,由于处理低质量图像而被引入的额外手段往往十分复杂,会大大增加人脸 识别系统的复杂度,使得人脸识别耗费时间更长一一这对于多数实际应用是不可接受的;另一方面,不 受图像样本因素影响的人脸识别算法是难以获得的。因此,我们必须研究新的解决方法。
在基于视频流的自动人脸识别应用中,获得的人脸图像数量通常较多,如果对人脸图像样本进行质 量评价,
筛选较为合适的样本用于识别, 这无疑会提高自动人脸识别系统的准确率; 即使样本数目有限, 也可以依据质量评价结果来选用相应的图像预处理方法来提高识别率。另外,根据人脸图像的质量情况 来调整分类器的阈值或其它参数能有效地降低错误拒绝率 (FRR)或错误接受率(FAR),亦可提高人脸识别
的实用性能。可见,在自动人脸识别系统中引入人脸图像质量评价环节是一条推动人脸识别实用化的重 要途径。因此,近几年来人脸图像的质量评价逐渐引起了人们的关注,关于图像质量评价的评价框架和 相关指标的研究工作也已有一些公开报道 [2-4],但关于人脸图像质量评价方法的研究目前还并不充分, 人
们往往是直接借用传统的图像质量评价方法。本文的研究表明,现有方法并不一定适用于自动人脸识别 这个特别领域中的人脸图像质量评价,其评价结果与实际情况可能存在一定差距。本文接下来将以清晰 度这一重要的人脸图像质量评价指标为例进行详细说明,并提出一种比传统评价方法更适合于自动人脸 识别的清晰度评价方法。最后,通过对同一组人脸图像进行清晰度评价实验,将其与传统清晰度评价方 法进行对比,以验证本文方法的准确性要高于传统方法。另外,还在真实环境下通过人脸识别实验来验 证本文提出的清晰度评价方法在自动人脸识别中的作用及其适用性。
2 自动人脸识别中的清晰度评价
在基于视频流的自动人脸识别应用中,自动检测采集到的人脸图像不清晰的情况时有发生。不清晰 的人脸图像不但会影响人脸识别的准确率,而且还会影响对譬如人脸姿态等其它图像质量指标的评价 [2,4],故本文将清晰度选作研究对象。影响人脸图像清晰度的原因主要有图像模糊和采集噪声干扰。忽略 采集噪声,摄像机对焦失准或拍摄瞬间人脸沿摄像机光轴方向快速运动会造成离焦模糊,拍摄瞬间人脸 垂直于摄像机光轴方向快速运动会造成运动模糊,实际上这两种模糊经常是并存的。传统的图像质量评 价往往是考察经过计算压缩、传输、增强或其他处理变换后的图像与原始图像质量上的差别,在评价时 通常有“标准图像”可供参照[5]。因此,无论是具有计算简单优点而被广泛使用的均方差 (MSE)和峰值信
噪比(PSNR)方法,还是更符合人眼视觉系统 (HVS)特性的结构相似度(SSIM)方法⑹或基于自然场景统计
(NSS)的视觉信息逼真度(VIF)方法⑺,由于必须得通过将变换后的图像与标准图像进行比较来做出质量 评价,故皆不适合作为自动人脸识别中的人脸图像清晰度评价方法。另一方面,无需参考图像的图像质 量评价方法相对较少,且主要用于图像盲恢复参数的辨识(如对点扩散函数 PSF的估计等),其中的特
征提取过程较为复杂,计算耗时长,故难以满足自动人脸识别系统的时间要求。于是,研究者们提出了 第2页共7页
通过衡量图像梯度统计信息 【2]或高频部分能量[3]来评价人脸图像清晰度的方法。这两种方法虽然无需参 考图像,而且简单快速,但是其实并不可靠。 这是因为不同人的面部差异通常较大, 再加上眼镜的佩戴,
使得人脸图像的边缘信息差异更大;而且,运动模糊图像的边缘不是在所有方向都是模糊的,与运动方 向垂直的方向上的边缘并没有发生退化,而且运动模糊还会产生新的锐利边缘(例如一个亮点可能在运 动模糊后形成一条线),所以不能完全依据边缘信息来判断图像模糊程度。鉴于上述原因,本文提出了 一种新的基于倒谱(cepstrum)域分析的清晰度评价方法。
3人脸图像清晰度评价方法
倒谱理论自从1963年被提出后[8],在雷达、地震波、超声波和语音信号分析等领域得到了应用,后 来又作为一种盲去卷积方法被应用于图像恢复的参数辨识中 I9】。如果能准确地辨识出模糊图像的点扩散
函数的参数,即能评价出图像的模糊程度。但实际上,在倒谱图中很难清楚地辨识出点扩散函数的特征; 而且通常情况下不能预知模糊的类型,辨识点扩散函数的参数往往需要对倒谱图进行预处理,其过程也 是比较复杂并且费时的[10]。为了避免这些问题,本文提出了一种新的清晰度评价方法,不通过辨识点扩 散函数的参数而是采取直接统计倒谱图中的高能量亮点的方法来估计图像清晰度。因为本文只研究人脸 图像的清晰度评价,暂不考虑对模糊人脸图像进行复原,所以无须区分模糊类型或辨识出点扩散函数的 参数。采用这种方法不仅避免了模糊参数难以辨识的问题,而且使算法得以大大简化,提高了清晰度评 价速度,下面给出详细说明。
首先,图像的降质过程可用下面的数学模型来近似描述 [10]:
g(x, y) = f(x, y) * h(x, y) + n(x, y),
其中f(x, y)为输入清晰图像,h(x,y)为点扩散函数,n(x,y)为加性噪声。在这个模型里,输出降质图像g(x,y) 被表示为f(x,y)与 h(x,y)的卷积再加上n(x,y)。忽略噪声的影响,式(1)可写为:
g(x, y) = f(x, y) * h(x, y).
不失一般性,考察匀速直线运动产生的运动模糊,拍摄瞬间物体相对镜头的位移大小为 d,运动方
向与水平轴的夹角为 则由其导致的点扩散函数为:
y xtan , x2 y2 d/2
elsewhere
h(x, y)
0 elsewhere
于是,通过式(2) — (4),用一张清晰图像可分别人工模拟出其不同程度的运动模糊和离焦模糊效果。 对于一幅大小为 M XN的灰度图像g(x, y),它的傅立叶变换为:
G(u, v) = F{g(x, y)}, (5)
则其倒谱域变换定义为[9】:
-1
Cep{I(x, y)} = F {log | G(u, v)|}, ⑹
1
式中F { }和F { }分别表示傅立叶变换和反傅立叶变换, |?表示求复数模。由式 ⑵、(6)可得
Cep{ g(x, y)} = Cep{f(x, y)} + Cep{h(x, y)}. ⑺
由此可见,倒谱域变换的一个重要性质是:在倒谱域内,模糊图像的倒谱可分解为清晰图像的倒谱和点 (1)
丄
h(x,y) d
0
另外,由几何光学分析可知,一个散焦半径为 R的点扩散函数可描述为: 第3页共7页
扩散函数的倒谱的性线叠加。另外,由于倒谱域变换要进行对数计算,所以在倒谱域内,信号衰减特别 快。清晰的人脸图像经过倒谱域变换后,图像衰减很快,几乎只集中在中心点附近很小的区域内,经二 值化处理后如图1(a)所示。而运动模糊图像和离焦模糊图像由于叠加了点扩散函数,它们的二值化倒谱 图中的高能量亮点散布在整幅图中,分别如图 1(b)、(c)所示。
(a) (b) (c)
图1三幅不同质量的人脸图像及其对应的二值化倒谱图, (a)清晰图像;(b)运动模糊图像;(c)离焦模糊图像
Fig. 1 Three face images of different quality and their corresponding binary cepstrum maps (a)the clear image; (b)the motion
blurred image; (c)the defocused image
二值化倒谱域中亮点的平均能量 E可定义为:
式中权值 W(i, j)定义为点(i, j)到中心点(ic, jc)的距离,C(i, j)定义为点(i, j)的二值化实倒谱值:
W(i, j) ,(i 2 ic) (j 2 jc), (9)
1 C(i,j) Cep(i, j) T (10)
0 Cep(i, j) T
其中,Cep(i, j)为点(i, j)的倒谱值,T为选取的二值化阈值。对同一幅待评价图像来说,当 T值增大时,
E值减小。当T值保持不变时,图像越模糊,E值越大。通过预先设定好 Eo值(Eo根据经验一般可取 0.01 左右),再采用二分法在(0,1)区间内搜索T,使通过式(8)算得的E满足EV E。,并且规定图像清晰度评 价函数为:
Score (1 T) 100%. (11)
由此可见,本文提出的倒谱域清晰度评价方法具有算法简单,限制条件少的优点。倒谱变换中的大
部分计算量由傅立叶变换和反傅立叶变换产生, 采用快速傅立叶变换(FFT)方法可大大减少计算时间。 如
果人脸图像比较大,为了减少评价时间,可缩小评价区域,截取部分区域进行上述计算。此外,降低评 价精度将减少搜索次数,也能减少清晰度评价时间。
4实验
为了考察上述清晰度评价方法,首先我们随机选取 FERET人脸库[11 ]中的1196张正面人脸图像,截
取面部区域作为实验样本,并假设这些原始图像都是清晰的图像。然后,按照降质模型 (2)-(4)分别用d
=5, 10, 20的水平运动模糊点扩散函数和 R = 3, 6, 12的离焦模糊点扩散函数对每一张原始图像进行人工
模糊,以模拟真实环境中产生的不同程度的模糊图像。原始图像及其对应的两种人工模糊后的图像示例 样本如图2所示。第一列为原始图像样本, 第一行从第二列到第四列分别为点扩散函数参数 d = 5, 10, 20 W(i, j)
j 1 C(i,j), (8) 第4页共7页
时对应的水平运动模糊图像,第二行从第二列到第四列分别为点扩散函数参数 模糊图像,可以看出图像从左至右逐渐变模糊。
分别采用文献[2]和[3]中的两种清晰度评价方法以及本文提出的方法来评价这些图像, 实验结果统计
分别如图3、图4和图5所示。在图3和图4中,为了曲线区别显示清晰,只选取了清晰图像和 d = 10,
R = 6的模糊图像这三组数据作为代表分别给出统计曲线;横坐标为计算每幅图像所得的锐度值
(sharpness),纵坐标为锐度值落在横轴某一区间内的图像的数目。显而易见,与图 5相比,图3和图4
中的清晰图像和模糊图像的锐度值都较为集中,通过锐度值来评价图像清晰度不比图 5中的T值准确。
图5中绝大多数清晰图像的 T值小于0.2,且当图像越模糊时,T值越大,因此可通过求T值来评估图像
清晰度。通过此实验证明了文献[2]和[3]中的方法不如本文提出的方法准确, 因此都不适合用于人脸图像
的清晰度评价。除此之外,还需要验证本文提出的清晰度评价方法能满足自动人脸识别中的其它要求, 下面给出了主要实验过程和实验结果。
图3采用文献[2]中方法计算所得锐度值分布图
Fig. 3 The distribution of the values of Sharpnesscomputed by the method in Ref. [2] R = 3, 6, 12时对应的离焦
vcneua0 图2 FERET人脸库中的人脸样本及其经模糊处理后的图像
Fig. 2 One face sample from the FERET face database and its blurred images
20
0 0.01 0.02 0.03 0.04 0.05
The values of sharpness --------Clear
......... Motion blurred
:Defocused 00
80
60
40