基于 YCbCr 颜色空间背景建模与手势阴影消除
- 格式:docx
- 大小:43.83 KB
- 文档页数:10
基于码本模型的运动阴影去除算法钟小芳;周浩;高志山;高赟【期刊名称】《计算机工程》【年(卷),期】2017(043)008【摘要】The moving shadow will result in deformed or missing foreground targets,which affects the tracking and analyzing of the moving target foreground.To solve this problem,this paper designs a moving shadow removal algorithm by introducing codebook model.This algorithm detects moving regions which included foreground targets and moving shadow by background codebook model constructed in YCbCr color space.According to the property of moving shadow in YCbCr color space,it gets the pixel values that represent moving shadow in moving region and establishes a moving shadow codebook model which has self-adaptive thresholds of brightness range and color distortion for all pixels in different locations in video frame,so as to implement detection and removal of motion shadow.Experimental results show that the proposed algorithm can effectively improve the detection rate and recognition rate of moving shadow.%运动阴影会导致运动目标前景发生形变或丢失,影响运动目标前景的跟踪和分析.针对该问题,引入码本模型设计运动阴影去除算法.利用在YCbCr颜色空间内建立的背景码本模型,检测包含运动前景目标和运动阴影的运动区域,并根据运动阴影在YCbCr颜色空间中的特性得到运动区域中表示运动阴影的像素值,为视频帧中所有不同位置的像素点建立一个具有自适应亮度范围阈值和色度距离阈值的运动阴影码本模型,实现运动阴影的检测和去除.实验结果表明,该算法可有效提高运动阴影的检测率和识别率.【总页数】6页(P266-271)【作者】钟小芳;周浩;高志山;高赟【作者单位】云南大学信息学院,昆明 650091;云南大学信息学院,昆明 650091;南京理工大学电子工程与光电技术学院,南京 210000;南京理工大学电子工程与光电技术学院,南京 210000;云南大学信息学院,昆明 650091【正文语种】中文【中图分类】TP391【相关文献】1.一种基于混合高斯模型的运动阴影去除算法 [J], 甘小勇;孙旭2.基于帧间差分与码本模型的运动车辆检测算法 [J], 杨燕妮;吴向前;刘鹏3.基于边缘检测与码本模型的运动目标检测算法 [J], 雷飞;黄文路;张泽4.基于自适应纹理特征和码本模型的分层运动目标检测算法研究 [J], 马健博;姜肇国;张宁5.基于码本模型运动目标检测算法研究 [J], 周优;周长胜;张良;徐英慧因版权原因,仅展示原文概要,查看原文内容请购买。
YCrCb色彩空间是一种将RGB色彩模型转换为亮度和色度分量的方法,广泛应用于数字图像处理和视频编码领域。
Y表示亮度分量(Luma),Cr和Cb表示色度分量(Chrominance)。
通过将RGB颜色转换为YCrCb色彩空间,我们可以更好地处理图像的亮度和色彩信息,从而应用于各种领域。
一、在数字图像处理中的应用场景1.1 图像增强YCrCb色彩空间可以用于图像的亮度和对比度增强。
通过对亮度分量进行调整,可以改善图像的清晰度和视觉效果;而对色度分量的调整可以提高图像的饱和度和色彩对比度,使图像更加艳丽。
1.2 肤色检测在人脸识别和数字美容应用中,利用YCrCb色彩空间可以更准确地检测肤色区域。
通过对Cr和Cb分量的阈值判定,可以提取出图像中的肤色区域,从而实现人脸识别和美容效果。
1.3 彩色图像压缩YCrCb色彩空间在JPEG图像压缩中起着重要作用。
将RGB图像转换为YCrCb色彩空间后,可以对色度分量进行亚采样,从而实现对图像的压缩。
这种压缩方式能够在保持图像质量的前提下减小文件大小,适用于图像存储和传输领域。
二、在视频编码中的应用场景2.1 视频压缩在现代视频编码标准中,如H.264和HEVC,YCrCb色彩空间被广泛应用于视频压缩。
通过对视频的亮度和色度分量分别进行空间和时间域的预测和编码,可以实现更高效的视频压缩,从而降低存储和传输成本。
2.2 视频分析在视频监控和视频处理领域,YCrCb色彩空间可以用于实现运动检测、背景建模和目标跟踪等功能。
通过对视频帧的亮度和色度分量进行分析,可以准确地检测出视频中的运动目标,为智能视频分析提供有力支持。
三、伦理道德建议根据对ycrcb色彩空间应用的了解,我们可以在数字图像处理和视频编码领域中更好地理解和应用这个概念。
对该领域的发展也有着积极的促进作用。
在撰写本篇文章的过程中,我也深刻理解了ycrcb色彩空间的重要性和应用场景。
希望我所共享的这些信息能够对您的工作和学习有所帮助,也欢迎您和我一起共享这个领域的见解和经验。
ycbcr颜色模型的基本原理 -回复关于y c b c r颜色模型的基本原理引言:在计算机图形学和数字图像处理中,颜色模型是一种用于描述和表示颜色的数学模型。
其中,y c b c r 颜色模型是一种常见的颜色模型,广泛应用于图像和视频的处理和编码中。
本文将详细介绍y c b c r颜色模型的基本原理,包括颜色分量的表示方式、亮度和色度分量的概念以及其在图像处理中的应用。
一、y c b c r颜色模型的基本概念1.颜色分量y c b c r颜色模型中的颜色值由三个分量表示,分别是亮度(l u m a)分量、蓝色差(b l u e c h r o m a)分量和红色差(r e d c h r o m a)分量。
这三个分量分别用Y、C b和C r表示。
2.亮度分量亮度分量(Y)表示了图像的亮度信息,它是彩色图像在无色彩信息时的亮度值。
在y c b c r颜色模型中,亮度分量的取值范围是0到255。
亮度值越高,代表图像的亮度越高。
3.色度分量色度分量(C b和C r)表示了图像的色彩信息,它们分别记录了图像中的蓝色和红色成分。
在y c b c r颜色模型中,色度分量的取值范围是-128到127。
色度分量的正值表示蓝色成分的增加,负值表示红色成分的增加。
二、y c b c r颜色模型的转换原理y c b c r颜色模型与其他常见的颜色模型(如R G B)之间可以进行相互转换。
下面将介绍y c b c r到R G B 的转换原理。
1.y c b c r到R G B的转换y c b c r颜色模型可以通过以下公式将其转换为R G B颜色模型:R=Y+ 1.402*(C r-128)G = Y - 0.344136 * (C b - 128) - 0.714136 * (C r-128)B=Y+ 1.772*(C b-128)其中,R、G、B分别表示R G B颜色模型中的红、绿、蓝分量。
Y、C b和C r分别表示y c b c r颜色模型中的亮度、蓝色差和红色差分量。
2007年第6期计算机系统应用基于YCbCr空间的亮度自适应肤色检测SeIf—adaptiveSkinColorDetectionBasedonYCbCrCoIorSpace王金庭(湖北经济学院计算机与电子科学系湖北武汉430205)杨敏(中国地质大学信息工程学院湖北武汉430074)摘要:本文针对复杂背景彩色图像提出了一种基于YCbCr颜色空间的自适应肤色检测算法。
该算法从两个方面考虑了抗光照问题:采用非线性分段色彩变换和基于Rsher评价准则的自适应阈值分割方法减小亮度的影响。
实验结果表明。
该算法复杂度较小,对光照变化具有很好的鲁棒性。
关键词:肤色检测颜色空间图像分割Fisher准则函数1引言肤色检测主要是根据肤色在颜色空间上的分布特征来检测图像中的肌肤区域。
人的肤色是人体表面最为显著的特征之一。
肤色是人脸部及手部区别于其他区域的重要特征,同时因其对姿势、旋转、表情等变化不敏感,可有效去除图像中复杂背景的干扰、减小待搜索范围Ⅲ。
因此,利用颜色信息进行皮肤区域探测已引起较多学者关注。
利用颜色信息进行皮肤检测在人脸检测与识别、高级人机交互界面、手势识别、基于内容的图像检索和基于内容的不良图像过滤等领域有着重要的地位。
Rosso甘i与AngelopouIoU【2’分别在1983年与1999年的研究成果证明了在生物和物理上肤色分布的一致性,指出尽管人的肤色因人种的不同而不同,呈现出不同的颜色,但是在排除了亮度、视环境等对肤色的影响后,皮肤的色调基本一致。
这也为利用颜色信息进行皮肤检测的可能性提供了有利的证据。
Rosso竹i与AngeIopoulou的研究表明不同人种的肤色在色调上是一致的,并且皮肤的饱和度特征有一定的稳定性,因而采用具有认知属性的、能够将亮度信息与色度信息分开表示的颜色空间对于皮肤的检测能够起到很好的作用。
对于颜色空间的选择问题,或者说在哪个颜色空间中皮肤检测能达到最佳的效果引起了许多学者的广泛关注与研究。
YCbCr色彩空間之資訊隱藏應用系統研究林明毅國立臺北商業技術學院資訊管理系***************.edu.tw李慶長國立臺北商業技術學院資訊管理系***************.edu.tw呂韶宜國立臺北商業技術學院資訊管理系****************.edu.tw摘要本篇研究應用了視覺與密碼學的概念,提出一個快速且方便使用的資訊隱藏應用系統,將資料隱藏在點陣圖的像素中。
相對於資料加密(encryption),資料隱藏技術將資料隱藏在另一個媒體中再傳輸,如此可提高傳輸通訊上的安全性。
為了善用YCbCr中的CbCr分量可以壓縮的特性,且同時為了增加原始資料擷取時的難度,本資訊系統將擷取時的密碼經過CRC32的運算後隱藏在偽裝影像中,並以此CRC32的值當做亂數的種子,做為資料隱藏及擷取時先後順序的依據,最後將全部的資料經過CRC32運算後的結果隱藏在之後的隨機位置中,藉以判定在往後擷取出的原始資料是否正確。
本研究成果所產生的偽裝影像與原始影像的相似度極高,PSNR忠誠度可高達30以上,人類眼睛幾乎無法查覺出其中是否有隱藏資料,且資料隱藏的順序是相依於隱藏時的密碼,因此密碼錯誤或偽裝影像經過處理後原始資料將無法還原,在使用上具有高度安全性。
關鍵字:資料隱藏、網路安全、數位信號處理壹、引言伴隨數位化時代的來臨,大部份之資料均以數位方式來儲存與流通,加上電腦科技之普及應用,資料數位化後之內容完整性的保護,儼然是一項重要的工作。
因此有人提出,把重要的資料隱藏在掩護媒體中,像是藏在影像、圖片、聲音中,只有接收者知道資料抽取的方法,才能將資料從掩護媒體中取得,而其他竊取的人,可能會被掩護媒體所誤導,認為只是個普通的影像、圖片,而不會有任何作為。
從以前到現在,將資料藏在掩護媒體中,有相當多的人提出方法。
目前應用在各種多媒體的隱藏技術中,文字方面的隱藏技術,是利用文件中字與字之間的空間、文法句型、語意還有特徵來隱藏訊息。
基于YCbCr颜色空间手势分割杨红玲;宣士斌;莫愿斌;赵洪【摘要】手势作为一种非常重要的信息交互载体,包含着大量符合人类认知习惯的交互信息,针对光照变化、外界干扰等复杂背景环境对手势分割的影响,提出了一种基于YCbCr颜色空间的肤色检测方法进行手势分割.根据人体肤色在YCbCr颜色空间中的聚类效果,采用基于椭圆模型的肤色检测方法,首先对复杂背景环境下的类肤色区域进行分割,同时针对分割图像中可能存在非手势区域的问题,采用最大类间方法获取分割阈值,去除图像中非手势区域,获取较高质量的手势二值图像.实验结果表明,针对复杂的背景环境,该算法具有较强的鲁棒性,能实现较为高效的手势分割.【期刊名称】《广西民族大学学报(自然科学版)》【年(卷),期】2017(023)003【总页数】6页(P61-66)【关键词】人机交互;颜色空间;肤色检测;手势分割【作者】杨红玲;宣士斌;莫愿斌;赵洪【作者单位】广西民族大学信息科学与工程学院,广西南宁 530006;广西民族大学信息科学与工程学院,广西南宁 530006;广西民族大学信息科学与工程学院,广西南宁 530006;广西民族大学信息科学与工程学院,广西南宁 530006【正文语种】中文【中图分类】TP391近年来随着计算机在人们生活中日益重要,人机交互越来越亲密,最原始的基于鼠标和键盘的图形用户界面交互方式已经不能满足人们的交互需求,无法满足人类的精神世界,更加自然化的人机交互方式成为新的需求.随着计算机视觉等科学技术的高速发展,给人机交互的发展带来了更多的可能.由于手势作为人们日常生活中的重要交互方式之一,包含着丰富的交互信息,因此基于视觉的手势分割识别技术成为现在非常热门的研究课题,也得到更多科研工作者的关注,为了能让计算机“看懂”人的手势信息,最初的手势识别是通过利用穿戴技术,让用户戴上数据手套做手势,数据手套将用户手势和位置信息反馈给计算机,让其理解用户的手势行为.基于穿戴技术的人机交互模式有定位准确性高、数据简单、处理速度较快等优点,虽然有很好的检测效果但是由于设备比较昂贵、操作性不够方便、不适合远距离操控等缺点使得难以得到推广[1].随着计算机视觉、机器人技术的高速发展,更加自然的手势分割成为现代人机交互技术的基础与关键性支撑,手势分割的精确程度会对交互效果带来直接的影响.在复杂背景下由于光照变化、背景环境、手势变化等外界条件的影响会对手势分割带来一定的困难.目前常见的手势分割方法大多是基于肤色聚类的特性[2],通常可以通过颜色信息获取手势部位的所在区域.由于人体的肤色信息是区别于周围环境物体的显著特征之一,经过大量科学研究发现,人体肤色信息具有非常好的聚类性[3].Jones[4]通过大量的被标定的肤色区域图像,建立了肤色模型,并与直方图肤色模型和混合高斯肤色分割模型的性能进行了比较,事实证明其建立的肤色模型在准确性能上有较大的优势.O1iver[5]对大量的肤色样本的颜色进行统计后发现肤色分布有着高斯分布的特点,并由此建立了肤色模型,根据输入颜色的Mahalanobis距离与建立的肤色模型相比较.该模型虽然有着较高的肤色检测效率,但是当背景有跟肤色相近的颜色时,检测效果就会受到很大的影响.此外,还有学者把其他的模型跟肤色模型相结合,充分发挥了各自的优势.Wu[6]使用Farnsworth's的UCS来表示颜色信息,建立了SCDM和HCDM两个模型,分别用来描述皮肤颜色和头发颜色,并以此对皮肤颜色和头发颜色相似度进行了分析;此外,对人脸还进行二维图案的建模,定义了各模板相应的隶属度函数及其相关模糊匹配规则,对输入图像进行不同尺寸的扫描匹配,进而实现人脸检测,该模型在更复杂的情形有着很好的适用.RL Hsu[7]通过大量的统计计算发现,肤色在CbCr空间中的投影近似一个椭圆,因此,通过计算改变椭圆相关参数进行肤色检测,获取人脸的区域,进而实现人脸检测.袁敏[8]通过构建基于肤色的椭圆模型结合三帧差分的方法,在动态的手势分割方面同样取得了不错的效果.由此可见,皮肤颜色信息是一种很重要的区分皮肤和周围环境的特征.因此针对复杂环境下的静态手势图像,提出了一种基于YCbCr颜色空间进行肤色检测的手势分割方法.该方法通过对比人体肤色在各颜色空间中聚类效果,选取对光照环境变化不太敏感的椭圆模型在YCbCr空间进行肤色检测实现复杂背景环境下手势分割,然后针对分割图像中可能存在非手势区域的问题,采用最大类间方法获取初步分割图像中对各个联通区域进行手势分割的阈值,去除图像中非手势区域,获取较高质量的手势二值图像.文中提出的算法包括图像预处理、肤色分割、手势分割三个模块.其中,输入端为采集得到的原始手势图像,根据采集的背景环境可以分为干净背景环境下手势图像和复杂背景环境下的手势图像.图像预处理模块是指肤色分割前的一些操作,比如高斯滤波、去噪、图像增强等,去除一定的环境干扰;肤色分割模块主要是根据人体肤色在颜色空间中具有良好的聚类效果,通过椭圆模型的肤色检测方法,实现对图像中前景和背景进行分割,提取包含手势区域的二值图像;手势分割模块采用最大类间方差的方法获取最大联通区域,对手势区域和非手势区域进行分割,去除非手势区域,获取较为干净的手势二值图像.最后算法的输出为手势分割的二值图像,具体的算法流程图如图1所示.由于手势分割过程输入的采集图像中非人手背景的存在会对手势识别造成一定的影响,因此笔者提出了一种肤色检测与最大类间方差相结合的手势分割方法,采用基于椭圆模型的肤色检测方法进行手势分割,获取只包含手势区域的二值图像,然后对获取的包含手势区域的二值图像采用最大类间方差的方法获取阈值,去除非手势区域,进行手势分割.该方法主要包括基于椭圆模型的肤色检测和基于最大类间方差的手势分割两部分.人体肤色在不同的颜色空间表现出不同的聚类特性,要想得到较为干净的手势分割效果,选择颜色空间就尤为重要.通常采集的图像为RGB形式,其中R、G、B分别代表了红、绿、蓝颜色的亮度信息,相互之间存在着一定的相关性,亮度稍稍的变化就会对肤色分割产生巨大变化,并不适合进行手势分割[9],需要利用线性或者非线性变化将其转化到其他颜色空间进行肤色分割.由于HSV空间对光照更为敏感,分割效果并不是特别理想,因此算法采用计算过程和表示形式比较简单的YCbCr颜色空间进行分割.YCbCr颜色空间是CCIR601编码方式的色彩模型[10],用Y描述颜色的明亮度,Cb、Cr描述颜色的色调和饱和度.Cb通道反映的是蓝色信号部分与 RGB 信号亮度值之间的差异,而Cr通道反映了RGB 颜色模型中红色信号部分与 RGB 信号亮度值之间的差异.由于YCbCr颜色空间具有和人的视觉感知的一致性并且肤色聚类的效果好及亮度和色度相互独立的特征,并且肉眼对图像Y分量更敏感,因此在通过对色度分量进行子采样来减少色度分量后,肉眼将察觉不到的图像质量的变化.由于YCbCr颜色空间能够很好地把颜色的亮度信息和色度信息分开,在Cb-Cr平面上肤色能够很好地聚集在一个小范围区域,将色彩转换到YCbCr颜色空间有一定的好处,YCbCr颜色空间中亮度被单独分为一个维度,分析色彩信息不考虑亮度信息的时候,在该空间中只需要分析Cb和Cr两维就行了,这样就减少了色彩空间的维度,降低了计算的复杂度;并且肤色在YCbCr颜色空间中有着很好的聚类性[11],在此空间中,肤色没有分散,能够很好地聚集在一块很小的区域.笔者采用了YCbCr 空间作为手势分割肤色颜色空间,图像从RGB颜色空间转化到YCbCr空间的公式如下所示:为了更好地对人体肤色聚类,我们排除亮度的干扰,只考虑色度信息,在Cb-Cr 平面内寻找肤色聚类区域.为此,需要对大量皮肤区域颜色值进行统计,然后在此基础上统计出Cb-Cr平面中肤色的区域.为了探究YCbCr颜色空间对肤色的聚类性能,笔者采集了不同环境下的手部图像共计88张,手动裁剪出人手肤色区域113块,共计6007466个像素.经过计算得出这些像素的灰度平均值为128.95,RGB 三个通道的平均值分别为149.23,124.21,99.90.这里R,G,B∈[0,255].将此结果转换到YCbCr空间,抛弃颜色的亮度信息Y,观察Cb-Cr平面中肤色分布近似呈现一个椭圆形状,如图2所示:因此经过大量的统计数据发现,将皮肤信息映射到YCbCr空间,会在CbCr二维空间中肤色像素点近似形成椭圆分布,通过判断坐标(Cb,Cr)是否在椭圆内(包括边界),来判断其为皮肤的概率.基于椭圆模型的肤色检测是基于YCrCb色彩空间的肤色分割模型.基于该颜色空间的肤色模型包括:阈值边界模型、高斯模型和椭圆模型等.阈值边界模型中,满足133<Cr<173且77<Cb<127的待判像素即被认为是肤色,但是该方法的漏检和误检可能性较大.虽然高斯模型和椭圆模型都具有相对精确的肤色判断依据,然而后者比前者具有更高的分割精度和更低的时间复杂度[12].因此本文选择椭圆模型进行肤色检测.由于肤色区域的颜色与亮度成非线性函数关系,在低亮度条件下,YCbCr 空间中色度的聚类性会随Y 呈非线性变换降低.本文中为使肤色聚类不受亮度Y 的影响,首先去掉高光阴影部分,并将YCbCr 颜色空间中的色度Cb,Cr进行非线性变换得到C′b,C′r.椭圆方程具体参数如下所示:+=1其中,Hsu等人经过大量统计实验,根据肤色点在CbCr子空间的聚类特性计算得出Cx=109.38,Cy=152.02,θ=2.53,ecx=1.60,ecy=2.41,a=25.39,b=14.03.当待判断的像素点的颜色分量 (Cb,Cr)值符合该模型时,则判定该点为肤色点.Otsu于1978年提出的最大类间方差法,是一种常用的阈值选取方法,能够有效地对图像进行分割[13].由于基于椭圆模型进行肤色检测中可能会受到类似人体肤色的干扰,肤色检测时会对类似肤色的区域进行分割,为了实现对肤色检测获取二值图像中的手势区域和非手势区域进行分割,去除非手势区域对手势分割的影响,在此引入最大类间方差的方法,获取进一步分割手势区域和非手势区域的阈值.为获取分割阈值,首先选取各图像的连通区域,以连通区域的个数为横轴,以对应连通区域像素个数为纵轴,归一化处理建立直方图.利用下式进行归一化处理:j=*255式中:j为第i个连通区域被归一化到直方图的Bin,M为图像中灰度值为255的连通区域的个数,N[i]为第i个连通区域像素的大小.同时采用最大类间方差法获取连通区域直方图阈值r,根据阈值k进行分割处理,去除各方向肤色检测后图像上的一些非手势区域,对肤色检测二值图像进行更加精准的手势分割处理.阈值r由下式可得:式中:vt为像素的大小期望,wr为连通区域像素的大小落在[0~r]范围内概率和,1-wr为连通区域像素的大小落在[r~255]范围内概率.但是为了去除更多的非手势区域,采用人工的手段提高分割阈值,将最后用于分割手势区域的阈值设置为1.2*r.则图像中所有连通区域的像素在[0~为验证基于椭圆模型进行手势分割的实时性、准确性和抗干扰性等性能,进行实验演示.该实验通过在window 10的操作系统环境下运用Matlab编程进行实现.该方法在处理一张640*450分辨率的图像时,运行机器在2.1 G,2 G RAM的情况下,执行时间大约在500~800 ms之间,因此在时间上,还需要采用一些加速策略,提高时间执行速度.同时用该方法的实验结果与国内相关论文进行了比较,结果如图4~6所示:可以看到,本文方法在肤色检测方法能获取较好的效果,如图4~6中能很好地将与背景区分度不大的指甲部分很好的检测出来;同时在图4中大拇指处由于光照的影响文献[14-15]较难将此处进行分割,而本文方法却能很好地排除光照变化造成的干扰;并且本方法也能很好地排除非手势区域,获取较为分割清晰的手势二值图像.另外,虽然本方法能够很好地处理光照变化带来的影响,但是在细节的处理方面却有着一定的不足之处,如图4中无名指与小拇指处的细节处理就不能很好的进行检测,会将背景阴影处认为是手势的一部分进行分割显示,因此本文仍然有着改进空间.笔者针对不同的复杂环境下的静态手势图像,提出了一种基于YCbCr颜色空间进行肤色检测的手势分割方法.通过对比人体肤色在各颜色空间中聚类效果,选取对光照环境变化不太敏感的椭圆模型在YCbCr空间进行肤色检测实现复杂背景环境下手势分割,获取初步的包含手势区域的二值图像,然后针对基于椭圆模型进行肤色检测中可能会受到类似人体肤色的干扰,分割时产生类似肤色的区域的问题,采用最大类间方法去除图像中非手势区域,获取较高质量的手势二值图像,实现了对复杂背景环境下手势的自动分割.同时通过用本文方法的实验结果与其他分割方法对比的结果表明,该方法在获取整体手势图像方面,能得到很好的效果;但是在手势指间的细节分割方面,还需要进一步提高.【相关文献】[1]Panwar M.Hand gesture recognition based on shape parameters[C]//International Conference on Computing,Communication and Applications.IEEE,2012:1-6.[2]Licsar A,Sziranyi er-adaptive hand gesture recognition system with interactive training[J].Image & Vision Computing,2005,23(12):1102-1114.[3]陶霖密,彭振云,徐光裕.人体的肤色特征[J].软件学报,2001,12(7):1032-1041.[4]M J Jones,J M Rehg.Statistical color models with application to skin detection [J].Int' Journal of Computer Vision archive,2002,46:81-96.[5]N.O1iver,A.Pentland,and FTER: A real-time face and lips tracker with facial expression recognition [J],Pattern Recognition,2000,33:1369-1382.[6]Wu H Y,Chen Q,Yachida M.A fuzzy-theroy-based face detector.[C]//Proceedings of the 13th International Conference on Pattern Recognition,Vienna,Austria,A:IEEE Computer Society,1996:406-410.[7]Hsu R L,Abdelmottaleb M,Jain A K.Face Detection in Color Images[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2002,1(5):696-706.[8]袁敏,姚恒,刘牮.结合三帧差分和肤色椭圆模型的动态手势分割[J].光电工程,2016,43(6):51-56.[9]张洪超,侯德文.一种基于 HIS 颜色空间的分割复杂背景图像算法[J].山东师范大学学报:自然科学版,2015(3):49-52.[10]万静,袁泽,张雪超.复杂背景下基于人脸的自适应肤色检测[J].计算机应用与软件,2016,33(11):148-152.[11]Senior A,Hsu R L,Mottaleb M A,et al.Face Detection in Color Images[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2008,24(5):696-706.[12]Elgammal A,Muang C,Hu D.Skin Detection[J].Ceur,2009:1218-1224.[13]Otsu N.Threshold Selection Method from Gray-Level Histograms,IEEE Transactions on Systems Man and Cybernetics[J].Systems Man & Cybernetics IEEE Transactionson,1979,9(1):62-66.[14]许雪梅,黄征宇,李丽娴,等.一种基于HSV颜色分割和模糊级联分类器的人脸检测技术[J].计算机应用与软件,2014(4):197-200.[15]李丹丹,史秀璋.基于HSI空间和K-means方法的彩色图像分割算法[J].微电子学与计算机,2010,27(7):121-124.。
基于 YCbCr 颜色空间背景建模与手势阴影消除佚名【摘要】为了提高动态手势检测的精确度,本文将基于YCbCr颜色空间的混合高斯背景建模应用于动态手势识别中,并且提出手势阴影消除的有效算法。
首先,对待检测视频帧通过抠图抠出手势图像,在YCb′Cr′颜色空间进行椭圆拟合,统计建立椭圆肤色模型,继而在YCbCr颜色空间进行混合高斯背景建模检测出动态手势,点乘原图像得到含有阴影的RGB手势图像,对检测出的含有阴影的手势图像利用已建立的椭圆肤色模型进行阴影消除,最后将手势图像连成视频序列。
实验结果表明,该算法在复杂背景下进行动态手势的检测率可达91.4%,高出传统方法10%左右,能够满足动态手势检测基本要求,且具有较高的实用价值。
%To improve the accuracy of the dynamic gesture detection , Gaussian mixture background modeling based on YCbCr color space is applied to the dynamic gesture recognition , and the effective gesture shadow elimination algorithm is proposed .First of all , the gesture image is cut out from video frame to be detected , and space ellipse fitting is developed in YCb′Cr′color.Oval color model is established statistically , and then dynamic gesture in the YCbCr color space through Gaussian mixture background modeling is detected .Original image is dotted product to get the gesture RGB image containing shadows .The shadows contained in the detec-ted gestures image were eliminated by using ellopse color model , and finally we take gesture images together into a videosequence .Experimental results show that in the algorithm of dynamic gesture detection rate is 91.4% under a complex background , about10%higher than that by the traditional methods .So it can meet the basic requirements of dynamic gesture detection , and has a high practical value .【期刊名称】《中国光学》【年(卷),期】2015(000)004【总页数】7页(P589-595)【关键词】手势检测;混合高斯背景建模;椭圆拟合;阴影去除【正文语种】中文【中图分类】TP391.9在信息迅速膨胀的今天,各种智能化产品登上人们生活的舞台,推动了人工交互的迅速发展。
手势识别技术是人机交互的重要组成部分,近年来各种手势识别的应用产品已投入到大众需求中,例如:基于手势识别的远程电视控制系统和视频游戏的用户界面、哑语识别及交警手势识别等。
手势识别是集人工智能、神经识别、图像处理及智能分析等于一体,涉及计算机语言、计算机视觉、图像处理等学科。
手势识别技术的迅速发展带动了各个领域的共同发展,在处于信息交互频繁的今天,手势识别已经成为人机交互发展的主流。
手势识别过程中首先要进行手势检测,检测结果的好坏直接影响到后面识别的精确度。
而在运动目标检测中,运动物体受到风吹、光照等外界因素的干扰容易产生阴影及其他噪声,对运动目标检测的精确性造成较大影响[1-3]。
目前运动目标检测运用最广泛的方法就是背景建模法,国内外对于手势检测的研究也取得了突破性进展,手势分割技术也从最初的借助数据手套等工具向着由纹理、颜色等特征的方向发展[4-6]。
如文献[7]和文献[8]中提出的背景建模在简单背景下能够较好地进行运动目标检测,但是不能有效地抑制阴影,容易造成运动目标的误检测;文献[1]和文献[4]提出的复杂环境下的手势检测,能够在较为复杂的背景中准确提取手势,但仅局限于静态手势;文献[9]和文献[10]提出基于GMM的彩色运动目标检测和联合两种颜色空间的运动目标阴影消除,这两种方法实现了对运动目标的提取及阴影的部分消除,但是该方法对光照及外界环境的要求高,具有一定的局限性,实用性不高。
文献[11]和文献[12]提出的方法能够在复杂背景下进行运动目标检测,但也不能有效地抑制阴影,具有一定的局限性。
本文提出的基于YCbCr颜色空间的混合高斯背景建模和基于YCb'Cr'颜色空间椭圆肤色模型相结合的动态手势检测不仅能够在复杂背景下准确进行手势检测,还能够有效消除手势阴影,提高了手势检测的精确度,具有一定的实用价值。
2.1 手势图像抠图及YCb'Cr'颜色空间的转化将待检测手势图像拆分成70帧,利用Photoshop软件手动将前20帧含背景信息的手势图像中抠出手势图像,并将抠出的手势图像非线性转换到YCb'Cr'颜色空间,抠出的手势图像如图1所示。
YCb'Cr'颜色空间是YCbCr非线性转换形成的。
研究发现在YCbCr颜色空间,肤色亮度和色度在高亮度和低亮度区域并非严格线性无关,这种依赖关系很大程度上影响了肤色的检测效果[13]。
YCb'Cr'颜色空间不仅解除了这种依赖关系,肤色在该颜色空间有着很好的聚类性,并且这种肤色聚类区域不随着亮度的变化而变化。
YCb'Cr'颜色空间转换公式如下:式中:WCi(Y)、的具体运算公式在文献[1]中有具体的求解。
WCi(Y)描述的是在Y-Ci坐标中肤色区域的宽度,Ci表示Cb和Cr,、Cb(Y)用4个边界来限定聚类区域。
这样更加有利于模型更好地适应亮度过暗或过亮的区域,以此提高系统的鲁棒性,提高对环境的适应能力。
Kl、Kh表示非线性分段色彩变换的分段阈值。
经过大量统计实验数据得出[1]:Kl=125,Kh=148,WCb=46.97,WCr=38.76,WLCb=23,WLCr=20。
2.2 最小二乘法椭圆拟合及椭圆模型的建立经研究发现,肤色在YCb'Cr'颜色空间聚类形状类似椭圆[1],且具有较强的聚类性。
把视频序列的第7帧进行非线性转换,并且将肤色点在Cb'-Cr'坐标系下的投影,投影结果如图2所示,图中横坐标为Cb'像素值,纵坐标为Cr'像素值。
从投影图可以看出,用椭圆模型来表述肤色在此颜色空间的分布比较精确,能够找到一个能包含所有肤色点的最小椭圆是手势提取的关键。
本文选用最小二乘法进行椭圆拟合,最小二乘法通过最小化误差的平方和来寻找最佳函数匹配,距离拟合和几何曲线拟合是最小二乘法的两种拟合方式[1]。
本文采用距离拟合椭圆的两种表达式如下:式(3)拟合过程运算较简便,且式(3)中参数能与式(2)中的椭圆五参数进行转换[14]。
本文椭圆拟合过程如下:首先,为避免椭圆方程有零解,并将解的整数倍误认为同一方程,需将式(3)加限制条件A+C=1[15],然后根据聚类图形手动选取聚类图形的6个具有代表性的边缘像素点p(xi,yi),其中包括4个椭圆长轴短轴与椭圆交点,再另选2个椭圆边缘曲率大的对称像素点。
继而构造误差平方和函数,如式(4):由极值原理可知,可得以下线性方程:继而求解该线性方程式可求出参数A、B、C、D、E、F。
本文对视频序列中前20帧抠出的手势图像进行最小二乘法椭圆拟合,然后求出参数并取其均值,最后进行公式转化[14]后可得椭圆的五参数具体数值为:θ=2.80,exy=2.35,ecx=2.05,a=27.50,b=14.30。
此时拟合的椭圆方程已确定,继而建立椭圆肤色模型,图像中的像素点可用下式表示:此时令若M>1,该像素位于椭圆之外认定为背景像素,标记为0,若M<1,该像素位于椭圆内部认定为前景像素,即为肤色,标记为1。
经过非线性转换容易形成伪肤色,即亮度小于80的非肤色点视为肤色,故本文将Y<80的像素点认定为背景像素,即标记为0。
3.1 模型简介以及参数初始化混合高斯模型中的背景像素的每一个像素可用N个不同的高斯分布表示,本文取N=3[11]。
每一个高斯分布都有其对应的权值Wk。
高斯模型还有2个重要的参数:均值μ与方差Ω。
对于手势视频帧中的像素点(x,y)在t时刻的观察值表示为Xt=()T。
方差矩阵和均值矢量表示为:参数初始化过程中将权值设置尽可能小,方差设置尽可能大,均值大小取第一帧图像中的每一个像素点的像素值。
本文取Wk,t=0.05;Ωk,t=15。
3.2 模型参数实时更新读取手势视频中第一帧,现有的高斯模型相匹配与帧中像素点进行匹配,若匹配,继而判断该像素与混合高斯模型中的某个高斯分布均值的距离是否小于标准差与偏差阈值的乘积(本文偏差阈值D=2.0)。
若满足,则该像素点与高斯模型中高斯分布相匹配,将该像素点归入高斯模型中,并按照文献[6]进行参数更新。
在更新过程中,α反映的是背景的更新速度,其取值大小对模型的更新有较大的影响。
经测试,本文α取值为0.03时效果最佳。
若该像素与混合高斯模型中高斯分布不匹配,则按照下式减小权重Wk,即:Wk,t+1=(1-α)Wk,t。
若像素点与已有的高斯模型不匹配,新的高斯模型将取代权重最小的高斯模型。
经过参数不断更新和训练,得到混合高斯分布模型。
3.3 混合高斯背景模型的建立及手势分割选取权重大于某一阈值T的所有高斯分布建立混合高斯背景模型,经测试,本算法T=0.40时效果最佳。
此时判断混合高斯背景模型与当前帧的某一像素点Xt是否匹配,即:||<,其中,D为偏差阈值,σ 为标准差。
若上k,t式成立,该像素点标记为0,即为背景像素点;若不成立,该像素点即为1,即为前景像素点[6]。
继而进行一下形态学操作,形态开操作消除部分噪声,连通域操作删除面积较小的噪声,运用合适结构元填充图像空洞区域。
最终得到运动手势图像。
经过以上处理,混合高斯背景建模第17帧图像动态手势检测结果如图3所示。