当前位置:文档之家› 基于深度学习的人体行为识别算法综述_朱煜

基于深度学习的人体行为识别算法综述_朱煜

基于深度学习的人体行为识别算法综述_朱煜
基于深度学习的人体行为识别算法综述_朱煜

基于神经网络的交互式异常行为识别研究

电子设计工程 Electronic Design Engineering 第26卷Vol.26第20期No.202018年10月Oct.2018 收稿日期:2018-01-24 稿件编号:201801133 作者简介:关百胜(1991—),男,山西运城人,硕士研究生。研究方向:图像处理与计算机视觉。 人的行为识别一直是计算机视觉领域的一个重要研究方向。近年来随着深度学习技术的不断发展,行为识别已经成为了计算机视觉方向的一个研究热点[1]。在智能安防领域中,人的行为识别研究范围主要包括越界检测、遗留物力检测、徘徊检测和打架斗殴等异常行为。 目前,行为识别研究方面的一些综述性文章[2-7] 对最近几年行为识别的发展现状进行了分析和总结。行为识别特征提取的方法分为传统的特征提取方法和基于深度学习的特征提取方法。针对人的行为分析主要包括人的姿态分析[8]、单人行为分析[9]、交互式行为分析[10]和人群行为分析[11]。 交互式行为识别的研究工作主要开始于2010[12] 年。在2014年的Computer Vision and Pattern Recognition (CVPR )会议上,相关专家对交互式行为识别的研究现状以及存在的问题进行了讨论分析。之前的研究方法主要是通过传统的图像特征提取方法和分类算法等手段进行交互式行为的识别,因此无法对复杂的交互式异常行为进行识别,算法的鲁棒性较差。考虑到目前深度学习在行为识别上已经取得初步的成果,故本文提出基于神经网络的交互式异常行为识别方法,对异常行为进行识别。神经网络技术能够自动提取视频中的交互式行为特征, 基于神经网络的交互式异常行为识别研究 关百胜1,2 ,卞春江1,冯水春1,陈实1 (1.中国科学院国家空间科学中心北京100190;2.中国科学院大学北京100094) 摘要:在智能安防领域中,异常行为识别一直是该领域的一个研究热点。但目前的研究技术仅能够识别简单的行为特征,对于复杂行为的识别还存在诸多问题。随着人工智能技术的不断发展以及在行为识别上的应用,可以尝试通过深度学习技术对监控视频中的异常行为进行识别。因此本文针对监控视频中的交互式异常行为进行分析研究,首先通过背景减除算法对视频数据进行预处理,然后采用深度学习技术在训练数据集上进行算法模型的训练,最后在测试数据集上进行算法模型的验证。该算法模型能够有效区分异常行为和正常行为,识别准确率为73%。关键词:交互式;异常;行为识别;神经网络;深度学习中图分类号:TN919.8 文献标识码:A 文章编号:1674-6236(2018)20-0001-05 Abnormal action recognition of interaction research based on neural network GUAN Bai?sheng 1,2 ,BIAN Chun?jiang 1,FENG Shui?chun 1,CHEN Shi 1 (1.National Space Science Center ,Chinese Academy Sciences ,Beijing 100190,China ;2.University of Chinese Academy Sciences ,Beijing 100094,China ) Abstract:Abnormal action recognition has been a hot topic in the field of intelligent security.However ,current research techniques can only recognize simple action ,and there are still many problems in complex action recognition.With the continuous development and application in action recognition of artificial intelligence ,we can try to recognize abnormal action of interaction in the surveillance video by deep learning.Therefore ,the paper analyzes abnormal action of interaction in the surveillance video. Firstly ,background subtraction is used to preprocess the video data ,and then deep learning is used to train the algorithm model in train dataset.Finally ,the algorithm model is validated on the test dataset.The model can effectively distinguish between abnormal action and normal action ,and the recognition accuracy is 73%. Key words:interaction ;abnormal ;action recognition ;neural network ;deep learning - -1万方数据

基于骨骼数据的人体行为识别

基于骨骼数据的人体行为识别 摘要 人体动作姿态识别是计算机视觉研究领域中最具挑战的研究方向,是当前的研究热点。对人体动作姿态进行自动识别将带来一种全新的交互方式,通过身体语言即人体的姿态和动作来传达用户的意思,如在机场、工厂等喧闹的环境下,采用手势、动作姿态识别等人机交互技术能够提供比语音识别更加准确的信息输入。总之,在智能监控、虚拟现实、感知用户接口以及基于内容的视频检索等领域,人体动作姿态的识别均具有广泛的应用前景。该文首先简单介绍了人体动作姿态序列的分割,然后对人体动作姿态识别的方法进行了分类介绍,并对一些典型的算法的研究进展情况及其优缺点进行了重点介绍。 关键词:人体动作姿态识别; 人工智能; 隐马尔可夫模型; 动态贝叶斯网络; 模板匹配前言 人体姿态识别是计算机视觉的一个重要研究方向,它最终目的是输出人的整体或者局部肢体的结构参数,如人体轮廓、头部的位置与朝向、人体关节点的位置或者部位类别。姿态识别的研究方法应该说,几乎涵盖了计算机视觉领域所有理论与技术,像模式识别、机器学习、人工智能、图像图形、统计学等。到目前为止,已经有众多识别方法被提出,并且也取得了许多重要的阶段性的研究成果,但是以往的方法都是基于普通光学图像,比如常见的RGB 图像,这类图像容易受光照、阴影等外界变化的影响,尤其在环境黑暗的情况下无法来识别人体姿态,并且由于人体关节自由度大,及人的体型、着装较大差异性,常导致姿态识别系统识别率低。尽管有研究者利用多个摄像机获取采集的图像来获取人体深度信息以克服以上问题[1],但是该类方法恢复的深度信息不是唯一的,而且计算量非常大,尤其是这种方法要求事先用人工对传感设备进行标定,而在选取场景中的标定物时,往往又会遇到实际环境操作困难的问题。 随着光电技术的快速发展,深度传感设备的成本逐渐降低,人们获取深图像的途径及方法也越来越多。该方向的研究也逐渐成为计算机视觉领域的研究趋势。具体原因包括:一方面,深度传感设备不仅操作简单,并且极大简化了普通摄像机的标定过程;另一方面,得到的深度图像由于直接包含了人体的深度信息,能够有效的克服普通光学图像遇到的上述问题。到目前为止,较有影响力的基于该类图像的人体姿态识别算法,应该是 Shotton 等人利用一种深度传感器 Kinect 来实时捕捉人体运动的算法,该算法虽然能够满足人们对识别系统实时性的要求,但其对硬件要求特别高,并且不适合低分辨率图像中的人体关节点提取,容易导致人体骨架扭曲。下文将具体陈述人体运动分析的主要用途和前人在不同时期对这些难题的处理办法。 主题 基于计算机视觉的人体运动分析不仅在智能监控、人机交互、虚拟现实和基于内容的视频检索等方面有着广泛的应用前景,更是成为了未来研究的前瞻性方向之一。Gavrila 总结了它的一些主要应用领域[2,3,4],下面据此对其典型应用做出进一步的介绍。 智能监控(Smart Surveillance) 所谓“智能监控”是指监控系统能够监视一定场景中人的活动,并对其行为行分析和识别,跟踪其中的可疑行为(例如在一些重要地点经常徘徊或者人流密集的场合下突发的人群拥挤等状况)从而采取相应的报警措施。智能监控系统应用最多的场合来自于那些对安全

浅谈视频搜索网站深度链接行为的刑法规制

浅谈视频搜索网站深度链接行为的刑法规 制 随着我国网络视频行业的迅猛发展,搜索类视频网站盗链侵权问题日益突出。由于搜索类视频网站服务器上存储的不是具体影视作品,而是类似于种子的资源,即网络链接,对以网络深度链接方式进行的盗版侵权行为能否进行刑法评价、如何评价是一个刑法难题。 一、对视频网站深度链接行为进行刑法规制的必要性 深度链接是设链网站对第三方网站中存储文件的直接链接,用户点击之后, 即可以在不脱离设链网站的情况下,在线打开第三方网站的视频文件,观看其影视作品。 (一)视频网站深度链接行为具有严重的社会危害性 如果从技术及运作模式上分析,目前我国的视频网站深度链接侵权主要有如下两种模式: 一是直接侵权模式,即通过技术手段破解他人视频网站的保护措施,直接盗播他人的视频作品。如快播公司和百度公司均推出自己的影音播放器,这些播放器破解各正版视频网站的技术保护措施,通过搜索爬虫非法抓取他人视频信息,直接盗播他人网站内容。如已被判刑的https://www.doczj.com/doc/a93205238.html,和星际s电影负责人张某,为提高点击率以赢得更多广告费收入,分别使用百度影音客户端和快播公司QVOD播放软件抓取他人享有独家信息网络传播权的影视作品600余部进行盗播。 二是以技术支持方式与众多小型盗版网站联合侵权模式,即通过技

术、流量、广告联盟分成以及推广费用支持,大型搜索类视频网站与上千家小型盗版网站结成利益联盟,形成一个庞大的盗版视频产业链。 (二)用刑法从根本上遏制侵权行为 由于搜索引擎身份以及网站服务器并未储存侵权作品而只提供链接资源等行为特点,每遇侵权诉讼以及版权主管机关的立案调查,搜索类盗链视频网站均借口避风港原则来规避责任。 虽然在2012年以后的几乎所有行政处罚及法律诉讼中,法院及主管行政机关均以红旗原则认定被诉视频网站深度链接行为构成侵权,但对其侵权行为的性质多界定为民事侵权,侵权行为的后果也多是民事赔偿与行政处罚。按我国现行《著作权法》第49条的规定,当权利人的实际损失或侵权人的违法所得难以计算时,对侵权行为的法定最高赔偿额为人民币50万元。按北京市海淀区人民法院统计,该院判决的网络视频侵权案件平均赔偿额为人民币3万元;2013年11月,优酷土豆诉百度视频侵权案,原告方索赔人民币1.2亿元,法院判决赔偿49万元。虽然索赔数额与实际判决赔偿数额相差悬殊,但这已接近法院所能判处的法定赔偿的上限。 二、视频网站深度链接行为的刑法定性 我国《刑法》第217条规定,未经著作权人许可,复制发行其文字作品、音乐、电影、电视、录像作品,情节严重的构成侵犯著作权罪。因此,如果视频网站的盗链侵权行为属于复制发行行为,对这种行为就应该以侵犯著作权罪定罪处罚。 2004年最高人民法院、最高人民检察院《关于办理侵犯知识产权刑

“深度学习“学习笔记

摘要:人工智能的飞跃发展得益于深度学习理论的突破以及移动互联网创造的大数据。本文梳理了人工智能、机器学习、深度学习的概念以及发展历程;介绍了深度学习基本理论、训练方法、常用模型、应用领域。 关键词: 机器学习、人工神经网路、深度学习、语音识别、计算机视觉 1.概述 2017年5月27日,围棋世界冠军柯洁与Google围棋人工智能AlphaGo的第三场对弈落下帷幕。在这场人机大战中,世界围棋第一人0:3完败于围棋人工智能。人工智能以气势如虹的姿态出现在我们人类的面前。人工智能AI(Artificial Intelligence)从此前的学术研究领域全面进入大众视野。整个业界普遍认为,它很可能带来下一次科技革命,并且,在未来可预见的10多年里,深刻得改变我们的生活。 、人工智能、机器学习、深度学习 什么是人工智能人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科。该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。上世纪50年代人工智能的理念首次提出,科学家们不断在探索、研究,但是人工智能的发展就磕磕碰碰。人工智能的发展经历了若干阶段,从早期的

逻辑推理,到中期的专家系统,直到上世纪80年代机器学习诞生以后,人工智能研究终于找对了方向。 机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型对真实世界中的事件作出决策与预测的一种方法。基于机器学习的图像识别和语音识别得到重大发展。人工神经网络(Artificial Neural Networks)成为机器学习中的一个重要的算法,其中反向传播算法(Back Propagation)是最常用的ANN学习技术。基于BP算法的人工神经网路,主要问题是训练困难、需要大量计算,而神经网络算法的运算需求难以得到满足。进入90年代,神经网络的发展进入了一个瓶颈期。其主要原因是尽管有BP算法的加速,神经网络的训练过程仍然很困难。因此90年代后期支持向量机(SVM)算法取代了神经网络的地位。【SVM是个分类器,通过“核函数”将低维的空间映射到高维的空间,将样本从原始空间映射到一个更高维的特质空间中,使得样本在这个新的高维空间中可以被线性划分为两类,再将分割的超凭你们映射回低维空间。】 2006年,加拿大多伦多大学教授、机器学习领域的泰斗Geoffrey Hinton在《科学》上发表了一篇文章,开启了深度学习在学术界和工业界的浪潮。这篇文章有两个主要观点:1、多隐层的人工神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类;2、深度神经网络在训练上的难度,可以通过“逐层初始化”(layer-wise pre-training)来有效克服,在这篇文章中,逐层

深度链接的侵权问题

深度链接的侵权问题 摘要:随着网络技术的不断,发展深度链接这一现象在当今社会已是屡见不鲜,但是国家关于信息网络传播权的立法中对于怎样判断深度链接的侵权构成,在确定侵权时如何把握公众利益与个人利益的关系规定不明确。本文中,我们可以从《侵权责任法》的角度对此加以评析。 关键词:侵权责任法深度链接侵权 伴随着网络空间技术的发展,信息的传播方式打破了传统传播模式的束缚,并正以一种崭新的网络传播模式呈现于我们面前。网络传播方式的无形性、难以追责性、瞬间性等特征使得传统著作权保护手段显得苍白无力,网络传播权的立法保护纷至沓来。笔者在以下的分析论述中着力说明对于在网络环境下的著作权的保护及其保护程度,如何控制这一限度以达到在适当的范围内既能维护权利人利益又不至于阻碍信息对人类社会发展的推动,实现个人权益与公众利益的平衡。 一、网络信息传播权的相关概念 1、著作权中的网络信息传播权 现行的《著作权法》第10条有关著作权内容的第12项中第一次规定了信息网络传播权,“即以有线或者无线方式向公众提供作品,使公众可以在其个人选定的时间和地点获得作品的权利”。2006年5月18日颁布的《信息网络传播权保护条例》的第26条中对信息网络传播的概念作了进一步的阐明,即“以有线或无线方式向公众提供作品、表演或者录音录像制品,使公众可以在其个人选定的时间和地点获得作品、表演或者录音录像制品的权利。” 2、网络传播权在深度链接下的特点 深度链接与一般链接相对应。一般链接是指设链者在其网站或网页上直接显示被链接的地址,网络用户能够清楚地知道设链者的网站或网页同其他网站或网页建立了链接。 而深度链接则与此不同,设链者将被链接对象的网址“埋”在自己的网站或网页当中,网络用户一般很难发现其浏览的内容是从其他网站链接而来。网络用户在链接网站的一步一步地引导之下访问被链接网站,而访问的内容并不存入设链者的服务器上,只在服务器上暂时复制”,一经关机,内容也随之消失。深度链接有以下三个特点: i网络连接实时化。用户浏览网站下载资料等必须是登陆网站时,一旦不与网络连接用户也无法获取资料。

Deep Learning(深度学习)学习笔记整理

Deep Learning(深度学习)学习笔记整理 作者:Zouxy version1.02013-04-08 目录: 一、概述 二、背景 三、人脑视觉机理 四、关于特征 4.1、特征表示的粒度 4.2、初级(浅层)特征表示 4.3、结构性特征表示 4.4、需要有多少个特征? 五、Deep Learning的基本思想 六、浅层学习(Shallow Learning)和深度学习(Deep Learning) 七、Deep learning与Neural Network

八、Deep learning训练过程 8.1、传统神经网络的训练方法 8.2、deep learning训练过程 九、Deep Learning的常用模型或者方法 9.1、AutoEncoder自动编码器 9.2、Sparse Coding稀疏编码 9.3、Restricted Boltzmann Machine(RBM)限制波尔兹曼机 9.4、Deep BeliefNetworks深信度网络 9.5、Convolutional Neural Networks卷积神经网络 十、总结与展望 十一、参考文献和Deep Learning学习资源

一、概述 Artificial Intelligence,也就是人工智能,就像长生不老和星际漫游一样,是人类最美好的梦想之一。虽然计算机技术已经取得了长足的进步,但是到目前为止,还没有一台电脑能产生“自我”的意识。是的,在人类和大量现成数据的帮助下,电脑可以表现的十分强大,但是离开了这两者,它甚至都不能分辨一个喵星人和一个汪星人。 图灵(图灵,大家都知道吧。计算机和人工智能的鼻祖,分别对应于其著名的“图灵机”和“图灵测试”)在1950年的论文里,提出图灵试验的设想,即,隔墙对话,你将不知道与你谈话的,是人还是电脑。这无疑给计算机,尤其是人工智能,预设了一个很高的期望值。但是半个世纪过去了,人工智能的进展,远远没有达到图灵试验的标准。这不仅让多年翘首以待的人们,心灰意冷,认为人工智能是忽悠,相关领域是“伪科学”。 但是自2006年以来,机器学习领域,取得了突破性的进展。图灵试验,至少不是那么可望而不可及了。至于技术手段,不仅仅依赖于云计算对大数据的并行处理能力,而且依赖于算法。这个算法就是,Deep Learning。借助于Deep Learning算法,人类终于找到了如何处理“抽象概念”这个亘古难题的方法。

(最新版)人体行为检测和识别毕业设计

本科生毕业设计(论文) 题目:人体行为检测与识别 姓名: 学号: 系别: 专业: 年级: 指导教师: 2015 年 4 月20日 独创性声明 本毕业设计(论文)是我个人在导师指导下完成的。文中引用他人研究成果的部分已在标注中说明;其他同志对本设计(论文)的启发和贡献均已在谢辞中体现;其它内容及成果为本人独立完成。特此声明。 论文作者签名:日期: 关于论文使用授权的说明 本人完全了解华侨大学厦门工学院有关保留、使用学位论文的规定,即:学院有权保留送交论文的印刷本、复印件和电子版本,允许论文被查阅和借阅;学院可以公布论文的全部或部分内容,可以采用影印、缩印、数字化或其他复制手段保存论文。保密的论文在解密后应遵守此规定。 论文作者签名:指导教师签名:日期:

人体行为检测与识别 摘要 人体行为检测与识别是当前研究的重点,具有很高的研究价值和广阔的应用前景。主要应用在型人机交互、运动分析、智能监控和虚拟现实也称灵境技术(VR)领域,对于研究人体检测和识别有着重要的意义。因为人的运动的复杂性和对外部环境的多变性,使得人们行为识别和检测具有一些挑战。对人类行为和检测的研究目前处于初级阶段,有待进一步研究和开发。 本文基于matlab人体行为识别和检测的研究,本文主要研究的是从图像中判断出目标处于何种行为,例如常见的走、坐、躺、跑、跳等行为的识别。从现有的很多主流研究成果来看,最常见的行为识别系统结构包括几个模块:目标检测、目标跟踪、行为识别。本文首先对图像进行判断是否有人体目标,识别出人体后对图像进行灰度化,在对灰度图像用背景差法与背景图像比对,最后,比对提取出的人体来判断人体处于何种行为。 关键词:matlab,肤色识别,行为检测

人体行为识别技术

人体行为识别技术 在计算机视觉领域中,人体运动行为识别是一个被广泛关注的热点问题,在智能监控、机器人、人机交互、虚拟现实,智能家居,智能安防,运动员辅助训练等方面有巨大应用价值。行为识别问题一般遵从如下基本过程:数据图像预处理,运动人体检测、运动特征提取、特征训练与分类、行为识别。着重从这几方面逐一回顾了近年来人体行为识别的发展现状和常有方法。并对当前该研究方向上待解决的问题和未来趋势做了分析。行为理解可以简单地认为是时变数据的分类问题,即将测试序列与预先标定的代表典型行为的参考序列进行匹配。通过对大量行为理解研究文献的整理发现:人行为理解研究一般遵从特征提取与运动表征、行为识别、高层行为与场景理解等几个基本过程。 特征提取与运动表征是在对目标检测、分类和跟踪等底层和中层处理的基础上,从目标的运动信息中提取目标图像特征并用来表征目标运动状态;行为识别则是将输入序列中提取的运动特征与参考序列进行匹配,判断当前的动作处于哪种行为模型;高层行为与场景理解是结合行为发生的场景信息和相关领域知识,识别复杂行为,实现对事件和场景的理解。【2】 1、行为识别的应用 从应用领域的分类来讲,可以将人体运动分析的应用分成如下几个领域: ①智能监控 这里所指的“智能”包含两个方面的含义。一种“智能”是指系统能够在一定的场景中检测是否有人的出现(如通过检测人脸的方法)防止只是简单的通过 运动目标检测所造成的错误报警(例如因为动物活动或者刮风摇动树枝等等而造

成误报)。另外一种“智能”是指系统能够监视一定场所中人的活动,并对其行为进行分析和识别,跟踪可疑行为(如经常在重要地点徘徊等等行为)从而采取相应的报警措施。通常把报警系统设置于银行、机场、车站、码头、超市、办公大楼、住宅小区等地,以实现对这些场所的智能监控。 ②虚拟现实 跟踪现实世界人的姿态,从而创建一个虚拟的仿真场景,实现人与这个虚拟世界的交互。该领域的具体应用涉及视频游戏、虚拟摄影棚、计算机动画等方面。 ③高级用户接口 指可以通过对用户手势的识别来代替传统的鼠标和键盘输入,从而实现人与计算机之间的智能交互。此外,通过对手势语言的理解,还可以进行聋人与计算机之间的手语交流。 ④运动分析 人体运动分析可以运用于基于容的视频检索领域。例如可以检索在运动会上单杠比赛中运动员的杠上动作。这样可以节省用户大量的查询视频资料的时间和精力。另外一种应用是用于各种体育项目中,提取运动员的各项技术参数(如关节位置、角度和角速度,等等),通过分析这些信息,可以为运动员的训练提供指导和建议,有助于提高运动员的训练水平。此外,还可以用于体育舞蹈动作的分析,以及临床矫形术的研究等领域。 ⑤基于模型的视频编码 通过提取一定的静态场景中人物的形态特征参数和3D姿态参数,以较低的数据量对视频数据流加以描述,实现视频数据的压缩和低比特率传送。可以用于在因特网上展开远程视频会议以及VOD(Video-On-Demand)视频点播。

深度学习及其在动作行为识别中的进展

深度学习及其在动作行为识别中的进展 深度学习是近年来备受关注的一个研究领域,是机器学习的一个延伸。通过构建深度学习神经网络来提取特征是目前应用于动作行为识别中的一个新研究方向。为了引起更多的视觉领域研究者对深度学习的探索和深入,推动在动作行为识别中的研究,文章首先介绍了深度学习的由来、概念和原理,探讨深度学习与机器学习(神经网络)之间的关系;然后介绍近阶段利用深度学习在动作行为识别中的进展。最后阐述深度学习目前发展所面临的问题,以及对未来的展望。 标签:深度学习;行为识别;神经网络 1 概述 动作行为识别是计算机视觉领域中的一个研究热点,已经广泛应用于智能监控、人机交互、视频检索等领域中[1]。动作行为识别技术是通过对视频或者图像中人体动作行为做出有意义的判断。有效表达图像(视频)中的实际目标和场景内容是最基本,最核心的问题。因此,对于特征的构建和选择得到广泛关注,例如STIP、SIFT、MSER等。但是,能通过无监督方式让机器自动从样本中学习到表征样本的特征,会让人们更好地利用计算机来实现人的视觉功能。而深度学习作为神经网络的延伸和发展,是通过逐层构建一个多层网络来使得机器自动学习到隐含在数据内部的关系,从而让学习到的特征更加准确性。 文章旨在探讨深度学习与机器学习(神经网络)之间的关系,并且介绍深度学习的由来、概念和原理;同时介绍目前深度学习在计算机视觉中的应用。最后提出深度学习目前发展所面临的问题,以及对未来的展望。 2 深度学习 2.1 深度学习概述 深度学习源于人工神经网络的研究,是机器学习的拓展。深度学习是经过组合低层特征来形成更加抽象的属性类别和特征,从中发现原始数据的特征表征[2]。现在用于动作行为识别的技术是通过“动作表征”+“动作分类器”的框架来进行行为识别的。其中“动作表征”是人们手动设计特征获取到的,也就是在目前识别框架内存在一个对动作图像(视频)的预处理过程。 深度学习和浅层学习相对。目前许多学习算法是浅层网络学习方法,具有一定的局限性,例如在样本有限的状况下,表示复杂函数的能力有限制,且对复杂分类问题的泛化能力也会受到一定约束[3]。而深度学习通过学习深层非线性网络结构,达到复杂函数逼近,又能在样本少的情况下学习原始数据的特征。BP 算法作为传统神经网络的典型算法,虽然训练多层网络,但仅含几层网络,训练方法很不理想[3]。因为其输入和输出间非线性映射让网络误差函数形成含多个极小点的非线性空间,因而经常收敛到局部最小,且随着网络层数的增加,容易

人体行为识别技术讲解学习

人体行为识别技术

人体行为识别技术 在计算机视觉领域中,人体运动行为识别是一个被广泛关注的热点问题,在智能监控、机器人、人机交互、虚拟现实,智能家居,智能安防,运动员辅助训练等方面有巨大应用价值。行为识别问题一般遵从如下基本过程:数据图像预处理,运动人体检测、运动特征提取、特征训练与分类、行为识别。着重从这几方面逐一回顾了近年来人体行为识别的发展现状和常有方法。并对当前该研究方向上待解决的问题和未来趋势做了分析。行为理解可以简单地认为是时变数据的分类问题,即将测试序列与预先标定的代表典型行为的参考序列进行匹配。通过对大量行为理解研究文献的整理发现:人行为理解研究一般遵从特征提取与运动表征、行为识别、高层行为与场景理解等几个基本过程。 特征提取与运动表征是在对目标检测、分类和跟踪等底层和中层处理的基础上,从目标的运动信息中提取目标图像特征并用来表征目标运动状态;行为识别则是将输入序列中提取的运动特征与参考序列进行匹配,判断当前的动作处于哪种行为模型;高层行为与场景理解是结合行为发生的场景信息和相关领域知识,识别复杂行为,实现对事件和场景的理解。【2】 1、行为识别的应用 从应用领域的分类来讲,可以将人体运动分析的应用分成如下几个领域: ①智能监控 这里所指的“智能”包含两个方面的含义。一种“智能”是指系统能够在一定的场景中检测是否有人的出现(如通过检测人脸的方法)防止只是简单的通过运动目标检测所造成的错误报警(例如因为动物活动或者刮风摇动树枝等等而造成误报)。另外一种“智能”是指系统能够监视一定场所中人的活动,并对其行为进行分析和识别,跟踪可疑行为(如经常在重要地点徘徊等等行为)从而采取相应的报警措施。通常把报警系统设置于银行、机场、车站、码头、超市、办公大楼、住宅小区等地,以实现对这些场所的智能监控。 ②虚拟现实 跟踪现实世界人的姿态,从而创建一个虚拟的仿真场景,实现人与这个虚拟世界的交互。该领域的具体应用涉及视频游戏、虚拟摄影棚、计算机动画等方面。 ③高级用户接口 指可以通过对用户手势的识别来代替传统的鼠标和键盘输入,从而实现人与计算机之间的智能交互。此外,通过对手势语言的理解,还可以进行聋人与计算机之间的手语交流。 ④运动分析 人体运动分析可以运用于基于内容的视频检索领域。例如可以检索在运动会上单杠比赛中运动员的杠上动作。这样可以节省用户大量的查询视频资料的

人体行为识别技术

在计算机视觉领域中,人体运动行为识别是一个被广泛关注的热点问题,在智能监控、机器人、人机交互、虚拟现实,智能家居,智能安防,运动员辅助训练等方面有巨大应用价值。行为识别问题一般遵从如下基本过程:数据图像预处理,运动人体检测、运动特征提取、特征训练与分类、行为识别。着重从这几方面逐一回顾了近年来人体行为识别的发展现状和常有方法。并对当前该研究方向上待解决的问题和未来趋势做了分析。行为理解可以简单地认为是时变数据的分类问题,即将测试序列与预先标定的代表典型行为的参考序列进行匹配。通过对大量行为理解研究文献的整理发现:人行为理解研究一般遵从特征提取与运动表征、行为识别、高层行为与场景理解等几个基本过程。 特征提取与运动表征是在对目标检测、分类和跟踪等底层和中层处理的基础上,从目标的运动信息中提取目标图像特征并用来表征目标运动状态;行为识别则是将输入序列中提取的运动特征与参考序列进行匹配,判断当前的动作处于哪种行为模型;高层行为与场景理解是结合行为发生的场景信息和相关领域知识,识别复杂行为,实现对事件和场景的理解。【2】 1、行为识别的应用 从应用领域的分类来讲,可以将人体运动分析的应用分成如下几个领域: ①智能监控 这里所指的“智能”包含两个方面的含义。一种“智能”是指系统能够在一定的场景中检测是否有人的出现(如通过检测人脸的方法)防止只是简单的通过运动目标检测所造成的错误报警(例如因为动物活动或者刮风摇动树枝等等而造成误报)。另外一种“智能”是指系统能够监视一定场所中人的活动,并对其行为进行分析和识别,跟踪可疑行为(如经常在重要地点徘徊等等行为)从而采取相应的报警措施。通常把报警系统设置于银行、机场、车站、码头、超市、办公大楼、住宅小区等地,以实现对这些场所的智能监控。 ②虚拟现实 跟踪现实世界人的姿态,从而创建一个虚拟的仿真场景,实现人与这个虚拟世界的交互。该领域的具体应用涉及视频游戏、虚拟摄影棚、计算机动画等方面。 ③高级用户接口 指可以通过对用户手势的识别来代替传统的鼠标和键盘输入,从而实现人与计算机之间的智能交互。此外,通过对手势语言的理解,还可以进行聋人与计算机之间的手语交流。 ④运动分析 人体运动分析可以运用于基于内容的视频检索领域。例如可以检索在运动会上单杠比赛中运动员的杠上动作。这样可以节省用户大量的查询视频资料的时间和精力。另外一种应用是用于各种体育项目中,提取运动员的各项技术参数(如关节位置、角度和角速度,等等),通过分析这些信息,可以为运动员的训练提

相关主题
文本预览
相关文档 最新文档