当前位置:文档之家› 人体三维姿态重构与动作分析

人体三维姿态重构与动作分析

上海交通大学工程硕士学位论文目录

目录

摘要 ....................................................................................................................................... I ABSTRACT ....................................................................................................................... III 第一章绪论 (1)

1.1引言 (1)

1.2研究背景及现状 (2)

1.3三维人体重建与动作分析 (3)

1.3.1基于Kinect的研究 (4)

1.3.2单目视觉条件下的研究 (4)

1.4本文的主要贡献 (5)

1.5本文结构 (5)

第二章三维人体姿态重构和动作分析 (7)

2.1前景检测与分割算法研究 (9)

2.1.1人体特征分类 (9)

2.1.2前景检测与提取 (10)

2.2动作分析方法 (11)

2.3分类器研究 (12)

2.3.1判别式模型研究 (13)

2.3.2生成式模型研究 (14)

2.4本章小结 (16)

第三章基于Kinect的动作识别研究 (17)

3.1多目视觉概述 (17)

3.1.1双目立体视觉 (17)

3.1.2多目视觉系统 (18)

3.2基于Kinect的三维人体动作分析 (19)

3.2.1Kinect设备介绍 (19)

3.2.2Kinect关键技术 (20)

3.3三维动作表示 (21)

3.3.1点云数据获取 (21)

V

3.3.2人体骨架模型 (23)

3.3.3骨架模型初始化 (26)

3.3.4量子进化算法 (28)

3.3.5量子进化算法改进 (31)

3.4动作识别分类 (34)

3.4.1动作特征提取 (34)

3.4.2SVM分类算法 (35)

3.5本章小结 (37)

第四章基于单目视觉的人体运动跟踪和重建 (38)

4.1基于单目视觉的研究特点 (38)

4.2基于高斯模型的前景检测 (38)

4.32D到3D的姿态估计 (40)

4.3.12D关节检测 (40)

4.3.22D到3D的模型建立 (41)

4.4基于模拟退火算法的姿态估计 (42)

4.4.1粒子滤波 (42)

4.4.2模拟退火 (43)

4.4.3模拟退火粒子滤波算法优化 (45)

4.5本章小结 (47)

第五章系统实现与结果分析 (48)

5.1基于Kinect的系统实现与结果分析 (48)

5.1.1点云数据获取 (48)

5.1.2骨架模型 (50)

5.1.3动作分类 (50)

5.1.4实验对比 (54)

5.2基于单目相机的人体上半身姿态分析 (55)

5.2.1前景提取 (55)

5.2.2人体姿态重建 (57)

5.3本章小结 (60)

第六章总结与展望 (61)

6.1全文总结 (61)

6.2工作展望 (62)

VI

参考文献 (63)

致谢 (68)

攻读学位期间发表的学术论文目录 (69)

VII

插图索引

图2-1人体三维重构和动作分析一般步骤 (8)

图3-1双目立体视觉系统组成部分 (18)

图3-2 Kinect设备结构 (20)

图3-3 Kinect 图像矫正 (22)

图3-4灰度直方图 (23)

图3-5人体骨架模型 (24)

图3-6骨架模型的建立流程 (27)

图3-7不同动作手部位置对比 (35)

图3-8使用曲线进行分类 (36)

图3-9使用低维向高维映射进行分类 (37)

图4-1人体上半身检测结果 (40)

图4-2透视投影模型 (41)

图4-3运动跟踪失败 (46)

图5-1使用Kinect获取前景 (49)

图5-2 Kinect获取的点云数据 (49)

图5-3骨架建立结果 (51)

图5-4用于HMM分类的动作字典 (52)

图5-5 Cornell 数据库场景图 (53)

图5-6基于高斯模型的前景提取 (56)

图5-7基于单目相机的姿态分析各环节输出 (57)

图5-8 BROWN大学数据库上半身姿态估计结果 (57)

图5-9自建数据库上半身姿态估计结果1 (58)

图5-10自建数据库上半身姿态估计结果2 (59)

VIII

表格索引

表3-1量子进化算法 (31)

表4-1粒子滤波算法 (43)

表4-2模拟退火算法 (45)

表5-1使用SVM与HMM的分类对比 (52)

表5-2使用SVM分类器进行动作分类的实验结果 (54)

表5-3使用SVM、CRF、HCRF的动作识别率 (54)

IX

上海交通大学工程硕士学位论文第一章绪论

第一章绪论

1.1 引言

实验证实,人类从外部世界所能获取的信息总量约80%是通过人的视觉得到的,这说明人类视觉蕴含极为丰富的信息,同时也表明人类能够高效的处理通过视觉获取的信息。而飞速发展的计算机技术,令赋予计算机等其他智能机器以人类的视觉功能这件事已经不再是人类的一个梦想。

计算机视觉作为近年来一个热门的研究领域,自出现起便获得了学者们的广泛关注,越来越多新技术的研究和应用,给该研究方向的飞速发展提供了更好的契机。视觉在各个应用领域中,如制造业、医疗诊断和军事等领域[1][2]中各种智能或自主系统中,都作为一个十分关键而重要的组成部分存在着,很多先进国家将它视为会对经济和科学产生广泛影响的学科并且作为工程中会面临的重大基本问题考虑,其意义和价值由此可见一斑。例如,美国国防高级研究计划局正在投入研究的多目视频监控,其就是利用计算机视觉技术中的自动视频理解技术,目的是使单个操作员即可监视在复杂战场中的人类活动。实时视觉监控系统[2]使用一个能够进行轮廓分析和跟踪的复合系统,这个系统能做到实时的进行多人跟踪并且在有遮挡的室外表现也很好。另外,英国的研究人员也做了对车辆和人体的跟踪识别以及他们的交互等相关研究[3]。此外,著名的IBM和微软公司积极的在人体运动分析领域进行投资。

计算机视觉关注的是如何能够让计算机有效的去感知、理解并处理视觉信息,进一步来说其最终目标是研究如何能够更好的模拟人类视觉和人类大脑的对外界的感知,从而达到协助人类进行某些领域的工作,甚至超越人类能力范围。

相较于人类的视觉器官,图像视频摄取设备等成像系统被计算机视觉作为输入手段使用,然后大脑被计算机取代,来完成对输入信息的处理和解释,整个处理过程中,计算机视觉与图像处理、模式识别以及图像理解等学科的关键技术有所交叉,因此可以说计算机视觉的研究范围涵盖广泛,这无疑也给研究人员提出了不小的挑战。计算机视觉的突出特点是多样性和不完善性,其多样性的一个重要原因便是成像系统的种类繁多,因此获取的输入信息可谓千差万别。另外,面对大量信息,如何进行有效的筛选,如何进行正确的解读,也是相当关键的问题。若只针对图像而

1

相关主题
文本预览
相关文档 最新文档