计算机视觉期末复习
- 格式:doc
- 大小:460.50 KB
- 文档页数:7
计算机视觉期末考试题及答案一、选择题1. 下列哪个是计算机视觉的基本任务?A. 物体识别B. 图像去噪C. 特征提取D. 图像压缩答案:A2. 图像分割的目标是什么?A. 将图像分成若干不重叠的区域B. 提取图像中的边缘和角点C. 对图像进行降噪处理D. 对图像进行缩放和旋转答案:A3. 下列哪个不属于计算机视觉中的特征提取方法?A. 边缘检测B. 霍夫变换C. SIFTD. 形态学操作答案:D4. 目标识别中最常用的算法是?A. 支持向量机(SVM)B. 卷积神经网络(CNN)C. 决策树D. 随机森林答案:B5. 计算机视觉中的光照问题指的是什么?A. 图像中的曝光问题B. 图像中的阴影和反射问题C. 图像中的亮度和对比度问题D. 图像中的色彩平衡问题答案:B二、填空题1. 图像的分辨率是指图像中的像素数量()图像的单位面积。
答案:除以2. 特征匹配算法中常用的匹配度量指标是()。
答案:距离3. 边缘检测算法中,经典的Sobel算子是基于()的。
答案:梯度4. 目标检测中的非极大值抑制是用来()。
答案:过滤掉重复的检测结果5. 目标跟踪中最常用的方法是()。
答案:卡尔曼滤波三、简答题1. 请简要解释计算机视觉中的图像金字塔是什么,并说明其应用场景。
答案:图像金字塔是一种多尺度表示的方法,通过对原始图像进行多次模糊和下采样,得到一系列分辨率不同的图像。
它的应用场景包括图像缩放、图像融合、目标检测等。
图像金字塔可以在不同尺度下对图像进行处理,以适应不同场景的需求。
2. 请简要介绍计算机视觉中的物体识别技术,并指出其挑战和解决方案。
答案:物体识别是指在图像或视频中自动识别出特定物体的技术。
其挑战包括光照变化、视角变化、遮挡等因素的影响。
解决方案包括利用深度学习方法进行特征提取和分类,使用数据增强技术增加训练数据,以及采用多模态融合的方法提高识别准确率。
3. 请简要解释计算机视觉中的图像分割技术,并说明常用的分割方法。
计算机视觉考试题及答案解析计算机视觉(Computer Vision),是研究如何使机器“看”的一门学科。
它涵盖了图像处理、模式识别、机器学习等多个领域。
作为计算机科学的重要分支之一,计算机视觉已经在各个领域得到了广泛的应用,包括人脸识别、图像搜索、无人驾驶等。
本文将介绍一些常见的计算机视觉考试题,并对答案进行解析。
一、选择题1.下列哪种方法可以实现图像分割?A. 边缘检测B. 直方图均衡化C. 图像降噪D. 全局阈值法答案:D。
图像分割是将图像划分为多个区域的过程,全局阈值法是一种常用的图像分割方法,通过设置一个合适的全局阈值,将图像中的像素分为两个类别。
2.计算机视觉中常用的特征描述子是什么?A. SIFTB. SURFC. HOGD. All of the above答案:D。
在计算机视觉中,SIFT(尺度不变特征变换)、SURF (加速稳健特征)和HOG(方向梯度直方图)都是常用的特征描述子,用于提取图像中的关键特征。
3.以下哪项不是深度学习在计算机视觉中的应用?A. 目标检测B. 图像分类C. 图像修复D. 人脸识别答案:C。
深度学习在计算机视觉中的应用非常广泛,包括目标检测、图像分类、人脸识别等,但不包括图像修复。
二、填空题1.卷积神经网络(CNN)是一种_________学习模型。
答案:深度。
2.在图像处理中,直方图均衡化是一种用于_____________的方法。
答案:增强图像对比度。
3.在目标检测中,R-CNN的全称是_________________。
答案:Region-based CNN。
三、解答题1.请简要解释计算机视觉中的目标跟踪是指什么?答:目标跟踪是指在连续的图像序列中,根据已有的目标位置信息,在下一帧图像中准确定位并跟踪目标的过程。
目标跟踪在视频监控、无人驾驶等领域中有着广泛的应用。
常用的目标跟踪方法包括基于特征的跟踪(如颜色、纹理等特征)和基于深度学习的跟踪(如Siamese网络、深度学习特征提取等)。
数字图像处理与计算机视觉复习Ace Nirvana整理第一章绪论1.1前言人类传递信息的主要媒介是语音和图像。
听觉信息20%,视觉信息>60%,其他(如味觉、触觉、嗅觉) <20%,“百闻不如一见”。
医学领域:1895年X射线的发现。
1.2数字图像处理的起源数字图像处理的历史可追溯至二十世纪二十年代。
最早应用之一是在报纸业,当时,引入巴特兰电缆图片传输系统,图像第一次通过海底电缆横跨大西洋从伦敦送往纽约传送一幅图片。
第一台能够进行图像处理的大型计算机出现在20世纪60年代。
数字图像处理的起源可追溯至利用这些大型机开始的空间研究项目,可以说大型计算机与空间研究项目是数字图像处理发展的原动力。
计算机断层是一种处理方法,在这种处理中,一个检测器环围绕着一个物体(或病人),一个X射线源,带有检测器的同心圆绕着物体旋转,X射线通过物体并由位于环上对面的相应的检测器收集起来,然后用特定的重建算法重建通过物体的“切片”的图像,这些切片组成了物体内部的再现图像。
计算机断层技术获得了1979年诺贝尔医学奖。
从20世纪60年代至今,数字图像处理技术发展迅速,目前已成为工程学、计算机科学、信息科学、统计学、物理、化学、生物学、医学甚至社会科学等领域中各学科之间学习和研究的对象。
如今图像处理技术已给人类带来了巨大的经济和社会效益。
不久地将来它不仅在理论上会有更深入的发展,在应用上亦是科学研究、社会生产乃至人类生活中不可缺少的强有力的工具。
1.3图像处理的应用意义(1)图像是人们从客观世界获取信息的重要来源人类是通过感觉器官从客观世界获取信息,即通过耳、目、口、鼻、手通过听、看、味、嗅和触摸的方式获取信息。
在这些信息中,视觉信息占60%~70%。
视觉信息的特点是信息量大,传播速度快,作用距离远,有心理和生理作用,加上大脑的思维和联想,具有很强的判断能力。
其次是人的视觉十分完善,人眼灵敏度高,鉴别能力强,不仅可以辨别景物,还能辨别人的情绪,由此可见,图像信息对人类来说是十分重要的。
西安电子科技大学2016-2017年度上学期期末考试《图像理解与计算机视觉》试题及答案学号:姓名:班级:1. 一幅图像的象素灰度级为256、大小为1024×1024的图象的数据量多少MB?假设网络的平均传输速率为1Mbit/s,需要多少秒才能传送完毕?每个像素可以用8比特表示。
解答:图像的数据量是1024×1024×8/8=1 MB,需要8 秒才能传送完毕。
2. 通过你对生活的观察,举出一个书本描述之外的图像处理应用的领域和例子。
解答:医院CT检查,等。
I f x y z t的各个参数的具体含义,反映的图像类型有多3. 请说明图像亮度函数(,,,,)少?解答:I f x y z t中,(x,y,z)是空间坐标,λ是波长,t 是时间,I 是图像数学表达式(,,,,)光点(x,y,z)的强度(幅度)。
上式表示一幅运动(t) 的、彩色/多光谱(λ) 的、立体(x,y,z)图像。
I f x y z t表示一幅运动(t) 的、彩色/多光谱(λ) 的、立体(x,y,z)图像。
对(,,,,)于静止图像,则与时间t 无关;对于单色图像(也称灰度图像),则波长λ为一常数;对于平面图像,则与坐标z 无关,故f(x,y)表示平面上的静止灰度图像,它是一般图像I f x y z t的一个特例。
(,,,,)4. 色彩具有哪几个基本属性,表述这些属性的含义。
解答:色相(H):色相是与颜色主波长有关的颜色物理和心理特性,它们就是所有的色相,有时色相也称为色调。
饱和度(S):饱和度指颜色的强度或纯度,表示色相中灰色成分所占的比例,用0%-100%(纯色)来表示。
亮度(B):亮度是颜色的相对明暗程度,通常用0%(黑)-100%(白)来度量。
5. 请解释马赫带效应。
解答:所谓“马赫带效应(Mach band effect)”是指视觉的主观感受在亮度有变化的地方出现虚幻的明亮或黑暗的条纹,马赫带效应的出现是人类的视觉系统造成的。
1、、。
;视觉是人类观察世界、认知世界的重要功能手段。
人类从外界获得信息约有80%来自视觉系统。
2、计算机视觉是指用计算机实现人类的视觉功能,即对客观世界中三维场景的感知、加工和理解。
计算机视觉的研究方法只有有两种:一种是仿生学的方法,参照人类视觉系统的结构原理,建立相应的处理模块完成类似的功能和工作;另一种是工程的方法,即从分析人类视觉过程的功能着手,并不刻意模拟人,视觉系统内部结构,而仅考虑系统的输入和输出,并采用任何现有的手段来实现系统的功能。
计算机视觉主要研究目标有两个:一是建立计算机视觉系统来完成各种视觉任务;二是把该研究作为探索人脑视觉工作机理的手段,即生物学机理。
3、计算机视觉系统的功能模块主要有以下几个模块:图像采集、预处理、基元检测、目标分割、表达描述、形状分析等,参考下图1.4.14、整个视觉过程是由光学过程,化学过程和神经处理过程这3个顺序的子过程所构成。
光学过程:我们需要掌握的是人眼水平截面的示意图,见图2.1.1。
光学过程基本确定了成像的尺寸。
类似照相机。
化学过程:视网膜表面的光接收细胞可分为:锥细胞(亮视觉)和柱细胞(暗视觉)。
化学过程,基本确定了成像的亮度或颜色。
神经处理过程:将对光的感觉转换为对景物的知觉。
视觉处理过程流图2.1,2如下:5、形状知觉是对景物各部分相对关系的知觉,也与视野中各种空间关系的知觉有关。
6、轮廓(封闭的边界)是形状知觉中最基本的概念,人在知觉一个形状以前一定先看到轮廓。
轮廓的构成如果用数学语言来说就是轮廓对应亮度的二阶导数。
轮廓与形状又有区别,轮廓不等于形状。
轮廓在帮助构成形状时还有“方向性”。
轮廓通常倾向于对它所包围的空间发生影响,即轮廓一般是向内部而不是向外部发挥构成形状的作用。
7、主观轮廓:在没有直接刺激作用下产生的轮廓知觉。
主观轮廓的形成是在一定感觉信息的基础上进行知觉假设的结果8、空间知觉的问题本质是一个深度感知的问题。
人对空间场景的深度感知主要依靠双目视觉实现。
机器视觉期末考试题及答案一、选择题(每题2分,共20分)1. 机器视觉中,图像采集卡的作用是什么?A. 存储图像数据B. 转换模拟信号为数字信号C. 处理图像数据D. 显示图像数据2. 在机器视觉系统中,边缘检测算法主要用于:A. 图像分割B. 图像增强C. 图像压缩D. 图像去噪3. 以下哪项不是机器视觉系统的基本组成部分?A. 光源B. 相机C. 镜头D. 打印机4. 机器视觉中的图像处理通常包括哪些步骤?A. 图像采集、图像预处理、特征提取、图像分析B. 图像采集、图像编码、图像解码、图像分析C. 图像采集、图像压缩、图像解压、图像分析D. 图像采集、图像存储、图像传输、图像分析5. 在机器视觉中,颜色空间转换的目的是什么?A. 改变图像大小B. 改变图像格式C. 改善图像质量D. 便于图像分析和处理6. 以下哪种算法不是用于图像分割的?A. 阈值分割B. 边缘检测C. 区域生长D. 直方图均衡化7. 机器视觉中,用于测量物体尺寸的方法是:A. 模板匹配B. 特征匹配C. 尺寸测量D. 形状识别8. 机器视觉系统中,相机的分辨率对图像质量的影响是:A. 分辨率越高,图像质量越差B. 分辨率越高,图像质量越好C. 分辨率与图像质量无关D. 分辨率越高,图像质量越不稳定9. 在机器视觉中,特征提取的目的是:A. 提高图像的分辨率B. 改善图像的对比度C. 提取图像中的关键信息D. 压缩图像数据10. 机器视觉在工业自动化中的应用包括:A. 质量检测B. 物体识别C. 尺寸测量D. 所有以上选项答案:1. B2. A3. D4. A5. D6. D7. C8. B9. C 10. D二、简答题(每题10分,共30分)1. 简述机器视觉在自动化生产线中的应用及其优势。
2. 解释什么是机器视觉中的图像预处理,并列举几种常见的图像预处理方法。
3. 描述机器视觉系统中相机标定的重要性及其基本步骤。
三、计算题(每题25分,共50分)1. 假设有一个机器视觉系统用于检测产品上的缺陷。
计算机视觉与图像识别考试(答案见尾页)一、选择题1. 计算机视觉中,哪种算法可以用于物体检测和定位?A. 卷积神经网络(CNN)B. 循环神经网络(RNN)C. 长短期记忆网络(LSTM)D. 支持向量机(SVM)2. 在计算机视觉中,以下哪种技术可以用于图像分割和目标识别?A. 主成分分析(PCA)B. 图像分割算法如阈值分割、区域生长等C. 阈值分割算法D. 生成对抗网络(GAN)3. 计算机视觉中的目标跟踪算法中,哪种算法是基于特征匹配的?A. K均值聚类B. 梯度下降法C. 基于特征的跟踪算法,如光流法、均值漂移等D.粒子滤波器4. 在计算机视觉中,哪种技术可以用于测量和识别图像中的距离和尺寸?A. 相机标定B. 三维重建C. 手眼协调(EHR)D. 图像分割5. 计算机视觉中的图像识别技术中,哪种技术可以用于识别图像中的物体和场景?A. 特征提取和匹配B. 深度学习中的卷积神经网络(CNN)C. 阈值分割D. 图像分割算法如区域生长等6. 在计算机视觉中,哪种技术可以用于从视频中提取关键帧?A. 光流法B. 运动估计C. 基于颜色的方法D. 人脸检测算法7. 计算机视觉中的图像恢复技术中,哪种技术可以用于去除图像中的噪声和干扰?A. 图像平滑滤波B. 图像锐化C. 图像变换D. 图像编码和解码8. 在计算机视觉中,哪种技术可以用于实现图像的超分辨率(提高图像的分辨率)?A. 双线性插值B. 高斯模糊C. 卷积神经网络(CNN)D. 实现图像超分辨率的技术通常不直接依赖于这些方法9. 计算机视觉中的场景理解技术中,哪种技术可以用于分析和理解图像中的内容及其上下文关系?A. 语义分割B. 实例分割C. 人脸识别D. 目标检测和识别10. 在计算机视觉中,哪种技术可以用于将二维图像转换为三维立体信息?A. 图像增强B. 图像变换C. 立体视觉技术D. 图像配准11. 计算机视觉中,以下哪个选项不是特征提取的方法?A. 边缘检测B. SIFT特征提取C. HOG特征提取D. K均值聚类12. 在图像识别中,以下哪个算法可以用于物体检测?A. SVMB. 随机森林C. YOLOD.深度学习中的Faster R-CNN13. 在计算机视觉中,以下哪种方法可以用于图像分割?A. K-means聚类B. 基于深度学习的方法,如FCNC. 图像处理技术,如阈值分割D. 阈值分割14. 计算机视觉中,以下哪个选项不是模式识别的方法?A. 支持向量机(SVM)B. 决策树C. 随机森林D. 神经网络15. 在图像识别中,以下哪种技术可以用于分类和回归?A. 支持向量机(SVM)B. 决策树C. 随机森林D. 深度学习中的神经网络16. 在计算机视觉中,以下哪种方法可以用于三维重建?A. 单目相机B. 双目相机C. 三目相机D. RGB-D相机17. 在图像识别中,以下哪种算法可以用于语义分割?A. 聚类算法,如K-meansB. 基于深度学习的方法,如U-NetC. 图像处理技术,如阈值分割D. 阈值分割18. 计算机视觉中,以下哪个选项不是图像恢复的方法?A. 伽马校正B. 直方图均衡化C. 噪点消除D. 局部修复19. 在计算机视觉中,以下哪种方法可以用于运动估计?A. 光流法B. 词袋模型(BoW)C. HOG特征D. 基于深度学习的方法,如Optical Flow20. 在图像识别中,以下哪种技术可以用于实时检测?A. 支持向量机(SVM)B. 决策树C. 随机森林D. 深度学习中的YOLO21. 计算机视觉中的图像处理技术主要包括哪些方法?A. 图像缩放B. 图像旋转C. 图像滤波D. 图像增强22. 在计算机视觉中,以下哪种算法可以用于目标检测和定位?A. K-means聚类算法B. 支持向量机(SVM)C. 霍夫变换D. 图像分割23. 计算机视觉中的深度学习方法有哪些?A. 卷积神经网络(CNN)B. 循环神经网络(RNN)C. 生成对抗网络(GAN)D. Transformer模型24. 在图像识别中,以下哪种技术可以提高识别准确率?A. 数据增强B. 激活函数C. 权重共享D. 正则化25. 计算机视觉中的目标跟踪算法主要有哪些?A. K均值算法B. 光流法C.均值漂移(Mean Shift)D. 模糊C均值聚类(FCM)26. 在图像处理中,以下哪种技术可以实现图像的锐化、去噪和增强?A. 图像平滑B. 图像锐化C. 图像增强D. 图像分割27. 计算机视觉中的特征提取和匹配技术在哪些应用场景中具有广泛应用?A. 自动驾驶B. 人脸识别C. 手写数字识别D. 医学影像分析28. 在计算机视觉中,以下哪种技术可以实现图像的立体匹配和三维重建?A. 形码技术B. 空时自适应处理(STAP)C. 协同式结构从运动(CSM)D. 图像缝合29. 计算机视觉中,哪种技术可以用于检测和识别图像中的物体?A. 特征匹配B. 深度学习C. 图像分割D.模式识别30. 在计算机视觉中,以下哪种方法可以用来对图像进行预处理?A. 清晰化B. 滤波C. 泛化D. 分类31. 计算机视觉中的目标检测与定位任务通常使用哪种算法?A. K-means聚类B. 支持向量机(SVM)C. 随机森林D. YOLO(You Only Look Once)32. 在计算机视觉中,以下哪种技术可以用于测量和跟踪物体的运动?A. 特征点检测B. 运动估计C. 图像恢复D. 图像增强33. 计算机视觉中的图像分割方法中,哪种方法可以实现基于像素值的精确分割?A. 阈值分割B. 区域生长C. 分水岭算法D. K-means聚类34. 在计算机视觉中,以下哪种技术可以用于识别图像中的文字?A. 文本检测B. 文本分类C. 文本生成D. 文本识别35. 计算机视觉中的深度学习模型中,哪种结构可以用于图像分类任务?A. 卷积神经网络(CNN)B. 循环神经网络(RNN)C. 长短期记忆网络(LSTM)D. 生成对抗网络(GAN)36. 在计算机视觉中,以下哪种技术可以用于从视频中提取关键帧?A. 光流法B. 目标检测C. 图像分割D. 视频稳定化37. 计算机视觉中的目标跟踪任务通常使用哪种算法?A. 霍夫变换B. 尺度不变特征变换(SIFT)C. 目标检测D. 运动估计38. 在计算机视觉中,以下哪种技术可以用于将图像中的物体转换为数字信号?A. 图像编码B. 图像解码C. 图像增强D. 图像滤波39. 计算机视觉中,以下哪个因素会影响到特征提取的准确性?A. 图像分辨率B. 图像亮度C. 图像噪声D. 图像角度40. 在人脸识别技术中,以下哪种算法被广泛应用?A. SVMB. K-均值聚类C. 深度学习D. 随机森林41. 在计算机视觉中,以下哪种方法可以用于测量距离?A. 卡尔·蔡司镜头B. 相位差方法C. 光学相机D. 超声波传感器42. 在图像识别中,以下哪种技术可以用于检测和识别物体?A. 深度学习B. 邻域搜索C. 阈值分割D. 图像滤波43. 在计算机视觉中,以下哪种方法可以用于图像恢复?A. 图像变换B. 图像编码和解码C. 图像增强D. 图像去噪44. 在人脸识别中,以下哪种算法可以实现活体检测?A. SVMB. K-均值聚类C. 深度学习D. 随机森林45. 在计算机视觉中,以下哪种技术可以用于视频分析?A. 图像处理B. 语音识别C. 自然语言处理D. 机器学习46. 在图像识别中,以下哪种技术可以用于分类和识别图像中的对象?A. 特征匹配B. 图像分割C. 图像编码和解码D. 深度学习47. 在计算机视觉中,以下哪种方法可以用于目标跟踪?A. 深度学习B. 光流法C. 匹配滤波器D. 规范化方法48. 在图像识别中,以下哪种技术可以用于场景理解?A. 图像分类B. 图像分割C. 基于知识的方法D. 深度学习二、问答题1. 计算机视觉中,什么是特征提取?请简述其特征提取的主要步骤。
第一章P11什么就是讣算机视觉- -■让计算机理解图像与视频P12讣算机视觉与图像处理得区别»数字图像处理图像/视频-〉图像/视频(图像变换、图像滤波、图像复原、图像压缩、…)>计算机视觉图像/视频-〉模型(二维基素图-〉2、5维要素图-〉三维模型表征)P14-20计算机视觉中存在哪些难点与挑战挑战:外观、卜小与形状;■姿态/运动;复杂与理预测得行为;噪声与遮挡汐卜观变化;上下文间依赖性;视点变化P23-28图像中存在哪些计算机视觉线索深度线索:直线透视;空间透视远近顺序线索:遮挡形状线索:纹理梯度形状与光照线索:阴影位置与光照线索:投影P30-46讣算机视觉有哪些典型应用OCR (光学字符识別)、智能交通、人脸检测、表情识别、多视点三维重建、基于视觉得生物识另U、辅助驾驶、无人驾驶汽车、基于视觉得人机交互、智能机器人、匸业机器人P48 CCD/CMOS传感器得成像原理:尤绘转换P49-54采样与量化影响图像得哪些属性采样影响图像空间分辨率;量化影响图像幅度分辨率(灰度)P61图像坐标系左上角为坐标原点P75-78像素距离与邻域关系习題1、2 P19汁算机视觉要达到得目得有哪些?答:计算机通过图像与视頻对客观世界得感烁识別与理解;对场景进荷耨与描述;根据对场景得解释与描述制定行为规划.第三章PM薄透镜成像模型薄透镜模型/:焦距瓦F:焦点xwhere and12P17-21射影几何中哪些物理信息丢失•与保留了?丢失信息:长度、角度 保留信息疽线特性、交比 不变性 P22-24灭点打火线得概念场景中得平行线投影到图像平而后,会聚于“灭点”灭线:火点得集合P46-49像机成像过程中包含了哪些内参与外参?像机内参和外参: 一般化形式£■//(血 & • d»像机内参和外参:般化形式像机内部参数(内参)像机外部参数(外參)Z 叭0] 0 A Vo i 0 00 1 loj示〃轴和诸由的不垂直因子。
计算机图形学期末复习第一章绪论●名词解释:图形、图像、点阵法、参数法。
图形:是指能够在人的视觉系统中形成视觉印象的客观对象。
点阵法:是具有灰度或颜色信息的点阵来表示图形的一种方法,它强调图形有哪些点组成,这些点具有什么灰度或色彩。
图形包括哪方面的要素参数法:是以计算机所记录的图形的形状参数与属性参数来表示图形的一种方法。
把参数法描述的图形叫做图形;把点阵法描述的图形叫做图像。
●图形包括哪两方面的要素,在计算机中如何表示它们?图形的要素可以分为两类,一类是刻画形状的点、线、面、体等几何要素;另一类是反应物体本身固有属性,如表面属性或材质的明暗、灰度、色彩(颜色信息)等非几何要素。
在计算机中表示带有颜色及形状的图和形常用两种方法:点阵法和参数法。
●什么叫计算机图形学?分析计算机图形学、数字图像处理和计算机视觉学科间的关系。
计算机图形学是研究怎样利用计算机来显示、生成和处理图形的原理、方法、和技术的一门学科。
计算机图形学试图将参数形式的数据描述转换生成(逼真的)图像。
数据图像处理则着重强调图像之间进行变换,它旨在对图像进行各种加工以改善图像的视觉效果,计算机视觉是研究用计算机来模拟生物外显或宏观视觉功能的科学和技术,它模拟对客观事物模式的识别过程,是从图像到特征数据对象的描述表达处理过程。
●有关计算机图形学的软件标准有哪些?标准有:计算机图形核心系统(GKS)及其语言联编、三维图形核心系统(GKS-3D)及其语言联编、程序员层次交互式图形系统(PHIGS)及其语言联编、计算机图形元文件(CGM)、计算机图形接口(CGI)、基本图形转换规范(IGES)、产品数据转换规范(STEP)等。
●试发挥你的想象力,举例说明计算机图形学有哪些应用范围,解决的问题是什么?近年来计算机图形学已经广泛地用于多种领域,如科学、医药、商业、工业、政府部门、艺术、娱乐业、广告业、教育和培训等。
第二章计算机图形系统及图形硬件●名词解释:刷新、刷新频率、像素点、屏幕分辨率、位平面、屏幕坐标系。
计算机视觉课程期末项目及总结报告目录目录 (1)摘要 (3)一、基于深度学习的视觉技术 (4)1.深度学习的计算机视觉技术发展前沿动态 (4)1.1研究方向上的前沿动态 (4)1.2研究的技术领域的前沿动态 (6)1.3研究的关键技术的前沿动态 (9)1.4小结 (11)2.基于深度学习的三维重建问题研究技术的分析 (12)2.1三维重建技术研究领域的研究综述 (12)2.1.1基于主动视觉的三维重建技术 (12)2.1.2基于被动视觉的三维重建技术 (14)2.2三维重建技术研究中要解决的关键技术问题 (15)2.2.1运动恢复结构法(Structure from motion) (15)2.2.2机器学习法 (16)2.3研究工作的思想原理以及关键技术细节 (17)2.4实现的主要过程以及技术细节 (18)2.4.1网络架构 (18)2.4.2损失函数 (18)2.5研究的难点以及未来研究的改进策略 (19)2.5.1难点解决方案 (19)2.5.2未来研究改进策略 (20)2.6小结 (20)二、计算机视觉的综述 (21)1.计算机视觉的基础综述 (21)1.1生物理论基础——人类视觉系统 (21)1.2颜色模型 (21)2.计算机视觉的内容综述 (22)2.1低层视觉 (22)2.2中层视觉 (24)2.3高层视觉 (26)3.计算机视觉技术中传统研究方法与智能的深度学习方法的区别与联系 (27)3.1两者的本质区别 (27)3.2无法替代的计算机视觉技术中传统研究方法 (28)3.3计算机视觉技术中深度学习研究方法优势 (28)4.现有计算机视觉技术的发展动态 (29)5.计算机视觉技术发展的前沿科学问题 (29)5.1边缘计算 (29)5.2点云物体识别 (29)5.3融合现实 (30)5.4实例分割 (30)6.小结 (31)Reference ................................................................................................... 错误!未定义书签。
一、1.什么是计算机视觉?理解计算机视觉问题的产生原理。
研究用计算机来模拟生物视觉功能的技术学科。
具体来说,就是让计算机具有对周围世界的空间物体进行传感、抽象、分析判断、决策的能力,从而达到识别、理解的目的。
2.直方图的均衡化处理的“中心思想”是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布。
直方图均衡化就是对图像进行非线性拉伸,重新分配图像像素值,使一定灰度范围内的像素数量大致相同。
直方图均衡化就是把给定图像的直方图分布改变成“均匀”分布直方图分布。
是将原图像通过某种变换,得到一幅灰度直方图更为均匀分布的新图像的方法。
设图像均衡化处理后,图像的直方图是平直的,即各灰度级具有相同的出现频数,那么由于灰度级具有均匀的概率分布,图像看起来就更清晰了。
二、 1.常见的几何变换:平移T x 为点(x ,y )在x 方向要平移的量。
旋转 变尺度:x 轴变大a 倍,y 轴变大b 倍。
2.卷积掩膜技术:(,)(,)(,)(,)m n f i j h i m j n g m n =--∑∑ 对应相乘再相加 掩膜的有效应用——去噪问题3. 均值滤波器(低通):抑制噪声 主要用于抑制噪声,对每一个目标像素值用其局部邻域内所有像素值的加权均值置换。
con 命令高斯滤波器:一个朴素的道理,距离目标像素越近的点,往往相关性越大,越远则越不相干。
所以,高斯滤波器根据高斯函数选择邻域内各像素的权值 medfilt1 。
区别方法是:高通滤波器模板的和为0,低通滤波器模板的和为1常用的非线性滤波器:中值滤波;双边滤波;非局部滤波 4.边缘检测算子:通过一组定义好的函数,定位图像中局部变换剧烈的部分(寻找图像边缘)。
主要方法有:Robert 交叉梯度,Sobel 梯度,拉普拉斯算子,高提升滤波,高斯-拉普拉斯变换(都是高通滤波器)Canny 边缘检测 算法步骤:1. 用高斯滤波器平滑图像.2. 用一阶偏导有限差分计算梯度幅值和方向.3. 对梯度幅值进行非极大值抑制 .4. 用双阈值算法检测和连接边缘.5.分割(大题 伪码?)(1)经典方法是基于灰度阈值的分割方法 *介绍单值阈值,它把一幅灰度图像转换成二值图像 *求T 的常用的方法是求解灰度直方图中的双峰或者多峰,并以两峰之间的谷底作为阈值。
*全局阈值是指整幅图像使用同一个阈值做分割处理,并产生一个二值图,区分出前景对象和背景。
适用于背景和前景对比度大的图像算法实现:-- 选取一个合适的阈值T ,逐行扫描图像– 凡灰度级大于T 的,颜色置为255;凡灰度级小于T 的,颜色置为0(2)自适应阈值:解决单值阈值无法工作的一个方法是将图像分割为子图像,并分别进行阈值化处理6.Hough 变换:可用于将边缘像素连接起来得到边界曲线,主要优点在于受噪声和曲线间断的影响较小(鲁棒性好)⎩⎨⎧≤>=Ty x f T y x f y x g ),( 0),( 1),(如果如果1100cos sin 0[1][1]sin cos 0001x y x y θθθθ-⎛⎫ ⎪= ⎪ ⎪⎝⎭110000[1][1]0000a x y x y b ab ⎛⎫ ⎪= ⎪ ⎪⎝⎭(,)1[,][,]k l N h i j f k l M ∈=∑⎪⎪⎪⎭⎫ ⎝⎛=1010001]1[]1[0011y x T T y x y x这意味着:原图像空间中的每条直线在参数空间中都对应一个点。
如果一幅图像中存在某一条直线,那么对应参数空间中,某个点一定被击中较多次。
但是如果采用表示直线,不能表示水平和竖直的情况。
将其转换为θθsi n cos y x s +=Hough 变换就没有了限制。
直线还会变成单个点。
参数空间的坐标变成了s ,θ7.拓扑描述(应用?)区域的拓扑描述用于描述物体平面区域结果形状的整体性。
也就是说,只要图形不撕裂或者折叠,拓扑描述的性质就不会受到图形变形的影响。
常用的特性有:(1)孔: 如果一个封闭的区域内,其不包含我们感兴趣的像素,则成为此区域为图像的孔洞,用H 表示。
(2)欧拉数EUL :在图像中,图像中所有对象的总数C 与孔洞数相减,为欧拉数。
EUL=C-H在Matlab 中,采用bweuler 计算二值图像的欧拉数。
三、1.角点: 是景物轮廓线上曲率的局部极大点,是物体边缘拐角所在的位置点,对掌握景物的轮廓特征具有决定作用。
一旦找到了景物的轮廓特征点也就大致掌握了景物的形状。
Moravec 角点算子是最早的角点算子颜色特征:属于图像的内部特征,它描述了图像或者图像一部分区域。
颜色特征和线段,角点特征比起来,对于尺寸,方向,突变等不敏感,因此颜色特征被用于图像识别,检索。
颜色矩和颜色直方图颜色矩:以数字方法为基础,通过计算矩来描述颜色的分布,一般来说在RGB 空间,由于颜色分布主要集中在低阶矩,因此常采用一阶矩、二阶矩等表达颜色的分布纹理特征:描述的是对图像区域内的内容变化进行量化,捕捉那种具有周期性,规律性的变化。
例如粗糙度,光滑度,颗粒度,随机性和规范性。
如灰度差统计,自相关函数,灰度更生矩阵和基于频谱特征的分析法。
灰度共生矩阵就是通过研究灰度在空间相关性来描述纹理的常用方法。
????形状特征?尺度空间理论2.排污口检测(大题):具体检测的思路有两种:第一种:间接阈值法step1: 通过大量采样,在晴天、阴天、多云、大雾的天气条件下,分别选定天空和海水的一块区域,分别在此区域内统计海水和天空的饱和度并求均值;step2: 根据上述得到的海水的饱和度设置阈值。
具体阈值的设定方法必须依据天空的饱和度,因为海水的饱和度与天气直接相关。
例如,在晴天的条件下,统计得到的天空的平均饱和度,记为sky_threshold ,并根据sky_threshold 从大量统计数据中确定一个饱和度的取值范围,例如从 M 到N ,海水的平均饱和度记为sea_threshold ,也就是污水的饱和度阈值step3: 当摄像头每次循环获取到当前帧图像时,按照step1中的方法,分别从天空和海水区域分割出一幅子图,统计并计算出二者饱和度的均值,然后进行判断;step4: 当step3中得到的天空的饱和度处于 M 到 N 的范围,就以sea_threshold 作为污水的阈值,如果step3中得到的海水的平均饱和度低于sea_threshold ,就认为海水被污染了,启动报警系统发出警报,否则继续执行step3,直到系统关闭;第二种:直接阈值法step1:采集大量样本图片,不考虑天气因素;step2:在海水区域,在排污口附近分割出一幅子图,并统计饱和度,记为s1;step3:在远离排污口处分割出一幅相同大小的子图,并统计饱和度,记为s2(也可以设置一个经验阈值);step4:计算两个饱和度的差值记s = s1 - s2,然后根据多次试验,求多组s 的平均值,作为污水的阈值,记threshold;step4之后,摄像头每次获取的当前图片重复上述操作,当计算得到的饱和度差值大于threshold时,认为排污口正在排污,启动报警系统发出警报。
3.熵熵是图像所具有的信息量的度量,纹理信息也属于图像的信息,是一个随机性的度量,当共生矩阵中所有元素有最大的随机性、空间共生矩阵中所有值几乎相等时,共生矩阵中元素分散分布时,熵较大。
它表示了图像中纹理的非均匀程度或复杂程度。
若灰度共生矩阵值分布均匀,也即图像近于随机或噪声很大,熵会有较大值。
4.Sift特征// 步骤?a) SIFT特征是图像的局部特征,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性。
b) 独特性(Distinctiveness)好,信息量丰富,适用于在海量特征数据库中进行快速、准确的匹配。
c) 多量性,即使少数的几个物体也可以产生大量SIFT特征向量。
d) 高速性,经优化的SIFT匹配算法甚至可以达到实时的要求。
e) 可扩展性,可以很方便的与其他形式的特征向量进行联合5.均值漂移:是一种有效的统计迭代算法。
是一种基于密度梯度上升的非参数方法,通过迭代运算找到目标位置,实现目标跟踪。
它显著的优点是算法计算量小,简单易实现,适合于实时跟踪场合;但是跟踪小目标和快速移动目标时常常失败,而且在全部遮挡情况下不能自我恢复跟踪。
通过实验提出应用核直方图来计算目标分布,证明了均值漂移算法具有很好的实时性特点Mean Shift特性四、1.人工智能:AI。
它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
它企图了解人类与机器智能的实质,并生产出一种能以人类智能相似的方式做出反应的智能机器。
2.机器学习:通过算法使得机器从大量的历史数据中习得规律,从而对新的数据样本做智能识别或预测未来。
机器学习主要分为符号主义学习(以决策树模型与相关算法为代表)、连接主义学习(以神经网络模型...)与统计学习(以支持向量机...)3.机器学习按照学习的方式:1.监督学习:一种典型的机器学习方法。
利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程。
监督学习相当于有人在旁边看着算法学习(实际上利用两组已经标定好的正样本和负样本去实现),随时纠正学习中的错误。
纠正的方式就是对于错误的学习给予惩罚(例如降低权值),直到训练得到的模型达到目标识别率。
2.非监督学习:在未加标签的数据中(没有正负样本集合了),试图找到隐藏的结构。
因为提供给学习者的实例是未标记的,因此没有错误或报酬信号来评估潜在的解决方案。
典型算法为K-means算法。
3.强化学习:不同于监督学习一开始就提供带标签的学习数据集合,强化学习中由环境提供学习好坏作的评价(通常为一个回报函数),RL系统靠获得的反馈不断的获得知识并改进学习方案,从而进行自身学习。
典型的算法:Agent技术。
4.深度学习:概念源于人工神经网络的研究。
是一种多隐式层的神经网络。
通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
相互关系人工智能机器学习神经网络简述每个4.贝叶斯方法(大题)(概率图模型)算题:P(A|B)表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件的条件概率。
(通常用)•注意:朴素贝叶斯算法是假设各个特征之间相互独立。
举例:一座别墅在过去的20 年里一共发生过2 次被盗,别墅的主人有一条狗,狗平均每周晚上叫 3 次(A),在盗贼入侵(B)时狗叫的概率被估计为0.9,问题是:在狗叫的时候发生入侵的概率是多少?答:我们假设A 事件为狗在晚上叫,B 为盗贼入侵,我们现在要估计的是P(B|A)。
则以天为单位统计,P(A) = 3/7,P(B) = 2/(20*365) = 2/7300,P(A|B) = 0.9,按照公式很容易得出结果:P(B|A) = 0.9*(2/7300)/(3/7) = 0.000585.聚类:聚类分析是在数据中发现数据对象之间的关系,将sj进行分组,组内的相似性越大,组间的差别越大,则聚类效果越好。