计算机视觉发展史
- 格式:ppt
- 大小:1.73 MB
- 文档页数:40
自动识别技术的发展历史.自动识别技术是指利用计算机视觉、图像处理、模式识别等相关技术,实现对物体、文字、声音等信息自动识别的技术。
随着科学技术的发展,自动识别技术经历了漫长的发展历程,取得了重要的进展和突破,为人们的生活和工作带来了诸多便利。
本文将从历史的角度,探讨自动识别技术的发展历程。
1. 二十世纪初至四十年代:电报、电话和雷达的发展早在二十世纪初,人类就开始利用电报技术进行信息传输,这可以看作是自动识别技术的雏形。
随着通信技术的不断发展,电话和雷达技术的出现,人们开始尝试利用声音和电波进行识别和跟踪,为今后自动识别技术的发展奠定了基础。
2. 五十年代至七十年代:光学字符识别(OCR)和条形码技术的兴起在这一时期,光学字符识别(OCR)和条形码技术成为了自动识别技术的重要代表。
光学字符识别技术可以将印刷或手写的文字转换为数字代码,实现文字信息的自动识别和处理,为图书馆、档案管理等领域提供了便利。
条形码技术的广泛应用也大大提高了商品和物流信息的自动识别和管理效率,为商业和物流行业带来了巨大的变革。
3. 八十年代至九十年代:计算机视觉和模式识别技术的快速发展随着计算机技术的飞速发展,计算机视觉和模式识别技术开始受到重视。
计算机视觉技术可以利用摄像头捕捉物体的图像,并通过图像处理和分析,实现对物体的识别和跟踪。
模式识别技术在语音识别、手写识别、人脸识别等方面取得了重要进展,为自动识别技术的广泛应用打下了基础。
4. 二十一世纪至今:深度学习和人工智能的崛起进入二十一世纪,深度学习和人工智能技术开始快速崛起,为自动识别技术的发展带来了全新的机遇和挑战。
深度学习技术可以通过训练神经网络,实现对复杂数据的自动分析和识别,为图像识别、语音识别、自然语言处理等领域带来了重大突破。
人工智能技术的不断进步也推动了自动驾驶、智能家居、智能机器人等领域的快速发展,将自动识别技术推向了一个新的高度。
总结来看,自动识别技术经历了从简单的传输识别到复杂的图像处理和深度学习的漫长发展历程。
计算机图形图像技术发展历史概述计算机图形图像技术是计算机科学和图形学领域的重要分支,它涵盖了计算机生成的图像、图形处理和图形显示等各个方面。
随着计算机技术的飞速发展,图形图像技术也经历了多个阶段的演进和变革。
本文将对计算机图形图像技术的发展历史做一个概述。
一、1950-1960年代:计算机图形学的起步阶段在计算机诞生的早期阶段,由于计算能力有限,计算机图形学的发展非常有限。
1950年代,人们开始尝试使用计算机生成一些简单的图形,如直线、圆等。
而在1960年代,随着计算机硬件、软件以及算法的不断改进,计算机图形学逐渐得到了更多的关注和发展。
二、1970-1980年代:基础算法的提出与优化在1970年代,Bresenham提出了著名的Bresenham算法,这个算法可以高效地画出一条给定斜率的直线,其被广泛应用于计算机图形学中。
同时,随着处理器速度的提高以及内存容量的增加,计算机图形学得以取得更大的突破。
在1980年代,人们开始研究曲线和曲面的绘制算法,并取得了一定的成果。
三、1990年代:三维图形学的兴起进入1990年代,随着计算机性能的进一步提升,三维图形学逐渐兴起并得到了广泛应用。
同时,图形处理单元(GPU)的问世也推动了三维图形学的发展。
人们能够生成更加逼真的三维模型,模拟现实世界中的光照、材质等效果,为电影、游戏等行业带来了巨大的进步。
四、2000年代:计算机动画技术的突破2000年代,计算机动画技术取得了重大突破。
随着硬件设备和软件工具的不断创新,计算机动画的制作变得更加容易和高效。
人们开始利用计算机生成更加生动、逼真的动画效果,并应用于电影、广告等领域。
此外,虚拟现实技术也在这一时期得到了快速发展,使用户能够沉浸在虚拟的三维环境中。
五、2010年代至今:计算机视觉和人工智能的融合进入2010年代,计算机视觉和人工智能的迅速发展为计算机图形图像技术带来了新的机遇和挑战。
通过人工智能算法的引入,计算机能够更加准确地识别和分析图像中的内容,并进行智能化的图像处理。
cv 模型发展史
CV(计算机视觉)模型发展至今已经经历了几个重要的里程碑和发展阶段。
以下是CV模型的发展史(CV模型是指用来处理和分析图像和视频数据的计算机算法和模型):
1. 传统图像处理阶段(20世纪70-80年代):
在这个阶段,CV模型主要依赖于传统的图像处理技术。
常使用的算法包括边缘检测、图像分割和特征提取。
传统的图像处理算法集中在低级的像素级和几何级处理,忽视了语义级别的理解。
因此,这时的CV模型对于复杂的图像任务表现有限。
2. 统计模型和机器学习阶段(20世纪90年代-2000年代):
随着机器学习和统计学的发展,CV模型开始使用统计和机器学习方法来解决图像识别和分类问题。
常用的模型包括SVM、决策树和随机森林等。
这些模型为CV模型提供了更强的泛化能力和灵活性,使其在一些基本的视觉任务上取得了较好的结果。
3. 深度学习阶段(2010年代至今):
随着深度学习技术的兴起,CV模型进入了一个新的阶段。
通过使用深度神经网络,CV模型能够自动从原始图像数据中学习有关特征的表示,并能够在目标识别、物体检测和图像分割等任务中取得令人瞩目的结果。
卷积神经网络(CNN)是CV模型中最常用的深度学习架构之一。
总体而言,CV模型的发展经历了从传统图像处理到机器学习和统计模型再到深度学习的演进过程。
随着硬件的发展和数据集的扩大,CV模型在图像识别、物体检测和图像分割等领域的性能不断提升,为我们提供了更多有关图像和视频数据的深层次理解和分析能力。
视觉技术的发展历史一、引言视觉技术是指通过人眼和视觉系统来感知、处理和解释图像和视频的能力。
随着科技的进步,视觉技术在过去几十年中取得了巨大的发展。
本文将从早期的发展开始,逐步介绍视觉技术的历史。
二、早期视觉技术早期的视觉技术主要依赖于人眼的观察和解释。
人们通过肉眼观察和分析图像,来获取信息和认识世界。
然而,这种方法存在一定的局限性,因为人眼的感知能力有限,并且受到主观因素的影响。
三、相机的出现19世纪,相机的发明为视觉技术的发展带来了重要的突破。
通过相机,人们可以将现实世界中的图像捕捉下来,并通过胶片或感光元件记录下来。
这样,人们可以通过观察照片来获取更准确和客观的信息。
四、电视的兴起20世纪,电视的发明进一步推动了视觉技术的发展。
电视技术利用电子器件将图像信号转换为电信号,并通过屏幕显示出来。
电视的出现不仅让人们可以观看远距离的事件,还为电影、广告和新闻等媒体提供了新的传播方式。
五、计算机图形学的发展20世纪60年代,计算机图形学的出现为视觉技术的发展带来了革命性的变化。
计算机图形学利用计算机来生成和处理图像,使得人们可以通过计算机程序来创造和编辑图像。
这一技术的出现不仅在电影和游戏等领域有着巨大的应用,还为后来的计算机视觉技术的发展奠定了基础。
六、计算机视觉的崛起20世纪80年代以后,计算机视觉技术开始迅速发展。
计算机视觉利用计算机和相机等设备来模拟人类视觉系统,实现图像的感知、分析和理解。
这一技术的应用非常广泛,包括人脸识别、图像检索、自动驾驶等领域。
七、深度学习的应用近年来,深度学习技术的兴起为计算机视觉带来了新的突破。
深度学习利用神经网络来模拟人脑的学习和识别能力,可以自动学习和提取图像特征。
这一技术的应用使得计算机视觉技术在图像分类、目标检测、图像生成等方面取得了显著的进展。
八、虚拟现实和增强现实技术虚拟现实和增强现实技术是近年来视觉技术的又一重要发展方向。
虚拟现实技术通过头戴式显示器等设备,将用户完全沉浸于虚拟的环境中。
人脸识别发展史——
人脸识别技术是一项具有里程碑意义的计算机视觉技术,在不同应用领域发挥着重要的作用,发展至今已有相当长的历史,它的发展史可以分为以下几个时期:
第一个时期,从1970年到1980年,是人脸识别技术的发展的初期,在这一时期,计算机视觉技术正式被引入,人脸识别技术也随之而来,比较完善的人脸识别系统诞生。
主要技术包括粗略的比较、局部特征提取、人脸融合技术以及模板匹配技术等。
第二个时期,从1980年至1990年,是人脸识别技术的成熟时期,在这一时期,随着计算机视觉技术的迅速发展,相关算法技术也逐渐完善,各种机制相继出现,人脸识别系统也取得了较大的进展。
主要技术包括三维人脸模型技术、神经网络技术以及自适应技术等。
第三个时期,从1990年到2000年,是识别技术由查找转为验证的时期,在这一时期,由于计算机性能的飞速发展,大量新理念和新技术的出现,人脸识别系统可以实现基于特征的验证,大大提高了识别的准确率和效率。
主要技术包括展开验证技术、识别准确率技术、人脸检测技术和自动优化技术等。
第四个时期,从2000年至今,是人脸识别技术全面发展的时期,在这一时期。
计算机视觉简史计算机视觉(ComputerVision)一词源于1960年代,指的是利用计算机技术来识别、理解和分析图像内容的技术,它与深度学习和机器学习有着千丝万缕的关系。
至今,计算机视觉技术已经广泛应用于医学影像诊断、安防监控、面部检测以及自动驾驶等领域。
往事是新的。
计算机视觉的发展史可追溯到1700年前的古希腊,当时的古希腊哲学家伊壁鸠鲁提出了“视觉识别(Visual Recognition)”的概念,这为计算机视觉技术奠定了基础。
在20世纪50年代,IBM、Carnegie Mellon大学和MIT实验室等研究机构相继开始将线性代数和概率论等数学知识应用到计算机视觉领域,以建立图像识别的基础框架。
1960年,IBM的科学家米利贝尔和亚历山大金林斯利合著了《计算机图像处理机器看图》( Machine Perception of Three-Dimensional Solids)一书,此书是第一本专门介绍计算机视觉技术的著作,从而使计算机视觉这一概念被众人所熟知。
在20世纪70年代,随着数字处理技术和数字图像处理技术不断发展,计算机视觉技术也在成长。
1979年,IBM研究室的研究员费希尔(R.M.Fisher)提出了聚类分析方法,这一算法可以有效地用来识别图像中特定的物体。
1980年,计算机图形学研究领域发展迅猛,大量的图形分析算法被提出,这为计算机视觉提供了大量的支持,使它的应用领域可以进一步扩大。
20世纪90年代,随着数字图像处理技术的进一步发展,计算机视觉技术也在不断成熟,其中特别是当时刚刚被提出的深度学习算法为计算机视觉技术的发展做出了重大贡献。
在21世纪初,随着云计算技术、大数据技术和机器学习技术的飞速发展,计算机视觉技术也有了飞跃式的进步,它与深度学习和机器学习的结合让计算机视觉具备了更强的分析能力,使它在医学影像诊断、安防监控、面部检测以及自动驾驶等领域有了广泛的应用。
至此,计算机视觉发展史从古希腊哲学家伊壁鸠鲁到IBM研究室的研究员费希尔,再到深度学习算法,它们充分说明了计算机视觉技术在过去几个世纪中经受考验,并取得了长足进步。
机器视觉的概念一、发展历史机器视觉起源于1951年Neumann用计算机分析二维图像;20世纪60年代ROBERT分析三维图像;随着电视摄像技术与计算机技术发展而于20世纪70年代中后期发展。
1975年第一次出现计算机视觉(Computer Vision,CV)这个概念。
1977年美国麻省理工David Marr教授提出机器视觉理论后得到较大发展,把视觉分为三个层(即目标与策略、表示与算法、硬件的实现),在理论方面分为三个层次(低中高分别对应于2、2.5、3维空间)。
由此机器视觉开始进入大发展时期,各种理论层出不穷,推动着技术的进步。
玖瑞科技(LOOKSMART)也于2012年进入机器视觉领域。
二、概念与特点机器视觉(Machine Vision,MV)常常也称之为计算机视觉(Computer Vision,CV),这是一对互相联系又有区别的一对概念。
广义地来讲,区别不大,两者都是指使用计算机和数字图像技术对客观事物图像进行理解、分析、处理和控制,故很多场合两者相互混淆使用,不加区分。
机器视觉(LOOKSMART)包括其字面的意思,即“视(LOOK)”和“觉(SMART)”两部分。
“视”就是看的到、看的清。
“觉”就是理解、分析、处理,就是看的明白。
合起来就是通过机器来获取数学意义上的清晰图像,并对图像进行理解、分析和处理,用于展示、控制等,即LOOKSMART,和玖瑞科技非常贴切。
机器视觉有以下特点:1、机器视觉技术是一项综合技术,包括但不限于数字图像理解分析及处理技术、机械工程技术、电气控制技术、电光源照明技术、光学成像技术、数据传输存贮及控制技术、传感器技术、模拟及数字视频技术、计算机软硬件技术、人机接口技术等,这些技术综合运用、相互协调才能成功构造出机器视觉应用系统。
2、机器视觉技术是一门实用的技术,其要求包括但不限于对工业现场恶劣环境的适应、通用的工业接口、要求不太高的现场工人操作、较强的容错能力和安全性,较强的鲁棒性,以及客户能接收的较低成本(经济性),这些要求均要全部满足才能为客户所接收。
计算机视觉研究综述计算机视觉是一门研究如何让计算机从图像或视频中获取信息、理解内容并作出决策的科学。
近年来,计算机视觉领域的研究和应用取得了显著进展,成为发展的重要方向之一。
本文将对计算机视觉领域的研究现状进行综述,介绍其发展历史、现状、热点问题、挑战以及未来发展方向。
一、发展历史与现状计算机视觉的研究可以追溯到20世纪50年代,但直到近年来,随着深度学习技术的快速发展,计算机视觉领域才取得了突破性的进展。
目前,计算机视觉领域的研究热点主要集中在图像分类、目标检测、图像分割、姿态估计、行为识别等方面,其应用场景涵盖了安防、医疗、自动驾驶、智能物流等领域。
二、图像处理与特征提取图像处理是计算机视觉领域的基础,其研究内容包括图像预处理、增强、变换等。
随着深度学习技术的发展,卷积神经网络(CNN)成为了图像处理的重要工具,能够自动学习图像的特征表达。
在特征提取方面,研究者们设计了许多手工制作的特征提取方法,如SIFT、SURF等,但近年来,深度学习方法尤其是卷积神经网络在特征提取方面已经取得了很大的成功。
三、机器学习与深度学习机器学习是计算机视觉领域的重要支撑技术,尤其是深度学习在图像分类、目标检测、图像分割等方面取得了重大突破。
卷积神经网络作为深度学习的重要代表,已经从基本的CNN模型发展出了许多改进和变种,如VGG、ResNet、Inception等。
此外,研究者们还提出了许多新型网络结构,如残差网络(ResNet)、注意力机制网络(Attention Net)等,以解决深度神经网络训练中的难题。
四、挑战与未来发展计算机视觉领域目前还存在许多问题和挑战,例如:如何提高模型的泛化能力,如何处理复杂场景和光照条件下的图像识别问题,如何实现跨模态的视觉理解等。
未来计算机视觉领域的发展将朝着以下几个方向进行:1、可解释性和透明性:未来的计算机视觉模型需要能够解释其决策过程和结果,以提高用户对模型的信任程度。
计算机视觉简史计算机视觉(Computer Vision)是一门连接计算机科学与人工智能的跨学科领域,利用数字图像及其处理技术,使计算机能够理解和解释对整个世界的视觉信息。
随着科技的发展,计算机视觉得到了广泛的应用和发展,下面我们一起回顾计算机视觉的简史。
1.1957年,形态学理论的提出。
德国神经解剖学家W.S.McCulloch和数学家W.Pitts提出了感知器模型。
这种模型是基于模拟人类大脑工作原理的模型,是计算机视觉技术的基础。
2.1960年代,视觉技术的起源。
人们开始尝试通过数字化图像处理实现自动检测、分类和识别图像等。
当时的计算机视觉技术只能处理简单的线条和点,难以应用于复杂的图像处理。
3.1970年代,框架式的计算机视觉。
这个时期出现了一种比较流行的计算机视觉框架,其核心理论是特征提取和匹配。
这种方法可用于图像的识别和匹配。
4.1980年代,立体视觉的发展。
计算机视觉研究领域的关键突破之一是立体视觉,这可用于计算图像中物体的三维位置。
在这个领域,发展出了基于视差计算的算法和基于区域匹配的算法。
5.1990年代,基于模型的计算机视觉。
这个时期的计算机视觉研究主要是基于模型的方法,即采用基于模板匹配、形状分析或纹理分析等算法。
但是,该方法也面临着对数据量、物体型号和摄像机视角等要求较高的问题。
6.2000年代至今,深度学习的兴起。
随着深度学习技术的发展,计算机视觉技术也得到了重大突破。
基于深度学习的计算机视觉方法更加高效、准确和灵活。
现在,计算机视觉被广泛应用于人脸识别、视频监控、自主驾驶、智能医疗以及虚拟现实等领域。
总之,计算机视觉的发展历经多个阶段,从最初的感知器模型到现在的基于深度学习技术的方法,计算机视觉技术不断推动着科技的发展和变革。
一个更加高效、精准、智能的计算机视觉系统,将是未来的一个重要方向。
计算机视觉的历史计算机视觉的最终⽬标是让计算机能像⼈类那样利⽤视觉观察和理解世界,具有⾃主适应变化环境的能⼒。
下⾯简短介绍计算机视觉的发展历史:第⼀阶段:20世纪50年代,计算机视觉还属于模式识别领域,当时的主要⼯作是⼆维图像的分析和识别。
尽管属于模式识别领域,但当时的模式识别还不是⼀个独⽴的学科,直到60年代,模式识别才成为⼀门独⽴的学科。
第⼆阶段:20世界60年代中期,Robert的研究⼯作开创了以理解三维场景为⽬标的三维计算机视觉研究。
Robert的系统能从⼆维数字图像中抽取多⾯体的线画,利⽤已知多⾯体的模型分析分析线画中对应的物体在三维空间中真实的位置。
由于Robert的研究给⼈们极⼤的启发,使计算机视觉进⼊蓬勃发展时期。
第三阶段:20世纪70年代,David Marr在计算机视觉历史上画上了浓墨重彩的⼀笔,他提出了第⼀个较为完善的视觉系统框架——视觉计算理论框架。
他认为视觉是⼀个复杂的信息处理过程,并有不同的信息表达⽅式和不同层次的处理过程,⽽最终的⽬的是实现计算机对外部世界的描述。
由此他提出三个层次的研究⽅法,计算理论层、表征与算法层、实现层。
并提出了⾃上⽽下,没有反馈的视觉处理框架,他认为视觉主要是获得物体的三维形状,并把获得过程分为三个阶段:1. 原始基元图(primal sketch)。
基元图由⼆维图像中的边缘点,直线,曲线、顶点等基本⼏何元素构成。
2. 2.5维图(2.5dimensional sketch)。
以观测者为中⼼的坐标系中,由输⼊图像和基元图恢复场景可见部分的深度、法线⽅向、轮廓等,这些信息的包含了深度信息,但不是真正的物体三维表⽰,因此称为⼆维半图(另⼀部分是物体背⾯或是被遮挡的部分)。
3. 3维模型(3dimensional model)。
在以物体为中⼼的坐标系中,由输⼊图像、基元图、⼆维半图来恢复、表⽰和识别三维物体。
Marr的理论给了我们研究计算机视觉许多珍贵的哲学思想和研究⽅法,同时也给计算机视觉研究领域创造了许多研究起点。
证券研究报告计算机2023年03月29日人工智能系列深度报告:计算机视觉行业框架——AI之眼,初启商业飞轮陈梦竹(证券分析师)陈凯艺(联系人)S0350521090003S0350121070080***************.cn***************.cn核心提要◆本篇报告主要解答了:计算机视觉技术发展如何?国内外差距如何?AI企业商业模式有哪些?是否可行?各领域、各模式有哪些企业做的比较好?AI企业如何实现正向盈利?如何评价AI企业?◆1、计算机视觉发展处于什么阶段?人工智能已迎来最好的发展时代,计算机视觉是计算机模拟甚至超越人类视觉,是人工智能技术层中应用最为广泛、市场占比最高的核心技术。
学术领域,计算机视觉已从过去的理论研究逐步转向应用,仍为以谷歌、微软、Meta等为首的海外主导,国内商汤、百度集团、腾讯控股、阿里巴巴也颇有建树。
商业领域,目前计算机视觉已实现技术单点突破,跨越工业红线,从0到1逐步开启商业化;但目前仍为全面商业化黎明前,主要受限于算力、数据、时间等生产要素,而生产要素之间的加速作用将形成飞轮效应,快速实现从1到N。
◆2、AI企业的商业模式是否可行?目前国内计算机视觉领域企业主要有三种商业模式:AIaaS、软硬件一体化产品、垂直行业解决方案。
我们认为AIaaS模式适合当下各行业AI渗透较低的商业环境;软硬件一体化是未来发展趋势,但目前需求尚未爆发;垂直行业解决方案中纯软件标准化产品适用于长尾场景少、需求较为单一行业,面向更多元场景的垂直细分行业则更需要一站式行业解决方案。
目前众多行业AI应用需求尚未完全爆发,因此我们认为当下商业化阶段首要目标是降低AI使用门槛,实现低价和技术通用性,加速AI在各行业渗透,需要AI企业重点发展AIaaS模式培养用户习惯,打造垂直细分行业标杆引领市场拓展。
◆3、企业如何实现正向盈利?虹软科技已实现正向盈利,格灵深瞳2022年归母净利润已正向盈利,其余企业尚处于亏损阶段。
计算机视觉的发展史随着人工智能和计算机技术的不断发展,计算机视觉已成为人们研究的热点问题之一。
计算机视觉是通过计算机来模拟人类视觉的过程,让机器能够“看”的能力,实现对图像和视频的自动处理、分析和理解。
在这篇文章中,我们将一起探讨计算机视觉的发展史,看看它是如何从一个简单的概念逐渐发展成为一个重要的领域。
一、早期的计算机视觉计算机视觉的产生可以追溯到20世纪50年代,当时的科学家们就开始研究如何使计算机具有视觉能力。
早期的计算机视觉研究主要依赖于扫描仪和数字化图像的技术,它们能够将物体的图像转化为数字信号,然后通过处理这些信号来实现对图像的分析和理解。
但是,由于当时计算机的处理能力有限,所以计算机视觉只能处理一些较为简单的图像,大规模应用还有待于进一步的发展和完善。
二、计算机视觉的进一步发展在20世纪60年代,由于计算机技术的不断发展,计算机视觉也得到了迅速的发展。
科学家们开始研究使用计算机来解决更加复杂的视觉问题,例如物体识别和场景理解等。
随着计算机的处理能力的不断提高,计算机视觉也开始逐渐地被广泛应用于工业、医疗、安防等领域。
到了20世纪80年代,计算机视觉的技术已经很成熟,可以处理更加复杂和具体的任务。
其中一个重要的进展是在模式识别方面,科学家发明了很多新的方法,将计算机视觉应用于实际的生产和商业活动中。
例如图像识别技术已经被广泛应用于车辆的自动驾驶和智能监控系统中。
三、深度学习和计算机视觉的结合随着深度学习技术的快速发展,计算机视觉也在最近的几年获得了新的突破。
深度学习是利用人工神经网络进行模式识别的一种技术,它可以处理非常复杂的数据集和模式。
通过深度学习技术的应用,计算机视觉可以更好地完成更加复杂的任务。
例如,最近几年用于人脸识别的技术已经非常先进。
通过使用深度学习技术,可以更加精确地进行人脸识别和区分,从而有效地提高了安全和监控的效率。
四、计算机视觉的前景未来,计算机视觉有巨大的发展前景。
计算机视觉的历史和未来计算机视觉(Computer Vision,CV)是一门涉及计算机和人类视觉交互的复杂学科,也是人工智能研究领域的一个重要分支。
它旨在让计算机模拟和理解人类的视觉系统,以便更好地处理、分析和理解数字图像和视频。
当然,计算机视觉的兴起并非一夜之间,有着丰富的历史,今天我们一起来探讨计算机视觉的发展历程及未来的发展趋势。
一、计算机视觉的发展历程1. 1956年至1980年代:计算机视觉的起步计算机视觉的先驱者在20世纪50年代就开始了相关研究,当时主要关注的是单个物体的识别。
1966年,MIT的Marvin Minsky 和Seymour Papert等人发表了《Perceptrons》一书,揭示了感知机模型的局限性,从而影响了计算机视觉的发展。
直到1970年代中期,David Marr在MIT发表了著名的《视觉认知的计算理论》一书,才标志着计算机视觉从研究阶段进入应用阶段。
1980年代末,计算机视觉取得了显著进展。
Horn和Schunck提出了基于光流场的运动分析方法。
Lucas和Kanade利用相邻两帧图像中共同的区域来计算运动矢量。
Szeliski和Vedula使用多帧图像来估计运动并纠正运动的Brian2. 1990年至2000年代:求解三维问题随着计算机技术的逐步发展,计算机视觉研究变得更加复杂,涉及更多的三维问题。
因此,三维重建和3D建模成为了研究热点。
1995年,由David Lowe等人提出的SIFT特征点检测算法,成为了特征点检测与匹配领域的基石。
1999年,Hartley和Zisserman提出了基于大量二维投影点的立体视觉重建方法,使得像素级的视觉测量成为了可能。
3. 2000年至今:深度学习和视觉应用的融合随着计算机和网络技术的增强,基于深度学习的计算机视觉技术开始成为主导。
2012年,Geoffrey Hinton等人提出使用卷积神经网络(CNN)进行图像分类的ImageNet,挑战了计算机视觉的前沿。