基于视觉认知机制的三维重建算法(VCM算法)
- 格式:doc
- 大小:5.03 MB
- 文档页数:4
专利名称:一种基于深度学习的三维场景重建方法专利类型:发明专利
发明人:金福生,赵钰,秦勇
申请号:CN201811112829.5
申请日:20180925
公开号:CN109461180A
公开日:
20190312
专利内容由知识产权出版社提供
摘要:一种基于深度学习的三维场景重建方法,属于深度学习和机器视觉技术领域。
通过卷积神经网络来估计场景的深度结构,并通过多视角方法对密集结构进行细化。
具体通过训练一种全卷积残差神经网络来预测深度图,再基于从不同视角拍摄的彩色图像,利用对极几何和密集优化方法来优化深度图并估计相机的姿态;最后,将优化后的深度图投影到三维空间,并通过点云进行三维可视化。
能够有效解决室外三维重建的问题,并提供高质量的点云输出结果;可在任意光照条件下使用;可克服单目方法无法估计物体实际尺寸的不足。
申请人:北京理工大学
地址:100081 北京市海淀区中关村南大街5号
国籍:CN
代理机构:北京理工正阳知识产权代理事务所(普通合伙)
代理人:王民盛
更多信息请下载全文后查看。
基于视觉认知机制的三维重建算法(VCM算法)Abstract:本文在总结以往重建方法的基础上,提出了一种新的三维重建方法——基于视觉认知机制的三维重建算法(VCM算法)。
类似于模型引导(CSG)[1,2]方法,算法将整个三维实体划分成基元(基本体素)的组合。
不同的是,基元不是事先定义好的,而是被限制为能用实体造型中广义平移操作所能生成的实体。
算法利用自底向上(B-rep)[3]方法生成实体每一个基元,再将基元合并成最后的结果实体。
在重建过程中出现歧义时,利用剖视图处理和视觉推理机制加以解决,使得结果实体与人的理解结果更加一致。
Keywords: Interpretation of engineering draws,3D reconstruction from multi-projections, visual cognition, pattern recognition.1 Introduction从工程视图重建三维实体一向被认为是一个颇具挑战性的课题,它的主要任务是从二维视图表达中提取产品模型的三维信息,使计算机能像人理解视图那样从工程视图中重建出产品的三维模型。
在工程制图中,主要都是以多视图表达一个三维实体的,包括三视图、剖视图、局部试图等,因此本文也将主要的研究集中在多视图三维重建技术上(下文如无特别说明,三维重建技术指的都是从多视图重建三维实体的技术)。
从上文对多视图三维重建技术的分析,我们可以看到从多视图重建三维实体目标的研究应做好以下几项工作:1)必须要将自动识别与人机交互有效地结合起来,至少在目前一个全自动识别系统的实用性是有限时。
因为目前教给计算机识图的本领与有经验工程人员识图的本领相差太大,诸如多视图、剖面、局部放大、省略表示、检查图形一致性等在目前还没有很好解决。
因此充分利用人的知识和技巧来弥补自动识别的不足,引导自动识别将会极大地增强识别算法的实用性。
2)必须建立综合各种识别方法及相关学科技术的识别系统,至少在目前运用一种方法独自建立的识别系统很难胜任实际工程中三视图的识别时。
计算机视觉中的三维物体识别和重建算法研究随着计算机技术的不断发展,计算机视觉领域也取得了长足的进步。
在计算机视觉中,三维物体识别和重建算法是一个重要的研究方向。
本文将探讨三维物体识别和重建算法的研究现状以及未来的发展方向。
一、三维物体识别算法三维物体识别是计算机视觉中的一个关键问题,它的目标是通过计算机对三维物体进行自动识别和分类。
传统的三维物体识别算法主要基于特征提取和模式匹配的方法,通过提取物体的形状、纹理等特征,然后与已知的模型进行匹配来实现识别。
然而,这种方法在处理复杂场景和多变形状的物体时存在一定的局限性。
近年来,深度学习技术的兴起为三维物体识别算法带来了新的突破。
深度学习模型可以通过大量的数据训练得到更准确的特征表示,从而提高了物体识别的准确率。
例如,卷积神经网络(CNN)在三维物体识别中取得了显著的成果。
通过将三维物体的点云数据转换为图像,然后使用CNN进行分类,可以实现较高的识别准确率。
然而,目前的三维物体识别算法还存在一些问题。
首先,对于复杂场景中的遮挡和噪声,算法的鲁棒性较差。
其次,对于形状变化较大的物体,算法的泛化能力也有待提高。
因此,未来的研究方向应该是进一步提高算法的鲁棒性和泛化能力,以适应更加复杂的场景和物体。
二、三维物体重建算法三维物体重建是计算机视觉中的另一个重要问题,它的目标是通过从图像或点云数据中恢复三维物体的几何结构和表面特征。
传统的三维物体重建算法主要基于结构光、多视图几何等方法,通过从不同角度获取物体的信息,然后进行三维重建。
然而,这种方法需要较多的计算资源和时间,并且对场景要求较高。
近年来,基于深度学习的三维物体重建算法得到了快速发展。
通过使用深度学习模型,可以从单张图像或点云数据中恢复出更准确的三维物体模型。
例如,使用生成对抗网络(GAN)可以实现从单张图像到三维模型的转换,从而实现三维物体重建。
然而,目前的三维物体重建算法还存在一些问题。
首先,算法对于大规模场景的处理能力较弱,需要进一步提高算法的效率和稳定性。
三维重建算法研究综述
三维重建是计算机视觉领域的重要研究方向之一,其目的是通过从多个二维图像或传感器数据中恢复三维场景的结构和形状。
三维重建算法可以应用于许多领域,如增强现实、机器人导航、虚拟现实等。
目前,常用的三维重建算法包括基于视觉特征的方法、基于传感器的方法和基于机器学习的方法。
基于视觉特征的方法是最常用的三维重建算法之一、该方法利用图像中的特征点或边缘来匹配不同视角的图像,并利用三角剖分技术计算出相机的位置和场景中物体的三维坐标。
该方法的优点是适用于不同类型的图像,但其缺点是对图像中的特征点要求较高。
基于传感器的方法是另一种常用的三维重建算法。
该方法利用深度传感器、激光雷达等设备获取场景中每个物体的距离信息,从而得到物体的三维坐标。
该方法的优点是精度高且适用于各种环境,但其缺点是设备成本较高。
基于机器学习的方法是近年来兴起的一种三维重建算法。
该方法利用深度学习技术,通过训练模型从图像中恢复三维场景的结构和形状。
该方法的优点是能够处理大规模数据,并能够学习复杂的特征表示,但其缺点是对训练数据的依赖性较高。
除了上述方法外,还有一些基于几何约束的三维重建算法,如结构光三维扫描和立体视觉等。
这些方法通过利用几何关系和相机参数等信息来恢复三维场景的结构。
这些算法的优点是可以得到较准确的三维模型,但其缺点是对硬件要求较高。
总结而言,三维重建算法包括基于视觉特征的方法、基于传感器的方法、基于机器学习的方法和基于几何约束的方法。
不同的方法适用于不同的场景和应用需求。
随着计算机视觉和深度学习技术的发展,三维重建算法将得到进一步的改进和应用。
基于立体视觉的三维重建技术研究一、引言随着计算机技术和图像处理技术的不断发展,人们对于三维重建技术的需求也越来越大,而基于立体视觉的三维重建技术则是其中的一个重要方向。
本篇文章将详细分析该技术的原理与应用,并探讨其未来的发展趋势。
二、基本原理立体视觉的三维重建技术主要是利用双目或者多目摄像机同时拍摄同一个物体或者场景的影像,然后通过计算机程序对这些影像进行分析和处理,最终生成该物体或者场景的三维模型。
其中,双目摄像机主要是由两个相机组成,这两个相机的拍摄位置相互独立且成为了横向视差,在摄像机对准拍摄目标以后,两个相机同时拍摄目标的图像。
双目摄像机最大的优势是可以获取多个视图的图像,能够捕捉目标的多个视角信息,生成的三维模型更加准确。
而多目摄像机则是基于双目摄像机的基础上进一步扩展,主要是通过加入更多的摄像机来捕捉目标的更多视角信息,避免因视野不足而产生死角,提高了三维模型的完整度和准确性。
三、应用领域立体视觉的三维重建技术被广泛应用于以下领域:1.机器人技术在自动驾驶、智能家居等领域,机器人需要获取一定的环境信息,通过建立环境模型来进行路径规划和决策。
而立体视觉的三维重建技术可以精确获取环境的三维模型,让机器人更加精确地感知环境。
2.医疗领域在医疗领域,立体视觉三维重建技术可以通过对病人进行拍摄,获取病人的三维信息,利用三维模型进行手术模拟和预测,提高手术的安全性和成功率。
3.文化遗产保护在文化遗产保护方面,立体视觉的三维重建技术可以通过对文物进行拍摄获取其三维信息,实现文物数字化保护和传承。
4.电影制作在电影制作领域,立体视觉的三维重建技术可以通过获取物体的三维信息,实现更加逼真的特效制作和场景还原,提高电影制作的视觉效果和观影体验。
四、未来发展趋势随着技术的不断发展,立体视觉的三维重建技术在未来将有以下几个趋势:1.多模态融合在未来,随着人工智能和其他技术的不断发展和应用,各种传感器、摄像机等设备进行多模态融合,形成一个更加完整的空间信息模型,提高三维重建的准确性和完整度。
一种新颖实用的基于视觉导航的三维重建算法
林强;李宏东;顾伟康
【期刊名称】《传感技术学报》
【年(卷),期】2003(016)004
【摘要】根据立体视觉在视觉导航应用中的特点,提出了由视差图重建三维场景的整套算法.首先,推导视差图里各点在摄像机坐标系下的三维坐标.其次,建立摄像机坐标系与车体坐标系的转换关系,得到更有实际意义的在车体坐标系下各点的三维坐标.最后,通过分格显示地貌的算法,大大减少了数据量.实验结果表明,该算法计算量小、鲁棒性强,完全满足视觉导航中的实时性、准确性要求.
【总页数】5页(P401-405)
【作者】林强;李宏东;顾伟康
【作者单位】浙江大学信息与电子工程系,杭州,310027;浙江大学信息与电子工程系,杭州,310027;浙江大学信息与电子工程系,杭州,310027
【正文语种】中文
【中图分类】TP242.6
【相关文献】
1.基于视觉导航的三维重建算法误差分析及补偿 [J], 王海彬;陈华华;顾伟康
2.一种实用的三维折射率场重建算法 [J], 刘峰;阎大鹏
3.一种基于弹性融合的改进三维重建算法 [J], 李帅
4.一种基于加权多准则的火炮爆炸场中高温火球三维温度场的迭代重建算法 [J],
刘晓蔚;祝海江;刘兴旺;李小春;李卓明
5.一种基于空间编码结构光的稠密三维重建算法 [J], 陈荣;许宏丽;杨东学;黄华因版权原因,仅展示原文概要,查看原文内容请购买。
基于计算机视觉的三维重建技术综述计算机视觉的三维重建技术是指通过计算机视觉算法和技术手段,利用图像或视频信息推导出场景中的三维几何结构和外观特征的过程。
三维重建技术在许多领域都有广泛的应用,如虚拟现实、增强现实、机器人导航、文化遗产保护等。
本文将综述目前常用的三维重建技术,包括基于视差的立体视觉方法、基于结构光的方法和基于多视角的方法。
基于视差的立体视觉方法是最早也是最常见的三维重建方法之一、该方法通过使用至少两个视点的图像,并通过计算图像中物体在两个视点之间的视差来推断物体的深度信息。
常用的视差计算方法包括区域匹配、基于特征点的方法和基于光流的方法。
区域匹配方法将图像分割为若干个相对均匀的区域,然后通过比较区域之间的灰度值差异来计算视差。
该方法适用于纹理丰富的物体,但对于纹理较弱或连续纹理的物体效果较差。
基于特征点的方法则通过选取图像中的特征点,在不同视点之间计算特征点的视差来推断物体的深度信息,该方法对于纹理较弱的物体效果较好。
基于光流的方法则通过分析图像序列中物体的运动来计算物体的深度信息。
基于结构光的方法是另一种常用的三维重建技术。
该方法通过使用一种或多种结构光源将光投影到场景中,并通过记录光的反射和变形来推断物体的深度信息。
常用的结构光源包括激光和投影仪。
激光结构光方法通过使用激光束扫描物体表面,并通过测量激光与物体表面的反射点之间的距离来推断物体的深度信息。
投影仪结构光方法则通过将编码的光投影到物体表面,并通过记录光的变形来推断物体的深度信息。
结构光方法具有较高的精度和鲁棒性,但其在纹理较弱或光照较暗的环境下效果较差。
基于多视角的方法是最新也是最先进的三维重建技术。
该方法通过使用多个视点的图像或视频序列,并通过分析不同视点之间的相对几何关系来推断物体的深度信息。
常用的多视角方法包括结构从运动方法和特征点匹配方法。
结构从运动方法通过推断场景中相机的运动轨迹来求解三维结构,该方法适用于场景中有足够多的纹理且相机运动较大的情况。
计算机视觉中的三维重建算法研究综述计算机视觉是一门研究如何使计算机“看到”和理解图像的学科。
随着计算机技术的不断发展,计算机视觉在各个领域都发挥着重要的作用。
其中,三维重建算法是计算机视觉领域中的一个重要研究方向。
本文将对计算机视觉中的三维重建算法进行综述。
一、三维重建算法的基本原理三维重建算法的基本原理是通过从二维图像中提取特征信息,恢复物体的三维结构。
常用的三维重建算法包括结构光法、立体视觉法和运动恢复法等。
1. 结构光法结构光法是一种利用光线在物体表面上的反射和折射来重建物体三维结构的方法。
该方法通过投射特定的光源模式,如条纹或格点,然后通过相机拍摄物体表面的图像,并根据图像中的光线变形信息来计算物体的深度信息。
结构光法的优点是测量精度高,但需要特殊的设备和环境。
2. 立体视觉法立体视觉法是利用两个或多个摄像机从不同的视角拍摄物体来恢复其三维结构的方法。
该方法通过计算图像中物体的视差信息,即不同视角下物体在图像上的位置差异,来推测物体的深度信息。
立体视觉法的优点是可以使用常规的摄像机设备,但需要进行图像匹配和视差计算等复杂的算法处理。
3. 运动恢复法运动恢复法是利用物体在运动过程中的图像序列来恢复其三维结构的方法。
该方法通过分析图像序列中物体的运动轨迹和变化情况,来推测物体的深度信息。
运动恢复法的优点是可以实时捕捉物体的运动信息,但需要对图像序列进行复杂的运动分析和计算。
二、三维重建算法的应用领域三维重建算法在各个领域都有广泛的应用。
以下将介绍其中几个典型的应用领域。
1. 文化遗产保护三维重建算法可以用于文化遗产的数字化保护和修复。
通过对文物或古建筑进行三维扫描和重建,可以实现对其形状、结构和纹理等方面的精确还原,为文化遗产的保护和研究提供有力的工具。
2. 工业制造三维重建算法可以用于工业制造中的产品设计和质量控制。
通过对产品进行三维扫描和重建,可以实现对其外形和尺寸等方面的精确分析和评估,提高产品的设计和制造效率。
基于计算机视觉的三维重建技术研究与应用近年来,随着计算机视觉技术的迅猛发展,基于计算机视觉的三维重建技术逐渐成为研究的热点。
三维重建技术通过将二维图像或视频转化为三维模型,既可以提供更加真实逼真的图像显示,又可以广泛应用于机器人导航、虚拟现实、文化遗产保护等领域。
在基于计算机视觉的三维重建技术中,最核心的过程是从多个角度的二维图像中恢复出三维物体的几何形状和纹理信息。
这一过程通常包括相机标定、特征点匹配、点云生成和纹理贴图等步骤。
首先,相机标定是三维重建的关键步骤之一。
相机标定的目的是确定相机内外参数,包括焦距、畸变系数、旋转矩阵和平移向量等。
通过准确地估计这些参数,可以为后续的图像处理提供正确的几何信息。
其次,特征点匹配是三维重建中另一个重要的环节。
特征点是指图像中具有显著性质的点,如角点、边缘等。
通过在不同视角的图像中提取和匹配特征点,可以确定图像之间的对应关系,进而计算出物体的三维位置和姿态。
接下来,点云生成是将特征点转化为点云模型的过程。
点云模型是由大量离散的点构成的三维模型,每个点都具有坐标和颜色信息。
点云生成的方法主要包括稠密重建和稀疏重建。
稠密重建通过像素级的深度图像生成点云模型,精度较高但计算复杂度较高。
稀疏重建则通过特征点的三维坐标估计整个三维模型,计算速度快但精度有所降低。
最后,纹理贴图是为点云模型添加真实的纹理信息。
在点云生成过程中,由于只有点的坐标和颜色信息,没有物体表面的纹理信息。
纹理贴图的作用是将二维图像的纹理映射到点云模型上,使其更加逼真。
纹理贴图的方法主要有贴图坐标法和映射投影法,通过将二维图像上的每个像素映射到点云模型上的对应位置,将二维图像的纹理信息传递给点云模型。
基于计算机视觉的三维重建技术在许多领域都有广泛的应用。
首先,在工业领域,三维重建技术可以用于产品设计和检测。
通过将真实的产品转化为三维模型,可以进行产品形状分析、结构优化等工作。
其次,在文化遗产保护方面,三维重建可以用于数字化古迹和艺术品的保存与展示。
计算机视觉中的3D重建算法研究随着计算机视觉(Computer Vision)技术的发展,3D重建技术在越来越多领域得到了应用,如建筑、文化遗产保护、游戏、虚拟现实等。
3D重建技术将现实世界中的物体用数字化的方式表现出来,方便对其进行分析、处理和应用。
在计算机视觉中,3D重建算法是一项核心技术,其主要目的是根据图片、视频等二维信息恢复出物体的三维形状。
本篇文章将介绍计算机视觉中的3D重建算法研究进展及其应用。
三维重建的基本原理三维重建的基本原理是从一组2D图像中恢复3D模型。
三维重建通常包括三个步骤:摄像、三角测量和欧氏重建。
在摄像阶段,摄像机或激光扫描仪获取2D 或3D数据。
在三角测量阶段,基于2D或3D数据,确定物体外部表面的几何形状。
在欧氏重建阶段,用数学算法将三角网格转换为物体的3D表面。
三维重建的算法对于三维重建来说,最关键的就是三角测量。
目前主流的三维测量方法主要有以下几种:1.立体重建(Stereovision)立体重建是应用广泛的三维重建技术之一,其主要思想是根据左、右相机的视角拍摄到的不同角度的图像,通过计算出两张图像之间的视差距离,进而确定了该图像上每个点的深度信息。
在立体重建中,由相邻两个摄像机同时获取多张图像,因此需要计算出相邻两张图像的匹配关系。
一些基于特征点的匹配算法,例如SIFT、SURF等,在实现立体匹配时发挥了重要的作用。
该技术通常适用于中等规模的场景,主要受限于相机的数量和分辨率。
2.结构光扫描(Structured Light Scanning)结构光扫描是一种基于激光投影的三维重建技术。
在该技术中,通过将细小的光条或光点投射到模型表面上,以此获取模型表面的3D信息。
当光条或光点投射到模型表面上时,激光光线被反弹回来,在相机中形成深度数据。
结构光扫描是一种快速但准确度不高的3D重建技术,可应用于小物体的重建。
3.时序结构光扫描(TSLS)相比于静态的结构光扫描,时序结构光扫描更适用于大尺寸复杂物体的重建。
基于视觉认知机制的三维重建算法(VCM算法)Abstract:本文在总结以往重建方法的基础上,提出了一种新的三维重建方法——基于视觉认知机制的三维重建算法(VCM算法)。
类似于模型引导(CSG)[1,2]方法,算法将整个三维实体划分成基元(基本体素)的组合。
不同的是,基元不是事先定义好的,而是被限制为能用实体造型中广义平移操作所能生成的实体。
算法利用自底向上(B-rep)[3]方法生成实体每一个基元,再将基元合并成最后的结果实体。
在重建过程中出现歧义时,利用剖视图处理和视觉推理机制加以解决,使得结果实体与人的理解结果更加一致。
Keywords: Interpretation of engineering draws,3D reconstruction from multi-projections, visual cognition, pattern recognition.1 Introduction从工程视图重建三维实体一向被认为是一个颇具挑战性的课题,它的主要任务是从二维视图表达中提取产品模型的三维信息,使计算机能像人理解视图那样从工程视图中重建出产品的三维模型。
在工程制图中,主要都是以多视图表达一个三维实体的,包括三视图、剖视图、局部试图等,因此本文也将主要的研究集中在多视图三维重建技术上(下文如无特别说明,三维重建技术指的都是从多视图重建三维实体的技术)。
从上文对多视图三维重建技术的分析,我们可以看到从多视图重建三维实体目标的研究应做好以下几项工作:1)必须要将自动识别与人机交互有效地结合起来,至少在目前一个全自动识别系统的实用性是有限时。
因为目前教给计算机识图的本领与有经验工程人员识图的本领相差太大,诸如多视图、剖面、局部放大、省略表示、检查图形一致性等在目前还没有很好解决。
因此充分利用人的知识和技巧来弥补自动识别的不足,引导自动识别将会极大地增强识别算法的实用性。
2)必须建立综合各种识别方法及相关学科技术的识别系统,至少在目前运用一种方法独自建立的识别系统很难胜任实际工程中三视图的识别时。
而且已有许多算法综合了不同的识别方法从而提高了识别能力。
在识别策略上应采用“各个击破”的策略,充分利用视图上所有相关信息,灵活运用不同的识别方法有针对性地处理不同类型的图形,尽快抓住形体特征,从而减少识别的复杂性,提意识别能力和速度。
3)必须要建立知识的自动积累机制,具有良好的扩展性,用以不断提高识别的自动化程度。
人识图的经验是通过不断地“看”、归纳、总结而积累起来的。
而以往的算法不具备这种能力。
无论通过什么方法好不容易识别出来的实体目标,却没有再把它自动转化成识别知识以扩展识别能力,更不用说能自动归纳、总结出识别某类实体的最佳方法。
而且有些识别模型太复杂,用人工的方式构造已无法胜任,必须要有自动构造的能力。
当图纸信息越复杂,识别越困难时,就越显出知识自动积累的重要。
本文主要是从前两个方面着手,提出一种新算法,算法的思想和框架将在下面一章中具体描述。
2 Algorithm2.1算法思想现有三维重建算法的不足,促使我们考虑一种新的算法。
这种算法需要解决三个方面的问题:1) 选择一个合适的基准抽象表达层。
使得在从这样的一个中间表达层上进行三维模型重建时,不要过分地依赖自然约束与常识;2) 建立新的算法机制,克服B-rep[3]、CSG[1,2]等方法的缺限和所遇到的困难;3) 引入视觉推理机制,从而使得算法能根据所“看”到的形体的固有的形状特征作一些合理的猜测和推理,生成用户所期望的三维形体。
基于以上的认识,我们提出了一个基于视觉认知机制(Visual Cognition Mechanism)的三维重建算法(简称为VCM算法)。
对于上述三个方面的问题,算法采用了如下的对策:1) 在选择合适的基准抽象表达层方面,我们在对比多视图,单视图表达各自的优缺点,针对CAD系统的特点,选择了这样的一个中间表达抽象层——以三视图表达为基础,并允许剖视图等一些示意性信息的加入。
在有剖视图存在是,允许省略三视图中的一到两个视图;2) 在建立新的算法机制方面,针对三维模型重建方法与算法和人的视觉重建及认知过程有着千丝万缕的联系,因此在对人的视觉重建机制作更深层的分析和总结基础上,并考虑到计算机信息加工的特点,采用了基于人的视觉认知过程的机制;3) 在引入视觉推理机制方面,我们根据视觉认知心理学中的知觉组合原则,归纳出几类知识,并简化成相应的规则,形成了以产生式系统为核心的推理机制。
VCM算法采用了类似于CSG建模的机制来实现文献[4,5]总结出的人的视图理解策略,将基本体素(基元)限定为一类,即能够使用广义平移扫掠操作产生的三维实体,从而将CSG方法中的基本体素的识别转化为基元的划分,避免了基本体素识别的困难。
对于划分好的基元描述,采用现有B-rep方法中的几何信息恢复策略来生成基元的三维模型。
所有的基元构成一CSG树描述,它们被逐步加到结果实体中。
在上述基础上,加入剖视图信息的处理和基于视觉认知规则的视觉推理,在视图理解出现歧义时,协助用户得到最可能的解。
另外,也允许用户在基元的划分和生成时对理解过程进行交互。
2.2算法框架2.2.1术语定义三维重建研究的历史较长,形成了许多不同的术语,为了避免混淆,下面对本文所用的术语加以定义(图1是一个示意图):图1 术语解释示意图平移扫掠操作(sweep操作):实体造型中的一种从二维形状生成三维实体的操作。
在给定了一个二维形状和一个扫掠向量后,二维形状上的每个顶点沿扫掠向量移动到一个新的位置并形成了一个新的二维形状,扫掠前后的二维形状和扫掠过程中顶点的运动轨迹构成了一个三维实体。
广义平移扫掠操作:平移扫掠操作的扩展,二维形状上的每个顶点都沿不同的扫掠向量进行扫掠。
基元:即基本体素,在本文中指的是能够通过广义平移扫掠操作产生的三维实体。
基座面:广义平移扫掠操作中被扫掠的二维形状,包含外轮廓和内部孔洞描述。
它所在平面的法向量指向扫掠操作生成的基元内部。
重建方向:基座面的规则化法向量。
重建平面:输入三视图中与重建方向垂直的视图。
重建立面:输入三视图中与重建方向平行的视图。
基座面扫掠轨迹:基座面上每个顶点在广义平移扫掠操作中的扫掠向量的集合。
2.2.2算法框架总述根据上述算法思想,可得到如下一个粗略的算法框架,如图2所示。
首先在输入视图中找出相应的约束特征和形成基元的条件,给出所有可能基元的初步划分和描述;然后对每一可能的基元,通过广义平移扫掠操作产生三维模型(产生歧义时通过视觉推理,剖视图处理等手段解决),并逐步加到结果实体中;当生成的结果实体对所有的视图均做出完全一致的解释时,算法成功结束,否则报错返回。
2.2.3算法步骤结合实体造型中广义平移扫掠操作的特点,下面给出了一个模拟人理解工程视图过程的算法的具体步骤:1) 首先由用户选择重建方向。
重建方向的选择限定为三视图中某一视图的法向,选中的视图就是重建平面,三视图中其他的视图就是重建立面。
2) “分线框”:根据用户选定的重建平面和相关视图中所包含的形状变化特征,按最大可能性划分出结果实体的所有基元;3) “想形状”:对每一基元,确定它的基座面和基座面扫掠轨迹(产生歧义时通过剖视图处理和视觉推理来协助解决,或是由用户来确定),然后扫掠基座面生成基元的三维模型;4) 生成每一可能基元的三维模型后,通过实体造型中的粘接操作和布尔操作逐步形成结果实体;“对投影”:形成最后的结果实体后,检查它对所有视图做出的解释的一致性和完全性。
如一致且完全,算法成功结束;否则给出错误信息,并由用户确认结果。
算法的每一步骤如图3所示:3 Conclusion本文在介绍了从工程视图重建三维实体的现有技术的基础上,提出了一种融合B-rep 方法和CSG 方法的新的重建算法——基于视觉认知机制的三维重建算法(VCM 算法)。
在这种新的重建算法中,重建结果与人的期望结果更加一致,即当人的理解没有歧义时,计算机也能提供唯一的解。
从工程视图重建三维实体的工作是相当复杂的,本文提出的算法只是为三维重建问题的解决提供了另一种思路和方法,仍然存在不少问题,主要表现在:不能提供病态解的处理方法;重建有时还需用户不必要的参与。
解决这些问题将是我们进一步工作的方向,在完善现有算法机制的基础上,要逐步加入工程语义分析,并借鉴专家系统实现的人工智能技术,以期能更加有效的解决三维重建这个复杂的问题。
图2 算法框架Reference[1] Weidong Wang and Georges Grinstein, “A polyhedral object ’s CSG-Rep reconstruction from a single 2D line drawing ”, Proc. of 1989 SPIE Intelligent Robots and Computer Vision Ⅲ: Algorithms and Techniques , 1989, 1192: 230-238[2] Weidong Wang, “On the Automatic Reconstruction Problem of a 3D Object ’s Constructive Solid Geometry Representation from its 2D Projection ”, A Doctor of Science dissertation, Computer Science Dept. University of Massachusetts at Lowell , 1992[3] Masanori Idesawa, “A System to Generate a Solid Figure from Three Views ”, Bull. JSME , 1973, 16: 216-225[4]王其昌,看图思维规律—机械制图基本功训练,北京:机械工业出版社,1989.[5]东北工学院机械制图教研室,制图与看图,北京:北京人民出版社,1976.图3 算法的图示。