一种改进的图像重组算法及其硬件实现
- 格式:doc
- 大小:302.50 KB
- 文档页数:5
图像处理中的图像融合算法改进方法图像融合是一种将多幅图像合成为一幅图像的处理技术,被广泛应用于计算机视觉、遥感、医学影像等领域。
在图像融合中,目标是将多幅图像的有用信息融合到一幅图像中,以提高图像质量和提供更多的可视化信息。
然而,现有的图像融合算法在某些场景中仍然存在一些问题,如边缘模糊和细节损失。
因此,本文将介绍几种图像融合算法的改进方法,以解决这些问题。
首先,基于小波变换的图像融合算法是目前应用最广泛的方法之一。
该算法基于小波变换原理,将图像分解为低频和高频部分,然后通过融合规则将高频部分的细节信息添加到低频部分中。
然而,在某些情况下,由于低频和高频部分之间的互相影响不足,造成融合结果的边缘模糊和细节损失。
为了改进这一问题,可以采用自适应权重的方法来提高低频和高频部分间的互相影响。
通过根据图像的局部特征计算权重,将更多的细节信息融合到低频部分中,从而改善图像的边缘和细节。
其次,基于多尺度变换的图像融合算法是另一种常用的方法。
该算法将图像分解为多个尺度的组分,并采用不同的融合规则对每个尺度的组分进行融合。
然而,由于不同尺度的组分具有不同的重要性和局部特征,传统的融合规则无法充分考虑到这些差异。
为了改进这一问题,可以采用基于加权平均的融合规则来提高图像融合的效果。
通过根据不同尺度组分的重要性和局部特征,对每个尺度的组分进行加权平均,从而获得更好的融合结果。
此外,基于深度学习的图像融合算法近年来得到了广泛关注,并取得了很大的成功。
深度学习模型可以通过学习大量的图像数据来提取图像的特征,并根据特征之间的关系进行图像融合。
然而,由于深度学习模型的复杂性和计算资源的要求,该方法在实际应用中可能存在一些限制。
为了解决这个问题,可以采用预训练模型和迁移学习的方法来加速深度学习模型的训练和应用。
通过利用预训练模型在大规模数据集上训练的特征提取能力,可以在较小的数据集上进行图像融合任务的训练,从而减少计算资源的消耗。
图像处理中的图像增强算法评估与改进图像增强是数字图像处理中的重要内容之一,其目的是改善或增强图像的视觉效果,提高图像的质量和可读性。
图像增强算法根据不同的应用领域和需求,有多种不同的方法和技术。
本文将针对图像增强算法进行评估与改进。
一、图像增强算法评估图像增强算法的评估是为了确定算法的性能和效果,对比不同算法的优劣,并为改进算法提供指导。
图像增强算法的评估可从以下几个方面进行:1. 主观评价:主观评价是通过人眼观察和判断来评估图像增强效果的好坏。
人眼判断的主观性较强,需要评价者具备一定的专业知识和经验。
主观评价通常通过主观评分法、可接受性评估和实验用户调查等方法进行。
2.客观评价:客观评价是通过一些定量的指标或算法对图像增强算法进行评估。
常用的客观评价指标包括图像对比度、图像亮度、锐度等。
另外,也可以使用峰值信噪比(PSNR)、结构相似性指数(SSIM)等公认的客观评价指标来评估图像增强算法的性能。
3.算法速度:算法速度是评估图像增强算法的另一个重要因素。
在实际应用中,图像增强算法需要在较短的时间内完成,因此快速的算法更受欢迎。
算法速度的评估可通过计算算法的执行时间来获得。
综合以上评价指标,可以比较不同图像增强算法的优劣,为改进算法提供依据。
二、图像增强算法的改进1. 基于传统图像增强算法的改进:传统的图像增强算法包括直方图均衡化、灰度拉伸、滤波器等。
对于这些传统算法,可以通过调整参数和改进算法步骤来提升算法的性能。
例如,可以根据图像的特点,改进直方图均衡化算法,使其适用于不同的图像类型。
另外,可以采用基于机器学习的方法来自动调整算法参数,提高算法的鲁棒性和适应性。
2. 基于深度学习的图像增强算法改进:深度学习在图像处理领域取得了巨大的成就。
通过利用神经网络的强大表达能力,可以实现对图像的高级特征学习和表示。
可以利用深度学习模型,对图像增强进行端到端的学习和优化,提高图像增强效果。
例如,可以使用卷积神经网络(CNN)对图像进行超分辨率重建,增强图像的细节和清晰度。
一种图像重建方法、系统、设备及存储介质技术领域本发明实施例涉及医疗器械技术,尤其涉及一种图像重建方法、系统、设备及存储介质。
背景技术一般情况下,采用医学影像设备(如CT(Computed Tomography,电子计算机断层扫描)、PET(Positron Emission Computed Tomography,正电子发射型计算机断层显像))对被检测者的某一扫描区域扫描过程中,被检测者可能存在自主或不自主的运动(如被检测者自主的呼吸运动、不自主的心脏搏动和胃肠蠕动等),这些自主或不自主的运动就会在重建图像上形成运动伪影,降低图像质量甚至影响诊断。
为此,现有技术常采用运动校正方法消除形成的运动伪影,如选取初始重建图像的不同范围的投影数据,或者选取数据范围相同但权重不同的投影数据,将这些投影数据进行重建得到多个投影数据的重建图像,根据多个投影数据的重建图像计算运动场,并根据运动场对多个投影数据的重建图像进行校正。
可见,上述方法是在图像域上进行运动校正,在具体实现时,如果初始重建图像的运动伪影较明显,则根据选择的多个投影数据的重建图像计算得到的运动场很不准确,导致重建图像的校正效果较差。
发明内容本发明实施例提供了一种图像重建方法、系统、设备及存储介质,以实现在投影域进行伪影校正,大大减少重建图像的运动伪影。
第一方面,本发明实施例提供了一种图像重建方法,包括:获取目标对象的原始扫描数据,根据所述原始扫描数据确定与所述原始扫描数据对应的正投影数据;计算所述原始扫描数据与所述正投影数据之间的校正运动场,根据所述校正运动场对所述原始扫描数据进行校正;对校正后的原始扫描数据进行重建,得到目标重建图像。
第二方面,本发明实施例还提供了一种图像重建系统,该系统包括:获取模块,用于获取目标对象的原始扫描数据,根据所述原始扫描数据确定与所述原始扫描数据对应的正投影数据;计算模块,用于计算所述原始扫描数据与所述正投影数据之间的校正运动场,根据所述校正运动场对所述原始扫描数据进行校正;重建模块,用于对校正后的原始扫描数据进行重建,得到目标重建图像。
一种改进型增强图像处理算法研究与应用刘洋;余建华;顾志芹;陈先锋【摘要】常规的基于高斯或拉普拉斯模板的锐化或增强算法应用中,都会出现包边的现象,即在与邻域有强烈对比的目标上会出现明显的暗或亮包边问题.常规方法未对该现象进行处理,导致部分场景目标存在明显的包边现象.基于常规算法产生的包边问题的原因分析,发现主要是在获取高频图像信息时,采用高斯或拉普拉斯这种基于位置差异计算权重的方式导致;因此在进行获取高频细节时,通过增加以灰度差值来调整权重方式来获取细节,或采用更简单的高频细节截止的处理方式,可有效改善增强算法中的包边问题.【期刊名称】《激光与红外》【年(卷),期】2019(049)003【总页数】4页(P381-384)【关键词】图像增强;包边;位置权重;灰度权重【作者】刘洋;余建华;顾志芹;陈先锋【作者单位】武汉电力职业技术学院电力工程系,湖北武汉 430079;武汉电力职业技术学院电力工程系,湖北武汉 430079;华中科技大学图书馆,湖北武汉 430074;武汉理工大学资源与环境工程学院,湖北武汉 430070【正文语种】中文【中图分类】TP391.411 引言由于红外图像动态范围较大,在将其转换为适合人眼观察的模拟图像过程中,容易造成图像细节的缺失,影响人眼的观察效果。
如何获取具有良好对比度且信息丰富的图像,是红外图像处理中的一项重要技术。
目前成熟的图像变换算法主要包括自动增益控制(AGC)和非线性变换,但上述算法在处理大动态范围红外图像时无法同时保留图像不同温度区间的细节信息,影响图像的显示效果[1]。
采用频率域法增强图像是图像增强的一种方法,采用高通滤波可以增强边缘信号,使模糊图片变得清晰,改善图像视觉效果,采用低通滤波可以去除图像中的噪声,改善图像视觉效果[2]。
在很多增强算法中都存在包边的问题,特别是与邻域有强烈对比度的目标上出现黑边或白边的问题。
如坏点、较暗背景中的亮目标、较亮背景中的暗目标。
一种改进的图像重组算法及其硬件实现
2007-08-13 11:30:54 作者:罗碧强李斌来源:中国集成电路
关键字:CMOS像素线性
1.引言
目前,大多数的数字相机的图像传感器,不管是CMOS还是CCD,都是单色的,即只有灰度的变化。
为了得到彩色图像,普遍采用的方法是在传感器的表面覆盖一层聚酰亚胺掩膜的彩色滤色器。
滤色器的格式有多种,一般为棋盘格式。
本文提出的算法针对的是其中最常用的bayer格式,如图1所示,其滤色滤格子分别透过G(绿)、B(蓝)、R(红)三种颜色,其中G的采样率是B、R的两倍,原因是人眼对绿色信息要比蓝色、红色敏感。
图像传感器传来的数据通常对应每个像素点R、G、B三种颜色中的一种颜色信息,图像重组算法(Demosaicing Algorithm)是指把传感器送来的每个像素点信息转化为包含R、G、B三原色信息的图像算法。
关于图像重组算法日前主要有独立插值法、按比例插值法、Kimmel法等,本文将在分析这些算法的基础上提出能平衡图像质量和硬件消耗的新算法及实现方法。
2.传统算法
2.1 独立插值算法
最简单的线性方法足R、G、B三分量各自独立进行插值重组,彼此没有关联。
以利用相邻像素作平均的插值法为例:
如图2,G2、G4、G6、G8、R1、R3、R7、R9为已知相应像素的相应分量,G5、R2、R4、R6、R8、R5为所求分量,求法如下:
蓝色分量的求法与R相似。
此方法虽然简单,占用硬件资源比较少,但是却会引起色彩混淆和边沿模糊问题,因为其在重组过程中忽略了边沿问题。
为了提高图像质量,可以在此基础上加入梯度的控制。
因此,该算法采用了梯度小的方向的分量值作均值处理。
由于梯度大的方向是边沿变化的方向,若选取了该方向上的值作均值,就会模糊了边沿。
以求图2中的G5分量为例:
水平梯度H=|G4-G6|,垂直梯度V=|G2-G8|。
H>V,G5=(G2+G8)/2;H< P>
此外,该算法没有考虑噪声因素,其简单的平均化操作将使一个像素上的噪声扩大到影响九个像素,从而导致信噪比较低。
2.2 按比例插值算法
由于BAYER格式的传感器上G分量比R、B分量要多一倍,于是有人提出利用G分量对R、B分量进行插值。
如图3所示,G1-G9已经插值得到,R1、R3、R7、R9为已知R信息,求R5:
R5={(R1*G5/G1)+(R3*G5/G3)+(R7*G5/G7)+(R9*G5/G9))/4
此算法对消除色彩混淆有一定的作用,但有个致命的缺点,在G分量特别小的区域,两G分量比例(如G5/G1)可能会变得很大;由于R1、R3、R7、R9都只是所要求的R5周围的点,在R5周围很有边沿信息(在图像中,边沿信息与噪声无异)时,如果G5/G1等比例值太大,很可能引入一个非常大的噪声,使得图像失真严重,造成计算R、B分量时对噪声特别敏感,使得图像信噪比降低。
2.3 Kimmel算法
Kimmel算法是图像重组算法中一个常用的经典方法。
如图4,Kimmel算法求G5:
其中,E为权重参数,表征该相邻像素参与运算的比例。
E由该相邻像素的梯度D决定,梯度D越大,权重E越小。
梯度D的定义如下:(其中P代表R,G,B任意一个分量)
从而:Ei=(1+D2(P5)+D2(Pi))1/2,如E3=(1+Dxd2(PS)+Dxd2(P3))1/2。
kimmel算法在求解R、B分量时也同样采用了按比例插值的思想,只是比例权重不同,这样可以较大程度地减弱色彩混淆现象。
如图4,用kimmel算法求R5:
Kimmel算法重组得到的图像质量比线性插值的方法提高了很多,但kimmel算法也有其缺点,这是本文提出改进算法的出发点,将在下面讨论。
3.改进的算法
本文在kimmel算法的基础上进行了如下的改进:
(1) 待重组图像像素与周边像素的关联性进一步增强,从而改善图像的边沿特性。
在kimmel算法中梯度简单地以两个像素的某个分量差绝对值表示,本文提出的方法是用一个相应方向上更大范围窗口的像素点的差的平均值来代替原来梯度。
例如,在kimmel算法中,如图1,D=|G[5,5]□G[6,6]|,用本文的方法则为:
这样可进一步加强所求像素点与周边像素已知分量的关联性,从而减弱混淆现象。
(2) 修正kimmel算法在G分量缺少时的缺陷。
在kimmel算法中,在G很小的区域,两像素的G比例就会变得很大,这样会造成图像失真和放大噪声。
为此,本文在利用G计算R、B时,可给G设一阈值;此值越大,图像质量越差;此值越小,在G较小区域的图像失真就越严重;因此,此值的设定要经过反复的仿真试验,找到合适的平衡点,本文经过实验对比各参数下的效果,将此值选择为40~60。
(3) 改变kimmel算法所有像素都重新计算其三分量值的做法。
kimmel的算法会改变每个像素三个分量的值,本算法保留原来该像素的已知值,从而可以保留原始图像更多的信息,提高了图像质量。
由于本算法要在ASIC 上实现,在不影响图像总体质量的前提下,应尽量简化某些运算,节省硬件资源。
①本文在求E时不用开方倒数的方式,而采用查表的方式,即一个范围内的D值对应一个E值,只要所设的值能达到“D大则E小”的效果便可;
②求D时所需的除以21/2的运算可转化成近似移位相加。
4.硬件实现
本算法涉及了大量的算术运算,而且计算中像素相关性的要求需要存储大量像素,所以硬件实现必须适当减少硬件资源和RAM的使用量,从而降低ASIC的面积,本文提出如下的解决方法。
4.1 流水线式的运算处理
由式(1)、式(2)可见,计算插入的R、G、B值要经过大量的运算,而传感器送过来的数据是实时的,对其处理也必须是实时的,也就是说进来像素的分量值就要送出一个像素的R、G、B值。
假设模块的主频率和传感器送来的数据频率分别为48MHz和12MHz,则在四个周期就要输出一个像素的R、G、B值。
显然,四个48MHz时钟周期是不可能完成如此多的运算的。
本文采用的方法是把众多运算分成m个步骤完成,而每个步骤都占n个周期,一个步骤完成的结果在下一个n个周期运用计算,如此一级一级的计算,输入与输出都是实时的,其设计思想近似于计算机架构中的流水线结构。
其中m和n要根据模块时钟与传感器输出数据的频率的比例关系以及所设计ASIC的工艺水平对时序的限制来确定。
此方法可使此模块面积减为原始设计的1/2左右。
以计算R[5,5](像素坐标如图1)为例:步骤1:求得G[4,3],G[4,5],G[6,3],G[6,5],G[4,7],G[6,7];步骤2:求得R[5,4]和R[5,6];步骤3:求得R[5,5],这样,每个步骤都有4个周期去完成,就可以满足模块的实时性。
其中步骤1可再分为前两个周期计算G[4,3],G[4,5]和G[6,3],后两个周期计算G[6,5],G[4,7],G[6,7],从而复用其中除法器、加法器和乘法器,使该运算占用资源减少到一半。
同样道理,计算R[5,4]和R[5,6]时也可以复用资源,分别在两个周期内完成其运算。
4.2 堆栈式的RAM操作
此算法要求存储9×9窗口大小的像素信息,也就是要存下9行的传感器送来的数据。
本文提出的方法只需要存8行的像素信息即可,但要配合一个9×9的寄存器阵列实现。
下面以实例说明RAM操作过程:当第9行数据要送来时,前8行数据已按顺序存储在RAM中。
当传感器送来G[1,9]时,模块要进行以下工作:(1)把RAM第1列数据读出;(2)然后把第1列后7行的数据连同G[1,9]写到RAM的第1列中,同时把第1列全部数据连同G[1,9]写到9x9的阵列的第一列中,这样既保存了第1行的数据,又保证第9行数据能写到RAM里,相当于将RAM数据往里推,丢去第1行数据,推入第9行的数据。
如此类推,就可以减少一行存储资源。
5.仿真与验证
本文基于摄像头控制器芯片的开发平台进行了仿真验证,并比较了改进的算法与传统算法的优劣。
此模块通过了功能仿真、DC工具时序、面积等分析,并在FPGA板上通过接传感器,经JPEP压缩,由USB传输到计算机验证其效果。
本文采用Syn-opsys公司的DC compiler分析了各算法实现的面积代价。
同时,本文针对几种算法的图像还原能力作了分析:用线性方法、kimmel方法和本算法处理同一张图片转化的bayer格式图片,设R(x,y)为原图像素值,r(x,y)为处理后像素值:
设满足(3)式的点为还原良好点,其个数为n,本文所用测试图片为640×480大小,令h=n/640×480为算法的还原程度判断。
图5和表1是几种Demosaicing算法的仿真结果图片及其相应的h值和面积代价,可以看到本文提出的方法的图像质量要比其他算法的好,尤其在高频时,混淆现象得到了很好的改善。
6 结论
本文在详细分析传统算法的优劣基础上,提出了新的图象重组算法,而流水线式分时复用资源的实现方法节省了接近一半的资源,很好地克服了模块实时性要求,主频时钟限制和demosaicing算法复杂性带给硬件实现资源成本高的问题。