基于统计量的声呐图像目标检测算法
- 格式:pdf
- 大小:226.88 KB
- 文档页数:4
图像处理论文题目(推荐标题123个)图像处理,用计算机对图像进行分析,以达到所需结果的技术。
又称影像处理。
图像处理一般指数字图像处理。
数字图像是指用工业相机、摄像机、扫描仪等设备经过拍摄得到的一个大的二维数组,该数组的元素称为像素,其值称为灰度值。
下面是123个关于图像处理论文题目,供大家参考。
图像处理论文题目一:1、智能施肥机作物覆盖率测量系统设计——基于北斗导航和多媒体图像处理2、基于OpenCV的精量喷雾图像处理技术3、数字图像处理技术在木材科学中的应用4、图像处理与识别技术的发展应用5、激光超声可视化图像处理研究6、基于MATLAB软件的图像处理技术在电子元器件引脚缺陷检测的应用7、数字图像处理GUI设计及在教学中的应用8、Matlab图像处理在水稻谷粒计数中的应用9、数字图像处理的关键技术研究10、基于图像处理的公交车内人群异常情况检测11、数字图像处理技术的发展及应用12、基于图像处理的变压器呼吸器自动检测13、基于图像处理的智能小车无线远程灭火14、一种新的磁共振图像处理流水线的设计与实现15、采用数字图像处理的羊毛与羊绒纤维识别16、数字图像处理技术在扫描电化学显微镜中的应用17、基于SIFT算法的局部特征点人脸识别图像处理技术18、Matlab软件在“遥感数字图像处理”课程教学中的应用——基于成果导向教育理念19、图像处理Hough变换的慢小目标航迹起始方法20、基于图像处理技术的管道裂缝检测方法研究21、基于声呐图像处理的船用水下目标识别技术研究22、基于图像处理的田间杂草识别定位技术的研究23、一种增强细节的红外图像处理算法24、基于Zynq-7000的伪彩色图像处理系统设计与实现25、基于图像处理技术的聚合物水基钻井液微观结构分形研究图像处理论文题目二:26、研究生数字图像处理教学模式与实验改革探索27、触屏交互的图像处理实验平台设计28、卫星激光测距系统中图像处理子系统设计29、基于CS架构的煤矿井下图像处理算法研究30、一种基于先验知识的弧焊机器人图像处理方法31、电子信息图像处理与卫星遥感技术在船舶目标识别中的应用32、基于图像处理的变电站视频智能分析研究33、基于图像处理的前方行驶车辆速度测量方法34、基于图像处理的小麦叶绿素估测模型研究35、医学影像技术专业数字图像处理与MATLAB教学探索36、深度学习在图像处理领域中的应用综述37、增强图像处理算法在在线加工圆形零件轮廓识别中的应用研究38、一种计算机视觉算法的图像处理技术39、人工神经网络和图像处理技术在叶绿素含量检测中的应用40、Python在图像处理中的应用41、膜计算在图像处理领域应用研究综述42、基于数学形态学的路面裂缝图像处理技术43、SVM在高光谱图像处理中的应用综述44、基于图像处理弓网燃弧检测研究45、基于嵌入式图像处理系统的鱼类轨迹跟踪46、图像处理中处理重叠椭圆轮廓的改进算法47、计算机图像处理技术在医学影像中的进展与应用研究48、基于三维图像处理的虚拟人物重构改进方法49、基于图像处理技术的艺术设计系统设计与实现50、卷积神经网络在图像处理方面的应用图像处理论文题目三:51、基于机器视觉的草莓图像处理研究52、智能摄影测量和图像处理在高分辨率光学遥感影像处理中的应用——CRC-AGIP实验室的案例53、基于图像处理的数控机床运动控制系统54、基于MATLAB图像处理的高速铁路异物侵限检测技术研究55、金属断口图像处理研究进展56、一种基于图像处理的船舶水尺标志识别方法57、基于图像处理的位移测量传感器设计58、基于Matlab GUI的图像处理演示平台设计59、计算机图形学与图像处理的融合课程方案60、基于matlab和小波分析“一体化”法在医学图像处理中应用61、基于DSP6455实时红外图像处理仿真平台设计62、基于FPGA的图像处理系统设计与实现63、图像处理与识别技术的发展及应用分析64、一种基于图像处理的表面故障裂纹检测系统65、基于深度图像处理技术的类圆形重叠颗粒计数66、基于MATLAB GUI的图像处理实验系统设计67、基于图像处理的围岩分级测量实验教学系统开发68、基于Qt的数字图像处理实验演示系统69、基于图像处理的成形砂轮激光切向整形系统算法与实现70、基于数字图像处理的液位测量系统的研究与实现71、基于LabVIEW图像处理的动态拉出值检测方法72、基于稀疏分解和背景差分融合方法的图像处理技术73、基于图像处理的输电线路导线表面损伤特征研究74、基于RFID和图像处理的奶牛测产系统设计75、木质文物三维断层扫描图像处理图像处理论文题目四:76、基于DR图像处理技术的肺部异常检测概述77、基于图像处理技术的火灾识别方法的应用与研究78、基于图像处理技术的等离子体射流稳定性分析79、基于图像处理的光弹应力测量实验80、基于图像处理的轮轴探伤系统对铁路安全的控制研究81、基于HALCON的印花鞋面剪裁图像处理系统设计82、应用图像处理的纱线黑板毛羽量检测与评价83、图像处理技术在车牌识别中的研究84、基于图像处理的印刷板打孔定位与实现85、底吹过程中基于图像处理技术的气泡直径分布特性86、基于图像处理的风电叶片裂纹检测系统设计87、基于图像处理技术的房屋裂缝宽度变化实时监测研究88、智能驾驶汽车视觉图像处理技术89、基于图像处理技术的中药饮片识别研究90、计算机图形图像处理相关技术探讨91、VR全景图像处理技术研究92、人工智能算法在图像处理中的应用93、图像处理技术在激光熔池温度检测的应用94、基于图像处理技术的植物叶片面积和周长测量95、学术导向的图像处理课程教学改革96、基于PIV图像处理法的管内低浓度液固两相流颗粒运动特性研究97、焊接缺陷的X射线自动检测图像处理98、基于LabVIEW和MATLAB的数字图像处理实验教学研究99、基于图像处理的大蒜蒜种品质无损分级方法研究100、基于数字图像处理技术的再生混凝土数值模拟图像处理论文题目五:101、基于MATLAB图像处理的中空纤维膜截面尺寸的测量102、基于图像处理的井下人员身份识别103、基于图像处理技术的隧道裂缝检测综述104、基于变形数字图像处理的土体拉伸试验装置的研发与应用105、改进Canny算法在码垛机器人视觉图像处理中的应用研究106、基于图像处理和压缩感知的鱼群低溶氧胁迫异常行为检测方法107、基于嵌入式图像处理系统的软件设计与实现108、浅析图像处理技术的实际应用109、智能数字图像处理系统的设计与实现110、基于OpenCV图像处理的智能小车户外寻迹算法的设计111、机器学习在图像处理中的应用112、复合材料红外热波检测图像处理技术的研究进展113、基于数字图像处理技术的测树仪算法研究114、基于图像处理的车牌识别检测系统115、小波分析在数字图像处理中的应用116、CMOS相机采集的激光测距图像处理方法研究117、基于图像处理的四旋翼自主跟踪智能车设计118、基于图像处理和无人机的反窃电精准取证系统的设计与实现119、基于小波变换的模糊图像处理系统设计与实现120、基于图像处理的鱼群运动监测方法研究121、图像处理中拉普拉斯矩阵的稀疏化处理122、利用Cryo-SEM和图像处理技术评价老化和再生沥青低温抗裂性的新方法123、基于数字图像处理技术的多孔沥青混合料细观空隙特征规律。
浅析侧扫声呐技术在海洋测绘中的应用摘要:侧扫声呐是利用回声测深原理探测海底地貌和水下物体的设备,目前广泛应用于海洋地形调查以及探测海底礁石、沉船、管道、电缆以及各种水下目标等。
侧扫声呐具有高分辨率、高效率、低成本等优点,可以提供连续的二维海底图像,对于揭示海底地形地貌的细节和特征有重要作用。
本文旨在介绍侧扫声呐的检测原理、国内外现状、在海洋测绘中的应用以及发展趋势,为后续进行海洋侧扫声呐探测技术的研究打下基础。
关键词:侧扫声呐技术,海洋测绘,海底地形地貌探测1侧扫声呐检测原理侧扫声呐技术利用海底地物对入射声波反向散射的原理来探测海底信息,它能直观地提供海底地形地貌的声成像。
其工作原理主要包括以下几个过程:(1)声波的发射:侧扫声呐由拖鱼和船载仪器组成,拖鱼内装有发射换能器和接收换能器阵列,通过电缆与船载仪器相连。
发射换能器向左右两侧发射扇型波束,覆盖一定范围的水体和海底。
(2)声波的接收:接收换能器阵列按一定时间间隔接收水体和海底反射回来的声波信号,并将其转换为电信号传输到船载仪器。
(3)声波的处理:船载仪器对接收到的电信号进行放大、滤波、增益补偿、信噪比提高等处理,以提高信号的质量和可识别性。
(4)声波的显示:船载仪器将处理后的信号按照一定的灰度或颜色编码显示在屏幕上,形成侧扫声呐图像。
声呐图像上的每一行代表一次发射和接收的结果,每一列代表一定距离范围内的回波强度,从而反映海底地形地貌的变化。
2侧扫声呐在海洋测绘中的应用侧扫声呐由于成像分辨率高、对目标区域海底实现全覆盖扫侧,据此对海底地形地貌等进行定性分析,被广泛应用于目标探测,沉船及失事飞机等海底残骸的搜索,海底表层沉积物属性的确定以及海底地震、火山、地层的监测、水下实体结构查勘等。
下面具体介绍一下侧扫声呐在海洋测绘中的应用。
2.1海底地形地貌测量侧扫声呐可以提供连续的二维海底图像,对于揭示海底地形地貌的细节和特征有重要作用。
通过对声呐图像的解译和分析,可以识别出海底的不同类型和形态,如沙纹、基岩、岩石、锚沟等。
多波束与侧扫声呐在水下探测中的应用李英超1 朱俊尧2发布时间:2023-06-18T03:45:26.497Z 来源:《科技新时代》2023年7期作者:李英超1 朱俊尧2 [导读] 近年来,我国很多水下探测人员为了提高探测结果的准确性,逐渐在工作中应用多波束与侧扫声呐。
基于此,本文主要概述了多波束测深系统和侧扫声呐系统,而且分析了多波束与侧扫声呐在水下探测中的应用案例,希望可以为有需要的人提供参考意见。
1.身份证号码:37108219811221xxxx;2.身份证号码:37028119880823xxxx摘要:近年来,我国很多水下探测人员为了提高探测结果的准确性,逐渐在工作中应用多波束与侧扫声呐。
基于此,本文主要概述了多波束测深系统和侧扫声呐系统,而且分析了多波束与侧扫声呐在水下探测中的应用案例,希望可以为有需要的人提供参考意见。
关键词:多波束;侧扫声呐;水下探测对于水资源开发利用而言,水下障碍物探测是重要的基础,其可以运用先进的探测技术,准确测量水下地形及障碍物,如此一来,除了可以保证水域船舶安全通行,也能科学指导水下救援工作的进行。
在现阶段的水下探测中,经常采用的探测方法有两种,一种是多波束,另一种是侧扫声呐。
从根本上来看,这些障碍物探测手段都是条带式扫海系统,其可以扫测整个水底地形。
然而在扫测过程中,不管是多波束还是侧扫声呐,都有着不同的工作原理以及方法,此文将某个水库救援-测试项目作为例子,科学分析多波束和侧扫声呐的应用要点和应用效果。
一、多波束测深系统和侧扫声呐系统的概述(一)多波束测深系统当前,在水下测深中普遍应用多波束探测系统。
就设备结构单元来讲,通常其包含多个单元,比如:测深设备以及定位设备等等。
其中,该系统的数据分辨率容易受到很多因素影响,最为主要的是探测设备多波束换能器。
对于系统而言,差分GNSS接收机属于定位装置,在障碍物定位测量过程中其起到控制测量的重要作用。
在多波束测深过程中,利用罗经运动传感器可以迅速测量航向数据,而且对船实时姿态准确测量。
mlsys方法摘要:1.什么是MLSY方法?2.MLSY方法的核心原理与应用领域3.如何实施MLSY方法?4.MLSY方法的优势与局限性5.我国在MLSY方法的研究与应用现状正文:MLSY方法,全称为“多层信号处理系统(Multi-Layer Signal Processing System)”,是一种基于多层信号处理的先进技术。
该方法通过对信号进行多层次的处理和分析,实现了在复杂环境中对信号的识别、提取和重构,具有广泛的应用前景。
MLSY方法的核心原理是将信号分为多个层次,每个层次对应不同的处理任务。
在底层,MLSY方法主要针对原始信号的预处理,如滤波、去噪等;中间层则侧重于特征提取和特征匹配,以实现信号的识别和分类;顶层则负责对信号进行重构和优化,以提高信号质量。
这种层次化的处理方式使得MLSY方法具有较强的适应性和鲁棒性,能在各种复杂环境下有效运行。
MLSY方法的应用领域十分广泛,包括但不限于通信、雷达、声呐、图像处理、生物医学信号处理等。
在通信领域,MLSY方法可以用于信道估计、信号解调等任务;在雷达和声呐领域,MLSY方法可以实现对目标的检测、跟踪和识别;在图像处理领域,MLSY方法可以提高图像的清晰度和质量;在生物医学信号处理领域,MLSY方法有助于疾病的诊断和治疗。
实施MLSY方法的关键步骤包括:1.确定信号处理层次和任务;2.选择合适的信号处理算法;3.设计合理的信号处理模块;4.搭建多层信号处理系统;5.对系统进行优化和调试。
MLSY方法的优势在于其层次化的处理方式,使得信号处理更加细致和高效。
同时,MLSY方法具有较强的适应性和鲁棒性,能在各种复杂环境下运行。
然而,MLSY方法也存在一定的局限性,如处理复杂度较高、计算量较大等。
在我国,MLSY方法的研究与应用已取得了一定的成果。
科研人员不仅在理论上进行了深入研究,提出了多种改进的MLSY算法,还将其成功应用于实际领域,如通信、雷达、图像处理等。
基于迁移学习的水声目标识别①邓 晋1, 潘安迪1, 肖 川1, 刘姗琪21(复旦大学 计算机科学技术学院, 上海 201203)2(中国电子科技集团公司第二十三研究所, 上海 200437)通讯作者: 邓 晋, E-mail: *********************摘 要: 海洋声场环境的时变空变特性、水声目标发声机理的多源性以及其他噪声源的干扰, 给水声目标的检测和识别带来很多困难. 常规的目标识别手段主要是基于音频时频域特征分析, 在复杂海洋环境下的难以获取有效的表征特征及鲁棒的识别效果. 为了解决这些问题, 本文提出了基于迁移学习的水声目标识别, 分别利用预训练网络VGG 和VGGish 提取深层声学特征及模型微调, 实现水声目标的分类识别. 实验表明, 本文提出的识别算法有效提升了识别准确率, 减少了训练时间, 基于微调的迁移学习算法在水声目标识别上平均准确率为92.48%, 取得了当前最好的识别结果.关键词: 迁移学习; 水声识别; 信号特征表征; 音频分类; 舰船噪声引用格式: 邓晋,潘安迪,肖川,刘姗琪.基于迁移学习的水声目标识别.计算机系统应用,2020,29(10):255–261. /1003-3254/-7538.htmlTransfer Learning for Acoustic Target RecognitionDENG Jin 1, PAN An-Di 1, XIAO Chuan 1, LIU Shan-Qi 21(School of Computer Science, Fudan University, Shanghai 201203, China)2(The 23rd Research Institute of China Electronics Technology Group Corporation, Shanghai 200437, China)Abstract : The time-varying and space-varying characteristics of the marine sound field environment, the multi-source nature of the sound mechanism of underwater acoustic targets, and interference from other noise sources have brought many difficulties to the detection and identification of acoustic targets. Conventional target recognition methods are mainly based on the audio time-frequency domain analysis, it is difficult to obtain effective features and robust recognition effects. In order to solve these problems, transfer learning based acoustic target recognition is proposed. The pre-trained networks VGG and VGGish are used to extract deep acoustic feature analysis and fine-tune respectively.Experiments show that the proposed algorithm effectively improves the recognition accuracy and reduces the training time. The fine-tuned transfer learning algorithm has an average accuracy rate of 92.48% in acoustic target recognition,which achieved the state-of-the-art recognition result.Key words : transfer learning; acousticrecognition; signal feature characterization; audio classification; ship noise水声目标识别技术是一种利用声呐接收的被动目标辐射噪声、主动目标回波以及其他传感器信息提取目标特征并判别目标类型或舰型的信息处理技术[1]. 水声目标识别包括声呐技术、环境感知计算、监听技术[2]等. 在水声领域, 目标分类与识别是国际公认的难题, 目前尚无有效的方法实现水声目标的准确识别. 海水是声音在水下传播的介质, 但海水的分层特性、时变特性以及区域不均匀性, 使声音在船舶过程中受信计算机系统应用 ISSN 1003-3254, CODEN CSAOBNE-mail: ************.cn Computer Systems & Applications,2020,29(10):255−261 [doi: 10.15888/ki.csa.007538] ©中国科学院软件研究所版权所有.Tel: +86-10-62661041① 基金项目: 国家自然科学基金(61671156)Foundation item: National Natural Science Foundation of China (61671156)收稿时间: 2019-12-21; 修改时间: 2020-01-19; 采用时间: 2020-02-25; csa 在线出版时间: 2020-09-30道畸变、混响和杂波的影响, 导致信号强度衰减, 特征被掩盖, 进而给水声目标特征识别和分类带来很大的挑战. 远航、风、波、洋湍流提高了海洋环境中噪声水平, 重要信号被遮蔽, 使目标信号的探测和识别性能严重下降[3]. 因此, 如何有效探测和估计长距离低信噪比下的目标、以及从船舶辐射噪声信号中提取特征[4],是水下定位、识别和跟踪的迫切问题, 实际上, 水声目标识别一直是国际公认的难题.本文的组织结构如下: 第1节介绍基于传统声学特征水声目标识别概况; 第2节介绍基于迁移学习的水声目标识别背景及方法; 第3节实验结果及分析; 第4节文章总结及未来工作展望.1 基于传统声学特征的水声目标识别水中目标辐射噪声组成复杂, 主要声源包括: 机械噪声、螺旋桨噪声和水动力噪声[5]. 一般的水声目标识别都是基于人工特征的, 通常包括: 时频特征[2,6,7]、线谱[4,8–11]、DEMON谱[5]等等. 在人工提取特征后使用统计学模型、模式分类或专家系统等方法进行分类识别. 算法1为基于传统声学特征的水声目标识别算法.算法1. 基于传统声学特征的水声目标识别算法1) 预处理, 将水听器阵列采集到的声呐信号通过信号增强, 提高信噪比.2) 特征提取, 提取帧级别的时域或频域信息, 诸如: 线谱分布、连续谱能量谱分布、特定频段线谱数量、LOFAR谱和DEMON等.3) 分类识别, 基于水声目标特征的分类识别方法主要有统计分类、模型匹配、神经网络和专家系统等方法.在过去的20年中, 通过发展先进的水声信号处理技术, 对舰船辐射噪声的特征提取方式进行了广泛多样的探索[12]. 这些方法里面比较经典的有, 利用振荡性质, Duffing振子[10]和随机共振理论[11]检测船舶辐射噪声的线谱. 由于音频信号的非平稳特性, 时频分析技术更适合于非平稳信号, 这种方法的优点是能结合时域中的非平稳信息和频域信息, 例如短时傅立叶变换(STFT)[6,7], 小波变换(WT)[6,13,14]和Hilbert-Huang变换(HHT)[15,16]. 考虑到船舶辐射噪声的非线性特性, 许多方法被用来提取非线性特征, 包括相空间重构[17,18], 基于信号调制的DEMON谱分析[5], 基于序贯检测思想的LOFAR分析[19], 基于分形的方法[20,21], 和复杂性度量[22]等.2 基于迁移学习的水下声源识别D s={x i,y i}n i=1D t={x j,y j}n+mi=n+1P(x s)P(x t)P(x s) P(x t)D sD t在机器学习领域, 迁移学习[20]被定义为针对一个有标记的源域和目标域,这两个领域的数据分布和不同, 即, 迁移学习的目的就是要借助的知识, 来学习目标域的知识(标签). 通常有算法2所示的4种方法实现迁移学习.算法2. 迁移学习的4种基本方法1) 基于样本迁移, 根据一定的权重生成规则, 对数据样本进行重用.2) 基于特征迁移, 通过特征变幻的方法相互迁移, 来减少源域和目标域之间的差距; 或者将源域和目标域的数据特征变换到统一特征空间中, 然后利用传统机器学习方法进行识别.3) 基于关系迁移, 关注源域和目标域的样本之间的关系, 挖掘不同领域之间的相似性.4) 基于模型迁移, 从源域和目标域中找到他们之间共享的参数, 以实现知识的迁移.迁移学习的常见动机是目标任务中缺少足够的训练数据, 当使用神经网络时, 通过共享预训练网络的权重参数, 可以显著减少目标任务模型中需要训练参数的数量, 从而以较小的数据集实现有效的学习[23]. 一个流行的例子是在计算机视觉中迁移学习用于图像语义的分割, 该网络可以利用在图像分类[24]任务中学习到的诸如图像基本形状等丰富的信息并进一步用于图像分割任务.针对图像任务, Visual Geometry Group (VGG)[25]模型是由Google开发和维护的图像分类模型, VGG16是最好的图像分类模型之一, 它经过1000种物体的训练, 因此可以识别1000种物体.针对音频任务, 数据集AudioSet[26]是基于人们上传到YouTube的大量数据及所提供的标签. 其包含567个不同类型的音频数据, 总时长约567小时. Google 已经发布了基于该数据集训练的模型VGGish[27], 它在网络的较低层处理频谱图, 并在较高层时使用多个卷积层和完全连接层获取深层表征用于后续分类.深度学习技术可以从原始数据中学习特征, 在提取信号样本的固有特征方面具有优势, 特别是在复杂环境下, 这种特征提取上面的优势相比传统特征提取方法更为突出. 迁移学习可以将在学习一项任务时获得相应的知识用来解决相关的任务, 通常可以将源任务的部分参数用于目标任务. 受此启发, 基于频谱与图片的二维相似性, 我们提出了两类迁移学习方案, 一是分别利用基于ImageNet[28]及AudioSet分别预训练的计算机系统应用2020 年 第 29 卷 第 10 期模型作为特征提取器, 将学习到深度特征进一步用于分类; 二是对上述模型进行微调.图1是基于迁移学习的水下声源识别算法的整体流程, 主要分为3个部分: (1)信号预处理, 对输入信号进行分段规整及傅里叶变换; (2)进行深层特征提取并选取相应分类器进行分类; (3)对相应预训练网络进行微调.音频信号预处理分类器分类结果微调深度特征提取+图1 算法整体流程2.1 预处理如图2(a)所示, 舰船辐射噪声能量主要集中分布于8000 Hz以下的低频部分[29], 基于这种能量分布规律, 为了更好地刻画低频成分的分布规律, 我们借鉴了语音识别中的梅尔频谱. 其中, 目标音频信号采样率为52 734 Hz, 使用具有50%重叠的90 ms汉明窗加窗函数, 输出的梅尔频谱存储为3×224×224的图片格式, 以便后续操作后续用于VGG16网络的输入. 此外, VGGish 预训练网络的输入采样频率为16 000 Hz, 我们对实验音频数据进行了下采样. 窗口长度(STFTlength)为25 ms,重叠长度(Hopsize)为10 ms, 输出频谱为96×64, 嵌入(Embedding)编码大小为128. 如图2所示, 图2(a)表示音频信号的功率谱, 图2(b)表示音频信号的经傅里叶变换后的线性功率谱, 图2(c)表示音频信号的梅尔频谱.0.0040.003切片0.0020.00125 00020 00015 00010 000500081924096204810245120 1.5 3.0 4.5 6.07.59.05115(a)(b)(c)225傅立叶变换梅尔滤波梅尔频谱图2 VGG网络预处理及谱示意图2.2 使用预训练网络提取深度特征用于分类如图3为使用预训练网络特征提取器的迁移学习框架. 本文分别使用基于音频预训练的VGGish, 以及基于图像预训练的VGG16网络分别作为特征提取器.分别将网络输出层的输出作为特征向量, 其特征向量长度分别为128和4096.分类器特征特征向量音频频谱输出层卷积神经网络标签数据+标签图3 使用预训练网络作为特征提取器本文使用scikit-learn[30]的SVM和kNN的算法实现, 以及开源ELM的算法实现, 分别进行实验并对比VGGish和VGG16抽取的深度特征向量在不同分类器(SVM, kNN和ELM)中的识别性能.(1) SVMk(x,y)σ支持向量机(Suport Vector Machine, SVM)[31]是在分类与回归分析中分析数据的监督式学习模型与相关的学习算法. 原始数据是在有限维空间中分布的, 但一般区分的集合在该空间中往往线性不可分. 为此, SVM 将原有限维空间映射到维数高更高的空间中, 并在高维或无限维空间中构造超平面或超平面集合用以划分不同的集合. 为了保持计算负荷合理, 人们选择适合该问题的核函数来定义SVM方案使用的映射, 以确保用原始空间中的变量可以很容易计算点积. 在本文中, 我们分别采用线性核函数(LinearSVM)和高斯核函数作为支持向量机的核函数, 高斯核函数表示如式(1), 其中是带宽.K(x,y)=exp(−||x−y||22σ2)(1)(2) kNNk最近邻(k-Nearest Neighbor, kNN)[32]分类算法是是一种用于分类和回归的非参数统计方法. 在这两种情况下, 输入包含特征空间(Feature Space)中的k个最接近的训练样本. 在kNN分类中, 输出是一个分类族群. 一个对象的分类由其邻居的“多数表决”确定, k个2020 年 第 29 卷 第 10 期计算机系统应用最近邻居(k为正整数, 通常较小)中最常见的分类决定了赋予该对象的类别. 若k = 1, 则该对象的类别直接由最近的一个节点赋予. kNN是基于实例(Instance-based)的学习方法, kNN算法没有训练的步骤, 因为数据集就是模型本身, 在有新样本输入时, 将测量样本与训练集中每个点的距离, 选择k个最接近的点作为k 最近邻, 新样本的类别即为k个点中数量最多的类别,可以描述为以下公式:C test=max(C1,C2,C3,···,C n)(2)其中, C i为K近邻点中类别为i的点的个数, k和点之间的距离度量方式是可选的参数, 经过实验, 本选取欧式距离作为度量, k取值为5.(3) ELM极限学习机(Extreme Learning Machine, ELM)[33]实际上也属于前馈神经网络, 极限学习机的出现主要是为了解决神经网络训练训练速度慢的问题. 传统的前馈神经网络(如BP神经网络)需要人为设置大量的网络训练参数, 此算法却只需要设定网络的结构, 而不需设置其他参数, 因此具有简单易用的特点. 其输入层到隐藏层的权值是一次随机确定的, 算法执行过程中不需要再调整, 而隐藏层到输出层的权值只需解一个线性方程组来确定, 因此可以提升计算速度.极限学习机原理如下: 其中W1是输入向量到隐藏节点层的权重矩阵, σ是激活函数, W2是隐藏节点层到输出向量的权重矩阵.ˆY=W2σ(W1x)(3) ELM对超参数敏感, 我们对其进行了参数搜索,并使用ReLU作为非线性激活函数. 其中, ELM的主要超参数是隐藏的单元数: 100、250、500、1200、1800、2500. 本文使用开源ELM实现, 该代码可从https:// /zygmuntz/Python-ELM获取.2.3 微调如图4所示, 实验选择了基于VGG与训练的VGG16网络进行微调, 其中VGG16网络的输入为[3,224,224], VGGISH的输入为[96,64], 本文使用Python的librosa 扩展包计算音频的梅尔频谱图作为网络的输入. 考虑到实验所用数据集音频时长, 我们无法微调整个网络,因此在实验中只微调了嵌入层(Embeddinglayers), 并使用一些正则化技术训练一个简单的多层感知机(MLP, Multiayer Perceptron), 使用ReLU激活函数, Batch Norm正则化和Dropout的前连接隐藏层, 最终输出为5类.224×224×3224×224×64112×112×12856×56×25628×28×51214×14×5127×7×5121×1×40961×1×n微调(Fine-tune)卷积+ReLU最大池化 (Max polling)全连接+ReLUSoftmax 层图4 使用音频频谱对VGG16预训练网络进行微调ABCDE0:000:100:200:300:400:50Time1:001:101:201:30图5 A~E五类音频波形及梅尔频谱3 实验及结果分析3.1 数据集本文使用的船只噪声数据来自2012年至2013年间在西班牙海岸不同地区录制的ShipsEar[29]数据集.该数据集共有在15 s到10 分钟以内的11种舰船类型共计90条记录, 按照数据集原文的标注, 根据舰船种类的可以将它们合并为A、B、C、D各4个大类, 以及E类1个背景噪声, 如图5所示为选取5个类的音频波形及其梅尔频谱实例, 其中, 横轴为时间, 纵轴分别为振幅和梅尔频率. 详细划分如表1所示.表1 ShipsEar数据集详情类别数据集A Fishingboats; Trawlers; Musselboats; Tugboats; DrafgersB Motorboats; Pilotboats; SailboatsC PassengerferriesD Oceanliner; Ro-RovesselsE Backgroundnoiserecordings3.2 评价指标我们将模型预测值与真实标签进行比较, 获取测计算机系统应用2020 年 第 29 卷 第 10 期试中所有样例的真正例(TP), 假正例(FP), 真负例(TN)和假负例(FN)个数. 并针对每一个实验结果分别计算准确率、召回率及F1函数, 用以全面而准确地度量来实验结果. 其中, 准确率是所有正确被检索的结果(TP)占所有实际被检索到的(TP+FP)的比例; 召回率是所有正确被检索的结果(TP)占所有应该检索到的结果(TP+FN)的比例; F1是准确率和召回率的调和平均数.这些指标可以用以下公式表示:accuracy=T PT P+FP+T N+FN(4)recall=T PT P+FN(5)F1=21precision+1recall(6)3.3 实验结果和分析本文选取当前在ShipEar数据上使用神经网络取得的最好分类结果的论文: 基于深度玻尔兹曼机的水声目标识别[3]作为对照文章. 该方法是一种可通过输入数据集学习概率分布的随机生成神经网络.(1)基于预训练网络特征提取的识别效果如表2所示, 将VGGish及VGG16分别直接作为特征提取器, 得到的特征向量分别作为不同分类器的输入. 在使用VGG16的特征向量与最近邻分类算法kNN组合时, 取得了最好的分类结果, 平均最优准确率为90.26%, 与当前最好的结果DBM[3]只差了不到0.5个百分点. 此外, VGGish特征向量在与支持向量机SVM 组合时也取得了准确率为87.78%比较理想的分类结果.表2 不同训练网络特征向量与不同分类器的性能指标预训练网络性能指标LinearSVM SVM kNN ELMVGGISH Acc0.77670.87780.87360.8610 Rec0.75270.85530.87910.8560 F10.76290.87090.87190.8612VGG16Acc0.85040.86720.90260.8238 Rec0.84920.84360.90440.8185 F10.84890.86380.90460.8282(2)基于微调预训练网络的识别效果本文将基于音频数据集预训练的VGGish及基于图片数据集预训练的VGG16分别去掉原始Softmax 层之后, 加入不同的全连接层和新的Softmax输出层,如表3所示, 在VGGish上取得的最优准确率为89.22%,在VGG16上最优准确率为92.48%. 相对当前最优的DBM网络的90.70%, 本文提出的算法有比较明显的性能提升.表3 微调VGGISH、VGG16及DBM网络性能指标网络隐层网络结构平均准确率VGGISH−64−50.8627−128−50.8922−128−32−50.8871 VGG16−512−50.9177−1024−50.9248−1024−512−50.9106 DBM−500−50.8860−500−500−50.9030−−500−500−200−50.9070如图6所示, 对于添加一个神经元个数为1024隐层的VGG16网络, 当使用对数损失函数时, 损失函数随训练次数的变化,在大约200次迭代后即收敛, 相比DBM[3]的收敛速度大约提升了5倍.1.00.80.60.40.20255075100125Number of epochs150175200 Loss图6 VGG16在训练集上的错误率如图7所示, 横轴为真实值, 纵轴为预测值, 可以看出, 针对类别E, 即环境噪声的平均预测准确率为98%左右, 且不存在漏判, 即没有识别出将舰船噪声并当做环境音; 算法对于针对A、B、C、D四类舰船噪声的识别准确率分别为90%、83%、92%、93%. 其中, 针对B类相对较低的准确率, 仅为83%, 通过对ShipsEar数据集的分析, 我们认为是B类数据的量相对于A、C、D类原始数据的相对不均衡, 这个问题可以通过进一步扩充数据集得到避免. 总的来说, 我们提出的基于迁移学习的水声目标识别算法, 多次试验平均最优准确率为92.48%, 取得了当前最好的分类效果,在算法训练和数据处理上也有比较明显的优势.4 结论与展望在水声目标识别受限于海洋环境的复杂性, 而难2020 年 第 29 卷 第 10 期计算机系统应用以提取有效的目标特征并进行分类的背景下, 本文首次采用基于迁移学习的水声目标识别方法, 分别采用预训练网络特征提取和微调两种迁移学习方法, 并应用ShipsEar 数据集, 进行了算法验证. 结果表明, 与当前最好的DBM 分类算法相比, 我们取得了92.48%的最好平均准确率. 总的来说, 通过实验我们验证了迁移学习应用于水声目标分类中的可行性, 并且迁移学习可以解决在音频领域的数据稀疏问题. 此外, 这种思路也许可以被用于很多不同的音频任务, 具有广阔的应用前景.Normalized confusion matrixA0.900.000.050.050.000.80.60.40.20.00.040.830.080.040.000.020.040.920.010.000.050.000.020.930.000.000.000.020.000.98B CDEABCPredicted labelD ET r u e l a b e l图7 5个类的分类混淆矩阵参考文献方世良, 杜栓平, 罗昕炜, 等. 水声目标特征分析与识别技术. 中国科学院院刊, 2019, 34(3): 297–305. [doi: 10.16418/j.issn.1000-3045.2019.03.007]1Chu S, Narayanan S, Kuo CCJ. Environmental soundrecognition with time-frequency audio features. IEEE Transactions on Audio, Speech, and Language Processing,2009, 17(6): 1142–1158. [doi: 10.1109/TASL.2009.2017438]2Xie JW, Chen J, Zhang J. DBM-based underwater acousticsource recognition. Proceedings of 2018 IEEE International Conference on Communication Systems (ICCS). Chengdu,China. 2018. 366–371.3Liu J, He Y, Liu Z, et al . Underwater target recognitionbased on line spectrum and support vector machine.Proceedingsof2014InternationalConferenceonMechatronics, Control and Electronic Engineering (MCE-14). Paris, France. 2014.4Chung KW, Sutin A, Sedunov A, et al . DEMON acousticship signature measurements in an urban harbor. Advances in 5Acoustics and Vibration, 2011, 2011: 952798. [doi: 10.1155/2011/952798]Sejdić E, Djurović I, Jiang J. Time-frequency featurerepresentation using energy concentration: An overview of recent advances. Digital Signal Processing, 2009, 19(1):153–183. [doi: 10.1016/j.dsp.2007.12.004]6Wang Q. Underwater bottom still mine classification usingrobust time–frequency feature and relevance vector machine.International Journal of Computer Mathematics, 2009, 86(5):794–806. [doi: 10.1080/00207160701704572]7Cai YB, Zhang MZ, Shi XZ, et al . The feature extraction andclassification of ocean acoustic signals based on wave structure. Acta Electronica Sinica, 1999, 27(6): 129–130.8Li N, Li XK. A stochastic resonance of line-spectrumextraction method for underwater target recognition. Journal of Information & Computational Science, 2014, 11(18):6437–6446.9Zheng SY, Guo HX, Li YA, et al . A new method fordetecting line spectrum of ship-radiated noise using duffing oscillator. Chinese Science Bulletin, 2007, 52(14):1906–1912. [doi: 10.1007/s11434-007-0271-4]10Fu ZK, Xing JC, Zhu RD, et al . A new method of detectingline-spectrum based on auto-correlation with stochastic resonance theory. Proceedings of the 2013 25th Chinese Control and Decision Conference (CCDC). Guiyang, China.2013. 1104–1107.11Ma YC, Chin CS, Woo WL, et al . An acoustic annoyancestudy of hard disk drive for laptop. IEEE Transactions on Magnetics, 2016, 52(8): 3301609.12Azimi-Sadjadi MR, Yao D, Huang Q, et al . Underwatertarget classification using wavelet packets and neural networks. IEEE Transactions on Neural Networks, 2000,11(3): 784–794. [doi: 10.1109/72.846748]13Averbuch A, Zheludev V, Neittaanmäki P, et al . Acousticdetection and classification of river boats. Applied Acoustics,2011, 72(1): 22–34. [doi: 10.1016/j.apacoust.2010.09.006]14Huang NE, Shen SSP. Hilbert-Huang Transform and ItsApplications: Volume 16. 2nd ed. London: World Scientific,2014.15Lin L, Chu FL. Feature extraction of AE characteristics inoffshore structure model using Hilbert-Huang transform.Measurement, 2011, 44(1): 46–54. [doi: 10.1016/j.measure ment.2010.09.002]16Kennel MB, Brown R, Abarbanel HDI. Determiningembedding dimension for phase-space reconstruction using a geometrical construction. Physical Review A, 1992, 45(6):17计算机系统应用2020 年 第 29 卷 第 10 期3403–3411. [doi: 10.1103/PhysRevA.45.3403]Meng QX, Yang S, Piao SC, et al . Research on chaoticcharacter of ship-radiated noise based on phase space reconstruction. Proceedings of 2012 International Conference on Image Analysis and Signal Processing. Hangzhou, China.2012. 1–5.18de Moura NN, Filho ES, de Seixas JM. Independentcomponent analysis for passive sonar signal processing. In:Silva SR, eds. Advances in Sonar Technology. Austria: In-Teh, 2009.19Pan SJ, Yang Q. A survey on transfer learning. IEEETransactions on Knowledge and Data Engineering, 2010,22(10): 1345–1359. [doi: 10.1109/TKDE.2009.191]20Yang S, Li ZS, Wang XL. Ship recognition via its radiatedsound: The fractal based approaches. The Journal of the Acoustical Society of America, 2002, 112(1): 172–177. [doi:10.1121/1.1487840]21Wang Y, Liu QY. Multi-scale permutation entropy as a toolfor complexity analysis of ship-radiated noise. Proceedings of 2016 IEEE/OES China Ocean Acoustics (COA). Harbin,China. 2016. 1–4.22Choi K, Fazekas G, Sandler M, et al . Transfer learning formusic classification and regression tasks. Proceedings of 18th International Society for Music Information Retrieval Conference. 2017. 141–149.23Oquab M, Bottou L, Laptev I, et al . Learning andtransferring mid-level image representations usingconvolutional neural networks. Proceedings of 2014 IEEE Conference on Computer Vision and Pattern Recognition.Columbus, OH, USA. 2014. 1717–1724.24Simonyan K, Zisserman A. Very deep convolutionalnetworks for large-scale image recognition. In: Bengio Y,25LeCun Y, eds. 3rd International Conference on Learning Representations. San Diego, CA, USA. 2015.Gemmeke JF, Ellis DPW, Freedman D, et al . Audio set: Anontology and human-labeled dataset for audio events.Proceedings of 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). New Orleans, LA, USA. 2017. 776–780.26Hershey S, Chaudhuri S, Ellis DPW, et al . CNN architecturesfor large-scale audio classification. Proceedings of 2017IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). New Orleans, LA, USA. 2017.131–135.27Deng J, Dong W, Socher R, et al . Imagenet: A large-scalehierarchical image database. Proceedings of 2009 IEEE Conference on Computer Vision and Pattern Recognition.Miami, FL, USA. 2009. 248–255.28Santos-Domínguez D, Torres-Guijarro S, Cardenal-López A,et al . Shipsear: An underwater vessel noise database. Applied Acoustics, 2016, 113: 64–69. [doi: 10.1016/j.apacoust.2016.06.008]29Pedregosa F, Varoquaux G, Gramfort A, et al . Scikit-learn:Machine learning in python. The Journal of Machine Learning Research, 2011, 12: 2825–2830.30Suykens JAK, Vandewalle J. Least squares support vectormachine classifiers. Neural Processing Letters, 1999, 9(3):293–300. [doi: 10.1023/A:1018628609742]31Keller JM, Gray MR, Givens JA. A fuzzy K-nearest neighboralgorithm. IEEE Transactions on Systems, Man, and Cybernetics, 1985, SMC–15(4): 580–585.32Huang GB, Zhu QY, Siew CK. Extreme learning machine:Theory and applications. Neurocomputing, 2006, 70(1–3):489–501.332020 年 第 29 卷 第 10 期计算机系统应用。
技术交流▏应用侧扫声呐的海底目标探测技术研究多波束测深系统以条带测量的方式,可以对海底进行100%的全覆盖测量,每个条带的覆盖宽度可以达到水深的数倍。
应用这种高新技术,不仅可以获得高精度的水深地形数据,还可以同时获得类似侧扫声纳测量的海底声像图,为人们提供了直观的海底形态;侧扫声纳的出现为海底探测提供了完整的海底声学图像,用于获得海底形态,并对海底物质的纹理特征进行定性的描述。
利用侧扫声纳和多波束测深系统能够探测海底地形、地貌、障碍物的特点,侧扫声纳和多波束测深系统在大陆架测量、港口疏浚、渔业捕捞、水利和生态监测、海底电缆探测、油气管道布设路径地形测绘以及轮船锚泊海区检测等方面均得到了广泛的应用,且取得了明显的效果,两者都是开发和利用海洋资源必需的仪器设备。
在水深测量精度、定位精度、声像图分辨率等方面两者又各有独特的优点,如果将两者综合起来加以应用,可有效增强不同观测数据的互补性,提高工程质量。
本文以EdgeTech 4200FS型侧扫声纳和SimradEM1002型多波束测深系统为例来说明其在海洋目标探测中的综合应用。
一、侧扫声纳和多波束测深系统的特点多波束测深系统与侧扫声纳都是实现海底全覆盖扫测的水声设备,都能够获得几倍于水深的覆盖范围。
它们具有相似的工作原理,以一定的角度倾斜向海底发射声波脉冲,接收海底反向散射回波,从海底反向散射回波中提取所需要的海底几何信息。
由于接收波束形式的不同以及对所接收回波信号处理方式的不同,多波束测深仪通过接收波束形成技术能够实现空间精确定向,利用回波信号的某些特征参量进行回波时延检测以确定回波往返时间,从而确定斜距以获取精确的水深数据,绘制出海底地形图。
侧扫声纳只是实现了波束空间的粗略定向,依照回波信号在海底反向散射时间的自然顺序检测并记录回波信号的幅度能量,仅仅显示海底目标的相对回波强度信息,获得海底地貌声像图。
⒈ 高精度的水深和定位数据多波束测深系统在处理接收的海底反向散射回波时,有着精密的空间定向,从回波信号时延处理上,有着准确的回波信号时延检测,因此多波束测深系统测量的水深数据精度高;从回波信号幅度处理上,多波束测深系统虽然也需要幅度的归一化处理,但不象侧扫声纳的归一化处理那样严格,远近端回波信号基本均匀,满足时延检测即可,因此多波束测深系统在测量水深的同时虽然也能获得类似侧扫声纳的海底声像图,为人们提供直观的海底形态,但声像图质量不高,分辨率较低。