基于函数型聚类的空气污染时空特征分析
- 格式:docx
- 大小:232.00 KB
- 文档页数:8
基于改进型YOLOv5的粉尘检测算法 目录 一、内容综述................................................2 1.1 背景与意义...........................................2 1.2 研究目标与内容.......................................3 二、相关工作................................................5 2.1 YOLOv5模型简介.......................................6 2.2 尘埃检测研究进展.....................................7 2.3 改进型YOLOv5模型的提出...............................8 三、改进型YOLOv5模型构建....................................9 3.1 模型结构优化........................................10 3.2 训练策略调整........................................11 3.3 实验参数设置........................................12 四、粉尘检测算法设计.......................................14 4.1 检测原理概述........................................14 4.2 特征提取与分类器设计................................15 4.3 模型训练与优化......................................17 五、实验结果分析...........................................18 5.1 实验环境与参数设置..................................19 5.2 检测结果展示........................................20 5.3 与其他方法的比较分析................................21 六、结论与展望.............................................21 6.1 主要成果总结........................................22 6.2 研究不足与改进方向..................................23 6.3 未来工作展望........................................24 一、内容综述 随着工业化和城市化进程的加速,环境污染日益严重,其中粉尘污染已经成为一个突出的问题。为了有效控制粉尘污染,提高空气质量,研究者们开始探索利用计算机视觉技术进行粉尘检测。传统的粉尘检测方法主要依赖于人工采样和实验室分析,这种方法不仅效率低,而且存在主观因素的影响。基于计算机视觉的粉尘检测算法成为了研究的热点。 在计算机视觉领域,因其具有检测速度快、准确率高等优点而受到了广泛关注。YOLOv5在处理复杂场景下的粉尘检测任务时,仍然面临着一定的挑战。为了提高粉尘检测的准确率和鲁棒性,本文将对基于改进型YOLOv5的粉尘检测算法进行研究。 在改进型YOLOv5的基础上,本研究将重点关注以下几个方面:一是优化网络结构,提高模型的检测性能;二是改进损失函数,以适应粉尘检测的特殊需求;三是引入新的图像处理技术,增强粉尘检测的鲁棒性和准确性;四是结合实际应用场景,优化算法的整体性能。
基于聚类分析的航空装备故障诊断方法研究随着飞机各系统综合化水平的提高,各航空机载设备之间相互交联复杂程度增加,航空装备在日常训练维护中会产生大量的外场故障信息。
对于广大机务人员来说,如何迅速定位故障位置并解决故障,成为一大难题。
除此之外,在飞机大修或航空装备维修方面,工程师需要对飞机或装备进行质量评估,在此过程中不仅要排除已有故障,还要根据装备现有状态进行故障预测。
目前在实际的航空装备维护及修理领域,多依赖于工程师个人经验或单一专家的技术水平,这种方式效率较低,且不具有继承性。
近年来航空设备采购和使用量大,在多年的使用过程中,形成了海量航空设备故障数据,如何有效利用这些已有的故障数据,对其有效信息进行大数据挖掘,提炼总结规律,对认识故障、识别故障、预防故障和解决故障有很大帮助。
本文的目的在于建立一个航空装备故障诊断模型,将不同专业的问题进行归类,实现快速定位轻微、中等设备故障,并对重大故障进行参考。
1概述目前常见的智能故障诊断方法包括:故障树诊断法、基于贝叶斯网络、基于模糊理论、基于人工神经网络、基于专家系统的故障诊断等等,以上方法在飞机或航空装备故障诊断中各有优劣。
数据挖掘是建立在近十年来兴起的以“大数据”、“人工智能”、“深度学习”等为主要特征基础上的成熟技术,在各新兴产业中发挥了重要作用,但是将文本型数据挖掘技术应用到航空装备中较为少见。
本文的目的在于,使用文本挖掘技术建立航空装备故障诊断模型。
基于航空装备外场故障数据库建立了故障预测模型,主要包含3个过程:文本数据的特征提取、文本聚类算法的选择、文本聚类算法的可信度评估。
文本挖掘的核心是文本聚类算法。
聚类分析(cluster analysis)是指依据数据的不同特征,将其划分为不同的数据类,相同类内部的元素尽量相似,不同类之间的元素尽量不相似。
这些不同的类又称为簇(cluster)。
文本聚类(document clustering)则是对文本内容进行的聚类,广泛应用于模式识别和大数据挖掘等领域。
文章透彻解读聚类分析及案例实操目录一、聚类分析概述 (3)1. 聚类分析定义 (4)1.1 聚类分析是一种无监督学习方法 (4)1.2 目的是将相似的对象组合在一起 (5)2. 聚类分析分类 (6)2.1 根据数据类型分为数值聚类和类别聚类 (7)2.2 根据目标函数分为划分聚类和层次聚类 (9)二、聚类分析理论基础 (10)1. 距离度量方法 (11)1.1 欧氏距离 (13)1.2 曼哈顿距离 (14)1.3 余弦相似度 (15)1.4 皮尔逊相关系数 (16)2. 聚类有效性指标 (17)三、聚类分析算法 (18)1. K-均值聚类 (19)1.1 算法原理 (21)1.2 算法步骤 (22)1.3 收敛条件和异常值处理 (24)2. 层次聚类 (25)2.1 算法原理 (26)2.2 算法步骤 (27)2.3 凝聚度量和链接度量 (28)四、案例实操 (30)1. 客户分群 (31)1.1 数据准备 (33)1.2 聚类结果分析 (34)1.3 结果应用 (35)2. 商品推荐 (36)2.1 数据准备 (37)2.2 聚类结果分析 (38)2.3 结果应用 (39)3. 新闻分类 (40)3.1 数据准备 (41)3.2 聚类结果分析 (42)3.3 结果应用 (44)五、聚类分析应用场景 (45)1. 市场细分 (46)2. 社交网络分析 (47)3. 生物信息学 (48)4. 图像识别 (49)六、讨论与展望 (51)1. 聚类分析的局限性 (52)2. 未来发展方向 (53)一、聚类分析概述聚类分析是一种无监督学习方法,旨在将相似的对象组合在一起,形成不同的组或簇。
它根据数据的内在结构或特征,而非预先定义的类别对数据进行分组。
这种方法在数据挖掘、机器学习、市场细分、社交网络分析等领域具有广泛的应用。
特征选择:从数据集中选择合适的特征,以便更好地表示数据的分布和模式。
距离度量:确定一个合适的距离度量方法,用于衡量数据点之间的相似程度。
空气质量评价论文1空气质量指数空气质量指数(AQI)通常由空气的清洁或污染程度来反映,其重点是评估人群呼吸某一段时间(短期或长期)的污染空气后对健康的影响情况。
在实施AQI之前,我国衡量空气质量的指标是空气污染指数(API),它以SO2、NO2和PM10为指标,将各污染物浓度简化计算为单一无量纲指数,并分级表征空气质量优劣。
但随着区域性复合污染和光化学烟雾污染的日益突出,API评价体系已不能很好地反映我国现阶段复杂的空气污染状况。
因此,在借鉴国外经验并结合国内实际情况的基础上,我国将评价指标改为了AQI。
与API相比,AQI也沿用无量纲指数来描述空气质量状况,但评价指标增加到了6项,更加真实全面地反映了空气质量。
AQI评价主要突出单项污染指标的作用,即空气质量级别取决于某一污染物质量浓度对应的空气质量分指数(IAQI)。
可见,AQI计算简便,根据对人体健康影响最大的某项污染物来衡量空气质量状况,有助于人们直观了解空气污染状况。
但当空气中各类污染物质量浓度差异较大时,AQI会掩盖污染物对空气的总体影响状况,丢失大量有用信息,这对研究者分析和掌握空气中污染物组分及各类污染物对空气质量的影响较为不利。
因此,可进一步研究空气质量评价中存在的模糊和灰色区域。
2灰色聚类分析灰色聚类分析充分考虑了环境质量分级的模糊性和环境系统的灰色性,将聚类对象(评价对象)对不同聚类指标(评价指标)所拥有的白化值(实测浓度值),按N个灰类(评价等级)进行归纳整理,从而判断聚类对象属于哪一灰类。
灰色聚类评价算法的研究重点集中在白化函数的选择和聚类权的确定上,经典的灰色聚类模型中白化函数的构造通常是分段直线型的,每个等级的白化函数只与其相邻的两个等级存在亲疏关系,使得白化函数的覆盖范围有限;另外,在聚类权的确定上,各指标权重在不同等级中的不一致性也无法在最大程度上保证评价的规范性和准确性。
对此,本文采用改进的灰色聚类法,通过构造指数型白化函数来拓展覆盖范围,提高评价分辨率和信息利用率,并分别考虑白化值和标准值在不同灰类的权重,使聚类结果更具可比性。
doi:10.3969/j.issn.1005-8141.2021.07.003基于多时相遥感影像的皖北地区城市建成区扩张时空特征分析——以安徽省阜阳市为例蒋伟峰,李天宇,李倩,吴锶梦,周裕祺,陆林(安徽师范大学地理与旅游学院,安徽芜湖241000)摘要:以遥感影像和统计年鉴为数据源,选取城市空间扩张速度等为测度指标,运用空间形态分析等方法探讨了1981—2018年安徽省阜阳市城市建成区扩张的时空演变规律及其影响因素。
结果表明:①阜阳市城市建成区处于扩张阶段,扩张速度和强度呈增长趋势。
②城市建成区外延城市化和内涵城市化并存,其空间形态由紧凑型向分散型转变。
③城市重心由西北部向东南部转移,东南方向仍是城市扩张主导方位。
④经济、人口、政策、地理环境是影响建成区扩张的主要因素。
关键词:城市建成区;遥感影像;时空特征;阜阳市中图分类号:TU984文献标志码:A文章编号:1005-8141(2021)07-0780-07Spatial and Temporal Characteristics of Urban Sprawl in Northern Anhui Based on Multi一temporal Remote Sensing Images-------A Case Study of Fuyang City,Anhui ProvinceJIANG Wei-feng,LI Tian-yu,LI Qian,WU Si-meng,ZHOU Yu-qi,LU Lin(School of Geography and Tourism,Anhui Normal University,Wuhu241000,China)Abstract:This paper used remote sensing images and statistical yearbooks as data sources,urban spatial expansion rate etc.as measurement indicators and spatial analysis etc.as methods to explore the temporal and spatial evolution of Fuyang urban expansion from1981to2018 and its influencing factors.The results showed that:①Fuyang urban area was in the expansion stage,and its expansion speed and intensity are increasing.②T he urban built-up area had both extended urbanization and internal urbanization,and its spatial form has changed from compact to decentralized.③The city's centerof gravity shifted from the northwest to the southeast,and the southeast is still the dominant direction of urban expansion.④E conomy,population,policies,and geographical environment were the main factors affecting the expansion of built-up areas.Key words:urban built-up area;remote sensing image;spatial and temporal characteristics;Fuyang City城市建成区是指行政区范围内经过征用的土地和实际发展起来的非农业生产建设地段,包括城市中集中连片的区域、近郊内联系密切的其他城市建设用地中的非农业生产建设用地[1]。
聚类分析 1.1聚类分析的概念: 聚类分析法是理想的多变量统计技术,主要有分层聚类法和迭代聚类法。 聚类分析也称群分析、点群分析,是研究分类的一种多元统计方法。
1.2常见的聚类分析法: K-means算法、凝聚聚类算法以及EM算法系统聚类法和K均值聚类法是聚类分析中最常用的两种方法
经典的聚类分析方法:【数据挖掘中聚类算法研究和发展-周涛】 1.2.1基于划分的相关聚类算法 K-means 算法是一种最为典型的基于划分的聚类分析算法,自从该算法被开发出来后,就一直被拿来研究和改进。该算法的主要思想是大家非常了解的,首先随机选取 K个对象作为中心点,然后遍历每个数据对象,直到收敛为止。
1.2.2基于密度的相关聚类算法 DBSCAN 算法是一种较为常见的基于密度的聚类分析算法,该算法首先需要将任意的数据对象设定为核心数据对象,在 Eps 范围内包含的数据对象数目要不少于Minpts 规定的个数,然后根据相应的规则来对核心对象进行合并,最终完成类簇的聚类分析。 1.2.3基于层次的相关聚类算法 BIRCH 算法[28]是一种出现较为基本且简单的可以进行良好的伸缩的层次聚类算法。该算法具有较好的聚类表现,它主要包含两个概念:聚类特征(CF)和聚类特征树(CF-Tree),通过这两个概念来进行描述并使得该算法能够有效地处理数据集。
1.2.4基于网格的相关聚类算法 Yang W 等人提出的 STING(Statistical INformation Grid)算法的的核心思想是将目标数据集映射到矩形单元,该空间区域通过分层和递归方法进行划分,其主要是基于多分析率的网格算法。
1.2.5基于模型的相关聚类算法 EM(Exception-Maximization)算法是一种基于模型的聚类方法,该算法主要分为两步,期望步和最大化步。期望步先给定当前的簇中心,将每个数据对象划分到距离簇中心最近的簇,然后最大化步调整每个簇中心,使得该分派的数据对象到新中心的距离之和最小化,直到聚类收敛或改变充分小。
基于函数型聚类的空气污染时空特征分析作者:杨敏王世跃张丹
来源:《经济研究导刊》2021年第29期
摘要:我国经济的飞速发展导致了环境污染问题的加剧。
中共十八大报告中提出“美丽中国,永续发展”的理念,将空气质量问题上升到国家层面。
针对我国空气质量的状况及研究热点区域,为进一步明确安徽省的空气质量时空分布特征,基于聚类分析,采用K均值聚类分析方法和层次聚类(系统聚类)得出安徽省各市空气质量等级的相似程度,并借助于方差分析对两种分析方法进行显著性检验,最后根据空气质量的相似程度将安徽省各城市进行分类,结果表明,在空间上安徽省16个地级市按空气质量变化可以划分成三个区域,从地图上呈现为由北至南污染状况逐渐转优趋势。
关键词:空气质量;聚类分析;方差分析
中文分类号:X823 文献标志码:A 文章编号:1673-291X(2021)29-0043-03
引言
工业革命在给我们带来财富的同时,也带来了环境污染问题,其中空气污染一直是我国经济发展和城市扩张中的重大问题,在这个快速发展经济和科技的时代,我国因为污染问题放慢了前进的脚步。
党的十九大提出的“打赢蓝天保卫战”观点,体现了我国现代化的治理体系以及贴近实际情况而表现出的强大治理能力。
加大大气污染治理力度,对我国来说,既是改善人民生活的重大民生工程,更是促进社会发展和经济发展的重大政治任务。
一方面体现着国家对生态文明建设的重视,另一方面代表着党中央对建设生态文明的坚定决心和极大信心。
通过资料收集,发现关于空气质量对城市进行地域划分的研究非常少见。
叶景山等采用函数型主成分分析法对福建省空气质量指数的影响因素进行分析,同时结合Arc GIS图对其时空分布特征进行描述。
郦少将利用函数型数据的聚类分析方法对浙江省空气质量指数进行研究,从而探讨浙江省空气污染的时空特征。
从现有文献来看,关于空气质量研究主要存在以下问题:(1)关于空气质量的相关研究侧重于研究引发空气质量的不同因素的相关性,而并未按照不同因素将各城市进行一个相似度划分。
(2)关于空气质量的定性研究较多,而借助于一定理论方法进行定量研究的较少。
本文以安徽省16个市作为研究对象,对2013—2019年各市空气质量数据进行采集和处理(数据来源于中国环境监测总站),主要基于函数聚类结果进行分析,将安徽省各地级市按空气污染程度进行分类,并了解分析安徽省时空特征及影响因素。
这不仅对更深层次了解我国环境质量现状有积极意义,而且可以为政府等有关部门制定环境治理与防护措施提供有力依据,从而营造一个良好的大气环境和社会环境。
一、研究方法的选择
本文通过采集到的空气质量指数监测数据,对安徽省16个市的空气污染大气进行时空特征分析,截取2013年10月—2019年12月份期间的各项指标数,对空气质量指数监测数据进行分类汇总处理后,再采用聚类分析,根据其空气质量的相似程度将安徽省各城市进行分类,最后采取方差分析对聚类结果的可靠度进行度量。
聚类分析就是将多个对象或者个体按相似程度进行分类。
本文以安徽省16个地级市为例,基于聚类分析理论分别引入AQI指数和二氧化硫、一氧化碳、PM10、二氧化氮、PM25、臭氧指标等各项污染物的日均值共7个变量,以城市名标注个案,采用K-均值聚类分析方法和层次聚类(系统聚类)得出安徽省各市空气质量等级相似程度。
其次借助方差分析对两种分析方法结果进行显著性检验。
方差分析是一种分析调查或试验结果是否有差异的统计分析方法,分析分类结果的显著性及7个变量对所得结果的显著程度,剔除不关键变量。
二、基于聚类分析研究安徽省空气污染时空特征及影响因素
(一)聚类数的确定
在根据大气污染状况程度对安徽省不同地区进行分类时,由于聚类要素对分类结果的准确性和科学性存在巨大影响,因此首先确定聚类要素为大气污染物含量,然后对其进行处理并将地区确定为聚类对象。
在本次聚类分析中,把PM25日均值、一氧化碳日均值、AQI指数、质量等级、二氧化氮日均值、当天AQI排名、PM102日均值、二氧化硫日均值以及臭氧指标日均值作為聚类分析的指标,利用SPSS软件进行系统聚类,对安徽省16个市2013年10月28日至2019年12月31日数据进行初步的聚类分析,根据聚类结果得到以下分类。
根据初步聚类结果分析,决定把安徽省各地区分成三个类别。
(二)聚类结果分析
利用SPSS软件进行层次聚类操作和K-均值聚类分析的操作,得到聚类结果的谱系图,如图1。
综合聚类分析结果,充分考虑我国大气生态安全的经验和安徽省的实际情况,把安徽省16个市分为三个类别。
其中第一个类别包括淮北市、毫州市、淮南市、蚌埠市、芜湖市、马鞍山市、滁州市、宿州市、合肥市、阜阳市、铜陵市这11个市;第二个类别包括安庆市、宣城市、池州市、六安市这4个市;第三个类别由黄山市构成,黄山市独成一类。
第一类质量等级,当天AQI排名,AQI指数和二氧化氮、二氧化硫、PM25、一氧化碳、臭氧指标、PM10各项24小时均值的指标值都比较高,空气质量在安徽省较差;第二类指标值在中等水平,空气质量在安徽省中等;第三类指标值在较低的水平,空气质量在安徽省较好。
观察安徽省地图分布发现,第一类的城市都分布在安徽省的中北部,空气质量较差;第二类的城市分布在安徽省的中南部,空气质量在安徽省在中等水平;第三类城市处于最南部,空气质量较高。
三、基于方差分析进行显著性检验
为研究臭氧指标、PM25、二氧化硫、二氧化氮、一氧化碳、PM10各项空气污染物日均值和AQI指数等因素与上述聚类中分类汇总的结果之间是否具有显著差异,选取单因素方差分析法进行显著性检验,结果如表1。
以臭氧指标等空气污染物的24小时均值和AQI指数共7个指标作为因变量,以分类汇总得到的N_BREAK做因子,通过单因素方差分析法进行分析。
得出表1是不同指标对分类汇总结果影响的单因素方差分析结果。
可以看到,如果只考虑上述指标的影响,则分类汇总总变差(1 992.519)中的AQI指数均值可解释的变差为1 308.796,随机误差引起的变差为683.722,两者方差分别为327.199和62.157,故可以得到F统计量的观测值为5.264,相对应的P-值为0.013。
在α=0.05的情况下,由于概率值小于显著性水平,所以不能接受原假设,认为AQI指数均值对分类汇总产生了显著影响,该指标是值得认可的。
同理可得到二氧化硫等各项空气污染物24小时均值的变差、方差、F统计量和P-值。
其中仅二氧化硫24小时均值指标未通过显
著性检验,说明该指标在进行分类汇总时没有对结果产生显著影响,而其余指标都通过了显著性检验,因此证明我们的聚类结果是显著有效的。
以AQI指数和二氧化硫、二氧化氮等各项空气污染物的24小时均值为因变量,以城市编号为标记个案,通过K-均值聚类方差分析法进行分析,得到的理论符合单因素方差分析的结论。
因此,更加证明我们的聚类结果是真实可靠的。
四、结论
环境污染是国家发展首先需要重视的问题。
本文通过中国环境监测总站数据发布平台收集到2013—2019年安徽省空气质量数据,基于聚类分析等研究方法将安徽省内地区按空气质量状况大致分为三类,其中安庆市、宣城市、池州市、六安市这4个市空气质量中等,另外仅黄山市空气质量较好。
空气质量时空特征分布在地图上大体呈现为由北至南逐渐转优,这与地理环境因素和人类活动因素有一定关系,南方雨季降水充足,能有效减少空气污染物含量。
这对政府等有关部门进行针对性环境治理具有重要意义,有利于营造良好的社会生活环境,有利于积极践行我国可持续發展理念。
参考文献:
[1] 姚昱阳.长江经济带环境污染变动的时空特征分析[D].武汉:中南民族大学,2018.
[2] 李豫.基于多元函数型数据聚类的我国城市空气质量时空特征分析[D].上海:上海师范大学,2019.
[3] 张叶娥,高云.基于ARIMA模型的大同市空气质量预测研究[J].软件,2019,40(12):85-89.
[4] 祝煦,黄正勇,贺磊.影响环境空气质量的PM2.5与相关因素的关系研究[J].安庆师范学院学报:自然科学版,2015,(1):31-35.
[5] 梁银双,刘黎明,卢媛.基于函数型数据聚类的京津冀空气污染特征分析[J].调研世界,2017,(5):43-48.
[6] 高胜云,王拥兵,张丽霞.系统聚类方法对大气污染地区的划分[J].西昌学院学报:自然科学版,2019,33(2):70-73.
[7] 郦少将.基于函数型聚类的浙江省空气污染时空特征分析[J].河南教育学院学报:自然科学版,2018,98(1):19-24.
[8] 李中建,徐景霞.资源型城市生态环境质量聚类分析研究及启示[J].河南工业大学学报:社会科学版,2013,9(2):51-57.
[责任编辑张宇霞]
作者简介:杨敏(1998-),女,安徽安庆人,学生,从事经济统计学研究。