物联网中传感节点数据异常检测方法研究
- 格式:pdf
- 大小:284.31 KB
- 文档页数:4
物联网环境中的传感器数据质量评估与筛选方法随着物联网技术的不断发展和应用,传感器在物联网环境中扮演着重要的角色,用于采集环境数据并实现智能控制。
然而,传感器数据质量的准确性和可靠性对于物联网系统的正常运行至关重要。
本文将探讨物联网环境中的传感器数据质量评估与筛选方法,以提高数据的准确性和可靠性。
传感器数据质量评估是指对传感器采集的数据进行可靠性和准确性的评估。
传感器数据质量评估的目的是识别和排除数据中的异常、错误和异常情况,以确保物联网系统的可靠性和性能。
以下是一些常用的传感器数据质量评估方法:1. 数据准确性评估:通过与其他准确数据的比对,判断传感器数据的准确性。
可以使用数学模型或基准测量工具对传感器数据进行校正。
另外,还可以使用多个传感器进行冗余度检验,筛除异常数据。
2. 数据一致性评估:数据一致性是指同一传感器在不同时间和条件下采集到的数据之间的一致性。
采用统计方法,比如方差分析和相关性分析,可以评估数据的一致性,并进行异常检测和修复。
3. 数据时效性评估:数据时效性是指传感器数据的采集、传输和处理的时间延迟。
通过时序分析和实时监控,可以评估数据的时效性。
如果数据延迟超出了预期的范围,需要进行故障排除和调整。
4. 数据完整性评估:数据完整性是指数据集中是否包含了所需的全部信息。
通过使用完整性检查算法和数据遗漏检测算法,可以判断数据集的完整性,补充缺失的数据,提高数据的完整性。
5. 数据可用性评估:数据可用性是指用户能够方便、及时地获取和使用传感器数据的能力。
通过系统监测和故障检测等方法,可以对数据可用性进行评估。
如果存在数据获取和使用的障碍,需要及时处理,确保数据可用性。
在进行传感器数据质量评估的基础上,选择合适的传感器数据筛选方法至关重要。
传感器数据筛选目的在于去除低质量的数据,提高数据的可信度和有效性。
以下是一些常用的传感器数据筛选方法:1. 临界值筛选:通过设置临界值,将超出预设范围的数据识别为异常数据。
网络数据分析中的异常检测与故障定位方法研究摘要:随着互联网的快速发展与普及,大量数据产生并得以存储,如何对这些数据进行高效准确的分析成为一个重要的课题。
异常检测与故障定位是网络数据分析的关键环节之一,本文将介绍网络数据分析中常用的异常检测与故障定位方法,并对其进行综述和总结。
1. 异常检测方法异常检测在网络数据分析中起到了重要的作用,它可以帮助我们发现数据中的异常行为或异常模式。
常见的异常检测方法包括统计方法、无监督学习方法和有监督学习方法。
统计方法是最常用的异常检测方法之一,它将数据与已知的统计分布进行比较,根据数据与分布的偏离程度判断是否存在异常。
常用的统计方法包括均值、方差、中位数等。
无监督学习方法不需要预先标记的数据进行训练,通过学习数据中的模式来发现异常。
无监督学习方法常用的有聚类方法、密度估计方法等。
有监督学习方法则需要提供带有标签的数据进行训练,通过训练建立模型,通过模型对新数据进行分类判断是否异常。
2. 故障定位方法故障定位是指在网络中出现故障时,通过分析网络数据找出导致故障的原因和位置。
常见的故障定位方法包括基于模型的方法和基于数据分析的方法。
基于模型的故障定位方法是指通过建立网络模型来分析网络中的故障。
这些模型可以是基于物理或数学模型的,也可以是基于网络拓扑结构或协议的模型。
通过对这些模型进行有针对性的分析,可以定位到导致故障的原因和位置。
然而,基于模型的方法需要对网络结构和协议有较深的了解,并且对模型的建立和参数的选择有较高的要求。
基于数据分析的故障定位方法则是通过对网络数据进行分析,发现异常行为和模式,进而推断出故障的原因和位置。
这种方法不需要对网络结构和协议有深入了解,只需要对数据进行合理的分析。
常见的基于数据分析的故障定位方法包括关联分析、异常行为识别和路径分析等。
3. 综合方法与应用实际应用中,异常检测与故障定位通常需要综合使用多种方法才能达到较好的效果。
通过综合不同的方法,可以充分发挥各种方法的优势,提高异常检测的准确率和故障定位的精确性。
物联网环境中的传感器数据质量管理方法随着物联网技术的快速发展,传感器在物联网环境中扮演着重要的角色,负责采集、传输和分析各种环境数据。
然而,由于环境复杂性和传感器性能等因素的影响,传感器数据可能存在质量问题,这可能会对物联网系统的可靠性和安全性产生不良影响。
因此,物联网环境中的传感器数据质量管理变得至关重要。
为了确保传感器数据的准确性和可信度,以下是一些物联网环境中的传感器数据质量管理方法:1. 传感器校准:传感器在使用前需要进行校准,以减小传感器本身的误差,确保其输出数据准确。
校准的目的是调整传感器的输出,使其与已知准确度高的参考传感器相一致。
通过校准,可以降低传感器数据的误差,提高数据质量。
2. 数据过滤与异常检测:传感器数据中可能存在异常值或无效数据,这些数据可能是由于传感器故障、环境干扰或其他原因导致的。
为了保证数据质量,需要采用合适的算法对数据进行过滤和异常检测,排除异常值,提高数据的可靠性和精确性。
3. 数据校验与纠错:在传感器数据传输过程中,可能存在数据丢失、损坏或传输错误的情况。
为了确保数据的完整性和准确性,可以采用校验和纠错码等技术,对传输的数据进行校验和修复。
这样可以有效地减少数据错误率,提高数据质量。
4. 数据合并与融合:在物联网环境中,多个传感器常常同时工作,采集不同方面的数据。
为了综合利用各个传感器的数据,可以采用数据合并与融合的方法。
通过数据合并和融合,可以得到更全面、准确的环境信息,为物联网系统的决策和控制提供更可靠的数据基础。
5. 数据时序管理:在物联网环境中,传感器数据的时序关系对于数据的分析和使用至关重要。
为了保证数据的时序一致性,可以采用时间戳和时序管理技术,对传感器数据进行时间标记和排序。
这样可以确保数据的时序关系正确,为后续的数据分析和应用提供准确可靠的基础。
6. 传感器健康监测与维护:为了保证传感器数据的质量,需要对传感器进行健康监测和定期维护。
通过监测传感器的工作状态、精度变化和故障情况等,及时发现并处理传感器故障或性能下降的问题,确保传感器数据质量的稳定和可靠性。
物联网中的数据处理与分析方法1. 引言近年来,随着物联网(Internet of Things, IoT)技术的发展和普及,大量的数据被传感器和设备收集到。
这些数据对于物联网系统的性能优化、故障诊断、行为分析等方面具有重要意义。
因此,对物联网中的数据进行有效的处理和分析成为了一个重要的研究领域。
本文将介绍物联网中常用的数据处理和分析方法。
2. 数据收集物联网系统通常通过各种传感器和设备收集数据。
对于不同的应用场景,选择合适的传感器和设备,并采用合适的数据采集方式非常重要。
常见的数据采集方式包括有线连接、无线连接和蓝牙连接等。
此外,还可以借助云服务进行数据收集和管理。
3. 数据预处理在数据进入分析阶段之前,常常需要进行数据预处理。
数据预处理的目标是将原始数据进行清洗、转换和规范化,以提高后续分析的准确性和效果。
常见的数据预处理方法包括数据清洗、异常值检测、数据变换和归一化等。
3.1 数据清洗数据清洗是指对原始数据中的噪声、缺失值、重复值等进行处理,以提高数据的质量和可用性。
常见的数据清洗方法包括: - 缺失值处理:通过插值、均值填充或删除等方法处理缺失值。
- 异常值处理:根据数据的分布特征,使用统计方法或规则进行异常值检测和处理。
- 数据去重:去除重复的数据,以避免对分析结果的影响。
3.2 数据变换数据变换是将原始数据映射到更具有可解释性和适合分析的形式。
常见的数据变换方法包括: - 数据平滑:平滑技术可以通过滤波等方式降低数据的噪声,提取有效的特征。
- 数据聚合:将原始数据按一定的规则进行聚合,以减少数据的维度和复杂度。
3.3 数据归一化数据归一化是将数据进行标准化处理,使得不同属性的数据具有相同的尺度和范围,以避免在后续分析中某些属性对结果的影响过大。
常见的数据归一化方法包括: - 最小-最大归一化:将数据映射到指定范围内,如[0, 1]。
- Z-score归一化:将数据映射到均值为0,方差为1的正态分布。
物联网中的日志数据分析与异常检测算法再优化与实时处理物联网(Internet of Things,IoT)的快速发展使得大量的设备能够实时采集和传输数据,给人们的生活和工作带来了巨大的便利。
然而,IoT系统中的设备数量众多、数据量庞大,给日志数据的分析与异常检测带来了巨大的挑战。
本文将探讨物联网中的日志数据分析与异常检测算法再优化与实时处理的相关问题,并提出一些解决方案。
首先,我们需要了解物联网系统中的日志数据。
在物联网系统中,设备产生的日志数据记录着设备的状态信息和操作记录。
这些日志可能包括设备的工作时间、温度、湿度等传感器数据,以及设备的操作和异常情况等信息。
通过对这些日志数据进行分析与异常检测,可以帮助我们了解设备的工作情况、发现潜在的故障和问题,并及时采取合适的措施。
然而,物联网中的日志数据分析与异常检测也面临着一些困难。
首先,由于物联网系统中设备数量庞大,数据量大、复杂,如何高效地处理和分析这些数据需要一种高效的算法。
其次,物联网系统中设备的工作状态和行为特点多样,如何针对不同的设备类型和工作场景设计出适用的日志数据分析与异常检测算法也是一个挑战。
最后,物联网系统的实时性要求较高,需要及时发现并处理异常情况,加剧了对实时处理算法的需求。
为了优化物联网中的日志数据分析与异常检测算法,我们可以采用以下方法。
首先,可以利用机器学习算法对日志数据进行训练和建模,提取设备工作的特征和规律。
通过监督学习可训练出的模型可以对日志数据进行分类和预测,帮助我们快速地发现和处理异常情况。
此外,无监督学习方法如聚类算法可以帮助我们发现设备之间的潜在关联和异常行为。
其次,可以利用分布式计算和并行处理技术来提高日志数据的处理效率。
物联网系统中的设备数量众多,单台服务器无法处理所有的日志数据,因此可以采用分布式架构将处理任务分配给多个服务器并行处理。
同时,通过任务划分和数据分片技术,可以将日志数据分散到不同的服务器上进行处理,提高数据处理的速度和效率。
物联网传感器数据分析方法随着物联网技术的不断发展和普及,大量传感器设备被广泛应用于各行各业,收集和传输着大量的数据。
这些数据蕴含着珍贵的信息,对于企业和个人来说具有重要的价值。
而物联网传感器数据的分析方法则成为了解读和挖掘这些数据的关键。
一、数据采集和预处理物联网传感器数据的分析过程通常以数据采集和预处理开始。
数据采集是指通过不同类型的传感器设备收集数据,如温度、湿度、压力、光照等等。
而预处理则是对原始数据进行清洗和转换,以去除数据中的噪音和异常值,并且将其转化为适合分析的格式。
在数据采集方面,可以通过使用传感器网络、物联网平台或者云平台等手段,实现对传感器数据的实时采集。
同时,还可以结合机器学习和人工智能算法,对数据进行智能化处理和辅助决策。
在数据预处理方面,可以采用一系列的数据清洗和转换技术,如去除噪音、缺失值填充、数据平滑和数据变换等。
这样可以保证在后续的数据分析过程中,得到准确、可靠且具有一致性的数据。
二、数据可视化和探索性分析数据可视化和探索性分析是物联网传感器数据分析的重要环节。
通过将数据以图表、图形或者其他形式展现出来,可以更直观地观察和理解数据的特征和规律。
在数据可视化方面,可以使用各种工具和软件进行图表和数据展示。
例如,可以使用Python中的matplotlib和seaborn库,通过绘制直方图、散点图、箱线图等直观地展示数据的分布和相关性。
在探索性分析方面,可以通过统计分析和数据挖掘技术,对数据进行探索和挖掘。
例如,可以使用聚类分析、关联规则挖掘、异常检测等方法,发现数据中的隐藏模式和异常情况。
三、数据建模和预测数据建模和预测是物联网传感器数据分析的核心环节。
通过对数据进行建模和预测,可以揭示数据之间的内在关系,并提供未来的趋势和预测结果。
在数据建模方面,可以采用机器学习和统计建模等方法,如线性回归、决策树、支持向量机等。
这些模型可以帮助我们发现变量之间的关系,并进行预测和分类。
工业物联网异常检测技术综述 一、本文概述 Overview of this article 随着科技的飞速发展和工业0时代的来临,工业物联网(IIoT)在提升生产效率、降低运营成本以及优化能源利用等方面展现出了巨大的潜力。然而,与此其带来的复杂性和数据量的激增也使得异常检测成为了一项至关重要的任务。本文旨在全面综述工业物联网异常检测技术的最新进展、核心原理、应用实例以及未来发展趋势,以期为相关领域的学者和从业者提供有益的参考。 With the rapid development of technology and the advent of the industrial era, the Industrial Internet of Things (IIoT) has shown enormous potential in improving production efficiency, reducing operating costs, and optimizing energy utilization. However, the complexity and surge in data volume brought about by this also make anomaly detection a crucial task. This article aims to comprehensively review the latest progress, core principles, application examples, and future development trends of industrial Internet of Things anomaly detection technology, in order to provide useful references for scholars and practitioners in related fields. 文章首先回顾了工业物联网异常检测的发展历程,探讨了从传统的基于阈值的检测到现代的基于机器学习和深度学习的方法的转变。随后,文章重点介绍了各类异常检测技术的核心原理,包括统计学方法、时间序列分析、聚类分析、分类器以及深度学习等,并分析了它们的优缺点和适用场景。 The article first reviews the development process of anomaly detection in the industrial Internet of Things, and explores the transformation from traditional threshold based detection to modern machine learning and deep learning based methods. Subsequently, the article focuses on introducing the core principles of various anomaly detection technologies, including statistical methods, time series analysis, clustering analysis, classifiers, and deep learning, and analyzes their advantages, disadvantages, and applicable scenarios. 接着,文章通过多个应用实例展示了异常检测技术在工业物联网中的实际应用,如设备故障预警、生产过程优化、能源管理以及安全监控等。这些案例不仅验证了异常检测技术的有效性,也揭示了其在工业物联网中的广阔应用前景。 Furthermore, the article demonstrates the practical application of anomaly detection technology in industrial Internet of Things through multiple application examples, such as equipment failure warning, production process optimization, energy management, and safety monitoring. These cases not only validate the effectiveness of anomaly detection technology, but also reveal its broad application prospects in the industrial Internet of Things. 文章展望了工业物联网异常检测技术的未来发展趋势,包括算法的优化与创新、多源异构数据的融合处理、以及与安全性和隐私保护的结合等。通过深入剖析这些趋势,文章旨在为相关领域的研究和实践提供有益的启示和方向。 The article looks forward to the future development trends of industrial Internet of Things anomaly detection technology, including algorithm optimization and innovation, fusion processing of multi-source heterogeneous data, and integration with security and privacy protection. By analyzing these trends in depth, the article aims to provide useful insights and directions for research and practice in related fields.
无线传感器网络中数据异常检测与处理技术研究一、引言随着无线传感器网络技术的迅速发展,越来越多的应用场景需要利用传感器网络来实现数据的实时采集与传输。
然而,在传感器网络中,由于环境复杂、传输过程中的干扰等原因,常常会出现数据异常的情况,严重影响了数据的可靠性和正确性。
因此,研究无线传感器网络中数据异常检测与处理技术,对于保障数据传输的可靠性具有重要意义。
二、数据异常检测技术1. 数据异常检测的定义和分类数据异常检测是指在无法预知数据分布情况的情况下,通过对数据进行建模和分析,发现与模型不符合的数据点,从而检测出数据中的异常值。
数据异常可以分为两种类型:点异常和群体异常。
点异常是指单个数据点与其他数据点显著不同的情况,群体异常是指一群数据点与整体数据分布不一致的情况。
2. 常见的数据异常检测方法(1) 基于统计学方法的异常检测:该方法通过对数据进行建模并计算各个数据点的概率密度值来判断数据是否异常。
常见的统计学方法包括Z-score、3σ法和箱线图等。
(2) 基于机器学习的异常检测:该方法是利用机器学习算法对数据进行建模,从而实现对异常数据的检测。
常见的机器学习算法包括支持向量机、决策树和神经网络等。
(3) 基于聚类的异常检测:该方法通过将数据点划分为不同的簇,并判断一个数据点是否在合适的簇中,从而检测出异常值。
常见的聚类算法包括k-means算法和DBSCAN算法等。
三、数据异常处理技术1. 数据异常处理的定义和分类数据异常处理是指对检测出来的数据异常进行分类和处理的过程。
异常处理可以分为两种类型:处理异常和放弃异常。
处理异常是通过对异常值进行修正或采用插值的方式来处理异常值,使得数据能够更符合实际情况。
放弃异常是直接将异常值删除或标记为异常值,以防止异常值对后续数据分析造成影响。
2. 常见的数据异常处理方法(1) 增量式学习:该方法是利用现有数据进行学习,同时利用新加入的数据对现有的模型进行更新,从而避免因为少量数据的变化导致整个模型的重构。
物联网中的传感器数据的处理和分析方法随着物联网的快速发展,传感器数据的处理和分析成为了物联网应用中的关键环节。
物联网通过连接各种各样的传感器设备,采集大量的传感数据,随之而来的是如何高效地处理和分析这些数据,从中提取有用的信息和知识。
本文将介绍物联网中传感器数据处理和分析的常用方法和技术。
一、传感器数据的处理传感器数据处理是指将原始的传感器数据进行处理和清洗,以便后续的分析和应用。
以下是常用的传感器数据处理方法:1. 数据预处理:数据预处理是指对原始数据进行清洗和修正,以去除噪声、异常值和缺失值,以提高数据质量。
常用的数据预处理技术包括平滑处理、插值处理、异常值检测和缺失值处理等。
2. 数据采样和压缩:由于物联网中传感器数据量巨大,传输和存储成本很高,因此需要对数据进行采样和压缩。
数据采样是指从原始数据中选择一部分数据进行处理和分析,以减少数据量;数据压缩是指通过一定的算法和方法减少数据的存储空间和传输开销。
3. 数据标准化和归一化:传感器数据通常具有不同的量纲和范围,为了能够进行有效的比较和分析,需要对数据进行标准化和归一化处理。
常用的数据标准化和归一化方法包括最小-最大归一化、Z-得分标准化和小数定标标准化等。
二、传感器数据的分析传感器数据的分析是指从处理和清洗后的数据中提取有用的信息和知识,为物联网应用提供决策支持和智能化服务。
以下是常用的传感器数据分析方法:1. 数据可视化:数据可视化是将传感器数据以图表、图像或地图等形式展示出来,以便进行直观和可理解的分析。
常用的数据可视化方法包括折线图、散点图、柱状图和热力图等。
2. 数据挖掘和机器学习:数据挖掘和机器学习是通过利用算法和模型从传感器数据中发现隐藏的关联规律和模式。
数据挖掘可以用于异常检测、分类和聚类等任务;机器学习可以用于预测、优化和决策等任务。
3. 数据分析和建模:数据分析和建模是通过对传感器数据进行统计和分析,获取数据的特征和趋势,为物联网应用提供决策支持。
第29卷第5期 计算机仿真 2012年5月 文章编号:1006—9348(2012)05-0159-04
物联网中传感节点数据异常检测方法研究
黄 华 (清远职业技术学院,广东清远511510) 摘要:研究物联网中节点数据异常的检测问题,提高检测的准确率。针对当物联网中的传感节点采集到的外界数据内容随 机性较大,在数据存储形式、格式等特征上存在较大差异时,造成各个节点数据之间很难取得一致。传统方法检测无法准确 根据差异信息建议统一待检测特征,造成检测的准确度不高的问题。为了解决这一问题,提出一种基于特征模糊聚类概率 搜索的节点数据异常检测算法,通过计算节点数据与异常数据之间的特征模糊聚类概率,运用模糊概率因素判定非法节点 数据。实验证明,改进方法能快速、完整地将检测节点异常数据,取得了理想的效果。 关键词:物联网;节点数据;特征模糊聚类概率 中图分类号:TP393.08 文献标识码:A
Data Anomaly Detection Method of Sensor Nodes in Internet of Things HUANG Hua (Qingyuan Vocational and Technical College,Qingyuan Guangdong 511510,China) ABSTRACT:Research the abnormality detection of the network nodes to improve the testing accuracy.Data collected from sensor nodes of network are random and different in format and storage form,thus it is hard for the nodes to fit each other.The traditional detection method cannot accurately suggest the uniform features to be detected according to different information,which leads to the low accuracy of the detection.To solve this problem,this paper proposed an algorithm based on the characteristics of the fuzzy clustering probability searching.By caculating the probability of the fuzzy characteristics between node data and abnormal data,we can determine the illegal node data with the application of the fuzzy probability factors. KEYWORDS:Internet of Things;Node data;Contact probability
1 引言 现代的物联网应用中。传感网络技术得到了长足的发 展,数据的传递也变得十分地快速、便捷,与传统的互联网不 同。物联网络连接的是与生活息息相关的外界环境,传递的 是一些设备仪器采集到的外界信息,这些功能给人们的生产 和生活都带来了极大的便利l1]。与此同时,各种有害信息也 给物联网中的传感网络带来了极大的威胁,这些有害信息如 果大范围传递,会对物联网络终端的各种设备带来很大威 胁。为了避免上述问题带来的危害,针对物联网的传感网络 安全防范技术已经成为这个领域研究的核心问题。学者们 希望能够利用一种有效方式,自动识别物联网的传感网络中 的异常节点,避免异常数据给物联网中的传感网络带来的威 胁 。 与互联网中检测方法不同,物联网中多是以传感器网络 为基础的,采集到的外界信息有较强的随机性。使用传统方
收稿日期:2011—10—06修回日期:2011—11—03
式进行物联网络安全检查.需要利用有规律的配准算法、通 过配准过滤算法等对物联网传感网络中的节点数据异常情 况进行检测。这些方法必须建立在节点数据异常特征能够 被准确描述的基础上,但是与互联网不同的是,在物联网中. 传感网络中传递的数据具有很强的随机性,数据格式、内容 等特征存在很大的差异,因此,很难像互联网一样,建立统一 特征对物联网中的数据特征进行有效描述[3 1。当传感网 络中的数据区别较大的情况下,检测方法无法建立统一的检 测特征,会造成传统方法无法检测出传感数据的异常,获取 结果的漏检率非常高_6]。所以,完整检测出物联网传感网络 中的数据异常信息,是保证物联网传感网络安全的基础。 为了避免使用传统方式进行物联传感网络节点数据异 常检测的缺陷.提出了一种基于特征模糊聚类概率搜索的节 点数据异常检测算法。通过建立数学模型。进行节点数据和 异常数据相关性概率计算.获取异常节点数据之间的相关 性,通过衡量标准进行对比分析,确定这种节点数据是否存 在异常情况_7]。实验证明。本文提出的方式能够对物联网中 传感网络异常数据进行准确检测,取得了让人满意的效果。
一1 59— 2物联网节点检测原理 物联网络与传统的互联网络不同,最主要的区别就是其 传递的信息是外界采集的不规则的、有差异的数据信息,物 联网多依靠由传感器组成的传感网络为主。物联网传感网 络中的节点数据异常检测.也叫做物联网传感网络节点数据 验证检测,这种检测方式是将物联网传感网络中节点数据, 与正常节点数据进行对比,根据配准结果实现对节点数据异 常的检测l8-9 3。具体方法如下所述: 首先建立物联网络中异常节点数据数学模型,选择节点 数据特性,设为z(Y,z)。 利用上面建立的模型,对物联网传感网络节点数据与正 常节点数据进行对比分析,利用式(1)提取出疑似非法节点 数据特征,将其作为检测对象,方法如下: f(Z(y,z)+T)/logT≥0.5 提取 为检测对象,1、 【(Z(Y, )+T)/logT<0.5不提取 为检测对象。。 通过上面阐述的方法提取节点检测对象是T=(T , , ,…, ),其中 代表第 个节点数据,s是待检测节点数据 的数量。 将获取的待测对象集合与数据库中的节点数据进行对 比。利用式(2)能够锁定物联网传感网络中的异常节点数 据: s E(z)=sinx/ logT (2) J:2 将物联网传感网络中的异常数据 (z)与标准节点进行 对比分析,从而得知这个检测对象中是否包含异常数据: fE(z) tx节点数据异常 , 【E(1)< 节点数据正常 一 通过以上检测原理可以看出,传统的检测方法是建立在 对网络节点数据的特征提取基础上进行的.需要提取网络数 据中同一特征建立标准节点特征进行检测,但是在物联网路 中,传感器采集到的信息存在很大的随机性和非线性,不同 传感节点之间采集到的数据存在着很大的差异,很难建立统 一的特征¨l 。这就造成,式(1)中很难提取出一个统一的特 征对异常节点数据进行有效的描述,导致式(2)锁定节点不 准确,最终导致式(3)无法做出准确的判断。导致从物联网 传感网络中数据异常检测的准确率越低的问题。 为了避免传统检测方式的上述缺陷,提出了一种基于特 征模糊聚类概率搜索的节点数据异常检测算法,通过计算节 点数据与异常数据之间的相关性,运用模糊概率因素确定非 法节点数据。避免了传统检测方式过于依赖节点中单一样 本特征的缺陷,准确检测出物联网传感网络中的异常数据, 为快速、完整地过滤物联网传感网络中的异常数据奠定了良 好的基础。 3 特征模糊聚类概率检测 3.1 异常节点数据搜索 与传统的互联网络不同.物联网的异常节点检测多是建 一160一 立在传感器采集回的差异信息基础上的。很难像互联网一 样,建立统一的传递模型。在对物联网传感网络中的异常数 据进行检测时,最重要的步骤是计算节点数据与异常数据之 间的特征模糊聚类概率。需要建立一个数学模型描述这种 特征模糊聚类概率。这个模型中包括n个待测节点数据和P 条相关性较大的数据,建立一个大小是n×P的矩阵,用C… ={Cik)…描述。矩阵中的每个点都代表节点数据特性,每 列都代表有一定相关性的数据特性。
C = (4) 为了获取节点数据与异常数据之间的联系.减少运算步 骤,缩短运算时间,需要对矩阵进行降维处理。 C…=( + )/X, (5) 其中,n代表矩阵中的样本数量,P代表有一定相关性数 据的样本数量,通过式(6)能够得到: U=,(Pl,P2,…,P ),s>max(n,P) (6) 其中,P 代表矩阵相关性系数。 对矩阵进行降维处理,能够得到式(7): Cf=(W +P,+W )/2 (7) 如果在满足上述条件的情况下,1无限接近于rank(B), 则c 与C…无限接近。假设对矩阵进行降维处理,则在矩阵 中,选取物联网传感网络中的待测节点数据,则可以得到与 其相关的节点数据,从而过滤与其无关的节点数据,提高了 过滤异常数据的效率。根据上面阐述的方法,可以准确选取 异常数据的特性,得到节点数据与异常数据之间的特征模糊 聚类概率,从而提高了异常数据检测效率。 3.2 特征模糊聚类概率的计算 与互联网的直接检测法不同,在获取物联网传感网络中 的异常数据后,需要计算节点数据与异常数据之间的特征模 糊聚类概率,从而确定这些数据是否属于异常数据。具体步 骤如下: 使用传统方式进行物联网传感网络节点数据异常检测, 忽略了节点数据与异常数据之间的联系,获取的检测结果准 确率较低,因此提出了节点数据与异常数据之间的特征模糊 聚类概率计算方式提高检测准确率:假设P代表异常数据数 目,e 代表第k个扫描节点,如果这些异常数据能够按照其相 关性分为L类,其特性是(W ,W ……W ),n是待测异常数 据数目,e (w W ,…..,Wh)代表节点数据,因此,e : (W W ,…..,Wh)代表物联网传感网络中全部待测节点 数据。这种检测方法需要将节点数据e 按照不同的特性进 行分类,分为异常数据和节点数据两类。确定物联网传感网 络中的节点数据是否是异常数据的时候,需要利用式(8)计 算节点数据与异常数据之间的特征模糊聚类概率: Q( )=q(,^)q(fl+ )/q(c,) (8) 其中,k:1,2,…,P。