基于时间序列分析的网络流量预测模型研究
- 格式:pdf
- 大小:330.95 KB
- 文档页数:5
基于LSTM的时间序列预测算法研究 近年来,时间序列预测算法在数据分析和机器学习领域得到了广泛的应用。其中,基于长短时记忆网络(LSTM)的时间序列预测算法备受关注。本文就基于LSTM的时间序列预测算法进行一定的研究。
一、背景介绍 时间序列预测算法是对一系列连续的时间点所组成的数据集进行建模和分析,以预测该数据集将来的趋势和表现。该算法广泛应用于经济学、气象学、交通学等领域。与传统的预测算法相比,基于LSTM的时间序列预测算法可以处理非线性、非平稳等问题。
LSTM是一种递归神经网络(RNN)的变体,其对于长期依赖问题有着较好的解决效果。LSTM的特点在于它可以在时序数据中记住和取舍信息。循环神经网络存在梯度消失或梯度爆炸的问题,在处理长期依赖问题时效果不够显著,而使用LSTM可以有效地避免这些问题。
二、LSTM的原理 LSTM的核心是记忆单元(memory cell),记忆单元的状态可以被LSTM网络所读取和写入。同时,LSTM有三个门,包括输入门(input gate)、输出门(output gate)和遗忘门(forget gate),这三个门负责在网络中控制数据的流动。输入门控制输入数据的量,遗忘门控制记忆单元的值是否保留,输出门则控制网络输出的值。LSTM的具体计算方式如下:
1. forget_gate = sigmoid(Wf . [xt, ht-1] + bf) 2. input_gate = sigmoid(Wi . [xt, ht-1] + bi) 3. output_gate = sigmoid(Wo . [xt, ht-1] + bo) 4. ct = forget_gate * ct-1 + input_gate * tanh(Wc . [xt, ht-1] + bc) 5. ht = output_gate * tanh(ct) 其中,xt和ht-1分别为输入向量和上一个时间点的隐藏状态向量。[xt, ht-1]表示其拼接。Wf、Wi、Wc、Wo为权值矩阵,bf、bi、bc、bo为偏移量。sigmoid为sigmoid函数,tanh为双曲正切函数。
基于深度学习的时空序列数据预测模型研究随着科技不断发展,各行业中都涌现出大量的时空序列数据,如金融市场数据、天气数据以及医疗数据等等,这些数据都是以时间和空间为两个维度来记录的。
在这些数据中,时间维度是关键的因素,因为它存储了过去的信息,并帮助我们预测未来。
因此,时空序列数据预测已成为众多学者的研究方向之一。
在这个领域中,深度学习变得越来越重要。
在过去几年中,深度学习已成为许多领域的关键技术,如图像处理,语音识别和自然语言处理。
它已经在预测时空序列数据方面取得了显著的成功。
深度学习模型的优点之一是它能够自动提取输入数据的特征。
这是传统统计方法所欠缺的。
例如,在传统的时间序列分析中,我们需要手动选择滞后项的数量和潜在的趋势和季节性因素。
但在深度学习模型中,这些因素会自动被提取。
因此,深度学习模型更适用于那些复杂和不规则的时空序列数据。
在这里,我们将介绍深度学习在时空序列预测中的应用,以及其常见的模型。
我们将首先介绍递归神经网络(Recurrent Neural Network, RNN)和长期短期记忆网络(Long Short-Term Memory, LSTM),然后介绍一些深度学习在时空序列预测中的典型应用。
RNN和LSTMRNN是一种能够模拟时序数据的神经网络模型。
它可以接收序列输入并输出序列输出。
在RNN中,每个隐藏层单元都包含一个状态向量,它存储了之前的所有状态信息。
这个状态向量会被更新,并传递到下一个隐藏层单元中,以存储先前的信息。
然而,在传统的RNN中,当序列比较长时,它可能会出现梯度消失或梯度爆炸的问题。
这意味着训练过程中,网络无法学习到更深的网络结构。
因此,LSTM被提出来解决这个问题。
LSTM是一种特殊的RNN,它具有门控结构,并且可以保持长时间的状态信息。
在LSTM中,每个隐藏层单元都包含一个状态向量和三个门——输入门、输出门和遗忘门。
这些门组合起来可以选择性地存储和遗忘信息。
网络数据分析与预测方法的研究随着互联网技术的迅猛发展,互联网已经成为人们获取信息、交流与互动的重要途径。
然而,互联网上产生的大量数据也对我们提出了新的挑战,如何从海量的网络数据中提取有价值的信息,并进行准确的预测,成为了一个亟待解决的问题。
本文将围绕网络数据分析与预测方法展开研究,探讨分析网络数据的方法和技术,以及利用这些分析结果进行预测的方法。
一、网络数据分析方法1.数据收集与清理网络数据分为结构化数据和非结构化数据两种类型,其中结构化数据容易处理,非结构化数据则需要进一步的处理和分析。
在进行网络数据分析之前,数据的收集和清理步骤是非常重要的。
数据的收集可以通过爬取网页、获取API接口数据、采集社交媒体数据等方式进行。
在清理数据时,需要去除掉重复数据、缺失数据和异常值,以确保数据的准确性和可靠性。
2.文本分析在网络数据中,文本数据占据了重要的地位。
文本分析可以通过自然语言处理技术,对文本进行词频统计、情感分析、主题模型等处理。
总结文本数据中的关键词和主题,能够帮助我们了解用户的需求和舆情动态。
文本分析在舆情监测、用户评论分析、推荐系统等领域具有广泛的应用。
3.网络关系分析在网络数据中,除了文本数据,网络关系数据也非常重要。
这些关系可以通过网络结构图进行可视化,或者利用图算法进行分析。
例如,社交网络中的用户关系、网页之间的链接关系等。
网络关系分析可以帮助我们发现社交网络中的影响力节点、研究网页之间的传播路径等。
二、网络数据预测方法1.时间序列分析时间序列分析是一种将时间因素考虑进来的预测方法。
在网络数据分析中,时间序列分析可以用来预测用户的行为、网站的流量、产品的销售等。
时间序列分析方法包括常见的ARIMA模型、指数平滑模型、回归模型和周期模型等。
通过对历史数据进行分析和建模,我们可以得到未来一段时间内的趋势和变化。
2.机器学习方法机器学习方法在网络数据预测中也得到了广泛的应用。
通过训练模型,利用算法从数据中学习规律,并进行预测。
网络流量的预测和调度在如今数字化时代变得日益重要。
随着更多人使用互联网,网络流量管理变得更加复杂且具有挑战性。
有效地预测和调度网络流量可以帮助提高网络性能、优化资源分配和提供更好的用户体验。
本文将探讨如何进行网络流量的预测和调度,从而满足用户需求和优化网络性能。
一、网络流量预测网络流量预测是指利用历史数据和一些预测模型来估计未来一段时间内的网络流量。
这有助于规划带宽、优化网络架构和资源分配。
以下是一些常用的网络流量预测方法:1. 基于统计模型的预测:这种方法基于统计学理论和模型,如ARIMA模型(AutoRegressive Integrated Moving Average)和贝叶斯网络。
它们通过分析历史数据中的模式和趋势来预测未来的流量。
2. 基于机器学习的预测:机器学习算法可以根据输入的历史数据训练模型来预测未来的网络流量。
常用的算法包括支持向量机(SVM)和随机森林(Random Forest)。
这些算法可以根据数据集的特征、变化和关系来学习并提供准确的预测结果。
3. 基于深度学习的预测:深度学习模型如循环神经网络(RNN)和长短期记忆网络(LSTM)可以处理时序数据,并且在网络流量预测中取得了不错的效果。
这些模型能够捕捉时间序列中的长期依赖性和复杂关系,从而提高预测准确度。
二、网络流量调度网络流量调度是指根据不同应用程序、用户需求和网络状况来优化资源分配和流量传输的过程。
网络流量调度可以帮助提高网络性能、减少拥堵和延迟,并最大程度地满足用户需求。
以下是一些常见的网络流量调度方法:1. 弹性带宽调度:这种调度方法根据网络负载和带宽需求的变化动态地分配带宽资源。
它可以根据实时数据流量和网络状态进行自适应调整,从而提高带宽利用率和响应速度。
2. QoS保证调度:不同应用程序和服务对网络性能的要求各不相同。
QoS(Quality of Service)调度可以根据应用程序的服务等级和需求来优先传输数据包,从而保证关键应用的服务质量和用户体验。
基于循环神经网络与时序数据挖掘的交通流量预测研究交通流量预测是城市交通规划和管理中的关键问题之一。
准确预测交通流量可以帮助交通部门优化路网规划、交通信号控制以及旅行者信息提供等操作,最终提高城市交通运行效率和减少交通拥堵。
随着循环神经网络(Recurrent Neural Network, RNN)技术和时序数据挖掘方法的发展,基于RNN和时序数据挖掘的交通流量预测研究被广泛应用。
循环神经网络是一类特殊的神经网络结构,适用于处理序列数据、时间序列等具有时间依赖性的问题。
与传统的前馈神经网络(Feedforward Neural Network)相比,RNN的隐状态可以通过一个循环的连接实现信息在时序上的传递,从而对前序信息进行记忆和利用。
这使得RNN成为处理交通流量预测问题的强有力工具。
在交通流量预测中,时序数据挖掘扮演着至关重要的角色,其可以从历史交通流量数据中识别出重要的模式和趋势,从而为预测模型提供准确的输入。
常见的时序数据挖掘方法包括时间序列分析、周期性分析、自回归模型、移动平均模型等。
这些方法可以帮助我们理解交通流量数据中的季节性、周期性和趋势性,并提取出有效的特征用于交通流量预测。
基于循环神经网络和时序数据挖掘的交通流量预测方法可以分为两个主要步骤:特征提取和流量预测。
首先,通过时序数据挖掘方法,我们可以从历史交通流量数据中提取出有意义的特征。
例如,我们可以提取每天的交通流量变化模式、周末与工作日的流量差异、季节性和节假日对流量的影响等。
这些特征可以用于后续的流量预测模型。
针对特征提取之后的交通流量预测问题,循环神经网络被广泛应用。
基于RNN的交通流量预测模型能够利用历史交通数据中的时序信息和交通流量的动态特性进行预测。
这种方法能够捕获与时间相关的特征,同时还能够考虑到交通流量之间的相互影响。
常见的基于RNN的交通流量预测模型包括基本的循环神经网络(Simple RNN)、长短期记忆网络(Long Short-Term Memory, LSTM)和门控循环单元(Gated Recurrent Unit, GRU)等。
基于LSTM神经网络的地铁短时客流量预测研究基于LSTM神经网络的地铁短时客流量预测研究一、引言地铁作为城市交通的重要组成部分,客流量的变化对地铁运营和乘客出行都有很大的影响。
因此,准确预测地铁短时客流量对实现地铁运营的智能化管理至关重要。
近年来,随着深度学习的快速发展,LSTM神经网络在时间序列预测中展现出了很好的性能,成为研究地铁短时客流量预测的有效工具。
二、LSTM神经网络简介1. LSTM神经网络原理LSTM(Long Short-Term Memory)是一种特殊的循环神经网络,对于处理长时间依赖问题具有较好的性能。
相比于传统的循环神经网络,LSTM引入了遗忘门、输入门和输出门,以更好地控制信息的流动。
2. LSTM神经网络的训练过程LSTM神经网络的训练过程包括前向传播和反向传播两个阶段。
在前向传播过程中,通过将当前时刻的输入与前一时刻的输出结合,计算得到当前时刻的输出。
在反向传播过程中,通过比较网络输出与实际值之间的误差,调整网络权重以减小误差,经过多次迭代,使网络逐渐收敛。
三、地铁短时客流量预测方法1. 数据预处理首先,收集地铁站点的历史客流量数据,并进行数据清洗和归一化处理,以提高模型的准确性。
然后,将数据集按照时间序列划分为训练集和测试集。
2. 构建LSTM神经网络模型将LSTM作为时间序列预测模型,输入当前时刻的客流量数据,通过多个LSTM层的堆叠,得到输出结果。
3. 模型训练与评估使用训练集对LSTM神经网络模型进行训练,通过反向传播算法不断调整模型参数,直到模型收敛。
然后,使用测试集对模型进行评估,计算预测值与实际值之间的误差,以评估模型的准确性。
四、实验与结果分析在某城市的地铁站点进行实验,收集了数月的历史客流量数据用于训练和测试。
通过对比预测值与实际值,发现基于LSTM神经网络的地铁短时客流量预测方法在准确性上明显优于传统的统计方法。
五、模型的优化与改进为了进一步提高地铁短时客流量预测的准确性和实用性,可以从以下几个方面进行优化和改进:1. 考虑影响客流量的外部因素,如天气、节假日等,引入更多的特征数据进行模型训练。
网络流量预测模型及其应用研究随着互联网的普及,人们对于网络的依赖度越来越高。
无论是个人使用还是企业的运营,都需要网络来进行跨地域的信息传递和交互。
而随着移动互联网的发展,移动端的网络流量增加速度更是远超PC端。
因此,预测网络流量的需求也越来越重要。
本文将探讨网络流量预测模型及其应用研究。
一、网络流量预测的意义网络流量预测的主要意义在于帮助网络运营商、企业和用户预测未来一段时间内的网络流量使用量,以便能够做出有效的调整和准备。
例如,如果一个用户知道自己在未来一周内的流量使用量可能会特别大,那么他就可以提前购买更多的流量或调整自己的应用使用方式,以保证网络的稳定性和自己的使用体验。
对于企业来说,网络流量预测也非常重要。
如果某个时期企业的网站访问量突然增加,但是没有预料到这种情况,那么可能会造成网站崩溃或者响应缓慢等问题,严重影响到用户使用和体验,甚至导致生意的损失。
二、网络流量预测的技术手段网络流量预测的技术手段主要分为两类:基于历史数据的统计方法和基于机器学习的预测模型。
统计方法是通过分析历史数据得出规律,并以此推断未来一段时间内的流量使用情况。
常用的统计方法包括ARIMA模型、指数平滑模型、回归分析模型等。
这种方法的优点是简单易懂,计算量小,但是无法反映复杂的非线性变化趋势。
机器学习方法是利用数据挖掘和机器学习技术,从历史数据中提取特征,建立预测模型,并通过测试集进行验证和优化。
常用的机器学习方法包括线性回归、决策树、神经网络、支持向量机等。
这种方法的优点是能够自动学习从历史数据中提取特征,并建立模型,适合于具有复杂关系的非线性变化趋势预测。
三、网络流量预测模型的应用网络流量预测模型的应用非常广泛,我们可以将其应用于许多领域。
例如,我们可以将其应用于网络运营商的流量调度和优化,提高网络的传输速度和质量。
我们也可以将其应用于企业的网站运营,以及个人用户的流量管理和使用。
另外,我们还可以将网络流量预测模型应用于边缘计算和物联网领域。
基于大数据的时间序列预测模型研究与实践随着大数据技术的不断发展和应用,时间序列预测成为数据分析和决策支持的重要手段之一。
本文将从理论研究和实践应用两个方面,探讨基于大数据的时间序列预测模型的研究与实践。
一、理论研究时间序列预测是通过对历史数据的分析和建模,来预测未来一段时间内的数值或趋势。
基于大数据的时间序列预测相较于传统方法,具有更高的准确性和更全面的分析能力。
下面将介绍几种常见的基于大数据的时间序列预测模型:1. ARIMA模型自回归移动平均模型(ARIMA)是一种常用的时间序列预测模型。
它通过对序列的自相关和滑动平均相关进行建模,来预测未来的数值。
在大数据环境下,可以使用分布式计算平台来提高ARIMA模型的训练和预测效率。
2. LSTM模型长短期记忆网络(LSTM)是一种递归神经网络,通过引入记忆单元和门控机制,能够更好地捕捉时间序列中的长期依赖关系。
在大数据背景下,LSTM模型可以通过分布式训练和批处理技术,处理更大规模的时间序列数据。
3. Prophet模型Prophet模型是Facebook开源的时间序列预测模型,具有简单易用和高准确性的特点。
它利用可自定义的季节性、趋势性和节假日效应来拟合时间序列数据,并进行预测。
在大数据环境下,可以利用分布式计算和并行处理,提高Prophet模型的训练和预测速度。
二、实践应用基于大数据的时间序列预测模型在实际应用中有广泛的场景,本节将介绍两个典型的实践案例。
1. 电力负荷预测电力负荷预测对于电力系统的运行和调度具有重要意义。
通过基于大数据的时间序列预测模型,可以分析历史电力负荷数据,并预测未来的负荷水平,以便准确安排电力供给和优化电力系统的运行效率。
2. 股票价格预测股票价格的波动具有一定的规律性,通过基于大数据的时间序列预测模型,可以分析历史股票价格数据,并预测未来的价格趋势,为投资者提供决策依据。
三、总结与展望基于大数据的时间序列预测模型在各个领域的应用越来越广泛。
基于MLP神经网络的气象时间序列预测模型研究随着气候变化的日益加剧,气象数据的准确预测对于人们生活、农业、交通等方面都有着极为重要的意义。
传统的气象预测方法往往依赖于经验、历史数据和统计方法,但这种方法的效果可能受到自然环境变化等因素的影响。
因此,基于MLP神经网络的气象时间序列预测模型成为了一种有效的新方法,本文将就该方法进行探讨。
一、MLP神经网络的基本原理MLP神经网络是一种常用于非线性回归、分类和预测的技术。
该技术依据训练数据集建立的多层前向神经网络结构作为数学模型,通过学习和调整网络权重实现对数据进行预测。
在MLP神经网络中,输入层和输出层之间可能包含若干个隐藏层,每个隐藏层都由多个神经元组成。
神经元根据输入的信息,通过训练与自我调整,得出最终的输出值,该值作为下一层神经元的输入值。
通过不断训练、学习和调整神经网络权重,可以使神经网络的实际输出值与期望输出值差异最小化,从而实现对于输入数据的准确预测。
二、基于MLP神经网络的气象时间序列预测模型研究MLP神经网络的一大优势在于可以应对复杂的非线性问题,而气象数据则具有多变性、时序性、不确定性等特点,适合采用基于MLP神经网络的气象时间序列预测模型。
该模型主要分为四个部分,分别是数据预处理、搭建神经网络模型、训练模型和预测结果。
1. 数据预处理数据预处理是模型研究的重要基础,其主要任务是消除数据的噪声干扰、填补缺失数据和数据标准化等。
在进行数据预处理时,需先将原始气象数据进行分析,分清数据的主要特点和规律,做出相应的预处理方案。
2. 搭建神经网络模型搭建神经网络模型的任务是根据数据预处理的结果,确定神经网络的结构和节点数目,从而完成神经网络模型的整体构建。
神经网络结构的设计涉及到输入层、隐层和输出层的节点数目、权值、阈值等参数,是实现高精度预测的关键因素。
3. 训练模型训练模型是指将历史气象数据分为训练集和测试集,在训练集上应用BP算法进行神经网络的训练,调整网络权重和阈值等参数,然后在测试集上进行检测,评估模型的准确性。
基于深度学习的时间序列预测算法研究一、引言时间序列预测是指根据过去某一段时间的数据,预测接下来一段时间内该现象的变化趋势。
而深度学习是现今最热门的机器学习技术之一,能够自动学习数据的抽象特征,逐渐逼近或超越人类的表现。
本文旨在研究基于深度学习的时间序列预测算法,探讨其优缺点与应用场景。
二、常见时间序列预测算法1. ARIMA模型ARIMA模型(Autoregressive Integrated Moving Average)是应用最为广泛的时间序列预测算法之一,它的核心思想是对被预测现象进行自回归和滑动平均处理,然后再进行逆差分运算,最终得到预测结果。
ARIMA模型最大的优势在于能够处理时间序列中的自相关性和季节性,缺点则是需要有一定的时间序列分析专业知识。
2. 多元线性回归模型多元线性回归模型(Multiple Linear Regression)是基于多个自变量对目标变量进行预测的算法,在时间序列预测中,通常使用多元线性回归模型建立某一因素对时间序列变化的影响模型,然后通过该模型进行预测。
该算法的优点是具有较好的可解释性,而缺点则在于对于非线性数据的拟合效果不佳。
3. 神经网络模型神经网络模型(Neural Network)是一种模仿人类大脑神经网络结构、具有自适应学习能力的计算模型,在时间序列预测中,通常使用全连接神经网络(Fully Connected Neural Network)或长短期记忆神经网络(Long Short-Term Memory)进行预测。
神经网络模型的优点在于能够自动抽取数据的特征,缺点则在于需要大量的数据训练模型,且容易过拟合。
三、基于深度学习的时间序列预测算法近年来,基于深度学习的时间序列预测算法逐渐受到研究者的关注,主要包括以下两种模型:1. 卷积神经网络模型卷积神经网络模型(Convolutional Neural Network)常用于图像识别领域,在时间序列预测中,通常使用一维卷积神经网络(1D CNN)对时序数据进行特征提取和分类。
基于时间序列分析的网络流量异常检测闫伟;张军【摘要】Aiming at the problem that the traditional model could not accurately identify and detect network traffic anomalies,we proposed a network traffic anomaly detection model based on time series analysis.Firstly,the original data of network traffic was extracted,and the original data was denoised by wavelet threshold to eliminate the influence of interference factors.Secondly,time series analysis method was used to mine the relationship among network traffic data,and network traffic anomaly detection model was established.Finally,simulation experiments were used to verify the effectiveness and superiority of the detection model.The result shows that time series analysis can accurately and timely detect abnormal behavior of network traffic,and the detection results are better than other current network traffic anomaly detection models.%针对传统模型无法对网络流量异常进行准确识别和检测的问题,提出一种基于时间序列分析的网络流量异常检测模型.首先提取网络流量的原始数据,并对原始数据进行小波阈值去噪处理,消除干扰因素的影响;然后采用时间序列分析法挖掘网络流量数据之间的变化关系,建立网络流量异常检测模型;最后通过仿真实验验证检测模型的有效性和优越性.实验结果表明,时间序列分析法可以准确、及时地检测网络流量的异常行为,且结果优于目前其他网络流量异常检测模型.【期刊名称】《吉林大学学报(理学版)》【年(卷),期】2017(055)005【总页数】6页(P1249-1254)【关键词】网络安全;流量异常;检测模型;回声状态流量;时间关联【作者】闫伟;张军【作者单位】宿迁学院信息工程学院,江苏宿迁223800;华东师范大学计算机科学与软件工程学院,上海200062;华东师范大学计算机科学与软件工程学院,上海200062【正文语种】中文【中图分类】TP393随着信息化技术的迅速发展, 互联网的应用范围越来越广, 而各种网络攻击行为日益增加, 给网络系统的安全带来严重威胁[1]. 网络流量异常检测可以对网络运行状态进行监督, 对保证网络系统的稳定运行具有重要意义. 为了保证网络的安全性, 设计性能优异的流量异常检测模型已成为网络管理领域研究中的热点问题[2-7]. 目前, 网络流量异常检测模型[8]分为静态和动态两种. 其中静态模型通过阈值实现异常检测, 当网络利用率、用户流量等超过阈值时, 即表示网络系统出现了异常现象, 必须采取相应的管理措施[9]. 静态模型假设网络流量是一种静态变化的, 实际上网络流量受人们上网行为、上网价格、上网时间等因素的影响, 具有强烈的动态变化特点, 采用固定阈值方法自适应能力差, 导致网络流量异常检测结果可信度低, 实际应用范围较窄[10]. 动态网络流量异常检测模型常采用一个连续滑动窗对窗内流量进行检测, 当窗内流量剧增或剧减时, 可以判断此时网络流量处于异常状态[11]. 近年来, 通过将回归分析法、指数平滑法引入到网络流量异常检测的建模中, 对网络流量的历史时间序列进行建模和分析, 找到网络流量异常的点, 实现网络流量异常检测, 可得到较好的检测效果[12]. 但在实际应用中, 收集网络流量历史时间序列不可避免包含噪声, 这些噪声对网络流量异常检测结果产生干扰, 同时回归分析法、指数平滑法属于线性建模方法, 对具有动态变化特点的网络流量进行检测, 检测精度较低[13]. 为了解决当前流量异常检测模型存在的问题, 本文提出一种基于时间序列分析的网络流量异常检测模型. 首先采用小波阈值法对网络流量历史数据进行去噪处理, 抑制噪声产生的干扰; 然后采用时间序列分析法----回声状态网络进行建模. 仿真测试结果表明, 该模型可有效检测网络流量的异常行为, 检测效果优于其他模型.1.1 小波阈值法在网络流量数据采集过程中, 由于受多种因素的影响, 采集网络流量数据f(t)常包含噪声e(t), 因此得到含噪的网络流量数据可表示为在网络流量异常检测过程中, 噪声e(t)会对建模过程产生干扰, 对检测结果产生不利影响, 因此选择小波阈值法去除噪声e(t). 当小波变换对有噪声的网络流量数据进行处理后, 通常情况下有用的网络流量数据与幅值大的系数相对应, 而噪声e(t)与幅值小的系数对应, 因此采用一个阈值δ与小波系数进行比较, 如果小波系数小于δ, 则认为其是噪声, 去除该系数. 目前小波阈值法有软阈值去噪法和硬阈值去噪法, 但它们均存在不足, 如硬阈值法去除噪声不彻底, 而软阈值法易将一些有用的数据去除, 难以保证原始数据的真实性. 因此本文采用改进的小波阈值法进行去噪, 阈值函数构建如下:其中: wj,k表示原始小波系数表示阈值处理后的小波系数; N表示小波分解层次. 由于阈值函数是一种连续函数, 当|ωj,k|≥δ时可导, 因此可得通过小波阈值法对采集网络流量数据进行去噪后, 采用小波重构得到去噪后的网络流量数据, 去噪过程如图1所示.1.2 回声状态网络回声状态网络是一种新型的时间序列分析方法, 也是一种递归神经网络, 其主要核心模块为动态记忆库, 数据通过输入层进入动态记忆库学习, 并对网络的相关参数进行动态调整, 具有强大的非线性学习能力, 能对网络流量异常行为进行建模和分析, 回声状态网络的基本结构如图2所示.设回声状态网络有M个输入节点, 动态记忆库的节点数为N个, 有L个输出节点, 对于第n个时刻, 回声状态网络各节点间的关系可描述为设回声状态网络的输入为u(k), 输出为y(k), 动态记忆库的储备池状态为x(k), 则当网络结构确定后, 回声状态网络即构成一个非线性系统, 此时回声状态网络可采用下式进行描述:其中: tanh表示正切函数; b为偏置向量; Wx,Win,w分别表示回声状态网络的内部、输入、输出的权值.回声状态网络的工作过程包括采样和权值计算, 步骤如下:1) 初始化回声状态网络的状态x(0)=0, 根据Win对网络流量数据, 即输入u(k)(k=1,2,…)进行学习, 并通过动态记忆库进入储备池, 得到回声状态网络的输出;2) 根据训练样本和得到系统状态矩阵, 对输出权值w进行计算:其中, λ表示正则化系数. 当输出权值w确定后, 即完成了回声状态网络的训练, 建立相应的模型.本文模型的建模步骤如下:1) 针对某个网络系统, 采集其工作过程中的流量异常数据, 对于缺失数据采用相邻数据加权平均值进行补全, 同时为了消除流量变化幅度过大的不利影响, 对网络流量异常值进行归一化处理, 使网络流量异常值位于[0.1,1]内, 计算公式为其中: xmin和xmax分别表示对网络流量异常历史数据的最小和最大值;y′为归一化后的网络流量异常值;2) 采用小波阈值法对归一化后网络流量异常数据进行去噪, 去除其中含有的噪声, 并将数据划分为训练样本集和验证样本集两部分;3) 将网络流量异常的训练样本输入到回声状态网络中进行学习, 并初始化回声状态网络的相关参数;4) 估计回声状态网络的状态变量, 并计算回声状态网络的w值;5) 根据w计算模型的输出, 并与网络流量异常的实际值进行比较, 得到回声状态网络的网络流量异常检测误差;6) 如果网络流量异常检测误差未达到实际应用要求的范围, 则返回4)继续学习;7) 根据估计的参数, 建立网络流量异常检测模型, 对网络流量异常的验证样本集进行测试, 并对测试结果进行分析.综上可知, 基于时间序列分析的网络流量异常检测模型工作流程如图3所示.3.1 数据来源为了测试基于时间序列分析的网络流量异常检测性能, 用某个网络系统作为研究对象, 对其工作中的网络流量异常状态进行采集, 得到大量网络流量异常数据, 去除前面和最后部分的网络流量异常数据, 构建如图4所示的网络流量异常检测数据集.3.2 网络流量的小波阈值去噪图4的网络流量中含有一定的噪声, 导致网络流量变化有随机性, 且十分不平稳. 因此采用小波阈值法对其进行去噪处理, 得到不同尺度的网络流量, 通过重构得到去噪后的网络流量数据如图5所示.3.3 结果与分析采用回声状态网络对去噪后的网络流量异常数据进行训练, 建立时间分析法的网络流量异常检测模型, 对100个网络流量异常的验证样本进行测试, 得到异常检测预测结果如图6所示.由图6可见, 检测值与网络流量异常真实值相差较小, 二者之间的偏差可以忽略不计, 表明经过小波阈值法去噪后, 去除了网络流量异常数据中的噪声, 减少了噪声对网络流量异常建模的干扰.为了验证体现本文模型的优越性, 采用经典的网络流量异常检测模型进行对比实验[14-17], 用均方根误差(RMSE)和百分数误差(MAPE)[18]对网络流量异常检测结果进行比较:不同模型的网络流量异常检测结果列于表1. 由表1可见: 本文模型的网络流量异常检测结果的RMSE最低, 说明本文模型获得了高精度的网络流量异常检测结果; MAPE也低于其他对比模型, 表明对于所有网络流量样本, 检测结果较稳定, 且网络流量异常检测训练时间和检测时间也相对更少, 网络流量异常检测效果得到了明显改善, 可应用于大规模网络流量的异常检测, 从而提高了网络系统的安全性.综上所述, 为了提高网络流量异常检测的精度, 本文结合网络流量含有噪声、随机性变化的特点, 提出了一种基于时间序列分析法的网络流量异常检测模型. 首先采用小波阈值法对原始网络流量异常数据进行处理, 防止噪声给网络流量异常检测带来的干扰; 然后采用时间序列分析法中的回声状态网络建立网络流量异常检测模型. 实验结果表明, 该模型的网络流量异常检测精度较高, 且检测速度较快, 获得了比目前经典网络流量异常检测模型更优的结果.【相关文献】[1] 马卫, 熊伟. 基于协同神经网络的网络流量异常检测 [J]. 华中师范大学学报(自然科学版), 2012, 46(5): 537-539. (MA Wei, XIONG Wei. Network Traffic Anomaly Detection Based on Synergetic Neural Network [J]. Journal of Huazhong Normal University (Natural Sciences), 2012, 46(5): 537-539.)[2] 张登银, 廖建飞. 基于相对熵的网络流量异常检测方法 [J]. 南京邮电大学学报(自然科学版), 2012, 32(5): 26-31. (ZHANG Dengyin, LIAO Jianfei. Network Traffic Anomaly Detection Based on Relative Entropy [J]. Journal of Nanjing University of Posts and Telecommunications (Natural Science), 2012, 32(5): 26-31.)[3] 曹敏, 程东年. 基于自适应阈值的网络流量异常检测算法 [J]. 计算机工程, 2009, 35(19): 164-166. (CAO Min, CHENG Dongnian. Network Traffic Abnormality Detection Algorithm Based on Self-adaptive Threshold [J]. Computer Engineering, 2009, 35(19): 164-166.) [4] 郭峰赫, 刘淑芬. 基于sFlow的分布式网络流量分析系统 [J]. 吉林大学学报(理学版), 2015,53(5): 987-991. (GUO Fenghe, LIU Shufen. Distributed Network Traffic Analysis SystemBased on sFlow [J]. Journal of Jilin University (Science Edition), 2015, 53(5): 987-991.) [5] 尚华,冯牧,张贝贝. 基于Bayesian方法的参数估计和异常值检测 [J]. 重庆邮电大学学报( 自然科学版), 2016, 28(1): 138-142. ( SHANG Hua,FENG Mu,ZHANG Beibei. Parameter Estimation and Outliers Detection Based on Bayesian Method [J]. Journal of Chongqing University of Posts and Telecommunications (Natural Science Edition), 2016, 28(1): 138-142.)[6] 骆焦煌. 异常网络环境下云计算资源需求策略 [J]. 吉林大学学报(理学版), 2017, 55(4): 964-968. (LUO Jiaohuang. Strategy of Resource Demand of Cloud Computing in Abnormal Network Environment [J]. Journal of Jilin University (Science Edition), 2017, 55(4): 964-968.)[7] 谢红,刘人杰,陈纯锴. 基于误用检测与异常行为检测的整合模型 [J]. 重庆邮电大学学报(自然科学版), 2012, 24(1): 73-77. ( XIE Hong,LIU Renjie,CHEN Chunkai. An Integrated Model Based on Misuse Detection and Anomaly Behavior Detection [J]. Journal of Chongqing University of Posts and Telecommunications (Natural Science Edition), 2012, 24(1): 73-77.)[8] 温祥西, 孟相如, 马志强, 等. 基于局部投影降噪和FSVDD的网络流量异常检测 [J]. 计算机应用研究, 2013, 30(5): 1523-1526. (WEN Xiangxi, MENG Xiangru, MA Zhiqiang, et al. Network Traffic Anomaly Detection Based on Local Projection Denoise and FSVDD [J]. Application Research of Computers, 2013, 30(5): 1523-1526.)[9] 邹柏贤. 一种网络异常实时检测方法 [J]. 计算机学报, 2003, 26(8): 940-945. (ZOU Boxian. A Real-Time Detection Method for Network Traffic Anomalie [J]. Chinese Journal of Computers, 2003, 26(8): 940-945.)[10] 邱卫, 杨英杰. 基于尖点突变模型的联动网络流量异常检测方法 [J]. 计算机科学, 2016, 43(3): 163-167. (QIU Wei, YANG Yingjie. Interaction Network Traffic Anomaly Detection Method Based on Cusp Catastrophic Model [J]. Computer Science, 2016, 43(3): 163-167.)[11] 米捷, 王佳欣. 多层次数据中心网络流量异常检测算法 [J]. 河南工程学院学报(自然科学版), 2017, 29(1): 62-66. (MI Jie, WANG Jiaxin. Research on Anomaly Detection Algorithm of Multi-layer Data Center Network Traffic [J]. Journal of Henan University of Engineering, 2017, 29(1): 62-66.)[12] 费金龙, 王禹, 王天鹏, 等. 基于云模型的网络异常流量检测 [J]. 计算机工程, 2017, 43(1): 178-182. (FEI Jinlong, WANG Yu, WANG Tianpeng, et al. Network Traffic Anomaly Detection Based on Cloud Model [J]. Computer Engineering, 2017, 43(1): 178-182.)[13] 曹杰, 殷保群. 基于流特性的网络流量异常检测研究 [J]. 系统科学与数学, 2015, 35(10): 1127-1134. (CAO Jie, YIN Baoqun. Network Traffic Anomaly Detection Based on Flow Feature [J]. Journal of Systems Science and Mathematical Sciences, 2015, 35(10): 1127-1134.)[14] 李宇翀, 魏东, 罗兴国, 等. 基于多元增量分析的全网络在线异常检测方法 [J]. 上海交通大学学报, 2017, 29(1): 62-66. (LI Yuchong, WEI Dong, LUO Xingguo, et al. Online Network-Wide Anomaly Detection Algorithm Based on Multivariate Incremental Component Analysis [J]. Journal of Shanghai Jiaotong University, 2017, 29(1): 62-66.)[15] 牛咏梅. 基于分形理论的光纤网络流量异常检测技术 [J]. 激光杂志, 2016, 37(5): 89-91. (NIU Yongmei. Anomaly Detection Technology of Fiber Network Traffic a Based on Fractal Theory [J]. Laser Journal, 2016, 37(5): 89-91.)[16] 胡平, 叶坤, 刘瑞琴. 一种基于Chebyshev的网络流量异常检测方法 [J]. 计算机应用与软件, 2016, 37(5): 89-91. (HU Ping, YE Kun, LIU Ruiqin. A Network Traffic Anomaly Detection Method Based on Chebyshev [J]. Computer Applications and Software, 2016, 37(5): 89-91.)[17] 刘仁山, 孟祥宏. 基于时间特征的网络流量异常检测 [J]. 辽宁工程技术大学学报(自然科学版), 2013, 32(4): 544-548. (LIU Renshan, MENG Xianghong. Anomaly Detection of Network Traffic Based on Time Characteristics [J]. Journal of Liaoning Technical University (Natural Science), 2013, 32(4): 544-548.)[18] 韩敏, 穆大芸. 回声状态网络LM算法及混沌时间序列预测 [J]. 控制与决策, 2011, 26(10): 1469-1472. (HAN Min, MU Dayun. LM Algorithm in Echo State Network for Chaotic Time Series Prediction [J]. Control and Decision, 2011, 26(10): 1469-1472.)。
基于双向LSTM的网络安全态势预测模型的研究随着信息技术的发展,网络安全问题日益突出。
为了提前预测和应对网络攻击,研究者们开始探索利用机器学习算法来构建网络安全态势预测模型。
本文将介绍一种基于双向长短时记忆网络(BLSTM)的网络安全态势预测模型的研究。
网络安全态势预测模型是通过分析网络流量数据来预测未来的网络安全威胁。
双向LSTM是一种能够捕捉时间序列信息的递归神经网络模型,其具有记忆单元和门控单元,能够更好地处理长期依赖关系。
首先,本研究收集了大量的网络流量数据,并对数据进行预处理。
预处理包括数据清洗、特征提取和数据标准化等步骤,以确保数据的准确性和一致性。
接下来,我们构建了一个BLSTM网络模型来学习网络流量数据的特征和模式。
BLSTM模型由两个方向相反的LSTM层组成,可以同时考虑过去和未来的信息。
这种结构能够更好地捕捉网络流量数据中的时间相关性和依赖关系。
然后,我们使用收集到的网络流量数据训练BLSTM模型。
训练过程中,我们采用交叉熵损失函数和梯度下降算法来优化模型的参数。
通过不断迭代训练,模型可以逐渐学习到网络流量数据中的规律和模式。
最后,我们使用训练好的BLSTM模型来预测未来的网络安全态势。
通过输入当前的网络流量数据,模型可以输出未来一段时间内可能出现的安全威胁。
这样,网络管理员可以提前采取措施来防范潜在的攻击。
实验结果表明,基于双向LSTM的网络安全态势预测模型在预测准确性和稳定性上都取得了良好的效果。
与传统的预测方法相比,该模型能够更准确地预测网络安全威胁,并能够及时发现和应对潜在的攻击。
总之,本文研究了一种基于双向LSTM的网络安全态势预测模型。
该模型通过学习网络流量数据的特征和模式,能够提前预测和应对网络攻击。
未来,我们将进一步改进模型的性能,提高预测准确性,并将其应用于实际的网络安全防护中。
流量预测算法指标
流量预测是指根据历史数据和其他相关信息,利用算法来预测
未来某一时间段内的流量情况。
流量预测算法可以采用多种方法,
其中常见的包括时间序列分析、回归分析、神经网络、贝叶斯网络等。
这些算法在流量预测中各有优缺点,选择合适的算法需要考虑
数据特点、预测精度和计算效率等因素。
首先,时间序列分析是一种常用的流量预测算法,它基于历史
数据的时间序列模式,通过对趋势、季节性和周期性等因素的分析,来预测未来流量的变化趋势。
时间序列分析的指标包括均方根误差(RMSE)、平均绝对误差(MAE)等,用于评估预测结果与实际观测
值之间的偏差程度。
其次,回归分析是另一种常见的流量预测算法,它通过建立流
量与其他变量之间的数学关系模型,来预测未来流量的数值。
在回
归分析中,常用的指标包括R方值(R-squared)、残差标准差等,
用于评估模型的拟合程度和预测精度。
此外,神经网络算法在流量预测中也有广泛的应用,它通过模
拟人脑神经元的连接方式,来学习和预测复杂的非线性关系。
在神
经网络算法中,常用的指标包括均方误差(MSE)、准确率等,用于
评估网络模型的预测性能。
另外,贝叶斯网络算法则是一种基于概率推理的流量预测方法,它能够有效地处理不确定性信息,并结合先验知识和新观测数据来
进行流量预测。
在贝叶斯网络算法中,常用的指标包括后验概率、
边际概率等,用于评估预测结果的可信度和准确性。
综上所述,流量预测算法的选择需要根据具体情况进行综合考虑,评估指标也需要根据算法的特点和预测需求进行选择,以保证
预测结果的准确性和可靠性。
网络流量预测与优化技术研究近年来,随着互联网的普及和数字化时代的到来,网络技术不断发展,人们在日常生活中对网络的依赖越来越深。
作为一个世界性的信息交流平台,互联网在数据传输方面有着重要的作用。
因此,预测和优化网络流量成为了一个重要的研究课题。
在大数据时代,每天产生的网络数据数量以指数级增长,传统的网络模型和算法已经无法满足网络流量的需求。
因此,研究人员开始关注网络流量预测与优化技术的发展。
网络流量预测可以帮助网络管理员更好地规划网络资源,提高网络传输速度,降低数据丢失率。
而网络流量优化则可以帮助网络服务提供商提供更好的服务,提高用户体验和满意度。
网络流量预测是通过分析和建立数学模型来预测未来一段时间内的网络流量情况。
为了实现准确的预测,研究人员通常采用多种技术手段。
一种常用的方法是使用统计学模型,如时间序列模型、ARIMA模型等。
这些模型可以根据网络历史数据的规律,将过去的网络流量与未来的网络流量进行关联,从而得出准确的预测结果。
另一种方法是使用机器学习算法,通过训练算法模型来预测未来的网络流量。
机器学习模型可以根据大量的网络数据自动学习和调整模型,从而得出更为准确的结果。
然而,网络流量预测并非一项易事。
网络流量受到许多因素的影响,如用户量、应用程序需求、网络拓扑结构等。
因此,研究人员需要综合考虑这些复杂因素,并建立适当的模型来进行预测。
同时,网络流量预测还需要考虑未来的不确定性因素,如突发的事件、季节性变化等。
这对预测模型的鲁棒性和预测精度提出了更高的要求。
网络流量优化是在预测的基础上进行的,其目标是通过合理分配网络资源和调整网络拓扑结构,以提高网络的传输效率和质量。
网络流量优化包括多个方面,如路由优化、带宽调整、拥塞控制、缓存管理等。
通过优化网络流量,可以减少网络拥塞,提高数据传输速度,降低数据丢失率。
同时,网络流量优化可以帮助网络服务提供商更好地满足用户的需求,提高用户的满意度和粘性。
在网络流量优化方面,研究人员开发了许多技术和算法。
基于时问序列分析的网络流量预测模型研究周德懋,李舟军,康荣雷(北京航空航天大学计算机学院北京100191)
摘要:通过对网络流量数据作为时间序列进行小渡变换建模,应用于未来时间的网络流量数据预测。首先对流量数据序列进行多尺度分解,对分解到不同尺度上的数据分别利用不同的时间序列模型进行分析,然后进行预测数据的折衷处理,得到网络流量多尺度预测模型。仿真结果表明与单一应用RBF神经网络的时间序列预测模型相比,该模型预测效果良好,具有较高的预测精度和很好的模型适应性。关键词:网络流量;时间序列分析;径向基神经网络;小波变换建模中图分类号:P228.41;TP393文献标识码:A文章编号:1004—373X(2009)08—115一03
StudyonPredictionModdofNetworkTrafficFlowBasedonTimeSeriesAnalysisZHOUDemao,LIZhoujun,KANGRonglei
(SchoolofComputerScienceandEngineering,BeihangUniversity,Beijing,100191,China)
Abstract:Thenetworktrafficflowistobemulti—scalediscomposedtimeseriesbythewavelettransformmodelingisfirstintroduced,andthendifferenttimeseriesanalysismodelsbuilttoanalyzedataofdifferentscale,sothemulti—scale
predictionmodelisusedinnetworktrafficflowprediction.Theexperimentdataindicate:comparedwithothersingletime—seriespredictionmodelswithRBFnetworktheory,thismodelprovidebetterapproximateandpredictioneffort,andhashigherprecisionofpredictionandbetteradaptability.Keywords:networktrafficflow;timeseriesanalysis;RBFnetwork}wavelettransformmodeling
0引言对通信网络流量的预测,已有的方法主要建立在数理统计的基础上,其中较为成功的预测方法有:基于FARIMA(P,d,q)模型的预测方法uo;C.Bor—Sen提出的模糊自适应方法[2];基于分数整合滑动平均模型的预测方法口“1;利用模糊判断规则预测网络流量的方法[53等。目前,利用小波理论处理时间序列问题已经是一个热点,在许多领域得到应用并取得较好的成果,如物流、生物学、经济等[6]。而国内基于小波理论研究网络流量的研究工作开展甚少,因此,这里着重于讨论基于小波理论的网络流量预测新方法。在此将网络流量作为时间相关序列进行分析,提出将时间序列多尺度分辨分析方法应用于网络流量预测中,以期建立更合理、可行的网络流量预测模型,得到精确、可信的网络流量预测结果。1基本理论1.1多尺度系统分析理论多尺度系统分析理论的研究基于4个基本出收稿日期:2008—08—28基金项目:国家自然科学基金的资助项目(60573057,90718017)发点N]:(1)所研究的现象或过程具有多尺度特征或多尺度效应;(2)无论现象或过程是否具有多尺度特性,通常观测信号是在不同尺度(或分辨率)上得到的;(3)无论现象或过程是否具有多尺度特征,观测信号是否在不同尺度或分辨率上得到,利用多尺度算法往往能获得更多信息,从而降低问题的不确定性及复杂性;(4)无论现象或过程是否具有多尺度特性,观测数据是否在不同尺度上得到或者观测目标是否在多尺度上描述,总有一个不可忽略的原因考虑多尺度模型算法,那就是利用多尺度算法往往能够获得更多信息,从而降低问题的不确定性和复杂性。在实际应用中,分析和识别发生在不同尺度上的现象是很有意义的。多尺度分析建立在小波变换和多尺度表达理论的基础上,由于尺度分解直观、结构灵活并能提供良好的数学框架,使得基于小波的多尺度技术成为许多基础和应用研究的有力工具。多尺度建模和估计方法的灵活性可以在快速并行算法中对噪声和分辨率进行折衷。1.2时间序列多尺度混合预测模型建立在时间序列上的多尺度分析以小波分析与】】5 万方数据Mallat算法f8】为基础,其分析方法的核心内容是正交小波分解和重构。而Mallat算法为这一方法提供了便捷的递推公式。其基本思想是:将待处理的时间序列在不同的尺度上分解为细节和轮廓两部分,分解到细尺度上的部分称为细节序列部分,反映时间序列中高频部分变化;分解到轮廓尺度上的部分称之为平滑序列部分,反映时间序列中低频部分变化。通过分析序列所分解的细节和轮廓的部分,实现对时问序列的多尺度分析。在应用多尺度分析方法处理实际问题时,首要问题必须构造正交小波。1998年,I.Daubechies提出具有紧支集的正交小波系列:Daubechies小波。该正交小波的提出具有重要的意义。它使有限长度的时间序列进行正交小波分解和重构。利用DB为母小波对时问序列进行多尺度分解,将时间序列分解为趋势成分、随机成分和周期成分。趋势成分可以看作周期长度比实测序列长度长的长周期成分,因此该成分属于大尺度高频成分;随机成分由一系列人为随机因素引起,属于小尺度高频成分;周期成分由确定性因素引起。在频谱分析中介于趋势成分和随机成分之间。因此,将时间序列进行多尺度小波分解可以识别3种成本并将其进行分离。将分解后具有不同特征的时间序列分别利用相应的分析模型进行参数识别和估计,建立各自的相关模型,再将各模型的分析结果进行线性叠加得到最终结果。实现时间序列的耦合预测会得到比单一时间序列预测模型更好的分析预测结果。这是因为小波分解将非平稳时间序列分解成适当的多个平稳时间序列,提高了数据变化的稳定程度,从而提高了预测经精度。分析上述分解成分,将近似平稳的低频趋势项用AR模型来进行预测,因为AR模型对于分析平稳时间序列有较好的预测效果;将周期项和高频随机项分别利用RBF神经网络进行参数估计和建模;将三者的预测结果进行线性叠加得到最终的多尺度混合预测模型。2网络流多尺度混合预测模型网络流量的多尺度混合预测模型的具体实现步骤如下:2.1小波分解利用实际应用广泛且应用效果较好的db3小波对网络流量{Z,}进行3尺度分解,得到含有周期项和高频随机项的序列{H,},以及低频部分{L,}。2.2RBF网络的模型建立过程对分解之后得到的周期项和高频随机项{H。)采用RBF神经网络进行预测,具体实现步骤如下:(1)将输入的时间序列{H,}进行归一化处理,有:h,=(^i—h。i。)/(矗。,一h。i。)(1)116(2)对于时间序列hi,希望通过前夕个时刻的值预测下一个时刻的值,因此可将P作为神经网络的输入向量维数。P也称为神经网络的阶数,它的确定可遵循如下的步骤:对于非线性时间序列,一般的动力学表达式为:h,一f(h,1,h.2,…,矗.。)+e,(2)
用RBF神经网络进行函数逼近后的一步预测为:h,一f(h,I,h.2,…,h。。)(3)根据一步预测误差确定模型的阶次P。大量的数据试验表明,当P超过一定的值时,预测精度不会随着P的增加而提高,相反会增加计算量。因此在实际应用中,需要在低阶次和高精度之间进行折衷。(3)选用径向基函数为高斯函数的RBF网缓、,神经网络的输出为:
多一∑牡exp(一忪一c;㈣2砰)(4)
式(4)中:参数Ci为基函数的中心;毋为宽度;毗为权值;优为隐层感知器个数。(4)给定样本集[z;,Yi],根据梯度下降法进行网络训练,确定相关的参数值。取性能指标函数为:,一扣一耋岬pc等,]2㈣
求指标函数,关于Ci,吒以及∞i的偏导数,基于梯度下降法进行网络训练。(5)根据神经网络的训练结果,得到高频部分的载波相位预测值五。。2.3AR模型建立
对分解之后得到的低频序列{L,)采用AR时间序列建模。AR模型表述如下:l,一妒lZ,1+他Z,_2+…+%Z,。+蛳(6)式中:鸭相互独立同分布,体现了序列的随机性;q代表模型的阶数。AR模型建模具体实现步骤如下:(1)根据已经建立的AR模型,利用AIC准则函数[1¨进行定阶:AIC=一2log(模型的极大似然度)+2(模型的独立参数个数),预先给定上界lgN,其中N表示样本个数。根据AIC极小点确定模型的阶数。(2)根据最小二乘法对参数P进行估计:将式(6)写成矩阵形式,有:Y=却+(cJ(7)
依据最dx--乘估计公式计算得:妒一(LTL)一1LTy(8)(3)根据建立的AR模型,估计k时刻网络流量低频部分的预测值为:Z^=仍lk-1+仇Z卜2+…+%Z卜口(9)
万方数据王现岱虫壬撞苤之圣QQ皇笙墓墨翅盏羞星!墨翅垒盐篡垫廛旦堇盔g2.4预测结果输出预测k时刻的网络流量为:乞=左。+2。(10)
3仿真分析按照上述理论和方法,通过Matlab仿真检验多尺度混合预测模型对网络数据流预测的准确性。根据3000个历史网络数据流,预测未来300个网络数据流,并且与实际数据进行比较,得到预测的误差。传统的基于OLS算法的RBF神经网络应用于时间序列预测后的误差如图1所示,而这里所提出的多尺度混合预测模型的预测误差如图2所示。
图1OLS算法RBF神经网络预测误差图图2多尺度混合预测误差图仿真结果表明,多尺度混合预测模型应用于网络数据流的预测,比传统的OLS算法RBF神经网络预测模型,能得到更好的预测结果。
4结语这里根据时间序列分析理论,提出基于小波理论的网络流量混合预测模型。模型首先对网络流量序列进行多尺度分解,得到低频部分,高频部分和随机项;然后对得到的低频部分建立AR模型,对高频部分和随机项采用RBF神经网络进行预测;最后对各个模型的预测结果进行线性叠加,得到网络流量混合预测模型。仿真结果反映预测的准确性,验证了方法的可行性与有效
性。因此,将小波理论应用于网络流量预测中,具有很好的应用前景。
参考文献[13GarrettMW,WilhingerW.Analysis。ModelingandGenera—
tionofSelf—similarVBRVideoTraffic[A].Proceedings
SIGCOMM’94[C].NewYork:ACMPress,1994:269—280.
[2]ChenBorsen,YangYusuarg,BotekuenLee,以a1.FuzzyAdap—