IP网带宽测量技术研究与进展
- 格式:pdf
- 大小:729.64 KB
- 文档页数:10
网络测量中的链路延迟和带宽测量方法解析随着互联网的高速发展和数字化时代的到来,网络测量成为了一门重要的技术。
网络测量不仅可以帮助我们实时监测网络的健康状态,还可以帮助网络运营商优化网络架构和提供更好的网络服务。
在网络测量中,链路延迟和带宽是两个重要的指标,下面将对这两个指标的测量方法进行解析。
一、链路延迟测量方法链路延迟是指从发送数据开始到接收数据结束所经历的时间。
在网络测量中,我们通常使用Ping命令来测量链路的延迟。
Ping命令是网络诊断工具中的重要命令,它通过发送一个小的数据包到目标主机,并监听目标主机返回的响应时间来测量链路的延迟。
通过观察Ping命令的输出结果,我们可以得到链路延迟的平均值、最小值和最大值等信息,从而评估链路的质量。
除了Ping命令,还有其他一些更为复杂和精确的链路延迟测量方法,如使用Traceroute命令。
Traceroute命令可以跟踪数据包从源主机到目标主机所经过的路径,同时测量每一跳的延迟。
通过分析Traceroute命令的输出结果,我们可以发现链路中存在的瓶颈节点,并优化网络架构以提供更好的网络服务。
二、带宽测量方法带宽是指网络链路传输数据的能力,也是衡量网络性能的重要指标。
在网络测量中,我们可以使用不同的方法来测量链路的带宽。
其中之一是基于TCP协议的带宽测量方法。
这种方法通过向目标主机发送特定大小的数据包,并测量数据包从发送到接收所经历的时间来计算链路的带宽。
这种方法的优点是简单易用,但其精度可能受到TCP协议本身的限制。
另一种带宽测量方法是基于UDP协议的。
UDP协议相比于TCP协议来说,具有较小的报头和较少的控制机制,因此可以更加灵活地测量链路的带宽。
通过发送一系列不同大小的UDP数据包,并测量数据包的传输时间和丢包率,我们可以计算出链路的带宽。
这种方法在精度上相对较高,但也容易受到网络负载和拥塞的影响。
此外,还有一些基于主动探测的带宽测量方法,如使用Iperf工具。
基于Web 技术的IP 网络性能测量系统的研究与实现①荆 雷② 金跃辉③ 林 宇(北京邮电大学网络与交换国家重点实验室 北京100876)摘 要 在分析了网络性能测量系统的功能和层次结构的基础上,设计并实现了一个利用Web 技术测量IP 网络性能的系统。
系统基于分布式B/S 架构,有效地简化了部署并增强了移植性,降低了开发和维护的成本。
在模拟网络环境中的试验结果显示,系统测量结果准确可靠,测量速度快,代价低。
关键词 基于Web 的测量,性能测量,测量系统0 引言随着互联网的迅速发展,Internet 性能测量的研究受到了国际上的普遍关注。
网络性能测量是进行网络流量、拓扑、行为建模分析的基础和验证手段。
因此,构建一个可扩充的、高度可重用的IP 网性能测量系统就变得十分必要。
Internet 的盛行使得Web 浏览器成为一个广受使用者接受的操作界面,更由于各种与WWW 相关的开发技术如CGI 、JavaScript 、ActiveX 、X M L 、C OR 2BA [1]、DC OM [2]等陆续出现而逐渐成熟,使得Web 浏览器的用途从原先基本的超媒体本文浏览,扩展至各式各样的网络应用。
而WWW 本质上的主从式架构也使得利用该技术开发网络性能监测系统的做法变得直接而合理[3]。
本文介绍的是一种利用Web 技术和Applet 技术实现IP 网络性能的测量方法,网络性能测量系统采用了主动测量方式,主要针对树型拓扑IP 网络开展网络层和应用层端到端性能测量。
1 网络性能测量技术根据测量技术获得网络节点的支持力度以及测量点的位置可以将网络性能测量分为基于路由器的测量、端到端测量和路由器协作测量。
基于路由器的测量是利用路由器上各种网管软件来获取设备端口性能。
端到端的测量是只在边缘主机的参与下完成网络性能分析,对于端到端测量需要综合多个测量节点的结果来推导全网状况。
路由器协作测量也是在边缘主机上开展的测量,但需要在路由器的配合下对网络性能进行评估。
第3期2024年2月无线互联科技Wireless Internet Science and TechnologyNo.3February,2024作者简介:喻胜(1973 ),男,高级工程师,博士;研究方向:城域网络规划和设计㊂基于模型驱动双向主动测量协议的IP 网络遥测系统研究与实现喻㊀胜1,周㊀浩1,李㊀超2(1.成都斯达康科技有限公司,四川成都610051;2.电子科技大学信息与通信工程学院,四川成都617023)摘要:IP 层的OAM 技术中,双向主动测量协议(TWAMP )通过主动向网络注入测量报文,并根据对测量报文进行采集分析来实现任意2个具备IP 可达性网络节点之间的网络层性能监测㊂文章首先分析了TWAMP 测量方案在实际运营部署时存在的主要问题和挑战,然后针对网络的运维管理日益智能化的网络发展趋势下,需要对网络运行状况进行连续实时主动监测的新需求进行了相关分析㊂基于此,文章提出了一种面向互联网遥测架构的硬探针TWAMP 网络监控系统,以此实现IP 传送网的性能监测改进,为实现更实时可靠的智能运营提供有力支撑㊂关键词:IP 性能监测;双向主动测量协议;网络遥测;模型驱动遥测;硬探针中图分类号:TN915㊀㊀文献标志码:A0㊀引言㊀㊀随着网络和应用的演进,在网络上进行多业务承载时,运营商希望能有更完善的运维管理(Operation Administration and Management,OAM)方法对网络的性能进行监测,以在业务开通前以及业务运行过程中对网络的运行状况及故障进行及时的评估和监测㊂随着5G 和数智化时代用户业务类型的日益丰富,运营商传送网络的承载需求也在相应提高㊂网络的OAM 是一个分层分段的综合管理架构,在不同的传输技术中可以包含特定层次的相应OAM 技术㊂IP 层的OAM 技术中,针对任意2个具备IP 地址且路由可达的网络节点之间的IP 性能监测(IP Performance Monitor,IPPM)方法需要能够持续监测IP 层的端到端的报文传输时延㊁抖动及丢包率等网络性能信息[1]㊂1㊀双向主动运维协议方案的问题和挑战㊀㊀双向主动测量协议(Two -Way Active Measurement Protocol,TWAMP)是一种通过在指定的IP 节点之间主动发送双向IP 探测报文来检测网络指定IP 端点间IP 层网络性能的网络运维管理方法[2]㊂双向主动测量协议通过主动向网络注入测量报文,并根据对测量报文进行采集分析来实现任意2个具备IP 可达性网络节点之间的网络层性能监测㊂运营商在部署IP 层业务之前以及在网络实际运营时都可以通过TWAMP 方法,在需要监测的任意2个IP 节点上进行TWAMP 测量㊂在通过定义测量端点的IP 地址㊁传输层端口号㊁报文IP 优先级定义了测试会话(Test Session)之后,TWAMP 通过其Session Sender 模块向网络中注入带时戳和序列号的IP 测量报文发向测量对端端点㊂TWAMP 的测量对端端点作为会话报文的反射器(Session Reflector)将报文打上相应接收时戳反射回Session Sender㊂根据测试会话报文中携带的信息,TWAMP 能够完成任意2个具备IP 可达性的网络节点之间的IPPM 性能监测,并将测量数据上报给服务器端的性能管理系统㊂国际互联网工程任务组(The Internet Engineering Task Force,IETF )的RFC 5357标准中定义了TWAMP 测量方法的架构㊁流程和测量报文格式㊂然而,已有TWAMP 标准没有定义完成测量后形成的测量结果数据如何以合理的㊁标准化的方法传输给服务器端的性能管理系统数据采集器(Collector)㊂现有TWAMP 测量结果采集方法仍然将TWAMP 测量数据作为常规网络设备的性能监测(Performance Monitor,PM)对象进行采集㊂例如,通过类似对网络设备端口15min 流量统计PM 数据进行轮询的类似方法,由Collector 定期通过一问一答的方式轮询网络设备的TWAMP 测量结果数据,或者在网络出现故障需要密集主动连续测量网络IP 层性能时通过各设备厂商私有的网管数据采集方法来实现秒级主动上报㊂2 网络遥测架构㊀㊀在IP 网络日益复杂㊁网络的运维管理日益智能化的网络发展趋势下,需要对网络运行状况进行连续实时的主动监测㊂网络遥测(Telemetry)是一种通过服务器侧Collector 订阅需要采集的网络测量数据集(探针Probes 或传感器Sensors),网络节点连续主动实时推送测量数据的网络监测框架[3]㊂通过对网络设备的可监测测量数据进行数据模型抽象和结构化编码,服务器侧的智能运维系统能够自动对测量数据进行大数据分析等人工智能处理,进而实现感知网络㊂网络遥测方法是一种面向网管智能化的网络全方位性能监测框架㊂基于网络遥测框架,将TWAMP 测量以硬件探针的方式在数据平面进行亚秒级实时测量和秒级主动推送,可以有效提升IPPM 的测量效率和数据分析效率,为网络感知智能运维提供有力支撑㊂2.1㊀IP 承载网中的网络遥测㊀㊀网络遥测为网络的实时感知提供了新的框架㊂网络遥测可以订阅的网络感知数据涵盖了网络的管理㊁控制和数据平面㊂新一代网络遥测架构涵盖数据源㊁数据订阅㊁数据生成等多个组件㊂数据订阅需要定义可以从原始数据源组合和派生的自定义数据,数据生成利用适度的网络内计算来产生所需的数据㊂以基于L3VPN 的移动回传IP 城域网的南向接口(South Bound Interface,SBI)为例㊂如图1所示,典型的IP 承载网SBI 可分为4种主要接口类型:控制接口㊁配置管理接口㊁告警/性能和维护管理接口㊂除用作性能管理接口之外,网络遥测还可扩展实现OAM 测量等功能㊂图1㊀典型移动回传网络管控系统架构2.2㊀网元网络遥测㊀㊀本文实现的IP 网络性能监测系统中,运行在网元侧的遥测代理软件模块可以配置为遥测协议的服务器或客户端㊂本文实现的网元遥测方案如图2所示㊂设备网元上的遥测代理(Telemetry Agent)系统负责收集网元的性能/统计数据和状态数据并将其推送到收集器㊂遥测Agent 主要包括以下子模块:图2㊀网元遥测代理子系统架构㊀㊀(1)Policy㊂配置管理子模块,可设置遥测参数,包括采集器的IP/端口㊁订阅规则(决定推送哪些数据)㊁采样周期㊁传输协议和编码方式等㊂(2)Encode and Transport㊂Encode and Transport对采集到的数据进行编码和发送㊂(3)Data㊂网元设备中的传感器采集的数据㊂这些数据可能来自网元数据平面㊁控制平面或管理平面,可以实时反映网元设备的运行状态㊂(4)Sensor data buffer㊂Sensor data buffer用于接收来自网元传感器的遥测数据记录㊂已上报给采集器的遥测数据记录由遥测代理动态删除㊂遥测传感器数据缓冲区可以通过内存㊁文件或数据库来实现㊂3㊀基于网络遥测的双向主动测量方案3.1㊀TWAMP遥测系统架构㊀㊀针对传统TWAMP测量方法在数据处理和采集上报等实践应用中存在的问题,本文采用硬件TWAMP探针设计,基于网络遥测架构实现了一种模型驱动的硬件加速TWAMP遥测系统,如图3所示㊂图3㊀模型驱动的硬件加速TWAMP遥测系统㊀㊀模型驱动的硬件加速TWAMP遥测系统中,TWAMP数据探针模块采集部署于TWAMP协议Session Sender从其测量对端TWAMP SessionReflector返回的携带了原始IPPM测量信息的原始数据㊂系统的数据生成模块对TWAMP数据探针模块的TWAMP测量结果数据进行如下处理和编码:(1)利用TWAMP原始测量结果计算出IP OAM的IPPM测量参数,包括平均时延㊁最小时延㊁最大时延㊁平均抖动㊁最小抖动㊁最大抖动㊁平均丢包率㊁最小丢包率㊁最大丢包率等㊂对RFC5357标准定义的原始测量数据进行IPPM参数计算并形成结构化的TWAMP IPPM数据模型㊂TWAMP IPPM结构化数据模型形成一棵逻辑TWAMP探针采样子树,挂接在网络设备Telemetry采样树设备探针采样数据模型树的OAM相关节点下㊂(2)根据数据订阅模块的设置,数据生成模块可以对TWAMP测量分析结果数据进行取样并只对取样结果进行上报㊂(3)将IPPM测量结果按照TWAMP IPPM YANG数据模型规定的数据格式进行编码,并按照数据采集模块的订阅要求,以利于大规模并发数据采集的占用最少量测试数据传送带宽和CPU处理能力的数据格式进行测量结果编码㊂例如,采用二进制的序列化方法对TWAMP测量结果进行编码㊂二进制编码方法可以降低TWAMP测量结果传输对网络带宽和CPU处理性能的要求,同时维护对不同厂家数据采集模块软件的兼容性㊂图3中,数据订阅模块对需要采集的TWAMP测量信息㊁传输协议和传输通道进行设定㊂数据采集模块可以通过数据订阅模块对TWAMP测量信息采集事件触发标准进行设定㊂这一设定是基于TWAMP数据模型的㊂例如,数据采集模块可以通过数据订阅模块指定订阅平均丢包率大于10-5的TWAMP实时测量结果㊂数据订阅模块可以支持多种测量结果数据传输通道㊂数据发行模块对数据生成模块根据TWAMPIPPM YANG模型完成编码后的测量结果数据在数据订阅模块指定的传输通道上向数据采集模块进行连续㊁实时㊁主动的推送上传㊂本文系统中,数据采集模块用于通过数据订阅模块发起对TWAMP测量结果的订阅,同时用于接收数据发行模块推送的TWAMP实时测量结果㊂数据采集模块部署于云端,可以与OMC管控软件同机部署,也可以独立部署㊂数据采集模块采集的TWAMPTelemetry数据可以供更上层运维支持系统(Operation and Support System,OSS)及OMC控制器系统的数据分析模块进行智能分析㊂这一智能分析可以形成交互模型,即根据网络智能分析结果,OSS&Controller的相关应用可以自动形成并下发网络优化配置方案,并通过数据采集模块调用数据订阅模块来调整订阅的TWAMP测量数据并分析网络调优的效果,从而形成闭环控制㊂3.2㊀基于硬探针的TWAMP测量㊀㊀本文在基于ASIC架构的IP城域路由器(IPRAN Router)上实现了数据平面硬件加速的TWAMP硬探针,能够以亚秒级的周期发起TWAMP测试㊂本文研究通过在硬件数据平面增加TWAMP硬件加速协处理器的方式,实现TWAMP测试数据的亚秒级发送和解析㊂首先,在接收方向,在网元路由器(以下简称 网元 )的ASIC数据平面OAM模块设置基于TCAM的流量识别功能,识别预定义的TWAMP报文并Trap到TWAMP硬件加速协处理器去做结果测量和上报处理㊂对于每个TWAMP流,TWAMP硬件加速协处理器根据配置的报文offset识别出报文中的序列号㊁时戳等信息,自动计算出收包总数㊁丢包总数㊁报文时延(累计㊁最小㊁最大)㊁抖动㊂对每一个TWAMP流而言,TWAMP硬件加速协处理器定期计算㊁更新和向网元CPU上报TWAMP的测试结果㊂同时,在发送方向,TWAMP硬件加速协处理器的发包子模块可以构造报文头在报文的任意指定位置为特定流填写序列号㊁时戳和计数器之后,向网元ASIC数据平面进行常规发送㊂3.3㊀模型驱动的TWAMP遥测㊀㊀网络遥测架构的一个重要组件是结构化的探针数据集,模型驱动的遥测(Model-Driven Telemetry, MDT)㊂网络设备上的数据可以通过数据模型进行描述,保证运维中心(OMC)管控系统与设备之间的正确交互㊂在MDT中,模型驱动是用户或OMC可以指定模型路径来订阅设备需要推送的数据集㊂在网元上,数据也是按照这个模型描述发送的㊂在MDT架构中,采样数据源来自网元的转发面㊁控制面和管理面㊂数据根据YANG模型中描述的结构进行组织,以GPB㊁XML或JSON格式编码,并发送到收集器和分析器使用gRPC㊁TCP或UDP进行处理㊂网元设备中的遥测代理可以抽象为3层:数据模型层㊁编码层和传输层㊂供应商和组织为网络设备数据定义不同的YANG模型㊂为了实现来自不同供应商的网元和OMC的互操作,发送的遥测数据应按照标准YANG 模型进行组织㊂Google远程过程调用(gRPC)协议是一个在传输层HTTP/2协议上运行的高性能通用RPC框架㊂使用相同.proto文件的网元和采集器可以建立gRPC连接㊂gRPC连接建立后,可以通过gRPC通道传输各种语言编码的数据㊂本文系统遥测的TWAMP数据根据YANG模型中描述的结构进行组织,以Google Protocol Buffers (GPB)格式编码,并使用Google远程过程调用(gRPC)发送到收集器㊂在采用GPB编码方式的情况下,本文实现的TWAMP数据模型定义在twamp. proto中㊂4㊀基于TWAMP的微突发检测案例㊀㊀网络微突发(Micro Burst)故障是网络中发生的小规模㊁短暂的故障,其持续时间通常在几ms到几s 之间㊂网络微突发故障可能导致网络中断㊁数据丢失或导致网络安全威胁,从而影响用户的隐私和财产安全㊂通常,网络微突发故障的规模很小,故障持续时间短,因此检测难度很大[5]㊂4.1㊀微突发TWAMP测试数据㊀㊀为验证硬探针TWAMP遥测系统的有效性,本研究工作使用10ms级别的TWAMP测量报文发送周期和秒级的网络遥测推送发行周期对潜在问题的IP 连接进行微突发故障检测,对系统识别的有效性和准确性进行测试㊂针对目标网络,对IP报文丢包微突发故障进行TWAMP主动测量,基于网络Telemetry 的秒级实时监控采集数据进行故障检测㊁故障关联㊁根因分析和网络调优㊂首先,根据被监控网络的微突发故障涉及网络范围,安装TWAMP硬件探针,启动对指定IP网络节点间的网络主动监测㊂根据故障检测要求和TWAMP 的Telemetry YANG数据模型,调整订阅的TWAMP测量结果参数集㊁阈值及数据发行接口类型㊂TWAMP 硬探针启动后,本文系统的网络设备TWAMP的Session Sender模块处理来自远端Session Reflector的TWAMP主动测量报文㊂设置数据订阅,对TWAMP 探针的原始测量数据进行IPPM分析计算和Telemetry的发行格式编码㊂数据发行模块对TWAMP丢包率测量结果进行实时主动的上报发行㊂然后,通过在被测IP网络使用仪表以burst方式注入持续时间很短的高优先级背景流量,例如在GE接口上以线速注入50000个报文的高优先级burst报文,造成监测IPPM的TWAMP test session由于GE接口拥塞而形成微突发㊂4.2㊀微突发TWAMP测试结果㊀㊀基于TWAMP测试数据集,本文系统数据采集模块对来自多个网络设备的TWAMP订阅数据进行采集汇总,完成数据解码,提取需要的丢包率监测信息,发送给数据分析模块㊂数据分析模块通过智能分析对来自多个网络设备的实时TWAMP监测数据进行故障关联性及根因分析㊂OSS/Controller分析结果可以向网络下发调优配置命令㊂通过长期网络监测,云端模块可以推理分析微突发故障是否已经消除;若需要,则继续进行下一轮网络调优和TWAMP网络Telemetry监测㊂本文研究工作对TWAMP探针测量结果的主动Telemetry推送的发行时间间隔可以达到秒级㊂测试结果表明,这种实时主动的IPPM秒级上报监控能够有效检测出IP网络中的微突发故障,有助于实现网络的感知㊂5 结语㊀㊀综上所述,本文监测系统的IP网元TWAMP数据生成模块将TWAMP测量得到的原始数据进行网络设备节点本地的统计分析计算,并按照模型驱动遥测的结构化数据模型进行测量结果组织,有利于智能运维的云端分析软件进行智能的自动分析处理㊂目前,本文IP网络性能监测系统的研究以TWAMP的网络遥测架构建立为主,为运营商提供了全面的网络状态和性能信息㊂随着云端智能的逐渐加强,TWAMP遥测能够为下一代数智化网络提供智能决策支持㊂基于IP网络性能监测的实时遥测数据,运营商可以做出更加智能的决策,如容量升级㊁网络配置调整㊁故障预测等㊂这有利于实现基于网络大数据分析的智能闭环感知网络,有助于提高运营商的决策效率和网络运营的整体质量㊂参考文献[1]胡治国,田春岐,杜亮,等.IP网络性能测量研究现状和进展[J].软件学报,2017(1):105-134. [2]张夏颖,田耕.IP RAN下TWAMP测量功能的研究与实现[J].网络新媒体技术,2019(6):25-30. [3]代天成,张笑.网络遥测技术及其在网络自动化运维中的应用[J].无线互联科技,2023(7):91-93. [4]KUMAR A,KOLHE J,GHEMAWAT S,et al. IETF draft-kumar-rtgwg-grpc-protocol-00[EB/ OL].(2016-07-08)[2024-01-10].https:// /doc/html/draft-kumar-rtgwg-grpc-protocol-00.[5]NEWMAN D.高性能数据中心的10项基本基准测试(续一)[J].电信网技术,2012(12):64-72.(编辑㊀王雪芬)Research on IP network telemetry system based on model-driven two-way activemeasurement protocol methodYu Sheng1Zhou Hao1Li Chao21.Chengdu Starcom Technology Limited Chengdu610051 China2.School of Information and CommunicationEngineer University of Electronic Science and Technology of China Chengdu617023 ChinaAbstract In the OAM technology at the IP layer the Two-Way Active Measurement Protocol TWAMP implements network layer performance monitoring between any two network nodes with IP reachability by actively injecting measurement packets into the network and collecting and analyzing the measurement packets.The article first analyzes the main problems and challenges existing in the actual operation and deployment of TWAMP measurement and then addresses the new demand for continuous and real-time active monitoring of network operating conditions under the increasingly intelligent network development trend of network operation and maintenance management.Based on this this article proposes a hardware accelerated TWAMP network monitoring system oriented to the network telemetry architecture to achieve performance monitoring improvement of the IP transport network and provide solid support for achieving more real-time and reliable intelligent OAM.Key words IP performance monitoring two-way active measurement protocol network telemetry model-driven telemetry hardware accelerated probe。
IP地址的网络质量监测和优化随着互联网的快速发展,IP地址作为网络通信的基本单位,对于网络质量的监测和优化起着重要的作用。
本文将介绍IP地址的网络质量监测和优化的相关内容,以便提高网络连接的稳定性和速度。
一、IP地址的网络质量监测IP地址的网络质量监测是指对于特定IP地址的网络连接进行实时的监测和评估,以获得网络连接的质量状况。
以下是几种常见的IP地址网络质量监测方法:1. 延迟测试:延迟是指从发送请求到接收响应的时间间隔,也是衡量网络速度的重要指标。
常用的延迟测试工具有Ping和Traceroute。
Ping可以通过向目标IP地址发送小数据包并测量返回时间来评估网络延迟;Traceroute可以确定数据包在网络中的路径和传输时间,帮助我们找到延迟问题的源头。
2. 带宽测试:带宽是指网络连接传输数据的能力,通常以Mbps为单位。
带宽测试可以帮助我们了解网络连接的实际速度,并检测是否存在速度不稳定或限制带宽的问题。
常用的带宽测试工具有Speedtest 和iPerf。
3. 丢包率监测:丢包率是指在数据传输过程中丢失的数据包比例。
通常,丢包率越低,网络质量越好。
通过使用工具如MTR和Wireshark,我们可以监测网络连接的丢包率,并对其进行分析,找出导致丢包的原因。
二、IP地址网络质量的优化在对IP地址网络质量进行监测的基础上,我们可以采取一些优化措施来提高网络连接的质量和速度。
以下是几种常见的IP地址网络质量优化方法:1. 选择最佳的互联网服务提供商(ISP):不同的ISP提供的网络质量和速度有所不同。
通过进行比较和研究,选择一个可靠的ISP,可以大大改善网络连接的质量。
2. 调整路由器设置:路由器是连接我们设备与互联网之间的关键设备。
通过调整路由器的设置,例如关闭不必要的服务、更改信道、设置QoS等,可以提高网络连接的稳定性和速度。
3. 使用网线连接:对于需要高速稳定网络连接的设备,如台式电脑或网络电视,可以优先选择使用网线连接,而不是Wi-Fi连接。
网络测量工作总结在当今数字化高速发展的时代,网络已成为人们生活和工作中不可或缺的一部分。
为了确保网络的稳定运行、优化性能以及提供更好的服务质量,网络测量工作显得尤为重要。
以下是对一段时间以来网络测量工作的总结。
网络测量工作旨在收集、分析和评估网络的性能参数和运行状态,以便及时发现问题、优化网络配置和提升用户体验。
在过去的这段时间里,我们主要从以下几个方面开展了网络测量工作。
首先是网络带宽测量。
带宽是衡量网络传输能力的关键指标之一。
我们使用了多种工具和技术,如测速软件、流量监测设备等,对网络的上行和下行带宽进行了定期测量。
通过这些测量,我们能够了解网络在不同时间段和不同业务负载下的带宽利用情况。
这有助于我们发现潜在的带宽瓶颈,为网络升级和扩容提供依据。
其次是网络延迟测量。
延迟对于实时性要求较高的应用,如在线游戏、视频会议等,至关重要。
我们通过发送测试数据包并计算往返时间,来评估网络的延迟情况。
在测量过程中,我们不仅关注了整体的平均延迟,还对不同网络节点之间的延迟差异进行了分析。
这使我们能够定位延迟较高的网段或设备,采取针对性的优化措施,降低延迟,提高应用的响应速度。
网络丢包率的测量也是工作的重点之一。
丢包会导致数据传输错误和不完整,严重影响网络服务质量。
我们通过持续监测网络中的数据包丢失情况,及时发现丢包率异常的节点和链路。
针对高丢包率的问题,我们通过检查网络设备配置、排查线路故障等方式,有效地降低了丢包率,保障了数据传输的可靠性。
在网络拓扑结构的测量方面,我们通过网络探测工具和路由跟踪技术,绘制了网络的拓扑图。
这让我们清晰地了解了网络中各个设备和链路的连接关系,为网络规划、故障诊断和优化提供了直观的参考。
同时,我们还对网络中的设备和端口状态进行了监测,及时发现了设备故障和端口异常,确保网络的连通性。
除了上述技术层面的测量工作,我们还对网络用户的行为和需求进行了分析。
通过收集用户的访问记录、流量分布等数据,我们了解了用户对不同网络应用和服务的使用情况。
分类号:TP393密级:公开U D C:单位代码:10424学位论文IP网络QoS技术研究杜鑫申请学位级别:硕士学位专业名称:计算机应用技术指导教师姓名:孟晓景职称:教授山东科技大学二零一一年五月论文题目:IP网络QoS技术研究作者姓名:杜鑫入学时间:2008年9月专业名称:计算机应用技术研究方向:网络工程与并行处理指导教师:孟晓景职称:教授11年5月论文提交日期:202011论文答辩日期:2011年6月2011授予学位日期:THE SDUDY ON QoS TECHNOLOGY OF IP NETWORKA Dissertation submitted in fulfillment of the requirements of the degree ofMASTER OF PHILOSOPHYfromShandong University of Science and Technologyb yDu XinSupervisor:Professor Meng XiaojingCollege of Information Science&EngineeringMay2011声明本人呈交给山东科技大学的这篇硕士学位论文,除了所列参考文献和世所公认的文献外,全部是本人在导师指导下的研究成果。
该论文资料尚没有呈交于其它任何学术机关作鉴定。
硕士生签名:日期:AFFIRMATIONI declare that this dissertation,submitted in fulfillment of the requirements for the award of Master of Philosophy in Shandong University of Science and Technology,is wholly my own work unless referenced of acknowledge.The document has not been submitted for qualification at any other academic institute.Signature:Date:摘要当今人们日常生活所用的Internet网络与上世纪中叶Internet建立者的初衷相比,承担着数以万计的服务,这使得Internet网络的负载越来越重。
第7期2006年7月电 子 学 报AC TA ELECTRON I CA SI N ICAVo.l34 N o.7Ju l y 2006I P网带宽测量技术研究与进展韦安明,王洪波,林 宇,程时端(北京邮电大学网络与交换国家重点实验室,北京100876)摘 要: 网络带宽表征网络传输信息的能力,是衡量网络服务质量的重要指标.本文在分析I P网带宽测量的重要作用及其技术分类的基础上给出了链路/路径带宽、可用带宽、批量数据传输能力等测度定义,系统总结了当前最具代表性的各种I P网带宽测量技术,剖析了它们的内在机理及各自优缺点,同时介绍了多种对应的开源带宽测量工具,并对影响带宽测量收敛速度、准确度的因素进行了讨论,最后对带宽测量的应用前景和研究趋势进行了展望.关键词: 带宽测量;链路带宽;路径带宽;可用带宽;批量数据传输能力中图分类号: TN393 1 文献标识码: A 文章编号: 0372 2112(2006)07 1301 10The A chieve m ents of Band w i dth M easure m ent T echn i ques i n IP N et w orksW E I An m i n g,W ANG H ong bo,L I N Y u,CHENG Shi duan(S t a te Key Labo ra t ory o fNet w ork i ng and Sw itching,B eiji ng Un i versit y o f Po s ts&Telecomm un i cation s,B eiji ng100876,C h i na)Abst ract: B andw i dth is them etri c used to describe the net w or k infor m ati on tr ansfer capacity.It is an i m porta n t m easur e to eval uat e the quality of ser v ices in a net w or k.Th is paper e m phasizes the i m po rta n ce and cl assif i es the tec h niques of bandw i d t h m easur e m e n t for I P net w orks.It g i ves the def i n iti ons of m easures,such as li nk/pat h ba nd w idth,a vaila b le bandw i dth a nd bu l k data tra n sfer capacity,and anal yzes the p ri nciples and m erits of typical bandw i d t h m easur e m ent techn iques.It also i ntr oduces several correspond i ng open source too ls for these m easur e m e n ts.and disc u sses the m ai n factors w h i ch i m pact them easuring c onstri ngency s peed a nd acc uracy.It f i nall y g ives a v i e w o f further r esearch and a pp lication trend s i n t h is area.Key w ords: ba ndw idth m easur e m en;t li nk capacity;path capacity;avail ab le band w i d t h;bulk tr ansfer capacity1 引言在I P网中,带宽指的是链路或者路径的数据传输速率[1],用比特率度量其大小.网络带宽则是表征网络信息传输能力的测度(m etric),是反映网络服务质量(Quality of Ser v ice)的重要参数.例如在FTP(Fil e T ransfer Pr o t ocol)、P2P(Peer to Peer)等大量数据交换应用中,充足、稳定的网络带宽是Q oS得到保证的前提;网络多媒体应用需要根据可用带宽大小自动调整压缩码率,带宽大小直接影响音、视频效果;当用户从网络运营商购买了网络服务后,需要按照实际获得的带宽进行付费;网络运营商和用户签订服务等级合约(Service L evel A gr ee m ents)要参照运营商提供的网络带宽;网络拥塞检测、故障诊断、监测,流量工程,升级规划,以及运营商之间的对等连接服务[2]都需要了解网络带宽状况,这些应用都离不开带宽测量技术的支持.由于I n ter net是一个不断增长的、分布化(D istri bu ti ve)、不协作(Uncooperati ve)、异质(H eterogeneou s)的网络[3],具有诸多不确定因素,例如流量具有时变、突发的特征;端到端路由除了呈现非对称性(A sy mm etrical)外,还存在摆动(F la p)、中断(Ou tage)等不稳定现象[4,5];I P协议的设计者未考虑端到端性能分析的需要,没有为端到端性能分析提供控制通道,甚至连获取网络内部状态信息的基本手段都尚未提供[6,7];运营商基于保密和竞争的需要也没有为普通用户公开其网络内部的运行信息,从端主机进行的带宽测量不得不采用复杂的实现机制,通过端主机和节点路由器、端主机之间的紧密合作和进行大量的分析计算来完成测量任务.基于 简单网络,智能边缘的网络设计思想,带宽测量的目标是在缺少节点路由器协作的情况收稿日期:2005 10 12;修回日期:2006 5 15基金项目:国家自然科学基金(N o.90604019,60472067,60502037),973国家重点基础研究发展规划(N o.2006CB701306,2003CB314806),中国下一代互联网示范工程(N G I 04 8 1D).下,通过边缘主机对流经端到端路径的探测包进行时延特征分析,估测得出网络带宽的各个测度值.鉴于带宽测量的重要性,其获得了广泛、深入的研究.依据不同的划分标准,可对带宽测量技术进行分类:(1)按是否向网络内部注入探测包,可分为被动测量(PassiveM easure m ent)和主动测量(A ctive M easure m ent)技术.文献[8~10]研究了被动测量方式,但大多数带宽测量技术采用主动测量方式.主动测量中源主机首先按某种规律初始化探测包序列,然后将其顺序注入网络.探测包到达目的主机时,其间隔由于受传输时延、缓冲排队、流量整形、分组顺序重排[11]等因素的影响而发生改变.目的主机正是基于探测包中包间隔变化所携带的信息来估测网络带宽.主动测量技术的优点是可以灵活设计探测包的性状特征,按探测包结构分类有单包模型、包串模型、等长包对模型和非等长包对模型等;按探测包的发送形式,可以分为单播模型、组播模型,其缺点是向网络内部注入的探测包给网络带来了额外流量负载,轻者影响测量精度,重者影响网络的正常使用.(2)按测量过程是否需要节点路由器的协作,带宽测量技术可分为逐跳的链路带宽测量和端到端的路径带宽测量方式.链路带宽测量常用的方法是将UD P探测包的TTL(T i m e To L ife)值逐跳加一后注入网络,节点路由器在丢弃TTL为0的探测包后立即返回I CM P应答包,通过分析I CM P应答包到达时间和探测包发送时间的差值(RTT R ound T ri p T i m e)的特征可以估测出带宽;路径带宽测量通常不需要节点路由器的参与,直接由源、目的主机相配合完成测量.(3)按不同的测度,带宽测量可分为链路带宽(L i nkC apacit y)、路径带宽(Path C apacity)、可用带宽(A vailab l e B a ndw idth)和批量数据传输能力(BTC B ul k T ransfer C a pacity)测量技术.本文将按照此分类方法对若干带宽测量技术进行阐述,在第2节给出带宽测量测度定义,第3节介绍相关测量技术,第4节简单论述带宽测量技术的应用并就其未来发展趋势做了展望.2 测度定义2 1 链路/路径带宽链路带宽指网络层提供的最大数据传输能力.文献[1]给出了一种链路带宽定义,图1中,路由器Ri 到Ri+1称为一跳(hop),Ri 与Ri+1之间的网络层数据传输能力为C!i,称为第i跳链路带宽.R i到R i+1的一跳可由多个位于数据链路层的交换机或桥接器连接而成,称为段(seg m e n t).数据链路层通常以恒定的速率收发数据帧,例如10/100M bps以太网、2 048M bps E1线路均指数据链路层速率,其大小仅受传输媒介和收发器特性的影响,但该速率并非就是链路带宽.计算链路带宽需要考虑数据包(Packe,t网络层传输单位)封装成帧(Fr a m e,数据链路层传输单位)过程产生的额外协议字开销,其表达式形如式(1),其中C i为第i跳链路带宽,L L3为网络层待发数据包长度,H L2为数据链路层成帧过程的协议开销,C L2为数据链路层速率.可见链路带宽Ci与HL2和LL3之比有关,而HL2一般为常数,故实践中往往增加LL3以增大Ci,例如以太网发送M TU长度包可使链路带宽C i取得最大值.Ci=CL211+HL2LL3(1)路径(pat h)指源到目的的一条端到端数据通路,由一系列存储转发交换和路由节点构成,是多跳链路的集合.路径带宽则指零背景流量、无多径转发情况下端到端数据通路网络层的数据传输能力,例如一条由n跳链路构成的路径,路径带宽由最小链路带宽决定,表达式为Cp=m in{Ci,i=1,∀,n}.2 2 可用带宽另外在各种文献中,术语瓶颈链路(Bo ttle nec k L ink)不仅经常被用于指路径中具有最小带宽的链路,还被用于指具有最小可用带宽的链路,易造成误解,故引入术语狭窄链路(N arro w L ink)、紧凑链路(T igh t L i nk)以示区别.对于由n跳链路构成的路径,链路容量集合为{Ci,i=1,∀,n},链路可用带宽集合为{Ai,i=1,∀,n},狭窄链路指路径上具有最小链路带宽的那跳链路,其链路带宽表示为C NL= m in{C i,i=1,∀,n};紧凑链路指路径上具有最小可用带宽的那跳链路,其链路带宽表示为CTL={Ci,W henA i(i=1,∀,n)is m in i m um};1302电 子 学 报 2006年瓶颈链路专指同时具有狭窄链路和紧凑链路属性的那跳链路,瓶颈链路带宽C BL =C NL =C TL .按照定义,端到端路径中不一定存在瓶颈链路,图2[1]为一条没有瓶颈链路的路径拓扑示意图,1为狭窄链路,3为紧凑链路,瓶颈链路不存在.2 3 批量数据传输能力UDP 和TCP 是I P 网应用最广的两个传输层协议,更有90%的数据交换通过TC P 进行[15],其吞吐能力成为衡量网络性能的重要指标.由于TC P 实现机制[16,17]、参数选择[18]等因素的影响,精确测量TC P 吞吐能力十分困难.I ETF 提出了批量数据传输能力(BTC )概念以衡量网络吞吐能力.BTC 度量单个具有拥塞控制功能传输协议进行批量数据传输的能力.文献[19]对BTC 定义为在不可靠网络路径上,单个TCP 连接在时间间隔t 内可达到的最大平均数据传输速率.由于I ETF 认可多种传输层拥塞控制协议,故不能以某种既定的方法量化BTC.BTC 测量结果可靠、一致、可比的前提是源、目的主机传输层协议采用相同的拥塞控制算法.由于编码的历史继承性,I P 网广泛采用的TC P 协议的拥塞控制算法绝大多数源于文献[20,21].文献[19]给出了BTC 计算公式:BTC =D /t ,其中D 为已发送且可靠到达对端的数据总量,不包含协议帧封装时的字节开销,超时、错误重传的数据量只计算一次.文献[1,19]还讨论了影响BTC 测量的诸多因素,包括传输数据包的大小、无流控的UD P 流量、并发的多个TC P 连接、TCP 应答包所经路径的拥堵状况、TC P 收发两端套接字缓冲区大小、路由器缓冲大小、路径各跳链路的负载大小、TC P 实现的区别甚至TCP 初始窗口都会影响BTC 测量结果.3 带宽测量技术经过多年研究衍生出了多种测量算法,但由于拓扑和流量行为的复杂性,这些算法的实现都建立在测量周期T 中端到端路径P 的路由保持稳定,背景流量服从某种分布模型的假设之上,但不少研究[22~25]关注路由和背景流量动态变化给测量带来的噪声以提高算法的鲁棒性(r obust ness)和精度(accur ac y).3 1 链路/路径带宽测量技术总的来说,链路/路径带宽测量技术及工具都是通过向网络注入主动探测包以获取网络时延特性,并通过特定的模型估测出带宽.3 1 1 链路带宽测量技术单包模型是最早的链路带宽测量技术,它首先由文献[38]所提出,但文献[38]是从应用层估测链路带宽,测量结果容易受到端主机性能的影响.由Jacob s on 完成的测量工具Pathc har [30]是单包模型应用的典范,文献[28~30,32,34]提出的链路带宽测量技术都是改进的单包模型.单包模型可用图3表示,探测包的第一个比特从链路0发出到最后一个比特到达链路i 的时刻可用式(2)表示,d 0i=d 00+#i-1j=0s 0b j+q 0j +l j (2)其中d xi 表示探测包x 到达链路i 的时刻,s x表示探测包x 的长度,b j 表示链路j 的带宽,sxb j 表示探测包x 在链路j 上的传输时延,由探测包长和链路带宽决定,q 0j 为探测包x 在链路j 的排队时延,受背景流量影响,l j 表示探测包经过链路j 时所经历的等待时间,由媒介传播时延、路由表查找时间等组成,独立于探测包长度,为一常数值.对于单包模型,取x =0表示第1个探测包(也仅有一个探测包).考察背景流量很小的情况,q 0j 可以忽略不计.l j 为定值,只与媒介电气特性有关,d x i 可认为是探测包长度的线性函数.单包模型基于这样一个假设:向链路中为注入n 个长度为s 0l 的探测包(n 越大测量结果越精确,收敛时间也越长,占用网络带宽亦越大),至少有一个探测包的排队时延q 0j 可以忽略不计,得到该长度探测包组时延最小值,见图4中的纵轴散列点的下点.分别取l =1,∀,n,且令s 0l <s 0l+1,则由于链路转发时延的增加,得到n 个散列下点.对这n 个下点做线性拟合,得到一条直线,如图4,其斜率的倒数即为链路带宽.单包模型实现简单,不需要源、目的主机的协作即可完成链路带宽的测量,由于每次测量发送的是n 个探测包,而结果只取其中的最小时延值,减小了背景流量噪声对测量结果的影响.但单包模型依赖于I CM P ,出于安全和性能的原因,某些路由器却限制I CM P 的使用[43],致使测量失败,同时它有只适用于单向测量、误差累积、收敛1303第 7 期韦安明:IP 网带宽测量技术研究与进展慢[31,35]、带宽消耗大[23]等缺点.可见其缺乏速度、精度、灵活度.基于Pathchar 的改进方法[28,29,32,34]对单包模型的各个方面做了改进.文献[29]提高了Pathc har 的速度、精度,减小了探测流量.C link [34]与Pat hchar 不同的是它采用一种 奇偶 技术以产生交叉的链路带宽估测结果,当测量过程中路由不稳定时,C li nk 会跟随路由的变化,对使用每条路径进行跟踪测量,并采集相关的测量数据,直到其跟踪路径的测量数据满足统计需求.Pca h r [32]在Pat hchar 的基础上提供了三种不同的线性回归算法来获得链路带宽估值,且支持不同类型的探测包,在指定精度要求下动态调整测量次数.B i ng [28]和Pathc har 有相似的工作原理.为了克服单包模型的缺点,文献[8,31]提出了PT (Packet Tail gati ng)模型.其基本思想如下,对于链路i ,PT 模型向路径中注入两个连续的探测包,且第一个探测包的TTL 值为i 、长度远大于第二个探测包,即s 0 s 1.由于第二个探测包的传输时延s1b i 远小于第一个探测包的传输时延sb j ,保证了第二个探测包总是排于第一个探测包后.在链路j ,由于TTL 值耗尽,第一个探测包被路由器丢弃,而第二个探测包继续无排队地到达目的主机.依次递增TTL 值,可以得到任何链路的时延,从而可估算出链路带宽.PT 模型是文献[31]提出的多包模型的特例,如图5所示.对于n 跳链路,PT 模型的第二个探测包从链路0出发到达链路n 的时刻用式(3)表示,d x n =d x 0+#n 1j =0s xb j+l j +m ax(0,d x 1j+1-l j -d xj )(3)为了便于理解,用三阶段法将式(3)表示成式(4),d x n =[d x 0+#i 1j=0s x b j +l j ]+s x b i+d x 1i+1-d xi +#n-1j=i+1sxb j +d j(4)中括号内的式子依次表示探测包到达链路i 前时延、链路i 上转发时延、链路i 后时延.通过简化,链路的带宽由式(5)计算,式(5)中参量b n 1和l n 1在PT 模型的sig m a 阶段采用Pathchar 方法测出,其余参量由tailgati ng 阶段测量得到[31].x 15)P T 模型采用非路由器协作方式,摆脱了I CM P 的限制,以很少的探测流量获得和单包模型同等的测量精度,同时可以测量多通道链路(m ulti cha nnel li nk)网络环境,但PT 模型并未解决多链路误差累积问题.netti m er [8,31]链路带宽测量工具的实现就是基于PT 模型.文献[44]提出的方法类似于PT 模型,但不丢弃前包,而是利用探测包对沿路记录时戳,得到各跳链路的时延参数.文献[26]用前后两个包对(共4个探测包)的方式构造探测包串,以时延抖动分析代替了单包时延分析,重点考察背景流量引入的噪声,提出了类似Pat hchar 的ACC S I G 方法,但还是没能脱离I CM P 的支持.基于ACC S I G,文献[26]进一步提出了P Q 方法,它不依赖于I CM P ,避免了I CM P 包返回源主机过程引入的噪声.3 1 2 路径带宽测量技术应用最为广泛的路径带宽测量技术是由Jacob s on 等最早在文献[20]中提出的包对模型[22,40,41],但在研究早期由于缺乏有效滤波手段,时延抖动噪声的存在使得他们只能将包对模型更多地用于路径可用带宽测量[11,39].图6是包对模型的基本工作原理,向由n 跳链路组成的路径中注入背靠背、等长(L )的两个探测包,假设在第i 跳链路入口,探测包间隔为 T i n ,i ,链路单包转发时间为 T s,i .当 T in.i < T s .i 时,在链路上必定引发第二个探测包的排队,在链路出口处包对间隔为 T o ut.i ,且 T ou t .i > T i n .i ;当 T in.i > T s .i 时, T out.i = T i n .i ,包对间隔保持不变.探测包对经过多跳链路以后到达目的主机,包对间隔裂散为 T ou t =m i n i=1,∀,n T o ut.i ,由式(6)可估算出路径带宽.C =LT out(6)B o l o t 等在文献[40]中对包对模型进行扩展,得到的包串模型可用以分析路径时延、丢包特性.它向网络中注入等间距探测包,得到各探测包的RTT ,然后分析相邻探测包RTT 的时间特性得到路径带宽.C arter 等提出的Bp r obe 也采用包对模型[22],扩展了文献[40,41]的工作,克服了文献[40]方法的一些缺点.其本质是从源主机向目的主机发送一串探测包,原理类似于图6,在前向探测(dow n strea m pr obing)过程中包间隔在瓶颈链路处裂散到最大,后向探测(upstr ea m prob i ng)过程传送的是包长很小的I CM P 包,所以包间隔未受影响地传回源主机.理想状态下,包裂散间隔与路径瓶颈带宽成正比.通过对包间隔分布的分析由式(6)计算出路径带宽.1304电 子 学 报 2006年Bp r obe 采用了路由器协作机制(I CM P),只需布署在源主机上,但它是建立在假设路由器采用FI FO 队列、且探测包顺序到达瓶颈链路队列的基础上,对于其他队列、探测包丢失、瓶颈链路下游链路拥塞等情况,测量结果可能不正确.尽管包对模型可有效应用于路径带宽测量,但对网络环境要求较高[22],对路由变动、链路非对称等异常情况仍无能为力.Paxson 在文献[11,39]中指出包乱序分发、时钟粒度粗大、瓶颈链路动态改变及多通道链路等情况的存在限制了包对模型的应用,并提出了PB M 模型.PBM 模型通过调整探测包数、分析柱状图的峰值形态的变化以及采用启发式思维克服了包对模型的上述缺点[11,39],但PBM 实现过于复杂.文献[35,36]在研究包对模型的过程中使用了多个包对的包对串模式,他们发现多个探测包对注入路径后得出的测量结果呈现多峰态分布(见图7),并指出是背景流量的多模态引起了多峰现象,同时还采用分段测量法从多峰中定位正确结果并研究了探测包长度对结果的影响,发现早期研究提出的探测包越长越利于分析的结论不正确;并且发现增加包串中包对个数N 可使重复测量的结果趋于一致,当N 充分大时,测量样点呈现单峰态分布,且峰值收敛于ADR (A sy m ptotic D is persi on R at e),但ADR 并非路径带宽.文献[27]提出的Spr obe 使用TC P 协议的内在机制构造探测包对,可进行路径带宽的双向探测.对于前向探测,其基本思想如图8所示,向目的主机的无效端口发送两个背靠背的TC P 同步包(SYN ),修改SYN 包的长度(通常S YN 包长40B,Spr obe 将其修改为1500B )以使其在瓶颈链路上裂散出大间隔,目的主机TC P 收到无效端口的连接请求后返回复位(RST )包(包长40B ),源主机依收到的两个RST 包间隔即可估算出前向路径瓶颈带宽.对于后向探测,图9描述了其基本思想,在源、目的主机之间建立一条TC P 连接,源主机向目的主机发送H TTP GET 请求(目的主机假设为一W e d Ser ver),在TC P 慢启动阶段,目的主机会向源主机连续发送大小等于拥塞窗口的数据包,当拥塞窗口开启到1500B 时,源主机可将其中两个先后到达的数据包作为探测包对.SPr obe 解决了之前包对模型发送的探测包占用带宽过多的问题,但它局限于TC P 传输层协议,且无法穿越网络防火墙,后向探测还需要双端协作,给布署带来了困难.文献[24]提出的C apPr obe 方法更是综合分析了包对时延、包对间隔等因素,可有效剔除由背景流量引起的失真样本.在同等精度条件下,C apProbe 的收敛性能比Pathchar [30]和Pat h r ate [42]更好.链路/路径带宽测量过程会遇到非对称链路(AD SL ,卫星链路)的情况,会给双向探测带来困难.多数带宽测量方法只能完成前向探测,后向探测常常需要双端协作才能完成[27],文献[33,37]对非对称链路带宽探测进行了研究.3 2 可用带宽测量技术基于包对模型[20,40,41]和公平调度队列(Fair Q ueu i ng),K eshav 最早在文献[41]中进行了端到端可用带宽测量的尝试.而包串模型[22,45]对包对模型进行了扩展,其机理是向目的主机连续发送n 个长度为L 的探测包,然后由目的主机返回n 个长度为l 的应答包,且L l ,应用式A =(n*L )/T 得可用带宽,式中T 为源主机接受应答包所需的总时间.文献[22]提出的C pr obe 工具不局限于公平调度队列,文献[45]提出的P i pec har 和C p r obe 相似,但它们都被文献[35]证明测量到的不是真正的可用带宽,而是ADR (A sy m ptotic D ispersion Rate).之前尚未见到可精确估测每跳链路可用带宽的算法,文献[46]提出的基于RPT (Recursive Pac ket T rai n)的Pathnec k 工具也仅可粗略估测每跳链路的可用带宽的上限或者下限,因此本文只介绍端到端路径可用带宽测量方法.常见的可用带宽测量技术依探测方式可划分为直接探测[13,47,48]和迭代探测[13,14,47,49,50~53]两大类.3 2 1 直接探测P GM (Pr obe G ap M odel)模型是直接探测(D irect Pr o b i ng)的一种,它通过考察探测包对间隔变化来估测可用带宽,其基本方法如图10所示,源主机以速率R i 发送探测包串,探测包串到达目的主机的速率为R 0,可用带宽A 可由式(7)计算,A =C TL -R iC TLR 0-1,当R i >A (7)取{R i ,i=1,∀,n}进行n 次测量,得样本集{A i ,i=1,∀,n}.P GM模型实现简单易行、计算复杂度低,但只在R i >A 时成立.应用P GM 模型的前提是紧凑链路带宽C TL 为已知值,由紧1305第 7 期韦安明:IP 网带宽测量技术研究与进展凑链路定义可知其位置取决于各链路背景流量的大小,例如t 0时刻链路i 是紧凑的,但t 1时刻各跳链路的背景流量已经发生变化,链路j j ∃1可能取代成为新的紧凑链路.可见该条件并不易满足,尤其在广域网中P GM 模型的应用难度更大.文献[22]提供的B pr obe 可作为P GM 模型的前端,由它先行探测出路径的紧凑链路及其带宽.文献[48]提出的基于模型(M odel B ased)的D elph i 是另外一种直接探测方法,与之前的方法不同,D el phi 应用MWM (M u ltifractalW avel etM odel)[54]对背景流量进行建模,从而估测出路径可用带宽.文献[13]提出的I G I 方法虽然计算公式形似直接探测法,但测量过程则类似于下文阐述的迭代探测法.文献[47]提出的Spruce 方法构建探测包对串的方法与上述采用的等间距(指各包对之间的间距,而不是包对内部的间距)包对法稍有不同,如图11所示,它使用100个等间距包对,但包对与包对之间间隔 i n ter pa ir 服从指数分布,因此各包对到达目的主机的过程是一个泊松过程(Po iss on Pr ocess),包对到达事件相互独立.该方法的优点是包对之间的间距 i n ter pa ir 、包对内间距 i n tr a pa ir 是独立的,可根据需要调整,使背景流量对 i n tra pa ir 的影响减小,达到提高精度的目的.文献[55]的研究表明,相比于Pat h load 、D el ph i 和I G I ,Spruce 有更高的精度,探测包耗费的网络带宽更小,且实现更简单.3 2 2 迭代探测迭代探测的基本思路是用高速探测流量人为地制造路径拥塞,然后得到可用带宽.文献[13,14][47][49~52]实现的迭代探测(Iterative Prob i ng)都基于这个基本思路,向网络注入速率为R i 的突发包对串,当包对速率大于可用带宽时,路径发生瞬间拥塞,探测包间的时序关系发生改变,分析探测包的时延特征即可估测出路径可用带宽.由于可用带宽未知,测量过程实际上是包对速率不断变化的迭代过程,因此迭代探测也称为P R M (Pr obe R ate M odel)模型.与P GM 模型不同,迭代探测并不要求紧凑链路带宽C TL 为已知值,包对速率R i 可以是线性变化或按某种函数规律变化.P R M 测量过程采用如下判定条件,当测得R 0<R i 时,认为R i >A;当测得R 0=R i 时,认为R i %A;不可能出现R 0>R i .改变R i 进行迭代探测,找到R 0=R i 临界点,最终得到路径可用带宽A.M el ander 等于文献[49,52]中提出的ToPP (T rain o f Pac ket Pairs)方法是P RM 的典型代表,ToPP 以递增的速率向目的主机发送多个探测包对串(见图12、图13),每个包对串由n 个间隔为 T inter pa ir 的包对组成,包对内两个包间隔 T i n t r a pa ir 亦相等,改变包对速率指的是改变 T int r a pa ir ,例如图12中有t a>t b>t c,包对速率用式R i =L / T i n t ra pa ir 表示.由于需要进行迭代探测,P R M 模型在测量开始前先设定一个可用带宽分布域[R m in i ,R m axi ]作为包对速率递增的上、下限.当包对速率R i 以 R 递增时,迭代次数即为N =(R m axi-R m ini)/ R 次.假设链路j 处理长度为L的探测包的时间为 T s .j ,链路入口处包对到达间隔为 T int r a pa ir .i .j (i 表示第i 次探测),则当满足条件 T s .j > T int r a pa ir .i .j 时,链路出口处包对间隔裂散为 T s.j ,有 T int r a pa ir .i .j+1= T s .j .对测量结果做均值滤波,得包对间隔均值avg ( T intra pa ir.i )=#nj=1T intra pa ir.i.j ,通过式A i =L /avg( T int r a pa ir .i )计算链路可用带宽;如果 T s .j % T int r a pa ir .i .j ,则链路出口处包对间隔保持不变.由于只有当探测包对速率R i 大于链路可用带宽A 时,包对间隔才会裂散,故增大探测包对发送速率的过程就是发现具有相应可用带宽链路的过程,N 次探测的结果可能发现路径中的多跳拥塞链路.对于N 次测量结果集合{(R i ,A i )i=1,∀,N},使用式R i /A i = + R i 运用线性回归方法得到路径可用带宽,式 , 中为与路径容量及背景流量值相关的常系数.ToPP 方法的优点是其仅用很小的探测流量就可完成可用带宽的估测,同时可以探测到路径中的多个拥塞链路,图15为具有三段拥塞链路的可用带宽测量结果,但它需要双端布署、只能对单向路径进行测量,并且假设路径转发节点采用FCFS(F irst C o m e First Ser ve)及队尾随机丢包策略,对于其他策略则不一定成立.另外在背景流1306电 子 学 报 2006年。