当前位置:文档之家› 基于自适应滤波和独立分量分析提取胎儿心电的可行性研究毕业论文

基于自适应滤波和独立分量分析提取胎儿心电的可行性研究毕业论文

基于自适应滤波和独立分量分析提取胎

儿心电的可行性研究毕业论文

第1章绪论

1.1 本课题的研究目的及意义

反映胎儿宫内生理活动的客观指标之一是胎儿心电信号(FECG,Fetal Electrocardiogram),围产期对胎儿监护的质量直接影响到母婴的安全和胎儿的发育成长以及后天的智力成长。在围产期对胎儿进行心电监护能够预先诊断妊娠期和分娩期的胎儿宫内缺氧及先天性心脏病等疾病,降低围产儿发病率与死亡率[1]。

胎儿心电图是一种针对子宫内胎儿的心电监护方法。胎儿心电信号与胎儿心音和心动信号相比是最能反映心脏活动全貌的生理信号,而且当胎儿出现异常的时候,胎儿心电图的异常要比胎心率电子监护和胎心宫缩监护等指标的异常来得更早、更敏感。从胎儿心电信号不但能发现胎儿的瞬时和平均心率的变化,也可以同一般成人心电图(ECG ,Electrocardiogram)一样,从看到的FECG中获得更多胎儿心脏状况的信息。通过对FECG波形变化的分析,结合临床观察,能够及时发现胎儿缺氧、脐带缠绕等妊娠期或分娩期的病理情况[2]。以便尽早地采取确保胎儿健康的措施,降低围产期胎儿的发病率和死亡率。有很少一部分胎儿心电图的异常表现为胎儿的先天性心脏病,此时应尽早中止妊娠,以达到优生目的。

胎儿在母体内安全情况监测的有效手段之一是胎儿心电图检查,它可直接反映胎儿的健康状况,有非常高的诊断应用价值。由于胎儿心电图检查无创伤、可重复、方法简便,已经被临床医师所认可。结合其他手段如超声波检查等能更好地为临床服务。FECG早己是学习胎儿的心脏活动及尽早发现胎儿异常的重要方法,研究胎儿心电信号的提取技术具有重要的理论意义和实用价值。

1.2 目前研究现状

获取FECG的方法主要有直接法和间接法,直接法是侵入式的胎儿心电获取方法,在孕妇分娩时,直接从胎儿的皮肤上来获得清晰的胎儿心电,这种方法可以及时发现分娩过程中胎儿是否存在缺氧,但是是有创伤性的,而且只能用于产时,无法在围产期对胎儿监护,不能反复检测。间接法是非侵入式的胎儿心电提取方法,是在孕妇胸部和腹部放置多个电极,提取出多路信号,然后进行信号处理以获得令人满意的

胎儿心电信号,优点是不会对孕妇和胎儿造成伤害,且操作起来简单,能够用于围产期监护,缺点是此方法极易引入各种噪声,如基线漂移,工频干扰,母亲心电等等,而且这些信号都比胎儿信号强,会使胎儿信号淹没在其中,因此,如何从中提取出令人满意的胎儿心电就成为中外各学者研究的难题。

在信号处理领域中FECG的提取被作为一个典型的问题为人们所提出,这在临床医学诊断上是极具意义的。几十年来,人们为了消除MECG和其它噪声的干扰,提取出清晰的FECG,对FECG的提取进行了相当多的研究,也取得了丰硕的成果。目前常用的方法有自适应滤波,盲源分离,小波分析和神经网络等方法[3-7]。

1.3 课题研究的主要内容

本课题主要研究的是基于自适应噪声抵消技术来提取胎儿心电和基于独立变量分析的方法来提取胎儿心电两部分。

孕妇胸部获得的信号和腹部获得的信号可以分别作为自适应噪声抵消系统的滤波器输入和原始输入,经过自适应噪声抵消系统输出胎儿心电信号,我们会用多个实验来研究自适应滤波参数的选取,并且利用这些结论提取胎儿心电,最后总结这种方法的优缺点。

由于母体心电和胎儿心电是由于母体和胎儿各自的生理活动引起的,可以看做是统计独立的,理论上可以用独立变量分析方法来分离出胎儿心电。这里本文会用多个实验来研究不动点算法的分离能力,最后用此算法提取胎儿心电,并总结优缺点,然后对这两种算法的提取结果做一个对比。

1.4 论文结构安排

本文的结构安排如下:

第一章为绪论,简单介绍胎儿心电信号的重要意义,简述了胎儿心电信号提取的发展历程和研究现状,说明论文的研究目的和意义。

第二章主要介绍自适应最小均方算法的原理,以及优化的归一化最小均方算法原理,然后介绍自适应噪声对消的原理,最后用自适应噪声对消技术来提取胎儿心电,并且进一步研究了在工频干扰和微弱胎儿心电下的提取。

第三章主要介绍盲源分离的基本理论和独立变量分析原理,最后用快速独立分量分析方法提取胎儿心电,并且研究了母婴信噪比对其的影响。

第四章为结论与展望,总结本篇论文的研究工作,并指出进一步研究的方向。

第2章基于自适应滤波的胎儿心电信号提取

2.1 自适应滤波算法

2.1.1 最小均方算法

在自适应滤波器的诸多实现形式中,受到最广泛应用的就是由Widrow 和Hoff 提出的随机梯度算法。这种算法就称为最小均方(LMS)算法。如图2.1为自适应滤波模型。

)n 图2.1 自适应滤波器模型

其中)(n d 为滤波器的主输入通道的输入,输入的是期望信号)(1n s ;)(n x 为滤波器的输入,)(2n s 是与)(1n s 相关的信号;)(n e 是自适应处理器的输出)(n y 相对于)(n d 的误差,LMS 算法就是要使均方误差最小,从而使自适应滤波器的输出无限逼近期望信号。其表达式为:

∑-=-=1

0)()()(N i i i n x n w n y (2.1)

)()()(n y n d n e -= (2.2) 瞬时均方误差可表示为:)]([2n e E =ξ,其有效估计值为)(2n e =∧

ξ。

由最速下降法的定义能够知到权值更新公式为: )()()1(n n n -?+=+μW W (2.3) 这里T N n w n w n w n w n ])()()()([)(1210-= W 为权向量,μ为一调整步长常数,它

的量纲为信号功率的倒数。W

n e E n ??=?)]}([{2是均方误差)]([2n e E =ξ相对于权矢量)(n W 的梯度。

而LMS 算法是用∧

ξ来近似ξ,从而得出权向量迭代公式。

这样就有

)()(2)()(2)]([2n n e W n e n e W n e n x -=??=??=?∧ (2.4) 这里)(n x =T N n x n x n x ])1()1()([--- 。

最终可以得到

)()(2)()1(n n e n n x W W μ+=+ (2.5) 式(2.5)便是LMS 算法的权值递推公式。收敛条件是0<μ<

max 1λ, max λ为)(n x 相关矩

阵的最大特征值[8]。

综上所述,LMS 算法可以概括为:

(1) 滤波器的输出

)()()(n n n y x W T = (2) 估计误差

)()()(n y n d n e -=

(3) 权向量迭代公式

)()(2)()1(n n e n n x W W μ+=+

影响LMS 算法性能的主要参数有步长因子,滤波器阶数和初始权向量。步长因子主要决定算法的收敛速度,它越大算法收敛越快同时稳态误差越大,反之亦然,因此要合理的选取。滤波器阶数主要影响算法的效果,也会影响收敛速度,越大计算量越大,收敛越慢,但是算法的性能会越好。权矢量初始值对系统的影响主要体现在收敛速度方面,对其他性能影响不大,因此,一般我们都设它的初始值为零矩阵。

2.1.2归一化LMS 算法

归一化LMS 算法也叫最小均方算法,简称NLMS 算法,算法可以看作是一种特别的变步长LMS 算法,常用于回声消除领域。NLMS 自适应滤波器和LMS 自适应滤波器是相同的,都为横向结构,他们的不同仅仅在于两者的权值迭代式不同,NLMS 算法只是多了将权值归一化处理的步骤[9]。归一化LMS 算法可以看成是对原LMS 算法的一种改进。

NLMS 算法的滤波器系数更新式的具体描述为:

)()()()()1(2n e n n n n x x W W β+

=+ (2.6) 上式中,2)(n x 是输入信号)(n x 的欧氏范数平方。与传统的LMS 算法的滤波器

系数更新式(2.5)相比,NLMS 算法可以看成是一种变步长的LMS 算法,所以,相比LMS 算法,NLMS 算法将具有更好的收敛性能。当然,在收敛之前,NLMS 算法也

必须要满足一定的收敛条件,回顾LMS 算法的收敛条件,可知该算法的收敛条件为0<β<2,此时不再受输入信号特征值的影响。再回顾式(2.6)中的2)(n x ,若输入信号)(n x 过小,有可能导致分母过于接近0以致使算法发散。为了避免此情况发生,将式(2.6)改写为:

)()()()()1(2n e n n n n x x W W εβ

++=+ (2.7)

其中ε是一个很小的正数[10]。

对于LMS 算法,当输入信号)(n x 比较大时,其进入稳态后的噪声矢量公式为:

)()(2)(n x n e n N -= (2.8)

对于NLMS 算法,它的稳态噪声矢量公式为:

2)()

()(2)('n x n x n e n N -= (2.9)

从式(2.8)和式(2.9)可明显看出,与LMS 算法相比,NLMS 算法的失调量将会减少(失调是稳态后的噪声引起的),同时因输入向量)(n x 过大而产生的噪声也会减小。此外,NLMS 算法中的步长因子是可变的从而具有了比LMS 算法更快的收敛速度,同时还与LMS 算法的计算量相当。因而NLMS 算法在实际中比LMS 算法应用更为广泛。NLMS 算法用于N 阶FIR 自适应滤波器的流程图如图2.2所示。

图2.2 NLMS算法流程图

2.2自适应噪声对消提取胎儿心电信号的原理

1975年,Widrow首次运用自适应滤波算法提取胎儿心电信号,经过几十年的发展,己经在信号处理方面得到了广泛应用。近些年来,国内外学者在基本自适应滤波算法基础上提出了一系列改进,用于胎儿心电提取研究。

自适应滤波系统由两个输入端构成,即原始输入端和参考输入端。在胎儿心电提取中,原始输入端接母体腹部信号,参考输入端接母体胸部信号。其中,作为原始输入的母体腹部信号中,FECG的特征是由胎儿的生理现象所决定的,而MECG是由母体的生理现象所决定,所以可以假设混合信号中的FECG与MECG信号不相关。而作为参考输入的从母亲胸部提取出来的信号是由母亲的生理现象所决定的,所以可

以假设胸部信号与腹部信号中母亲心电部分以某种方式相关。因此可以通过不断调整滤波器系数使滤波器输出成为某种意义下母亲心电的最佳估计,然后通过相减器减掉原始母体腹部信号中的母亲心电成分,实现FECG的提取。

2.2.1 胎儿心电信号简介

图2.3是胎儿心电波形的一个周期,下面给出一些正常胎儿心电图和异常胎儿心电图的特点[4]。

图2.3 正常胎儿心电图

1 正常胎儿心电图

胎儿心率为120-160bpm,一分钟的差异为5-30bpm,因此R-R间距有微小的差异。QRS波时限为0.02-0.06s。

2 异常胎儿心电图

(1) 胎儿心动过速: 即胎儿心率大于160bpm(持续30分钟以上);

(2) 胎儿心动过缓: 即胎儿心率小于120bpm;

(3) 胎儿心率不齐: 胎儿心率变化范围超过25-30bpm;

(4) QRS时限赠宽: 即QRS时限大于0.05-0.6s;

(5) ST段改变: 即ST段上移或下移5μV以上;

(6) R波振幅增高: R波振幅平均值大于30μV;

(7) 胎儿心脏早搏: 30s内出现三次以上;

(8) 早搏: QRS波提前出现。

从人的皮肤上提取到的心电信号中经常会引进很多噪声。因此如果我们想把这些噪声最大化的消除掉,就必须要对其中引进的噪声做一个全面的分析。我们在监护病人的时候经常在心电信号中引入的噪声如下:母体心电信号,由于母亲自身的心电信号比胎儿的强很多,对胎儿心电来说是很大的干扰源。工频干扰,也就是家用标准电压的标准频率,因每个国家的供电标准不同也不尽相同。肌电噪声,一般由母体宫缩

等产生。基线漂移,通常是由于母体呼吸产生,频率往往在0.5Hz 以下。

2.2.2 自适应噪声对消

自适应噪声抵消系统是自适应最优滤波器的一种变形,它是于1965年由美国斯坦福大学最先研究成功的。用一个噪声的参考信号与被噪声淹没的有用信号做减法将噪声干扰消去是自适应噪声抵消的基本思想。而要实现这个思想的基本假设是作为噪声信号的参考信号与混入有用信号中的噪声之间必须具有某种相关性,而且二者要与有用信号相互独立或者不相关。根据经验,从被噪声淹没的信号中直接减去与噪声相关的信号是不安全的,非常有可能会使噪声不但没能被消掉,而且压制有用信号。然而,我们可以通过自适应系统对权值不断的调节从而减弱噪声,获取稳定的有用信号。

在至今为止的这几十年中,人们对自适应噪声抵消系统的不断研究和改进,使其早已被广泛的应用于各个领域。例如在语音系统中,它被用来抑制语音信号的失真和传输中的回声。在飞行战斗环境内,它也可以很好的提高飞行员战斗时的通信质量。而在医学方面,它可以用来提取胎儿的心电,母体腹部的信号作为原始输入,母体胸部信号作为参考输入,这样系统提取出来的便是胎儿的心电。

自适应噪声对消的模型如图2.4所示[11]。

)n

图2.4 有参考信号的自适应噪声抵消

在图2.4中有两个通道:主通道和参考通道,假定信号)(n s ,)(1n v ,)(2n v 为零均值平稳随机过程。由于混入两个输入端的噪声)(1n v 和)(2n v 是由一个噪声源所发出的,因而它们肯定以某种方式相关,然而)(1n v 和)(2n v 与要提取的信号)(n s 是不相关的。原始输入端不仅接收从有用信号源传来的信号)(n s ,也混入从噪声源传来的噪声

)(1n v ,而参考输入端输入的信号为)(2n v 。自适应滤波算法自行调整后输出)(1n v ∧,并

使其在最小均方误差意义下最接近主通道噪声)(1n v ,它是)(1n v 的最佳估计。这样就可以从原始输入端减去)(1n v ∧

来消去噪声从而提取出有用信号)(n s 。

自适应噪声抵消系统的输出)(n e ,可表示为

)()()()(11n v n v n s n e ∧-+= (2.10)

则均方误差输出的均方值为

]))()()([()]([2112n v n v n s E n e E ∧

-+= =))]()()(([2]))()([()]([112112n v n v n s E n v n v E n s E ∧∧-+-+ (2.11)

因为)(n s 与)(1n v 和)(2n v 均不相关,所以)(n s 与)(1n v ∧

也不相关,则有

0))]()()(([11=-∧n v n v n s E (2.12) 这样,式(2.11)就可以写为

]))()([()]([)]([21122n v n v E n s E n e E ∧

-+=(2.13) 然而自适应系统的调节仅仅在于得到原始输入端噪声信号的最佳估计)(1n v ∧,并不会影响有用信号的功率)]([2n s E ,因此自适应系统通过调整参数令)]([2n e E 达到最小等同于令]))()([(211n v n v E ∧

-达到最小,再由式(2.10)可知

)()()()(11n s n e n v n v -=-∧ (2.14) 于是我们可以知道当]))()([(211n v n v E ∧

-最小的时候,]))()([(2n s n e E -也变的最小,也就是说整个系统的输出)(n e 与有用信号)(n s 的均方误差最小。这也就意味着,)(n e 是待提取信号)(n s 的最优估计。

我们可以用自适应噪声对消来提取胎儿心电,原始输入端输入母体腹部信号,它包括母亲心电和胎儿心电,而参考输入端用来自同一组数据中从母亲胸部提取出来的信号,它不含胎儿心电,那么系统的输出)(n e 就是对胎儿心电的最佳估计。 2.3 运用自适应噪声对消提取胎儿心电信号

前面已经提到,理论上自适应滤波方法是可以用来提取胎儿心电信号的,下面我们就此进行研究。本文是基于MATLAB R2012a 来做的仿真实验研究。MATLAB 是美国MathWorks 公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境。它功能强大,上手简单,在PC 上可以免费使用,是一款非常棒的仿真软件。

2.3.1 自适应滤波参数的选取研究

我首先是编了一个NLMS 算法程序,程序见附录,用一个20Hz 幅度值为1的正弦波)(1n s 和一个33Hz 幅度值为0.5的正弦波)(2n s 叠加作为原始输入)(n x ,参考输入就用)(1n s ,来简单确定一下程序的参数。

图2.5所示为步长β取0.12,滤波器阶数N 为100时的输出,从上往下依次为)(1n s ,)(2n s ,)(n x ,)(n e 。

图2.5 仿真的结果 可以发现这组参数获得的效果是不错的。

考虑到)(1n s 和)(2n s 应是不相关的信号,而白噪声和任何信号都不相关。下面令)(1n s 是频率为20Hz 幅度值为1的正弦波,)(2n s 是信号功率为0dBW 的高斯白噪声,重新来做测试,图2.6就是步长 为0.12,滤波器阶数N 为100时的仿真图,从上往下依次为)(1n s ,)(2n s ,)(n x ,)(n e 。图2.7为其均方误差。

图2.6 仿真结果

图2.7 均方误差

可以看到输出的效果并不十分理想,可能是因为还没收敛。可以考虑调大一些步

长,当 为0.24时的仿真图和均方误差图分别如图2.8和图2.9所示。

图2.8 仿真结果

图2.9 均方误差

可以发现效果明显好了许多,并且由图2.9可知算法已收敛。由此我们必须选取合适的参数以获取清晰的波形。

经过本节的研究我们发现步长因子β对NLMS算法的影响,当β越大,算法收敛速度越快,但是稳态失调越大,当β越小,算法收敛速度越慢,到达稳态后的失调量也相应变小。而阶数一般是在怎样调节步长结果都很差的时候需要调高,所以我们在调试程序的时候要多试一下参数,以达到最好的滤波效果。

2.3.2 胎儿心电信号提取研究

接下来,我们试着用此算法来提取胎儿心电,临床数据由Lieven De Lathauwer[12]提供,数据来源于DaISy(Database for the Identification of Systems)数据库。该数据是用电极从孕妇体表记录的心电信号,采样频率为250Hz,采集时间为10秒。该组数据共有8通道信号,其中前5道为母体腹部信号,后3道为母体胸部信号。我将其做了归一化处理后,画出波形如图2.10和图2.11所示。

图2.10 前四道信号

图2.11 后四道信号

我们不妨选择第一路和最后一路来组合,第一路为母体腹部的信号,最后一路为滤波器的输入信号,参数依然沿用上一节最后所用的步长 为0.24,滤波器阶数N

为100。结果如图2.12,均方误差如图2.13所示。

图2.12 仿真结果

图2.13 均方误差

由图2.12和图2.13我们可以看出结果的稳态误差比较大,因此我们必须调小步

长β。不妨令β为0.01,结果如图2.14,均方误差如图2.15所示。

图2.14 仿真结果

图2.15 均方误差

从这两幅图我们不难发现由于步长过小,算法没有收敛。经过不断的调整步长,

最后发现 为0.08时提取出来的胎儿心电效果最佳,如图2.16所示。

不妨把它和母体腹部信号单独放出来看,如图2.17所示。

图2.17 NLMS算法提取出的胎儿心电

我们可以发现在前1000步内算法没有收敛,母体的信号没有被对消,1500步以后母体的心电基本被对消,但是可以发现对消的并不彻底,波形并不好。不过还是可以明显识别胎儿心电信号,效果还是可以令人接受的。

下面我们用胎儿信噪比较小的来试一下,不妨用第二路和第七路来做一次,经过不断调试,步长 为0.06,滤波器阶数N为100时结果最佳,仿真结果如图2.18所示。

图2.18 仿真结果

将胎儿心电信号单独放出来,如图2.19。

图2.19 所提取出的胎儿心电图

发现在1000步以内没收敛,后面算法基本收敛,发现胎儿心电信号可以被识别,但是效果似乎没有之前那幅图好,是因为这次所用腹部信号中胎儿信噪比较小,可见此算法会因为胎儿信号的减弱提取效果变差。

2.3.3 运用此算法对胎儿心电提取的进一步研究

为了进一步研究该算法对胎儿心电的提取性能,我们用另外一个数据库提供的母婴信号继续做实验,该数据库是PhysioBank数据库[13],这个数据库记录的是一个孕妇连续几个月的胸部和腹部信号,采样频率为1000Hz。如图2.20就是其中一组数据。

图2.20 原始数据

从图中我们可以看出前两组是胸部信号,后四路是腹部信号,但显然胎儿信号很弱,几乎看不出来。除了第四路信号稍差,其余两路胸部和三路腹部信号可以随意组合,我们不妨用第一路和第三路来做一次。阶数为120,步长为0.1时结果如图2.21所示。

图2.21 实验结果

可见母体心电没有对消,而且仍然比胎儿信号强很多,因此必须提高滤波器阶数来消除母体心电,可是经过多次调试,最终发现最好的结果如图2.22所示,此时阶数为

800,步长为0.07。

图2.22 实验结果

从图中可以看出母亲心电有所对消,但是仍很强,而且胎儿心电可识别的信号并不多,

总体来说提取效果较差。用其他所有组合都来试一遍,最好的结果如图2.23。

图2.23 实验结果

发现可以艰难识别胎儿心电了,母体心电还是没对消干净,仍比胎儿信号强,因此提取仍然是失败的。

在接下来的几周内,我几乎用这个数据库里所有的数据都进行了实验,但是没有一组能够成功提取,因此在此分析应该是PhysioBank数据库提供的数据中胎儿信号太弱了,以至于很难用自适应方法提取出令人满意的胎儿心电,可见该算法在胎儿信号很弱的时候并不适用。

我们都知道,在母体皮肤上采集信号的时候,经常会引入工频干扰,按照自适应噪声对消的理论,如果胸部信号和腹部信号都含有工频干扰,那么完全可以在对消工

频干扰的同时消去母亲心电,提取出胎儿心电。实验结果如图2.24所示。

图2.24 带有工频干扰的胎儿心电提取

可以看到同时消除工频干扰和母亲心电后胎儿信号被很好的分离了出来。

因为用上面的PhysioBank数据库中的数据提取不出胎儿心电,因此想找到一个临界值,也就是当胎儿信号弱到什么程度的时候,算法会不适用。

下面只考虑胎儿和母亲的信号功率比对提取的影响,用两路母亲心电和一路胎儿

心电,通过改变胎儿能量来不断降低信号功率比,叠加到其中一路母亲心电上来构成

网络爬虫工作原理

网络爬虫工作原理 1 聚焦爬虫工作原理及关键技术概述 网络爬虫是一个自动提取网页的程序,它为搜索引擎从Internet网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。聚焦爬虫的工作流程较为复杂,需要根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。然后,它将根据一定的搜索策略从队列中选择下一步要抓取的网页URL,并重复上述过程,直到达到系统的某一条件时停止,另外,所有被爬虫抓取的网页将会被系统存贮,进行一定的分析、过滤,并建立索引,以便之后的查询和检索;对于聚焦爬虫来说,这一过程所得到的分析结果还可能对以后的抓取过程给出反馈和指导。 相对于通用网络爬虫,聚焦爬虫还需要解决三个主要问题: (1) 对抓取目标的描述或定义; (2) 对网页或数据的分析与过滤; (3) 对URL的搜索策略。 抓取目标的描述和定义是决定网页分析算法与URL搜索策略如何制订的基础。而网页分析算法和候选URL排序算法是决定搜索引擎所提供的服务形式和爬虫网页抓取行为的关键所在。这两个部分的算法又是紧密相关的。 2 抓取目标描述 现有聚焦爬虫对抓取目标的描述可分为基于目标网页特征、基于目标数据模式和基于领域概念3种。 基于目标网页特征的爬虫所抓取、存储并索引的对象一般为网站或网页。根据种子样本获取方式可分为: (1)预先给定的初始抓取种子样本; (2)预先给定的网页分类目录和与分类目录对应的种子样本,如Yahoo!分类结构等; (3)通过用户行为确定的抓取目标样例,分为: a) 用户浏览过程中显示标注的抓取样本; b) 通过用户日志挖掘得到访问模式及相关样本。 其中,网页特征可以是网页的内容特征,也可以是网页的链接结构特征,等等。现有的聚焦爬虫对抓取目标的描述或定义可以分为基于目标网页特征,基于目标数据模式和基于领域概念三种。 基于目标网页特征的爬虫所抓取、存储并索引的对象一般为网站或网页。具体的方法根据种子样本的获取方式可以分为:(1)预先给定的初始抓取种子样本;(2)预先给定的网页分类目录和与分类目录对应的种子样本,如Yahoo!分类结构等;(3)通过用户行为确定的抓取目标样例。其中,网页特征可以是网页的内容特征,也可以是网页的链接结构特征,等等。 基于目标数据模式的爬虫针对的是网页上的数据,所抓取的数据一般要符合一定的模式,或者可以转化或映射为目标数据模式。

论文开题报告可行性分析

论文开题报告可行性分析 篇一:可行性研究开题报告 毕业设计(论文) 开题报告 题目XXXXX 指导教师 XXXXX 日期 XXXX 院、系(部)管理学院工程管理系 专业及班级工程管理专业XX级 01 班 姓名及学号 XX XXXXXXX 工程管理系 XX届毕业设计(论文)开题审查表 西安科技大学毕业设计(论文)开题报告 篇二:毕业论文开题报告范文 毕业论文开题报告范文 [1]毕业论文开题报告 开题报告是指开题者对科研课题的一种文字说明材料。这是一种新的应用写作文体,这种文字体裁是随着现代科学研究活动计划性的增强和科研选题程序化管理的需要应运而生的。开题报告一般为表格式,它把要报告的每一项内容转换成相应的栏目,这样做,既便于开题报告按目填写,避免遗漏;又便于评审者一目了然,把握要点。

开题报告包括综述、关键技术、可行性分析和时间安排等四个方面。开题报告作为毕业论文答辩委员会对学生答辩资格审查的依据材料之一。 由于开题报告是用文字体现的论文总构想,因而篇幅不必过大,但要把计划研究的课题、如何研究、理论适用等主要问题。 开题报告的总述部分应首先提出选题,并简明扼要地说明该选题的目的、目前相关课题研究情况、理论适用、研究方法。 开题报告是由选题者把自己所选的课题的概况(即"开题报告内容"),向有关专家、学者、科技人员进行陈述。然后由他们对科研课题进行评议。亦可采用"德尔菲法"评分;再由科研管理部门综合评议的意见,确定是否批准这一选题。开题报告的内容大致如下:课题名称、承担单位、课题负责人、起止年限、报名提纲。报名提纲包括: (1)课题的目的、意义、国内外研究概况和有关文献资料的主要观点与结论; (2)研究对象、研究内容、各项有关指标、主要研究方法(包括是否已进行试验性研究); (3)大致的进度安排; (4)准备工作的情况和目前已具备的条件(包括人员、仪器、设备等);

本科生毕业论文(设计)管理规范(精)

对外经济贸易大学 本科生毕业论文(设计管理规范 1991年9月教务处制订 2000年9月教务处修订 2003年9月教务处修订 2004年9月教务处修订 2005年10月教务处修订 2006年11月教务处修订 2010年10月教务处修订撰写毕业论文(设计(以下简称毕业论文。本管理办法除指明对毕业设计有特殊要求外,有关毕业论文的要求均适用于毕业设计,是本科培养方案的重要组成部分,是培养学生理论联系实际的学风和提高学生创新能力的有效手段, 是对学生掌握和运用所学基本理论、基本知识、基本技能以及从事科学研究能力的综合考核。为加强毕业论文管理,提高毕业论文质量,学校特制定本管理办法。 一、选题 (一毕业论文的题目由学生所在学院于第七学期初(第7周公布并由学生选定,也可以在教师指导下由学生自拟与所学专业有关的题目,经毕业论文指导教师和学院同意后确定。 (二毕业论文题目应与所修读专业有密切关系,应以研究、解决现实问题为主,应能引导学生运用理论去分析和解决问题,其范围大小和难易程度要符合学生的实际水平和现有条件。

(三学生选题应完成《毕业论文(设计开题申请表》,报指导教师审阅。指导教师在所指导学生完成开题申请表后,应适时召开开题报告会,组织学生就所选题目进行交流、评估,确定是否同意学生的选题。 (四毕业论文原则上为一人一题,如确需二人以上共同完成同一选题,须由指导教师同意并报学院毕业论文指导委员会批准,但每个学生必须独立完成自己所承担部分的研究工作。 (五开题申请表一经批准,学生不得随意改变论文题目。个别确有特殊原因需要改变者,须向指导教师说明理由,经指导教师、学院审核同意后,方可改变。 二、撰写 (一学生撰写毕业论文应查阅、研究写作论文所必须的文献资料,在正文中形成独立章节的文献综述,文献综述要求如下: 1.毕业论文文献综述是指在学生在毕业论文研究课题或研究题目确定后,通过搜集、整理、阅读国内外相关学术文献资料,就与该课题或题目直接相关的主要研究成果、学术意义、研究方法、研究动态、最新进展等问题进行归纳总结、综合分析后所做的简要评述。 2.毕业论文文献综述所评述的学术文献必须与学生所撰写论文保持高度一致,必须对可能影响所撰写论文主要论点、政策建议或反驳依据等主要学术结论的相关文献及其主要论断做出清晰、准确、流畅的说明。文献综述的字数应为800—1000字。 3.学生必须翻译两篇与选题直接相关的外语文献,外语文献应为专业论文或论文核心部分,译文汉字总字数不得少于2500字。 (二学生对所研究的论题应进行比较全面、深入、系统的分析和阐述,并体现出一定程度的独立见解。论文要理论联系实际,论点明确,论据充分,逻辑清楚,文字简练、通顺。

滤波器设计步骤及实现程序

数字滤波器的设计步骤及程序实现 湖南理工学院信息与通信工程学院 一、IIR 脉冲响应不变法设计步骤 1、已知实际数字指标as s ap p ,,,ωω 2、将数字指标化为原型模拟指标As s Ap p ,,,ΩΩ,可设T=pi, T /ω=Ω 3、求原型模拟滤波器的c N Ω,,其中:??? ???ΩΩ--=)/lg(2)]110/()110lg[(10/10/s p A A s p N N A p cp p 210 /1 10 -Ω= Ω N A s cs s 210 /1 10 -Ω= Ω ][cs cp c ΩΩ∈Ω, 4、根据N 写出归一化原型系统函数)(p G a 5、用c s p Ω=/代入得原型系统函数c s p a a p G s H Ω==/)()( 6、将)(s H a 化为部分分式展开形式∑-=k k a s s A s H )( 7、写出)(z H 的极点T s k k e z =,并写出)(z H 的部分分式展开形式∑--?= 11)(z z A T z H k k 8、将)(z H 化为分子分母形式,验证设计结果。 二、IIR 双线性变换法设计步骤 1、已知实际数字指标as s ap p ,,,ωω 2、将数字指标化为原型模拟指标As s Ap p ,,,ΩΩ,可设T=2, 2 tan 2ω?= ΩT 3、求原型模拟滤波器的c N Ω,,其中:?? ? ???ΩΩ--=)/lg(2)]110/()110lg[(10/10/s p A A s p N N A p cp p 210 /1 10 -Ω= Ω N A s cs s 210 /1 10 -Ω= Ω ][cs cp c ΩΩ∈Ω, 4、根据N 写出归一化原型系统函数)(p G a 5、用c s p Ω=/代入得原型系统函数c s p a a p G s H Ω==/) ()( 6、用11 112--+-?=Z Z T s 代入原型系统函数)(s H a 得1 1 112)()(--+-? ==Z Z T s a s H z H 8、将)(z H 整理成分子分母形式,验证设计结果。

常用的8种数字滤波算法

常用的8种数字滤波算法 摘要:分析了采用数字滤波消除随机干扰的优点,详细论述了微机控制系统中常用的8种数字滤波算法,并讨论了各种数字滤波算法的适用范围。 关键词:数字滤波;控制系统;随机干扰;数字滤波算法 1 引言 在微机控制系统的模拟输入信号中,一般均含有各种噪声和干扰,他们来自被测信号源本身、传感器、外界干扰等。为了进行准确测量和控制,必须消除被测信号中的噪声和干扰。噪声有2大类:一类为周期性的,其典型代表为50 Hz 的工频干扰,对于这类信号,采用积分时间等于20 ms整倍数的双积分A/D转换器,可有效地消除其影响;另一类为非周期的不规则随机信号,对于随机干扰,可以用数字滤波方法予以削弱或滤除。所谓数字滤波,就是通过一定的计算或判断程序减少干扰信号在有用信号中的比重,因此他实际上是一个程序滤波。 数字滤波器克服了模拟滤波器的许多不足,他与模拟滤波器相比有以下优点: (1)数字滤波器是用软件实现的,不需要增加硬设备,因而可靠性高、稳定性好,不存在阻抗匹配问题。 (2)模拟滤波器通常是各通道专用,而数字滤波器则可多通道共享,从而降低了成本。 (3)数字滤波器可以对频率很低(如0.01 Hz)的信号进行滤波,而模拟滤波器由于受电容容量的限制,频率不可能太低。 (4)数字滤波器可以根据信号的不同,采用不同的滤波方法或滤波参数,具有灵活、方便、功能强的特点。 2 常用数字滤波算法 数字滤波器是将一组输入数字序列进行一定的运算而转换成另一组输出数字序列的装置。设数字滤波器的输入为X(n),输出为Y(n),则输入序列和输出序列之间的关系可用差分方程式表示为: 其中:输入信号X(n)可以是模拟信号经采样和A/D变换后得到的数字序列,也

如何抓取网页数据,以抓取安居客举例

如何抓取网页数据,以抓取安居客举例 互联网时代,网页上有丰富的数据资源。我们在工作项目、学习过程或者学术研究等情况下,往往需要大量数据的支持。那么,该如何抓取这些所需的网页数据呢? 对于有编程基础的同学而言,可以写个爬虫程序,抓取网页数据。对于没有编程基础的同学而言,可以选择一款合适的爬虫工具,来抓取网页数据。 高度增长的抓取网页数据需求,推动了爬虫工具这一市场的成型与繁荣。目前,市面上有诸多爬虫工具可供选择(八爪鱼、集搜客、火车头、神箭手、造数等)。每个爬虫工具功能、定位、适宜人群不尽相同,大家可按需选择。本文使用的是操作简单、功能强大的八爪鱼采集器。以下是一个使用八爪鱼抓取网页数据的完整示例。示例中采集的是安居客-深圳-新房-全部楼盘的数据。 采集网站:https://https://www.doczj.com/doc/575387169.html,/loupan/all/p2/ 步骤1:创建采集任务 1)进入主界面,选择“自定义模式”

如何抓取网页数据,以抓取安居客举例图1 2)将要采集的网址复制粘贴到网站输入框中,点击“保存网址”

如何抓取网页数据,以抓取安居客举例图2 步骤2:创建翻页循环 1)在页面右上角,打开“流程”,以展现出“流程设计器”和“定制当前操作”两个板块。将页面下拉到底部,点击“下一页”按钮,在右侧的操作提示框中,选择“循环点击下一页”,以建立一个翻页循环

如何抓取网页数据,以抓取安居客举例图3 步骤3:创建列表循环并提取数据 1)移动鼠标,选中页面里的第一个楼盘信息区块。系统会识别此区块中的子元素,在操作提示框中,选择“选中子元素”

如何抓取网页数据,以抓取安居客举例图4 2)系统会自动识别出页面中的其他同类元素,在操作提示框中,选择“选中全部”,以建立一个列表循环

毕业设计开题可行性分析报告

毕业设计开题可行性分析报告 1.国内外研究动态: 多路温度控制系统属于信息技术的前沿尖端产品,被广泛应用于工农业生产、科学研究和生活等领域,早期的温控系统一般由继电器调温电路组成,很便宜,但是很容易接触不良,随着科技的发展,这样的温控系统无法满足越来越高的精度要求,比如样品的干燥,在某温度下做实验,都需要非常高的精确度。从以前最早的模拟、集成温度控制器到智能数码温控仪再到现在的数字、智能温控仪,数字 PID 控制、模糊控制等技术都在温控系统上得到了应用,这使得温控系统的安全性还有稳定性都有大幅度的提升。 国外仪器仪表普遍采用电子设计自动化EDA、计算机辅助制造CAM、计算机辅助测试CAT、数字信号处理DSP、专用集成电路ASIC及表面贴装技术SMT等技术,并且越来越智能化和数字化,其中在温度控制系统构成的温控仪器仪表这块,英国的 STRIX 公司在电热水壶温控器方面产品大约占据了世界 45的销售额,在这方面更是有其独特的“三金属片”,专利多达 250 项,主要特色是简单快速,即方便上手,烧水又快。外国人相当重视科学仪器的发展,因为这是科研工作的基础。 国内对于温控系统的发展相对于国外要晚一些,不过还是有很多可喜的的,比如 KL808 温控仪是国外技术垄断,但是我国自主研发了一款叫做“二兆瓦级永磁直驱风力发电交流器”,能够实现替代 KL808 温控仪。除此之外,我国工农业发展形势乐观,这更加大了市场对温控系统的需求。大棚种植,大规模室内养殖,要求恒温环境的科研研究等,都需要温控系统来对环境有一个良好的把握。 2.选题的依据和意义: 随着现代信息技术的飞速发展,温度测量控制系统在工业、农业及人们的日常生活中扮演着一个越来越重要的角色,它对人们的生活具有很大的影响,所以温度采集控制系统的设计与研究有十分重要的意义。故本次设计通过使用 51 单片机来完成多路温度采集控制系统的设计全过程。在工业检测系统中,热电偶作为一种主要的测温元件,具有结构简单、制造容易、使用方便、测温范围宽、测温精度高等特点,被广泛应用于工业温度控制过程中。但热电偶输出电势及其微弱,而且存在冷端温度误差和输出电势与被测温度的非线性问题,易引起较大测量误差,尤其在以单片机为器件的智能装置中,需进行复杂的信号放大、A/D 转换、查表线性、温度补偿及数字化输出接口等软硬件设计,硬件芯片使用过多,软件编写任务重,不能适应现阶段产品集成化、模块化的需要。 故本设计中的温度传感器采用 MAXIM 公司的 MAX6675 芯片,该芯片是 K 型热电偶串行模数转换器,它能完成信号放大、冷端补偿、线性化、A/D 转换及SPI 串口数字化输出功能,大大简化了热电偶测量智能装置的软硬件设计。二、研究的基本内容,拟解决的主要问题:1.基本内容:利用单片机技术设计多路温度测控系统实现多路温度的测量和控制。2.拟解决的主要问题: 1)温度可设定、可测、可控; 2)测控温范围 0~100℃、精度0.3℃; 3)“多路”是指最少两路。三、研究步骤、方法及措施:1.系统组成结构及工作原理: 1)温度测量原理多路温度测控系统的数据采集部分由多路转换器和热电偶数字转换器构成。系统设定测温范围是0~1 000 ℃传感器采用K 型热电偶。 K 型热电偶与8 选1 多路转换器CD4051 连接由单片机AT89C52 给出地址选通代码输入到CD4051 的输入端8 路温度采样信号经多路转换器分时选通输

5、华中科技大学本科生毕业设计(论文)规范化要求

本科生毕业设计(论文)规范化要求 一、规范化要求的内容 (一)毕业设计(论文)文本结构规范: 1.毕业设计(论文)任务书 2.毕业设计(论文)题目、摘要、关键词(中英文) 3.毕业设计(论文)目录 4.毕业设计(论文)正文(理工类): ⑴选题背景; ⑵方案论证; ⑶过程(设计或实验)论述; ⑷结果分析; ⑸结论或总结。 注:文科及其它学科,可根据学科特点,参照上述结构制定统一的正文结构规范。 5.致谢 6.附录 7.参考文献 (二)对以上内容的要求 1.1.2条的要求由指导教师把关。 2.论文文本每页右下角必须有页码,目录中必须标明页码。

3.毕业设计(论文)正文:正文内容序号为:一、二、三、…; ⒈、⒉、⒊、…;(1)、(2)、(3)、...。 (1)选题背景:说明本设计课题的来源、目的、意义、应解决的主要问题及应达到的技术要求;简述本课题在国内外发展概况及存在的问题,本设计的指导思想。 (2)方案论证:说明设计原理并进行方案选择,阐明为什么要选择这个设计方案(包括各种方案的分析、比较)以及所采用方案的特点。 (3)过程(设计或实验)论述:指作者对自己的研究工作的详细表述。要求论理正确、论据确凿、逻辑性强、层次分明、表达确切。 (4)结果分析:对研究过程中所获得的主要的数据、现象进行定性或定量分析,得出结论和推论。 (5)结论或总结:对整个研究工作进行归纳和综合,阐述本课题研究中尚存在的问题及进一步开展研究的见解和建议。4.致谢:简述自己通过本设计的体会,并对指导教师以及协助完成设计的有关人员表示谢意。 5.附录:包括与论文有关的图表、计算机程序、运行结果,主要设备、仪器仪表的性指标和测试精度等。 6.参考文献:为了反映文稿的科学依据和作者尊重他人研究成果的严肃态度以及向读者提出有关信息的出处,正文中应按顺序在引用参考文献处的文字右上角用[]标明,[]

几种非线性滤波算法的研究-内附程序

2017 年秋季学期研究生课程考核 (读书报告、研究报告) 考核科目:雷达系统导论 学生所在(系):电子与信息工程学院 学生所在学科:电子与同学工程 学生姓名: 学号: 学生类别: 考核结果阅卷人 第 1 页(共页)

几种非线性滤波算法的介绍与性能分析 作者姓名:学号: 专业院系:电信学院电子工程系 电子邮件: 摘要—非线性滤波算法在雷达目标跟踪中有着重要的应用,对雷达的跟踪性能有着至关重要的影响。好的滤波算法有利于目标航迹的建立及保持,能够得到较精确的目标位置,为发现目标后的后续工作提供可靠的数据依据。本文重点介绍了雷达数据处理中的几种非线性滤波算法:扩展卡尔曼滤波(EKF)、不敏卡尔曼滤波(UKF)、粒子滤波(PF),并且给出了一个利用这三种算法进行数据处理的一个实例,通过这个实例对比分析了这三种算法的性能以及优劣。 关键字—非线性滤波算法;扩展卡尔曼滤波;不敏卡尔曼滤波;粒子滤波; I.概述(一级表题格式) 在雷达对目标进行跟踪前要先对目标进行检测。对于满足检测条件的目标就需要进行跟踪,在跟踪的过程中可以利用新获得的数据完成对目标的进一步检测比如去除虚假目标等,同时利用跟踪获得数据可以进一步完成对目标动态特性的检测和识别。因此对目标进行准确的跟踪是雷达性能的一个重要指标。在检测到满足条件的目标后,根据目标运动状态建立目标运动模型,然后对目标跟踪算法进行设计,这是雷达目标跟踪中的核心部分。 目前主要的跟踪算法包括线性自回归滤波,两点外推滤波、维纳滤波、- αβ滤波、加权最小二乘滤波、维纳滤波和卡尔曼滤波[1]。对于线性系统而言最优滤波的方法就是卡尔曼滤波,卡尔曼滤波是线性高斯模型下的最优状态估计算法。但是实际问题中目标的运动模型往往不是线性的,因此卡尔曼滤波具有很大的局限性。目前主要用的非线性滤波算法可以分为高斯滤波和粒子滤波[2]。不敏卡尔曼滤波和扩展卡尔曼滤波就是高斯滤波中的典型代表,也是应用相对较为广泛的。粒子滤波的应用范围比高斯滤波的适用范围要广,对于系统状态非线性,观测模型非高斯等问题都有很好的适用性。本文具体分析阐述了扩展卡尔曼滤波算法,不敏卡尔曼滤波算法,粒子滤波算法,并且通过一个实例利用仿真的方法分析了这三种算法在滤波性能上的优劣,最后对这三种算法做了一定的总结。 我本科毕业设计题目为《基于历史数据的路径生成算法研究》,由于我是跨专业保研到电信学院,该课题所研究内容不属于雷达系统研究范围,是一种城市路网最快路径生成算法。 II.几种非线性滤波算法 A.扩展卡尔曼滤波 扩展卡尔曼滤波是将非线性系统转换为近似的线性系统的一种方法,其核心思想是围绕滤波值将非线性函数展开成泰勒级数并略去二阶及以上的项,得到一个近似的线性化模型,然后应用卡尔曼滤波完成状态估计。 扩展卡尔曼滤波状态空间模型: k k k w x f+ = + ) ( x 1 状态方程 k k k v x h+ =) ( z观测方程 其中(.) f和(.) h为非线性函数 在扩展卡尔曼滤波中,状态的预测以及观测值的预测由非线性函数计算得出,线性卡尔曼滤波中的状态转移矩阵A阵和观测矩阵H阵由f和h函数的雅克比矩阵代替。 对 (.) f和(.) h Taylor展开,只保留一次项有: ) ? ( ) ?( ) ( k k k k k x x A x f x f- + ≈ ) ? ( ) ?( ) ( k k k k k x x H x h x h- + ≈ 其中: k k x x k k dx df A ?= =为f对 1- k x求导的雅克比矩阵 k k x x k k dx dh H ?= =为h对 1- k x求导的雅克比矩阵 ) ?( ? 1-k k x f x=,于是可以得出: k k k k k k k w x A x f x A x+ - + ≈ + ) ? ) ?( ( 1 k k k k k k k v x H x h x H z+ - + ≈ + ) ? ) ?( ( 1 通过以上变换,将非线性问题线性化。接下来EKF 滤波过程同线性卡尔曼滤波相同,公式如下: )) | (?( ) |1 ( X?k k X f k k= + ) ( ) ( ) | ( ) ( ) |1 (P k Q k k k P k k k+ Φ' Φ = + )1 ( )1 ( ) |1 ( )1 ( )1 (S+ + + ' + + = +k R k H k k P k H k )1 ( )1 ( ) |1 ( )1 ( K1+ + ' + = +-k S k H k k P k

10种常用滤波方法

1、限幅滤波法(又称程序判断滤波法) A、方法: 根据经验判断,确定两次采样允许的最大偏差值(设为A) 每次检测到新值时判断: 如果本次值与上次值之差<=A,则本次值有效 如果本次值与上次值之差>A,则本次值无效,放弃本次值,用上次值代替本次值B、优点: 能有效克服因偶然因素引起的脉冲干扰 C、缺点 无法抑制那种周期性的干扰 平滑度差 2、中位值滤波法 A、方法: 连续采样N次(N取奇数) 把N次采样值按大小排列 取中间值为本次有效值 B、优点: 能有效克服因偶然因素引起的波动干扰 对温度、液位的变化缓慢的被测参数有良好的滤波效果 C、缺点: 对流量、速度等快速变化的参数不宜 3、算术平均滤波法 A、方法: 连续取N个采样值进行算术平均运算 N值较大时:信号平滑度较高,但灵敏度较低 N值较小时:信号平滑度较低,但灵敏度较高 N值的选取:一般流量,N=12;压力:N=4 B、优点: 适用于对一般具有随机干扰的信号进行滤波 这样信号的特点是有一个平均值,信号在某一数值范围附近上下波动 C、缺点: 对于测量速度较慢或要求数据计算速度较快的实时控制不适用 比较浪费RAM 4、递推平均滤波法(又称滑动平均滤波法) A、方法: 把连续取N个采样值看成一个队列 队列的长度固定为N 每次采样到一个新数据放入队尾,并扔掉原来队首的一次数据.(先进先出原则) 把队列中的N个数据进行算术平均运算,就可获得新的滤波结果 N值的选取:流量,N=12;压力:N=4;液面,N=4~12;温度,N=1~4 B、优点:

对周期性干扰有良好的抑制作用,平滑度高 适用于高频振荡的系统 C、缺点: 灵敏度低 对偶然出现的脉冲性干扰的抑制作用较差 不易消除由于脉冲干扰所引起的采样值偏差 不适用于脉冲干扰比较严重的场合 比较浪费RAM 5、中位值平均滤波法(又称防脉冲干扰平均滤波法) A、方法: 相当于“中位值滤波法”+“算术平均滤波法” 连续采样N个数据,去掉一个最大值和一个最小值 然后计算N-2个数据的算术平均值 N值的选取:3~14 B、优点: 融合了两种滤波法的优点 对于偶然出现的脉冲性干扰,可消除由于脉冲干扰所引起的采样值偏差C、缺点: 测量速度较慢,和算术平均滤波法一样 比较浪费RAM 6、限幅平均滤波法 A、方法: 相当于“限幅滤波法”+“递推平均滤波法” 每次采样到的新数据先进行限幅处理, 再送入队列进行递推平均滤波处理 B、优点: 融合了两种滤波法的优点 对于偶然出现的脉冲性干扰,可消除由于脉冲干扰所引起的采样值偏差C、缺点: 比较浪费RAM 7、一阶滞后滤波法 A、方法: 取a=0~1 本次滤波结果=(1-a)*本次采样值+a*上次滤波结果 B、优点: 对周期性干扰具有良好的抑制作用 适用于波动频率较高的场合 C、缺点: 相位滞后,灵敏度低 滞后程度取决于a值大小

网络爬虫详解

网络爬虫详解 一、爬虫技术研究综述 引言 随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎(Search Engine),例如传统的通用搜索引擎AltaVista,Yahoo!和Google等,作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。但是,这些通用性搜索引擎也存在着一定的局限性,如: (1) 不同领域、不同背景的用户往往具有不同的检索目的和需求,通用搜索引擎所返回的结果包含大量用户不关心的网页。 (2) 通用搜索引擎的目标是尽可能大的网络覆盖率,有限的搜索引擎服务器资源与无限的网络数据资源之间的矛盾将进一步加深。 (3) 万维网数据形式的丰富和网络技术的不断发展,图片、数据库、音频/视频多媒体等不同数据大量出现,通用搜索引擎往往对这些信息含量密集且具有一定结构的数据无能为力,不能很好地发现和获取。 (4) 通用搜索引擎大多提供基于关键字的检索,难以支持根据语义信息提出的查询。 为了解决上述问题,定向抓取相关网页资源的聚焦爬虫应运而生。聚焦爬虫是一个自动下载网页的程序,它根据既定的抓取目标,有选择的访问万维网上的网页与相关的链接,获取所需要的信息。与通用爬虫(general purpose web crawler)不同,聚焦爬虫并不追求大的覆盖,而将目标定为抓取与某一特定主题内容相关的网页,为面向主题的用户查询准备数据资源。 1 聚焦爬虫工作原理及关键技术概述 网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件,如图1(a)流程图所示。聚焦爬虫的工作流程较为复杂,需要根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。然后,它将根据一定的搜索策略从队列中选择下一步要抓取的网页URL,并重复上述过程,直到达到系统的某一条件时停止,如图1(b)所示。另外,所有被爬虫抓取的网页将会被系统存贮,进行一定的分析、过滤,并建立索引,以便之后的查询和检索;对于聚焦爬虫来说,这一过程所得到的分析结果还可能对以后的抓取过程给出反馈和指导。 相对于通用网络爬虫,聚焦爬虫还需要解决三个主要问题: (1) 对抓取目标的描述或定义; (2) 对网页或数据的分析与过滤; (3) 对URL的搜索策略。 抓取目标的描述和定义是决定网页分析算法与URL搜索策略如何制订的基础。而网页分析算法和候选URL排序算法是决定搜索引擎所提供的服务形式和爬虫网页抓取行为的关键所在。这两个部分的算法又是紧密相关的。

本科生毕业论文(设计)规范

本科生毕业论文(设计)规范 一、基本规范 (一)毕业论文(设计)文本结构规范及装订顺序: 1.毕业论文(设计)任务书 2.毕业论文(设计)题目、摘要、关键词(中英文) 3.毕业论文(设计)目录 4.毕业论文(设计)正文(理工类): (1)选题背景; (2)方案论证; (3)过程(设计或实验)论述; (4)结果分析; (5)结论或总结。 注:文科及其他学科,可根据学科特点,参照上述结构制定统一的正文结构规范。 5.致谢 6.附录 7.参考文献 (二)内容要求 1.任务书、题目、摘要、关键词、目录等项内容由指导教师把关。 2.论文文本每页右下角必须有页码,目录中必须标明页码。 3.毕业论文(设计)正文: 正文内容层次结构序数为:一、二、三、……;(一)(二)(三)……;1.2.3.……;(1)(2)(3)……。 (1)选题背景:说明本设计课题的来源、目的、意义、应解决的主要问题及应达到的技术要求;简述本课题在国内外发展概况及存在的问题,本设计的指导思想。 (2)方案论证:说明设计原理并进行方案选择,阐明为什么要选择这个设计方案(包括各种方案的分析、比较)以及所采用方案的特点。 (3)过程(设计或实验)论述:指作者对自己研究工作的详细表述。要求

论理正确、论据确凿、逻辑性强、层次分明、表达确切。 (4)结果分析:对研究过程中所获得的主要数据、现象进行定性或定量分析,得出结论和推论。 (5)结论或总结:对整个研究工作进行归纳和综合,阐述本课题研究中尚存在的问题及进一步开展研究的见解和建议。 4.致谢:简述自己完成论文(设计)的体会,并对指导教师以及协助完成论文(设计)的有关人员表示谢意。 5.附录:包括与论文有关的图表、计算机程序、运行结果,主要设备、仪器仪表的性能指标和测试精度等。 6.参考文献:为了反映论文的科学依据和作者尊重他人研究成果的严肃态度以及向读者提出有关信息的出处,正文中应按顺序在引用参考文献处的文字右上角用[]标明,[]中序号应与“参考文献”中序号一致,正文之后则应刊出参考文献,并列出只限于作者亲自阅读过的发表在公开出版物上的最主要文献。 参考文献的著录,按著录/题名/出版事项顺序排列: 期刊——著者,题名,期刊名称,出版年,卷号(期号),起始页码。 书籍——著者,书名、版次(第一版不标注),出版地,出版者,出版年,起始页码。 7.文字要求:文字通顺,语言流畅,无错别字,采用计算机打印成文。 8.图纸要求:图面整洁,布局合理,线条粗细均匀,圆弧连接光滑,尺寸标注规范,文字注释必须使用工程字书写。提倡学生使用计算机绘图。 9.曲线图表要求:所有曲线、图表、线路图、流程图、程序框图、示意图等不准徒手画,必须按国家规定标准或工程要求采用计算机或手工绘制。 10.译文要求:内容必须与课题(或专业内容)有联系,并说明出处。 11.论文字数要求: 毕业论文(设计)字数文科0.8—1.2万(其中外语专业不少于3000个单词),理工科不少于1.5万字(含图表);外文翻译不少于1.5万印刷符号、外文参考资料阅读量不少于10万印刷符号。文科各专业的文献综述必须单独写,其字数应在2千汉字以上,要求与译文相同。 12.毕业论文(设计说明书)用A4开纸打印,并使用学校统一制作的封面

电源滤波电路滤波原理图解

电源滤波电路的滤波原理图解 滤波电路主要有下列几种:电容滤波电路,这是最基本的滤波电路;π 型 RC 滤波电路;π 型 LC 滤波电路;电子滤波器电路。 1. 单向脉动性直流电压的特点 如图 1(a)所示。是单向脉动性直流电压波形,从图中可以看出,电压的方向性无论在何时都是一致的,但在电压幅度上是波动的,就是在时间轴上,电压呈现出周期性的变化,所以是脉动性的。 但根据波形分解原理可知,这一电压可以分解一个直流电压和一组频率不同的交流电压,如图 1(b)所示。在图 1(b)中,虚线部分是单向脉动性直流电压 U。中的直流成分,实线部分是 UO 中的交流成分。 2. 电容滤波原理 根据以上的分析,由于单向脉动性直流电压可分解成交流和直流两部分。在电源电路的滤波电路中,利用电容器的“隔直通交”

的特性和储能特性,或者利用电感“隔交通直”的特性可以滤除电压中的交流成分。图 2 所示是电容滤波原理图。 图 2(a)为整流电路的输出电路。交流电压经整流电路之后输出的是单向脉动性直流电,即电路中的 UO。 图 2(b)为电容滤波电路。由于电容 C1 对直流电相当于开路,这样整流电路输出的直流电压不能通过C1 到地,只有加到负载 RL 图为 RL 上。对于整流电路输出的交流成分,因 C1 容量较大,容抗较小,交流成分通过 C1 流到地端,而不能加到负载 RL。这样,通过电容 C1 的滤波,从单向脉动性直流电中取出了所需要的直流电压 +U。 滤波电容 C1 的容量越大,对交流成分的容抗越小,使残留在负载 RL 上的交流成分越小,滤波效果就越好。 3. 电感滤波原理

图 3 所示是电感滤波原理图。由于电感 L1 对直流电相当于通路,这样整流电路输出的直流电压直接加到负载 RL 上。 对于整流电路输出的交流成分,因 L1 电感量较大,感抗较大,对交流成分产生很大的阻碍作用,阻止了交流电通过 C1 流到加到负载 RL。这样,通过电感 L1 的滤波,从单向脉动性直流电中取出了所需要的直流电压 +U。 滤波电感 L1 的电感量越大,对交流成分的感抗越大,使残留在负载 RL 上的交流成分越小,滤波效果就越好,但直流电阻也会增大。

基于Matlab的常用滤波算法研究(含代码)讲解

毕业设计(论文) UNDERGRADUATE PROJECT (THESIS) 题目: 冲击测试常用滤波算法研究 学院 专业 学号 学生姓名 指导教师 起讫日期

目录 摘要 (2) ABSTRACT (3) 第一章绪论 (4) 1.1课题背景 (4) 1.2国内外相关领域的研究 (4) 1.3主要研究内容与创新 (5) 1.3.1研究内容与意义 (5) 1.3.2课题的创新点 (5) 1.3.3 研究目的与技术指标 (6) 第二章数字滤波基础 (7) 2.1数字滤波算法概念 (7) 2.2数据采样与频谱分析原理 (8) 2.2.1 时域抽样定理 (8) 2.2.2 离散傅立叶变换(DFT) (8) 2.2.3 快速傅立叶变换(FFT) (9) 2.2.4 频谱分析原理 (9) 2.3常用数字滤波算法基础 (10) 2.3.1常用数字滤波算法分类 (10) 2.3.2常用数字滤波算法特点 (11) 2.3.3常用滤波算法相关原理 (13) 2.4 冲击测试采样数据 (16) 2.4.1噪声的特点与分类 (16) 2.4.2冲击测试采样数据特点 (17) 2.5 MATLAB简介 (17) 2.5.1 MATLAB功能简介 (18) 2.5.2 MATLAB的发展 (18) 第三章、冲击测试滤波算法设计及滤波效果分析 (20) 3.1 冲击测试采样数据的分析 (20) 3.2 滤波算法设计及效果分析 (21) 3.2.1 中位值平均法的设计 (21) 3.2.2限幅法和限速法的设计 (23) 3.2.3一阶滞后法的设计 (25) 3.2.4低通法的设计 (26) 第四章结论与展望 (34) 4.1冲击测试的滤波算法总结 (34) 4.2冲击测试的滤波算法展望 (34) 致谢 (36) 参考文献 (37) 附录:程序代码清单 (38)

网站爬虫如何爬取数据

https://www.doczj.com/doc/575387169.html, 网站爬虫如何爬取数据 大数据时代,用数据做出理性分析显然更为有力。做数据分析前,能够找到合适的的数据源是一件非常重要的事情,获取数据的方式有很多种,最简便的方法就是使用爬虫工具抓取。今天我们用八爪鱼采集器来演示如何去爬取网站数据,以今日头条网站为例。 采集网站: https://https://www.doczj.com/doc/575387169.html,/ch/news_hot/ 步骤1:创建采集任务 1)进入主界面选择,选择“自定义模式” 网站爬虫如何爬取数据图1

https://www.doczj.com/doc/575387169.html, 2)将上面网址的网址复制粘贴到网站输入框中,点击“保存网址” 网站爬虫如何爬取数据图2 3)保存网址后,页面将在八爪鱼采集器中打开,红色方框中的信息是这次演示要采集的内容

https://www.doczj.com/doc/575387169.html, 网站爬虫如何爬取数据图3 步骤2:设置ajax页面加载时间 ●设置打开网页步骤的ajax滚动加载时间 ●找到翻页按钮,设置翻页循环 ●设置翻页步骤ajax下拉加载时间 1)网页打开后,需要进行以下设置:打开流程图,点击“打开网页”步骤,在右侧的高级选项框中,勾选“页面加载完成向下滚动”,设置滚动次数,每次滚动间隔时间,一般设置2秒,这个页面的滚动方式,选择直接滚动到底部;最后点击确定

https://www.doczj.com/doc/575387169.html, 网站爬虫如何爬取数据图4 注意:今日头条的网站属于瀑布流网站,没有翻页按钮,这里的滚动次数设置将影响采集的数据量

https://www.doczj.com/doc/575387169.html, 网站爬虫如何爬取数据图5 步骤3:采集新闻内容 创建数据提取列表 1)如图,移动鼠标选中评论列表的方框,右键点击,方框底色会变成绿色 然后点击“选中子元素”

高校市场营销专业本科毕业论文研究方法运用之实证分析

龙源期刊网 https://www.doczj.com/doc/575387169.html, 高校市场营销专业本科毕业论文研究方法运用之实证分析 作者:吴建勋唐璐宵王薇刘聪慧 来源:《人力资源管理》2016年第05期 摘要:在毕业论文撰写中,科学研究方法的选择至关重要。本科生毕业论文的研究方法,直接制约着研究结论的可靠性及论文的质量。本文以河南工业大学市场营销专业本科2012-2014届598篇有效毕业论文为研究样本,分析毕业论文研究方法的运用现状,分析造成大学 生对不同研究方法选择差异的原因,为今后毕业生撰写毕业论文时选用恰当的研究方法提供有益的镜鉴。 关键词:市场营销专业本科毕业生论文研究方法 一、引言 科学的研究方法的选择是确保本科生毕业论文质量的重要前提。许多高校以教学为中心,科研特别是本科生的科研氛围不太浓,学生们常常不知道什么是科学的研究方法,不清楚不同研究方法的特色、差异及适用条件,更不熟悉这些方法的运用,这些问题的存在必然会影响毕业论文的整体质量。现实中,由于科学研究方法的缺失、错用或乱用等导致相当数量毕业论文的结论难以成立。近年来许多学者对此也都有过深入的研究,浙江大学马庆国教授早就对管理科学研究方法给出了“标准化”建议。本文以河南工业大学市场营销专业本科2012-2014届598篇有效毕业论文为研究样本,分析这些论文所使用的研究方法情况,探讨其中存在的问题,并提出相应的建议。 1.研究背景 河南工业大学市场营销专业发展迅速,毕业生数量增长很快。现有的市场营销专业学生类型繁多,主要包括管理学院双学位市场营销专业学生、旅游管理专业学生,以及国际学院市场营销专业学生和国际学院国际市场营销专业学生等多个层次。2010届毕业生183人,2011届毕业生130人,2012届毕业生234人,2013届毕业生212人,2014届毕业生211人,2015届毕业生219人。六届合计1189人。由于学生人数众多,指导教师只有23人(含3名双肩挑人员,还有一些教师出国深造、外出学习),教师年人均指导学生8.62人,论文指导的工作量 较重。由于毕业生在毕业前忙于找工作、考研、考公务员、考会计证、考驾照等社会活动,大多心神不宁,难以全副身心投入到毕业论文的写作中,更遑论选择恰当的研究方法了。到来年春天,只有短短八周时间,要写出高质量的毕业论文,十分困难的。 什么是科学的研究方法?市场营销专业本科毕业论文应该选择哪些科学的研究方法?这些方法各有什么特色和适用条件?本文通过对河南工业大学市场营销专业本科2012-2014届598

对外经济贸易大学-本科生毕业论文(设计)基本规范

对外经济贸易大学本科生毕业论文(设计)基本规范 一、毕业论文打印及版面要求 1. 学生毕业论文必须上交打印稿和电子文档。 2. 毕业论文用纸必须采用国际标准A4幅面 (297mm×210mm)打印纸或复印纸印制。 二、封面 1. 中外文封面构成:学校的校徽与名称,位于封面上部顶端;论文性质(论文或设计),位于封面上部底端;论文题目,位于封面中部中端;学号、姓名、学院、专业、指导教师、完成时间等分列两栏,位于下部,两端、文字均需对齐。 外文封面,其排列形式则根据学生所使用语种的书写习惯由院系自行确定。 2. 不标页码。 3. 题目应简明、具体,起到能够概括论文要旨的作用。同时,还应考虑到题录、索引和检索的需要,为选择关键词提供方便。题目一般不超过20个汉字,必要时可加副标题。 三、目录 1. 论文的目录用“目录”作标题,用“三号黑体”字,位于目录页上部居中位置;页码位于页面下部居中位置,用罗马字

母标示。 2. 目录不包括论文的封面、论文审题表和论文评定表。 3. 目录中可列出两级标题。如果有两级标题,第二层次标题向内缩三格,置于第一层次标题之下。目录中的标题采用“小四号宋体”,一级序号用汉字,二级序号用汉字外加圆括弧。 4. 各标题的页码放在页的右端,标题和页码之间用实心的圆点隔开,两端对齐。只有第一层次的标题标明页码;第二层次的标题不标页码。标题采用“小四号宋体”。 5. 如果某一标题的长度超过一行,另起一行时应内缩三格。 6. 目录中各部分的序号应与论文正文一致。序号用汉语与标题之间用一个空格分开。 四、摘要 1. 摘要应以高度浓缩的方式陈述论文的核心内容,不必重复和解释论文的题目;篇幅应控制在300字以内。摘要标题用“三号黑体”,正文用“小四号宋体”。 2. 摘要的主要内容应包括:论文所研究的问题、使用的方法、所得出的结论以及结论的意义。 3. 摘要中不要使用第一人称。 4. 摘要的页码用罗马字母,在页的底端居中位置标上。本页还包括论文的题目、作者的姓名和关键词。

常见运放滤波电路

滤波电路 这节非常深入地介绍了用运放组成的有源。在很多情况中,为了阻挡由于虚地引起的直流电平,在运放的输入端串入了电容。这个电容实际上是一个高通滤波器,在某种意义上说,像这样的运放电路都有这样的电容。设计者必须确定这个电容的容量必须要比电路中的其他电容器的容量大100 倍以上。这样才可以保证电路的幅频特性不会受到这个输入电容的影响。如果这个滤波器同时还有放大作用,这个电容的容量最好是电路中其他电容容量的1000 倍以上。如果输入的信号早就包含了VCC/2 的直流偏置,这个电容就可以省略。 这些电路的输出都包含了VCC/2 的直流偏置,如果电路是最后一级,那么就必须串入输出电容。 这里有一个有关滤波器设计的协定,这里的滤波器均采用单电源供电的运放组成。滤波器的实现很简单,但是以下几点设计者必须注意: 1. 滤波器的拐点(中心)频率 2. 滤波器电路的增益 3. 带通滤波器和带阻滤波器的的Q值 4. 低通和高通滤波器的类型(Butterworth 、Chebyshev、Bessell) 不幸的是要得到一个完全理想的滤波器是无法用一个运放组成的。即使可能,由于各个元件之间的负杂互感而导致设计者要用非常复杂的计算才能完成滤波器的设计。通常对波形的控制要求越复杂就意味者需要更多的运放,这将根据设计者可以接受的最大畸变来决定。或者可以通过几次实验而最终确定下来。如果设计者希望用最少的元件来实现滤波器,那么就别无选择,只能使用传统的滤波器,通过计算就可以得到了。 3.1 一阶滤波器 一阶滤波器是最简单的电路,他们有20dB 每倍频的幅频特性 3.1.1 低通滤波器 典型的低通滤波器如图十三所示。

相关主题
文本预览
相关文档 最新文档