商务智能实验11报告
- 格式:doc
- 大小:597.00 KB
- 文档页数:8
《数据挖掘与商务智能实验》
实验报告
实验题目:预测分析:人工神经网络
姓名:王俊
学号:201430850164
指导教师:张大斌
实验时间:2016.11.10
2016年11 月10 日
实验题纲:
一、实验目的
1.了解熟悉SPSS Modeler及其相关知识
2.掌握SPSS Modeler工具建立B-P反向传播网络的方法
3.学会运用SPSS Modeler B-P反向传播网络进行相关内容的分析
二、实验内容
本实验将以一份虚拟的电信客户数据为例,文件名为Telephone.sav,它是一个SPSS 文件。该数据中的变量x1至x15分别是:居住地、年龄、婚姻状况、家庭月收入、受教育的程度、性别、家庭人口、基本服务累计开通月数、是否申请无线转移服务、上月基本费用、上月限制性项目的服务费用、无线服务费用、是否电子支付、客户所申请的服务套餐费用、是否流失。本实验实践神经网络的具体操作步骤,目标是建立客户流失预测模型。
三、实验步骤与结果
步骤1 创建K-means聚类数据流
(1)通过“Statistic文件”节点读入文件名为Telephone.sav的数据。(2)在数据流中添加“分区”节点,将样本集划分为训练集和测试集,如图所示
(3)在“建模”模块下选择“神经网络”节点连接在数据流的恰当位置。
步骤2 设置相关参数
(1)点击鼠标右键,点击“编辑”按钮进行主要参数的设置。
(2)在“选项”0选项卡下,勾选“显示反馈图形”。
(3)在“模型”选项卡下,勾选“使用分区数据”和“为每个分割购建模型”;选择“快速”方法;停止采用“默认值”。如图
步骤3 结果运行
计算的结果如图所示
四、实验分析与扩展练习
实验分析:如图所示,造成本实验预测精确度较低的的原因:1.网络结构过于简单,隐藏层数太少,神经元较少;
2.
2.未采用专家模式,对于一些权重(连接强度)分配不合理;
3.学习率设置不好
4.采用的方法不同
修改以上参数后,预测结果精度就会相应的增加
四、结论与讨论(重点)
1.反向传播是B—P反向传播模型较之于感知机最大的不同之处。所谓反向传播,是指B-P模型通过输出节点的测量误差,来逐层估计隐节点的误差,即反方向传播误差,从而调整网络权值,以实现输出值的精准化。
B-P反向传播网络算法包括正向传播和反向传播两个阶段。正向传播即从输入层到隐层到输出层,传播期间权值不变;预测误差计算出来后,便进入反向传播过程,即误差被反方向传回给输入节点。传播期间所有的网络可能会均得到调整。这种正向传播和反向传播过程不断重复,直到输出结果满足条件为止。B-P反向传播网络正得名于此。
2.B-P反向传播模型中,隐层起起着相当大的作用,其作用是将线性不可分的样本转化为线性可分的样本。所谓线性可分,指能使用一个超平面将两者分开,则为线性可分,否则则为线性不可分。
3.B-P反向传播模型中,可以通过改变网络结构在调整预测精度:比如增加隐层、
隐节点数量均可。
4.BP算法的执行步骤
在反向传播算法应用于前馈多层网络时,采用Sigmoid为激发面数时,可用下列步骤对网络的权系数Wij 进行递归求取。注意对于每层有n个神经元的时候,即有i=1,2,…,n;j=1,2,…,n。对于第k层的第i个神经元,则有n 个权系数Wi1 ,Wi2 ,…,Win ,另外取多—个Win+1 用于表示阀值θi ;并且在输入样本X时,取x=(X1 ,X2 ,…,Xn ,1)。
算法的执行的步骤如下:
1.对权系数Wij 置初值。
对各层的权系数Wij 置一个较小的非零随机数,但其中Wi ,n+1=-θ。2.输入一个样本X=(xl ,x2 ,…,xn ,1),以及对应期望输出Y=(Y1 ,Y2 ,…,Yn )。
3.计算各层的输出
对于第k层第i个神经元的输出Xi k ,有:
Xi k =f(Ui k )
4.求各层的学习误差di k
对于输出层有k=m,有
di m =Xi m (1-Xi m )(Xi m -Yi )
对于其他各层,有
5.修正权系数Wij和阀值θ
用式(1—53)时有:
用式(1—54)时有:
(格式按华南农业大学论文格式)