商务智能实验11报告

  • 格式:doc
  • 大小:597.00 KB
  • 文档页数:8

下载文档原格式

  / 8
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《数据挖掘与商务智能实验》

实验报告

实验题目:预测分析:人工神经网络

姓名:王俊

学号:201430850164

指导教师:张大斌

实验时间:2016.11.10

2016年11 月10 日

实验题纲:

一、实验目的

1.了解熟悉SPSS Modeler及其相关知识

2.掌握SPSS Modeler工具建立B-P反向传播网络的方法

3.学会运用SPSS Modeler B-P反向传播网络进行相关内容的分析

二、实验内容

本实验将以一份虚拟的电信客户数据为例,文件名为Telephone.sav,它是一个SPSS 文件。该数据中的变量x1至x15分别是:居住地、年龄、婚姻状况、家庭月收入、受教育的程度、性别、家庭人口、基本服务累计开通月数、是否申请无线转移服务、上月基本费用、上月限制性项目的服务费用、无线服务费用、是否电子支付、客户所申请的服务套餐费用、是否流失。本实验实践神经网络的具体操作步骤,目标是建立客户流失预测模型。

三、实验步骤与结果

步骤1 创建K-means聚类数据流

(1)通过“Statistic文件”节点读入文件名为Telephone.sav的数据。(2)在数据流中添加“分区”节点,将样本集划分为训练集和测试集,如图所示

(3)在“建模”模块下选择“神经网络”节点连接在数据流的恰当位置。

步骤2 设置相关参数

(1)点击鼠标右键,点击“编辑”按钮进行主要参数的设置。

(2)在“选项”0选项卡下,勾选“显示反馈图形”。

(3)在“模型”选项卡下,勾选“使用分区数据”和“为每个分割购建模型”;选择“快速”方法;停止采用“默认值”。如图

步骤3 结果运行

计算的结果如图所示

四、实验分析与扩展练习

实验分析:如图所示,造成本实验预测精确度较低的的原因:1.网络结构过于简单,隐藏层数太少,神经元较少;

2.

2.未采用专家模式,对于一些权重(连接强度)分配不合理;

3.学习率设置不好

4.采用的方法不同

修改以上参数后,预测结果精度就会相应的增加

四、结论与讨论(重点)

1.反向传播是B—P反向传播模型较之于感知机最大的不同之处。所谓反向传播,是指B-P模型通过输出节点的测量误差,来逐层估计隐节点的误差,即反方向传播误差,从而调整网络权值,以实现输出值的精准化。

B-P反向传播网络算法包括正向传播和反向传播两个阶段。正向传播即从输入层到隐层到输出层,传播期间权值不变;预测误差计算出来后,便进入反向传播过程,即误差被反方向传回给输入节点。传播期间所有的网络可能会均得到调整。这种正向传播和反向传播过程不断重复,直到输出结果满足条件为止。B-P反向传播网络正得名于此。

2.B-P反向传播模型中,隐层起起着相当大的作用,其作用是将线性不可分的样本转化为线性可分的样本。所谓线性可分,指能使用一个超平面将两者分开,则为线性可分,否则则为线性不可分。

3.B-P反向传播模型中,可以通过改变网络结构在调整预测精度:比如增加隐层、

隐节点数量均可。

4.BP算法的执行步骤

在反向传播算法应用于前馈多层网络时,采用Sigmoid为激发面数时,可用下列步骤对网络的权系数Wij 进行递归求取。注意对于每层有n个神经元的时候,即有i=1,2,…,n;j=1,2,…,n。对于第k层的第i个神经元,则有n 个权系数Wi1 ,Wi2 ,…,Win ,另外取多—个Win+1 用于表示阀值θi ;并且在输入样本X时,取x=(X1 ,X2 ,…,Xn ,1)。

算法的执行的步骤如下:

1.对权系数Wij 置初值。

对各层的权系数Wij 置一个较小的非零随机数,但其中Wi ,n+1=-θ。2.输入一个样本X=(xl ,x2 ,…,xn ,1),以及对应期望输出Y=(Y1 ,Y2 ,…,Yn )。

3.计算各层的输出

对于第k层第i个神经元的输出Xi k ,有:

Xi k =f(Ui k )

4.求各层的学习误差di k

对于输出层有k=m,有

di m =Xi m (1-Xi m )(Xi m -Yi )

对于其他各层,有

5.修正权系数Wij和阀值θ

用式(1—53)时有:

用式(1—54)时有:

(格式按华南农业大学论文格式)