浙江大学城市学院实验报告
课程名称实用统计软件
实验项目名称总体分布卡方检验
实验成绩指导老师(签名)日期2011-10-14
一.实验目的
1,掌握卡方检验的基本原理和算法;
2,能够用SPSS软件解决卡方检验的问题。
二. 实验内容与要求
1.根据摇奖号码中出现的数字值检验摇奖的球是否均匀,即0~9每个数字出现的概率是否均为1/10。下面是100个摇奖摇出来的数据。本例数据是实际收集的样本原始数据,所以不需要加权处理。
3 2 2 8 5
4 2 8 0 4 9 4 8 7 7 4 2 2 1 6 4 7 2 9 8 4 6 7 6 2 0 7
5 9 7 4 4 4 7 5
6 8 1
7 2 0 3 3 4
8 0 7 1 1 6 0 7 2 2 1 2 5 8 1 7 8 6 4 2 8 6 4
9 6 0 4 3 4 3 8 1 7 2 8 4 2 0 1 8 3 7 3 7 8 6 1 3 6 4 3
要求:在期望值选项中,我们选择“All categories equal”选项。
2.某门户网站为了了解网站的流量,在6小时内,记录每分钟内访问该网站的用户数,得
根据数据检验每分钟访问该网站的用户数是否服从泊松分布?
要求:
a.此数据首先需要用“频数”对“被访问数”变量进行加权
b.其次要计算在原假设被访问数服从泊松分布的下,变量个取值的期望频数。
计算方法:用变量取值的平均值(加权平均)作为泊松分布参数的估计值。
各取值期望频率计算方法:
N* p x= N*(Fλ(x)- Fλ(x-1))
SPSS中,变量计算公式:
(CDF.POISSON(被访问数,泊松参数估计值) - CDF.POISSON(被访问数-1,泊松参数估计值))*300
c.最后就是要检验观测频数与泊松分布假设下期望频数之间是否有显著性差异。
三.实验步骤
具体操作参见课件总体分布卡方检验.PPT(ftp://10.66.28.22:22)
四. 实验结果(数据与图形)与分析
从结果表格可以看出,总共100个数据中,0到9实际被抽到的次数分别为:7,9,14,9,16,4,10,14,13,4,。按照给定的理论分布,每个数字被抽到的期望频数应为10,10,10,10,10,10,10,10,10,10.实际观察频数和期望频数的差分别为-3,-1,4,-1,6,-6,0,4,3,-6.
0.067.该值就是所得到的相伴概率值,大于显著性水平0.06,因此不能拒绝原假设,可以认为样本来自总体分布与指定的期望分布没有显著性差异。
从结果表格可以看出总共300个观察数据中,从2到20的实际被访问数为:2,3,4,11,20,27,31,29,44,31,35,17,24,10,3,2,5,1,1,。按照泊松分布,访问量期望频数6.2.,2.2,5.5,11,18.4,26.5,33.4,37.3,37.6,34.4,28.9,22.4,16.1,10.8,6.8,4.0,2.3,1.2,0.6.实际访问量与泊松分布期望频数的差为:1.4,0.8,-1.5,0,1.6,0.5,-2.4,-8.3,6.4,-3.4,6.1,-5.4,7.9,-0.8,-3.8,-2.0,2.7,-0.2,0.4.
该表格是计算卡方统计量以及对应的相伴概率值。表格的最后一列值为0.305,该值就是所得到的相伴概率的值,大于显著性水平0.05,因此不能拒绝原假设,可以认为样本来自的总体与泊松分布假设下期望频数无显著性差异。