浅谈总体分布的拟合优度检验

  • 格式:ppt
  • 大小:366.00 KB
  • 文档页数:12

下载文档原格式

  / 12
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0
2020/4/5
f(2)2(1/2)22(/21)e2/2
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
3 3.84 6 7.81 9
1122.59 15
18
卡方值
华中科技大学同济医学院 宇传华
(yuchua@163.com)制作
卡方分布下的检验水准及其临界值
2020/4/5
2. 计算步骤
(1) H 0:样本的总体分布与该理论分布无区别 H1 :样本与该理论分布有区别
0.05
(2)列出各组的实际频数与理论频数
(3) Pearson 2 统计量
2 P
k (实际频数-理论频数)2
i 1
理论频数
O1 E1 2 (O2 E2 )2 ... (Ok Ek )2
2020/4/5
华中科技大学同济医学院 宇传华 (yuchua@163.com)制作
第一节 卡方拟合优度检验 的原理与计算步骤
1. 原理
判断样本观察频数(Observed frequency)
与理论(期望)频数(Expected frequency )之差
是否由抽样误差所引起。
2020/4/5
华中科技大学同济医学院 宇传华 (yuchua@163.com)制作
累计χ2 值
病人数 家庭数
家庭数
(1)
(2)
(3)
(4)
(5)
(6)
0
பைடு நூலகம்
112 0.6360 95.4084
2.885
2.885
1
20 0.3106 46.5948
15.179 18.065
2
11 0.0505
7.5852
3
7 0.0027
0.4116 7.996 12.513 30.578
150
8
H0:该病分布服从二项分布,H1:不服从二项分布
α=0.05
理论概率 P( x) x e
x!
fx
2020/4/5
n
0 103 1143 7 1 586 1.41889
413 华中科技大学同济医学院 宇传华
413
(yuchua@163.com)制作
P(7)=0.000556
卡方分量
表 7.3 Poisson 分布的拟合优度χ2 检验计算表
E1
E2
Ek
k 1 (计算理论分布时所用
自由度 参数的个数)
(4) 确定概率 P 并作出统计推论。
2020/4/5
华中科技大学同济医学院 宇传华 (yuchua@163.com)制作
注意:理论频数不宜过小,否则需要合并
χ2分布(chi-square distribution)
纵高
0.5 0.4 0.3 0.2 0.1 0.0
方格内 细胞数
(X) (1)
0 1 2 3 4 5 6 7 合计
实际 方格数 (Oi)
(2)
103 143
98 42 18
6 2 1 413
理论概率 (Pi) (3)
0.24198 0.34335 0.24359 0.11521 0.04087 0.01160 0.00274 0.00067
理论 方格数 (Ei)
华中科技大学同济医学院 宇传华 (yuchua@163.com)制作
第二节 离散型随机变量分布的 拟合优度检验
一、二项分布的拟合优度检验
二、Poisson分布的拟合优度检验
2020/4/5
华中科技大学同济医学院 宇传华 (yuchua@163.com)制作
一、二项分布的拟合优度检验
【例7.4】某研究人员在某地随机抽查了150 户3口之家,结果全家无某疾病有112户,家 庭中1人患病的有20户,2人患病的有11户, 3人全患病有7户,问该病在该地是否有家族 聚集性。
2. 实际工作中需要了解样本观察频数(Observed frequency,简记为O)是否与某一理论频数( Expected frequency,简记为E)相符。
2020/4/5
华中科技大学同济医学院 宇传华 (yuchua@163.com)制作
本章介绍的拟合优度检验方法
1. 卡方检验
2. 正态性检验的W法(Shapiro-wilk法)、D法( Kolmogorov-Smirnov法)
第七章 总体分布的拟合优度检验
Goodness of Fit Test for Distribution of Population
2020/4/5
华中科技大学同济医学院 宇传华 (yuchua@163.com)制作
为什么要知道总体分布?
1. 参数统计学推断方法(如t检验、F检验)均以 服从某一分布(如正态分布)为假定条件。
数据格式与计算公式
类别或组段 观察频数
理论频数
1
O1
E1
2
O2
E2



k
Ok
Ek
问题:试判断这份样本,是否来自该理论分布?
P2
k
i1
(Oi Ei)2, Ei
k1a
注意:理论频数Ei不宜过
a为参数的个数 2020/4/5
小(如不小于5),否则需 华中科技大学同济医学院 宇要传合华 并组段!
(yuchua@163.com)制作
(4)
099.939 141.802 100.601 047.580 016.878 004.790 001.133 6.201 000.278
Oi Ei
(5) 3.061 1.198 2.601 5.580 1.122
解:如果家庭成员之间的发病与否(X)互
不影响,则X符合二项分布(两种互斥结果
、试验条件不变、各次试验独立)。也就
表明疾病不具有家族聚集性。 2020/4/5
华中科技大学同济医学院 宇传华
(yuchua@163.com)制作
表 7.2 二项分布的拟合优度χ2 检验计算表
每户发 观察 理论概率 理论
χ2 分量
α=0.05
ˆ
发病总人数 调查总人数
01121 20 211 3 7 3150
63 450
0.14
1ˆ 1 0.14 0.86
理论概率 P( X
0)
3 0
0.140
0.863
0.63606 ,…
理论家庭数=150*理论概率 =3-1-1=1。
2χ 020/240/.505,1=3.84, ∴p<0.华05中(, 科y技u… c大hu学a具@同1有 6济3.医c家 o学m)院庭制宇作聚传华集性
二、Poisson分布的拟合优度检验
【例7.3】将酵母细胞的稀释液置于某种计量 仪器上,数出每一小方格内的酵母细胞数, 共观察了413个小方格,结果见表7.3第1、2 列,试问该资料是否服从Poisson分布?
H0:方格内酵母细胞的个数服从 Poisson 分布;
H1:…个数不服从 Poisson 分布