二项分布and卡方检验2002

  • 格式:ppt
  • 大小:392.50 KB
  • 文档页数:39

下载文档原格式

  / 39
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P(8) 10! 0.708 (1 0.70)108 0.23347 8!(10 8)!
3
一、二项分布的概念
二项分布(binomial distribution)是指在只 会产生两种可能结果如“阳性”或“阴性”之一 的n次独立重复试验(称为n重Bernoulli试验)中 ,当每次试验的“阳性”概率保持不变时,出现 “阳性”的次数X=0,1,2,…,n的一种概率分 布。
绝H0,接受H1,可以认为两组降低颅内压总体有效率
不等,即可认为异梨醇口服液降低颅内压的有效率 高于氢氯噻嗪+地塞米松的有效率。
21
四格表资料连续性校正公式
(| ad bc | n)2 n
2 c
(a
b)(c
d )(a
2 c)(b
d)
1
22
对于四格表资料,通常规定:
(1)当n≥40且所有的T≥5时,用检验的基本公 式;当P≈α时,改用四格表资料的Fisher确切概率 法。
表7-10 某地5801人的血型
ABO血型
O A B AB 合计
M 431 388 495 137 1451
MN血型
N
MN
490
902
410
800
587
950
179
32
1666 2684
合计
1823 1598 2032 348 5801
问题:(1)两分类变量有无关联?
(2)关联程度如何?
32
分析步骤:
H0:两种血型系统间无关联 H1:两种血型系统间有关联
0.05
2 5801( 4312 4902 L L 322 1)
18231451 18231666
348 2684
213.16
(4 1)(3 1) 6
33
查界值表得P<0.005。按α=0.05检验水准拒绝 H0 ,接受H1 ,认为两种血型系统间有关联。
不全相等
0.05
30
2 532( 1992 72 L L 262 1)
206 481 20651
144 51
21.04
(3 1)(2 1) 2
查2界值表,得p<0.005,按α=0.05水准, 拒绝H0 ,接受H1 ,三种疗法治疗周围性面 神经麻痹的有效率有差别。
31
双向无序分类资料的关联性检验
(2)当n≥40 但有1≤T<5时,用四格表资料的 校正公式;或改用四格表资料的Fisher确切概率法 。
(3)当n<40,或T<1时,用四格表资料的 Fisher确切概率法。
(4)连续性校正仅用于ν=1的四格表资料。
23
例7-2 某医师欲比较胞磷胆碱与神经节苷酯 治疗脑血管疾病的疗效,将78例脑血管疾病患者 随机分为两组,结果见表7-2。问两种药物治疗脑 血管疾病的有效率是否相等?
18
182
外用膏药组 118
26
144
4.59
合计
282
44
326
P值
<0.0125 <0.00227 >0.0125
38
第六节 有序分组资料的线性趋势检验
年龄与冠状动脉硬化的关系
年龄(岁) (X)
20~ 30~ 40~
≥ห้องสมุดไป่ตู้0 合计
冠状动脉硬化等级(Y)
— + ++ +++
70 22 4
2
27 24 9
第五节 多个样本率比较的 2 分割法
多个实验组间的两两比较
检验假设:
H0:1
,任两对比组的总体有效率相等
2
H1: 1
,任两对比组的总体有效率不等
2
0.05
36
检验水准调整:
' =
k(k 1) / 2+1
三种疗法治疗周围性面神经麻痹的实例中,检验
水准调整为:
' 0.05 0.05 / 4 0.0125
2 检验的步骤:
H0:1 2,即试验组与对照组降低颅内
压的总体有效率相等
H1:1 2,即试验组与对照组降低颅内
压的总体有效率不等
0.05
20
计算检验统计量
2 (99 21 5 75)2 200 12.86
104 96 174 26
查表作结论 查附表8 的界值表得 P 0.005 。按 0.05 拒
78.13
合计
174
26
200
87.00
基本公式:
2 (A T )2 T
1
18
四格表资料数据格式
组 别 阳性
阴性 合计
A组
a
b (a+b)
B组
c
d (c+d)
合 计 (a+c) (b+d) (n)
四格表专用公式:
2
(ad bc)2 n
(a b)(c d)(a c)(b d)
19
例数
结石部位 总例数
胆固醇 结石
胆红素 结石
其它
胆 囊 118
70
16
32
百分比(%)
胆固醇 结石
胆红素 结石
其它
59.3 13.6 27.1
肝外胆管 75
12
39
24
16.0 52.0 32.0
肝内胆管 29
2
20
7
6.9 69.0 24.1
合 计 222
84
75
63
37.8 33.8 28.4
35
11
假设检验: H0:π1=π2 H1:π1≠π2 α=0.05
计算统计量u :
u p1 p2 S p1 p2
11
S p1 p2
p(1 p)( ) n1 n2
式中 p 为合并样本率。
12
本例 n1=120,p1= 36/120 = 0.30; n2=110,p2= 22/110 = 0.20;
第六章 几种离散型 变量的分布及其应用
第一节 二项分布
1
例6-1 某种药物治疗某种非传染性疾病的有效率为 0.70。今用该药治疗该疾病患者10人,试分别计算 这10人中有6人、7人、8人有效的概率。
2
P(6) 10! 0.706 (1 0.70)106 0.20012 6!(10 6)!
P(7) 10! 0.707 (1 0.70)107 0.26683 7!(10 7)!
=1
(b+c)<40时
本例
2 c
(12 2 1)2 12 2
5.79
,P <0.05。
27
第四节 行×列表资料的 2 检验
1、多个样本率的比较 2、样本构成比的比较 3、双向无序分类资料的关联性检验
专用公式
2 n(
A2 1)
nR nC
自由度ν = (行数-1)(列数-1)
28
多个样本率或两个构成比 比较的2检验
16
表7-1 两组降低颅内压有效率的比较
组别
有效
无效
合计
有效率 (%)
试验组
99
5
104
95.20
对照组
75
21
96
78.13
合计
174
26
200
87.00
17
表7-1 两组降低颅内压有效率的比较
组别
有效
无效
合计
有效率 (%)
试验组 99(90.48) 5(13.52) 104
95.20
对照组 75(83.52) 21(12.48) 96
表7-8 三种疗法有效率的比较
疗法
物理疗法 药物治疗 外用膏药 合计
有效
199 164 118 481
无效
7 18 26 51
合计
206 182 144 532
有效率 (%) 96.60
90.11
81.94
90.41
29
H0:π1 = π2 = π3 ,即三种疗法治疗周围性
面神经麻痹的有效率相等 H1:三种疗法治疗周围性面神经麻痹的有效率
界值: u0.05 2 1.96 u0.01 2 2.58
8
四、样本率与总体率的比较
例 某药治疗某种疾病的有效率为0.70。用该药治 疗该疾病患者10人,结果2人有效。有何结论?
P(X 2) p0 p1 p2 0.0016
假设检验: H0:π = 0.70 H1:π< 0.70
9
例 某药治疗某病患者200人,结果70人有效。计 算总体有效率的95%可信区间。
2. 率的标准误,用来描述样本率的抽样误差,率 的标准误越小,则率的抽样误差就越小。
S p p(1 p) / n
7
三、总体率的区间估计
当n较大、p和1-p均不太小如np和n(1-p)均大于 5时,可利用样本率p的分布近似正态分布来估计 总体率的可信区间。
( p u 2S p , p u 2S p )
表7-2 两种药物治疗脑血管疾病有效率的比较
组别 胞磷胆碱组
有效
无效
46 6
合计 52
有效率 (%)
88.46
神经节苷酯组 18 8(4.67) 26 69.23
合计
64 14
78 82.05
校正:
2 c
3.14
未校正: 2 4.35
24
第二节 配对四格表资料的 2检验
表7-3 两种方法的检测结果
进一步计算列联系数:
C 2
213.16 0.1883
n 2 5801 213.16
结论:两种血型系统间虽然有关联性,但列联 系数数值较小,虽然有统计学意义,仍可认为 关系不太密切。
34
例7-5 某医院肝胆外科在手术中,观察了胆结 石的部位与类型的资料如下,试分析两者间有无关 系?
表7-11 胆结石的类型和部位
3(3 1) / 2 1
对应的临界值:
2 0.0125,1
6.24
37
三种疗法有效率的两两比较
对比组
有效
无效
合计
2值
物理疗法组 199
7
206
药物治疗组 164
18
182
6.76
合计
363
25
388
物理疗法组 199
7
206
外用膏药组 118
26
144
合计
317
33
350
21.32
药物治疗组 164
p = (36+22)/(120+110) = 0.2522;
则:
11
S p1 p2
0.2522(1 0.2522)( ) 0.0573 120 110
u 0.30 0.20 1.745 0.0573
查u界值表得0.05<P<0.10。按α=0.05水准,不拒
绝H0,即尚不能认为该职业人群颈椎病的发病有 性别差异。
13
第七章 2 检 验
Chi-square Test
14
2分布是一种连续型分布,按分布的密
度函数可给出不同自由度的一簇分布曲线。
2分布的形状依赖于自由度的大小;当自由 度趋向于无穷大时, 2分布趋向正态分布。
15
第一节 四格表资料的2 检验
例7-1 某院欲比较异梨醇口服液(试验 组)和氢氯噻嗪+地塞米松(对照组)降低颅 内压的疗效。将200例颅内压增高症患者随机 分为两组,结果见表7-1。问两组降低颅内压 的总体有效率有无差别?
4
从阳性率为π的总体中随机抽取大小为n的样
本,则出现阳性数为X的概率分布即呈二项分布,
记为X~B(n,π),
P(X )
n! X (1 )nX
X !(n X )!
X 0,1, 2,, n
5
中国福利彩票
发行量1500万元,特等奖100个,金额5万元; 每张彩票面值2元,中奖概率1/75000。
( p 1.96Sp , p 1.96Sp )
p 0.35
Sp 0.0362
95%可信区间:( 27.9% ,42.1%)
10
五、两样本率的比较 – 大样本
例6-5 为研究某职业人群颈椎病发病的性别差异, 今随机抽查了该职业人群男性120人和女性110人 ,发现男性中有36人患有颈椎病,女性中有22人 患有颈椎病。试作统计推断。
投入金额 未中概率 中奖概率
100元 1000元 1万元 10万元 100万元 0.99933 0.99336 0.93551 0.51341 0.00127 0.00067 0.00664 0.06449 0.48659 0.99873
6
二、二项分布的性质
1. 当n较大时,只要π不太靠近0或1,二项分布 B(n,π)近似正态分布N(nπ, nπ(1-π)) 。
免疫荧光法
+ - 合计
乳胶凝集法


11(a) 12(b)
2(c) 33(d)
13
45
合计
23 35 58
25
H0:B=C,即两种方法的总体检测 结果相同
H1:B≠C,即两种方法的总体检测 结果不相同
0.05
26
2 (b c)2
bc
=1 (b+c)≥40时
2 c
(b
c 1)2 bc
3
16 23 13 7
9 20 15 14
122 89 41 26
合计
98 63 59 58 278
39