当前位置:文档之家› 8.3.1分类变量与列联表8_3_2 独立性检验--高中数学选择性必修三同步训练(人教A版2019)

8.3.1分类变量与列联表8_3_2 独立性检验--高中数学选择性必修三同步训练(人教A版2019)

8.3.1分类变量与列联表8_3_2 独立性检验--高中数学选择性必修三同步训练(人教A版2019)
8.3.1分类变量与列联表8_3_2 独立性检验--高中数学选择性必修三同步训练(人教A版2019)

8.3列联表与独立性检验

8.3.1 分类变量与列联表

8.3.2 独立性检验

基础过关练

题组一分类变量与列联表

1.(2020河南南阳六校高二下联考)下面是一个2×2列联表:

y1y2合计

x135 a 70

x215 15 30

合计50 b 100

其中a,b处填的值分别为.

2.根据如图所示的等高堆积条形图可知吸烟与患肺病关系(填“有”或“没有”).

3.某学校对高三学生进行了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高堆积条形图,利用条形图判断该校高三学生考前心情紧张与性格类型是否有关系.

题组二独立性检验及其应用

4.下列说法中不正确的是( )

A.独立性检验是检验两个分类变量是否有关的一种统计方法

B.独立性检验得到的结论一定是正确的

C.独立性检验的样本不同,其结论可能不同

D.独立性检验的基本思想是带有概率性质的反证法

5.(2020陕西榆林高二下阶段测试)在一项中学生近视情况的调查中,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时最有说服力的方法是( )

A.平均数与方差

B.回归分析

C.独立性检验

D.概率

6.某学校食堂对30名高三学生偏爱蔬菜与偏爱肉类进行了一次调查,将统计数据制成如下表格:

偏爱蔬菜偏爱肉类男生/人 4 8

女生/人16 2

则认为偏爱蔬菜与偏爱肉类与性别有关的把握至少有( )

附:χ2=n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

,n=a+b+c+d.

α0.01 0.005 0.001 xα 6.635 7.879 10.828 A.95% B.99%

C.99.5%

D.99.9%

7.(2020广东清远阳山中学高二下教学质量检测)在独立性检验中,统计量χ2有两个临界值:3.841和6.635.当χ2≥3.841时,至少有95%的把握说明两个事件有关,当χ2≥6.635时,至少有99%的把握说明两个事件有关,当χ2<3.841时,认为两个事件无关.在一项打鼾与患心脏病的调查中,共调查了2 000人,经计算χ2=20.87.根据这一数据分析,我们可认为打鼾与患心脏病之间是的(填“有关”或“无关”).

8.某校数学课外兴趣小组为研究数学成绩是否与性别有关,统计了本校高三年级

每名学生一学期数学成绩的平均分(采用百分制),剔除平均分在40分以下的学生后,共有男生300名,女生200名.现采用分层随机抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生的成绩分为6组,得到下表.

分数段性别[40,

50)

[50,

60)

[60,

70)

[70,

80)

[80,

90)

[90,

100]

男/人 3 9 18 15 6 9

女/人 6 4 5 10 13 2

(1)估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果判断数学成绩与性别是否有关;

(2)规定成绩在80分以上为优秀(含80分),请你根据已知条件补全所列的2×2

列联表,并依据α=0.1的独立性检验,分析数学成绩与性别是否有关.

单位:人

优秀非优秀合计男生

女生

合计

附表及公式:

α0.1 0.05 0.01 0.001 xα 2.706 3.841 6.635 10.828

χ2=n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

,其中n=a+b+c+d.

9.某校在高一部分学生中调查男女同学对某项体育运动的喜欢情况,其二维条形图如图(黑色代表喜欢,白色代表不喜欢).

(1)写出2×2列联表;

(2)依据α=0.01的独立性检验,分析喜欢这项体育运动是否与性别有关;

(3)在这次调查中,从喜欢这项体育运动的一名男生和两名女生中任选两人进行专业培训,求恰是一男一女的概率.

附表及公式:

α0.1 0.05 0.01 0.001

xα 2.706 3.841 6.635 10.828

χ2=n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

,其中n=a+b+c+d.

10.(2020重庆第八中学高三下月考)某企业有甲、乙两套设备生产同一种产品,为了检测两套设备的生产质量情况,随机从两套设备生产的大量产品中各抽取了50件产品作为样本,检测一项质量指标值,若该项质量指标值落在[100,120)内,则为合格品,否则为不合格品.现得到相关统计情况如下:

甲套设备的样本的频率分布直方图

乙套设备的样本的频数分布表

质量指标值[95,

100)

[100,

105)

[105,

110)

[110,

115)

[115,

120)

[120,

125]

频数 1 6 19 18 5 1

(1)根据上述所得统计数据,计算产品的合格率,并对两套设备的优劣进行比较;

(2)填写下面的列联表,并依据α=0.05的独立性检验,分析该企业生产的这种产品的质量指标值与甲、乙两套设备的选择是否有关.

单位:件

甲设备乙设备合计合格品

不合格品

合计

附表及公式:

α0.1 0.05 0.01 0.001

xα 2.706 3.841 6.635 10.828

χ2=n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

,其中n=a+b+c+d.

能力提升练

题组一独立性检验及其应用

1.(2020江西吉安、抚州、赣州高三联考,)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A100天的日落和夜晚天气,得到如下2×2列联表:

夜晚天气

下雨未下雨日落云里走

出现25 5

未出现25 45

附表:

α0.1 0.05 0.01 0.001

xα 2.706 3.841 6.635 10.828

经计算得到χ2≈19.05,下列对地区A天气的判断不正确的是( )

A.夜晚下雨的概率约为1

2

B.未出现“日落云里走”时夜晚下雨的概率约为5

14

C.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关

D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨

2.(2020广东深圳中学高二月考,)2019年10月18日至27日,第七届世界军人运动会在湖北武汉举办,中国代表团共获得133金64银42铜,共239枚奖牌.为了调查各国参赛人员对主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如下表所示:

单位:人

男性运动员女性运动员对主办方表示满意200 220

对主办方表示不满意50 30

现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意

的男性运动员的概率为1

2

;②在犯错误的概率不超过1%的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;③没有99.9%的把握认为“是否对主办方表示满意与运动员的性别有关”.则正确说法的个数为( )

A.0

B.1

C.2

D.3

附:χ2=n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

,x0.01=6.635.

题组二独立性检验的综合应用

3.(2020山东临沂高二下期中联考,)在贯彻中共中央、国务院关于精准扶贫政

策的过程中,某单位在某市定点帮扶某村100户贫困户.为了做到精准帮扶,工作

组对这100户村民的年收入情况、危旧房情况、患病情况等进行调查,并把调查

结果转化为各户的贫困指标x.将指标x按照

[0,0.2),[0.2,0.4),[0.4,0.6),[0.6,0.8),[0.8,1.0]分成五组,得到如图所示的

频率分布直方图.规定若0≤x<0.6,则认定该户为“绝对贫困户”,否则认定该户

为“相对贫困户”;当0≤x<0.2时,认定该户为“亟待帮助户”.工作组又对这

100户家庭的受教育水平进行评测,家庭受教育水平分为“良好”与“不好”两种.

(1)完成下面的列联表,并依据α=0.05的独立性检验,分析绝对贫困户数与受教

育水平不好是否有关;

单位:户受教育水平良好受教育水平不好合计绝对贫困户 2

相对贫困户52

合计100

(2)上级部门为了调查这个村的特困户分布情况,在贫困指标处于[0,0.4)的贫困

户中,随机选取两户,用X表示所选两户中“亟待帮助户”的户数,求X的分布列

和数学期望E(X).

附:χ2=n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

,其中n=a+b+c+d.

α 0.1 0.05 0.01 x α

2.706

3.841

6.635

4.(2020湖南株洲第二中学高二下期中,)某班级数学兴趣小组为了研究人脚的

大小与身高的关系,随机抽测了20位同学,得到如下数据:

序号 1

2

3 4

5

6 7 8 9

10

身高x(厘米)

192 164 172 177 176

159 171 166 182 166 脚长y(码) 48

38 40 43

44 37

40

39

46

39

序号 11 12 13 14 15 16 17 18 19 20

身高x(厘米)

169 178 167 174 168

179 165 170 162 170 脚长y(码) 43

41 40 43

40

44

38

42

39

41

(1)若身高大于175厘米为“高个”,身高小于或等于175厘米为“非高个”;脚长大于42码为“大脚”,脚长小于或等于42码为“非大脚”.请根据上表数据作出2×2列联表,求出χ2的值(结果精确到小数点后三位),并说明有多大的把握认为人脚的大小与身高有关系;

(2)请根据序号为5的倍数的几组数据,求出y 关于x 的经验回归方程y ^

=b ^

x+a ^

. 附表及公式:

α 0.1 0.05 0.01 0.005 0.001 x α

2.706

3.841

6.635

7.879

10.828

χ2

=n (ad -bc )

2

(a+b )(c+d )(a+c )(b+d )

,其中n=a+b+c+d,

b ^

=

∑i=1

n

(x i -x )(y i -y )∑i=1

n

(x i -x )

2

,a ^

=y -b ^

x .

5.(2019甘肃天水一中高二上学期期末,)《中华人民共和国道路交通安全法》

第47条规定:“机动车行经人行横道时,应当减速行驶;遇行人正在通过人行横道,应当停车让行.机动车行经没有交通信号的道路时,遇行人横过道路,应当避让.”俗称“礼让斑马线”.下表是某市一主干路口监控设备所抓拍的5个月内驾驶员不“礼让斑马线”行为的统计数据:

月份x 1 2 3 4 5 违章驾驶员人数y

120

105

100

90

85

(1)请利用所给数据求违章驾驶员人数y 与月份x 之间的经验回归方程y ^

=b ^

x+a ^

; (2)交警从这5个月内通过该路口的驾驶员中随机抽查了50人,调查驾驶员“礼让斑马线”行为与驾龄的关系,并得到如下2×2列联表:

单位:人

不礼让斑马线

礼让斑马线

合计 驾龄不超过1年 22 8 30 驾龄1年以上

8 12 20 合计

30

20

50

依据α=0.025的独立性检验,分析“礼让斑马线”行为与驾龄是否有关. 参考公式及数据: b ^

=

∑i=1n

x i y i -nx y

∑i=1

n

x i 2-nx 2=

∑i=1

n

(x i -x )(y i -y )

∑i=1

n

(x i -x )

2

,a ^

=y -b ^

x .

α 0.1 0.05

0.025

0.01 0.005 0.001 x α

2.706

3.841 5.024 6.635

7.879

10.828

χ2

=n (ad -bc )

2

(a+b )(c+d )(a+c )(b+d )

,其中n=a+b+c+d.

答案全解全析

8.3 列联表与独立性检验

8.3.1 分类变量与列联表

8.3.2 独立性检验

基础过关练

1.答案35,50

解析由a+35=70,得a=35,由a+15=b,得b=50.

2.答案有

解析从等高堆积条形图上可以明显地看出吸烟患肺病的频率远远大于不吸烟患肺病的频率,所以吸烟与患肺病有关系.

3.解析作列联表如下:

单位:人

性格内向性格外向合计

考前心情紧张332 213 545

考前心情不紧

94 381 475

合计426 594 1 020

相应的等高堆积条形图如图所示:

图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张的样本中性格内向占的比例高,可以认为该校高三学生考前心情紧张与性格类型有关.

4.B 独立性检验是检验两个分类变量是否有关的一种统计方法,只是在一定的可信度下进行判断,不一定正确,会因为样本不同导致结论可能不同,带有反证法思想.

故选B.

5.C 判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.

6.C 由已知,2×2列联表为

偏爱蔬菜偏爱肉类合计

男生/人 4 8 12

女生/人16 2 18

合计20 10 30

则χ2=30×(4×2-16×8)2

12×18×20×10

=10>7.879=x0.005,故至少有99.5%的把握认为偏爱蔬菜与偏爱

肉类与性别有关,故选C.

7.答案有关

解析χ2=20.87>6.635时,至少有99%的把握认为打鼾与患心脏病有关.

8.解析(1)x

=45×0.05+55×0.15+65×0.3+75×0.25+85×0.1+95×0.15=71.5,

x

=45×0.15+55×0.1+65×0.125+75×0.25+85×0.325+95×0.05=71.5,

从男、女生各自的平均分来看,数学成绩与性别无关.

(2)由题表可知,在抽取的100名学生中,男生组中成绩优秀的有15人,女生组中

成绩优秀的有15人,据此可得2×2列联表如下:

单位:人

优秀非优秀合计

男生15 45 60

女生15 25 40

合计30 70 100

零假设为H0:数学成绩与性别无关.计算可得

χ2=100×(15×25-15×45)2

30×70×60×40

≈1.79<2.706=x0.1.依据α=0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为数学成绩与性别无关.

9.解析(1)观察二维条形图可得,

经调查的男生总共45人,其中喜欢这项运动的有15人,不喜欢的有30人;

经调查的女生总共45人,其中喜欢这项运动的有5人,不喜欢的有40人.

由此写出列联表如下:

单位:人

喜欢不喜

合计

男15 30 45

女 5 40 45

合计20 70 90 (2)零假设为H0:喜欢这项体育运动与性别无关.计算可得

χ2=90×(15×40-30×5)2

45×45×20×70

≈6.429<6.635=x0.01,

所以依据α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成

立,即认为喜欢这项体育运动与性别无关.

(3)设喜欢这项体育运动的一名男生和两名女生分别为A,B,C.

任选两人的情况为(A,B),(A,C),(B,C),

选一名男生和一名女生的情况为(A,B),(A,C),

所以P=2

3

,

即恰是一男一女的概率为2

3

.

10.解析(1)甲设备生产的产品的合格率为1-(0.008+0.020)×5=0.86,乙设备生

产的产品的合格率=1-2

50

=0.96,

从合格率可以看出,乙设备比甲设备好一些. (2)列联表如下:

单位:件

甲设备 乙设备 合计 合格品 43 48 91 不合格品 7 2 9 合计

50

50

100

零假设为H 0:该企业生产的这种产品的质量指标值与甲、乙两套设备的选择无关.计算可得 χ2

=

100×(43×2-48×7)

2

91×9×50×50

≈3.053<3.841=x 0.05,依据α=0.05的独立性检验,没有充分证

据推断H 0不成立,因此可以认为H 0成立,即认为该企业生产的这种产品的质量指标值与甲、乙两套设备的选择无关.

能力提升练

1.D 用频率估计概率可得,夜晚下雨的概率约为25+25100

=12,故A 判断正确;

未出现“日落云里走”时夜晚下雨的概率约为

25

25+45=5

14

,故B 判断正确;

由χ2≈19.05>10.828,可得有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,故C 判断正确,D 判断不正确.故选D. 2.B 任取1名参赛人员,抽到对主办方表示满意的男性运动员的概率为200500=25

,故

①错误; χ2

=

500×(200×30-50×220)

2

420×80×250×250

≈5.952<6.635=x 0.01,故②错误,③正确.故选B.

3.解析 (1)由题意可知,绝对贫困户有(0.25+0.50+0.75)×0.2×100=30(户),可得出如下列联表:

单位:户

受教育水平 良好 受教育水平 不好 合计 绝对贫困户 2 28 30 相对贫困户 18 52 70 合计

20

80

100

零假设为H 0:绝对贫困户数与受教育水平不好无关.计算可得χ2

=

100×(2×52-18×28)

2

30×70×20×80

≈4.762>3.841=x 0.05.

依据α=0.05的独立性检验,推断H 0不成立,即认为绝对贫困户数与受教育水平不好有关.

(2)贫困指标在[0,0.4)的贫困户共有(0.25+0.5)×0.2×100=15(户), “亟待帮助户”共有0.25×0.2×100=5(户), 依题意X 的可能取值为0,1,2, P(X=0)=

C 102C 152=37

,P(X=1)=

C 101C 51

C 15

2=10

21

,P(X=2)=

C 5

2C 152=2

21

,

则X 的分布列为

X 0 1 2

P

3

7

1021 221

故E(X)=0×3

7

+1×10

21

+2×221=2

3

.

4.解析 (1)根据题意,列出2×2列联表如下:

单位:人

高个 非高个 合计 大脚 5 2 7 非大脚 1 12 13 合计

6

14

20

由表中数据,得χ2

=

20×(5×12-1×2)2

6×14×13×7

≈8.802>7.879=x 0.005,

所以有99.5%的把握认为人脚的大小与身高有关系. (2)序号为5的倍数的数据有4组:

x 1=176,y 1=44,x 2=166,y 2=39,x 3=168,y 3=40,x 4=170,y 4=41, 则x =1

4×(176+166+168+170)=170,y =1

4

×(44+39+40+41)=41,

所以b ^

=

(176-170)×(44-41)+(166-170)×(39-41)+(168-170)×(40-41)+(170-170)×(41-41)

(176-170)2

+(166-170)2

+(168-170)2

+(170-170)

2

=

12

,a ^=y -b ^

x =41-1

2

×170=-44,

从而y 关于x 的经验回归方程是y ^=12

x-44. 5.解析 (1)由题表中数据得,x =3,y =100,

∑i=1

5

x i 2=55,∑i=1

5

x i y i =1 415,

∴b ^

=

∑i=15

x i y i -5x y ∑i=1

5

x i 2-5x 2=

1 415-1 500

55-45

=-8.5,

∴a ^=y -b ^

x =125.5,∴所求的经验回归方程为y ^

=-8.5x+125.5. (2)零假设为H 0:“礼让斑马线”行为与驾龄无关.由题表中的数据得χ2

=

50×(22×12-8×8)2

30×20×30×20

=50

9

≈5.556>5.024=x 0.025,

依据α=0.025的独立性检验,推断H 0不成立,即认为“礼让斑马线”行为与驾龄有关.

2020_2021学年高中数学课时素养评价三1.2.2~1.2.4独立性检验独立性检验的基本思想独立

课时素养评价三独立性检验独立性检验的基本思想独立性检验 的应用 (20分钟·50分) 一、选择题(每小题5分,共20分) 1.经过对χ2的研究,得到了若干个临界值,当χ2≤ 2.706时,我们认为事件A与B ( ) A.有95%的把握认为A与B有关系 B.有99%的把握认为A与B有关系 C.没有充分理由说明事件A与B有关系 D.不能确定 【解析】选C.当χ2>2.706时,有90%以上的把握说明A与B有关系,但当χ2≤2.706时,只能说明A与B是否有关系的理由不够充分. 2.利用独立性检验的方法调查高中生性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用2×2列联表,由计算可得χ2≈7.245,参照下表:得到的正确结论是( ) P(χ2≥x0) 0.01 0.05 0.025 0.010 0.005 0.001 x0 2.706 3.841 5.024 6.635 7.879 10.828 A.有99%以上的把握认为“爱好该项运动与性别无关” B.有99%以上的把握认为“爱好该项运动与性别有关” C.有95%的把握认为“爱好该项运动与性别有关” D.有95%的把握认为“爱好该项运动与性别无关” 【解析】选B.由χ2≈7.245>6.635,可得有99%以上的把握认为“爱好该项运动与性别有关”. 3.为了研究性格和血型的关系,抽查80人试验,血型和性格情况如下:O型或A型者是内向型的

有18人,外向型的有22人,B型或AB型是内向型的有12人,外向型的有28人,则有多大的把握认为性格与血型有关系( ) A.95% B.99% C.没有充分的证据显示有关 D.1% 【解析】选C. χ2=错误!未找到引用源。=1.92<2.706,所以没有充分的证据显示有关. 4.以下关于独立性检验的说法错误的是( ) A.独立性检验依赖小概率原理 B.独立性检验得到的结论一定正确 C.样本不同,独立性检验的结论可能有差异 D.独立性检验不是判定两事物是否相关的唯一方法 【解析】选B.受样本选取的影响,独立性检验得到的结论不一定正确. 二、填空题(每小题5分,共10分) 5.以下三个命题中:①在回归分析中,可用相关系数r的值判断模型的拟合效果,|r|(|r|≤1)越大,模拟的拟合效果越好;②在一组样本数据(x1,y1),(x2, y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)的散点图中,若所有样本点(x i, y i)(i=1,2,…,n)都在直线y=-错误!未找到引用源。x+1上,则这组样本数

假设检验的类型

假设检验的类型 ——方差分析& 检验2

目录 一、方差分析 1.原理 2.步骤 3.实例 二、检验 1.原理 2.实例2

1.原理 (1)应用背景 在许多实际问题的统计分析中,我们不仅要讨论两个总体均值相等的假设检验问题,而且还要讨论两个以上总体的均值是否相等的假设检验问题,在这种情况下,我们就选择方差分析的方法来检验这些样本的平均数差异的显著程度。 (2)应用条件(运用方差分析方法需要满足的假定) ①观察对象来自所研究因素的各个水平之下的独立随机抽样;②每个水平下的样本都取自正态分布的总体;③各个总体有相同的方差。2 独立性正态性 方差齐性

1.原理 (3)基本原理 假定容量为n的k个样本取自同一总体。用k个样本的方差估计总体的方差;用全体k个样本的所有元素作为一个样本(样本和),并依此估算总体的方差,如果“原假设”成立,这两个估计值应该十分接近,如果这两个估计值相差很大,这k个样本就不可能都取自同一个总体。 因为方差分析用两个方差的估计值的比F作单侧检验,所以这种方法又称F 检验。检验用F分布进行。

2.步骤 (1)建立方差分析的数学模型; (2)确定各个总体是否服从正态分布,且具有相等的方差; (3)建立检验用的原假设和备择假设,给出显著水平; (4)计算总体方差的估计值和统计量F ; (5)根据F 做出判断。2

3.实例 1)研究目的 为了研究学生学习数学的成绩是否受教师教学水平的影响,现将一个数学提高班的学生分成三个小班,分别由甲、乙、丙三位教师任教。三个班各随机抽取五个学生的最终成绩见表。假定三个学生的最终成绩服从正态分布,试问三个班学生的最终成绩是否存在显著的差异?如果有差异,应推举哪位教师担任此班教学使教学效果最好(α=0.05)?

高中数学 怎样进行独立性检验(b版)解题方法谈

怎样进行独立性检验(B 版) 一、独立性检验的基本思想 独立性检验的基本思想类似于数学中的反证法.其目的是为了确认“两个分类变量有关系”这一结论成立的可信程度.它首先假设结论不成立,即“两个分类变量没有关系”成立,在该假设下,构造的随机变量2X 的值应该很小.如果由观测数据计算得到的2X 的观测值很大,则在一定程度上说明假设不合理.因此可以根据随机变量2X 的含义来确定该假设不合理的程度.如果2X >6.635,则说明该假设不合理的程度是99%,从而可认为“两个分类变量有关系”这一结论成立的可信程度为99%. 二、独立性检验的相关概念 1.2×2列联表 一般地,如果有两个分类变量X 和Y ,它们的值域分别是1212{}{}x x y y ,,,,它们的样本频数列联表(见下表)称为2×2列联表. 2. 2X 统计量 2X 统计量是统计学中的一个非常有用的统计量,它是根据概率的统计定义和事件的独 立性得到的,其计算公式是2 2 112212211212 ()n n n n n n n n n ++++-=X .利用它的大小可以决定是否拒绝原来 的统计假设,如果计算出的2X 值较大,就拒绝假设;如果2 X 值较小,就接受假设. 3.临界值 通过对2 X 统计量分布和大量的试验数据的研究,已经得到了一些临界值,其中比较常用的有两个:3.841和6.635.在对具体问题进行独立性检验时,把计算出的2 X 值与以上两个临界值进行对比,从而确定两个事件的关系. 三、独立性检验步骤 使用2 X 统计量作2×2列联表的独立性检验的步骤是: (1)检查2×2列联表中的数据是否符合要求;

高二数学1-2 独立性检验

独立性检验 教学重点、独立性检验的基本方法,独立性检验的步骤 难点:.基本思想的领会及方法应用. 知识点 一、独立性检验的基本概念和原理 独立性检验是研究相关关系的方法。 1.分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量.比如男女、是否吸烟、是否患癌症,宗教信仰、国籍等等。 2列联表:分类变量的汇总统计表(频数表). 一般我们只研究每个分类变量只取两个 3.条形图 为了更清晰地表达这个特征,我们还可用如下的等高条形图表示两种情况下患肺癌的比例.如图3.2一3 所示,在等高条形图中,浅色的条高表示不患肺癌的百分比;深色的条高表示患肺癌的百分比. 通过分析数据和图形,我们得到的直观印象是“吸烟和患肺癌有关”.那么我们是否能够以一定的把握认为“吸烟与患肺癌有关”呢? 4.独立性检验的步骤 为了回答下面问题,我们先假设H :吸烟与患肺癌没有关系,看看能够得到什么样 的结论。 不患肺癌患肺癌合计不吸烟 a b a+b 吸烟 c d c+d 合计a+c b+d a+b+c+d 样本容量 n=a+b+c+d 如果“吸烟与患肺癌没有关系”,则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:

()()() ()()()() 2 2 0a c a c d c a b ad b c a b c d ad bc ad bc n ad bc k a b c d a c b d n a b c d ≈?+≈+?-≈++---= ++++=+++因此 : 越小, 说明吸烟与患肺癌之间关系越弱. 越大, 说明吸烟与患肺癌之间关系越强构造随机变量 其中 为样本容量 若 H 0 成立,即“吸烟与患肺癌没有关系”,则 K “应该很小.根据表3一7中的数据,利用公式(1)计算得到 K “的观测值为 ()2 2 996577754942209956.63278172148987491 K ?-?=≈???, 这个值到底能告诉我们什么呢? 统计学家经过研究后发现,在 H 0成立的情况下, 2( 6.635)0.01P K ≥≈. (2) (2)式说明,在H 0成立的情况下,2 K 的观测值超过 6. 635 的概率非常小,近似为0 . 01, 是一个小概率事件.现在2 K 的观测值k ≈56.632 ,远远大于6. 635,所以有理由断定H 0 不成立,即认为“吸烟与患肺癌有关系”.但这种判断会犯错误,犯错误的概率不会超过0.01,即我们有99%的把握认为“吸烟与患肺癌有关系” . 在上述过程中,实际上是借助于随机变量2 K 的观测值k 建立了一个判断H 0是否成立的规则: 如果k ≥6. 635,就判断H 0不成立,即认为吸烟与患肺癌有关系;否则,就判断H 0成立,即认为吸烟与患肺癌没有关系. 在该规则下,把结论“H 0 成立”错判成“H 0 不成立”的概率不会超过 2( 6.635)0.01P K ≥≈, 即有99%的把握认为H 0不成立. 假设检验 备择假设H 1 不成立的前提下进行推理 10成立 推出有利于H 1成立的小概率事件(概率不超过α的事件)发 生,意味着H 1成立的可能性(可能性为(1-α))很大 下任上例的解决步骤 第一步:提出假设检验问题 H 0:吸烟与患肺癌没有关系? H 1:吸烟与患肺癌有关系 第二步:选择检验的指标 2 2 ()K ()()()() n ad bc a b c d a c b d -=++++ (它越小,原假设“H 0:吸烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H 1:吸烟与患肺癌有关系”成立的可能性越大. 第三步:查表得出结论

假设检验的基本步骤

假设检验的基本步骤 (三)假设检验的基本步骤 统计推断 1.建立假设检验,确定检验水准 H0和H1假设都是对总体特征的检验假设,相互联系且对立。 H0总是假设样本差别来自抽样误差,无效/零假设 H1是来自非抽样误差,有单双侧之分,备择假设。 检验水准,a=0.05 检验水准的含义 2.选定检验方法,计算检验统计量 选择和计算检验统计量要注意资料类型和实验设计类型及样本量的问题, 一般计量资料用t检验和u检验; 计数资料用χ2检验和u检验。 3.确定P值,作出统计推理 P≤a ,拒绝H0,接受H1 P> a,按a=0.05水准,不拒绝H0,无统计学意义或显著性差异 假设检验结论有概率性,无论使拒绝或不拒绝H0,都有可能发生错误 (四)两均数的假设检验(各种假设检验方法的适用条件及假设的特点、计算公式、自由度确定以及确定概率P值并做出推断结论) u检验适用条件 t检验适用条件 t检验和u检验 1.样本均数与总体均数比较 2.配对资料的比较/成组设计的两样本均数的比较 配对设计的情况:3点 3. 两个样本均数的比较 (1)两个大样本均数比较的u检验 (2)两个小样本均数比较的t检验 (五)假设检验的两类错误及注意事项(Ⅰ和Ⅱ类错误) 1.两类错误 拒绝正确的H0称Ⅰ型错误-弃真,用检验水准α表示,α=0.05,犯I型错误概率为0.05,理论上平均每100次抽样有5次发生此类错误; 接受错误的H0称Ⅱ型错误-存伪。用β表示,(1-β)为检验效能或把握度,意义为两总体有差异,按α水准检出差别的能力,1-β=0.9,若两总体确有差别,理论上平均每100次抽样有90次得出有差别的结论。 两者的关系:α愈大β愈小;反之α愈小β愈大。 2.假设检验中的注意事项 (1)随机化:代表性和均衡可比性 (2)选用适当的检验方法 (3)正确理解统计学意义 (4)结论不绝对 (5)单侧与双侧检验的选择 四.分类变量资料的统计描述

关于假设检验中检验统计量的选择及拒绝域的确定问题

关于假设检验中检验统计量的选择及拒绝域的确定问题 假设检验是根据样本所提供的信息检验假设是否成立的一种统计推断方法。在检验之前总体参数未知,先对总体参数提出一个假设的值,然后根据样本所提供的信息检验假设是否成立。 在假设检验中,如何根据已知条件选择检验统计量,并确定拒绝域和临界值,是非常重要的两个环节。学员在理解时容易出现混淆。 一、 根据已知条件选择检验统计量 这里要注意,样本均值x 的分布与根据样本均值及总体方差(或样本方差)构造的检验统计量的分布是两个不同的概念。根据抽样分布的理论,只要总体服从正态分布,那么,无论是大样本,还是小样本,其样本均值的分布均服从正态分布;如果总体的分布是非正态分布,在大样本情况下,其样本均值的分布仍服从正态分布,小样本的样本均值的分布则服从非正态分布。 但是,检验统计量的分布则不然。 (一) 对于小样本量 分两种情况: 1、在总体是正态分布的情况下,如果总体方差未知、小样本(n<30),检验统计量n s x /0 μ-的分布服从t 分布; 2、在总体服从非正态分布、小样本的情况下,检验统计量的分布也服从t 分布。 由于一般情况下总体方差未知,需要用样本方差来代替,所以,一般准则是:小样本量时用t 检验。 (二) 对于大样本量 在大样本量( 30≥n )的情况下,检验统计量的分布与样本均值的分布相同,服从正态分布,这一点比较容易理解。所以,概括来说,大样本量时用Z 检验。 选择用t 检验还是Z 检验,直接关系到选择t 临界值还是Z 临界值。 二、 拒绝域和临界值的确定 应结合分布的图形来理解接受域、拒绝域以及临界值。 (一)对于双侧检验 一般在双侧检验时,使用正态分布对总体均值进行检验,拒绝域为:2αZ Z >或 2αZ Z -<(或2αZ Z >) ;使用t 分布进行检验,拒绝域为:2αt t >或2αt t -<,(或2αt t >) ;使用2χ分布进行检验时(对总体方差的检验),若检验的统计量222αχ>χ或2122αχχ-<时,拒绝原假设。注意,这里使用的是 2α,因为双侧检验中有两个拒绝域,各占2 α。只要满足其中一个拒绝域,即可拒绝原假设。

高中数学 选修1-2 3.独立性检验

3.独立性检验 教学目标 班级____姓名________ 1.了解分类变量、列联表、随机变量2 K . 2.了解独立性检验的基本思想和方法. 教学过程 一、知识要点. 1.分类变量:变量不同的值表示个体所属的类别不同. 2.列联表:两个分类变量的频数表. 3.随机变量:) )()()(()(22 d b c a d c b a bc ad n K ++++-=,010.0)635.6(2 ≈≥K P (小概率事件) 4.独立性检验:运用统计分析的方法确定分类变量的关系. (1)要判断“两个分类变量有关系”; (2)假设结论不成立,即“0H :两个分类变量没有关系”; (3)确定一个判断规则的临界值0k :当02k K ≥时,认为“两个分类变量有关系”,否则认为“两个分类变量没有关系”;(0k 是根据允许误判概率的上限来确定的) (4)按照上述规则,误判概率为)(02k K P ≥. 0k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82 )(02k K P ≥ 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 (5)拓展: ①令|| d c c b a a W +-+=,则) )(() )((22d b c a d c b a n W K ++++?=; ②令) )(() )((00d c b a n d b c a k w ++++? = ; ③02 k K ≥等价于0w W ≥,所以)(0w W P ≥等价于)(02 k K P ≥; ④可以用)(0w W P ≥来作为判断依据. 二、例题分析. 例1:研究吸烟与患肺癌的关系. 1.确定研究对象:吸烟与患肺癌的关系.

假设检验中两种类型错误的关系

假设检验中两种类型错误之间的关系 (一) α与β是在两个前提下的概率。α是拒绝H0时犯错误的概率(这时前提是“H0为真”);β是接受H0时犯错误的概率(这时“H0为假”是前提),所以α+β不一定等于1。结合图7—2分析如下: 图7-2 α与β的关系示意图 如果H0:μ1=μ0为真,关于与μ0的差异就要在图7—2中左边的正态分布中讨论。对于某一显著性水平α其临界点为。(将两端各α/2放在同一端)。 右边表示H0的拒绝区,面积比率为α;左边表示H0的接受区,面积比率为1-α。在“H0为真”的前提下随机得到的落到拒绝区时我们拒绝H0是犯了错误的。由于落到拒绝区的概率为α,因此拒绝“H0为真”时所犯错误(I型)的概率等于α。而落到H0的接受区时,由于前提仍是“H0为真”,因此接受H0是正确决定,落在接受区的概率为1-α,那么正确接受H0的概率就等于1-α。如α=0.05则1-α=0.95,这0.05和0.95均为“H0为真”这一前提下的两个概率,一个指犯错误的可能性,一个指正确决定的可能性,这二者之和当然为1。但讨论β错误时前提就改变了,要在“H0为假”这一前提下讨论。对于H0是真是假我们事先并不能确定,如果H0为假、等价于H l为真,这时需要在图7—2中右边的正态分布中讨论·(H1:μ1>μ0),它与在“H0为真”的前提下所讨论的相似,落在临界点左边时要拒绝H l (即接受H0),而前提H l为真,因而犯了错误,这就是II型错误,其概率为β。很显然,当α=0.05时,β不一定等于0.95。

(二)在其他条件不变的情况下,α与β不可能同时减小或增大。这一点从图7—2也可以清楚看到。当临界点向右移时,α减小,但此时β一定增大;反之向左移则α增大β减小。一般在差异检验中主要关心的是能否有充分理由拒绝H0,从而证实H l,所以在统计中规定得较严。至于β往往就不予重视了,其实许多情况需要在规定的同时尽量减小β。这种场合最直接的方法是增大样本容量。因为样本平均数分布的标准差为,当n增大时样本平均数分布将变得陡峭,在α和其他条件不变时β会减小(见图7—3)。 (三)在图7—2中H l为真时的分布下讨论β错误已指出落到临界点左边时拒绝H l所犯错误的概率为β。那么落在临界点右边时接受H l则为正确决定,其概率等于1一β。换言之,当H l为真,即μ1与μ0确实有差异时(图7—2中,μ1与μ0的距离即表示μ1与μ0的真实差异),能以(1—β)的概率接受之。 图7-3 不同标准差影响β大小示意图 如图7—2所示,当α以及其他条件不变时,减小μ1与μ0的距离势必引起β增大、(1一β)减小,也就是说,其他条件不变,μ1与μ0真实差异很小时,正确

高中数学选修1-2《独立性检验基本思想及其初步应用》教案

高中数学选修1-2《独立性检验基本思想及其初步应用》教案 High school mathematics elective 1-2 "basic idea of independe nce test and its preliminary application" teaching plan

高中数学选修1-2《独立性检验基本思想及 其初步应用》教案 前言:数学是研究数量、结构、变化、空间以及信息等概念的一门学科,从某种角 度看属于形式科学的一种,在人类历史发展和社会生活中,数学发挥着不可替代的 作用,是学习和研究现代科学技术必不可少的基本工具。本教案根据数学课程标准 的要求和教学对象的特点,将教学诸要素有序安排,确定合适的教学方案的设想和 计划、并以启迪发展学生智力为根本目的。便于学习和使用,本文档下载后内容可 按需编辑修改及打印。 教学要求:通过探究“吸烟是否与患肺癌有关系”引出 独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性. 教学重点:理解独立性检验的基本思想及实施步骤. 教学难点:了解独立性检验的基本思想、了解随机变量 的含义. 教学过程: 教学过程: 一、复习准备: 独立性检验的基本步骤、思想

二、讲授新课: 1.教学例1: 例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效? ① 第一步:教师引导学生作出列联表,并分析列联表,引导学生得出“秃顶与患心脏病有关”的结论; 第二步:教师演示三维柱形图和二维条形图,进一步向学生解释所得到的统计结果; 第三步:由学生计算出的值; 第四步:解释结果的含义. ② 通过第2个问题,向学生强调“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其它的证据表明可以进行这种推广.

高中数学教学案例分析(独立性检验)

高中数学人教A版选修2-3第三章3.2独立性检验的基本思 想及其初步应用教学设计 一、教材分析 本节课是人教A版(选修)2—3第三章第二单元第二节第一课时的内容.在本课之前,学生已经学习过事件的相互独立性、正态分布及回归分析的基本思想及初步应用。本节课利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节,也是高考的重要考点。 在本节课的教学中,要把重点放在独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤。在独立性检验中,通过典型案例的研究,介绍了独立性检验的基本思想、方法和初步应用。独立性检验的基本思想和反证法类似,它们都是假设论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的。因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据。 学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用”。在大数据时代,我们每天都会接触到影响生活的统计方面的信息,因此具备一些统计知识已经成为现代人已具备的一种数学素养。 二、学情分析 授课对象:高二理科15班(重二班)。 知识上:学生已经学习过统计、变量回归分析等知识,这为本节课的学习提供了知识基础。但本节课的内容独立性检验对学生来说是新的内容,为什么有这么一个方法?为什么要学习这个方法?通过课前的新闻引入可以让学生体会到本节课知识的应用性。独立性检验相当于建立一个判别“两个分类变量之间有关系”这一结论是否成立的规则,并且给出该规则把“两个分类变量之间没有有关系”错判成“两个分类变量之间有关系”的概率。所以首先要教会学生的是了解并初步理解这个规则,而后才是会用这个规则解决问题。 能力方面:学生具备了一定的认知、分析、归纳能力;能够进行小组活动。 但学生缺少深入探究问题的方法;运算能力和语言表达能力有待提高。针对这个问题,课堂上我通过适时引导学生探究,鼓励学生积极展示来解决。

假设检验习题

第6章 假设检验练习题 选择题 1. 对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程称为( ) A.参数估计 B.双侧检验 C.单侧检验 D.假设检验 2.研究者想收集证据予以支持的假设通常称为( ) A.原假设 B.备择假设 C.合理假设 D.正常假设 3. 在假设检验中,原假设和备择假设( ) A.都有可能成立 B.都有可能不成立 C.只有一个成立而且必有一个成立 D.原假设一定成立,备择假设不一定成立 4. 在假设检验中,第Ⅰ类错误是指( ) A.当原假设正确时拒绝原假设 B.当原假设错误时拒绝原假设 C.当备择假设正确时未拒绝备择假设 D.当备择假设不正确时拒绝备择假设 5. 当备择假设为: ,此时的假设检验称为( ) A.双侧检验 B.右侧检验 C.左侧检验 D.显著性检验 6. 某厂生产的化纤纤度服从正态分布,纤维纤度的标准均值为1.40。某天测得25根纤维的纤度的均值为x =1.39,检验与原来设计的标准均值相比是否有所下降,要求的显著性水平为α=0.05,则下列正确的假设形式是( ) H0: μ=1.40, H1: μ≠1.40 H0: μ≤1.40, H1: μ>1.40 H0: μ<1.40, H1: μ≥1.40 H0: μ≥1.40, H1: μ<1.40 7一项研究表明,司机驾车时因接打手机而发生事故的比例超过20%,用来检验这一结论的原假设和备择假设应为 A. H0:μ≤20%, H1: μ>20% B. H0:π=20% H1: π≠20% C. H0:π≤20% H1: π>20% D. H0:π≥20% H1: π<20% 8. 在假设检验中,不拒绝原假设意味着( )。 A.原假设肯定是正确的 B.原假设肯定是错误的 C.没有证据证明原假设是正确的 D.没有证据证明原假设是错误的 9. 若检验的假设为H0: μ≥μ0, H1: μ<μ0 ,则拒绝域为( ) A. z>zα B. z<- zα C. z>zα/2 或z<- zα/2 D. z>zα或 z<-zα 10.若检验的假设为H0: μ≤μ0, H1: μ>μ0 ,则拒绝域为( ) A. z> zα B. z<- zα C. z> zα/2 或z<- zα/2 D. z> zα或 z<- zα 11. 如果原假设H0为真,所得到的样本结果会像实际观测取值那么极端或更极端的概率称为 ( ) A.临界值 B.统计量 C. P 值 D. 事先给定的显著性水平 12. 对于给定的显著性水平α,根据P 值拒绝原假设的准则是( ) A. P= α B. P< α C. P> α D. P= α=0 13. 下列几个数值中,检验的p 值为哪个值时拒绝原假设的理由最充分( ) A.95% B.50% C.5% D.2% 14. 若一项假设规定显著性水平为α=0.05,下面的表述哪一个是正确的( ) A. 接受H0 时的可靠性为95% B. 接受H1 时的可靠性为95% C. H0为假时被接受的概率为5% D. H1为真时被拒绝的概率为5% 15. 进行假设检验时,在样本量一定的条件下,犯第一类错误的概率减小,犯第二类错误的概率就会( ) 01:μμ

高中数学苏教版选修2-3:课下能力提升(十八)独立性检验Word版含解析

课下能力提升(十八)独立性检验 一、填空题 1.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(有关,无关) 2.若两个研究对象X和Y 则X与Y之间有关系的概率约为________. 3.在吸烟与患肺病这两个对象的独立性检验的计算中,下列说法正确的是________.(填序号) ①若χ2=6.635,则我们认为有99%的把握认为吸烟与患肺病有关系.那么在100个吸烟的人中必有99人患肺病. ②从独立性检验的计算中求有99%的把握认为吸烟与患肺病有关系时,我们认为如果某人吸烟,那么他有99%的可能患肺病. ③若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. ④以上三种说法都不正确. 4.调查者询问了72名男女大学生在购买食品时是否观看营养说明得到如下2×2列联表: 从表中数据分析大学生的性别与看不看营养说明之间的关系是________.(填“有关”或“无关”) 5 则由表可知大约有________的把握认为多看电视与人变冷漠有关系. 二、解答题 6.为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据: 学生的数学成绩好坏与对学习数学的兴趣是否有关?

7.考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下列联表. 试按照原试验目的作统计推断. 8.为了调查某生产线上质量监督员甲是否在生产现场对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试用独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响. 答案 1.解析:由χ2值可判断有关. 答案:有关 2.解析:因为 χ2= (5+15+40+10)×(5×10-40×15)2 (5+15)×(40+10)×(5+40)×(15+10) ≈18.8,查表知 P (χ2≥10.828)≈0.001. 答案:99.9% 3.解析:由独立性检验的意义可知,③正确. 答案:③ 4.解析:提出假设H 0:大学生的性别与看不看营养说明无关,由题目中的数据可计算χ2= 72×(28×20-16×8)2 44×28×36×36 ≈8.42,因为当H 0成立时,P (χ2≥7.879)≈0.005,这里的χ2≈ 8.42>7.879,所以我们有99.5%的把握认为大学生的性别与看不看营养说明有关. 答案:有关 5.解析:由公式得 χ2= 168×(68×38-42×20)2 110×58×88×80 ≈11.377>10.828,所以我们有99.9%

人教版 高中数学【选修 2-1】第一章独立性检验Word版

人教版高中数学精品资料 重点列表: 重点名称重要指数 重点1 独立性检验★★★ 重点2 独立性检验与概率交汇综合问题. ★★★★ 重点详解: 重点1:独立性检验 【要点解读】 1.独立性检验的两个关键,一是是正确列出2×2列联表,二是准确理解并计算出2 K的值. 2.弄清判断两变量有关的把握性与犯错误概率的关系,根据题目要求作出正确的回答. 3.独立性检验中统计量K2的观测值k的计算公式较为复杂,在解题中应明确数据的意义,代入公式准确计算.准确计算2k的值是正确判断的前提. 【考向】独立性检验 【例题】 【2016辽宁省沈阳质量监测一】为考查某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下: 现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为2 5 . (Ⅰ)求22 ?列联表中的数据x,y,A,B的值;(Ⅱ)能够有多大把握认为疫苗有效? 附: 2 2 () ()()()() n ad bc a b a c c d b d χ- = ++++ 未发病发病合计未注射疫苗20 x A 注射疫苗30 y B 合计50 50 100

【答案】(Ⅰ)10y =,40B =,40x =,60A =.(Ⅱ)至少有99.9%的把握认为疫苗有效. 【名师点睛】 1.独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断. 2.独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释. 重点2:独立性检验与概率交汇综合问题 【要点解读】 在近几年高考中统计案例与概率结合的解答题所占比例较往年有所增加,重点考查回归直线方程的求解和应用、独立性检验及概率的知识,注重考查考生对相关数据的统计、分析与应用的能力,此类试题一般为中档题. 【考向】独立性检验与概率交汇综合问题 【例题】【2016吉林长春质量监测二】近年来我国电子商务行业迎来篷布发展的新机遇,2015年双11期间,某购物平台的销售业绩高达918亿人民币.与此同时,相关管理部门也推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功的交易,并对其评价进行统计,对商品的好评率为 35,对服务的好评率为3 4 ,其中对商品和服务都做出好评的交易为80次. (1)是否可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关? (2)若针对商品的好评率,采用分层抽样的方式从这200次交易中取出5次交易,并从中选择两次交易进行客户回访,求只有一次好评的概率. 2()0.150.100.050.0250.0100.0050.001 2.072 2.706 3.841 5.024 6.6357.87910.828 P K k k ≥

关于假设检验中检验统计量的选择及拒绝域的确定问题

关于假设检验中检验统计量的选择及拒绝域的 确定问题 集团文件版本号:(M928-T898-M248-WU2669-I2896-DQ586-M1988)

关于假设检验中检验统计量的选择及拒绝域的确定问题 假设检验是根据样本所提供的信息检验假设是否成立的一种统计推断方法。在检验之前总体参数未知,先对总体参数提出一个假设的值,然后根据样本所提供的信息检验假设是否成立。 在假设检验中,如何根据已知条件选择检验统计量,并确定拒绝域和临界值,是非常重要的两个环节。学员在理解时容易出现混淆。 一、 根据已知条件选择检验统计量 这里要注意,样本均值x 的分布与根据样本均值及总体方差(或样本方差)构造的检验统计量的分布是两个不同的概念。根据抽样分布的理论,只要总体服从正态分布,那么,无论是大样本,还是小样本,其样本均值的分布均服从正态分布;如果总体的分布是非正态分布,在大样本情况下,其样本均值的分布仍服从正态分布,小样本的样本均值的分布则服从非正态分布。 但是,检验统计量的分布则不然。 (一)对于小样本量 分两种情况: 1、在总体是正态分布的情况下,如果总体方差未知、小样本 (n<30),检验统计量n s x /0 μ-的分布服从t 分布; 2、在总体服从非正态分布、小样本的情况下,检验统计量的分布也服从t 分布。 由于一般情况下总体方差未知,需要用样本方差来代替,所以,一般准则是:小样本量时用t 检验。

(二)对于大样本量 在大样本量( 30≥n )的情况下,检验统计量的分布与样本均值的分布相同,服从正态分布,这一点比较容易理解。所以,概括来说,大样本量时用Z 检验。 选择用t 检验还是Z 检验,直接关系到选择t 临界值还是Z 临界值。 二、 拒绝域和临界值的确定 应结合分布的图形来理解接受域、拒绝域以及临界值。 (一)对于双侧检验 一般在双侧检验时,使用正态分布对总体均值进行检验,拒绝域为:2αZ Z >或2αZ Z -<(或2αZ Z >);使用t 分布进行检验,拒绝域为: 2αt t >或2αt t -<,(或2αt t >);使用2χ分布进行检验时(对总体方差的检验),若检验的统计量22 αχ>χ或2122αχχ-<时,拒绝原假设。注意,这里使用的是2α,因为双侧检验中有两个拒绝域,各占2 α。只要满足其中一个拒绝域,即可拒绝原假设。 在双侧检验的情况下,拒绝域在接受域的两侧,或分布图形的两端。 (二)对于单侧检验 在进行单侧检验时,使用正态分布或t 分布对总体均值进行检验,拒绝域与备择假设“大于”或“小于”的方向相同。如,μ≥1.40 H 1:μ <1.40,则拒绝域为Z 或t 值<临界值。这里只有一个拒绝域,所以不需要将α除以2。 特别要注意,如果计算得到的检验统计量的值为负,则要取临界值的负值来进行比较。因为从数轴上看,临界值的正值在另一侧,将它与为

高中数学选修2-3《独立性检验的基本思想及其初步应用》教案资料

) ◆教案 独立性检验的基本思想及其初步应用(第1课时)教材:人教A版·普通高中课程标准实验教科书·数学·选修2-3 【教学目标】 知识与技能目标: (1)通过学生课前分组进行“事件与事件之间是否有关系”的调查研究,理解统计方法的基本思想和应用,通过学生根据已有知识的基础上进行的数据分析,得到的直观结论,了解独立性检验的必要性,为知识的形成起到较好的推动作用. . (2)通过一起对典型案例“吸烟是否与患肺癌有关系”的合作探究、自主学习,并通过和反证法原理的对比,进一步让学生去理解独立性检验的基本思想、方法及初步应用. (3)经历由实际问题建立数学模型的过程,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用. 过程与方法目标: (1) 学生通过自主调查、设计抽样方案、分析数据、动手探究,培养学生的数学应用意识,掌握统计学的基本思想和方法,培养学生的动手能力、数理统计能力和合作精神. (2) 学生通过对调查数据的分析,作出的直观结论的可靠性程度的探究及其过程,理解独立性检验的基本思想,进一步掌握统计的方法,完善思维品质,并过特殊问题到一般性方法的探究,寻求知识之间的联系,通过新的知识与旧知识之间的对比,使学生掌握学习数学的基本方法,进一步完善认知结构. (3) 在探究过程中,在老师的引导下学生自主学习,学生主要通过合作交流,独立思考探究新知,获取新的知识;通过不同层次学生反映的问题进行适当的分析和指导,让不同层次的学生在学习过程中都有不同程度的提高,在练习中设置B组题,让思维和掌握程度较好同学能够“吃饱”.

情感、态度、价值观: " (1) 通过学生自主研究,进一步体会统计思想在实践中的应用,体会数形结合的思想;在探究过程中通过对具体情景中的问题到寻求一般解决方案,培养由特殊到一般思想,通过知识间的联系和对比,体验数学中转化思想的意义和价值. (2) 在教学中为学生提供充分的从事数学活动的机会,如:课前的调查研究,分析数据,通过课堂的探究活动,让学生自主探究新知,经历知识形成过程. (3)通过小组的协作,培养学生的团队精神,在活动中激发学生的学习潜能,促进他们真正理解和掌握基本的数学知识技能、数学思想方法及数学的应用意识,学会用计算器或计算机软件进行数理统计能力,获得广泛的数学活动经验,提高综合能力,学会学习,进一步在意志力、自信心、理性精神等情感与态度方面得到良好的发展. 【教学重点与难点】 重点:理解独立性检验的基本思想及实施步骤. 难点:(1)了解独立性检验的基本思想;(2)了解随机变量2K的含义. ? 【教学方法】 《新课程标准》的理念是“向学生提供充分从事数学活动的机会,帮助他们在自主探索和合作交流的过程中真正理解和掌握基本的数学知识和技能,数学思想和方法”. 考虑授课对象是高二年级理科生,学生层次差异比较明显,动手能力不足,因此通过课前的分组进行课题的调查研究,分析数据,获取结论的过程让学生在活动中提升数学思考能力,锻炼动手能力,学会处理数据的基本方法,课中通过合作探究,自主学习等方式体验知识的形成,根据不同层次学生在探究、解决问题和练习中反映的问题进行适当的引导,让学生在已有的基础上获得最大的发展. 本节课主要是探究性学习,学生通过课前的调查研究和直观发现的结论和样本的随机性,理解独立性检验的必要性,根据所探究问题进行类比联想,寻求突破点,并在过程中分析所得数据与问题之间的联系,提升数学思维能力,通过与反证法思想的类比,进一步加深对独立性检验思想的理解. 课堂中的例题和练习,主要是学生知识的应用为主,体会统计方法在实际问题中的应用,

假设检验的基本步骤

假设检验的基本步骤

————————————————————————————————作者:————————————————————————————————日期:

假设检验的基本步骤 (三)假设检验的基本步骤 统计推断 1.建立假设检验,确定检验水准 H0和H1假设都是对总体特征的检验假设,相互联系且对立。 H0总是假设样本差别来自抽样误差,无效/零假设 H1是来自非抽样误差,有单双侧之分,备择假设。 检验水准,a=0.05 检验水准的含义 2.选定检验方法,计算检验统计量 选择和计算检验统计量要注意资料类型和实验设计类型及样本量的问题, 一般计量资料用t检验和u检验; 计数资料用χ2检验和u检验。 3.确定P值,作出统计推理 P≤a,拒绝H0,接受H1 P>a,按a=0.05水准,不拒绝H0,无统计学意义或显著性差异 假设检验结论有概率性,无论使拒绝或不拒绝H0,都有可能发生错误 (四)两均数的假设检验(各种假设检验方法的适用条件及假设的特点、计算公式、自由度确定以及确定概率P值并做出推断结论) u检验适用条件 t检验适用条件 t检验和u检验 1.样本均数与总体均数比较 2.配对资料的比较/成组设计的两样本均数的比较 配对设计的情况:3点 3. 两个样本均数的比较 (1)两个大样本均数比较的u检验 (2)两个小样本均数比较的t检验 (五)假设检验的两类错误及注意事项(Ⅰ和Ⅱ类错误) 1.两类错误 拒绝正确的H0称Ⅰ型错误-弃真,用检验水准α表示,α=0.05,犯I型错误概率为0.05,理论上平均每100次抽样有5次发生此类错误; 接受错误的H0称Ⅱ型错误-存伪。用β表示,(1-β)为检验效能或把握度,意义为两总体有差异,按α水准检出差别的能力,1-β=0.9,若两总体确有差别,理论上平均每100次抽样有90次得出有差别的结论。 两者的关系:α愈大β愈小;反之α愈小β愈大。 2.假设检验中的注意事项 (1)随机化:代表性和均衡可比性 (2)选用适当的检验方法 (3)正确理解统计学意义 (4)结论不绝对 (5)单侧与双侧检验的选择 四.分类变量资料的统计描述

北师大版数学高二-高中数学3.2 独立性检验(1)教案 选修2-3

高中数学3.2独立性检验(1)教案 选修2-3 教学目标 (1)通过对典型案例的探究,了解独立性检验(只要求22?列联表)的基本思想、方 法及初步应用; (2)经历由实际问题建立数学模型的过程,体会其基本方法. 教学重点、难点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点. 教学过程 一.问题情境 5月31日是世界无烟日。有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题: 1. 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515 个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病. 问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”? 二.学生活动 (2)估计吸烟者与不吸烟者患病的可能性差异: 在吸烟的人中,有 3716.82%220≈的人患病,在不吸烟的人中,有21 7.12%295 ≈的人患病. 问题:由上述结论能否得出患病与吸烟有关?把握有多大? 三.建构数学 1.独立性检验: (1)假设0H :患病与吸烟没有关系. (近似的判断方法:设n a b c d =+++,如果0H 成立,则在吸烟的人中患病的比例与 不吸烟的人中患病的比例应差不多,由此可得 a c a b c d ≈ ++,即()()0a c d c a b ad bc +≈+?-≈,因此,||ad bc -越小,患病与吸烟之间的关系越

高中数学选修2-3-独立性检验

3.2独立性检验的基本思想及其初步应用 (共计3课时) 授课类型:新授课 一、教学内容与教学对象分析 通过典型案例,学习下列一些常用的统计方法,并能初步应用这些方法解决一些实际问题。 ①通过对典型案例(如“患肺癌与吸烟有关吗”等)的探究。了解独立性检验(只要 求2×2列联表)的基本思想、方法及初步应用。 ②通过对典型案例(如“人的体重与身高的关系”等)的探究,了解回归的基本思想、方法及其初步应用。 二. 学习目标 1、知识与技能 通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。 2、过程与方法 在本节知识的学习中,应使学生从具体问题中认识进行独立性检验的作用及必要性,树立学好本节知识的信心,在此基础上学习三维柱形图和二维柱形图,并认识它们的基本作用和存在的不足,从而为学习下面作好铺垫,进而介绍K的平方的计算公式和K的平方的观测值R的求法,以及它们的实际意义。从中得出判断“X与Y有关系”的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种判断的可靠程度的具体做法和可信程度的大小。最后介绍了独立性检验思想的综合运用。 3、情感、态度与价值观 通过本节知识的学习,首先让学生了解对两个分类博变量进行独立性检验的必要性和作用,并引导学生注意比较与观测值之间的联系与区别,从而引导学生去探索新知识,培养学生全面的观点和辨证地分析问题,不为假想所迷惑,寻求问题的内在联系,培养学生学习数学、应用数学的良好的数学品质。加强与现实生活相联系,从对实际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系。明确数学在现实生活中的重要作用和实际价值。教学中,应多给学生提供自主学习、独立探究、合作交流的机会。养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的知识来解决实际问题。 三.教学重点、难点 教学重点:理解独立性检验的基本思想;独立性检验的步骤。 教学难点;1、理解独立性检验的基本思想; 2、了解随机变量K2的含义; 3、独立性检验的步骤。 四、教学策略 教学方法:诱思探究教学法 学习方法:自主探究、观察发现、合作交流、归纳总结。 教学手段:多媒体辅助教学 五、教学过程:

相关主题
文本预览
相关文档 最新文档