当前位置:文档之家› 1.2.2独立性检验的基本思想和初步应用习题与答案

1.2.2独立性检验的基本思想和初步应用习题与答案

1.2.2独立性检验的基本思想和初步应用习题与答案
1.2.2独立性检验的基本思想和初步应用习题与答案

数学·选修1-2(人教A版)

1.2 独立性检验的基本思想及其初步应用

?达标训练

1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( )

A.散点图B.等高条形图

C.2×2列联表 D.以上均不对

答案:B

2.在等高条形图形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( )

A.

a

a+b

d

c+d

B.

c

a+b

a

c+d

C.

a

a+b

c

c+d

D.

a

a+b

c

b+c

答案:C

3.对分类变量X与Y的随机变量K2的观测值k,说确的是( ) A.k越大,“ X与Y有关系”可信程度越小

B.k越小,“ X与Y有关系”可信程度越小

C.k越接近于0,“X与Y无关”程度越小

D.k越大,“X与Y无关”程度越大

答案:B

4.下面是一个2×2列联表:

则表中a、b的值分别为( )

A.94、96 B.52、50

C.52、54 D.54、52

答案:C

5.性别与身高列联表如下:

那么,检验随机变量K2的值约等于 ( )

A.0.043 B.0.367

C.22 D.26.87

答案:C

6.给出列联表如下:

根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是( )

A.0.4 B.0.5 C.0.75 D.0.85

答案:B

?素能提高

1.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲,下列说法中正确的是( )

A .男人、女人中患有色盲的频率分别为0.038、0.006

B .男人、女人患色盲的概率分别为19240、3

260

C .男人中患色盲的比例比女人中患色盲的比例大,患色盲是与性别有关的

D .调查人数太少,不能说明色盲与性别有关

解析:男人患色盲的比例为38480,比女人中患色盲的比例6

520

大,

其差值为??

????

38480-6520≈0.067 6,差值较大. 答案:C

2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:

男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110

由K 2=

算得, K 2=

≈7.8.

附表:

P (K 2≥k 0)

0.050 0.010 0.001 k 0

3.841 6.635 10.828

参照附表,得到的正确结论是( )

A .有99%以上的把握认为“爱好该项运动与性别有关”

B .有99%以上的把握认为“爱好该项运动与性别无关”

C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”

D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”

答案:A

3.若由一个2×2列联表中的数据计算得K2=4.013,那么在犯错误的概率不超过0.05的前提下认为两个变量______(填“有”或“没有”)关系.

答案:有

4.(2013·二模)以下四个命题:

①在一次试卷分析中,从每个试室中抽取第5号考生的成绩进行统计,是简单随机抽样;

②样本数据:3,4,5,6,7的方差为2;

③对于相关系数r,|r|越接近1,则线性相关程度越强;

④通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下列联表:

男女总计

走天桥402060

走斑马线203050

总计6050110

由K2=

可得,K2==7.8,则有99%以上的把握认为“选择过马路方式与性别有关”,其中正确的命题序号是________.

答案:②③④

附表

P (K2≥k0)0.050.0100.001

k03.84

1

6.63510.828

5.某学校为了调查喜欢语文学科与性别的关系,随机调查了一些学生情况,具体数据如下表:

类别

性别

不喜欢语文喜欢语文

男1310

女720

为了判断喜欢语文学科是否与性别有关系,根据表中的数据,得

到K2的观测值k=≈4.844,因为k≥3.841,根据下表中的参考数据:

P(K2≥k0)0.500.400.250.150.100.050.02

5

0.01

0.00

5

0.00

1

k0

0.45

5

0.70

8

1.32

3

2.07

2

2.70

6

3.84

1

5.02

4

6.63

5

7.87

9

10.8

28 判定喜欢语文学科与性别有关系,那么这种判断出错的可能性

为________.

答案:5%

6.某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(满分100分)如下表

序号12345678910 数学成绩95758094926567849871

物理成绩90637287917158829381

序号11121314151617181920 数学成绩67936478779057837283

物理成绩77824885699161847886

若单科成绩85以上(含85分),则该科成绩优秀.

数学成绩优秀数学成绩不优秀合计物理成绩优秀

物理成绩不优秀

合计

解析:(1)2×2列联表为(单位:人):

数学成绩优秀数学成绩不优秀合计物理成绩优秀 527

物理成绩不优秀 1 1213 合计 6 1420

(2)根据题(1)中表格的数据计算,能否在犯错误的概率不超过0.005的前提下认为学生的数学成绩与物理成绩之间有关系?

参数数据:

①假设有两个分类变量X和Y,它们的值域分别为(x1,x2)

和(y1,y2),其样本频数列联表(称为2×2列联表)为:

y1y2合计

x1 a b a+b

x2 c d c+d

合计a+c b+d a+b+c+d

则随机变量K2=,其中n=a+b+c+d为样本容量;

②独立检验随机变量K2的临界值参考表如下:

P(K2≥k0)0.500.400.250.150.10

k00.4550.708 1.323 2.072 2.706

P(K2≥k0)0.050.0250.0100.0050.001 k0 3.841 5.024 6.6357.87910.828

解析:根据列联表可以求得K2的观测值

k=≈8.802>7.879.

在犯错误的概率不超过0.005的前提下认为:学生的数学成绩与物理成绩之间有关系.

7. 2013年3月14日,CCTV财经频道报道了某地建筑市场存在违规使用未经淡化海砂的现象.为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,得到了相关

混凝土耐久性达标

混凝土耐

久性不达标

总计

使用淡化海砂25530 使用未经淡化海砂151530 总计402060

的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关?

解析:提出假设H0:使用淡化海砂与混凝土耐久性是否达标无关.

根据表中数据,求得K2的观测值

k==7.5>6.635.

查表得P(K2≥6.635)=0.010.

∴能在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关.

(2)若用分层抽样的方法在使用淡化海砂的样本中抽取了6个,现从这6个样本中任取2个,则取出的2个样本混凝土耐久性都达标的概率是多少?

P(K2≥k)0.100.0500.0250.0100.001 k 2.706 3.841 5.024 6.63510.828

解析:用分层抽样的方法在使用淡化海砂的样本中抽取6个,其

中应抽取“混凝土耐久性达标”的为25

30

×6=5,“混凝土耐久性不达

标”的为6-5=1,

“混凝土耐久性达标记”为A1,A2,A3,A4,A5”;“混凝土耐久性不达标”的记为B.

在这6个样本中任取2个,有以下几种可能:(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,B),(A2,A3),(A2,A4),(A2,A5),(A2,B),(A3,A4),(A3,A5),(A3,B),(A4,A5),(A4,B)(A5,B),共15种.

设“取出的2个样本混凝土耐久性都达标”为事件A,它的对立事件A为“取出的2个样本至少有1个混凝土耐久性不达标”,包含(A1,B),(A2,B),(A3,B),(A4,B),(A5,B),共5种可能.

∴P(A)=1-P(A)=1-5

15=

2

3

.

即取出的2个样本混凝土耐久性都达标的概率是2 3 .

8.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:克),重量值落在(495,510]的产品为合格品,否则为不合格品.左下表是甲流水线样本频数分布表,右下图是乙流水线样本的频率分布直方图.

(1)根据上表数据作出甲流水线样本的频率分布直方图;

解析:甲流水线样本的频率分布直方图如下:

(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率;

解析:由题表知甲样本中合格品数为8+14+8=30,由题图知乙样本中合格品数为(0.06+0.09+0.03)×5×40=36,故甲样本合

格品的频率为30

40

=0.75,乙样本合格品的频率为

36

40

=0.9.

据此可估计从甲流水线任取1件产品,该产品恰好是合格品的概率为0.75.从乙流水线任取1件产品,该产品恰好是合格品的概率为

0.9.

(3)由以上统计数据完成下面2×2列联表,能否在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关?

甲流水线乙流水线合计

合格品a=b=

不合格品c=d=

合计n=

附表:

P(K2≥k0)0.150.100.050.02

5

0.01

0.00

5

0.001

k02.07

2

2.70

6

3.84

1

5.02

4

6.63

5

7.87

9

10.82

8

(参考公式:K2=,其中n=a+b+c+d)

解析:2×2列联表如下:

甲流水线乙流水线合计合格品a=30b=3666

不合格品c=10d=414

合计4040n=80

∵K2=

n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

=80×(120-360)2

66×14×40×40

≈3.117>2.706.

∴在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关.

?品味高考

1.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如下:

性别

是否需要志愿者

男女

需要4030

不需要160270 解析:调查的500位老年人中有70位需要志愿者提供帮助,因

此该地区老年人中需要帮助的老年人的比例的估计值为70

500

=14%.

(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?

解析:K2的观测值k=500×(40×270-30×160)2

200×300×70×430

≈9.967,

由于9.967>6.635所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.

(3)根据(2)的结论,能否提出更好的调查办法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例?说明理由.

解析:由于(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.

附:K2=

P(K2≥k0)0.0500.0100.001

k0 3.841 6.63510.828

2.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.

(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;

解析:由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.

所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),

记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.

从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中至少有1名“25岁以下组”工人的可能结果共有7种,它们是:(A1,B1),(A1,B2),(A2,B1),

(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=7 10 .

(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?

附:K2=

P(K2≥k0)0.1000.0500.0100.001

k0 2.706 3.841 6.63510.828

解析:由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×0.25=15(人),“25周岁以下组”中的生产能手40×0.375=15(人),据此可得2×2列联表如下:

生产能手非生产能手合计

25周岁以上组154560

25周岁以下组152540

合计3070100

因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在年龄组有关”.

(教案)1.2独立性检验的基本思想及其初步应用

第一课时 1.2独立性检验的基本思想及其初步应用(一) (共2课时) 教学要求:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性. 教学重点:理解独立性检验的基本思想及实施步骤. 教学难点:了解独立性检验的基本思想、了解随机变量2 K的含义. 教学过程: 一、复习准备: 回归分析的方法、步骤,刻画模型拟合效果的方法(相关指数、残差分析)、步骤. 二、讲授新课: 1. 教学与列联表相关的概念: ①分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量. 分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级,等等. 分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义. 如用“0”表示“男”,用“1”表示“女”. ②列联表:分类变量的汇总统计表(频数表). 一 般我们只研究每个分类变量只取两个值,这样的列 联表称为22 ?. 如吸烟与患肺癌的列联表: 2. 教学三维柱形图和二维条形图的概念: 由列联表可以粗略估计出吸烟者和不吸烟者患肺 癌的可能性存在差异.(教师在课堂上用EXCEL软件演示三维柱形图和二维条形图,引导学生观察这两类图形的特征,并分析由图形得出的结论) 3. 独立性检验的基本思想: ①独立性检验的必要性(为什么中能只凭列联表的数据和图形下结论?):列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用于总体. 第一步:提出假设检验问题H 0:吸烟与患肺癌没有关系?H 1 :吸烟与患肺癌有关系 第二步:选择检验的指标 2 2 () K ()()()() n ad bc a b c d a c b d - = ++++ (它越小,原假设“H :吸 烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H 1 :吸烟与患肺癌有关系”成立的可能性越大. 教学要求:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据

2020_2021学年高中数学课时素养评价三1.2.2~1.2.4独立性检验独立性检验的基本思想独立

课时素养评价三独立性检验独立性检验的基本思想独立性检验 的应用 (20分钟·50分) 一、选择题(每小题5分,共20分) 1.经过对χ2的研究,得到了若干个临界值,当χ2≤ 2.706时,我们认为事件A与B ( ) A.有95%的把握认为A与B有关系 B.有99%的把握认为A与B有关系 C.没有充分理由说明事件A与B有关系 D.不能确定 【解析】选C.当χ2>2.706时,有90%以上的把握说明A与B有关系,但当χ2≤2.706时,只能说明A与B是否有关系的理由不够充分. 2.利用独立性检验的方法调查高中生性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用2×2列联表,由计算可得χ2≈7.245,参照下表:得到的正确结论是( ) P(χ2≥x0) 0.01 0.05 0.025 0.010 0.005 0.001 x0 2.706 3.841 5.024 6.635 7.879 10.828 A.有99%以上的把握认为“爱好该项运动与性别无关” B.有99%以上的把握认为“爱好该项运动与性别有关” C.有95%的把握认为“爱好该项运动与性别有关” D.有95%的把握认为“爱好该项运动与性别无关” 【解析】选B.由χ2≈7.245>6.635,可得有99%以上的把握认为“爱好该项运动与性别有关”. 3.为了研究性格和血型的关系,抽查80人试验,血型和性格情况如下:O型或A型者是内向型的

有18人,外向型的有22人,B型或AB型是内向型的有12人,外向型的有28人,则有多大的把握认为性格与血型有关系( ) A.95% B.99% C.没有充分的证据显示有关 D.1% 【解析】选C. χ2=错误!未找到引用源。=1.92<2.706,所以没有充分的证据显示有关. 4.以下关于独立性检验的说法错误的是( ) A.独立性检验依赖小概率原理 B.独立性检验得到的结论一定正确 C.样本不同,独立性检验的结论可能有差异 D.独立性检验不是判定两事物是否相关的唯一方法 【解析】选B.受样本选取的影响,独立性检验得到的结论不一定正确. 二、填空题(每小题5分,共10分) 5.以下三个命题中:①在回归分析中,可用相关系数r的值判断模型的拟合效果,|r|(|r|≤1)越大,模拟的拟合效果越好;②在一组样本数据(x1,y1),(x2, y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)的散点图中,若所有样本点(x i, y i)(i=1,2,…,n)都在直线y=-错误!未找到引用源。x+1上,则这组样本数

2独立性检验

1.2独立性检验的基本思想及其初步应用 根据表中数据得到 2 50181589 27232426 k () ??-? =≈ ??? 5.059,因为p(K2≥5.024)=0.025, 则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为() (A)97.5% (B) 95% (C)90% (D)无充分根据 2.(2011?湛江一模)利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅表格来确定“X和Y有关 A.5% B.75% C.99.5% D.95% 3.(2012?泰安一模)下列说法: ①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程,变量x增加一个单位时,y平均增加5个单位; ③线性回归方程必过; ④在一个2×2列联表中,由计算得K2=13.079,则有99%的把握确认这两个变量间有关系; 其中错误的个数是() A.0 B.1 C.2 D.3 4.(2010?泰安二模)某医疗研究所为了检验新开发的流感疫苗对甲型H1N1流感的预防作用,把1000名注射了疫苗的人与另外1000名未注射疫苗的人的半年的感冒记录作比较,提出假设H0:“这种疫苗不能起到预防甲型H1N1流感的作用”,并计算出P(Χ2≥6.635)≈0.01,则下列说法正确的是() A.这种疫苗能起到预防甲型H1N1流感的有效率为1% B.若某人未使用该疫苗,则他在半年中有99%的可能性得甲型H1N1 C.有1%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用” D.有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用” 5.(2012?枣庄一模)通过随机询问100名性别不同的大学生是否爱好踢毪子运动,得到如下的列联表: 随机变量,经计算,统计量K2的观测值k≈4.762,参照附表,得到的正

高考试题 回归分析,独立性检验

回归分析与独立性检验 1.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生. 从这次考试成绩看, ①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ; ②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 . 2.根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A .逐年比较,2008年减少二氧化碳排放量的效果最显着 B .2007年我国治理二氧化碳排放显现成效 C .2006年以来我国二氧化碳年排放量呈减少趋势 D .2006年以来我国二氧化碳年排放量与年份正相关 3.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 根据上表可得回归直线方程???y bx a =+ ,其中???0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为( )] A .11.4万元 B .11.8万元 C .12.0万元 D .12.2万元 4.在画两个变量的散点图时,下面哪个叙述是正确的 ( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在 y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上 5 2004年 2005年 2006年 2007年 2008年 2009年 2010年 2011年 2012年 2013年

根据以上数据,则 ( ) A .种子经过处理跟是否生病有关 B .种子经过处理跟是否生病无关 C .种子是否经过处理决定是否生病 D .以上都是错误的 6.变量x 与y 具有线性相关关系,当x 取值16,14,12,8时,通过观测得到y 的值分别为11,9,8,5,若在实际问题 中,y 的预报最大取值是10,则x 的最大取值不能超过 ( ) A .16 B .17 C .15 D .12 7.在研究身高和体重的关系时,求得相关指数≈2 R ___________,可以叙述为“身高解释了64%的体重变化,而随机 误差贡献了剩余的36%”所以身高对体重的效应比随机误差的效应大得多。 8.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图 (I )由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (II )建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量。 参考数据: 7 1 9.32i i y ==∑,7 1 40.17i i i t y ==∑, 7 2 1 () 0.55i i y y =-=∑, 7≈2.646. 参考公式:相关系数1 2 2 1 1 ()() ()(y y)n i i i n n i i i i t t y y r t t ===--= --∑∑∑, 回归方程 y a bt =+ 中斜率和截距的最小二乘估计公式分别为: 9.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论错误的是 A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳 10.为了研究某班学生的脚长x (单位:厘米)和身高 y (单位:厘米)的关系,从该班随机抽取10名学生,根据测 量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为???y bx a =+.已知10 1 225i i x ==∑,10 1 1600i i y ==∑,?4b =.该班某学生的脚长为24,据此估计其身高为 (A )160 (B )163 (C )166 (D )170 11.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg )某频率分布直方图如下: (1) 设两种养殖方法的箱产量相互独立,记A 表示事件:“旧养殖法的箱产量低于50kg, 新养殖法的箱产量不低

1.1《独立性检验》习题

1-1《 统计案例》习题 1.1 独立性检验 双基达标 限时15分钟 1.下面是一个2×2的列联表 则表中a ,b 解析 由a +21=73,得a =52, 由a +5=b ,得b =57. 答案 52,57 2.为了检验两个事件A 与B 是否相关,经计算得χ2=3.850,我们有________ 的把握认为事件A 与B 相关. 答案 95% 3.为了考查高中生的性别与是否喜欢数学课程之间的关系,某市在该辖区内 的高中学生中随机地抽取300名学生进行调查,得到表中数据: 解析 由χ2 =300 47×123-35×95 2142×158×82×218≈4.512. 答案 4.512 4.下列关于独立性检验的4个叙述,说法正确的是________. ①χ2 的值越大,说明两事件相关程度越大; ②χ2 的值越小,说明两事件相关程度越小; ③χ2 ≤3.841时,有95%的把握说事件A 与B 无关; ④χ2 >6.635时,有99%的把握说事件A 与B 有关. 解析 在独立性检验中,随机变量χ2 的取值大小只能说明“两分类变量有关”,这一结论 的可靠程度,即可信度,而不表示两事件相关的程度,故①②不正确.χ2 >6.635说明有99%的把握认为二者有关系,χ2≤3.841时,若x 2 >2.706则有90%的把握认为事件A 与B 有关系.因

此可知③中说法是不正确的. 答案 ④ 5.想要检验是否喜欢参加体育活动是不是与性别有关,应该假 设________________. 解析 独立性检验假设有反证法的意味,应假设两类变量(而非变量的属性)无关,这时 的χ2应该很小,如果χ2很大,则可以否定假设;如果χ2 很小,则不能够肯定或者否定假设. 答案 H 0:喜欢参加体育活动与性别无关 6.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行 了3年的跟踪研究,调查他们是否发作过心脏病,调查结果如下表所示: 解 提出假设H 0:两种手术对病人又发作心脏病没有影响.由列联表,得 χ2=392× 39×167-157×29 2196×196×68×324 ≈1.780<2.706. 因为当H 0成立时,χ2 ≥1.780的概率大于10%,这个概率比较大,所以根据目前的调查数 据,不能否定假设H 0,故我们没有理由说这两种手术与“又发作过心脏病”有关,故可以认为病人是否发作心脏病跟他做过何种手术无关. 综合提高 限时30分钟 7. 2008年10月8日为我国第十一个高血压日,主题是“在家测量您的 血压”.某社区医疗服务部门为了考察该社区患高血压病是否与食盐摄入 量有关,对该社区的1 633人进行了跟踪调查,得出以下数据: 计算χ2有关系.

《独立性检验的基本思想及其初步应用》说课稿

《独立性检验的基本思想及其初步应用》说课稿 各位专家、老师,大家好。我叫***,来自***中学,今天我说课的内容是《独立性检验的基本思想及 其初步应用》。 根据新课标的理念,对于本节课,我将以教什么,怎样教,为什么这样教为思路,从教材分析、学情 分析、目标分析、教法设计、教学过程、教学反思这六个方面来阐述我对本节课的构思。 一、教材分析 本节课是人教A版选修2-3第三章第二节第一课时,通过对典型案例的探究,了解独立性检验的基本 思想、方法及其初步应用。 学生学习了利用回归分析研究两个变量间的相关关系,本节课利用独立性检验进一步分析两个分类变 量之间是否有关系,是高中数学知识中体现统计思想的重要内容。 学生是教学的主体,只有了解学情,才能有效的进行课堂教学。 二、学情分析 知识上:学生已经学习过统计、变量回归分析等知识,这为本节课的学习提供了知识基础。 能力方面:学生具备了一定的认知、分析、归纳能力;能够进行小组活动。 学生缺少深入探究问题的方法;运算能力和语言表达能力有待提高。 针对这个问题,课堂上我通过适时引导学生探究,鼓励学生积极展示来解决。 三、目标分析 根据新课标对本节课的教学要求以及本节课教学内容特点,结合学情,我制定以下教学目标: 知识与技能:通过对典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检 验,明确独立性检验的基本步骤,并能解决实际问题。 过程与方法:通过设置问题,引导学生自主发现、合作探究、归纳展示、质疑对抗,使学生成为课堂 主体。 情感、态度与价值观:通过本节课学习,让学生体会统计方法在决策中的作用;合作探究的学习过程,使学生感受发现、探索的乐趣及成功展示的成就感,培养学生学习数学知识的积极态度。 基于以上分析,我确立本节课的: 教学重点:了解独立性检验的基本思想及实施步骤。 教学难点:独立性检验的基本思想;随机变量K2的含义。 为了突出重点、突破难点,在教法和学法上我是这样设计的: 四、教法设计 结合本节课的教学内容和学生的认知水平,在教法上:我坚持以学生为主体,教师为主导的原则,采 用“合作探究”的教学模式。通过精心设置问题,以问题为驱动,引导学生积极探究;组织学生分组讨 论,适时指导评价;点评学生展示成果,归纳总结。 在学法上:我以培养学生的探究能力为出发点,着眼于知识的形成和发展,注重学生的学习体验,把 学习过程分成四个步骤,由浅入深、循序渐进。 结合教法、学法,在教学上我将用八个环节来达成我的教学目标。 五、教学过程 1、情境引入,提出问题 我首先让学生观看视频: 提出问题1:“你认为吸烟与患肺癌有关系吗?”怎样用数学知识说明呢? 这样从实际问题抽象出数学问题,既激发了学生的求知欲,也为顺利实施本节课的教学目标打下了良 好的基础. 2、阅读教材,探究新知 在兴趣的引领和问题的驱动下,学生认真阅读教材,学习新知。我利用多媒体展示各种图片,更加形 象地说明分类变量的不同取值。明确指出,对于分类变量重点探究的是“两个分类变量之间是否有关系”。 “我们经常说吸烟容易得肺癌,是不是吸烟一定得肺癌呢?”(不一定) 我接着问:吸烟是否对患肺癌有影响呢?(有) 1

独立性检验的基本思想及其初步应用习题及答案

数学·选修1-2(人教A版) 独立性检验的基本思想及其初步应用 ?达标训练 1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( ) A.散点图B.等高条形图 C.2×2列联表 D.以上均不对 答案:B 2.在等高条形图形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( ) 与 d c+d 与 a c+d 与 c c+d 与 c b+c 答案:C 3.对分类变量X与Y的随机变量K2的观测值k,说法正确的是( ) A.k越大,“ X与Y有关系”可信程度越小 B.k越小,“ X与Y有关系”可信程度越小 C.k越接近于0,“X与Y无关”程度越小 D.k越大,“X与Y无关”程度越大 答案:B 4.下面是一个2×2列联表:

则表中a、b的值分别为( ) A.94、96 B.52、50 C.52、54 D.54、52 答案:C 5.性别与身高列联表如下: 那么,检验随机变量K2的值约等于 ( ) A. B. C.22 D. 答案:C 6.给出列联表如下: 根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是( ) A.B.0.5 C.D. 答案:B

?素能提高 1.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲,下列说法中正确的是( ) A .男人、女人中患有色盲的频率分别为、 B .男人、女人患色盲的概率分别为19240、3 260 C .男人中患色盲的比例比女人中患色盲的比例大,患色盲是与性别有关的 D .调查人数太少,不能说明色盲与性别有关 解析:男人患色盲的比例为38480,比女人中患色盲的比例6 520 大, 其差值为?? ???? 38480-6520≈ 6,差值较大. 答案:C 2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 由K 2=算得, K 2=≈. 附表: 参照附表,得到的正确结论是( ) A .有99%以上的把握认为“爱好该项运动与性别有关” B .有99%以上的把握认为“爱好该项运动与性别无关” C .在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别有关” D .在犯错误的概率不超过%的前提下,认为“爱好该项运动与性

1.2独立性检验的基本思想及其初步应用(学、教案)

1. 2 独立性检验的基本思想及其初步应用 课前预习学案 一、预习目标:能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本 思想;了解判断刻画回归模型拟合好坏的方法――相关指数和残差分析。 二、预习内容 1. 给出例3:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程. 温度/x C 21 23 25 27 29 32 35 产卵数/y 个 7 11 21 24 66 115 325 (学生描述步骤,教师演示) 2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系. 课内探究学案 一、学习要求: 通过对典型案例的探究,了解独立性检验的基本思想、方法及初步应用 学习重点: 对独立性检验的基本思想的理解. 学习难点: 独立性检验的基本思想的应用. 二、学习过程: 知识点详解 知识点一:分类变量 对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. 知识点二:列联表 为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机调查了9965人,得到如下结果(单位:人): 吸烟与患肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 像上表这样列出的两个分类变量的频数表,称为列联表. 知识点三:独立性检验 这种利用随机变量K 2 来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. 知识点四:判断结论成立的可能性的步骤 一般地,假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其样 501001502002503003500 10203040 温度 产卵数

(完整版)1.2.2独立性检验的基本思想及其初步应用习题及答案

数学·选修1-2(人教A版) 1.2 独立性检验的基本思想及其初步应用 ?达标训练 1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( ) A.散点图B.等高条形图 C.2×2列联表 D.以上均不对 答案:B 2.在等高条形图形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( ) A. a a+b 与 d c+d B. c a+b 与 a c+d C. a a+b 与 c c+d D. a a+b 与 c b+c 答案:C 3.对分类变量X与Y的随机变量K2的观测值k,说法正确的是( ) A.k越大,“ X与Y有关系”可信程度越小 B.k越小,“ X与Y有关系”可信程度越小 C.k越接近于0,“X与Y无关”程度越小 D.k越大,“X与Y无关”程度越大 答案:B

4.下面是一个2×2列联表: 则表中a、b的值分别为( ) A.94、96 B.52、50 C.52、54 D.54、52 答案:C 5.性别与身高列联表如下: 那么,检验随机变量K2的值约等于 ( ) A.0.043 B.0.367 C.22 D.26.87 答案:C 6.给出列联表如下: 根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是( ) A.0.4 B.0.5 C.0.75 D.0.85 答案:B

?素能提高 1.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲,下列说法中正确的是( ) A .男人、女人中患有色盲的频率分别为0.038、0.006 B .男人、女人患色盲的概率分别为19240、3 260 C .男人中患色盲的比例比女人中患色盲的比例大,患色盲是与性别有关的 D .调查人数太少,不能说明色盲与性别有关 解析:男人患色盲的比例为38480,比女人中患色盲的比例6 520 大, 其差值为?? ???? 38480-6520≈0.067 6,差值较大. 答案:C 2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 由K 2= 算得, K 2= ≈7.8. 附表: P (K 2≥k 0) 0.050 0.010 0.001 k 0 3.841 6.635 10.828 参照附表,得到的正确结论是( ) A .有99%以上的把握认为“爱好该项运动与性别有关”

随机变量及其分布列与独立性检验练习题附答案

数学学科自习卷(二) 一、选择题 1.将三颗骰子各掷一次,记事件A =“三个点数都不同”,B =“至少出现一个6点”,则条件概率()P A B ,() P B A 分别是( ) A.6091,12 B.12,6091 C.518,6091 D.91216,12 2.设随机变量ξ服从正态分布()3,4N ,若()()232P a P a ξξ<-=>+,则a 的值为 A .73 B .53 C .5 D .3 3.已知随机变量ξ~)2,3(2N ,若23ξη=+,则D η= A . 0 B . 1 C . 2 D . 4 4.同时拋掷5枚均匀的硬币80次,设5枚硬币正好出现2枚正面向上,3枚反面向上的次数为ξ,则ξ的数学期望是( ) A .20 B .25 C. 30 D .40 5. 甲乙两人进行乒乓球比赛, 约定每局胜者得1分, 负者得0分, 比赛进行到有一人比对方多2分或打满6局时停止, 设甲在每局中获胜的概率为 23,乙在每局中获胜的概率为13 ,且各局胜负相互独立, 则比赛停止时已打局数ξ的期望()E ξ为( ) A .24181 B .26681 C .27481 D .670243 6.现在有10奖券,82元的,25元的,某人从中随机无放回地抽取3奖券,则此人得奖金额的数学期望为( ) A .6 B .395 C .415 D .9 7.一个篮球运动员投篮一次得3分的概率为a ,得2分的概率为b ,不得分的概率为c ,,,(0,1)a b c ∈,且无其它得分情况,已知他投篮一次得分的数学期望为1,则ab 的最大值为 ( ) A .148 B .124 C .112 D .16 8.位于数轴原点的一只电子兔沿着数轴按下列规则移动:电子兔每次移动一个单位,移动的方向向左或向右,并且向左移动的概率为 23,向右移动的概率为13,则电子兔移动五次后位于点(1,0)-的概率是 ( ) A .4243 B .8243 C .40243 D .80243

2018 高考 回归分析和独立性检验专题复习(学生版)

回归分析与独立性检验 (一)变量间的相关关系、回归分析的基本思想及初步运用 一、相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系. 二、散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图. 三、回归分析:对具有相关关系的两个变量进行统计分析的方法叫回归分析. 1、回归直线方程 设所求的直线方程为y b x a ∧ =+,其中1 2 1 ()() ,() n i i i n i i x x y y b a y b x x x ==--==--∑ ∑ ,1 1 11,,n n i i i i x x y y n n === = ∑ ∑ (,) x y 称为样本点的中心,回归直线过样本点的中心.回归方程的截距a 和斜率b 是用最小二乘法计算出来的. 2、相关系数:两个变量之间线性相关关系的强弱用相关系数r 来衡量. 相关系数:()() n i i x x y y r --= ∑ 0r >,表示两个变量正相关;0r <,表示两个变量负相关; r 的绝对值越接近1,表明两个变量的线性相关性越强.r 的绝对值越接近0,表明两个变量之间几乎不存在 线性相关关系.通常,r 的绝对值大于0.75时,表明两个变量的线性相关性很强. (二)独立性检验的基本思想及其初步运用 一、用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例:是否吸烟,是否患肺癌等 二、独立性检验的方法:列出两个分类变量的频数表(列联表),直观判断.一般步骤: (1)2*2列联表 (2)提出假设:设p 与q 没有关系 (3)根据列联表中的数据2 K 计算的值

1独立性检验(应用检测题)

本套试题考查的内容比较全面,独立性检验的概念与方法、2×2列联表、随机变量2 K 的值、三维柱形图、二维条形图、等高条形图等知识点在试题中都得到了充分体现,很多试题与现实生活相联系,新颖别致,有大量的原创与改编试题。 独立性检验的基本思想及其初步应用同步测试题 A 组 一、选择题 1.独立性检验中的统计假设就是假设两个事件A 、B ( ) A 互斥 B 不互斥 C 相互独立 D 不独立 2.在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就 ( ) A. 越大 B. 越小 C.无法判断 D. 以上都不对 3.2010年3月26日,韩国军舰“天安”号发生不明原因爆炸事故离奇沉没,5月20日韩国军民联合调查团公布的调查结果说天安舰是遭受朝鲜小型潜水艇发射的鱼雷攻击而沉没的。对此,许多网民表达了自己的意见,有的网友进行了调查,在参加调查的4258名男性公民中有2360名认为是朝鲜所为,3890名女性公民中有2386人认为朝鲜是遭陷害,在运用这些数据说明天安舰事件中朝鲜是否冤枉时用什么方法最有说服力?( ) A 平均数 B 回归分析 C 独立性检验 D 方差 4.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅下表来确定断言“X 和Y 有关系”的可信度。如果k>5.024,那么就有把握认为“X 和Y 有关系”的百分比为 A.25% B.75% C.2.5% D.97.5% 5.假设有两个分类变量X 和Y ,它们的值域分别为},{21x x 和},{21y y ,其2×2列联表为: 对以下数据,对同一样本能说明X与Y有关的可能性最大的一组为( ) A .5=a ,4=b ,3=c ,2=d B .5=a ,3=b ,4=c ,2=d C .2=a ,3=b ,4=c ,5=d D .2=a ,3=b ,5=c ,4=d 6.考察玉米种子经过药物处理跟生病之间的关系得到如下表数据:

卡方独立性检验

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数(f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况: 卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。

高考试题回归分析,独立性检验

高考试题回归分析,独 立性检验 TTA standardization office【TTA 5AB- TTAK 08- TTA 2C】

回归分析与独立性检验 1.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生. 从这次考试成绩看, ①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ; ②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 . 2.根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A .逐年比较,2008年减少二氧化碳排放量的效果最显着 B .2007年我国治理二氧化碳排放显现成效 C .2006年以来我国二氧化碳年排放量呈减少趋势 D .2006年以来我国二氧化碳年排放量与年份正相关 3.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 根据上表可得回归直线方程???y bx a =+ ,其中???0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元 家庭年支出为( )] A .万元 B .万元 C .万元 D .万元 4.在画两个变量的散点图时,下面哪个叙述是正确的 ( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在 y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上 5 2004年 2005年 2006年 2007年 2008年 2009年 2010年 2011年 2012年 2013年

独立性检验高考真题(2017年-2018年))

2017年全国卷2文科数学 19.(12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg), 其频率分布直方图如下: (1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率; (2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关: 箱产量 (1)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行较。 附: 【解析】(1)旧养殖法的箱产量低于的频率为 因此,事件A的概率估计值为0.62.

(2)根据箱产量的频率分布直方图得列联表 K2= 由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关. (3)箱产量的频率分布直方图平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法. 2018全国卷3 18.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式,为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人第一组工人用第一种生产方式,第二组工人用第二种生产方式,根据工人完成生产任务的工作时同(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由: (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不 ? 解:(1)第二种生产方式的效率更高. 理由如下: (i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至

独立性检验练习含答案

§ 独立性检验 一、基础过关 1.当χ2>时,就有________的把握认为“x 与y 有关系”. 2.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则χ2≈__________.(结果保留3位小数) 3.分类变量X 和Y 的列表如下,则下列说法判断正确的是________.(填序号) y 1 y 2 总计 x 1 ( a b a +b x 2 c d c +d 总计 a +c b +d & a + b + c +d ①ad -bc 越小,说明X 与Y 的关系越弱; ②ad -bc 越大,说明X 与Y 的关系越强; ③(ad -bc )2越大,说明X 与Y 的关系越强; ④(ad -bc )2越接近于0,说明X 与Y 的关系越强. 4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 】 爱好 40 20 60 不爱好 20 30 50 总计 60 % 50 110 由 χ2=n ad -bc 2 a + b c + d a +c b +d 算得, χ2=110×40×30-20×20260×50×60×50≈. 附表: P (χ2≥k ) k ) 参照附表,得到的正确结论是________. ①在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别有关”; ②在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别无关”;

③有99%以上的把握认为“爱好该项运动与性别有关”; ④有99%以上的把握认为“爱好该项运动与性别无关”. 5.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸 . 年龄 合计 不超过40岁 超过40岁 吸烟量不多于20支/天 50 15 65 ) 吸烟量多于20支/天 10 25 35 合计 60 40 100 则有________的把握确定吸烟量与年龄有关. 二、能力提升 — 6.某高校“ 专业 性别 非统计专业 统计专业 合计 男 13 10 23 | 女 7 20 27 合计 20 30 50 为了判断主修统计专业是否与性别有关,根据表中的数据,得χ2=50×13×20-10×7 2 23×27×20×30 ≈. 因为χ2≈>,所以判断主修统计专业与性别有关系,那么这种判断出错的可能性为________. 7.在2×2列联表中,若每个数据变为原来的2倍,则卡方值变为原来的________倍. ~ 8.下列说法正确的是________.(填序号) ①对事件A 与B 的检验无关,即两个事件互不影响; ②事件A 与B 关系越密切,χ2就越大; ③χ2的大小是判断事件A 与B 是否相关的惟一数据; ④若判定两事件A 与B 有关,则A 发生B 一定发生. 9.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据: 无效 有效 总计 ( 男性患者 15 35 50 女性患者 6 44 50

《独立性检验》教案)

《独立性检验》教案 一、教学目标 1、知识与技能: 通过典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能利用独立性检验的基本思想来解决实际问题. 2、过程与方法: 通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题。通过列联表、等高条形图,使学生直观感觉到吸烟和患肺癌可能有关系.这一直觉来自于观测数据,即样本.问题是这种来自于样本的印象能够在多大程度上代表总体?这节课就是为了解决这个问题,让学生亲身体验直观感受的基础上,提高学生的数据分析能力. 3、情感态度价值观: 通过本节课的学习,加强数学与现实生活的联系。以科学的态度评价两个分类变量有关系的可能性。培养学生运用所学知识,解决实际问题的能力。对问题的自主探究,提高学生独立思考问题的能力;让学生对统计方法有更深刻的认识,体会统计方法应用的广泛性,进一步体会科学的严谨性。教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性。 二、教学重点 理解独立性检验的基本思想及实施步骤. 三、教学难点 1.了解独立性检验的基本思想; 2.了解随机变量K2的含义,K2的观测值很大,就认为两个分类变量是有关系的。 四、教学方法 以“问题串”的形式,层层设疑,诱思探究。用“讲授法”,循序渐进,引导学生,步步为营,螺蜁上升探究本节课的知识内容. 五、教学过程设计

环 节 互动意图创 设情景、引入新课课下预习,搜集有关分类变量有无关系的一些实例。 情境引入、提出问题:1、吸烟与患肺癌有关系吗? 2、你有多大程度把握吸烟与患肺癌有关? 组织引 导学生 课下预 习问题 背景, 初步明 确定要 解决 “吸烟 与患肺 癌”之 间的关 系问 题. 好的课 堂情景 引入, 能激发 学生求 知欲, 是新问 题能够 顺利解 决的前 提条件 之一. 初步探索、展示内涵 变量有定量变量、分类变量,定量变量—回归分析;分类变 量—独立性检验,引出课题。 问题1、我们在研究“吸烟与患肺癌的关系”时,需要关注哪一些 量呢? 列联表:分类变量的汇总统计表(频数表). 一般我们只 研究每个分类变量只取两个值,这样的列联表称为2*2列联表 . 如吸烟与患肺癌的列联表: 不患肺癌患肺癌总计 不吸烟7775 42 7817 吸烟2099 49 2148 总计9874 91 9965 问题2:由以上列联表,我们估计吸烟是否对患肺癌有影响?①在 不吸烟者中患肺癌的比例为________;②在吸烟者中患肺癌的比 例为________. 1,教师 通过举 例,引 入分类 变量这 个新概 念.引 出课题 2,组织 学生填 表讨论 问题, 初步得 到问题 的结 论. 从实际 问题出 发引入 概念, 提出问 题有利 于学生 明白我 们要学 习这节 课的必 要性。。

高考数学专题03 独立性检验(第四篇)(原卷版)

备战2020年高考数学大题精做之解答题题型全覆盖高端精品 第四篇概率与统计 专题03 独立性检验 【典例1】【2018年全国卷Ⅲ理数高考试题】 某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表: (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附: () ()()()() 2 2 n ad bc K a b c d a c b d - = ++++ ,

分析:(1)计算两种生产方式的平均时间即可. (2)计算出中位数,再由茎叶图数据完成列联表. (3)由公式计算出2k,再与6.635比较可得结果. 【典例2】【2020届湖北省武汉市武昌区高三元月调研考试】 某健身馆在2019年7、8两月推出优惠项目吸引了一批客户.为预估2020年7、8两月客户投入的健身消费金额,健身馆随机抽样统计了2019年7、8两月100名客户的消费金额,分组如下:[0,200),[200,400),[600),…,[1000,1200](单位:元),得到如图所示的频率分布直方图: 400, (1)请用抽样的数据预估2020年7、8两月健身客户人均消费的金额(同一组中的数据用该组区间的中点值作代表); (2)若把2019年7、8两月健身消费金额不低于800元的客户,称为“健身达人”,经数据处理,现在列联表中得到一定的相关数据,请补全空格处的数据,并根据列联表判断是否有95%的把握认为“健身达人”与性别有关?

相关主题
文本预览
相关文档 最新文档