当前位置:文档之家› 乘列联表练习题

乘列联表练习题

1.近几年出现各种食品问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病.为了解三高疾病是否与性别有关,医院随机对入院的60人进行了问卷调查,得到了如下的列联表:

(1)请将如图的列联表补充完整;若用分层抽样的方法在患三高疾病的人群中抽9人,其中女性抽多少人?

(2)为了研究三高疾病是否与性别有关,请计算出统计量2

K,并说明你有多大的把握认为三高疾病与性别有关?

2.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进

已知在全班50人中随机抽取1人,抽到喜爱打篮球的学生的概

率为3 5 .

(1)请将上表补充完整(不用写计算过程);

(2)能否有99.5﹪的把握认为喜爱打篮球与性别有关?说明你的理由.

3.某班主任对班级22名学生进行了作业量多少的调查,数据如下表:在喜欢玩电脑游戏的12中,有10人认为作业多,2人认为作业不多;在不喜欢玩电脑游戏的10人中,有3人认为作业多,7人认为作业不多。

求:(1)根据以上数据建立一个22

列联表;

(2)试问喜欢电脑游戏与认为作业多少是否有关系?

4.有甲、乙两个工厂生产同一种产品,产品分为一等品和二等

品.为了考察这两个工厂的产品质量的水平是否一致,从甲、

乙两个工厂中分别随机地抽出产品109件,191件,其中甲工

厂一等品58件,二等品51件,乙工厂一等品70件,二等品

121件.

(1)根据以上数据,建立2×2列联表;

(2)试分析甲、乙两个工厂的产品质量有无显著差别(可靠性不

低于99%).

5.某高中课外活动小组调查了100名男生与100名女生报考文、

理科的情况,下图为其等高条形图:

(1)绘出2×2列联表;

(2)利用独立性检验方法判断性别与报考文、理科是否有关系?若有关系,所得结论的把握有多大?

文科

理科

0.2

0.4

0.6

0.8

1

男 女

参考答案

1.(1)3人;(2)有99.5%的把握认为是否患三高疾病与性别有关系.

【解析】

试题分析:(1)根据题中所给数据,通过2×2连列表,直接将如图的列联表补充完整;通过分层抽样求出在患三高疾病的人群中抽9人的比例,即可求出女性抽的人数.(2)通过题中所给共识计算出2K ,结合临界值表,即可说明有多大的把握认为三高疾病与性别有关.

在患三高疾病人群中抽9人,则抽取比例为

41369= ∴女性应该抽取34112=?

人. 6分 (2)∵24

363030)1261824(602

2????-?=K 8分 879.710>=, 10分

那么,我们有99.5%的把握认为是否患三高疾病与性别有关系. 12分.

考点:1.分成抽样;2.独立性检验.

2.(1)详见解析;(2)有99.5﹪的把握认为喜爱打篮球与性别有关.

【解析】

试题分析:(1)首先通过全班50人中随机抽取1人,抽到喜爱打篮球的学生的概率为

35,得出喜爱打篮球的共有30人,进而完善此表;(2)通过列联表代入计算公式,得到2K 的值,

再查对临界值表,据此回答能否有99.5﹪的把握认为喜爱打篮球与性别有关.

(2)22

()()()()()n ad bc K a b c d a c b d -=++++50(2015105)7.87930202525??-?=≈??? ∴有99.5﹪的把握认为喜爱打篮球与性别有关.

考点:独立性检验.

(2) 有97.5%的把握认为喜欢玩电脑游戏与认为作业多少有

【解析】

试题分析:(1) 根据给出的数据建立22?列联;(2) 计算卡方变量

2

2

22(10732) 6.4181210139k ??-?=≈???,5.024<6.418<6.635,所以有97.5%的把握认为喜欢玩电脑游戏与认为作业多少有关.

试题解析:(1)根据题中所给数据,得到如下列联表:

(2)2

222(10732) 6.4181210139

k ??-?=≈???,5.024<6.418<6.635 ∴有97.5%的把握认为喜欢玩电脑游戏与认为作业多少有关.

在犯错误的概率不超过0.01的前提下不能认为成绩与班级有关系。

考点:1.2×2列联表;2.独立性检验 4.(1)

(2)见解析

【解析】

解:(1)

(2)提出假设H 0:甲、乙两个工厂的产品质量无显著差别.

根据列联表中的数据可以求得

χ2=()2

300581217051109191128172??-????≈7.781 4>6.635. 因为当H 0成立时,P(χ2

>6.635)≈0.01,所以我们有99%以上的把握认为甲、乙两个工厂的产品质量有显著差别.

5.解:(1)由男女生各100人及等高条形图可知报考文科的男生有100×0.4=40人,报考文科的女生有100×0.6=60人 ……2分

∴报考理科的男生有100-40=60人,报考理科的女生有100-60=40人 ……4分

所以2×2列联表如下: ……6分

文科

理科 总计 男 40

60 100 女 60

40 100 总计 100

100 200

(2)由公式计算2K 的观测值: 7.8798100100100100)60604040(2002

>=????-??=k ……10分

又由临界值表知

005.0)879.7(2≥≥K P 所以我们有99.5%的把握认为报考文理科与性别有关系 ……12分

【解析】略

独立性检验中的列表与用表

独立性检验中的列表与用表 224100 江苏省盐城市大丰区南阳中学 潘锦明 独立性检验基本思想中的2×2列联表是考查的重点,其中列表、填表与用表是独立性检验的基本步骤之一。本文就从以下三方面剖析。 一、列表: 关键理清两个分类变量关系,能合理列出分类变量列联表。 例1、网络对现代人的影响较大,尤其是青少年,为了了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了515人调查,发现其中经常上网的有220人,这220人中有37人期末考试不及格,而另外295人中有21人不及格。问:能否有99%的把握认为经常上网会影响学习? 分析:通过阅读,本题包括两个变量,一类是娱乐方式,一类是成绩。 假设“上网与是否影响学习无关”,则2 K 应该很小,由公式得2 K 的观测值 863.11220 29558457)3727421183(5152≈????-??=k ,且01.0)635.6(2≈≥K P . 所以,我们有99%的把握认为“中学生经常上网影响学习”。 点评:在使用2 K 统计量作2×2列联表的独立性检验时,要求表中的4个数据都大于5. 二、填表与用表 这类题首先根据表格数值进行补充,再求解计算。 例2、富士康某生产车间在发年终奖金的时候,为了体现多劳多得的原则,需要对全车 (1)如果随机抽查这个车间的一名工人,那么抽到主动参加车间培训的工人的概率是多少?抽到不太主动参加车间培训的且工作积极性一般的工人的概率是多少? (2)试运用独立性检验的方法分析:工人的工作积极性与对待车间培训的态度是否有 解:(1)主动参加车间培训的工人有24人,总人数为50人,概率25 50== P .

2乘2列联表练习题

1.近几年出现各种食品问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病.为了解三高疾病是否与性别有关,医院随机对入院的60人进行了问卷调查,得到了如下的列联表: (1)请将如图的列联表补充完整;若用分层抽样的方法在患三高疾病的人群中抽9人,其中女性抽多少人? (2)为了研究三高疾病是否与性别有关,请计算出统计量2 K,并说明你有多大的把握认为三高疾病与性别有关? 2.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下列表: 已知在全班50人中随机抽取1人,抽到喜爱打篮球的学生的概 率为3 5 . (1)请将上表补充完整(不用写计算过程); (2)能否有99.5﹪的把握认为喜爱打篮球与性别有关?说明你的理由. 某班主任对班级22名学生进行了作业量多少的调查,数据如下表:在喜欢玩电脑游戏的12中,有10人认为作业多,2人认为作业不多;在不喜欢玩电脑游戏的10人中,有3人认为作业多,7人认为作业不多。

求:(1)根据以上数据建立一个22 列联表; (2)试问喜欢电脑游戏与认为作业多少是否有关系? 4.有甲、乙两个工厂生产同一种产品,产品分为一等品和二等品.为了考察这两个工厂的产品质量的水平是否一致,从甲、乙两个工厂中分别随机地抽出产品109件,191件,其中甲工厂一等品58件,二等品51件,乙工厂一等品70件,二等品121件.(1)根据以上数据,建立2×2列联表; (2)试分析甲、乙两个工厂的产品质量有无显著差别(可靠性不低于99%). 5.某高中课外活动小组调查了100名男生与100名女生报考文、理科的情况,下图为其等高条形图:(1)绘出2×2列联表; (2)利用独立性检验方法判断性别与报考文、理科是否有关系?若有关系,所得结论的把握有多大?维夹綽讼設穡贛谣紼疯槍錮 文科 理科 0.2 0.4 0.6 0.8 1 男 女

非参数统计列联表卡方检验

非参数统计期末大作业 一、Wilcoxon符号秩检验 某个公司为了争夺竞争对手的市场,决定多公司重新定位进行宣传。在广告创意中,预计广告投放后会产生效果。一组不看广告组和一组看广告,抽取16位被 调查者,让起给产品打分。现有数据如下 不看广告62 83 96 99 71 60 97 100 看广告87 92 90 86 94 95 82 91 分析广告效应是否显著。 1、手算 建立假设: H0:广告效应不显著 H1:广告效应显著 不看广告组记为x,看广告组记为y。 X Y D=x-y |D| |D|的秩D的符号 62 87 -25 25 7 - 83 92 -9 9 2.5 - 96 90 6 6 1 + 99 86 13 13 4 + 71 94 -23 23 6 - 60 95 -35 35 8 - 97 82 15 15 5 + 100 91 9 9 2.5 + 由表可知: T+=1+4+5+2.5=12.5 T-=7+2.5+6+8=23.5 根据n=8,T+和T-中较大者T-=23.5,查表得,T+的右尾概率为0.230到0.273,在显著性水平下,P值显然较大,故没有理由拒绝原假设,表明广 告效应不显著。

2、Spss 在spss中输入八组数据(数据1): 选择非参数检验中的两个相关样本检验 对话框中选择Wilcoxon,输出如下结果(输出1): Ranks N Mean Rank Sum of Ranks 看广告- 不看广告Negative Ranks 4a 3.12 12.50

Positive Ranks 4b 5.88 23.50 Ties 0c Total 8 a. 看广告< 不看广告 b. 看广告> 不看广告 c. 看广告= 不看广告 由上表,负秩为4,正秩也为4,同分的情况为0,总共8。负秩和为12.5,正秩和为23.5,与手算结果一致 Test Statistics b 看广告- 不看广 告 Z -.771a Asymp. Sig. (2-tailed) .441 a. Based on negative ranks. b. Wilcoxon Signed Ranks Test 由上表,Z为负,说明是以负秩为基础计算的结果,其相应的双侧渐进显著性结果为0.441,明显大于0.05,因此在的显著性水平下,没有理由拒绝原假设,即表明广告效应不显著,与手算的结论一致。 3、R语言(R语言1) 输入语句: x=c(62,83,96,99,71,60,97,100) y=c(87,92,90,86,94,95,82,91) wilcox.test(x,y,exact=F,cor=F) 输出结果: Wilcoxon rank sum test data: x and y W = 33, p-value = 0.9164 alternative hypothesis: true location shift is not equal to 0 由输出结果可知,P=0.9164,远大于 =0.05,因此没有理由拒绝原假设,即广告效应并不显著,与以上结果一致。

第七章 列联表分析

第七章列联表分析 7.1 列联表(Crosstabs)分析的过程 7.2 列联表的实例分析 7.1 列联表 (Crosstabs) 分析的过程 列联表分析的过程是对两个变量之间关系的分析方法。被分析的变量可以是定类变量也可以是定序变量。系统是通过生成列联表对两个变量进行列联表分析的。 列联表分析的功能可以通过下述操作来实现。 图7-1 列联表分析对话框 1.打开列联表分析对话框 执行下述操作: Analyze→Descriptive→Crosstabs 打开Crosstabs 对话框如图7-1 所示。 2.确定列联分析的变量 从左侧的源变量窗口中选择两个定类变量或定序变量分别进入Row(s)(行)窗口和Column(s)(列)窗口。进入Row(s)窗口的变量的取值将作为行的标志输出,而进入Column(s)窗口的变量的取值将作为列的标志输出。Display clustered bar charts 是在输出结果中显示聚类条图。Suppress table 是隐藏表格,如果选择此项,将不输出R×C 列联表。 3.选择统计分析内容 单击statistics 按钮,打开statistics 对话框,如图7-2 所示。

图7-2statistics 对话框 下面介绍该对话框中的选项和选项栏的内容: (1)Chi-square 是卡方(X2)值选项,用以检验行变量和列变量之间是否独立。适用于定类变量和定序变量。 (2)Correlations 是皮尔逊(Pearson)相关系数r 的选项。用以测量变量之间的线性相关。适用于定序或数值变量(定距以上变量)。 (3)Nominal 是定类变量选项栏。选项栏中的各项是当分析的两个变量都为定类变量时可以选择的参数。 1)Contingency coefficient:列联相关的C 系数,由卡方系数修正而得。 2) Phi and Cramer's V:列联相关的V 系数,由卡方系数修正而得。 3)Lambda:λ系数。 4)Uncertainty Coefficient:不定系数。 (4)Ordinal 是定序变量选项栏。选项栏中的各项是当分析的两个变量都为定序变量时可以选择的参数。 1)Gramma:Gramma 等级相关系数。 2)Somers’d:Somers 等级相关d 系数。 3)Kendall’s tau-b:肯得尔等级相关tau-b 系数。 4)Kendall’s tau-c:肯得尔等级相关tau-c 系数。 (5)Nominal by Interval 选项栏中的Eta 是当一个变量为定类变量,另一个变量为数值变量时,测量两个变量之间关系的相关比率。 系统默认状态是不输出上述参数。如需要可自行选择。上述选择做完以后,单击Continue 返回到Crosstabs 对话框。 4.确定列联表内单元格值的选项 单击Cells(单元格)按钮,打开Cell Display 对话框,如图7-3 所示。

8.4 列联表独立性分析案例(2)

8.4 列联表独立性分析案例(2) 一、教学目标 (一)知识目标 通过对典型案例(如“新药的副作用 ”“秃顶与患心脏病是否有关系”)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。 (二)能力目标 让学生经历数据处理的过程,提高探索解决问题的能力。 (三)情感目标 通过独立性检验的基本思想的学习,让学生有真正对统计思维和确定思维差异的理解,体会到统计在现实生活的广泛应用。 二、教学重点 理解独立性检验的实施步骤 三、教学难点 理解独立性检验的实施步骤 四、教学过程 (一)引入课题 1.复习 A :独立性检验 B : () ()()()() 2 2 n ad bc k a b c d a c b d -= ++++ 2.独立性检验的思想(类似反证法) (二)案例讲解 了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50位患者服用安慰剂,得到下列实验数据: 请问服用新药是否可产生副作用? 分析: 假定服用新药与产生副作用没有关联.那么,首先要给“没有关联”下一个“能够操作”的定义。根据直观的经验,在服用新药与产生副作用的情形下,这个定义可以是这样的:如果服用新药与产生副作用没有关联,就意味着,无论服用新药与否,产生副作用的概率都是一样的。就此例题而言: .19.0100 19)(== 全体实验者产生副作用 P , 3.050 15)(== 服用新药产生副作用 P 二者相差较大。由此可以推断,开始的假设是不成立的。也就是说,服用新药与产生副作用是有关联的。

由统计的常识知道,要求等号成立是非常苛刻的条件,实际上一般也是办不到的,我们所能追求的是在概率意义下的可靠性。对于上面的独立性问题,我们应当寻找一个适当的统计量,用它的大小来说明独立性是否成立。在统计中,我们引入下面的量 在前面的例 子中 a =15, b =35, c =4, d =46。注意到独立性要求: P (全体生实验者产生副作用)=P (服用新药产生副作用) 即 b a a n c a += + 这等价于 n a n c a n b a = +? + 因此,可以用n c a n b a n a +? +- 的大小来衡量独立性的好坏。 问题: (1)用 n c a n b a n a +?+- + n d b n b a n b +?+- + n c a n d c n c +? +- + n d b n d c n d +? +- 是不是更好些? (2)用n c a n b a n c a n b a n a +?++?+- | | 比用n c a n b a n a +? +-合理,你认为有道理吗? (3)为了得到统计量的近似的分布,统计学家最终选用了: Q 2 =?? ??? ? ??+?++?+-++?++?+-++?++?+-++?++?+-n d b n d c n d b n d c n d n d c n c a n d c n c a n c n d b n b a n d b n b a n b n c a n b a n c a n b a n a n 2222)()()()( 用它的大小来衡量独立性的大小,你能把它化简得到下式吗? ,) )()()(() (2 2 d b c a d c b a bc ad n Q ++++-= c +

高中数学 8_4 列联表独立性分析案例同步精练 湘教版选修2-31

高中数学 8.4 列联表独立性分析案例同步精练湘教版选修2-3 基础巩固 1在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( ) A.若χ2=6.64,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病 B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病 C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误 D.以上三种说法都不正确 2由下表中的数据计算χ2的值约为( ) A.9.45 B.6.08 C.1.78 D.0.01 3博士生和研究生毕业情况的一个随机样本给出了关于所获取的学位类别与学生性别的分类数据如下表,由表中的数据,可得( )

A .性别与获取学位类别有关 B .性别与获取学位类别无关 C .性别决定获取学位的类别 D .以上说法都不正确 4关于2×2列联表: 下列说法正确的是( ) A .表中的数据n 11,n 12,n 21,n 22可以取任意的正整数 B .n =n +1+n 2+ C .χ2= n n 11n 12-n 21n 222 n 1+n 2+n +1n +2 D .两个因素X ,Y 的值域分别为{A ,A },{B ,B } 5为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表: 药物效果与动物试验列联表 患病 未患病 总计 服用药 10 45 55 没服用药 20 30 50 总计 30 75 105 依据表中的数据求χ2≈________.(精确到0.01)

6为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后14小时的结果如下表所示: 列联表独立性分析时的假设是______________________________. 7为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在现场时,990件产品中合格品有982件,次品有8件,甲不在现场时,510件产品中,合格品有493件,次品有17件.试用列联表独立性分析的方法对数据进行分析. 综合过关 8有人发现多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果: 则大约有________的把握认为多看电视与人变冷漠有关系.〔已知P(χ2≥10.828)≈0.001〕9某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:

(整理)2频数分析列连表.

1 频数分析 (Descriptive Statistics - Frequencies) 频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。 下面我们通过例子来学习单变量频数分析操作。 1) 输入分析数据 在数据编辑器窗口打开“data1-2.sav”数据文件。 2)调用分析过程 在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图3-4所示的对话框。 图3-4 “Frequencies” 对话框

3)设置分析变量 从左则的源变量框里选择一个和多个变量进入“Variable(s):”框里。在这里我们选“三化螟蚁螟 [虫口数]”变量进入“Variable(s):”框。 4)输出频数分布表 Display frequency tables,选中显示。 5)设置输出的统计量 单击“Statistics”按钮,打开图3-5所示的对话框,该对话框用于选择统计量: 图3-5 “Statistics”对话框

① 选择百分位显示“Percentiles Values”栏: Quartiles:四分位数,显示25%、50%和75%的百分位数。 Cut points for 10 equal groups:将数据平分为输入的10个等份。 Percentile(s)::用户自定义百分位数,输入值0—100之间。选中此项后,可以利用“Add”、“Change”和 “Remove”按钮设置多个百分位数。 ② 选择变异程度的统计量“Dispersion”:(离散趋势) Std.deviation 标准差Minimum 最小值 Variance 方差Maximum 最大值 Range 极差S.E.mean 均值标准误 ③ 选择表示数据中心位置的统计量“Central Tendency”:(集中趋势) Mean 均值 Median 中位数 Mode 众数 Sum 算术和 ④ 选择分布指标“Distribution”: Skewness 偏度 Kurtosis 峰度 6) 统计图形输出设置 单击“Charts”按钮,将弹出如图3-6所示的对话框:

最新应用SPSS软件进行列联表分析

应用SPSS软件进行列联表分析 在许多调查研究中,所得到的数据大多为定性数据,即名义或定序尺度测量的数据。例如在一项全球教育水平的研究中,调查了400余人的个人信息,包括性别、学历、种族等,对原始资料进行整理就可以得到频数分布表。 定义四个变量:gender(性别)、educat(学历)、minority(种族)、count(人数),其中前三个为分类变量,并且gender变量取值为0、1,标签值定义为:0表示female,1表示male;educat变量取值为1、2、3,标签值定义为:1表示学历低,2表示学历中等,3表示学历高;minority变量值为0、1,标签值定义为:0表示非少数种族,1表示为少数种族。下面做gender、educat、minority的三维列联表分析及其独立性检验。数据文件如图1所示。 图1 第一步:用“count”变量作为权重进行加权分析处理。从菜单上依次选Data--weight Cases 命令,打开对话框,如图2所示。

图2 点选Weight Cases by项,并将变量“count”移入Frequency Variable栏下,之后单击OK按钮。 第二步:从菜单上依次点选Analyze--Deseriptive Statistics--Crosstabs命令,打开列联分析对话框(Crosstabs),如图3所示。 图3 第三步:在Crosstabs对话框中,如图4将变量性别gender从左侧的列表框内移入行变量Row(s)框内,并将受教育年限编码后得到的学历变量educat移入列变量Column(s)框内(若

此时单击OK按钮,则会输出一个2*3的二维列联表)。这里要输出一个三维列联表,将变量种族minority作为分层变量移入Layer框中,并且可以勾选左下方的Display clustered bar charts项,以输出聚集的条形图,如图8图9所示。 图4 第四步:选择统计量,单击Cosstabs对话框下侧的Statistics按钮,打开其对话框,如图5 所示。 图5 在Statistics对话框内,勾选Chi-square项,以输出表2进行独立性检验。这里由于不是定距

第12章 列联表和对应分析

第十二章 列联表和对应分析 我们前面介绍的相关分析可以用来分析定量变量之间的关系,但不能用于定性变量的分析。本章介绍的列联表检验和对应分析方法则可以用来分析定性变量之间的关系。 第一节 列联表与独立性检验 【例12.1】美国的一般社会调查(General Social Survey )是由美国芝加哥大学的民意调查中心进行的一项随机抽样调查,调查对象为18岁以上的成年人。调查中获得了居民的婚姻状况和幸福状况方面的数据。下面我们根据1996年的调查结果来分析两个变量之间的关系(数据文件gss96.sav )。在调查中,婚姻状况的取值为已婚、丧偶、离异、分居和未婚(分别用1-5表示);幸福状况的取值为:非常幸福、比较幸福和不太幸福(分别用1-3表示)。在SPSS 软件中打开数据文件,选择“分析”→“描述统计”→“交叉表”,把“婚姻状况”设为行变量,把“幸福状况”设为列变量,可以得到表12-1所示的列联表。从表中我们可以看出,从婚姻状况看,已婚人员的比重最高;从幸福状况看,比较幸福的人员比重最高。但从表中我们很难直观地看出两个变量之间的内在联系。 表12-1 婚姻状况和幸福状况列联表 幸福状况 合计 非常幸福 比较幸福 不太幸福 婚姻状况 已婚 574 726 82 1382 丧偶 70 149 59 278 离异 83 292 79 454 分居 14 73 30 117 未婚 136 419 99 654 合计 877 1659 349 2885 要研究二维列联表中的两个变量是否相互独立,可以使用我们在非参数检验中讲过χ2 检验。检验的零假设和备择假设为 H 0:婚姻状况和幸福状况这两个变量相互独立;H 1:婚姻状况和幸福状况不相互独立。 假定样本量为n ,列联表有r 行、s 列,表中各行的合计值分别为r i R i ,,2,1,Λ=,各列的合计值分别为s j C j ,2,1,Λ=。每个单元格中的频数为j i O ,。在零假设成立,即行变量和列变量相互独立时,每个单元格频数的期望值可以按照式(12-1)计算: n C R n n C n R E j i j i ij ?= ??= (12-1) 显然,如果期望频数ij E 和观测频数ij O 相差不大,则零假设可能是正确的;如果二者差别很大,则零假设可能不成立。按照式(12-2)构造检验统计量:

8.3.1分类变量与列联表8_3_2 独立性检验--高中数学选择性必修三同步训练(人教A版2019)

8.3列联表与独立性检验 8.3.1 分类变量与列联表 8.3.2 独立性检验 基础过关练 题组一分类变量与列联表 1.(2020河南南阳六校高二下联考)下面是一个2×2列联表: y1y2合计 x135 a 70 x215 15 30 合计50 b 100 其中a,b处填的值分别为. 2.根据如图所示的等高堆积条形图可知吸烟与患肺病关系(填“有”或“没有”). 3.某学校对高三学生进行了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高堆积条形图,利用条形图判断该校高三学生考前心情紧张与性格类型是否有关系.

题组二独立性检验及其应用 4.下列说法中不正确的是( ) A.独立性检验是检验两个分类变量是否有关的一种统计方法 B.独立性检验得到的结论一定是正确的 C.独立性检验的样本不同,其结论可能不同 D.独立性检验的基本思想是带有概率性质的反证法 5.(2020陕西榆林高二下阶段测试)在一项中学生近视情况的调查中,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时最有说服力的方法是( ) A.平均数与方差 B.回归分析 C.独立性检验 D.概率 6.某学校食堂对30名高三学生偏爱蔬菜与偏爱肉类进行了一次调查,将统计数据制成如下表格: 偏爱蔬菜偏爱肉类男生/人 4 8 女生/人16 2 则认为偏爱蔬菜与偏爱肉类与性别有关的把握至少有( ) 附:χ2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) ,n=a+b+c+d. α0.01 0.005 0.001 xα 6.635 7.879 10.828 A.95% B.99% C.99.5% D.99.9%

《8.4 列联表独立性分析案例》教案

《4.3 列联表独立性分析案例》教案 教学目标 (一)知识与技能:通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。 (二)过程与方法: 在本节知识的学习中,应使学生从具体问题中认识进行独立性检验的作用及必要性,树立学好本节知识的信心,在此基础上学习三维柱形图和二维柱形图,并认识它们的基本作用和存在的不足,从而为学习下面作好铺垫,进而介绍K的平方的计算公式和K的平方的观测值R的求法,以及它们的实际意义。从中得出判断“X与Y有关系”的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种判断的可靠程度的具体做法和可信程度的大小。最后介绍了独立性检验思想的综合运用 (三)情感、态度与价值观:通过本节知识的学习,首先让学生了解对两个分类博变量进行独立性检验的必要性和作用,并引导学生注意比较与观测值之间的联系与区别,从而引导学生去探索新知识,培养学生全面的观点和辨证地分析问题,不为假想所迷惑,寻求问题的内在联系,培养学生学习数学、应用数学的良好的数学品质。加强与现实生活相联系,从对实际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系。明确数学在现实生活中的重要作用和实际价值。教学中,应多给学生提供自主学习、独立探究、合作交流的机会。养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的知识来解决实际问题。教学重点: 理解独立性检验的基本思想及实施步骤. 教学难点: K的含义. 了解独立性检验的基本思想、了解随机变量2 教学方法: 诱思探究教学法 学习方法: 自主探究、观察发现、合作交流、归纳总结。

乘列联表练习题

乘列联表练习题

————————————————————————————————作者:————————————————————————————————日期:

1.近几年出现各种食品问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病.为了解三高疾病是否与性别有关,医院随机对入院的60人进行了问卷调查,得到了如下的列联表:患三高疾病不患三高疾病合计 男630 女 合计36 (1)请将如图的列联表补充完整;若用分层抽样的方法在患三高疾病的人群中抽9人,其中女性抽多少人? (2)为了研究三高疾病是否与性别有关,请计算出统计量2 K,并说明你有多大的把握认为三高疾病与性别有关? 2.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下列表: 喜爱打篮球不喜爱打篮球合计 男生5 女生10 合计50 已知在全班50人中随机抽取1人,抽到喜爱打篮球的学生的概 率为3 5 . (1)请将上表补充完整(不用写计算过程); (2)能否有99.5﹪的把握认为喜爱打篮球与性别有关?说明你的理由. 3.某班主任对班级22名学生进行了作业量多少的调查,数据如下表:在喜欢玩电脑游戏的12中,有10人认为作业多,2人认为作业不多;在不喜欢玩电脑游戏的10人中,有3人认为作业多,7人认为作业不多。 求:(1)根据以上数据建立一个22 列联表; (2)试问喜欢电脑游戏与认为作业多少是否有关系?

4.有甲、乙两个工厂生产同一种产品,产品分为一等品和二等品.为了考察这两个工厂的产品质量的水平是否一致,从甲、乙两个工厂中分别随机地抽出产品109件,191件,其中甲工厂一等品58件,二等品51件,乙工厂一等品70件,二等品121件. (1)根据以上数据,建立2×2列联表; (2)试分析甲、乙两个工厂的产品质量有无显著差别(可靠性不低于99%). 5.某高中课外活动小组调查了100名男生与100名女生报考文、理科的情况,下图为其等高条形图: (1)绘出2×2列联表; (2)利用独立性检验方法判断性别与报考文、理科是否有关系?若有关系,所得结论的把握有多大? 文 理0 0.2 0.4 0.6 0.8 1 男 女

列联表可以检验变量之间的因果关系

列联表分析是通过分析多个变量在不同取值情况下的数据分布情况,从而进一步分析多个变量之间相互互相关系的一种描述性分析方法。为大家整理的相关的列联表可以检验变量之间的因果关系,供大家参考选择。 列联表可以检验变量之间的因果关系 列联表分析是通过分析多个变量在不同取值情况下的数据分布情况,从而进一步分析多个变量之间相互互相关系的一种描述性分析方法。 案例 试分析山东省两所高中学校的高三毕业生的升学情况,研究两所学校的学生的升学率之间有无明显的差别。 数据 SPSS统计分析与行业应用案例详解+配套光盘+示例>02>正文>原始数据>案例4; 数据分析 执行analyze/descriptive statistics/crosstabs,选择卡方检验,得到如下图 列联表结果 由上图结果可知甲中学的升学率为90.0%,占总升学率的31%;未升学率为10.0%。乙中学升学率为74%,占总的升学率为60.9%,未升学率为26%。 卡方显著性检验 从卡方检验结果可知pearson 卡方值为0.000,小于显著性水平,说明两学校间的升学率是显著相关的。 列联表可以检验变量之间的因果关系 列联表检验是对列联表中两分类变量是否独立的检验,也是假设检验的一个重要内容,称为列联表分析或列联表检验。 在统计实践中,人们经常需要对样本资料进行各种各样的分类,以便分析研究。如果对样本资料按照两个指标变量进行复合分组,其结果必然就是各种双向列联表。对于列联表资料,人们经常需要检验所依据分类的两个变量是否独立或相关。如在市场调查中,将被调查者对所拟推销商品的状态与被调查者的性别或年龄以及职业等指标变量进行双向复合分组,然后检验分类变量是否独立或相关,可发现和确定潜在的购买者群体,等等。这种对列联表

2019年数学2-3讲义+第8章 8.4 列联表独立性分析案例

8.4列联表独立性分析案例 [读教材·填要点] 1.列联表 一般地,对于两个因素X和Y,X的两个水平取值:A和A(如吸烟和不吸烟),Y也有两个水平取值:B和B(如患肺癌和不患肺癌),我们得到下表中的抽样数据,这个表格称为2×2列联表. 2.χ2的求法 公式χ2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) . 3.独立性检验的概念 用随机变量χ2研究两变量是否有关的方法称为独立性检验.4.独立性检验的步骤 要判断“X与Y有关系”,可按下面的步骤进行: (1)提出假设H0:X与Y无关; (2)根据2×2列联表及χ2公式,计算χ2的值; (3)查对临界值,作出判断. 其中临界值如表所示: 表示在H0成立的情况下,事件“χ2≥x0”发生的概率.5.变量独立性判断的依据

(1)如果χ2 >10.828时,就有99.9%的把握认为“X 与Y 有关系”; (2)如果χ2>6.635时,就有99%的把握认为“X 与Y 有关系”; (3)如果χ2>2.706时,就有90%的把握认为“X 与Y 有关系”; (4)如果χ2≤2.706时,就认为没有充分的证据显示“X 与Y 有关系”,但也不能作出结论“H 0成立”,即X 与Y 没有关系. [小问题·大思维] 1.利用χ2进行独立性分析,估计值的准确度与样本容量有关吗? 提示:利用χ2进行独立性分析,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确.如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性. 2.在χ2运算后,得到χ2的值为29.78,在判断因素相关时,P (χ2≥6.64)≈0.01和P (χ2≥7.88)≈0.005,哪种说法是正确的? 提示:两种说法均正确.P (χ2≥6.64)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两因素相关;而P (χ2≥7.88)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两因素相关. [例1] 数据: [解] 由列联表中的数据,得χ2的值为 χ2 =1 633×(30×1 355-224×24)2 254×1 379×54×1 579 ≈68.033>6.635. 因此,有99%的把握认为每一晚打鼾与患心脏病有关系. 解决一般的独立性分析问题,首先由所给2×2列联表确定a ,b ,c ,d ,a +b +c +d 的值,然后代入随机变量的计

2乘2列联表练习题

1 ?近几年出现各种食品问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病.为了解三高疾病是否与性别有关,医院随机对入院的60人进行了问卷调查,得到了如下的列联表: (1)请将如图的列联表补充完整;若用分层抽样的方法在患三高疾病的人群中抽9人,其中女性抽多少人? (2)为了研究三高疾病是否与性别有关,请计算出统计量K2, 并说明你有多大的把握认为三高疾病与性别有关? 2 ?为了解某班学生喜爱打篮球是否与性别有关,对本班50人进 已知在全班50人中随机抽取1人,抽到喜爱打篮球的学生的概 3 率为3. 5 (1)请将上表补充完整(不用写计算过程); (2)能否有99.5 %的把握认为喜爱打篮球与性别有关?说明你的理由. 3 ?某班主任对班级22名学生进行了作业量多少的调查,数据如下表:在喜欢玩电脑游戏的12中,有10人认为作业多,2 人认为作业不多;在不喜欢玩电脑游戏的10人中,有3人认为作业多,7人认为作业不多。 求:(1 )根据以上数据建立一个2 2列联表; (2)试问喜欢电脑游戏与认为作业多少是否有关系?

4. 有甲、乙两个工厂生产同一种产品, 产品分为一等品和二等 品?为了考察这两个工厂的产品质量的水平是否一致,从甲、 乙两个工厂中分别随机地抽出产品 109件,191件,其中甲工 厂一等品58件,二等品51件,乙工厂一等品 70件,二等品 121 件. (1) 根据以上数据,建立 2X2列联表; (2) 试分析甲、乙两个工厂的产品质量有无显著差别 (可靠性不 低于99%). 5. 某高中课外活动小组调查了 100名男生 与100名女生报考文、 (2)利用独立性检验方法判断性别与报考文、理科是否有关 系?若有关系,所得结论的把握 有多大? I ---- 1 理科 匚二I 文科

8.4 列联表独立性分析案例(3)教学设计

8.4 列联表独立性分析案例(3) 一、教学目标 (一)知识目标 通过对典型案例(如“色弱与性别是否有关”“中学生物理考试成绩和吃早点是否相关”)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。 (二)能力目标 让学生经历数据处理的过程,会用所学知识对具体案例进行检验,提高探索解决问题的能力。 (三)情感目标 从实例中发现问题,提高学习兴趣,激发学习积极性和主动性,不断自我完善,养成不断探求知识完善自我的良好态度。 二、教学重点 进一步理解独立性检验的实施步骤 三、教学难点 对临界值的理解作出判断 四、教学过程 (一)引入课题 独立性检验的步骤。 1.若要推断的论述为H1:“X与Y有关系”。可按如下步骤判断H1成立的可能性。 A 通过三维柱形图和二维条形图,粗略判断两个分类变量是否有关系。 B 可以利用独立性检验来考察两个分类变量是否有关系。并能精确判断可靠程度。 2.由观测数据算2 χ,其值越大,说明“X与Y有关系”成立的可能性越大。 3.由临界值表确定可靠程度。 (二)案例讲解 分析:设从表格中提供的统计数据,可以计算得到如下数值: 男性所占百分比:13212 0.48 300 + =;女性所占百分比: 1515 0.52 300 + = 在这300人的样本中,男性色弱患者的百分比:12 0.04 300 ≈;女性色弱的百分比: 5 0.017 300 ≈ 直观上看,300人中男性色弱的比例高于女性(0.040.017 >)。色弱应该与性别有关。下面进一步运用独立性的概念进行检验。

从300人中随机选取一人,设1A 表示男性,2A 表示女性,1B 表示色觉正常,2B 表示色弱。则: 1()0.48P A =,2()0.52P A =,2125 ()0.06300 P B += ≈ P (此人为男性且色弱)=12()0.04P A B = 而12()()0.480.060.028P A P B =?= 显然1212()()()P A B P A P B ≠ P (此人为女性且色弱)=22()0.017P A B =, 22()()0.520.060.031P A P B =?= 显然2222()()()P A B P A P B ≠ 因此,1A 与2B 、2A 与2B 都不是独立的。即色弱与性别有关。 我们用2χ独立性检验的方法计算得: 2 4.006χ≈ 由于220.05 3.84χχ>=,所以认为色弱与性别有关。 (三)巩固练习 为考察高中生的性别与是否喜欢数学课程之关系,在某城市的某校高中生中随机抽取300名学生,如下列联表: 与是否喜欢数学课程之间有关系,为什么? 解:在假设“性别与是否喜欢数学课程之间没有:的前提下,K 2应该很小,并且 P (K 2≥3.841)≈0.05, 而我们所得到的K 2的观察值是≈κ4.513超过3.841,这就意味着“性别与是否喜欢数学课之间有关系”这一结论是错误的可能性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程之间有关系”. (四)课堂小结 可以按如下步骤判断结论成立的可能性: 1.通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度。

2.3 列联表的精确检验

列联表的精确检验 1.1 Fisher检验 有时由于样本量过少,导致过多单元格的期望频数过小,从而导致卡方统计量失效,而 试验药有疗效的人数一样或更多的可能性,即单尾的P值为p = 0.0533 + 0.0039 + 0.0001 = 0.0573 若被择假设为试验药疗效与安慰剂有差异,则计算双尾的P值,也就是考虑和当前观测到的试验药有疗效的人数的概率一样或过更少的可能性,即双尾的P值为p = 0.0533 + 0.0039 + 0.0001 + 0.0498 = 0.1071 1.2 SAS Code data severe; input treat $ outcome $ count; datalines; Test f 10 Test u 2 Control f 2 Control u 4 ; proc freq order=data; weight count; tables treat*outcome / chisq nocol; run;

从输出的“Fisher’s Exact Test”的结果来看,“Left-sided Pr <= F”即的概率,“Right-sided Pr <= F”即的概率,“Table Probability”即的概率,“Two-sided Pr <= P”即双尾的概率。 在输出中还有一个统计量“Continuity Adj. Chi-Square”,它是对卡方统计量的连续性调整,但通常由于偏保守而不被使用。 2 卡方统计量的精确P值和SAS Code 对于卡方统计量,可以得到它的精确P值。 proc freq order=data; weight count; tables treat*outcome / chisq nocol; exact chisq; run;

8.2 多个独立样本R×C列联表资料的卡方检验

第八章c 2 检验 二、多个独立样本R×C列联表资料的c 2 检验

表 8-5 三种不同治疗方法治疗慢性支气管炎的疗效组别 有效 无效 合计 有效率% A 药 35 5 40 87.50 B 药 20 10 30 66.67 C 药 7 25 32 21.88 合计62 40 102 60.78 (24.31) ( ) A T T c - = ? 2 22 2 11 (1)32.74 R C i j i j i j A n n m c == =-= ?? 2.1 频率的比较

表 8-5 三种不同治疗方法治疗慢性支气管炎的疗效 组别 有效 无效 合计 有效率% A 药 35 5 40 87.50 B 药 20 10 30 66.67 C 药 7 25 32 21.88 合计62 40 102 60.78 2.1 多个独立样本频率的比较 (24.31) ( ) A T T c - = ? 2 22 2 11 (1)32.74 R C i j i j i j A n n m c == =-= ?? c 2 (A, B ) =4.419,P =0.036,P ’=0.108

2.2 独立样本频率的比较 表 8-6 儿童急性白血病患者与成年人急性白血病患者的血型分布 分组A 型 B 型 O 型 AB 型合计 儿童30 38 32 12 112 成人19 30 19 9 77 合计49 68 51 21 189 c 2 0.75,3 =1.21,P >0.75 2 2 11 (1)0.695 R C i j i j i j A n n m c == =- = ??

2乘2列联表练习题知识讲解

2乘2列联表练习题

1.近几年出现各种食品问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病.为了解三高疾病是否与性别有关,医院随机对入院的60人进行了问卷调查,得到了如下的列联表: (1)请将如图的列联表补充完整;若用分层抽样的方法在患三高疾病的人群中抽9人,其中女性抽多少人? (2)为了研究三高疾病是否与性别有关,请计算出统计量2 K,并说明你有多大的把握认为三高疾病与性别有关? 2.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下列表: 已知在全班50人中随机抽取1人,抽到喜爱打篮球的 学生的概率为3 5 .

(1)请将上表补充完整(不用写计算过程); (2)能否有99.5﹪的把握认为喜爱打篮球与性别有关?说明你的理由. 3.某班主任对班级22名学生进行了作业量多少的调查,数据如下表:在喜欢玩电脑游戏的12中,有10人认为作业多,2人认为作业不多;在不喜欢玩电脑游戏的10人中,有3人认为作业多,7人认为作业不多。 求:(1)根据以上数据建立一个22 列联表; (2)试问喜欢电脑游戏与认为作业多少是否有关系? 4.有甲、乙两个工厂生产同一种产品,产品分为一等品和二等品.为了考察这两个工厂的产品质量的水平是否一致,从甲、乙两个工厂中分别随机地抽出产品109件,191件,其中甲工厂一等品58件,二等品51件,乙工厂一等品70件,二等品121件. (1)根据以上数据,建立2×2列联表; (2)试分析甲、乙两个工厂的产品质量有无显著差别(可靠性不低于99%).

5.某高中课外活动小组调查了100名男生与100名女生报考文、理科的情况,下图为其等高条形图: (1)绘出2×2列联表; (2)利用独立性检验方法判断性别与报考文、理科是否有关系?若有关系,所得结论的把握有多大? 文科 理科 0 0.0.0.0.男 女

相关主题
文本预览
相关文档 最新文档