当前位置:文档之家› 第三章统计案例3.2独立性检验的基本思想及其初步应用(2)学案(无答案)新人教A版选修2_3

第三章统计案例3.2独立性检验的基本思想及其初步应用(2)学案(无答案)新人教A版选修2_3

第三章统计案例3.2独立性检验的基本思想及其初步应用(2)学案(无答案)新人教A版选修2_3
第三章统计案例3.2独立性检验的基本思想及其初步应用(2)学案(无答案)新人教A版选修2_3

3.2 独立性检验的基本思想及其初步应用(2)

【学习目标】

1.会制作22?列联表;2.了解随机变量2

K 的含义以及观测值k 的计算公式;3.掌握独立性检验的初步应用的一般步骤. 【能力目标】

1.能通过问题收集和采集数据;

2.利用数据制作等高图和列联表;

3.通过数据加工和处理,能对问题做出适当的阐述. 【重点难点】

1.观测值k 的计算;

2. 掌握独立性检验的初步应用的一般步骤.3.通过对典型案例分析,了解独立性检验的基本思想和方法. 【学法指导】

掌握独立性检验的初步应用的一般步骤:①制列联表,②写出假设,③计算观测值,④会查表求出概率,⑤回答问题. 【学习过程】 一.【课前预习】

阅读教材P94-P96;知识要点: ①列联表

一般地,假设有两个分类变量X 和Y ,它们的可能取值分别为

12{,}x x 和12{,}y y ,其样本频数列联表(称为22?列联表)如下表.

②假设:0H 两个分类变量X 和Y 无关;

③观测值的计算2

2

()()()()()

n ad bc K a b c d a c b d -=++++,(计算时注意约分)

④通过观测值查表找出临界值0k ,(使得满足20K k ≥的最大的临界值0k ),从而确定临界

值0k 对应的概率20()P K k ≥。

⑤回答问题:变量X 和Y 无关的可信程度是20()100%P K k ≥?;变量X 和Y 有关的可信

程度是2

0[1()]100%P K k -≥?;变量X 和Y 有关其犯错误的概率不超过2

0()100%

P K k ≥?, 二.【课堂学习与研讨】 类型2 独立性检验

例2.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.试分析学生选报文、理科与对外语的兴趣是否有关?

【归纳】运用独立检验的方法:①制列联表,②写出假设,③计算观测值,④会查表求出概率,⑤结论.

试一试:在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施 ( )

A.三.【课堂检测】

1.若用独立性检验的方法,我们得到能有99%的把握认为变量X 与Y 有关系,则( )

A .2 2.706K ≥

B .2 6.635K ≥

C .2 2.706K <

D .2

6.635K < 2.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是 ( )

①若K 2

的观测值满足2

6.635K ≥,我们有99%的把握认为吸烟与患肺病有关系,那么

在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%

的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误

A .①

B .①③

C .③

D .②

3.某校为了研究初一学生吃零食是否与性别有关,从初一年级抽取了100名学生调查购买零食的费用,规定每月在零食上花费不低于30元的为吃零食较多,每月在零食上花费不满30元的为吃零食较少.根据收集的数据得到了一个22?列联表,并计算得出2

K 的观测值为

4.365k =,则下列结论正确的是 ( )

A.有97.5%的把握认为“初一学生吃零食与性别有关”

B. 有95%的把握认为“初一学生吃零食与性别有关”

C. 该校初一学生中有95%的学生吃零食较多

D. 该校初一学生中有95%的女生吃零食较多 4.下列关于K 2

的说法中,正确的有________.

①2

K 的值越大,两个分类变量的相关性越大;

②若求出2

4 3.841K =>,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;

③独立性检验就是选取一个假设H 0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H 0的推断.

5.某高校统计初步课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:

为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量2

K 的观测值

为2

50(1320107) 4.84423272030

k ??-?=

≈.因为 3.841k >,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________. 四.【课堂小结】

1.独立性检验原理——在假设H 0下,如果出现一个与H 0相矛盾的小概率事件,就推断H 0不成立,且该推断犯错误的概率不超过小概率.

2.利用独立性检验解决问题的基本步骤①制列联表,②写出假设,③计算观测值,④会查表求出概率,⑤回答问题.

【课外作业】

1.有两个分类变量x ,y ,其22?列联表如下表.其中a ,15a -均为大于5的整数,若在犯错误的概率不超过0.1的前提下认为“x 与y 之间有关系”,则a 的取值应为 ( )

A.5或6

B. 6或7 C .7 或8 D .8或9

2.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:

试根据上述数据计算2

K =________,比较这两种手术对病人又发作心脏病的影响有没有差别__________.

3.某小学对232名小学生调查发现:180名男生中有98名有多动症,另外82名没有多动症,52名女生中有2名有多动症,另外50名没有多动症,用独立性检验的方法判断多动症与性别_______(填“有关”或“无关”).

.

4. 某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,有________________%的把握认为糖尿病患者与遗传有关系.( )

5.某教育科研机构研发了一款新的学习软件,为了测试该软件的受欢迎程度,该公司在某市的两所初中和两所小学按分层抽样法抽取部分学生进行了调研.已知这四所学校在校学生有9000人,其中小学生5400人,参加调研的初中生有180人. (1)参加调研的小学生有多少人?

(2)该科研机构将调研的情况统计后得到下表:

请将上表填写完整,并据此说明是否有99.9%的把握认为“喜爱使用该学习软件”与“学生年龄”有关?

卫生统计学考试试题及答案(附解释)题库

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 直方图(适用于数值变量,连续性资料的频数表变量) 直条图(适用于彼此独立的资料) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E ? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

高中数学第三章统计案例3.1独立性检验假设检验(hypothesistesting素材苏教版选修2_3202012251102

假设检验(hypothesis testing) 方法演变:t检验、z检验、F检验、卡方检验,方差分析( ANOVA) ?概述 假设检验是分析数据的一种方法。回答此类问题:“随机发生的事件的概率是多少?”另一方面的问题是:“我们从数据中发现的结果是真的吗?”当问题是有关大的总体而只能得到总体的一个样本时用假设检验。这种方法被用来回答在质量改进中一系列重要的问题,如“我们在过程中所做的改变对产出创造了有意义的差别吗?”或”顾客对场地A的满意度是不是比其他场地高?” 最常用的检验是:z检验、t检验、F检验、卡方(χ2)检验和方差分析。这些检验和其他的检验都是基于均值、方差、比例及其他统计量所形成的具有常见模式的频率分布。最有名的分布就是正态分布,它是:检验的基础。t检验、F检验和卡方(χ2)检验是基于t分布、F分布和卡方分布。 ?适用场合 ·想知道一组或更多组数据的平均值、比例、方差或其他特征时; ·当结论是基于更大总体中所取得的样本时。 例如: ·想确定一个过程的均值或方差有否改变; ·想确定很多数据集的均值或方差是否不同: ·想确定两组不同的数据集的比例是否不同; ·想确定真正的比例、均值或方差是否和一个定值相等(或大于或小于)。 ?实施步骤 假设检验的步骤由三部分组成:理解要解决的问题并安排检验(以下步骤1~3);数字计算通常由计算机完成(步骤4和步骤5);应用数值结果到实际问题中(步骤6)。虽然计算机能处理数字,但理解假没检验隐含的观念对第1部分和第3部分至关重要。 如果第一次接触假设检验,那么从看“注意事项”中的术语和定义开始。这些定义解释了假设检验的慨念,然后再回来看这个步骤。 本书不可能详细地涉及假设检验。这个步骤是个综述和快速参考。要得到更多的信息,查阅统计学参考书或请教统计学家。 1确定要从数据中获得的结论。选择适当的检验方法。用哪种检验取决于检验的目的和数据的种类。可以用表5.7和表5.8概括的常用的假设检验,或者请教统计学家以得到帮助。 2建立零假设和备择假设。确定问题是属于双尾检验、左尾检验还是右尾检验。 3选择显著性水平。。 4计算检验统计量,可借助计算机软件。 5用统计分布的统计表或计算机程序等来确定检验统计量的P值。对于z检验可用表A.1正态曲线以下的曲线。 6把P值与左尾或右尾检验的α或者双尾检验的α/2作比较,如果P值较小,那么拒绝零假设并会得到备择假设可能正确的结论。否则,不能拒绝零假设,并得出没有足够证据支持备择假设的结论。 ?备择步骤 步骤1~4同上。然后: 5用统计表或计算机程序确定如下所示的检验统计量的临界值和拒绝域。以z检验作为示例,对t检验、F检验或卡方检验,用统计量f、F或χ2来替换z。 6比较检验统计量和拒绝域。如果检验统计量值落在拒绝域内,拒绝零假设,结论是备择假设可能止确。否则,不拒绝零假设,结论是没有足够的证据支持备择假设。 ?示例:t检验

卫生统计学 案例版丁元林课后思考题答案

第一章:ECDBB 第二章:BDABC 第三章:DEBCD AEA 第四章:DCCDD DCBD 第五章:DCBDB AEEEC 第六章:CBEDC DDDDA 第七章:ACCBB DACEA 第八章:ABCDD BDADB 第九章:DDBCD AEA 第十章:BDCCE BDAEA 第十一章:CAEDC DBCCD 第十二章:BCAEE BA 第十三章:DDBCC BCDE 第十四章:无 第十五章:无 第十六章:无 第十七章:DBABC BDE 第十八章:无 第十九章:BDCDC CCADC 《卫生统计学》思考题参考答案 第一章绪论 1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的? 答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。 2、统计工作可分为那几个步骤? 答:设计、收集资料、整理资料、分析资料四个步骤。 3、举例说明小概率事件的含义。 答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。 第二章调查研究设计 1、调查研究有何特点? 答:(1)不能人为施加干预措施 (2)不能随机分组 (3)很难控制干扰因素 (4)一般不能下因果结论 2、四种常用的抽样方法各有什么特点? 答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。 (2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。 (3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。

卫生统计学课后思考题答案

卫生统计学》思考题参考答案 第一章绪论 1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的? 答:(1)1 定量资料(离散型变量、连续型变量)、 2 无序分类资料(二项分类资料、无序 多项分类资料)、 3 有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常 好、较好、一般、差、非常差” 5 个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。 2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。 3、举例说明小概率事件的含义。 答:某人打靶100 次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05 ,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。 第二章调查研究设计 1、调查研究有何特点? 答:(1)不能人为施加干预措施 (2)不能随机分组 (3)很难控制干扰因素 (4)一般不能下因果结论 2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简 便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。 (2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。 (3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。 (4)整群抽样:优点是易于组织和操作大规模抽样调查;缺点是抽样误差大。 3、调查设计包括那些基本容? 答:(1)明确调查目的和指标 (2)确定调查对象和观察单位 (3)选择调查方法和技术 (4)估计样本大小 (5)编制调查表 (6)评价问卷的信度和效度 (7)制定资料的收集计划 (8)指定资料的整理与分析计划 (9)制定调查的组织措施 4、调查表中包含那几种项目? 答:(1)分析项目直接整理计算的必须的容; (2)备查项目保证分析项目填写得完整和准确的容; (3)其他项目大型调查表的前言和表底附注。 第三章实验设计 1、简述实验设计的特点。 答:(1)研究者能人为设置处理因素(2)受试对象可以接受何种处理因素或水平是由随 机分配而定的。

卫生统计学试题6含答案

. 统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

. A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

(新)高中数学第一章统计案例1_1独立性检验假设检验素材新人教B版选修1-21

假设检验 1、某厂生产的化纤纤度服从正态分布 )04.0,(2 μN 。某天测得25根纤维的纤度的均值39.1=x ,问与原设计的标准值1.40有无显著差异?(取05.0=α) 解 设厂生产的化纤纤度为X ,则总体)04.0,(~2μN X ,且总体方差2204.0=σ已 知。顾客提出要检验的假设为 40 .1:0=μH , 40.1:1≠μH 因为已知总体标准差04.0=σ,所以选用U 检验,且在0H 成立的条件下有 )1,0(~25 04.00 N X U μ-= 针对备择假设40.1:1≠μH ,拒绝域的形式可取为 } /{0 c n X U W >-= =σμ 为使犯第一类错误的概率不超过05.0=α,就要在40.10 =μ时,使临界值c 满足 ()05 .0=>c U P 成立。由此,在给定显著性水平05.0=α时,得到临界值为 96 .1975.02/1===-u u c α 故相应的拒绝域为

{} 96.1>=U W 利用来自总体的样本值求得 25 .125 /04.040.139.1-=-= u 即 975 .096.125.1u u =<= 成立。显然,样本未落在拒绝域内,因此在05.0=α水平上认为纤维的纤度与原设计的标准值1.40没有显著差异。 2、设某厂生产的洗衣机的使用寿命(单位:小时)X 服从正态分布),(2σu N 但2 ,σu 未 知。随机抽取20台,算得样本均值1832=X ,样本标准差=S 497,检验该厂生产的洗衣机的平均使用时数“2000=μ”是否成立?(取检验水平05.0=α) 解 待检验假设 2000 0=μ:H 20001≠μ:H H 的拒绝域: 21α - >t T =2.093 T 的观测值 512 .1/2000 -=-=n S X T W ∈ 不能拒绝 H ,可以认为洗衣机的平均使用时数“2000=u ”. 3、在正常情况下,某炼钢厂的铁水含碳量(%)X ~ ),.(2 554σN (σ未知)。一日测得5炉铁水含碳量如下:

卫生统计学作业答案

《卫生统计学》第1次平时作业 一、选择题(每小题1分,共30分) 1.抽样研究中的样本是( C )。 A )研究对象的全体 B )总体中特定的一部分 C )总体中随机抽取的一部分 D )随意收集的一些观察对象 2.对某样品进行测量时,由于测量仪器事先未校正,造成测量结果普遍偏高,这种误差属于( A )。 A )系统误差 B )随机测量误差 C )抽样误差 D )随机误差 3.欲了解某市某年所有三级甲医院的病床数,该市每个三级甲医院就是一个( B )。 A )有限总体 B )观察单位 C )无限总体 D )观察值 4.下面的变量中哪个是数值变量( B )。 A )每个病人就诊的科室 B )每个病人就诊的次数 C )每个病人就诊的疾病 D )每个病人就诊的医院 5.用某年全市的出生数和婴儿死亡数计算婴儿死亡率,这种方法是属于( C )。 A )抽样研究 B )参数估计 C )统计描述 D )统计推断 6.医学人口统计应属于卫生统计学中的哪部分内容( C )。 A )卫生统计学基本原理 B )卫生统计学基本方法 C )健康统计 D )卫生服务统计 7.下面哪一种统计资料的来源不属于经常性的资料( D )。 A )统计报表 B )门诊病例 C )出生报告卡 D )调查问卷 8.5人的血清滴度为1:20,1:40,1:80,1:160,1:320,则平均滴度是( B )。 A )1:40 B )1:80 C )1:160 D )1:320 9.某组资料共5例,1902=∑x ,30=∑x ,则均数和标准差分别是( D )。 A )6,1.9 B )6.33,2.5 C )38,6.78 D )6,1.58 10.偏态分布数值资料,对数变换后,分布仍呈偏态。描述数据的集中趋势宜用( C )。

卫生统计学试题参考答案

医学统计方法选择题一: 医学统计方法概述 l.统计中所说的总体是指:A A根据研究目的确定的同质的研究对象的全体 B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示B A某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对 3.抽签的方法属于 D A分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样 4.测量身高、体重等指标的原始资料叫:B A计数资料B计量资料C等级资料D分类资料E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗人数8 23 6 3 1 该资料的类型是:D A计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6.样本是总体的C A有价值的部分B有意义的部分C有代表性的部分 D任意一部分E典型部分 7.将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对 8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断 C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料 E搜集资料、整理资料、分析资料、进行推断 9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:B A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则D A对照的原则B随机原则C重复原则 D交叉的原则E以上都不对 第八章数值变量资料的统计描述 11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率 12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择C A X B G C M D S E CV 13.各观察值均加(或减)同一数后:B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对 14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),

统计案例一_----独立性检验

统计案例一独立性检验 研修学院数学教研室闻岩 一、课标要求 学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。 内容与要求 1.统计案例(约14课时) 通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。 (1)通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验(只要求22列联表)的基本思想、方法及初步应用。 (2)通过对典型案例(如“质量控制”“新药是否有效”等)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用(参见例1)。------删掉了 (3)通过对典型案例(如“昆虫分类”等)的探究,了解聚类分析的基本思想、方法及初步应用。------删掉了 (4)通过对典型案例(如“人的体重与身高的关系”等)的探究,进一步了解回归的基本思想、方法及初步应用。 说明与建议 1.统计案例的教学中,应鼓励学生经历数据处理的过程,培养他们对数据的直观感觉,认识统计方法的特点(如统计推断可能犯错误,估计结果的随机性),体会统计方法应用的广泛性。应尽量给学生提供一定的实践活动机会,可结合数学建模的活动,选择1个案例,要求学生亲自实践。对于统计案例内容,只要求学生了解几种统计方法的基本思想及其初步应用,对于其理论基础不作要求,避免学生单纯记忆和机械套用公式进行计算。 2.教学中,应鼓励学生使用计算器、计算机等现代技术手段来处理数据,有条件的学校还可运用一些常见的统计软件解决实际问题。 例1某地区羊患某种病的概率是0.4,且每只羊患病与否是彼此独立的。今研制一种新的预防药,任选5只羊做实验,结果这5只羊服用此药后均未患病。问此药是否有效。 初看起来,会认为这药一定有效,因为服药的羊均未患病。但细想一下,会有问题,因为大部分羊不服药也不会患病,患病的羊只占0.4左右。这5只羊都未患病,未必是药的作用。分析这问题的一个自然想法是:若药无效,随机抽取5只羊都不患病的可能性大不大。若这件事发生的概率很小,几乎不会发生,那么现在我们这几只羊都未患病,应该是药的效果,即药有效。 现假设药无效,5只羊都不生病的概率是 (1-0.4)5≈0.078. 这个概率很小,该事件几乎不会发生,但现在它确实发生了,说明我们的假设不对,药是有效的。 这里的分析思想有些像反证法,但并不相同。给定假设后,我们发现,一个概率很小几乎不会发生的事件却发生了,从而否定我们的“假设”。 应该指出的是,当我们作出判断“药是有效的”时,是可能犯错误的。犯错误的概率是0.078。也就是说,我们有近92%的把握认为药是有效的。 二、全国考纲的要求 17.统计案例 了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. ①独立检验 列联表)的基本思想、方法及简单应用. 了解独立检验(只要求22

中南大学卫生统计学-在线作业二答案

卫生统计学_在线作业二 一. 单选题(共20题,共40分) 1.某配对资料经秩和检验,得4,,则下列结果哪一种正确(2分 )A.()。 B. C. D. E. F.以上均不对 ★标准答案:D ☆考生答案:D ★考生得分:2分评语: 2.非参数统计方法不适合于()。(2分)A.正态分布且方差齐的资料 B.偏态分布的资料 C.半定量资料 D.有过大值或过小值的资料 E.以上均不对 ★标准答案:A ☆考生答案:A ★考生得分:2 分评语: 3. 配对资料的秩和检验,统计量的确定为()。(2分)A.只可取T+作为统计量 B.只可取T-作为统计量 C.T+、T-可任取一个作为统计量 D.只以绝对值小的作为统计量 E.以上均不对 ★标准答案:C ☆考生答案:C ★考生得分:2 分评语: 4. 等级资料两样本比较的秩和检验中,如相同秩次过多,应计算校正值,校正结果使()。(2分)A.值增大,值减小 B.值增大,值增大 C.值减小,值增大 D.值减小,值减小 E.视具体资料而定 ★标准答案:A ☆考生答案:A ★考生得分:2 分评语: 5.若比较两等级资料的分布宜用()。(2分)A.t检验 B.检验 C.秩和检验 D.F检验 E.u检验 ★标准答案:C ☆考生答案:C

6. 甲、乙两个医院的等级相同,规模相当。在某年疾病统计中发现:甲院对5型肝炎的治愈率都高于乙院,但总的治愈率却是乙院的总治愈率反而高于甲院的总治愈率,造成这种矛盾现象,最可能的原因是()。(2分)A.两个医院对预后的诊断标准不一致 B.两个医院各型病人的构成比相差太大 C.两个医院医疗技术相差悬殊 D.两个医院的领导重视程度相差悬殊 E.两个医院的设备相差太大 ★标准答案:B ☆考生答案:B ★考生得分:2 分评语: 7. 两数值变量资料的小样本比较的假设检验,首先应考虑()。(2分)A.用检验 B.用检验 C.用秩和检验 D.检验和秩和检验均可 E.资料符合检验还是秩和检验的条件 ★标准答案:C ☆考生答案:C ★考生得分:2 分评语: 8.当选用Wilcoxon配对秩和检验时,无效假设为()。(2分)A.两样本对应的总体分布相同 B.两样本对应的总体的中位数相同 C.两样本均数相同 D.两样本差值的总体中位数为0 E.以上均不对 ★标准答案:D ☆考生答案:D ★考生得分:2 分评语: 9.配对四格表中,为比较两样本率的差别,下列哪种说法正确()。(2分)A.无效假设为 B. C.当时,需作连续性校正 D.可以用配对设计的检验 E.以上都不对 ★标准答案:E ☆考生答案:E ★考生得分:2 分评语: 10.当选用Wicoxon两样本秩和检验时,无效假设为(2分)A.()。 B.两样本对应的总体均数相同 C.两样本均数相同 D.两样本对应的总体分布相同 E.两样本的中位数相同 F.以上均不对 ★标准答案:C ☆考生答案:D

卫生统计学试题(含答案)

医学统计方法选择题一 医学统计方法概述 l .统计中所说的总体是指: A A 根据研究目的确定的同质的研究对象的全体 B 随意想象的研究对象的全体 C 根据地区划分的研究对象的全体 D 根据时间划分的研究对象的全体 E 根据人群划分的研究对象的全体 2. 概率P=0,则表示B A 某事件必然发生 B 某事件必然不发生 D 某事件发生的可能性很大 E 以上均不对 7. 将计量资料制作成频数表的过程,属于 A 统计设计 B 收集资料 C 整理资料 8. 统计工作的步骤正确的是 C A 收集资料、设计、整理资料、分析资料 C 设计、收集资料、整理资料、分析资料 E 搜集资料、整理资料、分析资料、进行推断 ¬¬ 统计工作哪个基本步骤: C D 分析资料 E 以上均不对 B 收集资料、整理资料、设计、统计推断 D 收集资料、整理资料、核对、分析资料 B 10. 以下何者不是实验设计应遵循的原则 D A 对照的原则 B 随机原则 C 重复原则 D 交叉的原则 E 以上都不对 第八章 数值变量资料的统计描述 11. 表示血清学滴度资料平均水平最常计算 B A 算术均数 B 几何均数 C 中位数 D 全距 E 率 12. 某计量资料的分布性质未 明,要计算集中趋势指标,宜选择 C A X B G C M D S E CV 13. 各观察值均加(或减)同一数后: B A 均数不变,标准差改变 B 均数改变,标准差不变 C 两者均不变 D 两者均改变 E 以上均不对 14. 某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24+(小时), 问 3.抽签的方法属于 D A 分层抽样 B 系统抽样 C 整群抽样 4.测量身高、体重等指标的原始资料叫: A 计数资料 B 计量资料 某种新疗法治疗某病患者 治愈 8 D 单纯随机抽样 E 二级抽样 5. 治疗结果 治疗人数 该资料的类型是: A 计数资料 6.样本是总体的 A 有价值的部分 D 任意一部分 显效 23 B C 等级资料 41 人, 好转 6 D 分类资料 治疗结果如下: 恶化 3 E 有序分类资料 计量资料 C B 有意义的部分 C 有代表性的部分 E 典型部分 C 无序分类资料 死亡 1 D 有序分类资料 E 数值变量资料 A 抽样误差 B 系统误差 C 随机误差 D 责任事故 E 以上都不对 C 某事件发生的可能性很小 9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:

高中数学统计案例--独立性检验 同步练习

统计案例--独立性检验 同步练习 1、下列关于卡方2χ的说法正确的是( ) A.2χ在任何相互独立问题中都可用与检验是否相关 B. 2χ的值越大,两个事件的相关性越大 C.2χ是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这类问题 D. ) )()()(() (2d b c a d c b a bc ad n ++++-= χ. 2、在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( ) A. 若统计量635.62>χ,我们有99%的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病 B. 若从统计中求出,有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病 C. 若从统计量中求出有95%把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误 D. 以上说法均错误 3 A. 种子经过处理跟是否生病有关 B. 种子经过处理跟是否生病无关 C. 种子是否经过处理决定是否生病 D. 以上都是错误的 4、若由一个22?列联表中的数据计算得013.42=χ,那么有 的把握认为两个变量有关系. 5、独立性检验所采用的思路是:要研究A 、B 两类型因子彼此相关,首先假设这两类因子彼此 ,在此假设下构造2χ统计量.如果2χ的观测值较大,那么在一定程度上说明假设 . 6、某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该搜集那些数据? . 7、打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得数据,试问:每一晚都打与患心脏病有关吗?有多大把握认为你的结论成立?

8、为了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50名患者服用 9、某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革的关系,随机抽取了189名员工进行调查,其中支持企业改革的调查者中,工作积极的54人,工作一般的32人,而不太赞成企业改革的调查者中,工作积极的40人,工作一般的63人. (1)根据以上数据建立一个2 2 的列联表; (2)对于人力资源部的研究项目,根据以上数据可以认为企业的全体员工对待企业改革的 态度与其工作积极性是否有关系?

卫生统计学试卷(附答案)

2004~2005学年第(1)学期预防医学专业本科 期末考试试卷 (卫生统计学课程) 姓名____________________ 班级____________________ 学号____________________ 考试时间:200 年月日午 —(北京时间)

一、选择题(每题1分,共60分) 1、A1、A2型题 A. 48.0 B. 49.0 C. 52.0 D .53.0 E.55.0 2. 比较7岁男童与17岁青年身高的变异程度,宜用: A. 极 差 B. 四分位数间距 C. 方差 D. 标准差 E. 变异系数 3. 根据观测结果,已建立y 关于x 的回归方程? 2.0 3.0y x =+,该回归方程表示x 每增加1个单位,y 平均增加几个单位? A. 1 B. 2 C. 3 D. 4 E.5 4. 设从 5.11=μ的总体中作五次随机抽样(n =5),问哪一个样本的数据既精确又准确? A. 8,9,10,11,12 B. 6,8,10,12,14 C. 6,10,12,14,18 D. 8,10,12,14,16 E. 10,11,12,13,14 5. 为表示某地近20年来婴儿死亡率的变化情况,宜绘制 A.散点图 B. 直条图 C. 百分条图 D. 普通线图 E. 直方图 6. 临床上用针灸治疗某型头痛,有效的概率为60%现用该法治疗5例,问其中至少2例有效的概率约为 A. 0.913 B. 0.087 C. 0.230 D.0.317 E. 以上都不对 7.二项分布、Poisson 分布、正态分布各有几个参数? A. 1,1,2 B. 2,1,2 C. 1,2,2 D. 2,2,2 E. 1,2,1 8. 假定某细菌的菌落数服从Poisson 分布,经观察得平均菌落数为9,问菌落数的标准差为: A. 18 B. 9 C. 3 D. 81 E. 27 9. 对于同一资料的直线相关系数与回归系数,下列论断有几句是正确的? 相关系数越大,回归系数也越大。 相关系数与与回归系数符号一致。 相关系数的t r 等于回归系数的t b 。 相关系数描述关联关系,回归系数描述因果关系。 A.1句 B.2句 C. 3句 D. 4句 E. 0句 10.下列四句话有几句是正确的? 标准差是用来描述随机变量的离散程度的。 标准误是用来描述统计量的变异程度的。 t 检验只用于检验两样本均数的差别。 χ2可用来比较两个或多个率的差别。 A. 0句 B. 1句 C. 2句 D. 3句 E. 4句

高中数学 第三章 统计案例 3.1 独立性检验 卡方检验素材 苏教版选修2-3

2 χ 检验 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。 (1) 四格表2 χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2 χ检验。 3. 行?列表的2 χ检验。 (二) 熟悉内容 频数分布拟合优度的2 χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 (一) 2χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公 式与用基本公式计算出的2χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2 χ检验的基本计算

《卫生统计学》习题及答案

1.表示均数抽样误差大小的统计指标是( C )。 A)标准差B)方差 C)均数标准误D)变异系数 2.抽样研究中,s为定值,若逐渐增大样本含量,则样本( B )。 A)标准误增大B)标准误减少 C)标准误不改变D)标准误的变化与样本含量无关 3.均数标准误越大,则表示此次抽样得到的样本均数( C )。 A)系统误差越大B)可靠程度越大 C)抽样误差越大D)可比性越差 4.假设已知某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg,标准差为11.2 mmHg,后者反映的是( A )。 A)个体变异B)抽样误差 C)总体均数不同D)抽样误差或总体均数不同 5.配对计数资料差别的卡方检验,其备择假设是( D )。 A)p1=p2 B)p1≠p2 C)B=C D)B≠C 6.下列关于总体均数可信区间的论述是正确的,除了( C )外。 A)总体均数的区间估计是一种常用的参数估计 B)总体均数可信区间所求的是在一定概率下的总体均数范围 C)求出总体均数可信区间后,即可推断总体均数肯定会在此范围内

D)95%是指此范围包含总体均数在内的可能性是95%,即估计错误的概率是5% 试题来源:【2016公卫执业医师考试宝典免 费下载】 小编教你如何快速通过公卫执业医师考试 查看其他试题,请扫描二维码,立即获得本 题库手机版详情咨询 7.总体率可信区间的估计符合下列( C )情况时,可以借用正态近似法处理。 A)样本例数n足够大时B)样本率p不太大时 C)np和n(1-p)大于5时D)p接近1或0时 8.正太近似法估计总体率95%可信区间用( D )。 A)p±1.96s B)p±1.96σ C)p±2.58σD)p±1.96sp 9.统计推断的内容( C )。 A)用样本指标估计相应总体指标B)假设检验 C)A和B答案均是D)估计参考值范围 10.关于假设检验,下列哪个是正确的( A )。 A)检验假设是对总体作的某种假设 B)检验假设是对样本作的某种假设

统计案例之独立性检验

统计案例之独立性检验 班级姓名学号 参考公式:,其中. 1.在中学生综合素质评价某个维度的测评中,分优秀、合格、尚待改进三个等级进行学生 互评.某校高一年级有男生500人,女生400人,为了了解性别对该维度测评结果的影响, 采用分层抽样方法从高一年级抽取了45名学生的测评结果,并作出频数统计表如下: 表一:男生表二:女生 (1)从表二的非优秀学生中随机抽取2人交谈,求所选2人中恰有1人测评等级为合格的概率; (2)由表中统计数据填写下面的列联表,并判断是否有90%的把握认为“测评结果优秀与性别有关”.

2.东亚运动会将于2013年10月6日在天津举行.为了搞好接待工作,组委会打算学习北 京奥运会招募大量志愿者的经验,在某学院招募了16名男志愿者和14名女志愿者,调查发现,男女志愿者中分别有10人和6人喜爱运动,其余人不喜欢运动. (1)根据以上数据完成以下2×2列联表: 喜爱运动不喜爱运动总计 男10 16 女 6 14 总计30 (2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与喜爱运动有关? (3)如果从喜欢运动的女志愿者中(其中恰有4人会外语),抽取2名负责翻译工作,那么抽出的志愿者中至少有1人能胜任翻译工作的概率是多少? 3.某中学拟在高一下学期开设游泳选修课,为了了解高一学生喜欢游泳是否与性别有关, 现从高一学生中抽取人做调查,得到如下列联表: 已知在这人中随机抽取一人抽到喜欢游泳的学生的概率为, (Ⅰ)请将上述列联表补充完整,并判断是否有%的把握认为喜欢游泳与性别有关? 并说明你的理由;

(Ⅱ)针对问卷调查的名学生,学校决定从喜欢游泳的人中按分层抽样的方法随机抽取 人成立游泳科普知识宣传组,并在这人中任选两人作为宣传组的组长,求这两人中至少有一名女生的概率, 4.某学校高三年级有学生 1 000名,经调查,其中750名同学经常参加体育锻炼(称为A 类同学),另外250名同学不经常参加体育锻炼(称为B类同学),现用分层抽样方法(按A 类、B类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 cm作为达标的标准,对抽取的100名学生,得到以下列联表: 身高达标身高不达标总计 经常参加体育锻炼40 不经常参加体育锻炼15 总计100 (1)完成上表; 5.某校进行文科、理科数学成绩对比,某次考试后,各随机抽取100名同学的数学考试成绩进行统计,其频率分布表如下.

卫生统计学第一次作业及答案

【补充选择题】A型题 1.统计资料的类型可以分为 A 定量资料和等级资料 B 分类资料和等级资料 C 正态分布资料和离散分布的资料 D 定量资料和分类资料 E 二项分布资料和有序分类资料 下列符号中表示参数的为2. ?t D C A B u S X E ,其取值范围为P统计学上所说的随机事件发生的概率3. B P≥1 C P≥0 A P≤1 D1≥E1>P>0 P≥0 4.小概率事件在统计学上的含义是 A 指的是发生概率P≤0.5的随机事件 B 指一次实验或者观察中绝对不发生的事件 C 在一次实验或者观察中发生的可能性很小的事件,一般指P≤0.05 D 以上说法均不正确 正确和CE A5.描述定量资料集中趋势的指标有 A 均数、几何均数、变异系数 B 均数、几何均数、四分位数间距 C 均数、变异系数、几何均数 D 均数、四分位数间距、变异系数 E 均数、几何均数、中位数 6.关于频数表的说法正确的是个组段10都分为A B 每一个组段必须组距相等 C 从频数表中可以初步看出资料的频数分布类型 不是连续型的资料没有办法编制频数表 D E 频数表中的每一个组段不一定是半开半闭的区间,可以任意指定 7. 关于偏态分布资料说法不正确的是 A正偏态资料的频数分布集中位置偏向数值大的一侧B负偏态资料的频数分布集中位置偏向数值大的一侧 偏态分布资料频数分布左右不对称C 不宜用均数描述其集中趋势 D E 不宜用变异系数来描述其离散程度8. 对于一个两端都没有确切值的资料,宜用下列哪个指标来描述其集中趋势 B 均数 C 方差 A 几何均数 E 四分位数间距 D 中位数 9.下列关于标准差的说法中哪种是错误的 A 对于同一个资料,其标准差一定小于均数 B 标准差一定大于0 C 同一个资料的标准差可能大于均数,也可能小于均数 D 标准差可以用来描述正态分布资料的离散程度 E 如果资料中观察值是有单位的,那么标准差一定有相同单位 10. 下列关于标准差S和样本含量n的说法,正确的是 A 同一个资料,其他条件固定不变,随着n增大,S一定减小 B 同一个资料,即使其他条件固定不变,随着n增大,也不能确定S一定减小

《卫生统计学》习题及答案

1.表示均数抽样误差大小的统计指标是(C ) A)标准差B)方差 C)均数标准误D)变异系数 2?抽样研究中,s为定值,若逐渐增大样本含量,则样本(B )。 A)标准误增大B)标准误减少 C)标准误不改变D)标准误的变化与样本含量无关 3. 均数标准误越大,则表示此次抽样得到的样本均数(C )。 A)系统误差越大B)可靠程度越大 C)抽样误差越大D)可比性越差 4. 假设已知某地35岁以上正常成年男性的收缩压的总体均数为 120.2mmHg,标准差为11.2 mmHg,后者反映的是(A )。 A)个体变异B)抽样误差 C)总体均数不同D)抽样误差或总体均数不同 5. 配对计数资料差别的卡方检验,其备择假设是(D )。 A)p1=p2 B)p1 Mp2 C)B=C D)B 丸 6. 下列关于总体均数可信区间的论述是正确的,除了( C )外。 A)总体均数的区间估计是一种常用的参数估计 B)总体均数可信区间所求的是在一定概率下的总体均数范围 C)求出总体均数可信区间后,即可推断总体均数肯定会在此范围内

D )95%是指此范围包含总体均数在内的可能性是 95%,即估计错误的概率 是5% 试题来源:【2016公卫执业医师考试宝 典免 费下载】 小编教你如何快速通过公卫执业医师考 试 查看其他试题,请扫描二维码,立即获 得本 题库手机版详情咨询阪imo 7.总体率可信区间的估计符合下列 (C )情况时,可以借用正态近似法处理。 A )样本例数n 足够大时 B )样本率p 不太大时 C)np 和n(1-p)大于5时 D )p 接近1或0时 8.正太近似法估计总体率95%可信区间用(D ) B) p ±1.96(T C) p ±2.58(T 10. 关于假设检验,下列哪个是正确的 A )检验假设是对总体作的某种假设 A)p ±1.96s D)p ±1.96sp 9.统计推断的内容(C )。 A )用样本指标估计相应总体指标 B )假设检验 C )A 和B 答案均是 D )估计参考值范围

统计案例-独立性检验及其初步应用

独立性检验的基本思想及其初步应用 知识点 1.与列联表相关的概念 (1)分类变量:变量的不同“值”表示个体所属的不同类型,像这样的变量称为分类变量. (2)列联表: ①列出的两个分类变量的频数表, 称为列联表. ①一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为: y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d a + b + c +d 在2×2列联表中,如果两个分类变量没有关系,则应满足ad -bc ≈0, 因此|ad -bc |越小, 关系越弱; |ad -bc |越大, 关系越强. 2.等高条形图 将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图。 等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否相互影响, 常用等高条形图展示列表数据的频率特征. 列联表和等高条形图的优劣: 列联表可以准确掌握总体中各部分的频率,但是需要计算; 等高条形图可以比较各个部分之间的差异,明确展现两个分类变量的关系。 3.独立性检验的基本思想 (1)定义:利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. (2)公式:K 2= n ad -bc 2a +b c + d a +c b +d ,其中n =a +b +c +d 为样本容量.用它的大小可以用 来决定是否拒绝原来的统计假设0H .如果K 2的值较大,就拒绝0H ,即认为A 与B 是有关的. 注:独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的.

相关主题
文本预览
相关文档 最新文档