3.2独立性检验的基本思想及其初步应用(一)1
- 格式:ppt
- 大小:364.00 KB
- 文档页数:15
独立性检验基本思想及应用独立性检验是一种用于确定两个变量之间是否存在关联的统计方法。
其基本思想是通过比较观察到的数据与预期的数据之间的差异来推断这两个变量之间的关系。
独立性检验的应用非常广泛。
在社会科学中,独立性检验常被用于研究两个分类变量之间是否存在关联,例如性别和职业、教育水平和政治倾向等。
在医学研究中,独立性检验也可以用来检查某种治疗方法是否与疾病的发展有关,以及风险因素和某种疾病之间的关系。
此外,独立性检验还被广泛应用于市场调查、品牌定位以及质量控制等领域。
独立性检验的基本思想是建立一个零假设(H0)和一个备择假设(H1)。
零假设认为两个变量是独立的,即它们之间没有关联;备择假设则认为两个变量之间存在关联。
独立性检验的步骤可以分为以下几步:1. 收集数据:需要收集两个分类变量的数据,例如通过问卷调查或观察获得数据。
2. 建立列联表:将数据整理成列联表形式,列联表是一种用于描述两个或多个分类变量之间关系的矩阵。
表格的行表示一个变量的不同类别,列表示另一个变量的不同类别,表格中的每个单元格表示两个类别的交叉数量。
3. 计算期望频数:在独立性检验中,我们假设两个变量是独立的,因此可以基于各类别的边际总数以及样本总数来计算期望频数。
期望频数是在两个变量独立情况下,各个类别的交叉数量。
4. 计算卡方统计量:卡方统计量用于衡量观察到的数据与期望数据之间的差异程度。
计算公式为:χ2 = Σ((观察频数- 期望频数)^2 / 期望频数)。
其中,Σ表示对所有单元格进行求和。
5. 设定显著性水平:显著性水平α为决策的临界点,用于决定是否拒绝零假设。
通常,α的常见选择为0.05或0.01。
6. 判断和解释结果:根据计算出的卡方统计量与临界值进行比较,如果计算出的卡方值大于临界值,拒绝零假设,认为两个变量之间存在关联;反之,接受零假设,认为两个变量是独立的。
独立性检验的结果常常以卡方统计量和p值的形式呈现。
p值是在零假设成立的条件下,观察到的数据与期望数据之间差异的概率。
独立性检验的基本思想综合测试题(有答案)选修2-33.2独立性检验的基本思想及其初步应用一、选择题1.统计假设H0:P(AB)=P(A)•P(B)成立时,有以下判断:①P(AB)=P(A)P(B);②P(AB)=P(A)P(B);③P(AB)=P(A)P(B).其中真命题个数是()A.1B.2C.3D.4答案]C2.在对吸烟与患肺病这两个分类变量的计算中,下列说法正确的是() A.若随机变量K2的观测值k>6.635,我们有99%的把握说明吸烟与患肺病有关,则若某人吸烟,那么他有99%的可能患有肺病B.若由随机变量求出有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99个人患有肺病C.若由随机变量求出有95%的把握说吸烟与患肺病有关,那么有5%的可能性使得推断错误D.以上说法均不正确答案]C解析]K2的意义与概率不能混淆.3.对两个分类变量A、B的下列说法中正确的个数为()①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K2的大小是判定A与B是否相关的唯一依据A.1B.2C.3D.4答案]A解析]①正确,A与B无关即A与B相互独立;②不正确,K2的值的大小只是用来检验A与B是否相互独立;③不正确,例如借助三维柱形图、二维条形图等.故选A.4.以下关于独立性检验的说法中,错误的是()A.独立性检验依据小概率原理B.独立性检验得到的结论一定正确C.样本不同,独立性检验的结论可能有差异D.独立性检验不是判定两分类变量是否相关的唯一方法答案]B解析]独立性检验得到的结论不一定正确,如我们得出有90%的把握认为A与B有关,只是说这种判断的正确性为90%,具体问题中A与B 可能有关,可能无关,故答案选B.5.根据下面的列联表判断患肝病与嗜酒有关系的把握有()嗜酒不嗜酒合计患肝病7775427817未患肝病2099492148总计9874919965A.90%B.95%C.97.5%D.99.9%答案]D解析]由K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)得其观测值k=9965×(7775×49-2099×42)27817×2148×9874×91≈56.6>10.828.故有99.9%的把握认为患肝病与嗜酒有关系,答案选D.二、填空题6.吃零食是中学生中普遍存在的现象.吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的列联表男女总计喜欢吃零食51217不喜欢吃零食402868合计454085试回答吃零食与性别有关系吗?(答有或没有)____________.答案]有解析]k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=85(140-480)217×68×45×40=98260002080800≈4.700>3.841.故约有95%的把握认为“吃零食与性别”有关.7.根据下表,计算K2的观测值k≈________.(保留两位小数)又发病未发病作移植手术39157未作移植手术29167答案]1.78解析]k=392×(39×167-157×29)2196×196×68×324≈1.78.8.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组的序号为________.①a=9,b=8,c=7,d=6②a=9,b=7,c=6,d=8③a=8,b=6,c=9,d=7④a=6,b=7,c=8,d=9答案]②解析]对于同一样本|ad-bc|越小,说明X与Y之间的关系越弱,|ad -bc|越大,说明X与Y之间的关系越强.|ad-bc|越大,K2越大,|ad -bc|越小,则K2越小.三、解答题9.调查339名50岁以上有吸烟习惯与患慢性气管炎的人的情况,获数据如下患慢性气管炎未患慢性气管炎总计吸烟43162205不吸烟13121134合计56283339试问:(1)有吸烟习惯与患慢性气管炎病是否有关?(2)用假设检验的思想给予说明.解析](1)根据列联表的数据,得到k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=339×(43×121-162×13)2205×56×283×134=6.674>6.635.所以有99%的把握认为“吸烟与患慢性气管炎病有关”.(2)假设“吸烟与患病之间没有关系”,由于事件A={K2≥6.635}的概率P(A)≈0.01,即A为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%.10.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:积极支持企业改革不太赞成企业改革合计工作积极544094工作一般326395合计86103189对于人力资源部的研究项目进行分析,根据上述数据能得出什么结论?解析]由公式k=189×(54×63-40×32)294×95×86×103≈10.76.因为10.76>7.879,所以有99.5%的把握说:员工“工作积极”与“积极支持企业改革”有关,可以认为企业的全体员工对待企业改革的态度与其工作的积极性是有关的.11.考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表所示.种子灭菌种子未灭菌合计有黑穗病26184210无黑穗病50200250合计76384460试按照原试验目的作统计推断.解析]由公式得,k=460×(26×200-184×50)2210×250×76×384≈4.804.由于4.804>3.841,所以我们有95%的把握认为种子灭菌与发生黑穗病是有关系的.12.打鼾不仅影响别人休息,而且可能与患有某种疾病有关.下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?患心脏病未患心脏病合计每一晚都打鼾30224254不打鼾2413551379合计5415791633解析]由公式②,k=1633×(30×1355-224×24)21379×254×54×1579≈68.33.因为68.33>6.635,所以有99%的把握说,每一晚都打鼾与患心脏病有关.。