(新)高中数学第一章统计案例1_1独立性检验概率论与数理统计公式整理素材新人教B版选修1-21
- 格式:doc
- 大小:563.06 KB
- 文档页数:20
《概率论与数理统计》 第一章随机事件及其概率§1.1 随机事件一、给出事件描述,要求用运算关系符表示事件: 二、给出事件运算关系符,要求判断其正确性: §1.2 概率古典概型公式:P (A )=所含样本点数所含样本点数ΩA 实用中经常采用“罗列组合”的想法计算补例1:将n 个球随机地放到n 个盒中去,问每个盒子恰有1个球的概率是多少?解:设A :“每个盒子恰有1个球”。
求:P(A)=?Ω所含样本点数:n n n n n =⋅⋅⋅...Α所含样本点数:!1...)2()1(n n n n =⋅⋅-⋅-⋅n n n A P !)(=∴补例2:将3封信随机地放入4个信箱中,问信箱中信的封数的最大数分别为1、2、3的概率各是多少?解:设A i :“信箱中信的最大封数为i”。
(i =1,2,3)求:P(A i )=?Ω所含样本点数:6444443==⋅⋅A 1所含样本点数:24234=⋅⋅836424)(1==∴A PA 2所含样本点数:363423=⋅⋅C1696436)(2==∴A PA 3所含样本点数:4433=⋅C161644)(3==∴A P注:由概率定义得出的几个性质:知识归纳整理1、0<P (A )<12、P(Ω)=1,P(φ) =0 §1.3 概率的加法法则定理:设A 、B 是互不相容事件(AB=φ),则: P (A ∪B )=P (A )+P (B )推论1:设A 1、 A 2、…、 A n 互不相容,则 P(A 1+A 2+...+ A n )= P(A 1) + P(A 2) +…+ P(A n )推论2:设A 1、 A 2、…、 A n 构成完备事件组,则 P(A 1+A 2+...+ A n )=1推论3: P (A )=1-P (A )推论4:若B ⊃A ,则P(B -A)= P(B)-P(A) 推论5(广义加法公式):对任意两个事件A 与B ,有P(A ∪B)=P(A)+P(B)-P(A B) 补充——对偶律:nnAA A A A A ⋂⋂⋂=⋃⋃⋃ (2)121nnAA A A A A ⋃⋃⋃=⋂⋂⋂ (2)121§1.4 条件概率与乘法法则条件概率公式:P(A/B)=)()(B P AB P (P(B)≠0)P(B/A)= )()(A P AB P (P(A)≠0)∴P (AB )=P (A /B )P (B )= P (B / A )P (A )有时须与P (A+B )=P (A )+P (B )-P (AB )中的P (AB )联系解题。
独立性检验
统计学的一种检验方式。
与适合性检验同属于X2检验,它是根据次数资料判断两类因子彼此相关或相互独立的假设检验。
假设有两个分类变量X和Y,它们的值域分另为{x1, x2}和{y1, y2},其样本频数列联表为:
若要推断的论述为H1:“X与Y有关系”,可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠程度。
具体的做法是,由表中的数据算出随机变量K^2的值(即K的平方)
K^2 = n (ad - bc) ^ 2 / [(a+b)(c+d)(a+c)(b+d)] 其中n=a+b+c+d为样本容量
K^2的值越大,说明“X与Y有关系”成立的可能性越大。
当表中数据a,b,c,d都不小于5时,可以查阅下表来确定结论“X与Y有关系”的可信程度:
例如,当“X与Y有关系”的K^2变量的值为6.109,根据表格,因为5.024≤6.109<6.635,所以“X与Y有关系”成立的概率为1-0.025=0.975,即97.5%。
1。
独立性检验的基本思想及初步应用一.基础概念的梳理与理解1.分类变量的描述性说明:对于宗教信仰来说,其取值为信宗教信仰与不信宗教信仰两种.象这样的变量的不同值表示个体所属的不同类别的变量称为分类变量.例如性别变量其取值为男女两种,吸烟变量其取值为吸烟与不吸烟两种;2.两个分类变量:是否吸烟与患肺癌于否,性别男和女与是否喜欢数学课程等等,这是我们所要关心的;3.22⨯列联表:列出的两个分类变量X 和Y ,它们的取值分别为12{,}x x 和12{,}y y 的样本频数表称为22⨯列联表1二.两个分类变量是否有关的粗略估计1.三维柱形图:如果列联表1的三维柱形图如下图 由各小柱形表示的频数可见,对角线上的 频数的积的差的绝对值||ad bc -较大,说明两 分类变量X 和Y 是有关的,否则的话是无关的.重点:一方面考察对角线频数之差,更重要的一方面是提供了构造随机变量进行独立性检验的思路方法。
2.二维条形图(相应于上面的三维柱形图而画)图1由深、浅染色的高可见两种情况下所占比例,由数据可知a a b+要比c c d +小得多,由于差距较大,因此,说明两分类变量X 和Y 有关系的可能性较大,两个比值相差越大两分类变量X 和Y 有关的可能性也越的.否则是无关系的.重点:通过图形以及所占比例直观地粗略地观察是否有关,更重要的一方面是提供了构造随机变量进行独立性检验的思想方法。
3.等高条形图(相应于上面的条形图而画)由深、浅染色的高可见两种情况下的百分比;另一方面,数据aa b+00要比c c d+小得多,因此,说明两分类变量X 和Y 有关系的可能性较大,否则是无关系的.重点:直观地看出在两类分类变量频数相等的情况下,各部分所占的比例情况,是在图2的基础上换一个角度来理解。
三.独立性检验的基本思想上面通过分析数据与图形,,得出这个估计是粗略的,因为我们说的“大得多”、“小图2图3得多”,到底是有多大的差距?也就是说得到的结论是直观上的印象,其实与是否有关还是有较大的差距的.但是上面的分析给了我们一种重要的思想方法.下面从理论上说明两类分类变量是否有关,请同学们从中体会其思想方法 1.基本思想与图形的联系假设两类分类变量是无关的,由上面的条形图2可知如下的比应差不多。
假设检验1、某厂生产的化纤纤度服从正态分布)04.0,(2μN 。
某天测得25根纤维的纤度的均值39.1=x ,问与原设计的标准值1.40有无显著差异?(取05.0=α)解 设厂生产的化纤纤度为X ,则总体)04.0,(~2μN X ,且总体方差2204.0=σ已知。
顾客提出要检验的假设为40.1:0=μH , 40.1:1≠μH因为已知总体标准差04.0=σ,所以选用U 检验,且在0H 成立的条件下有)1,0(~2504.00N X U μ-=针对备择假设40.1:1≠μH ,拒绝域的形式可取为}/{0c nX U W >-==σμ为使犯第一类错误的概率不超过05.0=α,就要在40.10=μ时,使临界值c 满足()05.0=>c U P成立。
由此,在给定显著性水平05.0=α时,得到临界值为96.1975.02/1===-u u c α故相应的拒绝域为{}96.1>=U W利用来自总体的样本值求得25.125/04.040.139.1-=-=u即975.096.125.1u u =<=成立。
显然,样本未落在拒绝域内,因此在05.0=α水平上认为纤维的纤度与原设计的标准值1.40没有显著差异。
2、设某厂生产的洗衣机的使用寿命(单位:小时)X 服从正态分布),(2σu N 但2,σu 未知。
随机抽取20台,算得样本均值1832=X ,样本标准差=S 497,检验该厂生产的洗衣机的平均使用时数“2000=μ”是否成立?(取检验水平05.0=α)解 待检验假设20000=μ:H 20001≠μ:H0H 的拒绝域:21α->tT =2.093T 的观测值512.1/2000-=-=n S X T W ∈ 不能拒绝0H ,可以认为洗衣机的平均使用时数“2000=u ”.3、在正常情况下,某炼钢厂的铁水含碳量(%)X ~),.(2554σN (σ未知)。
一日测得5炉铁水含碳量如下:4.48,4.40,4.42,4.45,4.47在显著水平050.=α下,试问该日铁水含碳量的均值是否有明显变化。
高中数学第一章统计案例1.1独立性检验预习导航新人教B 版选修121.相互独立的定义一般地,对于两个事件A ,B ,如果有P (AB )=P (A )P (B ),就称事件A 与B 相互独立,简称A 与B 独立.定义的推广:若事件A 1,A 2,…,A n 满足P (A 1A 2…A n )=P (A 1)P (A 2)·…·P (A n ),则称事件A 1,A 2,A 3,…,A n 相互独立.思考1若事件A 与B 独立,则事件A 与B ,A 与B ,A 与B 独立吗?提示:当事件A 与B 相互独立时,事件A 与B ,A 与B ,A 与B 也独立.从直观上可以认为,不论事件A 发生还是不发生对事件B 发生的概率没有影响,再者,尽管独立性的定义是用P (AB )=P (A )·P (B )来刻画的,但实际应用时往往并不是按此定义来验证事件A ,B 的独立性,而是从事件的实际意义出发判断两者是否相互独立.思考2甲组中有3名男生、2名女生,乙组中有2名男生、3名女生,今从甲、乙两组中各选出1名同学参加演讲比赛,试问“从甲组中选出1名男生”与“从乙组中选出1名女生”是否为相互独立事件?提示:是,解释如下:设“从甲组中选出1名男生”为事件A ,“从乙组中选出1名女生”为事件B ,则P (A )=35,P (B )=35,而P (AB )=3×35×5=925=P (A )P (B ),故事件A 与B 相互独立.2.独立性检验(1)χ2的计算公式一张用字母表示的2×2列联表如下:表中:n +1=n 11+n 21,n +2=n 12+n 22,n 1+=n 11+n 12,n 2+=n 21+n 22,n =n 11+n 21+n 12+n 22.统计量χ2(卡方)的表达式为χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2. (2)用χ2进行独立性检验在独立性检验中,χ2有两个临界值:3.841与6.635.①当χ2>3.841时,我们有95%的把握说事件A 与B 有关;②当χ2>6.635时,我们有99%的把握说事件A 与B 有关;③当χ2≤3.841时,我们认为事件A 与B 是无关的.思考3如何使用χ2统计量进行2×2列联表的独立性检验?提示:步骤如下:(1)作统计假设H 0:“事件A 与事件B 相互独立”,即P (AB )=P (A )P (B )成立; (2)由公式χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2,计算χ2的数值; (3)将χ2的数值与两个临界值3.841与6.635进行比较,作出统计推断:当χ2>3.841时,有95%的把握说事件A 与B 有关;当χ2>6.635时,有99%的把握说事件A 与B 有关;当χ2≤3.841时,认为事件A 与B 是无关的.特别提醒用统计量χ2进行独立性检验,要注意以下三点:(1)要求2×2列联表中的数据都要大于等于5,因而在确定样本容量时要注意这一点;(2)χ2计算公式中的n 11n 22与n 12n 21分别为表中主对角线(左上→右下)上的两数据之积和副对角线(右上→左下)上的两数据之积,不能混淆,其中n 为样本容量;(3)χ2的构造思路:当统计假设H 0:P (AB )=P (A )P (B )成立时,P (A B )=P (A )P (B ),P (A B )=P (A )P (B ),P (A B )=P (A )P (B )都成立,实际计算中,事件的概率可用相应的频率来估计,因而χ2的结果也受样本特征的影响,具有随机性.。
编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第一章统计案例1.1 独立性检验课堂探究新人教B版选修1-2)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第一章统计案例1.1 独立性检验课堂探究新人教B版选修1-2的全部内容。
—2探究一相互独立事件的概率相互独立事件的概率求解要使用相互独立事件的概率公式,即若事件A与事件B相互独立,则满足P(AB)=P(A)P(B),涉及两个以上独立事件,则用相互独立事件定义的推广,应用公式时,一定要优先判断事件之间的关系.【典型例题1】下列是某班英语及数学成绩的分布表,已知该班有50名学生,成绩分1~5共5个档次.如:表中所示英语成绩为第4档,数学成绩为第2档的学生有5人,现设该班任意一名学生的英语成绩为第m档,数学成绩为第n档.(1)求m=4,n=3的概率;(2)若m=2与n=4是相互独立的,求a,b的值.思路分析:能理解表中数据的含义是解题的关键,再根据两事件独立列出等式,进而求出参数a,b的值.解:(1)由表知英语成绩为第4档、数学成绩为第3档的学生有7人,而总学生数为50人,∴P=错误!.(2)由题意知,a+b=3.①又m=2与n=4相互独立,所以P(m=2)P(n=4)=P(m=2,n=4),即错误!·错误!=错误!.②由①②,解得a=2,b=1.探究二独立性检验的应用独立性检验实际上是检验两个分类变量是否相关,相关的程度有多大,其应用过程是先通过χ2统计量的计算公式求出χ2的值,其值越大,说明两个分类变量有关系成立的可能性越大,具体统计判断如下:若χ2>6。