假设检验的基本思想与概念
- 格式:ppt
- 大小:471.50 KB
- 文档页数:4
㊀㊀㊀㊀㊀假设检验的基本思想和有关概念的教学设计假设检验的基本思想和有关概念的教学设计Һ魏满满1㊀李石虎2∗㊀周㊀勤2㊀(1.江苏师范大学科文学院,江苏㊀徐州㊀221116;2.江苏师范大学数学与统计学院,江苏㊀徐州㊀221116)㊀㊀ʌ摘要ɔ本文主要探究了假设检验的基本思想和有关概念的教学设计.首先,通过 女士品茶 的故事引入,提炼出假设检验的基本思想;其次,通过分析项链含金量这一实际案例总结出假设检验的基本步骤,并介绍了假设检验的两类错误和p值的概念;最后,融入思政的元素,丰富了课堂教学内容.ʌ关键词ɔ假设检验;教学设计ʌ基金项目ɔ江苏师范大学课程思政专项研究(KCSZY17);江苏师范大学数学与统计学院思政示范课程(XYKCSZ01)一㊁引㊀言概率论与数理统计课程是各个高校理工科的基础必修课,它在理工科及经管类各专业被广泛应用.假设检验是概率论与数理统计中的重要知识点,是统计推断的主要方法之一,在概率统计的理论研究与实际应用中都占有极其重要的地位.2019年3月18日,在学校思想政治理论课教师座谈会上,习近平总书记明确提出[1]:要坚持灌输性和启发性相统一,注重启发性教育,引导学生发现问题㊁分析问题㊁思考问题,在不断启发中让学生水到渠成得出结论.近年来,各大高校都十分重视思政建设,通过教师培训㊁专家讲座㊁示范课程等多种方式来加深教师对课程思政的理解.教师是高校的 第一主角 ,作为专业课教师,也有责任和义务认真挖掘所授课程的 思政元素 .例如,2021年,李晨和陈丽萍[2]在研究概率统计的思政元素时,以概率学者的文化素养和科学治学精神为切入点,通过多个实际案例剖析全概率公式的应用,潜移默化地引入诸多思政元素来激发学生的学习兴趣.受此启发,本文着重从概率论与数理统计课程中 假设检验 这一角度思考,通过教学设计来探索课程思政理念进概率统计课堂的实践方法,目的就是同大家交流如何上好 假设检验 这一知识点的教学课.首先,我们通过 女士品茶 这一广为流传且富有趣味性的故事引入,启发学生思考,从中提炼出假设检验的基本思想.其次,我们通过分析项链含金量这一实际案例总结出假设检验的基本步骤.接着,我们介绍假设检验的两类错误和p值的概念,并介绍假设检验的一些应用.最后,我们融入思政的元素,以我国著名数学家严加安院士的‘悟道诗“为结尾,阐述了概率统计的基本思想,同时激励学生向老一辈科学家学习,树立正确的价值观,从而丰富了课堂教学内容.二㊁教学过程(一)问题引入首先,我们从一个经典故事出发,来体会假设检验的基本思想.例1[3]㊀(女士品茶试验)故事发生在英国剑桥大学,那是20世纪20年代,一群大学精英们正在品茶.该茶是由牛奶和茶水混合而成的.在品茶过程中,一位女士宣称:先加入牛奶还是先加入茶,不同的顺序会使茶的口感不同.周围人都认为这位女士简直是在胡言乱语,这是不可能的啊!然而在场的统计学家Fisher却对这个话题很感兴趣,他请人端来10杯调制好的茶让该女士品尝,其中有的是先加的牛奶,有的是先加的茶.结果,这位女士正确地鉴别出每一杯茶的制作顺序.该如何判断该女士是否有鉴别能力呢?Fisher的想法:假设该女士没有鉴别能力,这个时候她只能靠猜,从而她猜对的概率为12.因此,她能同时判断出10杯茶的概率为2-10<0.001,这个概率非常非常小,仅仅做一次试验是几乎不会发生的,可是,它却发生了!这表明原假设不恰当,应予以拒绝,认为该女士有鉴别能力!假设检验的基本思想:小概率反证法思想.先提出假设,然后设计试验,在原假设成立的条件下计算概率,依据小概率原理来判断是否拒绝原假设.那么多大的概率属于小概率呢?对于不同的问题,会有不同的标准,在统计学中,这个小概率称为显著性水平,常取0.05或0.01.接下来,我们就通过生活中的一个实际案例来探索一下假设检验的奥秘.(二)实例分析在生活中,经常会遇到一组数据,我们来看下面的例子.例2[4]㊀质检部门接到投诉后,对某金店进行调查,从标有18K的一批项链中抽取20条,测得其含金量如下:表1㊀某金店项链含金量数据单位:K17.618.117.918.318.017.417.518.617.317.817.317.818.117.417.618.017.218.318.317.5∗通信作者:李石虎,男,讲师,博士,就职于江苏师范大学,研究方向为概率论与数理统计.联系方式:江苏省徐州市江苏师范大学泉山校区数学与统计学院;电话邮编:221116;E-mail:shihuli@jsnu.edu.cn.㊀㊀㊀㊀㊀㊀问:如何判断这批项链有没有达到标准呢?(显著性水平α=0.05)分析:观察表1中的数据,我们可以发现:有的含金量大于18K,有的含金量小于18K,还有的恰好等于18K.那么我们能否直接说和标准值18K有显著差别呢?根据所学的统计学思想方法,我们已经了解到答案是否定的,因为这里看到的只是样本数据,我们无法直接做出判断.那么应该如何判断呢?我们的思路如下:首先,计算出这20条项链含金量的平均值为17.8,它与标准值18存在0.2的差值.这0.2的差值是由抽样引起的误差,还是有本质的差别?我们利用上述思想来检验一下.令ξ表示这批项链的含金量,由中心极限定理可知ξ ㊃N(μ,σ2),我们要检验均值是否为μ=18,具体步骤如下:1.建立假设.原假设H0:μ=18,表示这批项链符合标准;与之对立的备择假设H1:μʂ18,表示这批项链不符合标准.2.在H0成立时,由Fisher定理可知统计量T= x-μSnnt(n-1)=t(19).3.由T分布图像(如图1)可以看出:T的取值集中在零点附近.这表明:|T|越大,对应的概率就越小.从而存在临界值C,使得|T|大于或等于C是一个小概率事件,则C要满足P(|T|ȡC|H0成立)=α,再由T分布图像的对称性可知C=t0.975(19)ʈ2.093.图1㊀T分布图像从而,当|T|ȡ2.093时,非常小的概率事件在此就发生了,只能拒绝原假设H0.我们将W={(ξ1,ξ2, ,ξn)||T|ȡ2.093}这一集合称为拒绝域,如果样本的观测值落到W中,则原假设应被拒绝.4.代入样本均值和样本标准差进行计算,得到所观测的样本统计量t的值:|t|=|17.8-18|0.4039320ʈ2.214>2.093,其落到拒绝域W中,因此原假设被拒绝,故这批项链没有达到标准.为了更直观地理解拒绝域的含义,同学们可以参考T分布图像.小结㊀本案例利用假设检验思想得出了该金店项链的含金量不符合标准的结论,启发我们对待任何事情都不要抱有侥幸心理,不要弄虚作假,要诚信做人做事,方能赢得大家的信任.项链含金量不达标可能只是使消费者金钱方面的利益受损.试想一下:如果是某大型婴儿奶粉企业检测出质量不达标的产品呢?再或者是婴儿霜经检测含有毒物质呢?抑或是我们服用的某种药物检测出有危害健康的成分呢?这些案例都不是捕风捉影,均上过各大网站热搜,引起了消费者的恐慌.利用假设检验这个工具,有助于我们全面地认识这类事件,既可以让我们避免无谓的损失,又可以帮助我们找到有利的取舍依据.(三)假设检验的基本步骤通过对上述案例的分析,我们可以归纳出求解假设检验的基本步骤:第一步:从要研究的实际问题引入,先提出一个假设,一般称之为原假设,记为H0,与其对立的假设称为备择假设,记为H1.例如,在上述案例中,原假设为 这批项链符合标准 ,备择假设为 这批项链不符合标准 .第二步:依据所研究总体服从的分布,我们来构造合适的检验统计量,并通过所学知识来确定统计量服从的分布.第三步:接下来,我们需要确定检验的拒绝域W使得P((ξ1,ξ2, ,ξn)ɪW|H0成立)ɤα.第四步:根据样本数值计算统计量所对应的观测值.如果计算所得观测值落进了W中,则说明原假设不当,应予以拒绝,否则原假设不可以被拒绝.(四)假设检验的两类错误在 女士品茶 的例子中,如果该女士本来就没有鉴别能力,但是她运气好,每次都猜对了,这时候我们的推断就出错了.事实上,在假设检验问题中,我们由样本提供的信息来推断总体信息,由于样本只包含总体的一部分信息,这就不可能保证从来不会犯错误.假设检验可能犯的错误有如下两类:(Ⅰ)是否在 拒绝假设H0 时用了 小概率原理 .注意小概率事件并非不可能事件,如果原假设本为真,但由于样本值落进了拒绝区域内而得出 拒绝 的结论,这里犯的错误为弃真错误,通常称为第一类错误,记为α,即P(拒绝H0|H0为真)=α.(Ⅱ)反之,如果原假设H0本来是不成立的,却由于样本值未落进拒绝区域而得出 不能拒绝 的结论.这里的错误是纳伪错误,一般称为第二类错误,记作β,即P(接受H0|H0不真)=β.根据检验法则知:当H0成立时,拒绝H0的概率小于或等于显著性水平α,但是显著性水平α取得越小越好,因为㊀㊀㊀㊀㊀此时拒绝域也会相应地减小,从而导致犯第二类错误的概率增大.这是一个矛盾的双方,类似于区间估计时的做法,我们需要先固定显著性水平α,再选择合理的检验统计量来适当地减小β的值.下面我们再结合一个实际例子来理解两类错误:在新冠肺炎疫情发生初期,新闻报道中时常会出现 假阳 的检测结果.我们可以从假设检验的两类错误的角度来理解:事实上,任何检验方法都会存在犯错误的可能性,理想的试剂应是 假阴 和 假阳 出现的概率都越小越好,但当样本量有限㊁检测技术没有明显优化提升时,一类错误概率的减少必会导致另一类错误概率的增加,因此处理原则是:人为限定犯第一类错误的概率α,为降低犯第二类错误的概率,我们可以增大样本容量.所以,从统计学的观点看,新闻报道中的 假阴 假阳 患者出现并不奇怪.启发:小概率事件虽然在一次试验中不易发生,但绝非不可能事件,重复次数多了,发生的可能性也就增大了.这说明做任何事情都不要存在投机取巧的心理,俗话说 常在河边走,哪有不湿鞋 勿以恶小而为之,勿以善小而不为 .反之,再困难的事情,只要我们持之以恒,总是可以成功的,正所谓 锲而不舍,金石为开 !(五)假设检验的p值可以看出,显著性水平α变小,对应的拒绝域也会变小;当显著性水平α取得足够小时,使得样本值不落在相应的拒绝域中,从而在此显著性水平α下不能拒绝假设H0.当显著性水平α由上述足够小的值不断增大时,对应的拒绝域也会变大,当显著性水平α大到一定程度时,便可以使样本值落入相应的拒绝域中,从而在此显著性水平α下可以拒绝假设H0.对于一个确定的样本值,存在一个实数p(0<p<1),当显著性水平α=p时可以拒绝H0,而当α<p时原假设H0不可以被拒绝.可见,p是使依据给定样本数值做出 拒绝H0 的最小的那个显著性水平,我们称之为检验的p值.在例2中,我们也可以通过统计软件计算t统计量的值和p值:表2㊀某金店项链含金量检验结果检验值=18tdfp值均值差值项链含金量-2.214190.039-0.20000给定显著性水平α为0.05,由表2可知p值0.039<0.05,原假设应被拒绝,认为项链含金量与18K之间有显著的统计差异,从而得出 项链不符合标准 的结论.(六)课堂小结与思政本节课我们主要通过 女士品茶 的案例引入假设检验的基本思想,通过分析项链含金量这一实际案例总结出假设检验的基本步骤,也给出了假设检验的两类错误和p值的含义,这为接下来进一步学习不同类型的㊁具体的假设检验打下了必要的基础.假设检验不仅是一种重要的统计方法,更是一种思维方式,告诉我们用数据来说话,理性地看待问题.正因为如此,假设检验在我们的现实生活中有着十分重要的应用.比如,专家利用假设检验,结合临床数据分析不同采样点㊁人群㊁年龄的新冠病毒核酸检测的结果,给有关部门的决策提供参考.假设检验的理论方法不仅被广泛应用于医学检验㊁生物制药等诸多领域,在我们的生产生活,特别是工业产品的质量判断中也有着十分广泛的应用[5],因为在工厂的实际生产过程中,产品的尺寸总是左右浮动的,存在一定的误差,那么如何判断这些误差是否在允许的范围内?这就要用到假设检验的思想方法.不仅如此,假设检验的理论还可应用于文学研究.例如,东南大学韦博成教授在2009年[6]利用假设检验的理论方法分析了‘红楼梦“前80回与后40回的某些文风差异,得到的结论是 这两部分内容在写作风格方面存在明显的差异 ,给关于‘红楼梦“作者的论断提供了一个强有力的证据.在现实生活中,数据是无处不在的,学习假设检验的思想方法有助于我们正确地挖掘数据背后的规律,做出更客观的判断.如今,我们身处一个大数据时代,通过学习假设检验,更重要的是培养透过现象看本质这一统计思维.这里,调查得来的数据是现象,规律是从数据中探索出来的本质属性.我们需要借助数学模型,并结合统计方法来寻找这其中的规律和随机性,在潜移默化中培养统计思维.正如我国著名的数学家严加安院士在‘悟道诗“中所题:随机非随意,概率破玄机;无序隐有序,统计解迷离.注:课后同学们若想进一步了解统计学的发展历程,可以读一读‘20世纪统计怎样变革了科学:女士品茶“[7]这一科普著作.ʌ参考文献ɔ[1]习近平主持召开学校思想政治理论课教师座谈会[N].新华社,2019-03-18,20:57.[2]李晨,陈丽萍.概率论与数理统计课程教学中思政元素的挖掘与实践[J].大学教育,2021(9):104-106.[3]茆诗松,程依明,濮晓龙.概率论与数理统计教程:第3版[M].北京:高等教育出版社,2019.[4]朱元泽,李贤彬.概率论与数理统计[M].上海:上海交通大学出版社,2015.[5]乔静.假设检验在工业产品质量判断中的应用[J].机电信息,2020(27):142-143.[6]韦博成.‘红楼梦“前80回与后40回某些文风差异的统计分析(两个独立二项总体等价性检验的一个应用)[J].应用概率统计,2009(4):441-448.[7]萨尔斯伯格.20世纪统计怎样变革了科学:女士品茶[M].北京:中国统计出版社,2004.。
假设检验这里将涉及到统计学分析最为主要的理论前提:假设检验。
假设检验思想是构建统计理论,分析统计数据的决策支持的基石。
这里将首先介绍假设检验的相关思想、理论基础、分析步骤等,然后分别叙述几个比较重要的分布类型检验——正态分布检验、二项分布检验以及游程检验,并借此使同学们更加熟悉假设检验基本思想的具体应用。
一、假设检验的概念与原理1、假设检验的思维逻辑为了直观地介绍假设检验及其原理,这里不妨以实际生活为背景虚构一个例子:某商家宣称他的一大批鸡蛋“坏(变质)蛋率为1%”。
为了对这批鸡蛋的质量(即“坏蛋率为1%”还是“坏蛋率高于1%”)做出判断,顾客与商家约定,从中随机抽取5个作检查。
结果为4个“好蛋”,1个“坏蛋”。
根据这一检查结果,几乎任何一位顾客都会对“这批鸡蛋坏蛋率为1%”的广告词发生怀疑。
在“坏蛋率为1%”的前提下,5个鸡蛋样品中出现一个“坏蛋”的机会是很小的(应用二项分布的原理可以计算出,在这种前提下5个鸡蛋中出现1个或更多变质蛋的概率为0.049)。
发生机会理应很小的事件竟然在一次抽样中出现了?! 人们不禁怀疑前提条件(如“坏蛋率为1%”)的真实性。
这一思维逻辑上升到统计理论便是“小概率事件在一次随机试验中不(大)可能发生”的推断原理。
当然这样推断也可能出错, 因为在“坏蛋率为1%”的前提下, 毕竟还有4.9%的可能真的出现5个鸡蛋有1个“坏蛋”, 甚至更多坏蛋的情形。
本章将要介绍的假设检验理论和方法,正是基于这一思维判断形式而发展出来的依据随机样本对于未知事物进行判断和决策的规则。
需要通过假设检验来处理的问题一般具有两个特点:一是需要从全局的范围,即从总体上对问题作出判断;二是不可能或者不允许对研究总体的每一个个体均做观察。
例如,某工厂生产了一批炮弹,需要检测它们的质量是否合格;某药厂生产了一批用安瓿瓶封装的注射药物,需要检测它们的质量是否合格;某种治疗高血压的新药的疗效是否优于常规药物等等。