最新人教A版选修2-3高二数学2.2 2 假设检验:二项分布与正态分布(选修2-3)教案
- 格式:doc
- 大小:754.11 KB
- 文档页数:36
庖丁巧解牛知识·巧学一、条件概率1.设A 、B 为两个事件,且P (A )>0,称P(B|A)=)()(A P AB P 为在事件A 发生的条件下,事件B 发生的条件概率.一般把P(A|B)读作B 发生的条件下A 的概率.2.条件概率的性质为:(1)条件概率具有概率的性质,任何事件的条件概率都在0和1之间,即0≤P(B|A)≤1;(2)如果B 和C 是两个互斥事件,则P(B ∪C|A)=P(B|A)+P(C|A).疑点突破 事件B 在“事件A 已发生”这个附加条件下的概率与没有这个附加条件的概率是不同的.深化升华 已知A 发生,在此条件下B 发生,相当于AB 发生,要求P (B |A )相当于把A 看做新的基本事件空间来计算AB 发生的概率,即 P(B|A)=)()()()()()()()(A P AB P n A n n AB n A n AB n =ΩΩ=. 每一个随机试验都是在一定条件下进行的,而这里所说的条件概率则是当试验结果的一部分信息已知(即在原随机试验的条件下,再加上一定的条件),求另一事件在此条件下发生的概率.二、事件的独立性设A 、B 为两个事件,如果P (AB )=P (A )P (B ),则称事件A 与事件B 相互独立 如果事件A 与B 相互独立,那么A 与B ,A 与B ,A 与B 也都相互独立.“P (AB )=P (A )P (B )”,说明事件A 是否发生对事件B 发生的概率没有影响,即P (B |A )=P (B ).一般地,如果事件A 1,A 2,…,A n 相互独立,那么这n个事件都发生的概率,等于每个事件发生的概率的积,即P(A 1A 2…A n )=P (A 1)×P(A 2)×…×P(A n ).同两事件相互独立的公式应用前提一样,这儿也只有当A 1,A 2,…,A n 相互独立时才成立.辨析比较 事件的“互斥”与“相互独立”是两个不同的概念.两事件“互斥”是指两事件不可能同时发生,两事件“相互独立”是指一个事件的发生与否对另一个事件发生的概率没有影响.知识拓展 1-P (A )×P (B )表示两个相互独立事件A 、B 至少有一个不发生的概率.三、独立重复试验与二项分布1.独立重复试验:一般地,在相同条件下重复做的n次试验称为n次独立重复试验.“在相同条件下”,是指在n次独立重复试验中,各次试验的结果不会受到其他试验的影响. n次独立重复试验常见的实例有:①反复抛掷一枚均匀硬币;②正(次)品率的抽样;③有放回的抽样;④射手射击目标命中率已知的若干次射击.2.二项分布:一般地,在n次独立重复试验中,设事件A 发生的次数为X ,在每次试验中事件A 发生的概率为p,那么在n次独立重复试验中,事件A 恰好发生k次的概率为P (X=k )=k n C p k (1-p )n-k ,k=0,1,2,…,n.此时称随机变量X 服从二项分布.记作X —B (n,p ),并称p为成功概率.二项式[(1-p )+p ]n 的展开式中,第k+1项为T k+1=k n C (1-p)n-k p k ,可见P(X=k)就是二项式[(1-p)+p ]n 的展开式中的第k+1项,故此公式称为二项分布公式.方法归纳 求概率问题时,一般按如下步骤解决:①确定所给事件的性质.归纳为古典概型、互斥事件、独立事件、独立重复试验中的某一种;②u 判断事件的运算.看是和事件、积事件,确定事件至少有一个发生还是同时发生,从而运用相加或相乘的公式;③运用相应的公式求解.问题·探究问题1 我们知道,抛掷两次硬币,出现一次正面的概率是21.那么抛掷100次硬币一定会出现50次正面吗?思路:不会.事实上,将一枚硬币随机掷100次,相当于重复做了100次试验,每次有两个可能结果(出现正面或出现反面).出现正面的概率为21,根据n次独立重复试验中事件发生k次的概率公式,随机掷100次正好出现50次正面的概率为P 100(50)=50100C (21)100≈0.08.这个事件发生的可能性很小.探究:误认为“抛掷100次硬币一定会出现50次正面”,是因为没有理解“n次独立重复试验恰好发生k次”这一概率模型.这里指的是掷100次硬币恰好有50次正面,因而它的概率并不等于21,应该是掷100次硬币至少有50次正面的概率为21. 问题2 条件概率和相互独立事件同时发生的概率有什么异同?互斥事件和相互独立事件的区别是什么?思路:设事件A 、B ,在事件A 发生的条件下事件B 发生,等价于事件A 和B 同时发生,即AB 发生.但是在相互独立事件同时发生的概率中,A 、B 相互独立,互不影响,在条件概率中A 、B 有联系,不独立,即若B 发生,则A 一定发生.互斥事件和相互独立事件是两个不同的概念,两者都是对两个事件而言的,不同的是:“互斥事件”是说两个事件不能同时发生,“相互独立事件”是说一个事件发生与否与另一个事件发生的概率没有影响.因此,互斥事件和相互独立事件一定要区分清楚.探究:相互独立事件的概率求解一般是应用乘法公式,应用时要注意理解并运用相互独立事件的性质,如果事件A 与B 相互独立,那么A 与B ,A 与B ,A 与B 也都相互独立.如甲乙两人独立解同一道题,甲解决该问题的概率为P 1,乙解决该问题的概率为P 2,求恰好有1人解决这个问题的概率.我们应明确“恰好有1人解决这个问题”是指一人解出,同时另一人解不出,而两人解决问题是相互独立的.可以记甲解决这个问题的事件为A ,乙解决这个问题的事件记为B.则所求概率为P(A·B +A ·B)=P (A·B )+P (A ·B )=P (A )P (B )+P (A )P (B )=P 1(1-P 2)+P 2(1-P 1).典题·热题例1(2005浙江高考)袋子A 和B 中装有若干个均匀的红球和白球,从A 中摸出一个红球的概率是31,从B 中摸出一个红球的概率为p .(1)从A 中有放回地摸球,每次摸出一个,有3次摸到红球即停止.①求恰好摸5次停止的概率;②记5次之内(含5次)摸到红球的次数为ξ,求随机变量ξ的分布列.(2)若A 、B 两个袋子中的球数之比为1∶2,将A 、B 中的球装在一起后,从中摸出一个红球的概率是52,求p 的值. 思路分析: 由题意知,问题(1)可以看做是一个独立重复试验,可能利用独立重复试验的概率公式求解;问题(2)属于一个古典概型问题,可以用古典概型的概率公式解决.解:(1)①24C ×(31)2×(32)2×31=818. ②随机变量 ξ的取值为0,1,2,3.由n 次独立重复试验概率公式P n (k)=k n C p k (1-p)n-k ,得P(ξ=0)=05C ×(1-31)5=24332,P(ξ=1)=15C ×31×(1-31)4=24380, P(ξ=2)=25C ×(31)2×(1-31)3=24380, P(ξ=3)=33C (31)3+23C (31)2·32·31+24C ·(31)2·(32)2·31=8117或 P (ξ=3)=1-P (ξ=0)-P(ξ=1)-P(ξ=2)=1-811724351243808032==++ 随机变量 ξ的分布列是Ξ 01 2 3 P 24332 24380 24380 8117 (2)设袋子A 中有m 个球,则袋子B 中有2m 个球. 由523231=+m mp m ,得p=3013. 方法归纳 解决概率问题的关键是找出概率类型,所以对各种类型必须熟悉.根据试验的特点找出试验类型,然后采用相应的公式求解.例2在某次考试中,要从20道题中随机地抽出6道题,若考生至少能答对其中的4道题即可通过;若至少能答对其中5道题就获得优秀,已知某考生能答对其中10道题,并且知道他在这次考试中已经通过,求他获得优秀成绩的概率.思路分析: 本题属于条件概率问题.在已知该考生在考试中通过的前提下,获得优秀的概率,所以应根据条件概率的公式求解.解:设事件A 为“该考生6道题全答对”,事件B 为“该考生答对了其中5道题另一道答错”,事件C 为“该考生答对了其中4道题另2道答错”,事件D 为“该考生在这次考试中通过”,事件E 为“该考生在这次考试中获得优秀”,则A 、B 、C 两两互斥,且D=A ∪B ∪C,E=A ∪B.由古典概型的概率公式及加法公式可知P(D)=P(A ∪B ∪C)=P(A)+P(B)+P(C)=620210410620110510620610C C C C C C C C ++; P(AD)=P(A),P(BD)=P(C ∪B);P(E|D)=P(A ∪B|D)=P(A|D)+P(B|D)=58131********12180210)()()()(620620620620=+=+C C C C D P B P D P A P ,所以所求的概率为5813. 误区警示 利用公式P (B ∪C|A )=P (B|A )+P (C|A )可使求有些条件概率较为简捷,但应请注意这个性质在“B 与C 互斥”这一前提下才具备的,因此不要忽视这一条件而乱用这个公式.例3甲乙两个人独立地破译一个密码,他们能译出密码的概率分别为31和41,求: (1)两个人都译出密码的概率;(2)两个人都译不出密码的概率;(3)至多1个人译出密码的概率;(4)至少1个人译出密码的概率.思路分析: 我们把“甲独立地译出密码”记为事件A ,把“乙独立地译出密码”记为事件B ,显然,A ,B 为相互独立事件.问题(1)相当于事件A ,B 同时发生,即事件AB.问题(2)相当于事件A ·B .问题(3)“至多1个人译出密码”的对立事件是“两个人都译出密码”,即事件AB.问题(4)“至少1个人译出密码”的对立事件是“两个人都未译出密码”,即事件A ·B .由于A 、B 是相互独立事件,上述问题中,A 与B ,A 与B ,A 与B 都是相互独立事件,可以用公式计算相关概率.解:记“甲独立地译出密码”为事件A ,“乙独立地译出密码”记为事件B ,A 、B 为相互独立事件,且P (A )=31,P (B )=41. (1)两个人都译出密码的概率为:P (A·B )=P (A )·P (B )=31×41=121. (2)两个人都译不出密码的概率为:P(A ·B )=P (A )·P (B )=[1-P (A )]×[1-P(B)]=(1-31)(1-41)=21. (3)“至多1个人译出密码”的对立事件是“两个人都译出密码”,所以至多1个人译出密码的概率为1-P(AB)=1-P(A)P(B)=1-31×41=1211. (4)“至少1个人译出密码”的对立事件是“两个人都未译出密码”,所以至少1个人译出密码的概率为1-P(A ·B )=1-P(A )P(B )=1-4332⨯=21. 方法归纳 解答这类概率综合问题时,一般“大化小”,即将问题划分为若干个彼此互斥事件,然后运用概率的加法公式和乘法公式来解决.在运用乘法公式时,一定要注意是否满足彼此独立,只有彼此独立才能运用乘法公式.深化升华 在求事件的概率时,有时遇到求“至少…”或“至多…”等事件概率的问题,如果从正面考虑这些问题,它们是诸多事件的和或积,求解过程繁琐,但它们的对立事件却往往较简单,其概率也易求,此时,可逆向思维,先求其对立事件的概率,再利用概率的和与积的互补公式,求得原来事件的概率,即正难则反.例4某人射击5次,每次中靶的概率均为0.9,求他至少两次中靶的概率.思路分析: 至少有两次中靶包括恰好有2次中靶,恰好有3次中靶,恰好有4次中靶和恰好有5次中靶四种情况.而这些事件是彼此互斥的,而他每次射击中靶的概率均相等,并且相互之间没有影响,所以每次射击又是相互独立事件,因而他射击5次是进行5次独立重复试验.解:解法一:在5次射击中恰好有2次中靶的概率为25C ×0.92×0.13;在5次射击中恰好有3次中靶的概率为35C ×0.93×0.12;在5次射击中恰好有4次中靶的概率为45C ×0.94×0.1;在5次射击中5次均中靶的概率为55C ×0.95.至少有2次中靶的概率为25C ×0.92×0.13+35C ×0.93×0.12+45C ×0.94×0.1+55C ×0.95=0.008 1+0.072 9+0.328 05+0.590 49=0.999 54.解法二:至少有2次中靶的对立事件是至多有1次中靶,它包括恰好有1次中靶与全没有中靶两种情况,显然这是两个互斥事件.在5次射击中恰好有1次中靶的概率为15C ×0.9×0.14;在5次射击中全没有中靶的概率为0.15.所以至少有2次中靶的概率为1-15C ×0.9×0.14-0.15=1-0.000 45-0.000 01=0.999 54.误区警示 如果我们对独立重复试验的意义理解不深刻,很容易得出其概率为25C ×0.92×0.13=0.008 1的错误结果.究其原因是“至少有2次中靶”这一事件并不是指“有2次中靶,而其余三次不中靶”,因而不能直接运用公式k n C p k (1-p)n-k .该公式仅适用于求某n次独立重复试验中,事件A 发生了k次,而其余的n-k次事件A 不发生的概率,且P (A )=p.例5某厂生产的电子元件,其每件产品的次品率为5%(即每件为次品的概率).现从一件产品中任意连续地取出2件,其中次品数ξ的概率分布是ξ 0 1 2P请完成上表.思路分析: 由于每件产品的次品率为5%,则连续取出2件就相当于2次独立重复试验,即题中次品数ξ服从二项分布.解:由题意知,ξ—B(2,5%),则P(ξ=0)=02C (5%)0(95%)2=0.902 5,P(ξ=1)=C 12(5%)1(95%)1=0.095,P(ξ=2)=22C (5%)2(95%)0=0.002 5.所以,所求随机变量ξ的分布列为:Ξ 0 1 2P 0.902 5 0.096 0.002 5深化升华 二项分布是一种常见的离散型随机变量的概率分布,它应用十分广泛,利用二项分布的模型可以快速地写出随机变量的分布列,从而简化了求随机变量取每一个具体概率值的过程,因此我们应熟练掌握二项分布.应用二项分布来解决实际问题的关键在于在实际问题中建立二项分布的模型,也就是看它是否为n次独立重复试验,随机变量是否为在这n次独立重复试验中某事件发生的次数,满足这两点的随机变量才服从二项分布,否则就不服从二项分布.例6某车间有10台同类型的机床,每台机床配备的电动机功率为10千瓦,已知每台机床工作时,平均每小时实际开动12分钟,且开动与否是相互独立的,现因电力供应紧张,供电部门只提供50千瓦的电力给这10台机床,问这10台机床能够正常工作的概率是多少? 思路分析:50千瓦电力可同时供给5台机床开动,10台机床同时开动的台数不超过5台都可以正常工作,而每台开动与否是相互独立的,这是独立重复实验的问题.解:每台机床只有“开动”与“不开动”两种情况,开动的概率为516012=,不开动的概率为1-5451=.由于机床是否开动是相互独立的,因此10台机床正常工作,相当于做10次重复实验,但供电部门提供50千瓦的电力只能使5台机床同时工作.所以P=P 10(0)+P 10(1)+P 10(2)+P 10(3)+P 10(4)+P 10(5)=010C ·(51)0·(54)10+110C ·(51)1·(54)9+210C ·(51)2·(54)8+310C ·(51)3·(54)7+410C ·(51)4·(54)6+510C ·(51)5·(54)5=0.094. 故这10台机床能够正常工作的概率为0.094.误区警示 本题容易忽视的是独立重复试验含义,独立重复试验是指在同样条件下可重复进行的,各次之间相互独立的一种试验,每次试验都只有两种结果,并且在每一次试验中,事件发生的概率均相等.。
第七章假设检验:二项分布与正态分布有了概率和概率分布的知识,接下来我们要逐步掌握统计检验的一般步骤。
既然按照数学规则得到的概率都不能用经验方法准确求得,于是,理论概率和经验得到的频率之间肯定存在某种差别,这就引出了实践检验理论的问题。
随机变量的取值状态不同,其概率分布的形式也就不同。
本章我们不仅要引出二项分布和正态分布这两个著名的概率分布,并且要将它们与抽样调查联系起来,以领会统计检验,并逐步拓宽其应用面。
第一节二项分布二项分布是从著名的贝努里试验中推导而来。
所谓贝努里试验,是指只有两种可能结果的随机试验。
在实际问题中,有许多随机现象只包含两个结果,如男与女,是与非,生与死,同意与不同意,赞成与反对等等。
通常,我们把其中比较关注那个结果称为“成功”,另一个结果则称为“失败”。
每当情况如同贝努里试验,是在相同的条件下重复n次,考虑的是“成功”的概率,且各次试验相互独立,就可利用与二项分布有关的统计检验。
虽然许多分布较之二项分布更实用,但二项分布简单明了,况且其他概率分布的使用和计算逻辑与之相同。
所以要理解统计检验以及它所涉及的许多新概念,人们几乎都乐意从二项分布的讨论入手。
1.二项分布的数学形式我们仍从掷硬币的试验人手。
假定二项试验由重复抛掷n次硬币组成,已知硬币面朝上(成功)的概率是p,面朝下(失败)的概率是q (显然有 q=1―p)。
这样,对试验结果而言,成功的次数(即硬币面朝上的次数)X是一个离散型随机变量,它的可能取值是0,1,2,3,…,n。
而对X的一个具体取值x而言,根据乘法规则,我们立刻可以就试验结果计算出一种特定排列(先x次面朝上,而后n―x次面朝下)实现的概率,即ppp…pqqq…q=p x q n-x(7.1)由于正确解决概率问题,光考虑乘法规则是不够的,还要考虑加法规则,于是我们根据 (6.27)式,又可以得到就x 次成功和(n ―x )次失败这个宏观结果而言所包含的所有排列的方式数,用符号x n C 表示x n C =)!(!x n x n -! (7.2) 这样,我们就得到了二项试验中随机变量X 的概率分布,即P (X =x )=x n C p x q n-x(7.3)譬如,二项试验是将一枚硬币重复做8次抛掷,假设这枚硬币是无偏的,即p =q =0.5,那么根据(7.3)式,恰好得到5次面朝上的概率是P (5)=58C p 5q 8-5=!!!358521)(321)(=0.219 同理,我们也可以求出这个二项试验中硬币刚好为0,1,2,…,8次面朝上的各种宏观结果的概率,全部写出来就是表7.1。
注意:当x 为0时,0!=1。
此外x n C =x n n C -,掌握这种对称性,将有助于简化运算。
表7.1表7.1清楚地显示,做8次抛掷一枚硬币的重复试验,我们将得到9个可能结果中的一个。
与经验认识不同的是,通过运用概率论,实现的每个可能结果都与一定的概率相联系。
据此,我们可以对各种结果实现的可能性作出估计。
其中,试验结果为4次成功(即4次面朝上)的可能性最大,而试验结果为全部面朝上(即8次面朝上)或全部面朝下(即0次面朝上)的可能性最小,每做256次同样的重复试验才可望看到一次。
在这个简单例子中,每回试验硬币仅被重复抛掷了8次,也仅能有为数不多的可想象到的结果。
当然,还可以设想做硬币重复抛掷更多次的试验.比如硬币被重复抛掷100次,那么可能实现的结果就会有101种。
同样运用概率论的知识,我们可以把这些可能结果编组,并把概率和整个一组结果相联系。
每当我们把概率与重复试验的每一种可能结果或几组结果联系起来时,就会得到如表7.1所示的概率分布,我们称之为二项分布。
2.二项分布的讨论(1)二项分布为离散型随机变量的分布。
每当试验做的是在相同的条件下n次重复的贝努里试验时,随机变量X共有n+1个取值。
二项分布可以用分布律(表7.2)和折线图(图7.1)来表示。
表7.2(2)二项分布的图形当p =0.5时是对称的,当p≠ 0.5时是非对称的,而当n 愈大时非对称性愈不明显(参见图7.1)。
(3)二项分布的数学期望E (X )=μ=np ,变异数D (X )=σ2=npq 。
(4)二项分布受成功事件概率p 和试验次数n 两个参数变化的影响,只要确定了p 和n ,成功次数x 的概率分布也随之确定。
因而,二项分布还可简写作B (x ;n ,p )。
(5)二项分布的概率值除了根据公式直接进行计算外,还可查表求得。
二项分布表的编制方法有两种:一种依据概率分布律P (x )编制(见附表2);另一种依据分布函数F (x )编制(见附表3)。
F (x )=P (X≥x )=∑nx p n x B ),;((7.4)[例7.1.1] 某特定社区人口的10%是少数民族,现随机抽取6人,问其中恰好2人是少数民族的概率是多少?[解] 解法一:根据(7.3)式直接计算P (X =2)=26C p 2q 4=!!!4262101)(4109)(=0.0984=9.84% 解法二:根据附表2中纵列n =6和横行p =0.1所对应x 值,可直接查得B (x ;6,0.1)的概率值B (2;6,0.1)=0.0984解法三:根据附表3求得B (2;6,0.1)=F (2)- F (3 )=0.1143―0.0159=0.0984[例7.1.2]求B (x ;8,0.7)的中位数。
[解] 根据附表3中纵列n =8和横行p =0.7所对应的x 值,可查出大于等于x 的概率值。
由于附表列示的是二项分布的累计概率,因此求中位数很方便。
M d =5.5 +2553.05518.05.05518.0--=5.6747第二节统计检验的基本步骤二项分布是用数学或演绎推理的方法求得的一种理论分布。
认识到概率分布是先验的理论分布这一点很重要,因为我们不禁要问,既然试验或抽样调查的结果仅与随机变量可能取值中的一个相联系,那么实际试验或样本调查对结果的概率分布及前提假设有没有一个检验的问题?具体来讲,对于一枚硬币被重复抛掷8次的二项试验,经验告诉我们,一共有9种可能的结果,而且实现这些结果的机会是大不相同的。
研究者实际上从来不用经验的方法求得概率分布,因为通常我们只对一项试验进行一次或几次,抽取样本也是一个或至多不过几个。
既然二项分布是按照数学规则得到的,那么对这9种结果的可能性我们应该作出何种评价呢?如果实际抽样得到的结果偏巧就是先验概率预示的最不可能出现的结果,那么我们是认定纯属巧合,还是开始对用数学或演绎推理方法求得的概率以及理想试验的种种前提假设产生怀疑?更准确地说,在一枚硬币被重复抛掷8次的这个二项试验中,究竟出现什么结果时,我们应该对二项分布及其前提假设产生怀疑呢?是不是只要不是得到4次成功4次失败这个最大可能性结果就开始怀疑,还是仅当出现8次成功或一次也不成功这两个极端情况时才产生怀疑呢?这就是统计检验的核心问题。
概率分布不是一种研究者从资料中看到的分布,我们讨论它,不是出于对数学的爱好,而是因为统计推论的有关工作需要它。
现在,我们要进入系统讨论统计假设检验的实际步骤的阶段。
所有的统计检验都包含某些特定的步骤,这里先列示如下:(1)建立假设;(2)求抽样分布;(3)选择显著性水平和否定域(4)计算检验统计量;(5)判定。
应当注意,在统计检验中,概率分布都是与样本的可能结果相联系的,所以已超越了纯数学范畴。
本书至此,开始将概率分布化为抽样分布来具体讨论。
所谓抽样分布,就是把具体概率数值赋予样本每个或每组结果的概率分布。
1.建立假设统计检验是将抽样结果和抽样分布相对照而作出判断的工作。
取得抽样结果,依据描述性统计的方法就足够了。
抽样分布则不然,它无法从资料中得到,非利用概率论不可。
而不对待概括的总体和使用的抽样程序做某种必要的假设,这项工作将无法进行。
比如通过掷硬币的实验得到二项分布,必须假设:①样本是随机的,各次抛掷相互独立;②硬币是无偏的(或称是诚实的),即p=q=0.5。
概括地说,必须首先就研究总体和抽样方案都做出假设,再加上概率论,我们就可以对各种可能结果做具体的概率陈述了。
2.求抽样分布在做了必要的假设之后,我们就能用数学推理过程来求抽样分布了。
比如在这一章开头,在硬币抛掷n次的理想实验中,我们计算了成功次数为x的宏观结果所具有的概率,得到二项分布。
如果前提假设变动了,还可以求出其他形式的概率分布,如正态分布、泊松分布、卡方分布等等,它们都有特定的方程式。
由于数学上已经取得的成果,实际上统计工作者要做的这项工作往往并不是真的去求抽样分布的数学形式,而是根据具体需要,确定特定问题的统计检验应该采用哪种分布的数学用表。
3.选择显著性水平和否定域有了与问题相关的抽样分布,我们便可以把所有可能的结果分成两类:一类是不大可能的结果,比如硬币被抛掷8次,结果8次都面朝上。
另一类则相反,我们预料这些结果很可能发生。
既然如此,如果我们在一次实际抽样中得到的结果恰好属于第一类,我们就有理由对概率分布的前提假设产生怀疑。
在统计检验中,这些不大可能的结果称为否定域。
如果这类结果真的发生了,我们将否定假设;反之就不否定假设。
概率分布的具体形式是由假设决定的,假设肯定不止一个。
从统计检验的角度来看,所有假设在逻辑推理中都有相同的地位。
如果作为检验用的样本结果真的落在否定域内,那么可以讲,至少假设中的一个(也可能是全部)是错的。
就像在掷硬币的试验中,如果实际结果落在否定域中,那么我们可以说前提假设有问题。
不过,究竟是硬币不诚实还是抽样在程序上违反了随机原则,我们却无从得知。
所以要使检验具有意义,必须把怀疑集中在其中一个假设上。
在统计检验中,通常把被检验的那个假设称为零假设(或称原假设,用符号H0表示),并用它和其他备择假设(用符号H1表示)相对比。
至于我们究竟情愿认为假设中哪一个可能是错误的,因而应该作为被检验的对象,除了检验本身所提供的知识外,还必须从以往的经验或其他方面了解更多的东西。
在掷硬币的试验中,如果可以确定抽样程序遵循了随机原则,那么我们就可以认为硬币有偏,并把硬币无偏定为零假设。
一旦实际结果是落在否定域,我们就说p=0.5的假设错了。
反之,实际结果落在否定域之外,就不允许我们否定零假设。
值得注意的是,假设只能被检验,从来不能加以证明。
统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。
比如硬币抛掷试验的结果没有落在否定域中,我们不能据此就判定p=0.5的假设是对的。
因为假若硬币真正面朝上的概率是0.49而不是0.50,则正确的抽样分布和我们所计算的几乎完全相同。
如果我们因为不能否定零假设就冒然地肯定它,就很可能因为用语太绝对而犯错误。
所以在统计检验中,一个零假设如果我们不能否定它,也不能将它作为完全正确的假设而无保留地予以接受,而宁愿采用“不能否定它”的陈述。