统计推断 pdf
- 格式:docx
- 大小:36.05 KB
- 文档页数:1
第六章统计推断第四章研究了随机变量的几种分布律,总体如何配合样本,第五章讲的是样本统计量的分布规律,这些都属于总体与样本之间关系的第一个方面。
本章讨论第二个方面,即如何通过样本来推断总体。
由样本推断总体是以各种样本统计量的抽样分布为基础的。
所谓统计推断是指根据样本以及问题的条件和假定模型对未知事物(即总体)作出的以概率形式表述的推断,它主要包括假设检验和参数估计两个内容。
对所估计的总体提出一个假设,例如假设这个总体的平均数μ等于某个值μ0(μ= μ0),然后通过样本数据去推断这个假设是否可以接受。
如果可以接受,样本很可能抽自这个总体;否则,很可能不是抽自这个总体。
这一统计推断过程就是所谓的统计假设检验。
第一节单个样本的统计假设检验一、一般原理及两种类型的错误二、单个样本显著性检验的程序三、在σ已知的情况下,单个平均数的显著性检验—U 检验四、在σ未知时平均数的显著性检验——t 检验五、变异显著性的检验—x 2检验一、一般原理及两种类型的错误例1 用实验动物做实验材料,要求动物平均体重μ=10.00g ,若μ<10.00g,则需再饲养,若μ>10.00g则应淘汰。
动物体重是服从正态分布N (μ,σ2)的随机变量。
已知总体标准差σ= 0.40g ,但总体平均数μ是未知的。
为了得出对总体平均数μ的推断,从动物群体中,随机抽取含量为n的样本,通过样本平均数推断总体平均数μ。
(一)基本概念x 零假设是被检验的假设,通过检验可能被接受,也可能被否定。
本例中如果接受H 0:μ=10.00g , 表示该实验条件下饲养的实验动物可供实验用。
这里假设μ=μ0或μ-μ0=0, 称为零假设(null hypothesis),记作H 0:μ=μ0或H 0:μ-μ0=0。
1.假设提出零假设的同时,相应地有一对应假设,称为备择假设(alternative hypothesis),记作H A :μ>μ0, μ<μ0,μ≠μ0。
第六章统计推断第六章统计推断6.1 什么是统计假设?统计假设有哪⼏种?各有何含义?假设测验时直接测验的统计假设是哪⼀种?为什么?6.2 什么是显著⽔平?为什么要有⼀个显著⽔平?根据什么确定显著⽔平?它和统计推断有何关系?6.3 什么叫统计推断?它包括哪些内容?为什么统计推断的结论有可能发⽣错误?有哪两类错误?如何克服?6.4 若n =16,=σ15,要在=α0.01⽔平上测验H 0:=µ140,问y 要多⼤?若n =100,=σ15,要在=α0.05⽔平上测验H 0:=µ100,试求其否定区域?[答案:(1)y <132.65或>147.35;(2)y <96.13或>103.87]6.5 对桃树的含氮量测定10次,得结果(%)为:2.38,2.38,2.41,2.50,2.47,2.41,2.38,2.26,2.32,2.41,试测验H 0:=µ 2.50(提⽰:将各观察值减去2.40,可简化计算)。
[答案:y =2.39%,=y s 0.02%,t =5.5]6.6 从前作喷洒过有机砷杀雄剂的麦⽥中随机取4株各测定砷的残留量得7.5,9.7,6.8,和6.4mg ,⼜测定对照⽥的3株样本,得砷含量为4.2,7.0及4.6mg 。
(1)已知喷有机砷只能使株体的砷含量增⾼,决不会降低,试测验其显著性;(2)⽤两尾测验。
将测验结果和(1)相⽐较,并加解释。
[答案:=2e s 2.218,=-21y y s 1.14]6.7 从⼀个⽅差为24的正态总体中抽取⼀个容量为6的样本,求得其平均数=1y 15,⼜从⼀个⽅差为80的正态总体中抽取⼀个容量为8的样本,并知=2y 13,试取=α0.05测验210µµ=:H 和相对应的21µµ≠:A H 。
[答案:u =0.534,接受H 0]6.8 ⼀个容量为6的样本来⾃⼀个正态总体,知其平均数=1y 30和均⽅=21s 40,⼀个容量为11的样本来⾃⼀个正态总体,得平均数=2y 22,均⽅=22s 45,测验=-210µµ:H 4和相对的21µµ-:A H >4,取0.05的显著⽔平。
第 5 章 统计推断5.1 统计推断概述统计推断就是利用样本的数据,对总体的数量特征作出具有一定可靠程度的估计和判断。
统计推断的基本内容有参数估计和假设检验两方面。
概括地来讲,参数估计是指研究一个随机变量,推断它的数量特征和变动模式。
而假设检验是检验随机变量的数量特征和变动模式是否符合我们事先所作的假设。
参数估计和假设检验的共同特点是它们对总体都不很了解,都是利用部分样本所提供的信息对总体的数量特征作出估计或判断。
所以,统计推断的过程必定伴有某种程度的不确定性,需要用概率来表示其可靠程度,这是统计推断的一个重要特点。
5.1.1 参数估计参数估计是以样本统计量作为未知总体参数的估计量,并通过对样本各单位的实际观察取得样本数据,计算样本统计量的取值,把它作为总体参数的估计量。
参数估计包括点估计和区间估计。
点估计是直接以样本统计量作为相应总体参数的估计量。
例如,用样本均值作为总体均值的点估计量,用样本方差作为总体方差的点估计量。
点估计的优点在于它能提供总体参数的的具体估计值,可以直接作为决策的数量依据。
但是,点估计事实上几乎不可能做到完全准确,更谈不上有多大的置信度。
而区间估计是估计总体参数以某种概率保证程度(置信度)落入某一区间,这样就有把握多了。
对总体被估计参数θ作区间估计,就是要给出区间的下限1ˆθ和上限2ˆθ,使被估计参数落在(1ˆθ,2ˆθ)内的概率为1α−,即 12ˆˆ()1P θθθα≤≤=− 其中,1α−就是置信度,α被称为显著性水平,如图 5-1。
ˆθ12图 5-1 区间估计在SPSS 中没有专门的参数估计命令。
参数的点估计值可以在Descriptives 命令中得到,例如用统计量mean 作为总体均值的点估计,用统计量variance 作为总体方差的点估计等。
参数的区间估计可以通过Explore 命令得到(参见4.4节的内容),也可以在各种假设检验的过程中可以得到(参见本节后面的内容)。
统计推断第五章统计推断所谓统计推断就是根据抽样分布率和概率理论,由样本结果(统计数)来推断总体特征(参数)。
试验实践中所获得的资料,通常都是样本的结果;⽽我们希望了解的却是抽得样本的总体。
统计推断:统计假设测验参数估计统计假设测验是根据某种实际需要对未知的或不完全知道的统计总体提出⼀些假设,然后由样本的实际结果,经过⼀定的计算,做出在概率意义上应当接受哪种假设的测验。
例如在相同的栽培管理条件下种植了甲、⼄两个⽟⽶品种各15个⼩区,如果测得甲品种平均亩产为1x =650 kg ,⼄品种平均亩产为2x =670 kg ,亩产相差20 kg ,这究竟是由于甲品种的总体平均数µ1的确不同于⼄品种的总体平均数µ2呢?还是由于随机抽样误差(µ1和µ2并⽆不同)?这不能通过简单的⽐较来下结论,必须通过概率计算做出选择,这就是统计假设测验要研究的问题。
参数估计是指由样本统计数对总体参数做出点估计和区间估计。
点估计是指由样本统计数估计相应参数。
区间估计是指以⼀定的概率保证总体参数位于某两个数值之间。
第⼀节统计假设测验的基本原理⼀、统计假设测验的基本⽅法就是试验⼯作者提出有关某⼀总体参数的假设。
例如假设某批产品符合标准。
但是如何确切地证实假设是正确的还是错误的呢?当然可以把全部产品逐个检验,这种研究总体中全部个体的⽅法当然是很准确的,但往往是⾏不通的。
我们不得不采⽤另⼀种⽅法,即研究样本。
也就是从全部产品中抽取样本进⾏检验,然后推断这批产品是否合格。
这种利⽤样本以测验假设是否正确或错误的过程,称为⼀个假设正确性(或不正确性)的统计证明。
如果通过测验证明假设与试验结果相符,则该假设就被接受;反之,如果假设与试验结果不相符,则该假设就被否定。
对统计总体⼀般作两个假设,⼀个是假设总体参数与某⼀指定值相等或假设两个总体参数相等,即假设其没有效应,这⼀假设称为⽆效假设,记作H 0;和⽆效假设相对应的另⼀统计假设,叫对应假设或备择假设,记作H A 。
第五章 统计推断一、填空题5.1.1 设样本()120,,,,1.69,:35来自则对检验n X X X N H m m = ,采用的检验量是X Z =5.1.2 设12,,,n X X X 是来自总体X 的一个样本,又设()()2,E X D X m s ==,则总体均值m 的无偏估计为()样本均值X ;总体方差2s 的无偏估计为2S (样本方差)。
5.1.3 若检验统计量的观测值落在拒绝域内,则应拒绝 0H 。
5.1.4 设11ni i X X n ==å为来自正态总体()2,N m s 的样本均值,m 未知,欲检验2200:H s s=,检验的统计量为()2201n S s-。
5.1.5 两个正态总体均值的假设检验()2201212:已知=H m m s s =,检验量为X Y()122T t n n a >+-。
5.1.6 若其他条件不变,置信度越高,则置信区间的长度越长 。
二、单项选择题(在每小题的3个备选答案中选出1个正确答案,并将其字母填在题干后面的括号内)5.2.1 对总体参数进行抽样估计的首要前提是必须 ( B )A .事先对总体进行初步分析B .按随机原则抽取样本C .保证调查数据的准确性、及时性5.2.2 若其它条件相同,则下列诸检验的P 值中拒绝原假设理由最充分的是 ( A )A .2%B .10%C .25%5.2.3 某校有学生8000人,随即抽查100人,其中有20人对学生管理有意见,则该校学生中对学校后勤管理有意见的人数的点估计值为 ( C )A .20%B .20C .16005.2.4 如果总体服从正态分布,但总体均值和方差未知,样本量为n ,则用于构造总体方差置信区间的随机变量的分布是 ( C )A .()0,1NB .()2,N m sC .()21n c -5.2.5 其他条件相同时,要使抽样误差减少1/4,样本量必须增加 ( C )A .1/4B .4倍C .7/95.2.6 影响区间估计质量的因素不包括 ( B )A. 置信度B. 总体参数C. 样本量5.2.7 某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,P 应选 ( A )A .85%B .87%C .90%5.2.8 设()2~,X N m s ,()12,,,n X X X 是X 的一个简单随机样本,则未知参数2s 的矩估计量为( A )A .()21i X X n-åB .()2i X m -åC .()2i nX m -å三、多项选择题(在下列4个备选答案中,至少有二个是正确的,请将其全部选出,并把字母填在题干后面的括号内)5.3.1 推断统计学研究的主要问题是 ( ABD )A .如何科学地从总体中抽出样本B .怎样控制样本对总体的代表性误差C .怎样消除样本对总体的代表性误差D .如何科学地由所取样本去推断总体5.3.2 确定样本容量时,必须考虑的影响因素有 ( ACD )A .总体各单位之间的离散程度B .样本各单位之间的离散程度C .抽样方式的极限误差D .抽样推断的把握程度 5.3.3 影响抽样误差大小的因素有 ( ACD )A .总体各单位之间的离散程度B .调查人员的素质C .抽样方式与抽样方法D .样本容量5.3.4 若12ˆˆ,q q 都是总体参数q 的无偏估计量,正确的说法是( BC )A .12ˆˆ,q q q q ==B .若()()12ˆˆD D q q £,则12ˆˆ比q q 更有效C .()()12ˆˆ0,0E E q q q q -=-= D .21ˆ的无偏估计量qq 5.3.5 在其他条件不变时,抽样推断的置信度1a -越大,则 ( ACD )A .允许误差范围越大B .抽样推断的精确度越高C .抽样推断的精确度越低D .抽样推断的可靠性越高 5.3.6 区间估计 ( BD )A .没有考虑抽样误差大小B .考虑了抽样误差大小C .不能说明估计结果的可靠程度D .能说明估计结果的可靠程度5.3.7 关于原假设的建立,下列叙述中正确的有 ( CD )A .若不希望否定某一命题,就将此命题作为原假设B .尽量使后果严重的错误成为第二类错误C .质量检验中若对产品质量一直很放心,原假设为“产品合格(达标)”D .若想利用样本作为对某一命题强有力的支持,应将此命题的对立命题作为原假设。
经济生活与数学第六单元 统计推断与风险评估课程第六单元 统计推断与风险评估(共四讲)目录CONTENTS课程第一单元 ●第一讲 §6.1 统计推断 ●第二讲 §6.2 全概率公式和贝叶斯公式 ●第三讲 §6.3 风险评估 ●第四讲 §6.4 贝叶斯推断与信用评级经济生活与数学第六单元 统计推断与风险评估 第一讲 统计推断湖南大学 王利平 副教授第六单元第一讲 §6.1 统计推断要点●统计推断的定义与案例 ●信息分类 ●主观概率的意义●统计推断的定义与实例统计推断统计学中根据来自样本的信息 对总体分布规律或总体的数字特征 进行的推断,称为统计推断。
●统计推断的定义与案例案例一 :一位同学和一位猎人去打 猎,发现了一只兔子,两人一起瞄准 目标,枪响了,兔子中了一枪,应声 倒地,是谁射中了兔子?●统计推断的定义与案例推论:这一枪是猎人射中的。
只发一 枪便打中,猎人命中的概率一般大于这 位同学命中的概率。
这个推断体现了 数学中极大似然法的基本思想 。
●统计推断的定义与案例案例二 :2014年3月8日,马航MH370 客机失联,媒体曝光近十年来空难真 相,人们不禁担忧:在通常出行方式 中乘坐飞机还是安全的吗?●统计推断的定义与案例推论:安全。
乘坐飞机出行在通常的出 行方式中发生意外的概率最小。
这个推 断体现了数学中对数据进行统计分析的 基本思想 。
说明:(1)信息和经验很重要; (2)用数学方法量化信息更重要。
●信息分类总体信息信息分类样本信息 先验信息经验 历史资料两大统计学派:经典学派与贝叶斯学派●主观概率的意义先验信息中根据个人经验确定事件 发生的可能性称为主观概率。
请看经济生活中用常用的主观概率 的例子。
●主观概率的意义(1)企业家预测:“某项新产品畅销的可 能性为80%”;(2)外科医生认为:“某位患者手术成功 的可能性为70%”;(3)中学班主任评估:“某位同学考取大 学的可能性为95%”。