假设检验中两种类型错误的关系
- 格式:doc
- 大小:156.50 KB
- 文档页数:3
统计学课后思考题答案统计学课后思考题答案统计学课后思考题答案~~ 来源: 张倩倩Orange的日志在百度文库上下载下来的,奉献给同胞们~统计课后思考题答案第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1. 什么是生物统计学生物统计学的主要内容和作用是什么生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料,是研究生命过程中以样本来推断总体的一门学科。
生物统计学主要包括试验设计和统计分析两大部分的内容。
其基本作用表现在以下4个方面:1.提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。
2.判断试验结果的可靠性。
3.提供由样本推断总体的方法。
4.提供试验设计的一些重要原则。
2. 随即误差与系统误差有何区别随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的误差,是不可避免的,随机误差可以通过试验设计和精心管理设法减小,而不能完全消除。
系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。
系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的。
3. 准确性与精确性有何区别准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。
精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。
准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。
4. 平均数与标准差在统计分析中有何用处他们各有哪些特性平均数的用处:①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进行比较。
平均数的特征:①离均差之和为零;②离均差平方和为最小。
标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;③在正态分布中,X+-S内的观测值个数占总个数的%,X-+2s内的观测值个数占总个数的%,x-+3s 内的观测值个数占总个数的%。
第一章绪论一、名词解释:1. population 2. sample 3. homogeneity 4. variation 5. parameter二、辨别正误:()1.定量变量、分类变量和有序变量可以相互转换。
()2.同质的个体间不存在变异。
()3.如果个体间有变异,则它们一定不是不是来自同一总体。
()4.离散变量在数值很大时,单位为“千”或“万”时可以取小数值,此时可以近似认为是连续型变量。
()5.样本是总体中典型的一部分。
三、选择题1. 统计工作的前提和基础是()A 收集资料B 整理资料C 分析资料D 调查资料E 校对资料2.为了由样本推断总体,样本应该()A 总体中的任意部分B 总体中的典型部分C 总体中有价值的一部分D 总体中有意义的一部分E 总体中有代表性的一部分3.统计分析的主要内容有()A 描述性统计和统计学检验B 区间估计和假设检验C 统计图表和统计报告D 描述性统计和分析性统计E 描述性统计和统计图表4.统计学上的总体为()A任意想象的研究对象的全体B根据研究目的确定的研究对象的全体C根据时间划分的研究对象的全体D根据人群划分的研究对象的全体E根据地区划分的研究对象的全体 5.搞好统计工作,达到预期目标,最重要的是( )A原始资料要正确B原始资料要多C分析资料要先进D整理资料要详细E统计计算精度要高四、问答题:统计工作的基本步骤是什么?第二章定量资料的统计描述一.名词解释1. mean2. :median]3. Q4. S5. CV二.填空1. 对定量资料的描述,有()趋势和()趋势。
2.描述定量资料的集中趋势,常用的指标有()、()和()。
3.描述定量资料的离散趋势,常用的指标有()、()、()、()和()4.变异系数的应用条件为()或()。
5.描述等级资料的集中趋势,适宜选用()。
三.选择题1. 从一个数值变量资料的总体中抽样,产生抽样误差的原因是A. 总体中的个体值存在差别B. 总体均数不等于零C. 样本中的个体值存在差别D. 样本均数不等于零E. 样本只包含总体的一部分2.在正态分布条件下表示变量值变异情况的指标最常用的是A 标准差B 标准误C 变异系数D 全距E 百分位数3.变异系数越大说明A 标准差越大B 平均数越大C 标准差、平均数都大D 平均数小E以均数为准变异程度大4.反映定量变量观察数据集中位置的指标是A 标准差B 标准误C 频率D 全距E 均数5.在服从正态分布的条件下,样本标准差的值A 与集中趋势有关B 与观察例数有关C 与平均数有关D 与平均数无关 E 与个体的变异程度有关四.简答题试述描述定量资料的集中趋势的常用指标、计算方法和应用条件。
假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值来下结论。
当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。
假设检验的目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。
在质量管理工作中经常遇到两者进行比较的情况,如采购原材料的验证,我们抽样所得到的数据在目标值两边波动,有时波动很大,这时你如何进行判定这些原料是否达到了我们规定的要求呢?再例如,你先后做了两批实验,得到两组数据,你想知道在这两试实验中合格率有无显著变化,那怎么做呢?这时你可以使用假设检验这种统计方法,来比较你的数据,它可以告诉你两者是否相等,同时也可以告诉你,在你做出这样的结论时,你所承担的风险。
假设检验的思想是,先假设两者相等,即:μ=μ0,然后用统计的方法来计算验证你的假设是否正确。
假设检验的基本思想1.小概率原理如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。
2.假设的形式H0——原假设,H1——备择假设双尾检验:H0:μ = μ0,单尾检验:,H1:μ < μ0,H1:μ > μ0假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。
《心理统计学》复习题及答案一、填空题1、次数分布的两个基本特征是趋势与趋势。
2、数据( 14,15,18,10,22,13,23,11)的中位数为,数据( 26,11,9,18,22,7,17,22,10)的中位数为。
3、数据( 14,15,18,10,22,13,23,11)的中位数为。
4、当样本分布满足分布时,样本的算数平均数、中位数、众数相等。
5、当样本容量足够大时,任何样本的分布都将趋于分布。
6、根据样本统计量对相应总体参数所做的估计叫总体参数估计,总体参数估计分为点估计和。
7、某班平均成绩为90 分,标准差为3 分,甲生得94.2 分,则甲生的标准分为。
8、统计推断中,经常犯的两类错误是,。
9、当两个变量都是变量,而且两者之间的关系呈线性关系时,才能采用积差相关。
10、随机变量可以分为_______变量和离散变量。
11、假设检验一般有两个相互对立的假设,即原假设和__________。
12、两个独立的正态总体,已知总体方差相等但未知其具体数值,从中分别抽取容量为10和13的两个样本进行平均数差异的显著性检验,其自由度应为__________。
13、标准分数是以__________为单位,表示一个原始分数在团体中所处的位置。
14、当样本分布是偏态时,描述数据集中趋势的有效量是________ 。
15、描述统计主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组。
16、从数据的观测方法和来源划分,研究数据可分为和。
17、统计图一般由下面几个部分组成、、、、、。
二、单项选择题1、关于心理统计学,正确的观点是()。
A、统计无用B、统计万能C、低劣的实验研究,好的统计方法可以提高其研究水平D、心理统计方法只是决定研究水平的诸多因素中的一个2、统计学的研究对象是()。
A、随机现象B、必然现象C、模糊现象D、其他3、研究如何通过局部数据所提供的信息,推论总体的情形,这一部分内容属于统计学的()。
第五章假设检验本章介绍假设检验的基本概念以及参数检验与非参数检验的主要方法。
通过学习,要求:1.掌握统计检验的基本概念,理解该检验犯两类错误的可能;2.熟练掌握总体均值与总体成数指标的各种检验方法;包括:z 检验、t 检验和p-值检验;4.掌握基本的非参数检验方法,包括:符号检验、秩和检验与游程检验;5.能利用Excel 进行假设检验。
第一节假设检验概述一、假设检验的基本概念假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。
假设检验与区间估计结合起来,构成完整的统计推断内容。
假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。
本章分别讨论这两类检验方法。
进行假设检验,首先要对总体的分布函数形式或分布的某些参数做出假设,然后再根据样本数据和“小概率原理”,对假设的正确性做出判断。
这种思维方法与数学里的“反证法”很相似,“反证法”先将要证明的结论假设为不正确的,作为进一步推论的条件之一使用,最后推出矛盾的结果,以此否定事先所作的假设。
反证法所认为矛盾的结论,也就是不可能发生的事件,这种事件发生的概率为零,该事件是不能接受的现实。
其实,我们在日常生活中,不仅不肯接受概率为0的事件,而且对小概率事件,也持否定态度。
比如,虽然偶尔也有媒体报导陨石降落的消息,但人们不必担心天空降落的陨石会砸伤自己。
所谓小概率原理,即指概率很小的事件在一次试验中实际上不可能出现。
这种事件称为“实际不可能事件”。
小概率的标准是多大?这并没有绝对的标准,一般我们以一个所谓显著性水平α(0<α<1)作为小概率的界限,α的取值与实际问题的性质有关。
所以,统计检验又称显著性检验。
下面通过一个具体例子说明假设检验是怎样进行的。
【例5-1】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。
第8章假设检验例题由统计资料得知,1989 年某地新生儿的平均体重为3190克,现从1990年的新生儿中国机抽取100个,测得其平均体重为3210克,问1990年的新生儿与1989年相比,体重有无显著差异★解:从调查结果看,1990 年新生儿的平均体重为3210克,比1989年新生儿的平均体重3190克增加了20克,但这20克的差异可能源于不同的情况。
_种情况是,1990 年新生儿的体重与1989年相比没有什么差别,20克的差异是由于抽样的随机性造成的;另一种情况是,抽样的随机性不可能造成20克这样大的差异,1990年新生儿的体重与1989年新生儿的体重相比确实有所增加。
上述问题的关键点是,20克的差异说明了什么这个差异能不能用抽样的随机性来解释为了回答这个问题,我们可以采取假设的方法。
假设1989年和1990年新生儿的体重没有显著差异,如果用μo表示1989年新生儿的平均体重,μ表示1990年新生儿的平均体重,我们的假设可以表示为μ=μ或μ心=0,现要利用1990年新生儿体重的样本信息检验上述假设是否成立。
如果成立,说明这两年新生儿的体重没有显著差异;如果不成立,说明1990年新生儿的体重有了明显增加。
在这里,问题是以假设的形式提出的,问题的解决方案是检验提出的假设是否成立。
所以假设检验的实质是检验我们关心的参数一1990 年的新生儿总体平均体重是否等于某个我们感兴趣的数值。
例某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于1 000小时,已知灯泡燃烧寿命服从正态分布,标准差为200小时。
在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡★解:这是一个单侧检验问题。
显然,如果灯泡的燃烧寿命超过了1 000小时,批发商是欢迎的,因为他用已定的价格(灯泡寿命为1 000小时的价格)购进了更高质量的产品。
因此,如果样本均值超过1000小时,他会购进这批灯泡。
假设检验中两种类型错误之间的关系
(一) α与β是在两个前提下的概率。α是拒绝H0时犯错误的概率(这时前提是
“H
0为真”);β是接受H0时犯错误的概率(这时“H0
为假”是前提),所以α+β不一
定等于1。结合图7—2分析如下:
图7-2 α与β的关系示意图
如果H0:μ1=μ0为真,关于 与μ0的差异就要在图7—2中左边的正态分
布中讨论。对于某一显著性水平α其临界点为 。(将两端各α/2放在同一端)。
右边表示H0的拒绝区,面积比率为α;左边表示H0的接受区,面积比率为
1-α。在“H0为真”的前提下随机得到的 落到拒绝区时我们拒绝H0是犯了错误
的。由于 落到拒绝区的概率为α,因此拒绝“H0为真”时所犯错误 (I型)的概
率等于α。而 落到H0的接受区时,由于前提仍是“H0为真”,因此接受H0是
正确决定, 落在接受区的概率为1-α,那么正确接受H0的概率就等于1-α。
如α=0.05则1-α=0.95,这0.05和0.95均为“H0为真”这一前提下的两个概率,
一个指犯错误的可能性,一个指正确决定的可能性,这二者之和当然为1。但讨
论β错误时前提就改变了,要在“H0为假”这一前提下讨论。对于H0是真是假我
们事先并不能确定,如果H0为假、等价于Hl为真,这时需要在图7—2中右边
的正态分布中讨论·(H1:μ1 >μ0),它与在“H0为真”的前提下所讨论的相似, 落
在临界点左边时要拒绝Hl (即接受H0),而前提Hl为真,因而犯了错误,这就是
II型错误,其概率为β。很显然,当α=0.05时,β不一定等于0.95。
(二)在其他条件不变的情况下,α与β不可能同时减小或增大。这一点从图
7—2也可以清楚看到。当临界点 向右移时,α减小,但此时β一定增大;反
之 向左移则α增大β减小。一般在差异检验中主要关心的是能否有充分理由
拒绝H0,从而证实Hl,所以在统计中规定得较严。至于β往往就不予重视了,
其实许多情况需要在规定的同时尽量减小β。这种场合最直接的方法是增大样本
容量。因为样本平均数分布的标准差为 ,当n增大时样本平均数分布将变
得陡峭,在α和其他条件不变时β会减小(见图7—3)。
(三)在图7—2中Hl为真时 的分布下讨论β错误已指出 落到临界点左
边时拒绝Hl 所犯错误的概率为β。那么 落在临界点右边时接受Hl则为正确
决定,其概率等于1一β。换言之,当 Hl为真,即μ1与μ0确实有差异时(图7—2
中,μ1与μ0的距离即表示μ1与μ0的真实差异),能以(1—β)的概率接受之。
图7-3 不同标准差影响β大小示意图
如图7—2所示,当α以及其他条件不变时,减小μ1与μ0的距离势必引起β
增大、(1一β)减小,也就是说,其他条件不变,μ1与μ0真实差异很小时,正确
接受Hl的概率变小了。或者说正确地检验出真实差异的把握度降低了。相反,
若其他条件不变μ1与μ0的真实差异变大时,(1—β)增大即接受Hl的把握度增大。
所以说1—β反映着正确辨认真实差异的能力。统计学中称(1—β)为统计检验力。
这是个比较重要的统计学概念。假如真实差异很小时,某个检验仍能以较大的把
握接受它,就说这个检验的统计检验力比较大。