当前位置:文档之家› 统计学中常见分布的应用

统计学中常见分布的应用

统计学中常见分布的应用
统计学中常见分布的应用

统计学第七章假设检验

第七章 假设检验 Ⅰ.学习目的 假设检验包括参数检验与非参数检验,是一种最能体现统计推断思想和特点的方法。通过本章学习,要求:1.掌握统计检验的基本原理,理解该检验的规则及犯两类错误的性质;2.熟练掌握总体均值、总体成数及总体方差指标的各种检验方法,包括:z 检验、t 检验和p 值检验;3.掌握2 检验、符号检验、秩和检验及游程检验四种基本的非参数检验方法。 Ⅱ.课程内容要点 第一节 假设检验的基本原理 一、假设检验的基本原理 “小概率原理”:小概率事件在一次试验中几乎是不会发生的。 事先所做的假设,是假设检验中关键的一项工作。它包括原假设和备选假设两部分。原假设是建立在假定原来总体参数没有发生变化的基础之上的。备选假设是原假设的对立,是在否认原假设之后所要接受的,通常这是我们真正感兴趣的一个判断。 二、假设检验的规则与两类错误 1、假设检验的规则 假设检验的步骤: (1)首先根据实际应用问题确定合适的原假设0H 和备选假设1H ; (2)确定检验统计量,通过数理统计分析确定该统计量的抽样分布;

(3)给定检验的显著性水平α。在原假设成立的条件下,结合备选假设的定义,由检验统计量的抽样分布情况求出相应的临界值,该临界值为原假设的接受域与拒绝域的分界值; (4)从样本资料计算检验的样本统计量,并将其与临界值进行比较,判断是否接受或拒绝原假设。 从检验程序我们可以看出,统计量的取值范围可以分为接受域和拒绝域两个区域。拒绝域正是统计量取值的小概率区域。按照我们将这个拒绝域安排在所检验统计量的抽样分布的某一侧还是两端,可以将检验分为单侧检验或双侧检验。双侧检验中,又可以根据拒绝域,是在左侧还是在右侧而分为左侧检验和右侧检验。对于这些双侧、左、右单侧检验,我们要结合备选假设来考虑。 在检验规则中,我们经常碰到两种重要的检验方法:z检验与t检验。 p值检验的原理:给出原假设后,在假定原假设正确的情况下,参照备选假设,可以计算出检验统计量超过或者小于(还要依照分布的不同、单侧检验、双侧检验的差异而定)由样本所计算的检验统计量的数值的概率,这便是p值;而后将此概率值跟事先给出的显著性水平值α进行比较。如果该值小于α,否定原假设,取对应的备选假设。如果该值大于α,我们不就能否定原假设。 2、两类错误 H实际为真,但我们却依据样本信息,做出拒绝的错误结论当原假设 时,称为“弃真”错误;当原假设实际为假,而我们却错误接受时,称为“纳伪”错误。通常记显著性水平α为犯“弃真”错误的可能性大小,β为犯“纳伪”错误的可能性大小。由于两类错误是一对矛盾,在其他条件不变得情况下,减少犯“弃真”错误的可能性大小(α),势必增大犯“纳伪”错误的可能性大小(β),也就是说,β的大小和显著性水平α的大小成相反方向变化。 三、检验功效 -可以用来表明所做假设检验工作好坏的一个指标,我们称之为检1β

第五章+统计学教案(假设检验)

第五章+统计学教案(假设检验)参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数 进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计 的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证, 从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者 则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概 念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数 的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 2 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验

3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 一、假设检验概述 假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设 所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统 计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个 假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其 为“实际不可能事件”。 二、假设检验的基本概念

统计学假设检验习题答案教学提纲

如有侵权请联系网站删除 1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。 解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧 检验)。采用t 分布的检验统计量n x t /0σμ-=。查出α=0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。667.116/60800820=-= t 。因为t <2.131<2.947,所以在两个水平下都接受原假设。 2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)? 解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。n=100可近似采用正态分布的检验统计量n x z /0σμ-=。查出α=0.01水平下的反查正态概率表得到临界值2.32到2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值3100 /5001000010150=-=z 。因为z=3>2.34(>2.32),所以拒绝原假设,无故障时间有显著增加。 3.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600?

统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系[1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质, 然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之. 1. 三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,) ,则称统计量2222 12n =+X X χ++…X 为 服从自由度为n 的2χ分布,记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ,2χ分布的密度函数图形是一个只取非负值 的偏态分布,如下图.

卡方分布具有如下基本性质: 性质1:22(()),(())2E n n D n n χχ==; 性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++; 性质3:2 n χ→∞→时,( n )正态分布; 性质4:设)(~2 2n αχχ,对给定的实数 ),10(<<αα称满足条件: αχχαχα==>? +∞ ) (222 )()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student”的笔名首次发表的,这个分布在数理统计中也占有重要的位置. 定义:设2 ~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量 T = 服从自由度为n 的t 分布,记为~()T t n . t 分布的密度函数为

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

统计学相关 假设检验习题

假设检验习题(12月18-19日交)班级_________ 学号_______ 姓名________ 得分_________ 一、选择题 1、假设检验的基本思想是() A、中心极限定理 B、小概率原理 C、大数定律 D、置信区间 2、如果一项假设规定的显著水平为0.05,下列表述正确的是() A、接受H0时的可靠性为95% B、接受H1时的可靠性为95% C、H0为假时被接受的概率为5% D、H1为真时被拒绝的概率为5% 3、某种药物的平均有效治疗期限按规定至少必须达到37小时,平均有效治疗期限的标准差已知为11小时。从这一批这种药物中抽取100件进行检验,以该简单随机样本为依据,确定应接收还是应拒收这批药物的假设形式为() A、H0:μ=37 H1:μ≠37 B、H0:μ≥37 H1:μ<37 C、H0:μ<37 H1:μ≥37 D、H0:μ>37 H1:μ≤37 4、在一次假设检验中,当显著水平设为0.05时,结论是拒绝原假设,现将显著水平设为 0.1,那么() A、仍然拒绝原假设 B、不一定拒绝原假设 C、需要重新进行假设检验 D、有可能拒绝原假设 5、下列场合适合于用t统计量的是() A、总体正态,大样本,方差未知 B、总体非正态,大样本,方差未知 C、总体正态,小样本,方差未知 D、总体非正态,小样本,方差未知 6、犯第Ⅰ类错误是指() A、否定不真实的原假设 B、不否定真实的原假设 C、否定真实的原假设 D、不否定不真实的原假设 7、在假设检验中,接受原假设时,() A.可能会犯第一类错误 B. 可能会犯第二类错误 C.同时犯两类错误 D.不会犯错误 8、进行假设时,在其他条件不变的情形下,增加样本量,检验结论犯两类错误的概率将() A.都减小 B. 都增加 C.都不变 D.一个增加一个减少 9、两个样本均值经过t检验判定有显著差别,P值越小,说明() A.两样本均值差别越大 B. 两总体均值差别越小 C.越有理由认为两样本均值有差别 D. 越有理由认为两总体均值有差别 -是指() 10、在假设检验中,1α A.拒绝了一个真实的原假设的概率 B.接受了一个真实的原假设概率 C. 拒绝了一个错误的原假设的概率 D. 接受了一个错误的原假设概率 -是指() 11、在假设检验中,1β A.拒绝了一个正确的原假设的概率 B.接受了一个正确的原假设的概率 C. 拒绝了一个错误的原假设的概率 D. 接受了一个错误的原假设的概率

统计学假设检验习题答案

1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。 解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧 检验)。采用t 分布的检验统计量n x t /0σμ-=。查出α=0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。667.116/60800820=-= t 。因为t <2.131<2.947,所以在两个水平下都接受原假设。 2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)? 解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。n=100可近似采用正态分布的检验统计量n x z /0σμ-=。查出α=0.01水平下的反查正态概率表得到临界值2.32到2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值3100 /5001000010150=-=z 。因为z=3>2.34(>2.32),所以拒绝原假设,无故障时间有显著增加。 3.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600? 解: 01:1600, :1600,H H μμ=≠标准差σ已知,拒绝域为2 Z z α>,

[汇总]统计学假设检验练习题

[汇总]统计学假设检验练习题 例3.7.9 从一大批相同型号的金属线中,随机选取10根,测得它的直径(单位:mm)为: 1.23 1.24 1.26 1.29 1.20 1.32 1.23 1.23 1.29 1.28 2(1)如果金属线直径X,N(μ,0.04),试求平均直径μ的置信度为95%的置信区间. 22(2)如果金属线直径X,N(μ, σ),σ未知,试求平均直径μ的置信度为95%的置信区间. 例3.7.10 随机取某牌香烟8支,其尼古丁平均含量为3.6mg,标准差为 0.9mg(试求此牌香烟尼古丁平均含量μ的95,的置信区间((假设尼古丁含量服从正态分布)( 4.某种袋装食品的重量服从正态分布.某一天随机地抽取9袋检验,重量(单位:g)为 510 485 505 505 490 495 520 515 490 22(1) 若已知总体方差σ=8.6,求μ的置信度为90%的置信区间; (2) 若已知总体方差未知,求μ的置信度为95%的置信区间. 5.为了估计在报纸上做一次广告的平均费用,抽出了20家报社作随机样本,样本的均值和标准差分别为575(元)和120(元),假定广告费用近似服从正态分布,求总体均值的95%的置信区间. 6.从某一班中随机抽取了16名女生进行调查.她们平均每个星期花费13元吃零食,样本标准差为3元,求此班所有女生每个星期平均花费在吃零食上的钱数的95%的置信区间.(假设总体服从正态分布)

7.一家轮胎工厂在检验轮胎质量时抽取了400条轮胎作试验,其检查结果这些轮胎的平均行驶里程是20000km,样本标准差为6000km.试求这家工厂的轮胎的平均行驶里程的置信区间,可靠度为95%. 8.为了检验一种杂交作物的两种新处理方案,在同一地区随机地选择8块地段.在各试验地段,按两种方案处理作物,这8块地段的单位面积产量是(单位:kg) 一号方案产量: 86 87 56 93 84 93 75 79 二号方案产量: 80 79 58 91 77 82 74 66 222假设两种产量都服从正态分布,分别为N(μ, σ) ,N(μ, σ), σ未知,求μ-μ的置信度1212为95%的置信区间. 9.为了比较两种型号步枪的枪口速度,随机地取甲型子弹10发,算得枪口子弹的平均值 =500(m/s), 标准差s=1.10(m/s); 随机地取乙型子弹20发,得枪口速度平均值=496(m/s),标1 准差s=1.20(m/s). 设两总体近似地服从正态分布,并且方差相等,求两总体均值之差的置信水2 平为95%的置信区间. 10.为了估计参加业务训练的效果.某公司抽了50名参加过训练的职工进行水平测验,结果是平均得分为4.5,样本方差为1.8;抽了60名未参加训练的职工进行水平测验,其平均得分为3.75,样本方差为2.1. 试求两个总体均值之差的95%的置信区间.(设两个总体均服从正态分布). 11、风驰汽车制造厂的装配车间安装车门仍需人工操作,不同工人的装配时间不同,同一工人的装配时间也有差异,为测定安装车门所需时间,每隔一定时间抽选一个样本,共抽取了10个样本,其数据如下(单位:秒):

人大版统计学 习题加答案第四章 假设检验

第四章 假设检验 填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章) 一、 填空 1、在做假设检验时容易犯的两类错误是 和 2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为 ,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为 3、假设检验有两类错误,分别是 也叫第一类错误,它是指原假设H0是 的,却由于样本缘故做出了 H0的错误;和 叫第二类错误,它是指原假设H0是 的, 却由于样本缘故做出 H0的错误。 4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为 。 5、 假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为 。 6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm ,标准差为1.6cm ,想知道这批零件的直径是否服从标准直径5cm ,在显著性水平α下,否定域为 7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为 。(用H 0,H 1表示) 8、一般在样本的容量被确定后,犯第一类错误的概率为α,犯第二类错误的概率为β,若减少α,则β 9、某厂家想要调查职工的工作效率,用方差衡量工作效率差异,工厂预计的工作效率为至少制作零件20个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0.05的要求下,问该工厂的职工的工作效率 (有,没有)达到该标准。 KEY: 1、弃真错误,纳伪错误 2、双边检验,单边检验 3、拒真错误,真实的,拒绝,取伪错误,不真实的,接受 4、显著性水平 5、小概率事件 6、1.25>2 1α-z 7、H 0:t≥1000 H 1:t <1000 8、增大 9、有

关于生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). 12 2--∑∑n n x x )(

三大抽样分布

三大抽样分布 众所周知,在概率论中有二项分布、正态分布、泊松分布着三大分布,而统计学中也有三大抽样分布,分别是x2 分布、t布和F分布。这三大抽样分布的发现正好是现代统计学的形成时期,对于以参数统计推断为主要内容的现代统计学理论的形成有着重要意义。X2分布的发现来源于Kad Pears0n创立X2拟合优度理论的过程,而t分布的发现来源于Gosset小样本理论的创立过程,F分布则是来源于Fisher创立方差分析理论的过程。 三大抽样分布的研究意义 c.R.Rao曾经说过“在终极的分析中,一切知识都是历史,在抽象的意义下,一切科学都是数学,在理性的基础上,所有的判断都是统计学。”这句话一语道破统计学的重要性。三大抽样分布在统计学理论中占据着重要地位,由此可见,研究三大抽样分布对于科学研究有着重要意义。在实际工作中,统计工作者对于三大抽样分布的研究必不可少,通过研究三大抽样分布的产生、发展和完善,能够充分了解三大抽样分布理论的重要性。具体到统计学三大分布,对于三大分布理论的研究,能够在充分吸收前人研究成果的基础上不断进行理论创新,从而推动科学技术的进步。纵观所有的科技进步,无一不是在充分研究前人成果的基础上发展而来的研究统计学三大抽样分布,对于我国社会经济发展有着重要的推动作用。三大抽样分布产生于19世纪末20世纪初,在统计学的发展过程中,每一次新的分析统计数据概率模型的发现,统计学理论都会发生一次重大飞跃。为此,要想研究三大抽样分布,就应该对其发展过程进行研究。统计量是样本的函数,是随机变量,有其概率分布,统计量的分布称为抽样分布。 X2分布 x2的早期发展 由于受到中心极限定理和正态误差理论的影响,正态分布一直在统计学中占据重要地位。在很多数学家和哲学家心目中,正态分布是唯一可用的分析和解释统计数据的方法。但是随着时代的发展,一些学者开始对正态性提出了质疑,随后,在多位科学家的试验验证下,正态分布与实际数据拟合不好的情况日渐凸显出来,科学家纷纷开始研究比正态分布范围更广的分布类型,波那个人产生了偏态分布,其中,x2就是最早的偏态分布最早引入偏态分布的是JamesClerk Maxwel,他在研究气体分子运动的过程中引入了X2分布。1891年,X2分布首次被作为统计量的分布导出。Pizzetti在求线性 模型最小二乘估计残差平方和的分布时,通过富氏分析法得出了X2的分布。随着时代的发展,正态分布理论的局限更加明显,更加推动了偏态分布的发展。KarlPearson是对偏态分布贡献最大的人,成为了一代统计学巨人。按照他的观点,统计学应该把在模型基础上对观测数据进行有效预测作为基本任务,所以他开创了一族曲线对观测数据进行拟合,使得分布拟台数据的应用范围进一步扩大。 X2模型

统计学假设检验习题答案

资料收集于网络,如有侵权 请联系网站删除只供学习与交流 1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。 解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧 检验)。采用t 分布的检验统计量n x t /0σμ-=。查出α=0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。667.116/60800820=-= t 。因为t <2.131<2.947,所以在两个水平下都接受原假设。 2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)? 解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。n=100可近似采用正态分布的检验统计量n x z /0σμ-=。查出α=0.01水平下的反查正态概率表得到临界值2.32到2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值3100 /5001000010150=-=z 。因为z=3>2.34(>2.32),所以拒绝原假设,无故障时间有显著增加。 3.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600?

(完整word版)统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍 2分布,t 分布,F 分布和正态分布的定义及基本性质, 然后 用理论说明2分布,t 分布,F 分布与正态分布的关系,并且利用数学软件 MATLAB 来验证之. 1.三大分布函数[2] 1.1 2分布 2(n )分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme )赫尔默特(Helmert )、皮尔逊分别于1858年、1876年、1900年所发 现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量X 1,X 2,…X n 相互独立,且都来自正态总体 N (0,,),则称 统计量 2 =x ; X ;…+X ;为服从自由度为n 的2分布,记为 2 2 ~ (n ). 2 分布的概率密度函数为 1 x e 2 x 0 J x 0 其中伽玛函数(X ) e t t x 1dt,x 0, 2 分布的密度函数图形是一个只取非负值 的偏态分布,如下图? x 2 n 2° f(x; n)

2(n2) ,X!,X2相互独立,则X! X2~ 2g n2); 性质3: n 时,2(n) 正态分布; 性质4:设2~ 2(n),对给定的实数 (0 1),称满足条件: P{ 2 2(n)} 2(、f(x)dx (n) 的点2(n)为2(n)分布的水平的上侧分位数. 简称为上侧分位数.对不同的与n,分位 数的值已经编制成表供查 分布,是由英国统计学家戈赛特在1908年“student的'笔名 布在数理统计中也占有重要的位置. 1), Y?2(n), X,Y相互独立,,则称统计量T —X VY/ n 分布,记为T~t( n). 为 性质1: E( 2(n)) n,D( 2(n)) 2n ; 性质2:若X! 2(nJ,X2

统计学常用分布及其分位数

§1、4 常用得分布及其分位数 1、 卡平方分布 卡平方分布、t 分布及F 分布都就是由正态分布所导出得分布,它们与正态分布一起,就是试验统计中常用得分布。 当X 1、X 2、… 、Xn 相互独立且都服从N(0,1)时,Z=∑i i X 2 得分布称为自由度等于n 得2χ分布,记作Z ~2χ(n),它得分布 密度 p(z )=??? ????>??? ??Γ--,,00,2212122其他z e x n z n n 式中得??? ??Γ2n =u d e u u n ?∞+--012,称为Gamma 函数,且()1Γ=1, ?? ? ??Γ21=π。2χ分布就是非对称分布,具有可加性,即当Y 与Z 相互独立,且Y ~2χ(n ),Z ~2χ(m ),则Y+Z ~2χ(n+m )。 证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、 X n+m 相互独立且都服从N(0,1),再根据2χ分布得定义以及上述随机变量得相互独立性,令 Y=X 21+X 22+…+X 2n ,Z=X 21+n +X 22+n +…+X 2m n +, Y+Z= X 21+X 22+…+X 2n + X 21+n +X 22+n +…+X 2m n +, 即可得到Y+Z ~2χ(n +m )。 2、 t 分布 若X 与Y 相互独立,且 X ~N(0,1),Y ~2χ(n ),则Z =n Y X 得分布称为自由度等于n 得t 分布,记作Z ~ t (n ),它得分布密度 P(z)=)()(221n n n ΓΓ+2121+-???? ??+n n z 。 请注意:t 分布得分布密度也就是偶函数,且当n>30时,t

统计学(五):几种常见的假设检验

定义 假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。 基本原理 (1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。 (2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。至于怎样才算是“小概率”呢?通常可将概率不超过0.05的事件称为“小概率事件”,也可视具体情形而取0.1或0.01等。在假设检验中常记这个概率为α,称为显著性水平。而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作H1。 假设的形式 H0——原假设,H1——备择假设 双侧检验:H0:μ = μ0, 单侧检验:,H1:μ < μ0 或,H1:μ > μ0假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。 假设检验的种类 下面介绍几种常见的假设检验 1.T检验 亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。 目的:比较样本均数所代表的未知总体均数μ和已知总体均数μ0。 计算公式:统计量: 自由度:v=n - 1 适用条件: (1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准误; (3) 样本来自正态或近似正态总体。 T检验的步骤 1、建立虚无假设H0:μ1= μ2,即先假定两个总体平均数之间没有显著差异; 2、计算统计量T值,对于不同类型的问题选用不同的统计量计算方法;

假设检验 练习题 统计学

第八章假设检验 练习题 一、填空 1、在做假设检验时容易犯的两类错误是和 2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为,若提出的 原假设是总体参数大于或小于某一数值,这种假设检验称为 3、假设检验有两类错误,分别是也叫第一类错误,它是指原假设H0 是的,却由于样本缘故做出了H0的错误;和叫第二类错误,它是指原假设H0是的, 却由于样本缘故做出H0的错误。 4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称 为。 5、假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生 的,该原理称为。 6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm,标准差为1.6cm, 在显着性水平α=下,这批零件的直径是否服从标准直径5cm (是,否) 7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时 间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为。(用H0,H1表示) 8、一般在样本的容量被确定后,犯第一类错误的概率为α,犯第二类错误的概 率为β,若减少α,则β 9、某厂家想要调查职工的工作效率,工厂预计的工作效率为至少制作零件20 个/小时,随机抽样36位职工进行调查,得到样本均值为19,样本标准差为6,试在显着水平为的要求下,问该工厂的职工的工作效率(有,没有)达到该标准。 10、刚到一批货物,质量检验员必须决定是否接受这批货物,如不符合要求,将 退还给货物供应商,假定合同规定的货物单件尺寸为6,请据此建立原假设_ _ 和备择假设。 σ已知,应采用统计量检验总体均值。 11、总体为正态总体,且2 σ未知,应采用统计量检验总体均值。 12、总体为正态总体,且2 二、选择 1、假设检验中,犯了原假设H0实际是不真实的,却由于样本的缘故而做出的接

统计学三大分布及正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质, 然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之. 1.三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,) ,则称统计量222 212n =+X X χ++…X 为服从自由度为n 的2χ分布, 记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ,2χ分布的密度函数图形是一个只取非负值的偏态分布,如下图.

卡方分布具有如下基本性质: 性质1:22(()),(())2E n n D n n χχ==; 性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++; 性质3:2 n χ→∞→时,( n )正态分布; 性质4:设)(~2 2n α χχ,对给定的实数),10(<<αα称满足条 件:αχχα χα ==>?+∞ ) (2 22)()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查 用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student ”的笔名 首次发表的,这个分布在数理统计中也占有重要的位置. 定义:设2 ~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量/T Y n = 服从自由度为n 的t 分布,记为~()T t n .

第5章 统计假设检验练习题及答案

实验报告——第5章统计假设检验 姓名杨秀娟班级人力10001学号 【实验1】 某外企对员工英语水平进行调查,开发部门总结该部门员工英语水平很高,如果按照英语六级考试标准考核,一般平均分为75分。现从开发部门雇员中随机选出11人参加考试,得分如下:80,81,72,60,78,65,56,79,77,87,76 ^ 请问该开发部门的英语水平是否真的很高(即高于75分,且差异显著) 【解】 (1)数据和变量说明 本题所用数据是:外企英语六级考试成绩样本 该文件为11个样本,1个变量,如变量视图 (2)操作方法 (3)结果报告

, 上图为单样本t检验表,第一行注明了用于比较的已知的总体均数为75,下面从左到右依次为t值(t)、自由度(df)、P值(Sig)、两均数的差值、差值的95%可信区间。 由上表可知,t= , P=, P>,接受Ho,与平均成绩75相等,无显著差异,因此,该开发部门的英语水平不是真的很高。 【实验2】 以下是对某产品促销团队进行培训前后的销售业绩数据,试分析该培训是否产生了显著效果。 表5-20 培训前后销售业绩数据 56789 序号123' 4 7488827185 培训前677074~ 97 7687867895 培训后786778{ 98 【解】 (1)数据和变量说明 本文件有2个变量,9个数据 (2)操作方法 *

(3)结果报告 由上表可知,P=, P<,不接受无效假设,有显著差异,所以该培训产生了显著效果。 【实验3】 饲养队制定了两种喂养方案喂猪,希望通过试验了解一下不同喂养方案的喂养效果。

方案一:用一只猪喂不同的饲料所测得的体内钙留存量数据如下: 表 5-21 方案一喂养数据 序号! 1 23456789 饲料1" 饲料2/ 方案二:甲队有11只猪喂饲料1,乙队有9只猪喂饲料2,所得的钙留存量数据如下: ; 表5-22方案二喂养数据 序号12345678· 9 1011甲队饲料1; 乙队饲料2\ 请选用恰当方法对上述两种方案所获得的数据进行分析,研究不同饲料是否使小猪体内钙留存量有显著不同。 【解】 方案一 (1)《 (2)数据和变量说明 答:9个数据,2个变量 (3)操作方法

统计学常用分布

二项分布(,)B n p n 为试验次数,p 为每次成功概率 {}x x n x n p X x C p q -== 其中1p q += (),()E X np Var X npq == ()()tX t n E e q pe =+其中t -¥<<¥ 解释:n 重贝努里实验中正好成功x 次的概率 几何分布()Geo p p 为成功概率 ()x P X x pq == 2(),()E X q p Var X q p == ()(1),ln tX t E e p qe t q =-<- 解释:n 重贝努里实验中首次成功正好在第x+1次 负二项分布(,),1NB k p k >,k 为成功次数,01p <<,p 为成功概率 1{}x k x k x P X x C p q +-== 2(),()E X kq p Var X kq p == ()(),ln 1tX k t p E e t q qe =<-- 解释:贝努里实验系列中第k 次成功正好出现在第x +k 次实验上地概率 泊松分布()P l {},0! x P X x e x l l l -==> (),()E X Var X l l == (1)()t tX e E e e l -=,t -¥<<¥ 解释:贝努里概型中的实验次数很大,但每次成功的概率很小,平均成功次数接近于常数

均匀分布(,)U a b 1 (),X f x a x b b a =<<-;(),X x a F x a x b b a -=<<- 2 ()(),()212a b b a E X Var X +-== 11 ()(1)()r r r b a E X r b a ++-=+- 正态分布2(,)N m s 2 1) 2()x X f x m s -- = 2(),()E X Var X m s == 22 1 2()t t tX E e e m s += 对数正态分布2log (,)N m s 2 1 ln () 2()x X f x m s --=2 221 22(),()(1)E X e Var X e e m m s s ++==- 22 1 2()t t t E X e m s += 解释:如果X~2log (,)N m s ,则logX ~2(,)N m s 指数分布()Exp l ()x X f x e l l -=,()1x X F x e l -=- 21 1 (),()E X Var X l l == (1) ()r r r E X l G += 1()(1,X t M t t l l -=-<

统计学考试试卷A及答案

2012—2013学年第二学期闽江学院考试试卷 考试课程:统计学 试卷类别:A卷□ √ B卷□考试形式:闭卷□√开卷□ 适用专业年级:2011级金融学、国际贸易学、保险学专业 注明:试卷答案请做在答题纸上。 一、单选题(每题1分,共30分,30%) 1. 下列不属于描述统计问题的是() A根据样本信息对总体进行的推断B了解数据分布的特征 C分析感兴趣的总体特征D利用图,表或其他数据汇总工具分析数据 2. 根据样本计算的用于推断总体特征的概括性度量值称作() A.参数 B. 总体C.样本 D. 统计量 3. 通过调查或观测而收集到的数据称为() A.观测数据 B. 实验数据 C.时间序列数据 D. 截面数据 4. 从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()。 A.重复抽样 B.不重复抽样 C.分层抽样 D.整群抽样 5. 调查时首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。这样的调查方式称为()。 A 系统抽样 B 整群抽样 C 滚雪球抽样 D 判断抽样6. 下面的哪一个图形最适合于描述结构性问题() A.条形图 B.饼图 C.雷达图 D. 直方图 7. 对于大批量的数据,最适合描述其分布的图形是( ) A.条形图 B.茎叶图 C.直方图 D.饼图 8. 将某企业职工的月收入依次分为2000元以下、2000元~3000元,3000元~4000元、4000元~5000元、5000元以上几个组。最后一组的组中值近似为( ) .7500 C 9. 下列关于众数的叙述,不正确的是() A.一组数据可能存在多个众数 B.众数主要适用于分类数据 C.一组数据的众数是唯一的 D.众数不熟极端值的影响 10. 一组数据的最大值与最小值之差称为() A.平均数 B.规范差 C.极差 D.四分位差 11.如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=3,其意义是() A.至少有75%的数据落在平均数加减3个规范差的范围之内 B. 至少有89%的数据落在平均数加减3个规范差的范围之内 C.至少有94%的数据落在平均数加减3个规范差的范围之内 D. 至少有99%的数据落在平均数加减3个规范差的范围之内 12. 下列不是次序统计量的是()。 A. 中位数 B. 均值 C. 四分位数 D. 极差 13. 根据中心极限定理可知,当样本容量无限大时,样本均值的抽样分布服从正态分布,其分布的方差为()。 A.B. C. D. 14. 大样本的样本比例之差的抽样分布服从() A.正态分布B.t分布C.F分布D.开方分布

相关主题
文本预览
相关文档 最新文档