北京化工大学数理统计---两类错误 势函数共30页
- 格式:ppt
- 大小:2.71 MB
- 文档页数:30
数理统计第四章习题答案1.为了对一元方差分析表作简化计算,对测定值玄作变换打其中b、c是常数,且bHO。
试用凡表示组内离差和组间离差,并用它们表示F的值。
解:母体子样子样平均X]] , X l2, •••, x州X2x X — X 八21,A 22,>八2旳•••• • •X 心.X":X"_ ]叫 1 %一儿=—工bg _ c) = _ 丫b% _ bc = b( Xj _ c) n i J-I n i J-I_ i ’①& r n' —y = -工Rg—c)= 一工力州-bc = b(X-c) n r-i j-1 ,l r-i ;-l— 1 - — 1 -X i =c + - V/ X =c + — y b H 0b • b */•__ _ y i _ i _S厂工竹(疋-X)~》q(c +沙-c-汀r-1 r-I DD令s;=i>庙-弼"S1-1令S£=l±(y厂亦"理J-!)2r 1 — 1 -电=b£n-r n一r—1 7T —F = — = ^ = F fS E右石S;2、有四个厂生产1.5伏的3号干电池。
现从每个工厂产品中各取一子样,测量苴寿命得到数值如下:问四个厂干电池寿命有无显著差异(Q = 5%) ?解:假设丹0 : M = “2 = “3 = “4H\:m“2血从不全为零r = 4 n x =5 n2 = 4 ® =5 n4 =6 n = 20 X = 24.52经il査表得九os (3,16) = 3.24I 如"4745<耘(3,⑹故接受即可认为四个干电池寿命无显箸差异。
3、抽查某地区三所小学五年级男学生的身髙,得数拯如下:试问该地区三所小学五年级男学生的平均身高是否有显著差异(a = 5%)? 解:假设H°:“=“2=“3H\ :丛“2 “3不全相等r = 3 n A=n2=n3=6 X = 140.9278仏(2」5) = 3・68F = 4.373 >3.68 = ^(2,15)二拒绝H()故可认为该地区三所小学五年级男生平均身髙有显著差异。
02197--概率论与数理统计(二)[单项选择题]1.设分别为随机变量的分布函数,为使是某一随机变量的分布函数,在下列给定的各组值中应取(A、)。
2.设是随机变量,其分布函数分别为,为使是某一随机变量的分布函数,在下列给定的各组数值中应取(C、)3.设随机变量的概率分布为且满足,则的相关系数为(A、0)4.设A、B、C为三个事件,P(AB)>0且P(C|AB)=1,则有(C、P(C)≥P (A)+P(B)-1)5.设x?,x?,··· ···,x?为正态总体N(μ,4)的一个样本,表示样本均值,则μ的置信度为1-α的置信区间为(D、)6.设总体X服从正态分布N(μ,σ2),X?,X?,··· ···,X n是来自X 的样本,则σ2的最大似然估计为( A、 )7.设是未知参数的一个估计量,若,则是的( D.有偏估计 )8.在对单个正态总体均值的假设检验中,当总体方差已知时,选用( B、u检验法)9.若X~t(n)那么χ2~(A、F(1,n))10.对于事件A,B,下列命题正确的是(D、)11.设X~N(μ,σ2),那么当σ增大时,P{|X-μ|<σ}=(C、不变)12.已知随机变量X的密度函数f(x)=(λ>0,A为常数),则概率P{λ<X<λ+a}(a>0)的值(C、与λ无关,随a的增大而增大)13.设随机事件A与B互不相容,且P(A)>0,P(B)>0,则 (D、)。
14.设 X1, X2为来自总体N(μ, 1) 的一个简单随机样本, 则下列估计量中μ的无偏估计量中最有效的是 ( A、设随机变量X的概率密度为f(x),则f(x)一定满足【C、】16.设随机变量X与Y的方差分别是25和16,协方差为8,则相关系数ρXY=【C、】17.已知随机变量与相互独立,且它们在区间[-1,3]和[2,4]上服从均匀分布,则【A、3】18.若X,Y相互独立,则下列正确的是【C、】设X~N(0,1), Y~N(μ,σ2), 则Y与X之间的关系是【A、】设A, B为随机事件, A错误!未找到引用源.B,(B、)A,B,C是任意事件,在下列各式中,不成立的是(B、(A∪B)-A=B)设随机变量且相互独立,根据切比雪夫不等式有(D、≥5/12)设A,B,C为三个事件,且A,B相互独立,则以下结论中不正确的是(D、)设离散型随机变量X和Y的联合概率分布为,若X,Y独立,则α,β的值为(A、)设总体X的数学期望为μ,X?,X?,··· ···,X n为来自X的样本,则下列结论中正确的是(A、X?是μ的无偏估计量)已知是来自总体的样本,则下列是统计量的是(B、)设X,Y是相互独立的两个随机变量,它们的分布函数分别为F x(x),F y(y),则Z = max {X,Y} 的分布函数是(C、)对于任意两个随机变量X和Y,若E(XY)=E(X)-E(Y),则(B、D(X+Y)=D(X)+D(Y) ) 设A,B为任二事件,则(D、)设Φ(x)是标准正态分布函数,则Φ(0)= 【B、】设随机变量X与Y相互独立,且P{X≤1}=1/4,P{Y≤1}=1/3,则P{X≤1,Y≤1}=【C、】设随机事件A与B互不相容,且, ,则【D、】设A和B相互独立,,,则【B、】袋中有5个白球和3个黑球,从中任取两个,则取到的两个球是白球的概率是【A、】下列关于“统计量”的描述中,不正确的是【C、统计量表达式中不含有参数】设A,B为随机事件,则下列说法正确的是【B、】设随机变量X的取值范围是[-1,1],以下函数可以作为X的概率密度的是【C、】已知随机变量X的分布函数为C、7/12设随机变量X服从参数为的指数分布,则下列各项中正确的是(D、)设二维随机变量(X, Y)的概率密度为,则常数c=(A、)将一枚硬币重复郑n次,以X和Y分别表示正面向上和反面向上的次数,则X 与Y的相关系数等于(A、-1)是来自总体X~N(0,1)的一部分样本,设:,则Z/Y~(D、F(8,8))X?,X?独立,且分布率为(i=1,2),那么下列结论正确的是(C、P{X?=X?}=1/2)下列二无函数中,( B、) 可以作为连续型随机变量的联合概率密度。
数理统计大作业(二)全国各省发展程度的聚类分析及判别分析指导教师院系名称材料科学与工程院学号学生姓名2015 年 12 月21 日目录全国各省发展程度的聚类分析及判别分析 (1)摘要: (1)引言 (1)1实验方案 (2)1.1数据统计 (2)1.2聚类分析 (3)1.3判别分析 (4)2结果分析与讨论 (5)2.1聚类分析结果 (5)2.2聚类分析结果分析: (8)2.3判别分析结果 (9)2.4 Fisher判别结果分析: (11)参考文献: (16)全国各省发展程度的聚类分析及判别分析摘要:利用SPSS软件对全国31个省、直辖市、自治区(浙江、安徽、甘肃除外)的主要经济指标进行多种聚类分析,分析选择最佳聚类类数,并对浙江、湖南、甘肃进行类型判别分析。
通过这两个方法对全国各省进行发展分类。
本文选取了7项社会发展指标作为决定发展程度的影响因素,其中经济因素为主要因素,同时评估城镇化率和人口素质因素。
各项数据均来自2014年国家统计年鉴。
分析结果表明:北京市和上海市和天津市为同一类;江苏省和山东省和广东省为同一类型;河北、湖北、河南、湖南、四川、辽宁为同一类;其余的为另一类。
关键词:聚类分析、判别分析、发展引言聚类分析是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称。
它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。
系统聚类分析又称集群分析,是聚类分析中应用最广的一种方法,它根据样本的多指标(变量)、多个观察数据,定量地确定样品、指标之间存在的相似性或亲疏关系,并据此连结这些样品或指标,归成大小类群,构成分类树状图或冰柱图。
判别分析是根据多种因素(指标)对事物的影响来实现对事物的分类,从而对事物进行判别分类的统计方法。
判别分析适用于已经掌握了历史上分类的每一个类别的若干样品,希望根据这些历史的经验(样品),总结出分类的规律性(判别函数)来指导未来的分类。
第一章数据的描述和整理一、学习目的和要求1. 掌握数据的类型及特性;2.掌握定性和定量数据的整理步骤、显示方法;3.掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量;4.能理解并熟练掌握样本均值、样本方差的计算;5.了解统计图形和统计表的表示及意义;6. 了解用Excel软件进行统计作图、频数分布表与直方图生成、统计量的计算。
二、内容提要(一)数据的分类(二)常用统计量1、描述集中趋势的统计量2、描述离散程度的统计量3、描述分布形状的统计量* 在分组数据公式中,m i , f i 分别为各组的组中值和观察值出现的频数。
三、综合例题解析例1.证明:各数据观察值与其均值之差的平方和(称为离差平方和)最小,即对任意常数C ,有2211()()n ni ii i x x x C ==-≤-∑∑ 证一:设 21()()ni i f C x C ==-∑由函数极值的求法,对上式求导数,得11()2()22, ()2 n ni i i i f C x C x nC f C n =='''=--=-+=∑∑令 f '(C )=0,得唯一驻点11= ni i C x x n ==∑由于()20f x n ''=>,故当C x =时f (C )y 有最小值,其最小值为21()()ni i f x x x ==-∑。
证二:因为对任意常数C 有22222211111222212()()(2)2(2)()0nn n n nii iii i i i i i ni i xx x C x nx x C x nC nx C x nC n x Cx C n x C ======---=---+=-+-=--+=--≤∑∑∑∑∑∑故有2211()()nni ii i x x x C ==-≤-∑∑。
四、习题一解答1.在某药合成过程中,测得的转化率(%)如下:94.3 92.8 92.7 92.6 93.3 92.9 91.8 92.4 93.4 92.6 92.2 93.0 92.9 92.2 92.4 92.2 92.8 92.4 93.9 92.0 93.5 93.6 93.0 93.0 93.4 94.2 92.8 93.2 92.2 91.8 92.5 93.6 93.9 92.4 91.8 93.8 93.6 92.1 92.0 90.8 (1)取组距为0.5,最低组下限为90.5,试作出频数分布表; (2)作频数直方图和频率折线图;(3)根据频数分布表的分组数据,计算样本均值和样本标准差。
中国石油大学(北京)远程教育学院期末考试《化工系统工程》学习中心:_石家庄_姓名:_郭永亮学号: 955171 _关于课程考试违规作弊的说明1、提交文件中涉嫌抄袭内容(包括抄袭网上、书籍、报刊杂志及其他已有论文),带有明显外校标记,不符合学院要求或学生本人情况,或存在查明出处的内容或其他可疑字样者,判为抄袭,成绩为“0”。
2、两人或两人以上答题内容或用语有50%以上相同者判为雷同,成绩为“0”。
3、所提交试卷或材料没有对老师题目进行作答或提交内容与该课程要求完全不相干者,认定为“白卷”或“错卷”,成绩为“0”。
一、填空题(每空2分,共30分)1.在一个绝热封闭体系中,投入了9种已知质量的化合物,这些物质在其中发生了4个化学反应,产生了3种新化合物。
当系统稳定下来后,生成了2个液相层、1个气相,要确定系统的状态需要(2)个变量?2.一股已知条件的工艺物流(组分数为20),进入带进料阀和换热盘管的气液分离器进行气液分离,有哪些手段能够影响分离器的操作效果(调节阀开度),(调整换热判盘管温度)。
3.某设计院进行一个常规精馏塔的设计,设计师需要考虑的设计变量有(2)个。
4.过程系统节点相邻矩阵中流股汇集单元的特征是:(列有多个非零元素)。
5.某节点相邻矩阵A经过运算得到A⨯A、A⨯A⨯A两个新的矩阵,将A、A⨯A、A⨯A⨯A三个矩阵布尔相加后得到可及矩阵A*,其中元素值a25=a52=1、a27=a72=1、a57=1、a75=1,则说明:(节点3与5组成一个简单回路、节点3与7组成一个简单回路,且这两个回路构成复合回路)。
6.采用序贯模块模拟法进行流程计算时,最佳断裂流股要保证相关子系统中所有回路(被切断)。
7.由描述过程系统结构的原始索引矩阵I运用乘幂法则通过比较与替代获得了新的矩阵J=I2,其中,出现了4个相同的节点对{3-3}、{5-5}、{8-8}、{9-9},则说明:(这4个节点构成两个简单回路,但目前的信息还无法判断具体组合信息)。
第4页倒数第9行 将“……是基本事件的概率的可能性”改为“….是基本事件的概率的等可能性”第7页的第6行和第8行的公式中的“A μ”和“A μ”及“S μ”分别改为“()A μ”和“()A μ”及“()S μ”。
第10页中倒数第11行中“(3!12!)(4!4!4!4!)⨯”改为“(3!12!)(4!4!4!)⨯”第13页倒数第3行“贝叶斯公式可得”改为“由贝叶斯公式可得” 第14页第11行“概率均为…”改为“概率为…”,将例1-14中附图的数字改标为如下图的形式第15页中例1-16和第16页中例1-17中的“A μ”和“S μ”分别改为“()A μ”和“()S μ” 第16页中倒数第10行和第13行中的“()P AB ”均改为“()P AB ”第16页中最后一行中将“…生日同在各个月份…”改为“…生日在各个月份…” 第19页中第17行中的“()()()()A B A B A B A B ++++”改为 “()()()()A B A B A B A B ”第19页中倒数第9行中将“()()A B AB Ω- ”改为“()()A B S AB - ” 第20页中倒数第10行中的“(B )()AC B ”改为“(B )()AC B ” 第20页中倒数第9行中的“则()( )P AB =”改为“则()( )P AB =” 第21页第6行中将“()()P AB P AB =”改为“()()P AB P AB =” 第25页第15行中将“{}()(1),0,1,2,,kkn kk k n kn n n P k P X k C p p C p q k n --===-== ”改为“{}()(1),0,1,2,,kkn kn n P k P X k C p p k n -===-= ”第25页第19行中将“lim (),0,1,2,,!kn n P k e k n k λλ-→∞== ”改为lim ()lim (1),0,1,2,!kkk n kn n nn n n P k C p p e k k λλ--→∞→∞=-==第28页倒数第3行中将“0, 0(), 011, 1x Y g X x x x ≤⎧⎪==<≤⎨⎪>⎩”改为“0, 0(), 011, 1x y g x x x x ≤⎧⎪==<≤⎨⎪>⎩”第34页中倒数第10行中将“…第一路线较短…”改为“…第一条路线较短…”第36页第12行中将“…应选择第二条路线.”改为“…应选择第一条路线.” 第37页第9行中将“{}(1), 1,2,k P Y k p p k ==-= ”改为 “{}(1), 0,1,2,k P Y k p p k ==-= ”第40页中倒数第5行中公式中的“⨯”号改为“⋅”号第45页第8行中将“…独立性及不相关性的概念,了解这两个概念间的联系与区别,”改为“…独立性的概念,”第63页第14行中将“2231(60060), 010,150001()(20), 1020,150000, .Z z z z z f z z z ⎧-+≤<⎪⎪⎪=-≤<⎨⎪⎪⎪⎩其它”改为 “2331(60060), 010,150001()(20), 1020,150000, .Z z z z z f z z z ⎧-+≤<⎪⎪⎪=-≤<⎨⎪⎪⎪⎩其它” 第63页中倒数第4行将“}222)|y x y a +≤,如图3-7所示. 显然有(,)(,)GSf x y dxdy f x y dxdy ≤⎰⎰⎰⎰”改为“}222)|2y x y a +≤,如右图3-7.因为(,)0,,,f x y x y >-∞<<+∞显然有(,)(,)GSf x y dxdy f x y dxdy <⎰⎰⎰⎰,” 第64页第5行中将“22221x aa aedx e ---⎛⎫=-⎪⎪⎭⎰”改为“22221x aa aedx e ---⎛⎫<-⎪⎪⎭”第64页第722x aaedx --=⎰22x aaedx --<⎰第64页倒数第2行中将“220, 01,02()(,)30, X xy x dy x y f x f x y dy +∞-∞⎧⎛⎫+<<<<⎪ ⎪==⎝⎭⎨⎪⎩⎰⎰其它.” 改为“220, 01,()(,)30, X xy x dy x f x f x y dy +∞-∞⎧⎛⎫+<<⎪ ⎪==⎝⎭⎨⎪⎩⎰⎰其它.” 第67页第9行中将“…222cos 2222sin 12x y r x r Z y r ed erdr θπσσθθπσ+=--=⋅=⎰⎰”改为“…22cos 222sin12r x r zy r d erdr θπσθθπσ=-=⋅=⎰⎰”第67页第10行中将“22222220()12z r zr red e σσ--=--=-+⎰”改为“222222220()12r z zred e σσσ--=--=-+⎰”第67页第12行中将“2222'222()(1)z z Z z f z ee r σσ--=-+=”改为“2222222()(1)z z Z z f z ee σσσ--'=-+=”第67页第14行中将“2222, 0,()0, z Z z e z f z r σ-⎧⎪≥=⎨⎪⎩其他.”改为“2222, 0,()0, z Z z e z f z σσ-⎧⎪≥=⎨⎪⎩其他.”第69页倒数第4行中将“()f S ”改为“()f s ”第71页将第5行中“…关判断X 和Y 是…”改为“…并判断X 和Y 是…”第76页将第9行中“[(())][(())] (,1,2,,)ij i i j j E X E X X E X i j n σ=--= ”改为 “[(())(())] (,1,2,,)ij i i j j E X E X X E X i j n σ=--= ” 第83页将第14行中“1,X Y X Y μμσσ--==”改为“11,X Y X Y μμσσ--==”第88页倒数第5行中将“2()i i D X σ=i α(1,i =”改为“2()i i D X σ=,i α(1,i =”第89页第2行中将“22111()n n nn i i i i i i i i i D X D X ααασ===⎡⎤==⎢⎥⎣⎦∑∑∑”改为“222111()n n ni i i i i i i i i D X D X ααασ===⎡⎤==⎢⎥⎣⎦∑∑∑”第89页第4行中将“2121(,,,)nn n i i i f αααασ==∑ ”改为“22121(,,,)nn i ii f αααασ==∑ ”第89页第10行中将“2111ni iλσ==-∑”改为“2112ni iλσ==-∑”第90页第15行中将“{}11nkk n P X k ===∑∑”改为“{}11kk n P X k ∞===∑∑”第91页第5行中将“1()()1f x dx f x dx ∞-∞==⎰⎰”改为“120()()132a bf x dx ax bx c dx c ∞-∞=++=++=⎰⎰” 第92页倒数第5行中将“111{2,1}0{2}{1}428P X Y P X P =-==≠=-==⨯=”改为 “111{2,1}0{2}{1}428P X Y P X P Y =-==≠=-==⨯=” 第94页第21行中将“有奖购物问题”改为“有奖购物的应对策略”第98页第8行中将“22lim ()lim n t i x n n n X n F x P x e dt μ--∞→∞→∞⎧⎫-⎪⎪⎪=≤=⎬⎪⎪⎪⎩⎭∑⎰”改为“22lim ()lim n t i xn n n X n F x P x e dt μ--∞→∞→∞⎧⎫-⎪⎪⎪=≤=⎬⎪⎪⎪⎩⎭∑”第104页第5行中将“P X⎧=>⎨⎩”改为“P => ”第106页倒数第16行中将“计算同时用电户…”改为“同时用电户…” 第116页第1行中将“211~(0,),n n n X X N n σ++-”改为“211~(0,),n n n X X N nσ++-” 第128页倒数第9行中将“(1,)X B p -”改为“~(1,)X B p ” 第129页例7-5中将所有的“2u α”全部都改为“2z α”第133页第12行中将“12(1)(,,....,),n n x x x αα=+⋅ ”改为“12(1)(....),n n x x x αα=+⋅ ”第133页中第13行中将“1ln(,,)n x x α+ ”改为“1ln()n x x α+ ”第133页倒数第3行中将“1ˆmax{}i i nx θ≤≤=”改为“1ˆmin{}ii nx θ≤≤=” 第134页倒数第7,8,9,10行中的“1E θ∧,2E θ∧,3E θ∧,4E θ∧”分别改为“1ˆE θ,2ˆE θ,3ˆE θ,4ˆE θ” 第135页第7行中将“E θ∧,D θ∧”分别改为“ˆE θ,ˆD θ” 第135页第15行中将“⨯”号改为点乘号“⋅”第135页倒数第8行中将“12Y aX bX =+”改为“12Y aX bX =+”第135页倒数第6行中将“1EX μ=, 2EX μ=”改为“1EX μ=, μ=2X E ” 第135页倒数第4行中将“12Y aX bX =+”改为“21X b X a Y +=”第149页中将第6,7行中每个数字后的“次/min ”全部去掉第159页倒数第9行中将“此时拒绝域为”改为“此时接受域为”第163页第6行中将“问是否可以推论安装…”改为“问是否可以推断安装…” 第164页第11行中将“…有小一部分…”改为“…有一小部分…” 第178页倒数第4行中将“11n ≥”改为“171n ≥” 第179页第5行中将“(1)(D )”改为“(1)(B )” 第182页第10行中将“(5)1”改为“(5)12” 第184页倒数第10行中将“2ˆln X μ=矩”改为“2ˆln X μ=矩”。
(完整)概率论与数理统计(经管类)综合试题1-5_(课程代码_4183) 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((完整)概率论与数理统计(经管类)综合试题1-5_(课程代码_4183))的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(完整)概率论与数理统计(经管类)综合试题1-5_(课程代码_4183)的全部内容。
Ⅱ、综合测试题概率论与数理统计(经管类)综合试题一(课程代码 4183)一、单项选择题(本大题共10小题,每小题2分,共20分)在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。
错选、多选或未选均无分。
1.下列选项正确的是 ( B ).A 。
AB A B +=+ B.()A B B A B +-=-C 。
(A-B )+B =A D. AB AB =2。
设()0,()0P A P B >>,则下列各式中正确的是 ( D )。
A 。
P (A -B )=P (A )-P (B ) B.P (AB )=P (A )P (B )C. P (A +B )=P (A )+P (B )D. P (A +B )=P (A )+P (B )-P (AB )3。
同时抛掷3枚硬币,则至多有1枚硬币正面向上的概率是 ( D )。
A. 18B. 16C. 14D. 124.一套五卷选集随机地放到书架上,则从左到右或从右到左卷号恰为1,2,3,4,5顺序的概率为 ( B )。
A.1120 B. 160 C. 15 D. 125。
设随机事件A ,B 满足B A ⊂,则下列选项正确的是 ( A )。
习题三1 正常情况下,某炼铁炉的铁水含碳量2(4.55,0.108)X N .现在测试了5炉铁水,其含碳量分别为4.28,4.40,4.42,4.35,4.37. 如果方差没有改变,问总体的均值有无显著变化?如果总体均值没有改变,问总体方差是否有显著变化(0.05α=)?解 由题意知 2~(4.55,0.108),5,0.05X N n α==,1/20.975 1.96u u α-==,设立统计原假设 0010:,:H H μμμμ=≠ 拒绝域为{}00K x c μ=->,临界值1/21.960.108/0.0947c u α-==⋅=,由于 0 4.364 4.550.186x c μ-=-=>,所以拒绝0H ,总体的均值有显著性变化.设立统计原假设 22220010:,:H H σσσσ=≠ 由于0μμ=,所以当0.05α=时22220.0250.97511()0.03694,(5)0.83,(5)12.83,ni i S X n μχχ==-===∑ 2210.02520.975(5)/50.166,(5)/5 2.567c c χχ====拒绝域为 {}222200201//K sc s c σσ=>< 或 由于22/ 3.167 2.567S σ=> ,所以拒绝0H ,总体的方差有显著性变化. 2 一种电子元件,要求其寿命不得低于1000h .现抽测25件,得其均值为x =950h .已知该种元件寿命2(100,)X N σ ,问这批元件是否合格(0.05α=)?解 由题意知 2(100,)X N σ ,设立统计原假设0010:,:,100.0.05.H H μμμμσα≥<==拒绝域为 {}00K x c μ=-> 临界值为0.050.0532.9c u u =⋅=⋅=-由于 050x c μ-=-<,所以拒绝0H ,元件不合格.3 某食品厂用自动装罐机装罐头食品,每罐标准重量为500g ,现从某天生产的罐头中随机抽测9罐,其重量分别为510,505,498,503,492,502,497,506,495(g ),假定罐头重量服从正态分布. 问 (1)机器工作是否正常(0.05α=)? 2)能否认为这批罐头重量的方差为5.52(0.05α=)?解 (1)设X 表示罐头的重量(单位:g). 由题意知2(,)X N μσ ,μ已知 设立统计原假设 0010:500,:H H μμμμ==≠,拒绝域 {}00K x c μ=-> 当0.05α=时,2500.89,34.5, 5.8737x s s ===临界值 12(1) 4.5149c t n α-=-⋅=,由于00.8889x c μ-=<,所以接受0H ,机器工作正常.(2)设X 表示罐头的重量(单位:g). 由题意知2(,)X N μσ ,σ已知设立统计原假设 222220010: 5.5,:H H σσσσ==≠ 拒绝域为 {}{}222200102K s c s c σσ=<> 当α=0.05时,可得2220.0250.97512500.89,34.5,(5) 2.7,(5)19.02,0.3, 2.11x s c c χχ======由于22001.0138sK σ=∈ ,所以接受0H ,可以认为方差为25.5.4 某部门对当前市场的鸡蛋价格情况进行调查,抽查某市20个集市上鸡蛋的平均售价为3.399(元/500克),标准差为0.269(元/500克).已知往年的平均售价一直稳定在 3.25(元/500克)左右, 问该市当前的鸡蛋售价是否明显高于往年?(0.05α=)解 设X 表示市场鸡蛋的价格(单位:元/克),由题意知2(,)X N μσ 设立统计原假设 0010: 3.25,:H H μμμμ==>, 拒绝域为 {}00K x c μ=->当α=0.05时,13.399,0.269,20,0.0992x n c ασμ-====⋅=临界值由于0 3.399 3.250.149.x c μ-=-=>所以拒绝0H ,当前的鸡蛋售价明显高于往年.5 已知某厂生产的维尼纶纤度2(,0.048)X N μ ,某日抽测8根纤维,其纤度分别为1.32,1.41,1.55,1.36,1.40,1.50,1.44,1.39,问这天生产的维尼纶纤度的方差2σ是否明显变大了(0.05α=)?解 由题意知 2(,0.048)X N μ ,0.05α=设立统计原假设 2222220010:0.048,:0.048H H σσσσ==>=拒绝域为{}2200K s c σ=>, 当0.05α=时,2220.950.951.4213,0.0055,(7)14.07,(7)7 2.0096x s c χχ=====由于220 2.3988s c σ=>,所以拒绝0H ,认为强度的方差明显变大.6 某种电子元件,要求平均寿命不得低于2000h ,标准差不得超过130h .现从一批该种元件中抽取25只,测得寿命均值1950h ,标准差148h s =.设元件寿命服从正态分布,试在显著水平 α=0.05下, 确定这批元件是否合格.解 设X 表示电子元件的平均寿命(单位:h ),由题意知2(,)X N μσ 设立统计原假设 0010:=2000H <H μμμμ≥,: 拒绝域为 {}00K x c μ=-<当0.05α=时,1950,148,(1)50.64x s c t n α===-=-临界值由于 050x c μ-=->,所以接受0H ,即这批电子元件的寿命是合格的. 7 设n X X X ,...,,21为来自总体(,4)X N μ 的样本,已知对统计假01:1;: 2.5H H μμ== 的拒绝域为0K {}2>=X .1)当9=n 时,求犯两类错的概率α与β;2)证明:当n →∞时,α→0,β→0.解 (1)由题意知 {}010~(,4),:1;: 2.5,2,9.X N H H K X n μμμ===>= 犯第一类错误的概率为()21 1.51(1.5)0.0668.X P X P αμ⎫=>==>==-Φ=⎪⎭犯第二类错误的概率为()2 2.50.75(0.75)1(0.75)0.2266.X P X P βμ⎫=≤==≤=-⎪⎭=Φ-=-Φ=(2)若0:1H μ=成立,则(1,4)X N}{}{00000()=11)n P H H P X c P X c nc αμμσ=≥+=-<+=-Φ否定成立 当n →∞时,0)1ncσΦ→,所以0()n n α→→∞同理 }{0010=<+=+c )/)()=0()n P X c n βμμμσΦ-→Φ-∞→∞ 8 设需要对某一正态总体,4()N μ的均值进行假设检验H 0:μ= 15,H 1:μ< 15 取检验水平α=0.05,试写出检验H 0的统计量和拒绝域.若要求当H 1中的μ=13时犯第二类错误的概率不超过β=0.05,估计所需的样本容量n .解 由题意知 (,4)X N μ ,σ已知, 设立统计原假设 01:15,:15H H μμ=< 则拒绝域为}{015K X c =-<,其中临界值0.05c μ=⋅=-犯第二类错误的概率1513130.05P X P Xβ⎛⎫⎛⎫=->==->≤⎪⎭⎝⎝即1.65)0.95Φ≥, 化简得23.311n≥≈.9 设nXXX,...,,21为来自总体X~2(,)Nμσ的样本,2σ为已知, 对假设:0011:;:H Hμμμμ==其中01μμ≠,试证明:22011212()()nαβσμμμμ--=+⋅-解(1)10>μμ当时,由题意知00110:;:;H Hμμμμμ==>犯第一,二类错误分别为,αβ,则有001(|)P X c c uααμμμ-=>+=⇒=011100(|))XP X c P uαβμμμμμ-=≤+==≤=⇒()()220 11111120010 u u u u n u u ββααβαβσμμμ------=-=+==+-(2)10μμ≤当时由题意知00110:,:H Hμμμμμ==≤,犯第一,二类错误分别为,αβ,则有00(|)P X c c uααμμμ=<+=⇒=()()01100220 1111120010 (|))XP X c P uu u u u n u uαβααβαββμμμμμσμμ-----=≥+==≥+=⇒=++==+-10设171,...,XX为总体2(0,)X Nσ样本,对假设:2201:9,: 2.905H Hσσ==的拒绝域为}{24.93K s=<. 求犯第Ⅰ类错误的概率α和犯第Ⅱ类错的概率β.解由题意知2(0,)X Nσ,222~().nsnχσ统计假设为2201:9,: 2.905H Hσσ==. 拒绝域为}{24.93K s=<则犯第一,二类错误的概率,αβ分别是()()22222221717417174497.3040.0259999171744 3.319120.48810.750.253.319 3.319s s P s P P s P s P ασβσ⎛⎫⎛⎫⨯⨯=<==<=<== ⎪ ⎪⎝⎭⎝⎭⎛⎫⨯=<==-<==-= ⎪⎝⎭11 设总体是密度函数是1,01(;)0,x x f x θθθ-<<=⎧⎨⎩其他 统计假设 01:1,:2H H θθ==.现从总体中抽取样本21,X X ,拒绝域2134ΚX X =≤⎧⎫⎨⎬⎩⎭,求:两类错误的概率,αβ解 由题意知010213:1;:2,, 2.4H H K X n X θθ⎧⎫===≤=⎨⎬⎩⎭当12121,0,11(;1) 1.~(0,1),(,)0,x x f x X U f x x θ<<⎧===⎨⎩时,其他此时 212121231431(,)0.250.75ln 0.75.4x x P X f x x dx dx X αθ≤⎛⎫=≤===+⎪⎝⎭⎰⎰当1212122,014,0,12(;2).(,)0,0,x x x x x x f x f x x θ<<<<⎧⎧===⎨⎨⎩⎩时,其他其他 此时 21212123143992(,)ln 0.75.4168x x P X f x x dx dx X βθ>⎛⎫=>===+⎪⎝⎭⎰⎰12 设总体2(,)X N μσ ,根据假设检验的基本原理,对统计假设:00110:,:()()H H μμμμμσ==>已知;0010:,:H H μμμμσ≥<(未知),试分析其拒绝域.解 由题意知 2(,)X N μσ ,当00110:,:()H H μμμμμ==>成立时()01X P X c P αμμμ=->==>=-Φ{}1100,u c u K X c ααμ--===->所以拒绝域为 }{00K X c μ=->当0010:,:H H μμμμ≥<成立时00()()X P X c P X c P αμμμμ⎛⎛⎫⎫=-<≥≥-<=<=Φ}{00,c K X c ααμμμ===-<所以拒绝域为}{00K X c μ=-<13 设总体2(,)X N μσ 根据假设检验的基本原理,对统计假设: (1)22220010:,:()H H σσσσμ=>已知;(2)22220010:,:()H H σσσσμ≤>未知试分析其拒绝域.解 由题意知 2~(,)X N μσ(1)假设统计假设为 22220010:=,:>H H σσσσ 其中μ已知 当0H 成立时,拒绝域形式为 2020=>s K c σ⎧⎫⎪⎨⎬⎪⎭⎩由 222220=(n)ns ns χσσ ,可得220=>nsP nc ασ⎧⎫⎪⎨⎬⎪⎭⎩所以 21-=()nc n αχ,由此可得拒绝域形式为2201-201=>()sK n n αχσ⎧⎫⎪⎨⎬⎪⎭⎩ (2)假设统计假设为 22220010:<,:>H H σσσσ 其中μ未知当0H 成立时,选择拒绝域为 2020=>s K c σ⎧⎫⎪⎨⎬⎪⎭⎩,由222(-1)(1)n s n χσ- 得 ()()()()222201111n s n s P n c P n c ασσ⎧⎫⎧⎫--⎪⎪⎪⎪=>-≤>-⎨⎬⎨⎬⎪⎪⎪⎪⎩⎭⎩⎭所以21(1)(1)n c n αχ--=-,由此可得拒绝域形式为2201-201=>(1)1s K n n αχσ⎧⎫⎪-⎨⎬-⎪⎭⎩14 从甲、乙两煤矿各取若干样品,得其含灰率(%)为,甲:24.3, 20.8, 23.7, 21.3,17.4, 乙:18.2, 16.9, 20.2, 16.7 .假定含灰率均服从正态分布且2212=σσ,问甲、乙两煤矿的含灰率有无显著差异 (=0.05α)?解 由题意知 2212(,),Y (,)X N N μσμσ设统计假设为 012112:=;:H H μμμμ≠ 其中12=5,=4n n 当=0.05α时1/2122.3238,(2) 2.3646w s t n n α-==+-=临界值1-12=(+2) 3.6861w c t n n s α-⋅= 拒绝域为}{0 3.6861K x y c =->=而 03.5,,.x y c H -=<接受认为没有差别15 设甲、乙两种零件彼此可以代替,但乙零件比甲零件制造简单,造价也低.经过试验获得它们的抗拉强度分别为(单位:kg/cm 2):甲:88,87,92,90,91 乙:89,89,90,84,88假定两种零件的抗拉强度都服从正态分布,且21σ =22σ.问甲种零件的抗拉强度是否比乙种的高(=0.05α)?解 由题意知 2212(,),Y (,)X N N μσμσ设统计假设为 012112:=;:H H μμμμ≠,其中12=5,=5n n 当=0.05α时122.2136,(2) 1.86,w s t n n α==+-=-临界值1-212=(+2) 2.2136w c t n n s α-⋅= 拒绝域为}{0 2.2136K x y c =->=而 1.6x y c -=<,所以接受0H ,认为甲的抗拉强度比乙的要高.16 甲、乙两车床生产同一种零件.现从这两车床产生的产品中分别抽取8个和9个,测得其外径(单位:mm )为:甲:15.0,14.5,15.2,15.5,14.8,15.1,15.2,14.8 乙:15.2,15.0,14.8,15.2,15.0,15.0,14.8,15.1,14.8假定其外径都服从正态分布,问乙车床的加工精度是否比甲车床的高(=0.05α)?解 由题意知 2212(,),Y (,)X N N μσμσ设统计假设为 2222012112:;:H H σσσσ≥<,其中12=8,=9n n 当=0.05α时 220.0955,0.0261x y s s ==,临界值 12(1,1)0.2684c F n n α=--=拒绝域为202x ys K c s ⎧⎫⎪⎪=<⎨⎬⎪⎪⎭⎩,而22 3.6588x y s F c s ==>,接受0H ,认为乙的精度高.17 要比较甲、乙两种轮胎的耐磨性,现从甲、乙两种轮胎中各取8个,各取一个组成一对,再随机选取8架飞机,将8对轮胎磨损量(单位:mg )数据列表如下:试问这两种轮胎的耐磨性有无显著差异?(=0.05α). 假定甲、乙两种轮胎的磨损量分别满足2212(,),Y (,)X N N μσμσ 且两个样本相互独立. 解 由题意知 2212(,),Y (,)X N N μσμσ设统计假设为 012112:=;:H H μμμμ≠,其中12===8n n n 当=0.05α时,令()221/211,320,102200,319.69,(1) 2.36461n ZZ i Z X Y z s z z s t n n α-==-==-==-=-∑ 拒绝域为}{0K z c =>,临界值1-2=(1)2138Z c t n s α-⋅= 而320z c =<,所以接受0H ,认为两种轮胎耐磨性无显著差异.18 设总体2212(,),Y (,)X N N μσμσ , 由两总体分别抽取样本 X :4.4,4.0,2.0,4.8 Y :6.0,1.0,3.2,0.41)能否认为12μμ= (=0.05α)? 2)能否认为2212σσ= (=0.05α)?解 (1) 由题意知 2212(,),Y (,)X N N μσμσ 设统计假设为 012112:=;:H H μμμμ≠,其中12==4=n n n令Z X Y =-,则有22111.15,()9.02331nzi z s z z n ===-=-∑, 当=0.05α时,1-2=(1) 3.1824c t n α-=,1-=(1)/ 4.78Z c t n s α-⋅= 拒绝域为}{0K z c =>,而 1.15z c =<,所以012,.H μμ=接受认为 (2) 由题意知 2212(,),Y (,)X N N μσμσ设统计假设为 2222220111:=;:H H σσσσ≠,其中12==4=n n n 其中221.5467, 6.4367x y s s ==,拒绝域为2201222>x x yy s s K c c s s ⎧⎫⎪⎪=<⎨⎬⎪⎪⎭⎩或临界值 1/21221212(1,1)0.0648,(1,1)15.4392c F n n c F n n αα-=--==--= 而22201220.2403,,.X Ys F H s σσ===接受认为19 从过去几年收集的大量记录发现,某种癌症用外科方法治疗只有2%的治愈率.一个主张化学疗法的医生认为他的非外科方法比外科方法更有效.为了用实验数据证 实他的看法,他用他的方法治疗200个癌症病人,其中有6个治好了.这个医生断 言这种样本中的3%治愈率足够证实他的看法.(1)试用假设检验方法检验这个医生的看法;(2)如果该医生实际得到了4.5%治愈率,问检验将证实化学疗法比外科方法更有效的概率是多少?解 (1) 记每个病人的治愈情况为X ,则有(1,) X B p设统计假设为 0010:=0.02;:0.02H p p H p p >≤=,其中200,0.05n α==拒绝域为}{00K x p c =-<,临界值10.0163c αμ-==而 000.01,,0.02.x p c H p -=<>拒绝不能认为(2) 不犯第二类错误的概率101 4.5%P X u p p αβ-⎧⎫⎪⎪-=>=⎨⎬⎪⎪⎭⎩由(1,) X B p ,可得 (1),p p EX p DX n-== 由中心极限定理得1 4.5%10.72X P p β⎧⎫⎪-=>=⎬⎪⎭=-Φ= 20 在某公路上,50min 之间,观察每15s 内通过的汽车数,得下表通过的汽车数量0 1 2 3 4 ≥5次数f92 68 28 11 1 0问能否认为通过的汽车辆数服从泊松分布(=0.10α)?解 设统计假设为 0010:()(),()(),200.0.10H F x F x H F x F x n α====4001ˆ,0.805.j j H X j n λν====∑若成立 记 ˆ1,2,3,4ˆ(),!j j j p P x j e j λλ-==-=则有ˆ0.8050102143243500.8050.4471,0.805*0.3599,*0.144920.8050.805*0.0389,*0.0078,10.0014,34j j p e e p p p p p p p p p p λ--=============-=∑检验统计量的值为()2522210.9500 2.1596(1)(4)9.848,~(),0.805.j j n j jnp m r np H X P ανχχχλλ-=-==<--===∑不拒绝认为且21 对某厂生产的汽缸螺栓口径进行100次抽样检验,测得100数据分组列表如下:组限10.93~10.9510.95~10.9710.97~10.9910.99~11.01频数 582034 组限 11.01~11.0311.03~11.0511.05~11.0711.07~11.09 频数1766 4试对螺栓的口径X 的分布做假设检验(=0.05α).解 设X 表示螺栓的口径,2(,)X N μσ ,分布函数为()F x ,统计假设为0010:()(),:()()H F x F x H F x F x =≠,其中100,0.05,2n r α===在0H 成立的情况下,计算得88221111ˆˆ11.0024,()0.00101888j j j j i i X x v x v μσμ====⋅==-⋅=∑∑ 由ˆ11.0024(0,1)ˆ0.00319X X N μσ--= 得0810.9311.002411.0911.00242.2689,, 2.74520.003190.00319x x --==-==所以110887()()0.0386,,()()0.0140p x x p x x =Φ-Φ==Φ-Φ=检验统计量的值为2822210.951()13.825(1)(5)11.07j j nj jv np m r np αχχχ-=-==>--==∑由此应该20,~(,).H X N μσ拒绝不能认为22 检查产品质量时,每次抽取10个产品检验,共抽取100次,得下表: 次品数0 1 2 3 4 5 6 7 8 9 10 频数 35 40 18 5 1 1 0 0 0 0 0 问次品数是否服从二项分布(=0.05α)?解 设X 表示抽取的次品数,2(,)X N μσ ,分布函数为()F x ,统计假设为0010:()(),:()()H F x F x H F x F x =≠,其中10,0.05n α==在0H 成立的情况下,01ˆNj j X pjv N N ===∑ 计算得001011922801011021033710100103101010(1),0,1,,10;ˆˆˆ(1)0.3487,(1)0.3874,(1)0.1937ˆˆ(1)0.0574,(1)10,jj N j j N p C p p j p C p p p C p p p C p p p C p p p C p p--=-==-==-==-==-==-= 检验统计量的值为0020()21022210.9505.1295(1)(9)16.92j j n j jnp m r np ανχχχ-=-==<--==∑因此0,~(10,0.1).H X B 不拒绝认为23 请71人比较A 、B 两种型号电视机的画面好坏,认为A 好的有23人,认为B 好的有45人,拿不定主意的有3人,是否可以认为B 的画面比A 的好(=0.10α)?解 设X 表示A 种型号电视机的画面要好些,Y 表示B 中型号电视机画面要好些分布函数分别为()X F x ,()Y F x ,统计假设为 01:()(),:()(),10,100.0.05X Y X Y H F x F x H F x F x N n α=≠===由题意知++=23=45,=+n n n n n --, 检验统计量 ,min()s n n +-=而23(68)25s s α=<=,所以0,.H B 拒绝认为的画面好24 为比较两车间(生产同一种产品)的产品某项指标的波动情况,各依次抽取12个产品进行测量,得下表 甲1.13 1.26 1.16 1.41 0.86 1.39 1.21 1.22 1.20 0.62 1.18 1.34 乙1.21 1.31 0.99 1.59 1.41 1.48 1.31 1.12 1.60 1.38 1.60 1.84问这两车间所生产的产品的该项指标分布是否相同(=0.05α)?解 设,X Y 分别表示甲乙两车间所生产产品的指标分布,分布函数分别()X F x ()Y F x ,统计假设为01:()(),:()(),.0.05,12,X Y X Y H F x F x H F x F x n m α=≠===检验统计量为秩和T ,易知T 的样本值为112T =且(150,300)T N 拒绝域为012K u u α-⎧⎫⎪=>⎨⎬⎪⎭⎩而0.9752.194 1.96u u =>=,所以0,.H 拒绝认为指标分布不相同25问两班组的劳动生产率是否相同(α=0.05)?解 设,X Y 分别表示两个组的劳动生产率,分布函数分别为(),X F x ()Y F x ,统计假设为01:()(),:()(),.0.05,9,9X Y X Y H F x F x H F x F x n m α=≠===检验统计量为秩和T ,易知T 的样本值为73T = 拒绝域形式为}{01212,<K T t T t t t =<> 其中而12(9,9)=66,(9,9)105t t =,因此T K ∈, 所以0,.H 接受认为劳动生产率相同26 观观察得两样本值如下:Ⅰ 2.36 3.14 7.52 3.48 2.76 5.43 6.54 7.41 Ⅱ 4.38 4.25 6.54 3.28 7.21 6.54 问这两样本是否来自同一总体(α=0.05)?解 设,X Y 分别表示Ⅰ,Ⅱ两个样本,分布函数分别是(),X F x ()Y F x ,统计假设为01:()(),:()(),.0.05,6,8,X Y X Y H F x F x H F x F x n m α=≠===检验统计量为秩和T ,易知T 的样本值为49T = 拒绝域形式为}{01212,<K T t T t t t =<> 其中而12(6,8)=32,(6,8)58t t =,因此0T K ∈, 所以0,.H 接受认为来自同一总体 27 某种动物配偶的后代按体格的属性分为三类,各类的数目是:10,53,46,按照某种遗传模型其比率之比应为:22)1(:)1(2:p p p p --,问数据与模型是否相符(05.0=α)?解 设体格的属性为样本X ,由题意知(2,1)X B p - 其密度函数为()f x ,其中22(,)(1)0,1,2xxx f x p C p p x -=-=统计假设为0010:()(),:()()H F x F x H F x F x =≠似然函数为222211(1)(1)i iii nnx x x x n nxnxi i L C pp pp C--===-=-∏∏解得最大似然统计量为 ˆ12x p=- 则 220ˆˆ 1.330.1121pp === 1ˆˆˆ2(1)0.4454p p p =-= 22ˆˆ(1)0.4424p p =-= 拒绝域为}{2201(1)K m r αχχ-=>--而 ()21022210.950ˆ0.9134(1)(9) 3.8414ˆj j n j j np m r npανχχχ-=-==<--==∑所以0,.H 不拒绝认为与模型相符28 在某地区的人口调查中发现:15729245个男人中有3497个是聋哑人.16799031个女人中有3072个是聋哑人.试检验“聋哑人与性别无关”的假设(05.0=α).解 设X 表示男人中聋哑人的个数,Y 表示女人中聋哑人的个数,其分布函数分别表示为()X F x ,()Y F x . 统计假设为01:(,)()(),:(,)()()X Y X Y H F x y F x F x H F x y F x F x =≠拒绝域为}{2201(1)K m r αχχ-=>--而21022210.950ˆ()62.64(1)(1) 3.84ˆj j n j j v np m r np αχχχ-=-==>--==∑所以0,.H 拒绝认为聋哑与性别相关 29 下表为某药治疗感冒效果的联列表:试问该药疗效是否与年龄有关(α=0.05)?解 设X 表示该药的疗效与年龄有关,Y 表示该药的疗效与年龄无关,其分布函数分别表示为(),X F x ()Y F x . 统计假设为01:(,)()(),:(,)()(),3,3,0.05,X Y X Y H F x y F x F x H F x y F x F x r s α=≠===拒绝域为}{2201(1)K m r αχχ-=>--而 ()21022210.950ˆ13.59(1)(4)9.488ˆj j n j j npm r npανχχχ-=-==>--==∑所以0,.H 拒绝认为疗效与年龄相关30 某电子仪器厂与协作的电容器厂商定,当电容器厂提供的产品批的不合格率不超过3%时以高于95%的概率接受,当不合格率超过12%时,将以低于10%的概率接受.试为验收者制订验收抽样方案.解 由题意知,010.03,0.12,0.05,0.1p p αβ====代入式子 01()1()L p L p αβ=-⎧⎨=⎩()L p选用式子()(L P X d P U φ=≤=≤≈计算求得 66,4n d ==,于是抽查方案是:抽查66件产品,如果抽得的不合格产品4X ≤,则接受这批产品,否则拒绝这批产品.31 假设一批产品的质量指标2(,)X N μσ (2σ已知),要求质量指标值越小越好.试给出检验抽样方案(,n c )的计算公式.若2σ未知,又如何确定检验抽样方案(,n c )?若质量高时指质量指标在一个区间时,又如何确定检验抽样方案(,n c )?解 (1) 解方程组01()1()L L μαμβ=-⎧⎨=⎩ 得 ()201u u n αβσμμ⎛⎫+⎪= ⎪-⎝⎭10u u c u u αβαβμμ+=+ (2) 若2σ未知,用*2M 估计2σ,从而得出公式()2*201u u M n αβμμ⎛⎫+⎪= ⎪-⎝⎭10u u c u u αβαβμμ+=+习题四1 下表数据是退火温度x (C 0)对黄铜延性η效应的试验结果,η是以延伸率计算的,且设为正态变量,求η对x 的样本线性回归方程.x (C 0)300 400 500 600 700 800 y (%)40 50 55 60 67 70解 利用回归系数的最小二估计:101ˆˆˆxyxx l l y x βββ⎧=⎪⎨⎪=-⎩其中2211,n nxy i i xx i i i l x y nxy l x nx ===-=-∑∑ 代入样本数据得到:10ˆˆ0.0589,24.6286ββ==样本线性回归方程为:ˆ24.62860.0589y x =+ 2 证明线性回归函数中(1)回归系数1β的置信水平为α-1的置信区间为11ˆˆ(2)n β-±-; (2)回归系数0β的置信水平为α-1的置信区间为0ˆ(2)n βσ-±-.证 (1) 由于211ˆ,xx N l σββ⎛⎫ ⎪⎝⎭()0,1N 222(2)E S n χσ- 又因为:,()222ˆ2(2)n n σχσ-- 故 所以()2t n - 易知 {}11ˆ1p c ββα-<=-,1P α<=-⎪⎭⎩其中()122n α--c所以1β的置信水平为α-1的置信区间为11ˆˆ(2)n β-±- (2) 由0ˆβ~2201(,())xxnx N l βσ+,得()0,1N ,()222ˆ2(2)n n σχσ-- ,0ˆβ与2ˆσ相互独立, 所以:()2T t n ==-根据11221(2)(2)P T t n P t n ααα--⎫⎪⎛⎫⎪-=<-=<- ⎪⎪⎝⎭⎪⎪⎭()()0001122ˆˆ22P n n ααβββ--⎛⎫ ⎪ ⎪=-<<- ⎪ ⎪ ⎪⎝⎭得到0β的置信度为1α-的置信区间()012ˆ2n αβ--.3 某河流溶解氧浓度(以百万分之一计)随着水向下游流动时间加长而下降.现测得8组数据如下表所示.求溶解氧浓度对流动时间的样本线性回归方程,并以α=0.05对回归显著性作检验.流动时间t (天)0.5 1.0 1.6 1.8 2.6 3.2 3.8 4.7 溶解氧浓度(百万分之一)0.28 0.29 0.29 0.18 0.17 0.18 0.10 0.12解 利用101ˆˆˆtyttl l y t βββ⎧=⎪⎨⎪=-⎩其中2211,n nty i i tt i i i l t y nty l t nt ===-=-∑∑ 代入样本数据得到: 10ˆˆ0.0472,0.3145ββ=-= 所以,样本线性回归方程为:ˆ0.31450.0472yt =- 拒绝域形式为:{}21ˆc β> ()20.95ˆ1,6,0.0058ttF c c l σ==>而21ˆ0.0022β=,所以回归模型不显著. 4 假设X 是一可控制变量,Y 是一随机变量,服从正态分布.现在不同的X 值下分别对Y 进行观测,得如下数据i x0.25 0.37 0.44 0.55 0.60 0.62 0.68 0.70 0.73 i y 2.57 2.31 2.12 1.92 1.75 1.71 1.60 1.51 1.50 i x0.75 0.82 0.84 0.87 0.88 0.90 0.95 1.00 i y1.41 1.33 1.31 1.25 1.20 1.19 1.15 1.00(1)假设X 与Y 有线性相关关系,求Y 对X 样本回归直线方程,并求2σ=DY 的无偏估计;(2)求回归系数210σββ、、的置信度为95%的置信区间; (3)检验Y 和X 之间的线性关系是否显著(=0.05α); (4)求Y 置信度为95%的预测区间;(5)为了把Y 的观测值限制在)68.1,08.1(,需把x 的值限制在什么范围?(=0.05α)解 (1) 利用101ˆˆˆxyxx l l y x βββ⎧=⎪⎨⎪=-⎩其中2211,n nxy i i xx i i i l x y nxy l x nx ===-=-∑∑计算得10ˆˆ2.0698, 3.0332ββ=-= 所以,样本线性回归方程为:ˆ 3.0332 2.0698y x =-,22ˆ0.002015ES σ==(2) 根据第二题,1β的置信区间为()112ˆˆ2n αβ-±-,代入值计算得到: ()1 2.1825, 1.9571β∈--,0β的置信区间为()02ˆ2n αβσ-±-,代入数值计算得到:()0 2.95069,3.1160β∈.(3) 根据F 检验法,其拒绝域形式为 }{201ˆK c β=>而 12ˆ(2),xxc tn l ασ-=- 显然10K β∈,所以Y 和X 之间具有显著的线性关系.(4)()221(0,(1))xxx x y N l nσ-++ ,()21()1(0,1)xxx x s x N l n -=++ 令222ˆˆ(2)((2)n n t n σχσ---则有1122ˆˆ((2),(2))y yt n yt n αα--∈--(5) 根据(4)的结论,令22ˆˆ1.68 1.08yyαα--+=-=,解得 (0.7802,0.8172)x ∈5 证明对一元线性回归系数0ˆβ,1ˆβ相互独立的充分必要条件是0=x . 证 ""⇒()()()()()010011111ˆˆˆˆˆˆcov ,E y x ββββββββββ=--=---2110111101ˆˆˆˆ()E y x y x βββββββββ=---++2211011101ˆy xE y x ββββββββ=---++ ()2211ˆx E ββ=-- 222221111ˆˆˆ()xxE D E l σββββ=+=+若要()01ˆˆcov ,0ββ=,那么0x =.反之显然也成立,命题的证.6 设n 组观测值),...,2,1)(,(n i y x i i =之间有关系式:i i i i x x y εεββ,+-+=)(10~),...,2,1)(,0(2n i N =σ(其中∑==ni i x n x 11),且n εεε,...,,21相互独立.(1) 求系数10,ββ的最小二乘估计量10ˆ,ˆββ; (2) 证明∑∑∑===-+-=-ni i ni i i ni i y y y y y y 121212)ˆ()ˆ()(,其中∑==ni i y n y 11 (3) 求10ˆ,ˆββ的分布. 解 (1) 最小化残差平方和:2201[()]Ei i S y x x ββ=---∑01ββ求,的偏导数[][]220101012()02()()0E Ei i i i i S S y x x y x x x x ββββββ∂∂=----==-----=∂∂∑∑, 01ˆˆ,xyxxl y l ββ==得到: (2) 易知()()()22221111ˆˆˆˆˆˆ()()2()nnnniiiiiii i i i i i i i y y y yy y y y yy y y y y ====-=-+-=-+-+--∑∑∑∑ 其中01ˆˆˆ()()xyi i i xxl yx x y x x l ββ=+-=+-,将其代入上式可得 1ˆˆ()()0niiii y yy y =--=∑ 所以,∑∑∑===-+-=-ni i n i i i ni iy y yy y y121212)ˆ()ˆ()( (3) 20ˆ~(0,),iN y εσβ= ,200ˆ~(,)N nσββ∴同理,易得211ˆ~(,)xxN l σββ∴7 某矿脉中13个相邻样本点处某种金属的含量Y 与样本点对原点的距离X 有如下观测值 i x 2 3 4 5 7 8 10 i y 106.42 108.20 109.58 109.50 110.00 109.93 110.49 ix 11 14 15 16 18 19 i y 110.59 110.60 110.90 110.76 111.00 111.20分别按(1)x b a y +=;(2)x b a y ln +=;(3)xba y +=. 建立Y对X 的回归方程,并用相关系数221TES S R -=指出其中哪一种相关最大.解 (1)令v y a bv ==+,根据最小二乘法得到,正规方程:101ˆˆˆvy vv l l y vβββ⎧=⎪⎨⎪=-⎩,最后得到10ˆˆ1.1947,106.3013ββ==所以:样本线性回归方程为:ˆ106.3013y=+10.8861R = (2) 令ln ,v x y a bv ==+101ˆˆˆvyvv l l y vβββ⎧=⎪⎨⎪=-⎩,得到10ˆˆ1.714,106.3147ββ==所以:样本线性回归方程为:ˆ106.3147 1.714ln y x =+,20.9367R = (3) 令1,v y a bv x==+ 101ˆˆˆvy vv l l y vβββ⎧=⎪⎨⎪=-⎩,得到10ˆˆ111.4875,9.833ββ==- 所以:样本线性回归方程为:ˆ111.48759.833yx =-,30.987R = 综上,123R R R <<,所以第三种模型所表示的X Y 与的相关性最大. 8 设线性模型⎪⎩⎪⎨⎧++=+-=+=3213221211122εββεββεβy y y其中i ε~),0(2σN (1,2,3.i =)且相互独立,试求1β、2β的LS 估计.解 令()()1231212310,,,21,(,),,,12T TT Y y y y X βββεεεε⎡⎤⎢⎥==-==⎢⎥⎢⎥⎣⎦则线性模型可转化为 Y X βε=+ 根据 222TTTTES Y X Y Y Y X X X ββββ=-=-+, 令 20ES β∂=∂可得 ()1ˆT T X X X Y β-=即 112322311ˆˆ(23),(2)66Y Y Y Y Y ββ=++=--+ 9 养猪场为估算猪的毛重,随机抽测了14头猪的身长1x (cm),肚围2x (cm)与体重y (kg),得数据如下表所示,试求一个22110x b x b b y ++=型的经验公式.解由多元线性模型得:()2140,Y X I βεεσ=+⎧⎪⎨=⎪⎩()()()0121212,,,,,,T T Tn n Y y y y ββββεεεε===()114149145581516215271159621627416971ˆ172741787918084190851929419891110395T T X X X X Y β-⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦代入数值得到:12ˆ15.93840.52230.4738yx x =-++ 同样得到:12ˆ15.93840.52230.4738yx x =-++ 10 某种商品的需求量y ,消费者的平均收入1x 和商品价格2x 的统计数据如下表所示.试求y 对1x 、2x 的线性回归方程.1i x 1000600 1200 500 300 400 1300 1100 1300 300 2i x 5 7 6 6 8 7 5 4 3 9 i y100 75 80 70 50 65 90 100 110 60解 建立回归模型201122=+++(0,)Y x x N βββεεσ 其中根据2()=0E S ββ∂∂,可求得β的LS 估计为 -1ˆ=(X X)T T X Y β代入x ,得0=111.6918,β 1=0.0143,β 2=7.1882,β-则回归方程为:12ˆ111.69180.01437.1882yx x =+- 11 设n 组观测值),...,2,1)(,(n i y x i i =之间有如下关系:i i i i i x x y εεβββ,+++=2210~),...,2,1)(,0(2n i N =σ,且n εεε,...,,21相互独立.(1)求系数21,,βββ的最小二乘估计量210ˆ,ˆ,ˆβββ; (2)设n i x x y i i i ,...,2,1,ˆˆˆˆ2210=++=βββ,∑==n i i y n y 11,证明:∑∑∑===-+-=-ni i ni i i ni i y y y y y y 121212)ˆ()ˆ()(解 (1) ()()()0121212,,,,,,T T Tn n Y y y y ββββεεεε===1222211111Tn n X x x x x x x ⎛⎫ ⎪= ⎪⎪⎝⎭()1ˆT T X X X Y β-= (2)()()()22221111ˆˆˆˆˆˆ()()2()nnnniiiiiii i i i i i i i y y y yy y y y yy y y y y ====-=-+-=-+-+--∑∑∑∑()()11ˆˆˆˆ()0nT T i i i i x x x x y yy y β-==--=∑其中:y=x ,将其代入,得到 ()22211ˆˆ()()nni i i i i i y y y yy y ==∴-=-+-∑∑ 12(1)求形如2210x b x b b y ++=的回归方程;(2)对上述回归方程的显著性作检验; (3)求当x =5.5时Y 的估计值.解 (1) 令212,x x x x ==,求得回归方程为:2ˆ 3.4167 2.72620.3905yx x =+- (2) 拒绝域形式为:{}21ˆc β> ()20.9521ˆ1,6ˆxxF c l σβ=>而,所以回归方程具有显著性 (3) 将 5.5x =代入回归方程,得到ˆ 6.5982y= 13 设y 和变量12,x x 有形为ε++=2211x b x b y ,2(0,)N εσ 的回归方程模型,试用最小二乘法求出12b b 和的估计.解 令 ()()()121212,,,,,TTTn Y y y y βββεεε===1112121222Tn n x x x X x x x ⎛⎫= ⎪⎝⎭残差平方和为 222T T T T E S Y X Y Y Y X X X ββββ=-=-+令 20E S β∂=∂,得到 112ˆ(,)()T T T X X X Y βββ-==.。
北京化工大学2012-2013(1)《高等数理统计》试卷1. Let n X X X ,,,21 be iid random samples with pdf given by: 1)|(-=θθθx x f for 10<<x , where 0>θ is the parameter.(1) Find the method of moment estimator (MME) for θ and denote it by θ~.(2) Find the maximum likelihood estimator (MLE) of θ and denote it by 1ˆθ. Find the MLE of θ1 and denote it by 2ˆθ. (3) Calculate the Cramer-Rao Lower Bound for the variance of any unbiased estimator of θ1. (4) Is 2ˆθ unbiased estimator of θ1? If 2ˆθ is unbiased estimator of θ1, is it the uniformly minimum variance estimator (UMVUE) of θ1? Justify your answer. 2. Let n X X X ,,,21 be iid with pdf θθθ<<=x x f 0,/1)|(.(1) Prove that i n i n X X ≤≤=1)(max a complete sufficient statistics for the parameter θ.(2) Based on )(n X , find the uniformly minimum variance estimator (UMVUE) of θ.3. Let n X X X ,,,21 be a random sample form a ),(2σθn population, where θ and 2σ are unknown. We are interested in testing 00:θθ=H versus 01:θθ≠H ,here 0θ is a specified value of θ.(1) Show that the test that rejects 0H whenn S t X n /22/,10αθ->- is a test of size α, where 2/,1α-n t satisfies /2)t (/2,1αα=≥n-T P with 1~-n t T .(2) Show that the test in part (1) can be derived as a likelihood ratio test (LRT).4. Let n X X X ,,,21 be a random sample form a ),(2σθn population,2σ is known. Consider testing 1:0=θH versus 2:1=θH . Construct a uniformly most powerful (UMP) test with the size of α.。
高等教育自学考试辅导《概率论与数理统计(经管类)》第二部份数理统计部份专题一统计量及抽样的散布近几年试题的考点散布和分数散布最高分数分布最低分数分布平均分数分布样本的分布 2 1样本矩 2 1合计4/100 0/100 2/100一、整体与样本:所考察对象的全部称为整体;组成整体的每一个大体元素称为个体。
:从整体中随机抽取n个个体x1,x2…,x n称为整体的一个样本,个数n称为样本容量。
若是整体X的样本x1,x2…,x n知足:(1)x1与X有相同散布,i=1,2,…,n;(2)x1,x2…,x n彼此独立,那么称该样本为简单随机样本,简称样本。
取得简单随机样本的方式称为简单随机抽样方式。
(1)联合散布函数:设整体X的散布函数为F(x),x1,x2…,x n为该整体的一个样本,那么联合散布函数为二、统计量及其散布1.统计量、抽样散布:设x1,x2…,x n为取自某整体的样本,假设样本函数T=T(x1,x2…,x n)不含任何未知参数,那么称T为统计量;统计量的散布称为抽样散布。
:设x1,x2…,x n为取自某整体X的样本,(2)样本均值的性质:①若称样本的数据与样本均值的差为偏差,则样本偏差之和为零,即②偏差平方和最小,即对任意常数C,函数时取得最小值.(5)样本矩(7)正态分布的抽样分布A.应用于小样本的三种统计量的分布的为自由度为n的X2散布的α分位点.求法:反查X 2散布表.[答疑编号1]答案:D[答疑编号2]答案:[答疑编号3]答案:B [答疑编号4]答案:1 [答疑编号5]答案:B [答疑编号6]解析:故填20. [答疑编号7]答案:n解析:[答疑编号8]答案:解析:此题考核正态散布的叠加原理和x2-散布的概念。
根据课本P82,例题3-28的结果,若X~N(0,1),Y~N(0,1),且X与Y彼此独立,那么X+Y~N(0+0,1+1)=N(0,2)。
此题,已知X1、X2、X3、X4为来自整体X~N(0,1)的样本,因此X1、X2、X3、X4彼此独立且服从同散布N(0,1),那么X1+X2~N(0,2),X3+X4~N(0,2);从而,,那么以下选项中正确的选项是()[答疑编号9]答案:A解析:本题考察课本p140,4.一些重要结论。
数理统计学,应用统计学必考名词解释,简答题总结第一篇:数理统计学,应用统计学必考名词解释,简答题总结数理统计课程复习内容高淼林整理1、名词解释和简答题简单随机样本: 是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
统计量 : 统计理论中用来对数据进行分析、检验的变量。
抽样分布: 样本统计量的概率分布。
χ2分布: 设X1,X2,......Xn相互独立, 都服从标准正态分布N(0,1), 则称随机变量χ2=X1平方+X2平方+......+Xn平方所服从的分布为自由度为 n 的χ2分布。
t分布:设X1服从标准正态分布N(0,1),X2服从为n的χ2分布,且X1、X2相互独立,则称变量t=X1/(X2/n的结果开根号)所服从的分布为自由度为n的t分布。
F分布: 设X1服从自由度为m的χ2分布,X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量F=(X1/m)/(X2/n)所服从的分布为F分布,其中第一自由度为m,第二自由度为n点估计:又称定值估计,就是用实际样本指标数值作为总体参数的估计值区间估计: 参数估计的一种形式。
通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计置信度: 特定个体对待特定命题真实性相信的程度无偏性:估计值在待估参数的真值附近摆动,对待估参数的真值无偏倚有效性:一种基于业务性能的可用性。
指完成策划的活动和达到策划结果的程度一致性: 校准曲线接近规定特性曲线时的吻合程度假设检验:据一定假设条件由样本推断总体的一种方法显著水平:估计总体参数落在某一区间内,可能犯错误的概率为显著性水第一类错误:进行统计假设检验时,错误地拒绝原假设(也称零假设)H0的错误。
第二类错误:为在进行假设检验时,原假设不正确而接受原假设的错误原假设:研究者想收集证据予以反对的假设备择假设:研究者想收集证据予以支持的假设工序能力指数:表示工序能力对设计的产品规范的保证程度。