吴赣昌编-概率论与数理统计-第6章(new)
- 格式:ppt
- 大小:2.50 MB
- 文档页数:47
概率论与数理统计课后答案第6章第6章习题参考答案1.设是取⾃总体X的⼀个样本,在下列情形下,试求总体参数的矩估计与最⼤似然估计:(1),其中未知,;(2),其中未知,。
2.设是取⾃总体X的⼀个样本,其中X服从参数为的泊松分布,其中未知,,求的矩估计与最⼤似然估计,如得到⼀组样本观测值X 0 1 2 3 4频数17 20 10 2 1求的矩估计值与最⼤似然估计值。
3.设是取⾃总体X的⼀个样本,其中X服从区间的均匀分布,其中未知,求的矩估计。
4.设是取⾃总体X的⼀个样本,X的密度函数为其中未知,求的矩估计。
5.设是取⾃总体X的⼀个样本,X的密度函数为其中未知,求的矩估计和最⼤似然估计。
6.设是取⾃总体X的⼀个样本,总体X服从参数为的⼏何分布,即,其中未知,,求的最⼤似然估计。
7. 已知某路⼝车辆经过的时间间隔服从指数分布,其中未知,现在观测到六个时间间隔数据(单位:s):1.8,3.2,4,8,4.5,2.5,试求该路⼝车辆经过的平均时间间隔的矩估计值与最⼤似然估计值。
8.设总体X的密度函数为,其中未知,设是取⾃这个总体的⼀个样本,试求的最⼤似然估计。
9. 在第3题中的矩估计是否是的⽆偏估计?解故的矩估计量是的⽆偏估计。
10.试证第8题中的最⼤似然估计是的⽆偏估计。
11. 设为总体的样本,证明都是总体均值的⽆偏估计,并进⼀步判断哪⼀个估计有效。
12.设是取⾃总体的⼀个样本,其中未知,令,试证是的相合估计。
13.某车间⽣产滚珠,从长期实践中知道,滚珠直径X服从正态分布,从某天⽣产的产品中随机抽取6个,量得直径如下(单位:mm):14.7,15.0,14.9,14.8,15.2,15.1,求的0.9双侧置信区间和0.99双侧置信区间。
14.假定某商店中⼀种商品的⽉销售量服从正态分布,未知。
为了合理的确定对该商品的进货量,需对和作估计,为此随机抽取七个⽉,其销售量分别为:64,57,49,81,76,70,59,试求的双侧0.95置信区间和⽅差的双侧0.9置信区间。
吴赣昌高等数学教材《吴赣昌高等数学教材》高等数学是大学数学中的重要一门课程,旨在培养学生的抽象思维能力和解决实际问题的能力。
作为高等数学教育领域的重要奠基人之一,吴赣昌教授以其丰富的数学知识和教学经验编写了一本高等数学教材,为广大学子提供了一本权威、系统且易于理解的学习材料。
第一章微积分在微积分这一章节,吴赣昌教授系统地介绍了微积分的基本概念和原理,包括函数、极限、导数、积分等内容。
他通过深入浅出的讲解,帮助学生建立起对微积分的扎实理解和应用能力。
第二章线性代数线性代数是数学的重要分支,也是应用数学和工程学科中的必修课。
吴赣昌教授在这一章中详细介绍了向量、矩阵、线性方程组等内容,并通过大量的例题和实际应用案例,帮助学生掌握线性代数的基本方法和思维模式。
第三章概率论与数理统计概率论与数理统计是研究随机现象规律和统计规律的数学分支。
吴赣昌教授在本章中引入了概率的基本概念和统计学的基本原理,帮助学生了解概率与统计的应用范围,并通过生动的案例和实验,培养学生的观察与分析能力。
第四章微分方程微分方程是研究变化规律的数学分支,广泛应用于自然科学和工程技术领域。
吴赣昌教授在这一章节中引入了常微分方程和偏微分方程的解法方法,让学生能够熟练掌握微分方程的解题技巧及其实际意义。
第五章多元函数微分学多元函数微分学是数学分析的重要内容,研究多元函数的极限、连续性、可微性等性质。
吴赣昌教授在本章中详细介绍了多元函数的概念、偏导数、方向导数等,并通过实例让学生了解多元函数在实际问题中的应用。
第六章多元函数积分学多元函数积分学是微积分的重要分支,用于计算曲线的弧长、曲面的面积、物体的质量等。
吴赣昌教授在这一章节中详细讲解了多重积分和曲线曲面积分的计算方法,让学生掌握多元函数积分的基本理论和实际应用。
通过《吴赣昌高等数学教材》,学生能够系统、全面地掌握高等数学的基本概念和方法,提高数学计算和问题解决能力。
同时,该教材还注重理论与实践的结合,通过大量的实例和应用案例,帮助学生理解数学在实际问题中的应用价值。
第六章 统计量及其抽样分布第二节 总体与样本:1.研究对像的全体叫总体,,构成总体的每个成员称为个体总体就是一个分布,而其数量指标就是服从这个分布的随机变量。
从总体中抽样=从某分布中抽样2.样本:从总体中随机抽取n 个样本,记其指标值为12,....n x x x 则称为12,....n x x x 总体的一个样本,n 称为样本容量,或样本量,样本中的个体称为样品。
样本二重性:a) 样本是随机变量。
用12,,X X …,n X 表示 b) 样本是一组数值。
用12,.....x x在有限总体中进行放回抽样,是独立的随机抽样。
若是不放回的,则是不独立的抽样。
当总体容量N很大,但样本容量n 很小时(10%≤nN),不放回可近似看作放回抽样,是独立抽样。
简单随机抽样的要求:a) 样本具有随机性。
B)样本要有独立性。
用简单随机抽样方法得到的样本称为简单随机样本,简称样本,样本12,,x x …,n x 可看成是相互独立的具有同一分布的随机变量,其共同分布即为总体分布。
设总体具有分布函数(),F x 12,....n x x x 是取自该总体的容量为n 的样本,则 样本的联合分布函数为: 1 2.1(,....)()==∏nn i i F x x x F x若总体X 具有概率密度为(),f x 则样本的联合密度函数为:12(,......)n f x x x 1().==∏ni i f x若总体X 为离散型随机变量,则样本的联合密度函数为:12(,......)n p x x x 1().===∏ni i P X x通常:样本分布是指多维随机变量的联合分布。
3.样本数据的整理与显示 数据(样本)整理步骤: a) 对样本进行分组。
b) 确定每组组距 c) 确定每组组限d) 统计样本数据落入每个区间的个数——频数。
表格式,图形式1.直方图法 最常用的在组距相等场合常用宽度相等的长条矩形表示,矩形的高低表示频数的大小。
第六章 样本及抽样分布1.[一] 在总体N (52,6.32)中随机抽一容量为36的样本,求样本均值X 落在50.8到53.8之间的概率。
解:8293.0)78()712(}63.68.163.65263.62.1{}8.538.50{),363.6,52(~2=-Φ-Φ=<-<-=<<X P X P N X2.[二] 在总体N (12,4)中随机抽一容量为5的样本X 1,X 2,X 3,X 4,X 5. (1)求样本均值与总体平均值之差的绝对值大于1的概率。
(2)求概率P {max (X 1,X 2,X 3,X 4,X 5)>15}. (3)求概率P {min (X 1,X 2,X 3,X 4,X 5)>10}.解:(1)⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=>-25541225415412}112{|X P X P X P=2628.0)]25(1[2=Φ- (2)P {max (X 1,X 2,X 3,X 4,X 5)>15}=1-P {max (X 1,X 2,X 3,X 4,X 5)≤15} =.2923.0)]21215([1}15{1551=-Φ-=≤-∏=i i X P (3)P {min (X 1,X 2,X 3,X 4,X 5)<10}=1- P {min (X 1,X 2,X 3,X 4,X 5)≥10} =.5785.0)]1([1)]21210(1[1}10{15551=Φ-=-Φ--=≥-∏=i iXP 4.[四] 设X 1,X 2…,X 10为N (0,0.32)的一个样本,求}.44.1{1012>∑=i iXP解:)5(1.0}163.0{}44.1{),10(~3.0101221012221012查表=>=>∑∑∑===i i i i i i X P X P χX7.设X 1,X 2,…,X n 是来自泊松分布π (λ )的一个样本,X ,S 2分别为样本均值和样本方差,求E (X ), D (X ), E (S 2 ).解:由X ~π (λ )知E (X )= λ ,λ=)(X D∴E (X )=E (X )= λ, D (X )=.)()(,)(2λX D S E nλn X D === [六] 设总体X~b (1,p),X 1,X 2,…,X n 是来自X 的样本。
)n X +=2)i X -,S 2()iX X -21(,2N μ22(,4N μ212()22x e μ--⋅如果用X 的测试值x 估计μ1,用Y 的测试值y 估计μ2,从上面的图形可以看出,当可靠性(概率)取相同值(如90%)时,y 比x 更“接近”它的待估计量.当要求两个“接近"相同时,y 比x 的可靠性更高。
能够得到这些有价值的结论,应归功于我们知道了X 和Y 的分布.综上所述,我们需要知道统计量g (X 1,X 2,…,X n )的分布。
那么,g (X 1,X 2,…,X n )服从什么分布呢?不同的g 会有不同的结果.下面给出几种常见的分布,这些分布在统计推断中起着重要的作用。
(一)2χ分布(2χdistribution )设n X X X ,,,21 为相互独立的随机变量,它们都服从标准正态)1,0(N 分布,则随机变量221ni i X χ==∑ 服从自由度为n 的2χ分布,记作22()n χχ.)(2n χ分布的密度函数为122/210()2(/2)00n yn y e y f y n y --⎧>⎪=Γ⎨⎪≤⎩其中 )(αΓ称为伽马函数,定义为10(),0x x e dx ααα∞--Γ=>⎰。
下图描绘了)(2n χ分布密度函数在n = 1,4,10,20时的图形。
μ10.16μ20.082χ分布具有可加性:如果2211()n χχ、2222()n χχ,则 2221212()n n χχχ++2χ分布期望和方差:设22~()n χχ,则2()E n χ=,2()2D n χ=。
2χ分布分位点 对于给定的α( 0 〈 α < 1),称满足条件222(){()()}()ααn n n f y dy αχχχ+∞>==⎰P的数2()αn χ为2()n χ分布的上分位点。
教材后附表的2χ分布表给出分位点2()αn χ,可通过查表得到.如20.99(17) 6.408χ=,20.90(17)10.085χ=,20.05(17)27.587χ=等等。
第六章定积分的应用课后习题全解习题6-2★ 1.求由曲线xy =与直线x y =所围图形的面积。
知识点:平面图形的面积思路:由于所围图形无论表达为X-型还是Y-型,解法都较简单,所以选其一做即可 解: 见图6-2-1∵所围区域D 表达为X-型:⎩⎨⎧<<<<x y x x 10, (或D 表达为Y-型:⎩⎨⎧<<<<yx y y 210)∴⎰-=10)(dx x x S D61)2132(1223=-=x x (⎰=-=1261)(dy y y S D) ★ 2.求在区间[0,π/2]上,曲线x y sin =与直线0=x 、1=y 所围图形的面积知识点:平面图形面积思路:由于所围图形无论表达为X-型还是Y-型,解法都较简单,所以选其一做即可 解:见图6-2-2∵所围区域D 表达为X-型:⎪⎩⎪⎨⎧<<<<1sin 20y x x π, (或D 表达为Y-型:⎩⎨⎧<<<<y x y arcsin 010) ∴12)cos ()sin 1(202-=+=-=⎰πππx x dx x S D( 12arcsin 1-==⎰πydy S D)★★3.求由曲线x y =2与42+-=x y 所围图形的面积知识点:平面图形面积思路:由于所围图形表达为Y-型时解法较简单,所以用Y-型做 解:见图6-2-3∵两条曲线的交点:⎩⎨⎧±==⇒⎩⎨⎧+-==22422y x x y x y , ∴所围区域D 表达为Y-型:⎩⎨⎧-<<<<-22422yx y y ,∴2316)324()4(2232222=-=--=--⎰y y dy y y S D(由于图形关于X 轴对称,所以也可以解为:2316)324(2)4(223222=-=--=⎰y y dy y y S D )★★4.求由曲线2x y =、24x y =、及直线1=y 所围图形的面积知识点:平面图形面积思路:所围图形关于Y 轴对称,而且在第一象限内的图形表达为Y-型时,解法较简单 解:见图6-2-4∵第一象限所围区域1D 表达为Y-型:⎩⎨⎧<<<<yx y y 210,∴34322)2(22123101=⨯=-==⎰y dy y y S S D D(若用X-型做,则第一象限内所围区域=1D b a D D ,其中a D :⎪⎩⎪⎨⎧<<<<22410x y x x ,b D :⎪⎩⎪⎨⎧<<<<14212y x x ;∴12212201422[()(1]443D D x x S S x dx dx ==-+-=⎰⎰) ★★5.求由曲线xy 1=与直线x y =及2=x 所围图形的面积知识点:平面图形面积思路:由于所围图形表达为X-型,解法较简单,所以用X-型做 解:见图6-2-5∵两条曲线xy =和x y =的交点为(1,1)、(-1,-1),又这两条线和2=x 分别交于)21,2(、2) ,2( ∴所围区域D 表达为X-型:⎪⎩⎪⎨⎧<<<<x y xx 121,∴22211113((ln )ln 222DS x dx x x x =-=-=-⎰★★★6.抛物线x y 22=分圆822=+y x 的面积为两部分,求这两部分的面积知识点:平面图形面积思路:所围图形关于X 轴对称,而且在第一象限内的图形表达为Y-型时,解法较简单 解:见图6-2-6,设阴影部分的面积为1D S ,剩余面积为2D S∵两条曲线x y 22=、822=+y x 的交于(2,2)±(舍去4-=x 的解),∴所围区域1D 表达为Y-型:⎪⎩⎪⎨⎧-<<<<-228222y x y y ;又图形关于x 轴对称,∴342342(2)68(2)28(220320220221+=-+=--=--=⎰⎰ππy y dy y y S D(其中222cos 18cos 22cos 22844sin 2222+=+=⨯=-⎰⎰⎰=πππdt ttdt t dyy ty ) ∴34634282-=--=πππDS ★★★7.求由曲线x e y =、x e y -=与直线1=x 所围图形的面积知识点:平面图形面积思路:由于所围图形表达为X-型时,解法较简单,所以用X-型做 解:见图6-2-7∵两条曲线x e y =和x e y -=的交点为(0,1),又这两条线和1=x 分别交于) ,1(e 和) ,1(1-e∴所围区域D 表达为X-型:⎩⎨⎧<<<<-x x ey e x 10,∴2)()(1101-+=+=-=---⎰e e e e dx e e S x x x x D★★★8.求由曲线x y ln =与直线a y ln =及b y ln =所围图形的面积)0(>>a b知识点:平面图形面积思路:由于所围图形表达为Y-型时,解法较简单,所以用Y-型做 解:见图6-2-8∵在x ln的定义域范围内所围区域D :⎩⎨⎧<<<<ye x by a 0ln ln , ∴a b e dy e S b ayba y D-===⎰ln ln ln ln★★★★9.求通过(0,0),(1,2)的抛物线,要求它具有以下性质:(1)它的对称轴平行于y 轴,且向下弯;(2)它与x 轴所围图形面积最小知识点:平面图形面积和求最值思路:首先根据给出的条件建立含参变量的抛物线方程,再求最值时的参变量解:由于抛物线的对称轴平行于y 轴,又过(0,0),所以可设抛物线方程为bx ax y +=2,(由于下弯,所以<a ),将(1,2)代入bxax y +=2,得到2=+b a ,因此x a ax y )2(2-+=该抛物线和X 轴的交点为0=x 和aa x 2-=, ∴所围区域D :2200(2)a x ay ax a x-⎧<<⎪⎨⎪<<+-⎩ ∴23223226)2()223(])2([a a x a x a dx x a ax S aa a a D-=-+=-+=--⎰)4()2(61)]2()2()2(3[61)(233322+-=-⨯-+-⨯='---a a a a a a a a S D得到唯一极值点:4-=a ,∴所求抛物线为:x x y 642+-=★★★★10.求位于曲线x e y =下方,该曲线过原点的切线的左方以及x 轴上方之间的图形的面积知识点:切线方程和平面图形面积思路:先求切线方程,再作出所求区域图形,然后根据图形特点,选择积分区域表达类型 解:xe y =⇒xe y =',∴在任一点0x x =处的切线方程为)(000x x e ey x x -=-而过(0,0)的切线方程就为:)1(-=-x e e y ,即ex y =所求图形区域为21D D D =,见图6-2-10X-型下的1D :⎩⎨⎧<<<<∞-x e y x 00,2D :⎩⎨⎧<<<<xey ex x 1∴222)(1211e e e x eedx ex e dx e S x xxD=-=-=-+=∞-∞-⎰⎰ ★★★11.求由曲线θcos 2a r =所围图形的面积知识点:平面图形面积思路:作图可知该曲线是半径为a 、圆心(0 ,a )的圆在极坐标系下的表达式,可直接求得面积为ra图6-1-11 a2图6-2-12θ3sin a r =r6/π1D)cos 2(2θ+=a ra 6a 4a 32a π,也可选择极坐标求面积的方法做。
第六章 样本及抽样分布1.[一] 在总体N (52,6.32)中随机抽一容量为36的样本,求样本均值X 落在50.8到53.8之间的概率。
解: 8293.0)78()712(}63.68.163.65263.62.1{}8.538.50{),363.6,52(~2=-Φ-Φ=<-<-=<<X P X P N X2.[二] 在总体N (12,4)中随机抽一容量为5的样本X 1,X 2,X 3,X 4,X 5. (1)求样本均值与总体平均值之差的绝对值大于1的概率。
(2)求概率P {max (X 1,X 2,X 3,X 4,X 5)>15}. (3)求概率P {min (X 1,X 2,X 3,X 4,X 5)>10}.解:(1)⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=>-25541225415412}112{|X P X P X P =2628.0)]25(1[2=Φ-(2)P {max (X 1,X 2,X 3,X 4,X 5)>15}=1-P {max (X 1,X 2,X 3,X 4,X 5)≤15}=.2923.0)]21215([1}15{1551=-Φ-=≤-∏=i i X P (3)P {min (X 1,X 2,X 3,X 4,X 5)<10}=1- P {min (X 1,X 2,X 3,X 4,X 5)≥10}=.5785.0)]1([1)]21210(1[1}10{15551=Φ-=-Φ--=≥-∏=i i X P 4.[四] 设X 1,X 2…,X 10为N (0,0.32)的一个样本,求}.44.1{1012>∑=i i X P解:)5(1.0}163.0{}44.1{),10(~3.0101221012221012查表=>=>∑∑∑===i ii ii iX P XP χX7.设X 1,X 2,…,X n 是来自泊松分布π (λ )的一个样本,X ,S 2分别为样本均值和样本方差,求E (X ), D (X ), E (S 2).解:由X ~π (λ )知E (X )= λ ,λ=)(X D∴E (X )=E (X )= λ, D (X )=.)()(,)(2λX D S E nλnX D ===[六] 设总体X~b (1,p),X 1,X 2,…,X n 是来自X 的样本。
第五章数理统计的基础知识5.1 数理统计的基本概念习题一已知总体X服从[0,λ]上的均匀分布(λ未知),X1,X2,⋯,Xn为X的样本,则().(A)1n∑i=1nXi-λ2是一个统计量;(B)1n∑i=1nXi-E(X)是一个统计量;(C)X1+X2是一个统计量;(D)1n∑i=1nXi2-D(X)是一个统计量.解答:应选(C).由统计量的定义:样本的任一不含总体分布未知参数的函数称为该样本的统计量.(A)(B)(D)中均含未知参数.习题2观察一个连续型随机变量,抽到100株“豫农一号”玉米的穗位(单位:cm),得到如下表中所列的数据. 按区间[70,80),[80,90),⋯,[150,160),将100个数据分成9个组,列出分组数据计表(包括频率和累积频率),并画出频率累积的直方图.解答:分组数据统计表X¯=1n∑i=1nXi与Sn2=1n∑i=1n(Xi-X¯)2分别表示样本均值和样本二阶中心矩,试求E(X¯),E(S2).解答:由X∼B(10,3100),得E(X)=10×3100=310,D(X)=10×3100×97100=2911000,所以E(X¯)=E(X)=310,E(S2)=n-1nD(X)=291(n-1)1000n.习题6设某商店100天销售电视机的情况有如下统计资料f(x)={λe-λx,x>00,其它,F(x)={1-e-λx,x>00,x≥0,X(2)的概率密度为f(2)(x)=2F(x)f(x)={2λe-λx(1-e-λx),x>00,其它,又X(1)的概率密度为f(1)(x)=2[1-F(x)]f(x)={2λe-2λx,x>00,其它.习题9设电子元件的寿命时间X(单位:h)服从参数λ=0.0015的指数分布,今独立测试n=6元件,记录它们的失效时间,求:(1)没有元件在800h之前失效的概率;(2)没有元件最后超过3000h的概率.解答:(1)总体X的概率密度f(x)={(0.0015)e-0.0015x,x>00,其它,分布函数F(x)={1-e-0.0015x,x>00,其它,{没有元件在800h前失效}={最小顺序统计量X(1)>800},有P{X(1)>800}=[P{X>800}]6=[1-F(800)]6=exp(-0.0015×800×6)=exp(-7.2)≈0.000747.(2){没有元件最后超过3000h}={最大顺序统计量X(6)<3000}P{X(6)<3000}=[P{X<3000}]6=[F(3000)]6=[1-exp{-0.0015×3000}]6=[1-exp{-4.5}]6≈0.93517.习题10设总体X任意,期望为μ,方差为σ2,若至少要以95%的概率保证∣X¯-μ∣<0.1σ,问样本容量n应取多大?解答:因当n很大时,X¯-N(μ,σ2n),于是P{∣X¯-μ∣<0.1σ}=P{μ-0.1σ<X¯<μ+0.1σ}≈Φ(0.1σσ/n)-Φ(-0.1σσ/n)=2Φ(0.1n)-1≥0.95,则Φ(0.1n)≥0.975,查表得Φ(1.96)=0.975,因Φ(x)非减,故0.1n≥1.96,n≥384.16,故样本容量至少取385才能满足要求.5.2 常用统计分布习题1对于给定的正数a(0<a<1),设za,χa2(n),ta(n),Fa(n1,n2)分别是标准正态分布,χ2(n),t(n),F(n1,n2)分布的上a分位点,则下面的结论中不正确的是().(A)z1-a(n)=-za(n);(B)χ1-a2(n)=-χa2(n);(C)t1-a(n)=-ta(n);(D)F1-a(n1,n2)=1Fa(n2,n1).解答:应选(B).因为标准正态分布和t分布的密度函数图形都有是关于y轴对称的,而χ2分布的密度大于等于零,所以(A)和(C)是对的.(B)是错的. 对于F分布,若F∼F(n1,n2),则1-a=P{F>F1-a(n1,n2)}=P{1F<1F1-a(n1,n2)=1-P{1F>1F1-a(n1,n2)由于1F∼F(n2,n1),所以P{1F>1F1-a(n1,n2)=P{1F>Fa(n2,n1)=a,即F1-a(n1,n2)=1Fa(n2,n1). 故(D)也是对的.习题2(1)2.设总体X∼N(0,1),X1,X2,⋯,Xn为简单随机样本,问下列各统计量服从什么分布? (1)X1-X2X32+X42;解答:因为Xi∼N(0,1),i=1,2,⋯,n,所以:X1-X2∼N(0,2),X1-X22∼N(0,1),X32+X42∼χ2(2),故X1-X2X32+X42=(X1-X2)/2X32+X422∼t(2).习题2(2)2.设总体X∼N(0,1),X1,X2,⋯,Xn为简单随机样本,问下列各统计量服从什么分布? (2)n-1X1X22+X32+⋯+Xn2;解答:因为Xi∼N(0,1),∑i=2nXi2∼χ2(n-1),所以n-1X1X22+X32+⋯+Xn2=X1∑i=2nXi2/(n-1)∼t(n-1).习题2(3)2.设总体X∼N(0,1),X1,X2,⋯,Xn为简单随机样本,问下列各统计量服从什么分布?(3)(n3-1)∑i=13Xi2/∑i=4nXi2.解答:因为∑i=13Xi2∼χ2(3),∑i=4nXi2∼χ2(n-3),所以:(n3-1)∑i=13Xi2/∑i=4nXi2=∑i=13Xi2/3∑i=4nXi2/(n-3)∼F(3,n-3).习题3设X1,X2,X3,X4是取自正态总体X∼N(0,22)的简单随机样本,且Y=a(X1-2X2)2+b(3X3-4X4)2,则a=?,b=?时,统计量Y服从χ2分布,其自由度是多少?解答:解法一Y=[a(X1-2X2)]2+[b(3X3-4X4)]2,令Y1=a(X1-2X2),Y2=b(3X3-4X4),则Y=Y12+Y22,为使Y∼χ2(2),必有Y1∼N(0,1),Y2∼N(0,1),因而E(Y1)=0,D(Y1)=1,E(Y2)=0,D(Y2)=1,注意到D(X1)=D(X2)=D(X3)=D(X4)=4,由D(Y1)=D[a(X1-2X2)]=aD(X1-X2)=a(D(X1)+22D(X2))=a(4+4×4)=20a=1,D(Y2)=D[b(3X3-4X4)]=bD(3X3-4X4)=b(9D(X3)+16D(X4))=b(4×9+16×4)=100b=1,分别得a=120,b=1100.这时Y∼χ2(2),自由度为n=2.解法二因Xi∼N(0,22)且相互独立,知X1-2X2=X1+(-2)X2∼N(0,20),3X3-4X4=3X3+(-4)X4∼N(0,100),故X1-2X220∼N(0,1),3X3-4X4100∼N(0,1),为使Y=(X1-2X21/a)2+(3X3-4X41/b)2∼χ2(2),必有X1-2X21/a∼N(0,1),3X3-4X41/b∼N(0,1),与上面两个服从标准正态分布的随机变量比较即是1a=20,1b=100,即a=120,b=1100.习题4设随机变量X和Y相互独立且都服从正态分布N(0,32).X1,X2,⋯,X9和Y1,Y2,⋯,Y9是分别取自总体X和Y的简单随机样本,试证统计量T=X1+X2+⋯+X9Y12+Y22+⋯+Y92服从自由度为9的t分布.解答:首先将Xi,Yi分别除以3,使之化为标准正态.令X′i=Xi3,Y′i=Yi3,i=1,2,⋯,9,则X′i∼N(0,1),Y′i∼N(0,1);再令X′=X′1+X′2+⋯+X′9,则X′∼N(0,9),X′3∼N(0,1),Y′2=Y′12+Y′22+⋯+Y′92,Y′2∼χ2(9).因此T=X1+X2+⋯+X9Y12+Y22+⋯+Y92=X1′+X2′+⋯+X9′Y′12+Y′22+⋯+Y′92=X′Y′2=X′/3Y′2/9∼t(9),注意到X′,Y′2相互独立.习题5设总体X∼N(0,4),而X1,X2,⋯,X15为取自该总体的样本,问随机变量Y=X12+X22+⋯+X1022(X112+X122+⋯+X152)服从什么分布?参数为多少?解答:因为Xi2∼N(0,1),故Xi24∼χ2(1),i=1,2,⋯,15,而X1,X2,⋯,X15独立,故X12+X22+⋯+X1024∼χ2(10),X112+X122+⋯+X1524∼χ2(5),所以X12+X22+⋯+X1024/10X112+X122+⋯+X1524/5=X12+X22+⋯+X1022(X112+X122+⋯+X152)=Y习题6证明:若随机变量X服从F(n1,n2)的分布,则(1)Y=1X服从F(n2,n1)分布;(2)并由此证明F1-α(n1,n2)=1Fα(n2,n1).解答:(1)因随机变量X服从F(n1,n2),故可设X=U/n1V/n2,其中U服从χ2(n1),V服从χ2(n2),且U与V相互独立,设1X=V/n2U/n1,由F分布之定义知Y=1x=V/n2U/n1,服从F(n2,n1).(2)由上侧α分位数和定义知P{X≥F1-α(n1,n2)}=1-α,P{1X≤1F1-α(n1,n2)=1-α,即P{Y≤1F1-α(n1,n2)=1-α,1-P{Y>1F1-α(n1,n2)=1-α,故P{Y>1F1-α(n1,n2)=α,而P{Y≥Fα(n2,n1)}=α.又Y为连续型随机变量,故P{Y≥1F1-α(n1,n2)=α,从而Fα(n2,n1)=1F1-α(n1,n2),即F1-α(n1,n2)=1Fα(n2,n1).习题7查表求标准正态分布的上侧分位数:u0.4,u0.2,u0.1与u0.05.解答:u0.4=0.253,u0.2=0.8416,u0.1=1.28,u0.05=1.65.习题8查表求χ2分布的上侧分位数:χ0.952(5),χ0.052(5),χ0.992(10)与χ0.012(10).解答:1.145,11.071,2.558,23.209.习题9查表求F分布的上侧分位数:F0.95(4,6),F0.975(3,7)与F0.99(5,5).解答:0.1623,0.0684,0.0912.习题10查表求t分布的下侧分位数:t0.05(3),t0.01(5),t0.10(7)与t0.005(10).解答:2.353,3.365,1.415,3.169.(2)P{X¯>4.5}=P{Z>4.5-42/9=1-P{Z≤2.25}≈1-Φ(2.25)=1-0.9878=0.0122.习题2设总体X服从正态分布N(10,32),X1,X2,⋯,X6是它的一组样本,设X¯=16∑i=16Xi.(1)写出X¯所服从的分布;(2)求X¯>11的概率.解答:(1)X¯∼N(10,326),即X¯∼N(10,32).(2)P{X¯>11}=1-P{X¯≤11}=1-Φ(11-1032)≈1-Φ(0,8165)≈1-Φ(0.82)=0.2061.习题3设X1,X2,⋯,Xn是总体X的样本,X¯=1n∑i=1nXi,分别按总体服从下列指定分布求E(X¯),D(X¯).(1)X服从0-1分布b(1,p);(2)*X服从二项分布b(m,p);(3)X服从泊松分布P(λ);(4)X服从均匀分布U[a,b];(5)X服从指数分布e(λ).解答:(1)由题意,X的分布律为:P{X=k}=Pk(1-P)1-k(k=0,1).E(X)=p,D(X)=p(1-p).所以E(X¯)=E(1n∑i=1nXi)=1n∑i=1nE(Xi)=1n⋅np=p,D(X¯)=D(1n∑i=1nXi)=1n2∑i=1nD(X1)=1n2⋅np(1-p)=1np(1-p). (2)由题意,X的分布律为:P{X=k}=CmkPk(1-p)m-k(k=0,1,2,⋯,m).同(1)可得E(X¯)=mp,D(X¯)=1nmp(1-p).(3)由题意,X的分布律为:P{X=k}=λkk!e-λ(λ>0,k=0,1,2,⋯).E(X)=λ,D(X)=λ.同(1)可得E(X¯)=λ,D(X¯)=1nλ.(4)由E(X)=a+b2,D(X)=(b-a)212,同(1)可得E(X¯)=a+b2,D(X¯)=(b-a)212n.(5)由E(X)=1λ,D(X)=1λ2,同(1)可得D(X¯)=1λ,D(X¯)=1nλ2.习题4某厂生产的搅拌机平均寿命为5年,标准差为1年,假设这些搅拌机的寿命近似服从正态分布,求:(1)容量为9的随机样本平均寿命落在4.4年和5.2年之间的概率;(2)容量为9的随机样本平均寿命小于6年的概率。
第六章数理统计的基本概念前面五章我们讲述了概率论的基本内容,随后的五章将讲述数理统计.数理统计是以概率论为理论基础的一个数学分支.它是从实际观测的数据出发研究随机现象的规律性.在科学研究中,数理统计占据一个十分重要的位置,是多种试验数据处理的理论基础.数理统计的内容很丰富,本书只介绍参数估计、假设检验、方差分析及回归分析的部分内容.本章中首先讨论总体、随机样本及统计量等基本概念,然后着重介绍几个常用的统计量及抽样分布.第一节随机样本假如我们要研究某厂所生产的一批电视机显像管的平均寿命.由于测试显像管寿命具有破坏性,所以我们只能从这批产品中抽取一部分进行寿命测试,并且根据这部分产品的寿命数据对整批产品的平均寿命作一统计推断.在数理统计中,我们将研究对象的某项数量指标值的全体称为总体(Population),总体中的每个元素称为个体(Individual).例如上述的一批显像管寿命值的全体就组成一个总体,其中每一只显像管的寿命就是一个个体.要将一个总体的性质了解得十分清楚,初看起来,最理想的办法是对每个个体逐个进行观察,但实际上这样做往往是不现实的.例如,要研究显像管的寿命,由于寿命试验是破坏性的,一旦我们获得实验的所有结果,实用文档这批显像管也全烧毁了,我们只能从整批显像管中抽取一部份显像管做寿命试验,并记录其结果,然后根据这部份数据来推断整批显像管的寿命情况.由于显像管的寿命在随机抽样中是随机变量,为了便于数学上处理,我们将总体定义为随机变量.随机变量的分布称为总体分布.一般地,我们都是从总体中抽取一部分个体进行观察,然后根据所得的数据来推断总体的性质.被抽出的部分个体,叫做总体的一个样本.所谓从总体抽取一个个体,就是对总体X进行一次观察(即进行一次试验),并记录其结果.我们在相同的条件下对总体X进行n次重复的、独立的观察,将n次观察结果按试验的次序记为X1,X2,…,X n.由于X1,X2,…,X n是对随机变量X观察的结果,且各次观察是在相同的条件下独立进行的,于是我们引出以下的样本定义.定义6.1设总体X是具有分布函数F的随机变量,若X1,X2,…,X n是与X具有同一分布F(x),且相互独立的随机变量,则称X1,X2,…,X n为从总体X得到的容量为n的简单随机样本(Random sample),简称为样本.当n次观察一经完成,我们就得到一组实数x1,x2,…,x n.它们依次是随机变量X1,X2,…,X n的观察值,称为样本值.对于有限总体,采用放回抽样就能得到简单样本,当总体中个体的总数N比要得N≥10时),在实际中可将不放回抽样近似地当作到的样本的容量n大得多时(一般当n放回抽样来处理.实用文档实用文档若X 1,X 2,…,X n 为总体X 的一个样本,X 的分布函数为F (x ),则X 1,X 2,…,X n 的联合分布函数为F *(x 1,x 2,…,x n )=∏=ni i x F 1)(.又若X 具有概率密度f ,则X 1,X 2,…,X n 的联合概率密度为f *(x 1,x 2,…,x n )=∏=ni i x f 1)(.我们在搜集资料时,如果未经组织和整理,通常是没有什么价值的,为了把这些有差异的资料组织成有用的形式,我们应该编制频数表(即频数分布表).例6.1 某工厂的劳资部门为了研究该厂工人的收入情况,首先收集了工人的工资资料,表6-1记录了该厂30名工人未经整理的工资数值:表6-1以下,我们以例6.1为例介绍频数分布表的制作方法.表6-1是30个工人月工资的原始资料,这些数据可以记为x1,x2,…,x30,对于这些观测数据,第一步确定最大值x max和最小值x min,根据表6-1,有x max=640,x min=420.第二步分组,即确定每一收入组的界限和组数,在实际工作中,第一组下限一般取一个小于x min的数,例如,我们取400,最后一组上限取一个大于x max的数,例如取650,然后从400元到650元分成相等的若干段,比如分成5段,每一段就对应于一个收入组.表6-1资料的频数分布表如表6-2所示.表6-2实用文档600~650230图6-1为了研究频数分布,我们可用图示法表示.直方图直方图是垂直条形图,条与条之间无间隔,用横轴上的点表示组限,纵轴上的单位数表示频数.与一个组对应的频数,用以组距为底的矩形(长条)的高度表示,表6-2资料的直方图如图6-1所示.上述方法我们对抽取数据加以整理,编制频数分布表,作直方图,画出频率分布曲线,这就可以直观地看到数据分布的情况,在什么范围,较大较小的各有多少,在哪些地方分布得比较集中,以及分布图形是否对称等等,所以,样本的频率分布是总体概率分布的近似.样本是总体的反映,但是样本所含的信息不能直接用于解决我们所要研究的问题,而需要把样本所含的信息进行数学上的加工使其浓缩起来,从而解决我们的问题.针对不同的问题构造样本的适当函数,利用这些样本的函数进行统计推断.定义6.2设X1,X2,…,X n是来自总体X的一个样本,g(X1,X2,…,X n)是X1,X2…,X n的函数,若g中不含任何未知参数,则称g(X1,X2,…,X n)是一个统计量(Statistic).实用文档实用文档设x 1,x 2,…,x n 是相应于样本X 1,X 2,…,X n 的样本值,则称g (x 1,x 2,…,x n )是g (X 1,X 2,…,X n )的观察值.下面我们定义一些常用的统计量.设X 1,X 2,…,X n 是来自总体X 的一个样本,x 1,x 2,…,x n 是这一样本的观察值.定义样本平均值∑==ni i X n X 11;样本方差S 2=2221111()11n ni i i i X X X nX n n ==⎡⎤-=-⎢⎥--⎣⎦∑∑; 样本标准差S =∑=--=n i iX X n S 122)(11; 样本k 阶(原点)矩A k =∑=n i ki X n 11,k =1,2,…;样本k 阶中心矩B k =∑=-ni k i X X n 1)(1,k =1,2,….它们的观察值分别为∑==ni i x n x 11;实用文档s 2=2221111()11n n i i i i x x x nx n n ==⎡⎤-=-⎢⎥--⎣⎦∑∑ s =∑=--ni i x x n 12)(11; a k =∑=n i ki x n 11, k =1,2,…;b k =11()nk i i x x n =-∑, k =1,2,….这些观察值仍分别称为样本均值、样本方差、样本标准差、样本k 阶矩、样本k 阶中心矩.第二节 抽样分布统计量是样本的函数,它是一个随机变量.统计量的分布称为抽样分布.在使用统计量进行统计推断时常需知道它的分布.当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一般来说是困难的.本节介绍来自正态总体的几个常用的统计量的分布.1.χ2分布设X 1,X 2,…,X n 是来自总体N (0,1)的样本,则统计量2χ=X 12+X 22+…+X n 2所服从的分布称为自由度为n 的2χ分布(2χdistribution ),记为2χ~)(2n χ.实用文档)(2n χ分布的概率密度函数为f (y )=⎪⎩⎪⎨⎧>--.,0,0,)2(212122其他y y n y n n e Γf (y )的图形如图62所示.图622χ分布具有以下性质:(1) 如果21χ~)(12n χ,22χ~)(22n χ,且它们相互独立,则有)(~2122221n n ++χχχ.这一性质称为2χ分布的可加性. (2) 如果2χ~)(2n χ,则有E (2χ)=n ,D (2χ)=2n .证 只证(2)因为X i ~N (0,1)故E (X i 2)=D (X i )=1,D (X i 2)=E (X i 4)E (X i 2)]2=31=2,i =1,2,…,n .于是,)()()(12122n X E X E E ni i ni i ===∑∑==χ图63.2)()()(12122n X D X D D ni i n i i ===∑∑==χ对于给定的正数α,0<α<1,称满足条件实用文档{}⎰∞==>)(222)()(n y y f n P αχααχχd的点)(2n αχ为)(2n χ分布的上α分位点(Percentile of α),如图63所示,对于不同的α,n ,上α分位点的值已制成表格,可以查用(见附表),例如对于α=0.05,n =16,查附表得)16(205.0χ=26.296.但该表只详列到n =45为止.当n >45时,近似地有)(2n αχ≈2)12(21-+n z α,其中z α是标准正态分布的上α分位点.例如)50(205.0χ≈12(1.645+99)2=67.221.2.t 分布设X ~N (0,1),Y ~2()n χ,并且X ,Y 独立,则称随机变量t =nYX服从自由度为n 的t 分布(t distribution ),记为t ~t (n ).t (n )分布的概率密度函数为h (t )=[]2/)1(21)2/(2/)1(+-⎪⎪⎭⎫⎝⎛++n n t n n n ΓΓπ, ∞<t <∞.(证略). 图64中画出了当n =1,10时h (t )的图形.h (t )的图形关于t =0对称,当n充分大时其图形类似于标准正态变量概率密度的图形.但对于较小的n ,t 分布与N (0,1)分布相差很大(见附表).实用文档图6 4 图65对于给定的α,0<α<1,称满足条件P (t >t α(n ))=⎰∞)()(n t t t h αd =α的点t α(n )为t (n )分布的上α分位点(见图65).由t 分布的上α分位点的定义及h (t )图形的对称性知t 1α(n )=t α(n ).t 分布的上α分位点可从附表查得.在n >45时,就用正态分布近似:t α(n )≈z α.3.F 分布设U ~)(12n χ,V ~)(22n χ,且U ,V 独立,则称随机变量F =21//n V n U 服从自由度为(n 1,n 2)的F 分布(F distribution ),记F ~F (n 1,n 2).F (n 1,n 2)分布的概率密度为[][]⎪⎩⎪⎨⎧>++=+-.,0,0,)/(1)2/()2/()/(2/)()(2/)(21211)2/(2/21212111其他y n y n n n y n n n n y n n n n ΓΓΓψ (证略).实用文档)(y ψ的图形如图66所示.图6 6 图67F 分布经常被用来对两个样本方差进行比较.它是方差分析的一个基本分布,也被用于回归分析中的显著性检验.对于给定的α,0<α<1,称满足条件P {F >F α(n 1,n 2)}=⎰∞),(21)(n n F y y αψd =α的点F α(n 1,n 2)为F (n 1,n 2)分布的上α分位点(图67).F 分布的上α分位点有表格可查(见附表).F 分布的上α分位点有如下的性质:F 1α(n 1,n 2)=),(112n n F α.这个性质常用来求F 分布表中没有包括的数值.例如由附表查得F 0.05(9,12)=2.80,则可利用上述性质求得F 0.95(12,9)=1/F 0.05(9,12)=12.80=0.357. 4.正态总体的样本均值与样本方差的分布设正态总体的均值为μ,方差为σ2,X 1,X 2,…,X n 是来自正态总体X 的一个简单实用文档样本,则总有E (X )=μ, D (X )=σ2/n ,X ~N (μ,σ2/n ).对于正态总体N (μ,σ2)的样本方差S 2, 我们有以下的性质.定理6.1 设X 1,X 2,…,X n 是总体N (μ,σ2)的样本,X ,S 2分别是样本均值和样本方差,则有(1))1(~)1(222--n S n χσ;(2)X 与S 2独立. (证略).定理6.2 设X 1,X 2,…,X n 是总体N (μ,σ2)的样本,X ,S 2分别是样本均值和样本方差,则有)1(~/--n t nS X μ.证 因为)1,0(~/N nX σμ-,)1(~)1(222--n S n χσ且两者独立,由t 分布的定义知实用文档)1(~)1()1(//22----n t n S n nX σσμ. 化简上式左边,即得)1(~/--n t nS X μ.定理6.3 设X 1,X 2,…,1n X 与Y 1,Y 2,…,2n X 分别是来自具有相同方差的两正态总体N (μ1,σ2),N (μ2,σ2)的样本,且这两个样本相互独立.设∑==1111n i i X n X ,∑==2121n i i Y n Y 分别是这两个样本的均值.S 12=∑=--1121)(11n i i X X n ,S 22=∑=--2122)(11n i i Y Y n 分别是这两个样本的样本方差,则有:)2(~/1/1)()(212121-++---n n t n n S Y X W μμ,其中 S W 2=)2()1()1(21222211-+-+-n n S n S n .(证略).本节所介绍的三个分布以及三个定理,在下面各章中都起着重要的作用.应注意,它们都是在总体为正态总体这一基本假定下得到的.例6.2 设总体X 服从正态分布N (62,100),为使样本均值大于60的概率不小于0.95,问样本容量n 至少应取多大?解 设需要样本容量为n ,则)1,0(~/N n X nX ⋅-=-σμσμ,实用文档P (X >60)=⎭⎬⎫⎩⎨⎧⋅->⋅-n n X P 1062601062.查标准正态分布表,得Φ(1.64)≈0.95.所以0.2n ≥1.64,n ≥67.24.故样本容量至少应取68.小 结在数理统计中往往研究有关对象的某一项数量指标,对这一数量指标进行试验和观察,将试验的全部可能的观察值称为总体,每个观察值称为个体.总体中的每一个个体是某一随机变量X 的值,因此一个总体对应于一个随机变量X ,我们笼统称为总体X .随机变量X 服从什么分布就称总体服从什么分布.若X 1,X 2,…,X n 是相同条件下,对总体X 进行n 次重复独立的观察所得到的n 个结果,称随机变量X 1,X 2,…,X n 为来自总体X 的简单随机样本,它具有两条性质.1.X 1,X 2,…,X n 都与总体具有相同的分布;2.X 1,X 2,…,X n 相互独立.我们就是利用来自样本的信息推断总体,得到有关总体分布的种种结论.完全由样本X 1,X 2,…,X n 所确定的函数g =g (X 1,X 2,…,X n )称为统计量,统计量是一个随机变量.它是统计推断的一个重要工具.在数理统计中的地位相当重要,相当于随机变量在概率论中的地位.实用文档样本均值 ∑==ni i X n X 11和样本方差 S 2=∑=--n k k X X n 12)(11是两个最重要的统计量,统计量的分布称为抽样分布,读者需要掌握统计学中三大抽样分布:2χ分布,t 分布,F 分布.读者学习后续内容还需要掌握以下重要结果:1.设总体X 的一个样本为X 1,X 2,…,X n .且X 的均值和方差存在. 记μ=EX ,σ2=DX .则E (X )=μ, D (X )=σ2/n , ES 2=σ2.2.设总体X~N (μ,σ2),X1,X2,…,Xn 是X 的一个样本,则 (1) X ~N (μ,σ2/n ); (2))1(~)1(222--n S n χσ;(3) X 和S 2相互独立; (4))1(~/--n t nS X μ.3.定理6.3的结果. 重要术语及主题总体 样本 统计量实用文档2χ分布、t 分布、F 分布的定义及它们的密度函数图形上的α分位点.习 题 六1.设总体X ~N (60,152),从总体X 中抽取一个容量为100的样本,求样本均值与总体均值之差的绝对值大于3的概率.2.从正态总体N (4.2,52)中抽取容量为n 的样本,若要求其样本均值位于区间(2.2,6.2)内的概率不小于0.95,则样本容量n 至少取多大?3.设某厂生产的灯泡的使用寿命X ~N (1000,σ2)(单位:小时),随机抽取一容量为9的样本,并测得样本均值及样本方差.但是由于工作上的失误,事后失去了此试验的结果,只记得样本方差为S 2=1002,试求P (X >1062).4.从一正态总体中抽取容量为10的样本,假定有2%的样本均值与总体均值之差的绝对值在4以上,求总体的标准差.5.设总体X ~N (μ,16),X 1,X 2,…,X 10是来自总体X 的一个容量为10的简单随机样本,S 2为其样本方差,且P (S 2>a )=0.1,求a 之值.6.设总体X 服从标准正态分布,X 1,X 2,…,X n 是来自总体X 的一个简单随机样本,试问统计量Y =∑∑==-ni ii i XX n 62512)15(,n >5实用文档服从何种分布?7.求总体X ~N (20,3)的容量分别为10,15的两个独立随机样本平均值差的绝对值大于0.3的概率.8.设总体X ~N (0,σ2),X 1,…,X 10,…,X 15为总体的一个样本.则Y =()21521221121022212X X X X X X ++++++ 服从 分布,参数为 . (2001研考)9.设总体X ~N (μ1,σ2),总体Y ~N (μ2,σ2),X 1,X 2,…,1n X 和Y 1,Y 2,…,2n X 分别来自总体X 和Y 的简单随机样本,则⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-+-+-∑∑==2)()(21121221n n Y Y X X E n j j n i i = . (2004研考) 10.设总体X ~N (μ,σ2),X 1,X 2,…,X 2n (n ≥2)是总体X 的一个样本,∑==ni i X n X 2121,令Y =∑=+-+ni i n iX X X12)2(,求EY . (2001研考)11. 设总体X 的概率密度为f (x )=x-e21 (-∞<x <+∞),X 1,X 2,…,X n 为总体X 的简单随机样本,其样本方差为S 2,求ES 2. (2006研考)。
第六章参数估计6.1 点估计问题概述习题1总体X在区间[0,θ]上均匀分布,X1,X2,⋯,Xn是它的样本,则下列估计量θ是θ的一致估计是().(A)θ=Xn;(B)θ=2Xn;(C)θ=X¯=1n∑i=1nXi;(D)θ=Max{X1,X2,⋯,Xn}。
解答:应选(D).由一致估计的定义,对任意ɛ>0,P(∣Max{X1,X2,⋯,Xn}—θ∣〈ɛ)=P(-ɛ+θ〈Max{X1,X2,⋯,Xn}<ɛ+θ)=F(ɛ+θ)—F(-ɛ+θ).因为FX(x)={0,x〈0xθ,0≤x≤θ1,x〉θ,及F(x)=FMax{X1,X2,⋯,Xn}(x)=FX1(x)FX2(x)⋯FXn(x),所以F(ɛ+θ)=1,F(-ɛ+θ)=P(Max{X1,X2,⋯,Xn}〈—ɛ+θ)=(1—xθ)n,故P(∣Max{X1,X2,⋯,Xn}-θ∣〈ɛ)=1-(1-xθ)n→1(n→+∞).习题2设σ是总体X的标准差,X1,X2,⋯,Xn是它的样本,则样本标准差S是总体标准差σ的()。
(A)矩估计量;(B)最大似然估计量;(C)无偏估计量; (D)相合估计量。
解答:应选(D).因为,总体标准差σ的矩估计量和最大似然估计量都是未修正的样本标准差;样本方差是总体方差的无偏估计,但是样本标准差不是总体标准差的无偏估计.可见,样本标准差S是总体标准差σ的相合估计量.习题3设总体X的数学期望为μ,X1,X2,⋯,Xn是来自X的样本,a1,a2,⋯,an是任意常数,验证(∑i=1naiXi)/∑i=1nai(∑i=1nai≠0)是μ的无偏估计量。
解答:E(X)=μ,E(∑i=1naiXi∑i=1nai)=1∑i=1nai⋅∑i=1naiE(Xi) (E(Xi)=E(X)=μ)=μ∑i=1nai∑i=1n=μ,综上所证,可知∑i=1naiXi∑i=1nai是μ的无偏估计量。
习题4设θ是参数θ的无偏估计,且有D(θ)〉0, 试证θ2=(θ)2不是θ2的无偏估计.解答:因为D(θ)=E(θ2)-[E(θ)]2,所以E(θ2)=D(θ)+[E(θ)]2=θ2+D(θ)〉θ2,故(θ)2不是θ2的无偏估计。
第六章样本与抽样分布§6.1 数理统计的基本概念一.数理统计研究的对象例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。
(1)若规定寿命低于1000小时的产品为次品。
此问题是求P(X 1000)=F(10000),求F(x)? (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)?、D(x)?。
要解决二个问题1.试验设计抽样方法。
2.数据处理或统计推断。
方法具有“从局部推断总体”的特点。
二.总体(母体)和个体1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。
说明:(1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。
所以总体是个体的数量指标的全体。
(2)为研究方便将总体与一个R.V X对应(等同)。
a.总体中不同的数量指标的全体,即是R.V.X的全部取值。
b.R.V X的分布即是总体的分布情况。
例:一批产品是100个灯泡,经测试其寿命是:1000小时1100小时1200小时20个30个50个X 1000 1100 1200P 20/100 30/10050/100(设X表示灯泡的寿命)可知R.V.X的分布律,就是总体寿命的分布,反之亦然。
常称总体X,若R.VX~F(x),有时也用F(x)表示一个总体。
(3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y,Z, …)去描述总体。
2.总体的分类有限总体无限总体三.简单随机样本.1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样本中样品的个数称为样本容量(也叫样本量)。
每个样品的测试值叫观察值。
取得子样的过程叫抽样。
样本的双重含义:(1)随机性:用(X1,X2,……X n) n维随机向量表示。
X i表示第i个被抽到的个体,是随机变量。
(i=1,2,…n)(2)确定性:(x1,x2,……x n)表示n个实数,即是每个样品Xi观测值x i(i=1,2,…n)。