概率论与数理统计第六章(最新版)
- 格式:ppt
- 大小:1.21 MB
- 文档页数:55
概率论与数理统计第六章一、估计及其性质“估计”在中文里既可以作名词,也可以作动词。
用英文的话,可以表示成不同的单词:estimate:所谓的“估计”(动词)就是根据样本预测总体分布中的未知参数。
例如,已知总体服从正态分布[公式] ,但总体均值[公式] 未知,我们通过某个函数“估计”总体均值,[公式] 。
estimator:“估计量”(名词)[公式] 实际上是一个统计量,它是通过一个不含未知参数的样本函数计算出来的结果。
一般使用[公式] 表示总体的参数,[公式] 表示参数的估计量。
estimation:“估计法”(名词)表示寻找函数[公式] 的过程,可以理解为一种估计方法。
例如:Maximum Likelihood Estimation,最大似然估计法。
随着样本不同,同一估计法得到的结果可能是不一样的,因此“估计量”也是一个随机变量。
对于同一个参数,有不同的估计方法,而且看起来都是合理的。
如何比较它们的优劣呢?(1)均方误差MSE Mean Square Error评价一个估计量的好坏,很自然地会想到:衡量“估计量”与“真实值”之间的距离,距离越小表示估计量的性能越好。
也就是所谓的“均方误差”函数:[公式] 也就是距离平方的期望值,如果将其进一步展开:[公式]注意:[公式] 和[公式] 均为数值,[公式] 表示参数的真实值,[公式] 表示估计量的数学期望。
由此看见,均方误差由两部分组成:一是估计量的方差(Variances),即[公式] ;二是估计量的系统偏差(Bias)的平方,即[公式] 。
从“马同学”处借来此图,它可以帮助理解“方差”与“偏差”:备注:靶心表示“真实值”,红叉表示“估计值”“方差”衡量估计值的分散程度,“偏差”衡量估计值的期望与真实值的距离。
左上图:估计值落在靶心四周,此时“方差”较大但“偏差”较小;右上图:估计值落在靶心邻近,此时“方差”、“偏差”均较小;左下图:估计值离靶心较远,呈分散状,此时“方差”、“偏差”均较大;右下图:估计值离靶心较远,落点集中,此时“偏差”较大但“方差”较小。
第六章 数理统计的基本概念第一节 基本概念1、概念网络图正态总体下的四大分布统计量样本函数样本个体总体数理统计的基本概念→⎪⎪⎪⎭⎪⎪⎪⎬⎫⎪⎪⎪⎩⎪⎪⎪⎨⎧ 2、重要公式和结论例6.1:从正态总体)6,4.3(2N 中抽取容量为n 的样本,如果要求其样本均值位于区间(1.4, 5.4)内的概率不小于0.95,问样本容量n 至少应取多大?第二节 重点考核点统计量的分布第三节 常见题型1、统计量的性质例6.2:设),,,(721X X X 取自总体)5.0,0(~2N X ,则=⎪⎭⎫⎝⎛>∑=7124i i X P。
例6.3:设总体X 服从正态分布),(21σμN ,总体Y 服从正态分布),(22σμN ,1,,21n X X X 和 2,,21n Y Y Y 分别是来自总体X 和Y 的简单随机样本, 则=⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡-+-+-∑∑==2)()(21212121n n Y Y X X E n j j n i i .2、统计量的分布例6.4:设),,,(21n X X X 是来自正态总体),(2σμN 的简单随机样本,X 是样本均值,记,)(111221∑=--=ni i X X n S,)(11222∑=-=ni i X X n S,)(111223∑=--=ni i X n S μ,)(11224∑=-=ni i X n S μ则服从自由度为n-1的t 分布的随机变量是 (A ).1/1--=n S X t μ(B ).1/2--=n S X t μ(C )./3nS X t μ-=(D )./4nS X t μ-=[ ]例6.5:设总体X ~N (0,12),从总体中取一个容量为6的样本),,,(621X X X ,设26542321)()(X X X X X X Y +++++=,试确定常数C ,使随机变量CY 服从2χ分布。
第四节 历年真题数学一:1(98,4分) 从正态总体)6,4.3(2N 中抽取容量为n 的样本,如果要求其样本均值位于区间(1.4, 5.4)内的概率不小于0.95,问样本容量n 至少应取多大? [附表]:dt eZ t Z2221)(-∞-⎰=Φπ990.0975.0950.0900.0)(33.296.1645.128.1Z Z Φ2(01,7分) 设总体)0)(,(~2>σσμN X ,从该总体中抽取简单随机样本)2(,,,221≥n X X X n ,其样本的均值∑==ni i X n X 21,21求统计量∑=+-+=ni i n i X X X Y 12)2(的数学期望E (Y )。
第六章 样本及抽样分布1.[一] 在总体N (52,6.32)中随机抽一容量为36的样本,求样本均值X 落在50.8到53.8之间的概率。
解:8293.0)78()712(}63.68.163.65263.62.1{}8.538.50{),363.6,52(~2=-Φ-Φ=<-<-=<<X P X P N X2.[二] 在总体N (12,4)中随机抽一容量为5的样本X 1,X 2,X 3,X 4,X 5. (1)求样本均值与总体平均值之差的绝对值大于1的概率。
(2)求概率P {max (X 1,X 2,X 3,X 4,X 5)>15}. (3)求概率P {min (X 1,X 2,X 3,X 4,X 5)>10}.解:(1)⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=>-25541225415412}112{|X P X P X P=2628.0)]25(1[2=Φ- (2)P {max (X 1,X 2,X 3,X 4,X 5)>15}=1-P {max (X 1,X 2,X 3,X 4,X 5)≤15} =.2923.0)]21215([1}15{1551=-Φ-=≤-∏=i i X P (3)P {min (X 1,X 2,X 3,X 4,X 5)<10}=1- P {min (X 1,X 2,X 3,X 4,X 5)≥10} =.5785.0)]1([1)]21210(1[1}10{15551=Φ-=-Φ--=≥-∏=i iXP 4.[四] 设X 1,X 2…,X 10为N (0,0.32)的一个样本,求}.44.1{1012>∑=i iXP解:)5(1.0}163.0{}44.1{),10(~3.0101221012221012查表=>=>∑∑∑===i i i i i i X P X P χX7.设X 1,X 2,…,X n 是来自泊松分布π (λ )的一个样本,X ,S 2分别为样本均值和样本方差,求E (X ), D (X ), E (S 2 ).解:由X ~π (λ )知E (X )= λ ,λ=)(X D∴E (X )=E (X )= λ, D (X )=.)()(,)(2λX D S E nλn X D === [六] 设总体X~b (1,p),X 1,X 2,…,X n 是来自X 的样本。
Ch 6 数理统计的基本概念§6.1 基本概念 一、总体与样本1、总体——研究对象的全体,记为X 。
2、个体——构成总体的每一个对象,记为i X 。
3、总体容量——总体中包含的个体的个数。
有限总体——容量有限;无限总体——容量无限。
为推断总体X 的分布,从总体中抽取n 个个体,则对应n 个r.v.n X X X .....2,1——来自于总体X 的一个样本。
n X X X ......,21的取值((n x x x ,.....,21)--观测结果)称为样本的观测值,简称为样本值,整个抽取过程称之为抽样。
抽取的目的是根据样本的取值情况推断总体情况,因此应尽可能的使抽取的样本能反映总体的状况,故要求抽取的样本具有以下性质:文档收集自网络,仅用于个人学习⑴ 代表性:样本中每个r.v.i X 与总体X 具有相同的分布。
文档收集自网络,仅用于个人学习⑵ 独立性:n X X X ......,21相互独立。
——简单的随机抽样所得的样本称为简单的随机样本;若总体X 的分布函数为F (x ),则样本n X X X .....2,1的联合分布函数)().....,(121*i ni n x F x x x F =∏=。
文档收集自网络,仅用于个人学习若X 为连续型,且d.f 为f(x),且联合p.d.f 为:)()....,(121*i ni n x f x x x f =∏= 若X 为离散型,且分布律为:....2,1,)(===k p x X P k k 则联合分布律:in i i in n i i p p p x X x X x X P ....).....,(212211⋅⋅====。
...2,1.....3,2,1=in i i i 二、统计量Def:不含有任何未知数的关于样本空本空间的函数称为统计量。
e.g.1 设总体X~),(2σμN ,其中2,σμ未知,(n X X X .....2,1)为取自总体X 的一个样本,则:∑∑==--==n i i n i i X X n S X n X 1221)(11,1均为统计量。