概率统计简明教程 第六章 数理统计的基础知识
- 格式:doc
- 大小:2.01 MB
- 文档页数:38
概率论与数理统计各章重点知识整理 第一章 概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现. 样本空间S: E 的所有可能结果组成的集合. 样本点(基本事件):E 的每个结果. 随机事件(事件):样本空间S 的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(Φ):每次试验中一定不会发生的事件. 二. 事件间的关系和运算1.A ⊂B(事件B 包含事件A )事件A 发生必然导致事件B 发生.2.A ∪B(和事件)事件A 与B 至少有一个发生.3. A ∩B=AB(积事件)事件A 与B 同时发生.4. A -B(差事件)事件A 发生而B 不发生.5. AB=Φ (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=Φ且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德•摩根律 B A B A I Y = B A B A Y I = 三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率. (1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+… 2.性质(1) P(Φ) = 0 , 注意: A 为不可能事件P(A)=0 .(2)有限可加性 对于n 个两两互不相容的事件A 1,A 2,…,A n ,P(A 1∪A 2∪…∪A n )=P(A 1)+P(A 2)+…+P(A n ) (有限可加性与可列可加性合称加法定理) (3)若A ⊂B, 则P(A)≤P(B), P(B -A)=P(B)-P(A) . (4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理 对于任意二事件A,B ,P(A ∪B)=P(A)+P(B)-P(AB) . 对于任意n 个事件A 1,A 2,…,A n()()()()+∑+∑-∑=≤<<≤≤<≤=nk j i k j i nj i j i ni i n A A A P A A P A P A A A P 11121Y ΛY Y…+(-1)n-1P(A 1A 2…A n )四.等可能(古典)概型1.定义 如果试验E 满足:(1)样本空间的元素只有有限个,即S={e 1,e 2,…,e n };(2)每一个基本事件的概率相等,即P(e 1)=P(e 2)=…= P(e n ).则称试验E 所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k 是A 中包含的基本事件数, n 是S 中包含的基本事件总数. 五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0).P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0) 3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S) ,则 当P(B i )>0时,当P(A)>0, P(B i )>0时,. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件. (1)两个事件A,B 相互独立⇔ P(B)= P (B|A) .2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.3.n 个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()kki i i i i i A P A P A P A A A P ΛΛ2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x 2). (3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1). 二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为: (1)非负性 0≤P k ≤1 ; (2)归一性 11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=x k (k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()kn k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1)(3))X~π(λ)参数为λ的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (λ>0)三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数).2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(x x dx x f ; (4)若f (x)在点x 处连续,则f (x)=F / (x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 . 3.三种重要的连续型随机变量的分布(1)X ~U (a,b) 区间(a,b)上的均匀分布 ⎩⎨⎧=-0)(1a b x f 其它b x a << .(2)X 服从参数为θ的指数分布.()⎩⎨⎧=-0/1θθx ex f 00≤>x x 若若 (θ>0).(3)X~N (μ,σ2 )参数为μ,σ的正态分布 222)(21)(σμσπ--=x e x f -∞<x<∞, σ>0.特别, μ=0, σ2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--xt dt e x 2221)(π, Φ(-x)=1-Φ(x) .若X ~N ((μ,σ2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z α}= P{Z<-z α}= P{|Z|>z α/2}= α,则点z α,-z α, ±z α/ 2分别称为标准正态分布的上,下,双侧α分位点. 注意:Φ(z α)=1-α , z 1- α= -z α. 四.随机变量X 的函数Y= g (X)的分布 1.离散型随机变量的函数若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律. 2.连续型随机变量的函数若X 的概率密度为f X (x),则求其函数Y=g(X)的概率密度f Y (y)常用两种方法: (1)分布函数法 先求Y 的分布函数F Y (y)=P{Y ≤y}=P{g(X)≤y}=()()dx x f ky X k∑⎰∆其中Δk (y)是与g(X)≤y 对应的X 的可能值x 所在的区间(可能不只一个),然后对y 求导即得f Y (y)=F Y /(y) .(2)公式法 若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为 ()()()()⎩⎨⎧'=0y h y h f y f X Y 其它βα<<y其中h(y)是g(x)的反函数 , α= min (g (-∞),g (∞)) β= max (g (-∞),g (∞)) .如果f (x)在有限区间[a,b]以外等于零,则 α= min (g (a),g (b)) β= max (g (a),g (b)) .第三章 二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义 若X 和Y 是定义在样本空间S 上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X ≤x,Y ≤y}称为(X,Y)的(X 和Y 的联合)分布函数. 2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- ∞)=0, F(-∞,y)=0, F(-∞,-∞)=0, F(∞,∞)=1 .(3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) . (4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 .(2)归一性 ∑∑=i jij p 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x yy ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-y xdudv v u f ),( 则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度. 2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f .(3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2(4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<∞}= F (x , ∞) . (X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<∞, Y ≤y}= F (∞,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }= ∑∞=1j ij p = p i · ( i =1,2,…) 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }= ∑∞=1i ij p = p ·j ( j =1,2,…) 归一性 11=∑∞=•j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X 关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dy y f Y五.相互独立的随机变量1.定义 若对一切实数x,y,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j = p i ··p ·j ( i ,j =1,2,…)对一切x i ,y j 成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立. 六.条件分布1.二维离散型随机变量的条件分布定义 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称P{X=x i |Y=y j } 为在Y= y j 条件下随机变量X 的条件分布律. 同样,对于固定的i,若P{X=x i }>0,则称 P{Y=y j |X=x i }为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X 离散型随机变量连续型随机变量分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛)⎰∞∞-dx x xf )((积分绝对收敛)方差D(X)=E{[X-E(X)]2} []∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2=E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛),}{},{jji j j i p p y Y P y Y x X P •=====,}{},{•=====i j i i j i p p x X P y Y x X P函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差σ(X)=√D(X) . 二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .2.X,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X) 1.X~ (0-1)分布P{X=1}= p (0<p<1) p p (1- p) 2.X~ b (n,p) (0<p<1) n pn p (1- p)3.X~ π(λ) λ λ4.X~ U(a,b) (a+b)/2 (b-a) 2/125.X 服从参数为θ的指数分布 θ θ26.X~ N (μ,σ2) μ σ2 四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,… 随机变量X 的k 阶中心矩E{[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如:样本均值∑==n i i X n X 11 样本方差()∑--==n i iX X n S 12211 样本标准差S 样本k 阶矩∑==n i k i k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==ni k i k X X n B 1)(1( k=1,2,…)二.抽样分布 即统计量的分布1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n . 特别,若X~ N (μ,σ2 ) ,则X ~ N (μ, σ2 /n) .2.χ2分布 (1)定义 若X ~N (0,1) ,则Y =∑=ni i X 12~ χ2(n)自由度为n 的χ2分布.(2)性质 ①若Y~ χ2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ χ2(n 1) Y 2~ χ2(n 2) ,则Y 1+Y 2~ χ2(n 1 + n 2). ③若X~ N (μ,σ2 ), 则22)1(σS n -~ χ2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ χ2(n),0< α <1 ,则满足αχχχχαααα=<>=<=>--))}(())({()}({)}({22/122/212n Y n Y P n Y P n Y P Y 的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为χ2分布的上、下、双侧α分位点.3. t 分布(1)定义 若X~N (0,1),Y~ χ2(n),且X,Y 相互独立,则t=nY X ~t(n)自由度为n 的t 分布.(2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (μ,σ2)时, nS X μ-~ t (n-1) .③两个正态总体 相互独立的样本 样本均值 样本方差X~ N (μ1,σ12 ) 且σ12=σ22=σ2 X 1 ,X 2 ,…,X n1X S 12Y~ N (μ2,σ22 ) Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w (3)分位点 若t ~ t (n) ,0 < α<1 , 则满足αααα=>=-<=>)}({)}({)}({2/n t t P n t t P n t t P的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧α分位点. 注意: t 1- α (n) = - t α (n).4.F 分布 (1)定义 若U~χ2(n 1), V~ χ2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③)22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< α <1,则满足)},({)},({21121n n F F P n n F F P αα-<=>ααα=<>=-))},(()),({(212/1212/n n F F n n F F P Y的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧α分位点. 注意: .).(1),(12211n n F n n F αα=-第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数θ1, θ2,…, θk .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμΛΛΛ解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθΛΛΛ,以样本矩A l 取代总体矩μ l ( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A ΛΛΛθθθθθθ,若代入样本值则得到矩估计值. 2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, θ1, θ2,…, θk ),称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθΛΛ为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21Λ,称为参数θ1, θ2,…,θk 的最大似然估计值,代入样本得到最大似然估计量.若L(θ1, θ2,…, θk )关于θ1, θ2,…, θk 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iLθ (i =1,2,…,k) 求出最大似然估计. 3.估计量的标准(1) 无偏性 若E(∧θ)=θ,则估计量∧θ称为参数θ的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=μk =E(X k ),即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩μk 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= θ, 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效. (3)一致性(相合性) 若n →∞时,θθP →∧,则称估计量∧θ是参数θ的相合估计量. 二.区间估计1.求参数θ的置信水平为1-α的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,θ),其中只有一个待估参数θ未知,且其分布完全确定. (2)利用双侧α分位点找出W 的区间(a,b),使P{a<W <b}=1-α. (3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求. 2.单个正态总体待估参数 其它参数 W 及其分布 置信区间μ σ2已知 nX σμ-~N (0,1) (2/ασz n X ±) μ σ2未知 nS X μ-~ t (n-1) )1((2/-±n t n S X α σ2 μ未知 22)1(σS n -~ χ2(n-1) ))1()1(,)1()1((22/1222/2-----n Sn n S n ααχχ 3.两个正态总体 (1)均值差μ 1-μ 2其它参数 W 及其分布 置信区间已知2221,σσ22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y X σσα+±-未知22221σσσ== 212111)(n n S Y X w +---μμ~t(n 1+n 2-2) )11)2((21212n n S n n t Y X w+-+±-α 其中S w 等符号的意义见第六章二. 3 (2)③.(2) μ 1,μ 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比σ12/σ22的置信区间为))1,1(1,)1,1(1(212/12221212/2221----⋅-n n F S S n n F S S αα注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标α/2改为α,另外的下(上)限取为-∞ (∞)即可.。
概率论与数理统计期末复习重要知识点第二章知识点:1.离散型随机变量:设X 是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X 为一个离散随机变量。
2.常用离散型分布:(1)两点分布(0-1分布): 若一个随机变量X 只有两个可能取值,且其分布为12{},{}1(01)P X x p P X x p p ====-<<,则称X 服从12,x x 处参数为p 的两点分布。
两点分布的概率分布:12{},{}1(01)P X x p P X x pp ====-<<两点分布的期望:()E X p =;两点分布的方差:()(1)D X p p =-(2)二项分布:若一个随机变量X 的概率分布由式{}(1),0,1,...,.k kn k n P x k C p p k n -==-=给出,则称X 服从参数为n,p 的二项分布。
记为X~b(n,p)(或B(n,p)).两点分布的概率分布:{}(1),0,1,...,.k k n kn P x k C p p k n -==-= 二项分布的期望:()E X np =;二项分布的方差:()(1)D X np p =-(3)泊松分布:若一个随机变量X 的概率分布为{},0,0,1,2,...!kP X k ek k λλλ-==>=,则称X 服从参数为λ的泊松分布,记为X~P (λ)泊松分布的概率分布:{},0,0,1,2,...!kP X k ek k λλλ-==>=泊松分布的期望:()E X λ=;泊松分布的方差:()D X λ=4.连续型随机变量:如果对随机变量X 的分布函数F(x),存在非负可积函数()f x ,使得对于任意实数x ,有(){}()xF x P X x f t dt-∞=≤=⎰,则称X 为连续型随机变量,称()f x 为X 的概率密度函数,简称为概率密度函数。
5.常用的连续型分布: (1)均匀分布:若连续型随机变量X 的概率密度为⎪⎩⎪⎨⎧<<-=其它,0,1)(bx a a b x f ,则称X 在区间(a,b )上服从均匀分布,记为X~U(a,b)均匀分布的概率密度:⎪⎩⎪⎨⎧<<-=其它,0,1)(b x a a b x f 均匀分布的期望:()2a bE X +=;均匀分布的方差:2()()12b a D X -= (2)指数分布:若连续型随机变量X 的概率密度为00()0xe xf x λλλ-⎧>>=⎨⎩,则称X 服从参数为λ的指数分布,记为X~e (λ)指数分布的概率密度:00()0xe xf x λλλ-⎧>>=⎨⎩指数分布的期望:1()E X λ=;指数分布的方差:21()D X λ=(3)正态分布:若连续型随机变量X的概率密度为22()2()x f x x μσ--=-∞<<+∞则称X 服从参数为μ和2σ的正态分布,记为X~N(μ,2σ)正态分布的概率密度:22()2()x f x x μσ--=-∞<<+∞正态分布的期望:()E X μ=;正态分布的方差:2()D X σ=(4)标准正态分布:20,1μσ==,2222()()x t xx x e dtϕφ---∞=标准正态分布表的使用: (1)()1()x x x φφ<=--(2)~(0,1){}{}{}{}()()X N P a x b P a x b P a x b P a x b b a φφ<≤=≤≤=≤<=<<=-(3)2~(,),~(0,1),X X N Y N μμσσ-=故(){}{}()X x x F x P X x P μμμφσσσ---=≤=≤={}{}()()a b b a P a X b P Y μμμμφφσσσσ----<≤=≤≤=-定理1: 设X~N(μ,2σ),则~(0,1)X Y N μσ-=6.随机变量的分布函数: 设X 是一个随机变量,称(){}F x P X x =≤为X 的分布函数。
数学概率论与数理统计的基础知识概率论和数理统计是数学中的重要分支,它们研究了随机事件的发生规律以及通过对数据进行统计分析来了解事物的规律性。
本文将介绍数学概率论与数理统计的基础知识,帮助读者了解这两个领域的重要概念和方法。
一、概率论的基础知识1. 随机试验和样本空间随机试验是在相同条件下具有不确定性的实验,其结果不能事先预知。
样本空间是随机试验所有可能结果的集合。
2. 事件和概率事件是样本空间的子集,表示一些感兴趣的结果。
概率是事件发生的可能性大小的度量,介于0和1之间。
3. 古典概型古典概型是指具有有限样本空间且样本点等可能出现的随机试验。
在古典概型中,事件的概率可以通过样本点的数目来计算。
4. 条件概率条件概率是指事件B在另一个事件A已经发生的条件下发生的概率,表示为P(B|A)。
条件概率的计算可以使用“乘法规则”。
5. 独立事件事件A和B称为独立事件,如果事件A的发生不会对事件B的发生产生影响。
独立事件的概率计算可以使用“乘法规则”。
二、数理统计的基础知识1. 总体和样本总体是指研究对象的全体,而样本是从总体中选取的一部分个体。
统计学中,我们通常通过对样本的统计分析来推断总体的特征。
2. 随机变量和概率分布随机变量是取值具有随机性的变量,可以是离散的或连续的。
概率分布描述了随机变量各个取值的概率。
3. 参数和统计量参数是总体的特征指标,统计量是样本的特征指标。
通过样本统计量的计算,我们可以对总体参数进行估计。
4. 抽样分布和中心极限定理抽样分布是指统计量的分布,它反映了统计量的随机性。
中心极限定理表明,当样本容量足够大时,样本均值的抽样分布近似服从正态分布。
5. 置信区间和假设检验置信区间用于对总体参数进行估计,假设检验用于对总体参数的假设进行推断。
通过置信区间和假设检验,我们可以对统计结论进行推断和验证。
三、应用案例概率论和数理统计在各个领域都有广泛的应用。
例如,金融领域中的风险评估和投资决策,医学领域中的临床试验和流行病学研究,工程领域中的质量控制和可靠性分析等等。
第六章6.4 在例6.2.3 中, 设每箱装n 瓶洗净剂. 若想要n 瓶灌装量的平均阻值与标定值相差不超 过0.3毫升的概率近似为95%, 请问n 至少应该等于多少? 解:因为1)3.0(2)/3.0|/(|)3.0|(|-Φ≈<-=<-n nnX P X P σσμμ依题意有,95.01)3.0(2=-Φn ,即)96.1(975.0)3.0(Φ==Φn于是 96.13.0=n ,解之得 7.42=n 所以n 应至少等于43.6.5 假设某种类型的电阻器的阻值服从均值 μ=200 欧姆, 标准差σ=10 欧姆的分布, 在一个电子线路中使用了25个这样的电阻.(1) 求这25个电阻平均阻值落在199 到202 欧姆之间的概率; (2) 求这25个电阻总阻值不超过5100 欧姆的概率. 解:由抽样分布定理,知nX /σμ-近似服从标准正态分布N (0,1),因此(1) )25/10200199()25/10200202()202199(-Φ--Φ≈≤≤X P)5.0(1)1()5.0()1(Φ+-Φ=-Φ-Φ=5328.06915.018413.0=+-= (2) )204()255100()5100(≤=≤=≤X P X P X n P 9772.0)2()25/10200204(=Φ=-Φ≈6。
8 设总体X ~N (150,252), 现在从中抽取样本大小为25的样本, {140147.5}P X ≤≤。
解: 已知150=μ,25=σ,25=n ,)25/25150140()25/251505.147()5.147140(-Φ--Φ≈≤≤X P)5.0()2()2()5.0(Φ-Φ=-Φ--Φ= 2857.09615.09772.0=-=第六章《样本与统计量》定理、公式、公理小结及补充:。
概率论与数理统计第六章总结概率论与数理统计是数理学科中的重要分支,其应用广泛,涉及到许多领域,如工程、物理、自然科学、医学、经济学等等。
第六章主要讲述了离散型随机变量的概率分布、期望值、方差及其应用。
首先我们了解到离散型随机变量是指取值有限或者可以无限但是可以和自然数一一对应的随机变量,即不连续的随机变量。
其中概率分布的概念是很重要的,它告诉我们每种随机变量取值的可能性大小,从而可以计算一些重要的数值。
比如期望值,期望值是随机变量取值的平均值,它可以用概率分布函数计算得到。
期望值可以给我们一个随机变量所处于某个状态的平均位置,或者它对某个事件发生的平均贡献。
方差也是一个非常重要的概念,它是随机变量值与其期望值之差的平方的期望值。
方差表示了随机变量的分布范围,也就是它们取值的变化程度。
方差越大,代表随机变量距离其期望值越远,该随机变量取值的范围也相应较大。
求期望值和方差的过程中有一些公式会显著提高计算效率,比如线性变换的公式、缩放变换的公式、Chebyshev不等式等等。
这些公式的应用有助于简化计算,并且能帮助我们更容易地理解问题。
我们还讨论了一些常见离散型随机变量的概率分布,比如伯努利分布、二项分布、泊松分布等等。
这些分布的出现在实际问题中都有着很重要的意义,比如伯努利分布描述了实验只有两种可能结果的概率分布,比如是/否、头/尾等等。
而二项分布则描述了实验中成功的概率和试验次数的关系,给我们解决实际问题提供了基础。
除了离散型随机变量,我们还可以研究连续型随机变量的概率分布以及相应的数学理论。
这些知识在实际应用中也具有重要意义。
比如在统计财务账目时,需要研究一些连续型随机变量的概率分布,以便预测下一期客户付款时间的分布情况。
又比如在流量预测中,需要研究一些连续型随机变量的概率分布,以便预测某个时间段内的网络流量。
总之,离散型随机变量理论是概率论的核心内容,对于理解整个概率论课程和进行实际应用都有着重要的意义。
概率论与数理统计第六章总结一、概述在概率论与数理统计的第六章中,主要介绍了随机变量的概率分布以及常见的概率分布模型。
本章内容是概率论与数理统计的重点和难点之一,对于理解和应用概率统计的基本理论和方法具有重要意义。
二、随机变量的概率分布1. 随机变量及其概率分布的概念•随机变量是对随机试验结果的数值化描述,它的取值不仅依赖于随机试验的结果,还受到机会因素的影响。
•概率分布描述了随机变量可能取值的概率大小。
常用的概率分布有离散型和连续型两种。
2. 离散型随机变量及其概率分布•离散型随机变量的取值是有限或可列的,它的概率分布可以用概率质量函数来描述。
•常见的离散型随机变量包括伯努利随机变量、二项分布、泊松分布等。
3. 连续型随机变量及其概率分布•连续型随机变量的取值是无限的,它的概率分布可以用概率密度函数来描述。
•常见的连续型随机变量包括均匀分布、正态分布等。
三、常见概率分布模型1. 二项分布•二项分布是指在 n 重伯努利试验中,成功的次数服从的概率分布。
其概率质量函数为二项式系数与成功概率的乘积。
•二项分布在实际应用中常用于描述成功次数的分布情况,如抽样调查中的样本中某一特征出现的次数。
2. 泊松分布•泊松分布是定义在非负整数集上的概率分布,它描述了在一段时间或空间内事件发生的次数。
其概率质量函数为事件发生率与时间(或空间)长度的乘积。
•泊松分布常用于描述罕见事件发生的次数,如单位时间内电话呼叫次数、一段时间内事故发生次数等。
3. 正态分布•正态分布是最重要的连续型概率分布模型之一,也称为高斯分布。
它的概率密度函数呈钟形曲线,对称于均值。
•正态分布在实际应用中广泛存在,如身高体重、测量误差、考试成绩等符合正态分布的情况较多。
4. 指数分布•指数分布是定义在非负实数集上的连续型概率分布,它描述了连续时间间隔或空间间隔内事件发生的情况。
其概率密度函数呈指数下降曲线。
•指数分布在实际应用中常用于描述无记忆性随机事件的发生情况,如设备失效时间、极端天气事件的间隔等。
第六章数理统计的基本概念一、内容提要数理统计学是数学的一个分支,它的任务是研究怎样用有效的方法去收集和使用带有随机性的数据,建立数学方法,去揭示所研究问题的统计规律性。
它的主要内容是由样本来推断总体。
(一)基本概率1. 总体、个体与样本:研究对象的全体称为总体,用X、Y等表示。
组成总体的每个元素称为个体或单元。
从总体中按一定的规律抽出一些个体就称为抽样,所抽及的个体称为样本,用X1,X2,…,X n表示。
一般样本容量小于50的样本称为小样本,样本容量大于等于50的样本称为大样本,但在样本不易实现时,样本容量大于30的样本可看作大样本。
包含有限个个体的总体称为有限总体,包含无限个个体的总体称为无限总体。
2. 简单随机抽样与简单随机样本:如果总体中各个个体被抽到的机会是均等的,并且在抽取一个个体后总体的成分不变,那么,抽得的一些个体就能很好地反映总体的情况,基于这种想法抽取个体的方法称为简单随机抽样。
抽得的这些个体构成一个样本,用(X1,X2,…,X n)表示,n为样本容量,X1,X2,…,X n应是n个相互独立的且与总体X同分布的随机变量,并将这种样本称为简单随机样本,简称样本。
本书所讨论的样本,如无特别声明,均指简单随机样本。
样本(X1,X2,…,X n)是n个相互独立的且与总体同分布的随机变量,而一次抽取之后,12(X 1,X 2,…,X n )又是n 个具体的数据x 1,x 2…,x n ,即样本的一组观测值,在不致引起混淆的情况下,样本和样本值都用(X 1,X 2,…,X n )表示,这就是样本的二重性。
3. 样本分布函数(或经验分布函数):设样本(X 1,X 2,…,X n )的观测值按由小到大次序排列后为:**2*1n x x x ≤≤≤Λ定义()()*1**1*0,,,,1,2,,11,.n k k n x x kF x x x x k n n x x +⎧⎪⎪=≤<=-⎨⎪⎪≥⎩p L ,为样本分布函数对于样本的不同观测值(x 1,x 2…,x n ),我们将得到不同的F n (x ),所以F n (x )是一个随机变量。
第六章数理统计的基础知识从本章开始,我们将讨论另一主题:数理统计.数理统计是研究统计工作的一般原理和方法的数学学科,它以概率论为基础,研究如何合理地获取数据资料,并根据试验和观察得到的数据,对随机现象的客观规律性作出合理的推断.本章介绍数理统计的基本概念,包括总体与样本、经验分布函数、统计量与抽样分布,并着重介绍三种常用的统计分布:2分布、t分布和F分布.§1 总体与样本1.1 总体在数理统计中,我们把所研究对象的全体称为总体,总体中的每个元素称为个体.例如,研究某班学生的身高时,该班全体学生构成总体,其中每个学生都是一个个体;又如,考察某兵工厂生产炮弹的射程,该厂生产的所有炮弹构成总体,其中每个炮弹就是一个个体.在具体问题的讨论中,我们关心的往往是研究对象的某一数量指标(例如学生的身高),它是一个随机变量,因此,总体又是指刻画研究对象某一数量指标的随机变量X.当研究的指标不止一个时,可将其分成几个总体来研究.今后,凡是提到总体就是指一个随机变量.随机变量的分布函数以及分布律(离散型)或概率密度(连续型)也称为总体的分布函数以及分布律或概率密度,并统称为总体的分布.总体中所包含的个体总数叫做总体容量.如果总体的容量是有限的,则称为有限总体;否则称为无限总体.在实际应用中,有时需要把容量很大的有限总体当做是无限总体来研究.1.2随机样本在数理统计中,总体X的分布通常是未知的,或者在形式上是已知的但含有未知参数.那么为了获得总体的分布信息,从理论上讲,需要对总体X 中的所有个体进行观察测试,但这往往是做不到的.例如,由于测试炮弹的射程试验具有破坏性,一旦我们获得每个炮弹的射程数据,这批炮弹也就全部报废了.所以,我们不可能对所有个体逐一加以观察测试,而是从总体X 中随机抽取若干个个体进行观察测试.从总体中抽取若干个个体的过程叫做抽样,抽取的若干个个体称为样本,样本中所含个体的数量称为样本容量.抽取样本是为了研究总体的性质,为了保证所抽取的样本在总体中具有代表性,抽样方法必须满足以下两个条件:(1)随机性 每次抽取时,总体中每个个体被抽到的可能性均等. (2)独立性 每次抽取是相互独立的,即每次抽取的结果既不影响其它各次抽取的结果,也不受其它各次抽取结果的影响.这种随机的、独立的抽样方法称为简单随机抽样,由此得到的样本称为简单随机样本.对于有限总体而言,有放回抽样可以得到简单随机样本,但有放回抽样使用起来不方便.在实际应用中,当总体容量N 很大而样本容量n 较小时(一般当10N n ≥时),可将不放回抽样近似当作有放回抽样来处理. 对于无限总体而言,抽取一个个体不会影响它的分布,因此,通常采取不放回抽样得到简单随机样本.以后我们所涉及到的抽样和样本都是指简单随机抽样和简单随机样本.从总体X 中抽取一个个体,就是对总体X 进行一次随机试验.重复做n 次试验后,得到了总体的一组数据12(,,,)n x x x L ,称为一个样本观测值.由于抽样的随机性和独立性,每个(1,2,,)i x i n =L 可以看作是某个随机变量(1,2,,)i X i n =L 的观测值,而(1,2,,)i X i n =L 相互独立且与总体X 具有相同的分布.习惯上称n 维随机变量12(,,,)n X X X L 为来自总体X 的简单随机样本.定义1.1 设总体X 的分布函数为()F x ,若随机变量12,,,nX X X L 相互独立,且都与总体X 具有相同的分布函数,则称12,,,n X X X L 是来自总体X 的简单随机样本,简称为样本,n 称为样本容量.在对总体X 进行一次具体的抽样并作观测之后,得到样本12,,,n X X X L 的确切数值12,,,n x x x L ,称为样本观测值,简称为样本值.若总体X 的分布函数为()F x ,12,,,n X X X L 是总体X 的容量为n的样本,则由样本的定义知,12,,,n X X X L的联合分布函数为:112*).(,,,)(ni n i FF x x x x ==∏L (1.1)若总体X 是离散型随机变量,其分布律为{}i i p P X x ==(1,2,i =L ),则12,,,n X X X L 的联合分布律为:{}1122,,,n n P X x X x X x ===L 11()nii ni i iP X x p =====∏∏. (1.2)若总体X 是连续型随机变量,其概率密度为()f x ,则12,,,n X X X L 的联合概率密度为:121*(,,,)()nn i i f x x x f x ==∏L . (1.3)例1.1 设总体X 服从正态分布2(,)N μσ,其概率密度为22()21()x f x μσ--=,x -∞<<+∞.则样本12,,,n X X X L的联合概率密度为:{}2112*1exp 1()2(,,,)ni i n x f x x x μσ=--=∏L{}22111exp()2,nniixμσ==--∑,1,2,,.ix i n-∞<<+∞=L.例 1.2设总体(,)X B N p:,12,,,nX X XL为来自总体X的样本,求12,,,nX X XL的联合分布律.解12,,,nX X XL相互独立,并且(,)iX B N p:,1,2,,i n=L.因此,iX的分布律为{}C(1),i i ix x N xi i NP X x p p-==-0,1,2,,;1,2,,ix N i n==L L所以12,,,nX X XL的联合分布律为{}1122,,,n nP X x X x X x===L{}1i iniP X x===∏111C)(1)(.in ni ii inxNix nN xp p===--∑∑=∏0,1,2,,;1,2,,.x N i ni==L L1.3经验(样本)分布函数设总体X的分布函数为()F x,从总体X中抽取容量为n的样本12,,,nX X XL,样本值为12,,,nx x xL.假设样本值12,,,nx x xL中有k 个不相同的值,按由小到大的顺序依次记作:()(1)(2)kx x x≤≤≤L,并假设()ix出现的频数为in,那么()ix出现的频率为iinfn=,1,2,,,i k k n=≤L,显然有1kii nn ==∑, 11ki i f ==∑.设函数(1)()(1)1()1,2,,1,0,,()1,,,.i n j i i j k i k x x F x f x x x x x +==-<=≤<≥⎧⎪⎪⎨⎪⎪⎩∑L (1.4)称之为总体X 的经验(样本)分布函数,其图形为一阶梯形曲线,如图1.1所示.根据经验分布函数的定义,易知()n F x 具有以下性质: (1) 0()1n F x ≤≤;(2) ()n F x 是单调不减函数;(3) ()n F x 在每个观察值()i x 处是右连续的; (4) ()0n F -∞=,()1n F +∞=.可见经验分布函数()n F x 与总体的分布函数具有相同的性质.图1.1例1.4 从总体X 中随机地抽取容量为8的样本进行观测,得到如下数据:3,2.5,2.5,3.5,3,2.7,2.5,2.求X 的经验分布函数.解 将观测数据由小到大排列为 (1)(2)(3)(4)(5)2 2.5 2.73 3.5x x x x x <<<===<== ,计算得: 118f =,238f =,318f =,428f =,518f =, 由定义知经验分布函数为802,182 2.5,482.5 2.7,()58 2.73,7833.5,13.5.x x x F x x x x <≤<≤<=≤<≤<≥⎧⎪⎪⎪⎨⎪⎪⎪⎩ 对于固定的x ,经验分布函数是依赖于样本观测值的,由于样本的抽取是随机的,因而,()n F x 也是随机的.当给定样本观测值12,,,n x x x L 时,()n F x 是在n 次独立重复试验中事件{}X x ≤发生的频率.由于总体X 的分布函数()F x 是事件{}X x ≤发生的概率,根据伯努利大数定律可知,当n →∞时,对于任意给定的正数ε,有{}lim 1()()n n P F x F x ε→∞=-<.§2 统 计 量在实际应用中,人们对总体X 的分布是毫无所知的.借助于总体X 的样本12,,,n X X X L,对总体X 的未知分布进行合理的推断,这类问题统称为统计推断问题.在利用样本对总体进行推断时,常常借助于样本的适当函数.利用这些函数所反映的总体分布的信息来对总体的所属类型,或者对总体中所含的未知参数做出统计推断.通常把这样的函数称为统计量.2.1统计量的定义定义 2.1 设12,,,n X X X L是来自总体X 的一个样本,12,,,n x x x L 是样本值,12(,,,)n X X X g L 是12,,,n X X X L 的函数.如果12(,,,)n X X X g L 中不含未知参数,则称12(,,,)n X X X g L 为统计量,而12(),,,n g x x x L 称为统计量的观测值.例2.1 设总体(1,)X B p :,{}1P x p ==,{}01P x p ==-,其中0p >为未知参数,12,,,n X X X L 为来自总体X 的一个样本,指出下列函数哪些是统计量,哪些不是统计量.①12X X +; ②{}1max i i nX ≤≤; ③2n X p +; ④21()n X X -.解 据统计量定义,统计量必须满足两个条件:(1)它是样本12,,,n X X X L 的函数,(2)它不含未知参数.在①:④中,它们都是样本12,,,n X X X L 的函数,但③含未知参数p ,所以①,②及④中的函数都是统计量,③中的函数不是统计量.2.2 常用统计量下面介绍几种常用的统计量,设12,,,n X X X L 是来自总体X 的一个样本,12,,,n x x x L是相应的样本值.1.样本均值 称 11nii XX n==∑ (2.1)为样本均值,它的观测值为11ni i x x n==∑. 若总体X 具有均值()E X μ=和方差2()0D X σ=>,则()i E X μ=,2()i D X σ= , 1,2,.i n =L由第四章例2.7,有()E X μ=,2()D X nσ=.即样本均值的数学期望等于总体的均值,样本均值的方差等于总体方差的1n倍. 2.样本方差 称22011()ni i X X nS ==-∑ (2.2)为未修正样本方差,而称222201111))111((nni i i i n X X X X n n n S S n ==---==-=-∑∑ (2.3)为修正样本方差,它们的观测值分别为:12201()ni ix x ns =-=∑,22221111(11())nni i i i nx n n s x x x ==--=-=-∑∑.若总体X 具有数学期望()E X μ=和方差2()0D X σ=>,则2121()[()]1ni iE S E XX n ==--∑1221[()]1ni i E X nX n =--=∑1221[(()]1)ni iE XnE X n =--=∑[]{}{}{}1221()()()()1n i i i D X E X n D X E X n =+-+-=⎡⎤⎣⎦∑22221()1n n nn n nσσμμ=+---2.σ=可见22()E S σ=,而220()E S σ≠,即修正样本方差的数学期望等于总体方差,而未修正样本方差的数学期望不等于总体的方差.因此,在数理统计中主要使用修正样本方差,并简称为样本方差.3.样本标准差称S==(2.4)为样本标准差,其观测值为:s==例2.2 在对总体X抽取容量为n的样本进行检测时,得到m个互不相同的样本观测值12,,,mx x xL,它们出现的频率分别为12,,,mf f fL.求样本均值、样本方差和样本标准差的观测.解设12,,,mx x xL出现的频数分别为12,,,mn n nL,显然有12mn n n n+++=L,所以111111m m mii i i i ii i iniinx n x x f xn nxn========∑∑∑∑;221211()11()miiimi iinns x xn n nn x x===----=∑∑21()1mi iinf x xn==--∑;2s== .例 2.3设总体X服从参数为λ的指数分布,即()X Eλ:,样本12,,,n X X X L 来自总体X ,求()E X ,2()E S .解 由于()λ:XE ,所以1()E X λ=, 21()D X λ=,由前面的讨论,有()()1E X E X λ==,221()()λ==E S D X .4. 样本k 阶原点矩 称11nk k ii X nA ==∑,1,2,k =L , (2.5)为样本k 阶原点矩,它的观测值为:11nk k i i na x ==∑, 1,2,k =L .显然,样本一阶原点矩就是样本均值.即1A X =.5.样本k 阶中心矩 称1()1n kB X X i k i n ∑=-=, 1,2,k =L , (2.6)为样本k 阶中心矩,它的观测值为:11)(nkk i i nb x x ==-∑, 1,2,k =L .显然,样本二阶中心矩就是未修正样本方差,即220B S =. 6.顺序统计量 设12,,,n x x x L 是样本12,,,n X X X L 的一组观测值,将它们从小到大重新排序为:(1)(2)()n x x x ≤≤≤L .记()k X 是对应于()k x 的随机变量,这样得到的(1)(2)(),,,n X X X L 称为总体X 的一组顺序统计量,称()k X 为第k 位顺序统计量,称(1)12min (,,,)n X X X X =L 和()12max (,,,)n n X X X X =L 分别为样本最小值和样本最大值.设总体X 的分布函数为()F x ,记(1)X 和()n X 的分布函数分别为min ()F x 和max ()F x ,则{}max 12()max(,,,)n F x P X X X x =≤L{}12,,,n P X x X x X x =≤≤≤L {}{}{}12n P X x P X x P X x =≤≤≤L []()nF x ={}min 12()min(,,,)n F x P X X X x =≤L{}121min(,,,)n P X X X x =->L{}{}{}121n P X x P X x P X x ->>>=L []11()nF x --=.例2.4 在总体(12,4)N 中抽出容量为5的样本12354,,,,X X X X X ,求概率{}(5)15P X >和(1){10}P X <.解 设总体X 的分布函数为()F x ,则随机变量(5)X 和(1)X 的分布函数分别为:[]5max ()()F x F x = 和[]5min ()11()F x F x =--,于是有:{}(5)(5)max 15(15)1{15}1F P X P X>=-=-≤[]551(15)1[Φ(1.5)]F =-=-0.2923=,(1)10{}P X <[]5(10)11(10)min F F =--=[]51Φ(1)=-51(0.8413)=-0.5785=.2.3 正态总体的两个常用统计量的分布统计量是一个随机变量,它的分布通常称为抽样分布.定理2.1 设12,,,n X X X L 是来自正态总体2(,)X N μσ:的样本,X 样本均值,则有2(,):N nX μσ和(0,1).X U N μ-=: (2.7)证明 由于12,,,n X X X L 相互独立并且2(,)i X N μσ:(1,2,,)i n =L ,因此,11ni iX Xn==∑也服从正态分布,而()E X μ=,2()=D X nσ,所以2(,)X N nσμ:. 将X 标准化,有(0,1).X U N μ-=:例2.5 在总体2(80,20)N 中随机抽取一容量为100的样本,求样本均值X 与总体均值之差的绝对值大于3的概率.解 由定理2.1知8080(0,1),20102X X U N --==:于是{}80380|322X P X P -->=>⎧⎫⎪⎪⎨⎬⎪⎪⎩⎭8032122X P -=-⎛⎧⎫⎫≤⎨⎬ ⎪⎝⎩⎭⎭[]21Φ(1.5)=-2(10.9332)=-0.1336= .例 2.6 设总体2(3.4,6)X N :,12,,,n X X X L 为X的样本,若要使{}1.4 5.40.95P X <<≥,问样本容量n 至少应取多大?解 由定理2.1 知3.4(0,1)X N -:,又{}{}1.4 5.4 3.42P X P X <<=-<3P =<⎪⎭2Φ1=-,所以,要使{}1.4 5.40.95PX <<≥,只需2Φ10.95-≥,1.96≥,所以35n =.定理2.2 设两个正态总体211(,)X N μσ:和222(,)Y N μσ:,分别独立地从X 和Y 中抽取样本112,,,n X X X L 和212,,,n Y Y Y L (即这两个样本(112,,,n X X X L )与(212,,,n Y Y Y L )相互独立),样本均值分别为X 和Y ,则有(0,1).()μμ---=:N X Y U (2.8)证明 由定理的条件知X 和Y 相互独立,且2111(,)X N n σμ:,2222(,)Y N n σμ:,所以22121212(,),X Y N n n σσμμ--+:从而()(0,1)X Y U N μμ---=:.例2.7 设总体(20,3)X N :,从X 中独立地抽取两个容量分别为10和15的样本1210,,,X X X L 和1215,,,Y Y Y L ,样本均值分别为X 和Y ,求{}0.3P X Y ->.解 由于1210,,,X X X L 和1215,,,Y Y Y L 相互独立且都与总体X的分布相同,因此3(20,)10X N :,3(20,)15Y N :于是(0,0.5)-:X Y N ,所以{}0.30.3->=>⎫P X YP 0.31P =-⎫≤0.321Φ=-⎡⎤⎢⎥⎣⎦2(10.6628)=-0.6744=.§3 2χ分布数理统计研究的对象,大部分问题与正态分布有关.从本节开始我们介绍三个在数理统计中常用的来自正态总体的统计量.3.1 2χ分布的概念定义 3.1 设12,,,n X X X L 是来自标准正态总体(0,1)N 的样本,称随机变量222212n X X X χ=+++L (3.1)服从自由度为n 的2χ分布,记作22()n χχ:.这里自由度n 是(3.1)式右端所包含的独立变量的个数. 可以证明,若22()n χχ:,则2χ的概率密度为:12220()2(2)001,,.nxn x e x f x n x -->Γ≤=⎧⎪⎨⎪⎩(3.2)其中()2nΓ是Γ函数10()d x tx t e t +∞--Γ=⎰在2nx =处的值. 2()n χ分布的概率密度()f x 的图像如图3.1所示.图3.1 2()n χ分布的概率密度3.2 2χ分布的性质性质1 若22()n χχ:,则2()E n χ=,2()2D n χ=. (3.3) 证明 由于122==∑ni iXχ,其中(0,1)i X N : (1,2,,)i n =L ,12,,,n X X X L 相互独立,且()0i E X =,()1i D X =,所以22()()[()]1=+=E X D X E X i i i ,1,2,,i n =L ,因此122()()ni i E E X n χ===∑.又244421()()d d 3xi E X x x x x e x ϕ+∞+∞-∞-∞-===⎰⎰ ,[]2242()()()312i i i D X E X E X =-=-= ,1,2,,i n =L .所以122()()2ni i D D X n χ===∑.性质2 若2211()n χχ:,2222()n χχ:,且21χ和22χ相互独立,则2221212()n n χχχ++:. (3.4)证明 设1212,,,n n X X X +L 相互独立且都服从(0,1)N .由于2211()n χχ:,2222()n χχ:,所以21χ与122212n X X X +++L 同分布,22χ与111222212n n n n X X X ++++++L 同分布.再由21χ与22χ相互独立,知2212χχ+与1222122n n X X X ++++L 同分布,所以2221212()n n χχχ++: .性质2可以推广到有限个2χ分布的情形. 性质3 设22()n χχ:,则对任意实数x ,有2221lim d n txn P x t e χ→∞--∞-≤=⎫⎬⎭⎰. (3.5)证明 由于22()n χχ:,所以有12,,,n X X X L 相互独立且都服从(0,1)N ,使得222212n X X X χ=+++L .显然22(1)(1,2,)i X i n χ=:L ,即2i X 独立同分布且 2()1i E X =,2()2i D X =,1,2,,i n =L ,由独立同分布的中心极限定理,有22221lim lim }d n n ntxin n P x P x tX e χ→∞→∞--∞--≤≤=⎧⎫⎪⎪=⎬⎪⎩⎭∑⎰.性质3说明,当n2nχ-近似服从(0,1)N ,也就是说2χ近似服从正态分布(,2)N n n .例 3.1 设1234,,,X X X X 是来自总体(0,4)X N :的一个样本,问当,a b 为何值时,2221234(2)(34)()Y a X X b X X n χ=-+-:,并确定n 的值.解 由于1234,,,X X X X 独立同分布于(0,4)N ,所以12(2)0E X X -= ,34(34)0E X X -=, 21212(2)()(2)()20D X X D X D X -=+-= 223434(34)3()(4)()100D X X D X D X -=+-=于是2(0,1)X X N -:,3434(0,1)10X X N -:,而且122X X -与3434X X -相互独立,所以2223412(34)(2)(2)20100X X X X χ--+:从而120a =,1100b =,2n = .3.3 2χ分布的上α分位点定义3.2 设22()n χχ:,对于给定的正数(01)αα<<,称满足条件22{()}P n αχχ>=2()()d n f x x αχα+∞=⎰(3.6)的点2()n αχ为2()n χ分布的上α分位点 (如图3.2所示).图3.2 2()n χ分布的上α分位点在书末附表4中,对于确定的α与n ,给出了查找2()n αχ的表.例如0.01α=,10n =,查附表4,有20.01(10)23.209χ= .3.4 关于2χ分布的两个定理定理3.1 设12,,,n X X X L 是来自总体2(,)X N μσ:的一个样本,则随机变量12221()()ni i X n μχσ=-∑: . (3.7)证明 由于12,,,n X X X L 相互独立且都服从2(,)N μσ分布,所以12,,,n X X X μμμσσσ---L 也相互独立且都服从(0,1)N 分布,据定义3.11122221()()()nni i i i X X n μμχσσ==--=∑∑:.定理3.2 设12,,,n X X X L是来自总体2(,)X N μσ:的一个样本,X 和2S 分别是样本均值和样本方差,则有(1)222(1)(1)n Sn χσ--: ; (3.8)(2)X 与2S 相互独立. (3.9) 定理3.2的证明从略.例3.2 从正态总体2(,0.5)N μ中抽取样本1210,,,X X X L .(1)已知0μ=,求概率{}10124i i PX =≥∑;(2)若μ末知,求概率{}10210.675()i i X X P=≥-∑.解 (1)由于总体2(0,0.5)X N :,由定理3.1知10222211(10).0.5ii Xχχ==∑:查2χ分布表,有{}10124i i PX =≥∑{}102212140.50.5ii PX==≥∑216{}P χ=≥0.10≈.(2) 当μ未知时,由定理3.2 知10222212221(1)(1)(9)0.5()i iXX n Sn χχχσ=--=-==∑:,于是{}1021)0.675(i i PX X =≥-∑{}10222110.6750.50.5()ii XX P==-≥∑{}2(9) 2.700P χ=≥.查2χ分布表,有 20.975(9) 2.700χ=,于是{}10210.675()i i X X P=≥-∑0.975=例3.3 在总体2(,)N μσ中抽取容量为16的样本,2S 为样本方差,求2()D S .解 由定理3.2知222(1)(1)n Sn χσ--:,又由2χ分布的性质1,有22(1)2(1)n S D n σ-=-⎡⎤⎢⎥⎣⎦, 所以22224(1)(1)()2(1)n S n D D S n σσ--==-⎡⎤⎢⎥⎣⎦,即42422()115D S n σσ==-.§4 t 分布4.1 t 分布的概念定义4.1 设(0,1)X N :,2()Y n χ:,且X 和Y 相互独立,称随机变量X t =(4.1)服从自由度为n 的t 分布,记作()n t t :.t 分布又称学生氏(Student )分布.可以证明,()t n 分布的概率密度为:1221()2()(1)()2n n xf x nn+-+Γ+=,x -∞<<+∞ (4.2)并且当n →∞时,()t n 分布的概率密度趋于标准正态分布的概率密度,即有221()lim xn f x -→∞=, x -∞<<+∞.()f x 图像如图4.1所示,可以看出,()f x 的图像关于纵轴对称,并且()f x 曲线的峰顶比标准正态曲线峰顶要低,两端较标准正态曲线要高.此外,可以证明,()0(1)E t n => , ()(2)2n D t n n =>-. (4.3)图 4.1 ()t n 分布的概率密度例 4.1 设总体X 和Y 相互独立且都服从2(0,3)N 分布,而样本129,,,X X X L 和129,,,Y Y Y L 分别来自X 和Y ,求统计量222129X T Y X X Y Y =++++++L L的分布.解 由于911(0,1)9ii X X N ==∑:,(0,1)3i Y N : ,1,2,,9i =L ,99221121(9)39()i i i iY Y Y χ====∑∑:,并且X 和Y 相互独立,由t 分布的定义知9(9)iX T Xt ==∑:.4.2 t 分布的上α分位点定义4.2 设()n t t :,对于给定的正数(01)αα<<,称满足条件{}()()d ()t n Pf x x t tn ααα+∞=>=⎰(4.4)的点()t n α为()n t 分布的上α分位点.图4.2给出了()n t 分布的上α分位点()n t α,由t 分布概率密度()f x 图形的对称性可知1()()n n t t αα-=-.图4.2 ()n t 分布的上α分位点.书末附表5给出了()n t 分布上α分位点()n t α的数值表,例如0.025(8) 2.3060t =,0.9910.01(12)(12)t t -=0.01(12)t =- 2.6810=-.当n 较大(通常45n >)时,()n t α可以由标准正态分布的上α分位点u α来近似代替.4.3 关于t 分布的两个定理定理 4.1 设总体2(,)X N μσ:,12,,,n X X X L 是来自总体X 的样本,样本均值和样本方差分别为X 和2S ,则随机变量(1).-=-:X T t n Snμ (4.5)证明 由定理2.1知(0,1),-=:X U N nμσ再由定理3.2 知X 与2S 相互独立,并且2221(1),-=-:n V S n χσ根据t 分布的定义)(1).--==-=:X U X T t n μμ例4.2设总体X 服从正态分布2(,)N μσ,从总体X 中抽取样本112,,,n X X X L .记1,1n n X X i i n ∑== ,12()11n S X X n n i i n ∑=-=-,证明统计量(1).t n -:证明 由于1X n +与X n 相互独立,且2(,)1+:X N n μσ, 2(,):X N n nσμ, 所以12(0,)1n X X N n n nσ+-+:. 将随机变量1X X n n -+标准化,可得(0,1).X X u N -==:据定理3.2可知X n 与2n S 相互独立,且2222(1)(1).nn S n χχσ-=-:由1X n +与2n S 相互独立,知u 与2χ相互独立,据t 分布的定义(1).ut n ==-:定理4.2 设两个正态总体21(,)X N μσ:和22(,)Y N μσ:,分别独 立地从X 和Y 中抽取样本,样本容量分别为1n 和2n ,样本均值分别为X 和Y ,样本方差分别为21S 和22S ,记222112212(1)(1)2w n n n n S S S ---+=+,则随机变量12()()(2).---=+-:X Y T t n n μμ(4.6)证明 由定理2.2知()()(0,1)X Y N μμ---:,又由定理3.2知221112(1)(1)n S n χσ--:,222222(1)(1)n S n χσ--:,且2112(1)n S σ-与2222(1)n S σ-相互独立,根据2χ分布的可加性,有22211221222(1)(1)(2)n S n S n n χσσ--++-:,所以由t 分布的定义,有12()(2)X Y T t n n μμ---=+-:.§5 F 分布5.1 F 分布的概念定义 5.1 设21()X n χ:,22()Y n χ:,且X 和Y 相互独立,称随机变量12X n F Y n =(5.1)服从自由度为12(,)n n 的F 分布,记为12(,)F F n n :.可以证明,12(,)F n n 分布的概率密度为:111211122222(()2)12()(1)0,()(2)(2)120,0.,n n n n n n n n x x x f x n n n n x +--Γ++>=ΓΓ≤⎧⎪⎨⎪⎩(5.2)其图像如图5.1所示.此外,可以证明,若12(,)F F n n :,则222()(2)2n E F n n =>- , (5.3)221222122(224)()(4)(2)(4)n n n D F n n n n +-=>--. (5.4)图5.1 12(,)F n n 分布的概率密度例5.1 已知()t t n :,求2t 的分布.解 由t 分布定义可知,随机变量U 与V 相互独立,使得U t V n=其中 (0,1)U N :,2()V n χ:. 而2221UU t V nV n==,并且22(1)U χ:, 所以由F 分布的定义知22(1,)Ut F n V n=:.即2t 服从自由度为(1,)n 的F 分布.5.2 F 分布的上α分位点定义5.2 设12(,)F F n n :,对于给定的正数(01)αα<<,称满足条件{}21212(,)()d (,)F n n P FF f x x n n αα+∞=>=⎰(5.5)的点12(,)F n n α为12(,)F n n 分布的上α分位点. 图5.2给出了12(,)F n n 分布的上α分位点12(,)F n n α.图5.2 F 分布的上α分位点12(,)F n n α若12(,)F F n n :,则由F 分布的定义知211(,)F n n F:,从而,我们有112211(,)(,)F n n F n n αα-=. (5.6)事实上,对于给定的(01)αα<<,有 112112111{(,)}{}(,)P F F n n P F F n n ααα---=>=< 112111{}(,)P F F n n α-=-≥, 于是11211{}(,)P F F n n αα->=, 由于211(,)F n n F:,因此,1121(,)F n n α-就是21(,)F n n 的上α分位点21(,)F n n α,即112211(,)(,)F n n F n n αα-=.书后附表6给出了12(,)F n n 分布的上α分位点的数值表,例如0.05(8,9) 3.23F =,0.950.0511(15,12)0.403(12,15)2.48F F ===.5.3 关于F 分布的两个定理定理5.1 设两个正态总体211(,)X N μσ:和222(,)Y N μσ:,分别独立地从X 和Y 中抽取样本112,,,n X X X L 和212,,,n Y Y Y L ,则随机变量1222212211222112212112(,)()()n i n ii i X n n F F n n n n Y μσχσχμ===⋅⋅-=-∑∑: (5.7)证明 由定理3.1知 121111221()(),=-=∑:n i i X n μχσχ 222221222()(),=-=∑:n i i Y n μχχσ并且两个样本112,,,n X X X L 和212,,,n Y Y Y L 相互独立,所以,由F 分布的定义,有1221221221112122(,).()()===⋅⋅--∑∑:i n ii n i n F F n n n X Y σσμμ定理 5.2 设两个正态总体211(,)X N μσ:和222(,)Y N μσ:,分别独立地从X 和Y 中抽取样本,样本容量分别为1n 和2n ,样本均值分别为X 和Y ,样本方差分别为21S 和22S ,则随机变量2221122212(1,1).=--g:S F F n n S σσ (5.8)证明 由定理3.2知222111121(1)(1),-=-:n S n χχσ222222222(1)(1),-=-:n S n χχσ并且21χ和22χ相互独立,由F 分布的定义知21222111222221221(1,1).1-==---g:S n F F n n S n χσχσ例 5.2 设128,,...,X X X 是来自总体(,20)X N μ:的一个样本,1210,,...,Y Y Y 是来自总体(,33)Y N μ:的一个样本,21S 和22S 是各自的样本方差,并且总体X 和Y 相互独立,,求{}22122P S S ≥.解 由定理5.2知222211222122,33(79),20==gg:S S F F S S σσ所以{}2221122222S P S S P S ≥=≥⎧⎫⎨⎬⎩⎭2122333322020S P S =≥⨯⎧⎫⎨⎬⎩⎭g {}3.3.=≥P F 查F 分布表知{}221220.05.≥=P S S习 题 六(A )1.设128,,...,X X X 是来自服从(0,)θ 上均匀分布的总体的随机样本,0θ>为未知参数,求样本的概率密度.2. 设总体X 服从参数为λ的泊松分布,求样本12,,...,n X X X 的分布律.3. 若总体2(,)X N μσ:,其中2σ已知,但μ末知,而12,,,nX X X L 为X 的样本,指出下列量中哪些是统计量,哪些不是统计量.(1)11ni i X n=∑ ;(2)211()ni i X nμ=-∑ ;(3)2111()ni i X X n =--∑ ;(4;(5; (65X -4. 总体X 的一组容量为10的样本观测值为:0,0.2,0.25,0.3-,0.1-,2,0.15,1,0.7-,1-,求经验分布函数10()F x .5. 来自总体X 的一组样本观测值为:求样本均值X ,样本方差2S 和样本标准差S .6. 在总体2(52,6.3)N 中随机抽取一容量为36的样本,求样本均值X 在50.8到53.8之间的概率.7. 设随机变量X与Y相互独立,且222(,),()YX N nμχσσ::,证明()Xt t nμ-=:.8. 若总体X有数学期望()E Xμ=和方差2()D Xσ=,取X的容量为n的样本,样本均值为X,问n多大时,有(0.1)0.95P Xμσ-<≥.9. 设总体(150,400)X N:,(125,625)Y N:,并且X与Y相互独立,现从两总体中分别抽取样本,,样本容量都是为5,样本均值分别为X和Y,求{}0P X Y-≤ .10. 设总体X和Y都服从正态分布2(,)Nμσ,并且X与Y相互独立,X与Y分别是来自总体X和Y的容量都是n的样本均值,确定n的值,使{}00.01P X Y->= .11. 设总体(0,1)X N:,126,,,X X XL为X的一个样本,设22123456()()Y X X X X X X=+++++,求常数c,使得cY服从2χ分布.12. 设1210,,,X X XL为来自总体(0,0.09)N的样本,求{}10211.44iiP X=>∑ .13. 设125,,,X X XL是总体(0,1)X N:的一个样本,若统计量()()c X X U t n +=:,确定常数c 与n .14. 设总体2(0,)X N σ: ,12,X X 是样本,求212212()()X X Y X X +=-的分布.15. 设总体211(,)X N μσ:,222(,)Y N μσ:,从两个总体中分别抽取样本,得到下列数据:18n = ,10.5x =,2142.25s = ;210n = ,13.4y =,2256.25s =,求概率22214.40P σσ<⎧⎫⎨⎬⎩⎭.(B )1. 设有N 个产品,其中有M 个次品,进行放回抽样,定义i X 如下:1,0,i i X i =⎧⎨⎩第次取得次品,第次取得正品.求样本12,,...,n X X X 的联合分布.2.设总体2(,)X N nσμ:,12,,...,nX X X 是样本,证明:()22241[()](1)nii E XX n σ=-=-∑.3.设129,,...,X X X 是来自正态总体的简单随机样本,21126789()6,()3Y X X X Y X X X =+++=++L ,9222712(),i i S X Y ==-∑212).Z Y Y S =- 证明:统计量Z 服从(2)t 分布.【提供者:路磊】。
概率论与数理统计知识点总结1. 概率论基础- 随机事件:一个事件是随机的,如果它可能发生也可能不发生。
- 样本空间:所有可能事件发生的集合。
- 事件的概率:事件发生的可能性的度量,满足0≤P(A)≤1。
- 条件概率:在另一个事件发生的条件下,一个事件发生的概率。
- 贝叶斯定理:描述了随机事件A和B的条件概率和边缘概率之间的关系。
- 独立事件:两个事件A和B是独立的,如果P(A∩B) = P(A)P(B)。
- 互斥事件:两个事件A和B是互斥的,如果它们不能同时发生,即P(A∩B) = 0。
2. 随机变量及其分布- 随机变量:将随机事件映射到实数的函数。
- 离散随机变量:取值为有限或可数无限的随机变量。
- 连续随机变量:可以在某个区间内取任意值的随机变量。
- 概率分布函数:描述随机变量取值的概率。
- 概率密度函数:连续随机变量的概率分布函数的导数。
- 累积分布函数:随机变量取小于或等于某个值的概率。
- 期望值:随机变量的长期平均值。
- 方差:衡量随机变量取值的离散程度。
3. 多维随机变量及其分布- 联合分布:描述两个或多个随机变量同时取特定值的概率。
- 边缘分布:通过联合分布求得的单个随机变量的分布。
- 条件分布:给定一个随机变量的值时,另一个随机变量的分布。
- 协方差:衡量两个随机变量之间的线性关系。
- 相关系数:协方差标准化后的值,表示变量间的线性相关程度。
4. 大数定律和中心极限定理- 大数定律:随着试验次数的增加,样本均值以概率1收敛于总体均值。
- 中心极限定理:独立同分布的随机变量之和,在适当的标准化后,其分布趋近于正态分布。
5. 数理统计基础- 样本:从总体中抽取的一部分个体。
- 总体:研究对象的全体。
- 参数估计:用样本统计量来估计总体参数。
- 点估计:给出总体参数的一个具体估计值。
- 区间估计:给出一个包含总体参数可能值的区间。
- 假设检验:对总体分布的某些假设进行检验。
- 显著性水平:拒绝正确假设的最大概率。
第六章数理统计的基础知识从本章开始,我们将讨论另一主题:数理统计.数理统计是研究统计工作的一般原理和方法的数学学科,它以概率论为基础,研究如何合理地获取数据资料,并根据试验和观察得到的数据,对随机现象的客观规律性作出合理的推断.本章介绍数理统计的基本概念,包括总体与样本、经验分布函数、统计量与抽样分布,并着重介绍三种常用的统计分布:2 分布、t分布和F 分布.§1 总体与样本1.1 总体在数理统计中,我们把所研究对象的全体称为总体,总体中的每个元素称为个体.例如,研究某班学生的身高时,该班全体学生构成总体,其中每个学生都是一个个体;又如,考察某兵工厂生产炮弹的射程,该厂生产的所有炮弹构成总体,其中每个炮弹就是一个个体.在具体问题的讨论中,我们关心的往往是研究对象的某一数量指标(例如学生的身高),它是一个随机变量,因此,总体又是指刻画研究对象某一数量指标的随机变量X.当研究的指标不止一个时,可将其分成几个总体来研究.今后,凡是提到总体就是指一个随机变量.随机变量的分布函数以及分布律(离散型)或概率密度(连续型)也称为总体的分布函数以及分布律或概率密度,并统称为总体的分布.总体中所包含的个体总数叫做总体容量.如果总体的容量是有限的,则称为有限总体;否则称为无限总体.在实际应用中,有时需要把容量很大的有限总体当做是无限总体来研究.1.2随机样本在数理统计中,总体X的分布通常是未知的,或者在形式上是已知182183的但含有未知参数.那么为了获得总体的分布信息,从理论上讲,需要对总体X 中的所有个体进行观察测试,但这往往是做不到的.例如,由于测试炮弹的射程试验具有破坏性,一旦我们获得每个炮弹的射程数据,这批炮弹也就全部报废了.所以,我们不可能对所有个体逐一加以观察测试,而是从总体X 中随机抽取若干个个体进行观察测试.从总体中抽取若干个个体的过程叫做抽样,抽取的若干个个体称为样本,样本中所含个体的数量称为样本容量.抽取样本是为了研究总体的性质,为了保证所抽取的样本在总体中具有代表性,抽样方法必须满足以下两个条件:(1)随机性 每次抽取时,总体中每个个体被抽到的可能性均等. (2)独立性 每次抽取是相互独立的,即每次抽取的结果既不影响其它各次抽取的结果,也不受其它各次抽取结果的影响.这种随机的、独立的抽样方法称为简单随机抽样,由此得到的样本称为简单随机样本.对于有限总体而言,有放回抽样可以得到简单随机样本,但有放回抽样使用起来不方便.在实际应用中,当总体容量N 很大而样本容量n 较小时(一般当10N n ≥时),可将不放回抽样近似当作有放回抽样来处理. 对于无限总体而言,抽取一个个体不会影响它的分布,因此,通常采取不放回抽样得到简单随机样本.以后我们所涉及到的抽样和样本都是指简单随机抽样和简单随机样本.从总体X 中抽取一个个体,就是对总体X 进行一次随机试验.重复做n 次试验后,得到了总体的一组数据12(,,,)n x x x ,称为一个样本观测值.由于抽样的随机性和独立性,每个(1,2,,)i x i n = 可以看作是某个随机变量(1,2,,)i X i n = 的观测值,而(1,2,,)i X i n = 相互独立且与总体X 具有相同的分布.习惯上称n 维随机变量12(,,,)n X X X 为来自总体X 的简单随机样本.定义1.1 设总体X 的分布函数为()F x ,若随机变量12,,,nX X X 相互独立,且都与总体X 具有相同的分布函数,则称12,,,n X X X 是来自184总体X 的简单随机样本,简称为样本,n 称为样本容量.在对总体X 进行一次具体的抽样并作观测之后,得到样本12,,,n X X X 的确切数值12,,,n x x x ,称为样本观测值,简称为样本值.若总体X 的分布函数为()F x ,12,,,n X X X 是总体X 的容量为n 的样本,则由样本的定义知,12,,,n X X X 的联合分布函数为:112*).(,,,)(ni n iF F x x x x ==∏ (1.1)若总体X 是离散型随机变量,其分布律为{}i i p P X x ==(1,2,i = ),则12,,,n X X X 的联合分布律为:{}1122,,,n n P X x X x X x === 11()ni i ni i iP X x p =====∏∏. (1.2)若总体X 是连续型随机变量,其概率密度为()f x ,则12,,,n X X X 的联合概率密度为:121*(,,,)()nn i i f x x x f x ==∏. (1.3)例1.1 设总体X 服从正态分布2(,)N μσ,其概率密度为22()21()x f x μσ--=,x -∞<<+∞.则样本12,,,n X X X 的联合概率密度为:{}2112*1exp 1()2(,,,)ni i n x f x x x μσ=--=∏{}22111exp()2,nniixμσ==--∑,1,2,,.ix i n-∞<<+∞= .例 1.2设总体(,)X B N p,12,,,nX X X为来自总体X的样本,求12,,,nX X X的联合分布律.解12,,,nX X X相互独立,并且(,)iX B N p,1,2,,i n= .因此,iX的分布律为{}C(1),i i ix x N xi i NP X x p p-==-0,1,2,,;1,2,,ix N i n==所以12,,,nX X X的联合分布律为{}1122,,,n nP X x X x X x==={}1i iniP X x===∏111C)(1)(.in ni ii inxNix nN xp p===--∑∑=∏0,1,2,,;1,2,,.x N i ni==1.3经验(样本)分布函数设总体X的分布函数为()F x,从总体X中抽取容量为n的样本12,,,nX X X,样本值为12,,,nx x x.假设样本值12,,,nx x x中有k 个不相同的值,按由小到大的顺序依次记作:()(1)(2)kx x x≤≤≤,并假设()ix出现的频数为in,那么()ix出现的频率为iinfn=,1,2,,,i k k n=≤,显然有1851861k i i n n ==∑, 11ki i f ==∑.设函数(1)()(1)1()1,2,,1,0,,()1,,,.i n j i i j k i k x x F x f x x x x x +==-<=≤<≥⎧⎪⎪⎨⎪⎪⎩∑ (1.4)称之为总体X 的经验(样本)分布函数,其图形为一阶梯形曲线,如图1.1所示.根据经验分布函数的定义,易知()n F x 具有以下性质: (1) 0()1n F x ≤≤;(2) ()n F x 是单调不减函数;(3) ()n F x 在每个观察值()i x 处是右连续的; (4) ()0n F -∞=,()1n F +∞=.可见经验分布函数()n F x 与总体的分布函数具有相同的性质.187图1.1例1.4 从总体X 中随机地抽取容量为8的样本进行观测,得到如下数据:3,2.5,2.5,3.5,3,2.7,2.5,2.求X 的经验分布函数.解 将观测数据由小到大排列为 (1)(2)(3)(4)(5)2 2.5 2.73 3.5x x x x x <<<===<== ,计算得: 118f =,238f =,318f =,428f =,518f =,由定义知经验分布函数为802,182 2.5,482.5 2.7,()58 2.73,7833.5,13.5.x x x F x x x x <≤<≤<=≤<≤<≥⎧⎪⎪⎪⎨⎪⎪⎪⎩对于固定的x ,经验分布函数是依赖于样本观测值的,由于样本的抽188取是随机的,因而,()n F x 也是随机的.当给定样本观测值12,,,n x x x 时,()n F x 是在n 次独立重复试验中事件{}X x ≤发生的频率.由于总体X 的分布函数()F x 是事件{}X x ≤发生的概率,根据伯努利大数定律可知,当n →∞时,对于任意给定的正数ε,有{}lim 1()()n n P F x F x ε→∞=-<.§2 统 计 量在实际应用中,人们对总体X 的分布是毫无所知的.借助于总体X 的样本12,,,n X X X ,对总体X 的未知分布进行合理的推断,这类问题统称为统计推断问题.在利用样本对总体进行推断时,常常借助于样本的适当函数.利用这些函数所反映的总体分布的信息来对总体的所属类型,或者对总体中所含的未知参数做出统计推断.通常把这样的函数称为统计量.2.1统计量的定义定义 2.1 设12,,,n X X X 是来自总体X 的一个样本,12,,,n x x x 是样本值,12(,,,)n X X X g 是12,,,n X X X 的函数.如果12(,,,)n X X X g 中不含未知参数,则称12(,,,)n X X X g 为统计量,而12(),,,n g x x x 称为统计量的观测值.例2.1 设总体(1,)X B p ,{}1P x p ==,{}01P x p ==-,其中0p >为未知参数,12,,,n X X X 为来自总体X 的一个样本,指出189下列函数哪些是统计量,哪些不是统计量.①12X X +; ②{}1max i i nX ≤≤; ③2n X p +; ④21()n X X -.解 据统计量定义,统计量必须满足两个条件:(1)它是样本12,,,n X X X 的函数,(2)它不含未知参数.在① ④中,它们都是样本12,,,n X X X 的函数,但③含未知参数p ,所以①,②及④中的函数都是统计量,③中的函数不是统计量.2.2 常用统计量下面介绍几种常用的统计量,设12,,,n X X X 是来自总体X 的一个样本,12,,,n x x x 是相应的样本值.1.样本均值 称 11nii X Xn==∑ (2.1)为样本均值,它的观测值为11nii x xn==∑.若总体X 具有均值()E X μ=和方差2()0D X σ=>,则()i E X μ=,2()i D X σ= , 1,2,.i n =由第四章例2.7,有()E X μ=,2()D X nσ=.即样本均值的数学期望等于总体的均值,样本均值的方差等于总体方差的1n倍.2.样本方差 称22011()ni i X X nS ==-∑(2.2)190为未修正样本方差,而称222201111))111((nni i i i n X X X X n n n S S n ==---==-=-∑∑(2.3)为修正样本方差,它们的观测值分别为:12201()ni ixx ns =-=∑,22221111(11())nni i i i n x n n s x x x ==--=-=-∑∑.若总体X 具有数学期望()E X μ=和方差2()0D X σ=>,则2121()[()]1ni i E S E X X n ==--∑1221[()]1ni iE XnX n =--=∑1221[(()]1)ni iE X nE Xn =--=∑[]{}{}{}1221()()()()1ni i i D X E X n D X E X n =+-+-=⎡⎤⎣⎦∑22221()1n n nn n nσσμμ=+---2.σ=可见22()E S σ=,而220()E S σ≠,即修正样本方差的数学期望等于总体方差,而未修正样本方差的数学期望不等于总体的方差.因此,在数理统计中主要使用修正样本方差,并简称为样本方差.3.样本标准差 称S==(2.4)为样本标准差,其观测值为:s==例2.2 在对总体X抽取容量为n的样本进行检测时,得到m个互不相同的样本观测值12,,,mx x x,它们出现的频率分别为12,,,mf f f.求样本均值、样本方差和样本标准差的观测.解设12,,,mx x x出现的频数分别为12,,,mn n n,显然有12mn n n n+++=,所以111111m m mii i i i ii i iniinx n x x f xn nxn========∑∑∑∑;221211()11()miiimi iinns x xn n nn x x===----=∑∑21()1mi iinf x xn==--∑;2s== .例 2.3设总体X服从参数为λ的指数分布,即()X Eλ,样本12,,,nX X X来自总体X,求()E X,2()E S.解由于()λX E,所以1911921()E X λ=, 21()D X λ=,由前面的讨论,有()()1E X E X λ==,221()()λ==E S D X .4. 样本k 阶原点矩 称11nk k ii XnA ==∑,1,2,k = , (2.5)为样本k 阶原点矩,它的观测值为:11nkk ii na x ==∑, 1,2,k = .显然,样本一阶原点矩就是样本均值.即1A X =.5.样本k 阶中心矩 称1()1n kB X X i ki n ∑=-=, 1,2,k = , (2.6) 为样本k 阶中心矩,它的观测值为:11)(nkk i i nb x x ==-∑, 1,2,k = .显然,样本二阶中心矩就是未修正样本方差,即220B S =. 6.顺序统计量193设12,,,n x x x 是样本12,,,n X X X 的一组观测值,将它们从小到大重新排序为:(1)(2)()n x x x ≤≤≤ .记()k X 是对应于()k x 的随机变量,这样得到的(1)(2)(),,,n X X X 称为总体X 的一组顺序统计量,称()k X 为第k 位顺序统计量,称(1)12min (,,,)n X X X X = 和()12max (,,,)n n X X X X = 分别为样本最小值和样本最大值.设总体X 的分布函数为()F x ,记(1)X 和()n X 的分布函数分别为min ()F x 和max ()F x ,则{}max 12()max(,,,)n F x P X X X x =≤{}12,,,n P X x X x X x =≤≤≤ {}{}{}12n P X x P X x P X x =≤≤≤ []()nF x ={}min 12()min(,,,)n F x P X X X x =≤{}121min(,,,)n P X X X x =->{}{}{}121n P X x P X x P X x ->>>=[]11()nF x --=.例2.4 在总体(12,4)N 中抽出容量为5的样本12354,,,,X X X X X ,求概率{}(5)15P X >和(1){10}P X <.194解 设总体X 的分布函数为()F x ,则随机变量(5)X 和(1)X 的分布函数分别为:[]5max ()()F x F x = 和[]5min ()11()F x F x =--,于是有:{}(5)(5)max 15(15)1{15}1F P X P X >=-=-≤[]551(15)1[Φ(1.5)]F =-=-0.2923=,(1)10{}P X <[]5(10)11(10)minF F =--= []51Φ(1)=-51(0.8413)=-0.5785=.2.3 正态总体的两个常用统计量的分布统计量是一个随机变量,它的分布通常称为抽样分布.定理2.1 设12,,,n X X X 是来自正态总体2(,)X N μσ 的样本,X 样本均值,则有2(,) N nX μσ和(0,1).X U N μ-= (2.7)证明 由于12,,,n X X X 相互独立并且2(,)i X N μσ (1,2,,)i n = ,因此,11ni iX Xn==∑也服从正态分布,而()E X μ=,2()=D X nσ,所以2(,)X N nσμ . 将X 标准化,有195(0,1).X U N μ-=例2.5 在总体2(80,20)N 中随机抽取一容量为100的样本,求样本均值X 与总体均值之差的绝对值大于3的概率.解 由定理2.1知8080(0,1),20102X X U N --==于是{}80380|322X PX P -->=>⎧⎫⎪⎪⎨⎬⎪⎪⎩⎭8032122XP-=-⎛⎧⎫⎫≤⎨⎬ ⎪⎝⎩⎭⎭[]21Φ(1.5)=-2(10.9332)=-0.1336= .例 2.6 设总体2(3.4,6)X N ,12,,,n X X X 为X 的样本,若要使{}1.4 5.40.95P X <<≥,问样本容量n 至少应取多大?解 由定理2.1 知3.4(0,1)X N - ,又{}{}1.4 5.4 3.42P X PX <<=-<1963P =<⎪⎭2Φ1=-, 所以,要使{}1.4 5.40.95P X <<≥,只需2Φ10.95-≥,查正态分布表,得1.96≥,所以35n =.定理2.2 设两个正态总体211(,)X N μσ 和222(,)Y N μσ ,分别独立地从X 和Y 中抽取样本112,,,n X X X 和212,,,n Y Y Y (即这两个样本(112,,,n X X X )与(212,,,n Y Y Y )相互独立),样本均值分别为X 和Y ,则有(0,1).()μμ---=N X Y U (2.8)证明 由定理的条件知X 和Y 相互独立,且2111(,)X N n σμ ,2222(,)Y N n σμ ,所以22121212(,),X Y N n n σσμμ--+从而197()(0,1)X Y U N μμ---=.例2.7 设总体(20,3)X N ,从X 中独立地抽取两个容量分别为10和15的样本1210,,,X X X 和1215,,,Y Y Y ,样本均值分别为X 和Y ,求{}0.3PX Y->.解 由于1210,,,X X X 和1215,,,Y Y Y 相互独立且都与总体X的分布相同,因此3(20,)10X N ,3(20,)15Y N于是(0,0.5)- X Y N ,所以{}0.30.3->=>⎫PX YP 0.31P =-⎫≤0.321Φ=-⎡⎤⎢⎥⎣⎦2(10.6628)=-0.6744=.§3 2χ分布数理统计研究的对象,大部分问题与正态分布有关.从本节开始我们介绍三个在数理统计中常用的来自正态总体的统计量.1983.1 2χ分布的概念定义 3.1 设12,,,n X X X 是来自标准正态总体(0,1)N 的样本,称随机变量222212n X X X χ=+++ (3.1)服从自由度为n 的2χ分布,记作22()n χχ .这里自由度n 是(3.1)式右端所包含的独立变量的个数. 可以证明,若22()n χχ ,则2χ的概率密度为:12220()2(2)01,,.nx n x e x f x n x -->Γ≤=⎧⎪⎨⎪⎩ (3.2)其中()2nΓ是Γ函数1()d x tx te t +∞--Γ=⎰在2n x =处的值.2()n χ分布的概率密度()f x 的图像如图3.1所示.图3.1 2()n χ分布的概率密度3.2 2χ分布的性质199性质1 若22()n χχ ,则2()E n χ=,2()2D n χ=. (3.3)证明 由于122==∑ni i X χ,其中(0,1)iX N (1,2,,)i n = ,12,,,n X X X 相互独立,且()0i E X =,()1i D X =,所以22()()[()]1=+=E X D X E X i i i ,1,2,,i n = ,因此122()()ni i E E X n χ===∑.又244421()()d d 3xi E X xx x x ex ϕ+∞+∞-∞-∞-===⎰⎰,[]2242()()()312i i i D X E X E X =-=-= ,1,2,,i n = .所以122()()2ni iD D Xn χ===∑.性质2 若2211()n χχ ,2222()n χχ ,且21χ和22χ相互独立,则2221212()n n χχχ++ . (3.4)证明 设1212,,,n n X X X + 相互独立且都服从(0,1)N .由于2211()n χχ ,2222()n χχ ,所以21χ与122212n X X X +++ 同分布,22χ与111222212n n n n X X X ++++++ 同分布.再由21χ与22χ相互独立,知2002212χχ+与1222122n n X X X ++++ 同分布,所以2221212()n n χχχ++ .性质2可以推广到有限个2χ分布的情形. 性质3 设22()n χχ ,则对任意实数x ,有2221lim d n txn P x t eχ→∞--∞-≤=⎫⎬⎭⎰. (3.5)证明 由于22()n χχ ,所以有12,,,n X X X 相互独立且都服从(0,1)N ,使得222212n X X X χ=+++ .显然22(1)(1,2,)i X i n χ= ,即2i X 独立同分布且2()1i E X =,2()2i D X =,1,2,,i n = ,由独立同分布的中心极限定理,有22221lim lim }d n n ntxinnP x P x tX eχ→∞→∞--∞--≤≤=⎧⎫⎪⎪=⎬⎪⎩⎭∑⎰.性质3说明,当n2nχ-近似服从(0,1)N ,也就是说2χ近似服从正态分布(,2)N n n .例 3.1 设1234,,,X X X X 是来自总体(0,4)X N 的一个样本,问201当,a b 为何值时,2221234(2)(34)()Y a X X b X X n χ=-+- ,并确定n 的值.解 由于1234,,,X X X X 独立同分布于(0,4)N ,所以12(2)0E X X -= ,34(34)0E X X -=, 21212(2)()(2)()20D X X D X D X -=+-= 223434(34)3()(4)()100D X X D X D X -=+-=于是2(0,1)X X N - ,3434(0,1)10X X N - ,而且122X X -与3434X X -相互独立,所以2223412(34)(2)(2)20100X X X X χ--+从而120a =,1100b =,2n = .3.3 2χ分布的上α分位点定义3.2 设22()n χχ ,对于给定的正数(01)αα<<,称满足条件22{()}P n αχχ>=2()()d n f x x αχα+∞=⎰(3.6)的点2()n αχ为2()n χ分布的上α分位点 (如图3.2所示).202图3.2 2()n χ分布的上α分位点在书末附表4中,对于确定的α与n ,给出了查找2()n αχ的表.例如0.01α=,10n =,查附表4,有20.01(10)23.209χ= .3.4 关于2χ分布的两个定理定理3.1 设12,,,n X X X 是来自总体2(,)X N μσ 的一个样本,则随机变量12221()()ni i X n μχσ=-∑. (3.7)证明 由于12,,,n X X X 相互独立且都服从2(,)N μσ分布,所以12,,,n X X X μμμσσσ--- 也相互独立且都服从(0,1)N 分布,据定义3.11122221()()()nni i i iX Xn μμχσσ==--=∑∑ .定理3.2 设12,,,n X X X 是来自总体2(,)X N μσ 的一个样本,X 和2S 分别是样本均值和样本方差,则有203(1)222(1)(1)n Sn χσ-- ; (3.8)(2)X 与2S 相互独立. (3.9) 定理3.2的证明从略.例3.2 从正态总体2(,0.5)N μ中抽取样本1210,,,X X X . (1)已知0μ=,求概率{}10124i i PX =≥∑;(2)若μ末知,求概率{}10210.675()i i X X P=≥-∑.解 (1)由于总体2(0,0.5)X N ,由定理3.1知10222211(10).0.5i i X χχ==∑查2χ分布表,有{}10124i i PX =≥∑{}102212140.50.5ii PX==≥∑216{}P χ=≥0.10≈.(2) 当μ未知时,由定理3.2 知10222212221(1)(1)(9)0.5()i i X X n Sn χχχσ=--=-==∑,于是{}1021)0.675(i i PX X =≥-∑204{}10222110.6750.50.5()ii XX P==-≥∑{}2(9) 2.700P χ=≥.查2χ分布表,有 20.975(9) 2.700χ=,于是 {}10210.675()i i X X P=≥-∑0.975=例3.3 在总体2(,)N μσ中抽取容量为16的样本,2S 为样本方差,求2()D S .解 由定理3.2知222(1)(1)n Sn χσ-- ,又由2χ分布的性质1,有22(1)2(1)n S Dn σ-=-⎡⎤⎢⎥⎣⎦,所以22224(1)(1)()2(1)n S n DD S n σσ--==-⎡⎤⎢⎥⎣⎦,即42422()115D S n σσ==-.§4 t 分布2054.1 t 分布的概念定义4.1 设(0,1)X N ,2()Y n χ ,且X 和Y 相互独立,称随机变量X t =(4.1)服从自由度为n 的t 分布,记作()n t t .t 分布又称学生氏(Student )分布.可以证明,()t n 分布的概率密度为:1221()2()(1)()2n n xf x nn+-+Γ+=,x -∞<<+∞ (4.2)并且当n →∞时,()t n 分布的概率密度趋于标准正态分布的概率密度,即有221()lim xn f x -→∞=, x -∞<<+∞.()f x 图像如图4.1所示,可以看出,()f x 的图像关于纵轴对称,并且()f x 曲线的峰顶比标准正态曲线峰顶要低,两端较标准正态曲线要高.此外,可以证明, ()0(1)E t n => , ()(2)2n D t n n =>-. (4.3)206图 4.1 ()t n 分布的概率密度例 4.1 设总体X 和Y 相互独立且都服从2(0,3)N 分布,而样本129,,,X X X 和129,,,Y Y Y 分别来自X 和Y ,求统计量X T X X =+++的分布.解 由于911(0,1)9ii X XN ==∑ ,(0,1)3i Y N ,1,2,,9i = ,99221121(9)39()ii i iY Y Yχ====∑∑ ,并且X 和Y 相互独立,由t 分布的定义知2079(9)iX T Xt ==∑ .4.2 t 分布的上α分位点定义4.2 设()n t t ,对于给定的正数(01)αα<<,称满足条件{}()()d ()t n P f x x t t n ααα+∞=>=⎰(4.4)的点()t n α为()n t 分布的上α分位点.图4.2给出了()n t 分布的上α分位点()n t α,由t 分布概率密度()f x 图形的对称性可知1()()n n t t αα-=-.图4.2 ()n t 分布的上α分位点.书末附表5给出了()n t 分布上α分位点()n t α的数值表,例如0.025(8)2.3060t =,0.9910.01(12)(12)t t -=0.01(12)t =- 2.6810=-.当n 较大(通常45n >)时,()n t α可以由标准正态分布的上α分位208点u α来近似代替.4.3 关于t 分布的两个定理定理 4.1 设总体2(,)X N μσ ,12,,,n X X X 是来自总体X 的样本,样本均值和样本方差分别为X 和2S ,则随机变量(1).-=- X T t n μ (4.5)证明 由定理2.1知(0,1),-=X U N μ再由定理3.2 知X 与2S 相互独立,并且2221(1),-=- n V S n χσ根据t 分布的定义)(1).--==-=X U X T t n μμ例4.2设总体X 服从正态分布2(,)N μσ,从总体X 中抽取样本112,,,n X X X .记1,1n n X X i i n ∑== ,12()11n S X X n n i i n ∑=-=-,209证明统计量(1).t n -证明 由于1X n +与X n 相互独立,且2(,)1+ X N n μσ,2(,) X N n nσμ,所以12(0,)1n X X N n n nσ+-+.将随机变量1X X n n -+标准化,可得(0,1).X X u N -==据定理3.2可知X n 与2n S 相互独立,且2222(1)(1).nn S n χχσ-=-由1X n +与2n S 相互独立,知u 与2χ相互独立,据t 分布的定义(1).u t n ==-定理4.2 设两个正态总体21(,)X N μσ 和22(,)Y N μσ ,分别独 立地从X 和Y 中抽取样本,样本容量分别为1n 和2n ,样本均值分别为X210和Y ,样本方差分别为21S 和22S ,记222112212(1)(1)2w n n n n S S S ---+=+,则随机变量12()()(2).---=+- X Y T t n n μμ (4.6)证明 由定理2.2知()()(0,1)X Y N μμ--- ,又由定理3.2知221112(1)(1)n S n χσ-- ,222222(1)(1)n S n χσ-- ,且2112(1)n S σ-与2222(1)n S σ-相互独立,根据2χ分布的可加性,有22211221222(1)(1)(2)n S n S n n χσσ--++- ,所以由t 分布的定义,有12()(2)X Y T t n n μμ---=+- .§5 F 分布2115.1 F 分布的概念定义 5.1 设21()X n χ ,22()Y n χ ,且X 和Y 相互独立,称随机变量12X n F Y n =(5.1)服从自由度为12(,)n n 的F 分布,记为12(,)F F n n .可以证明,12(,)F n n 分布的概率密度为:111211122222(()2)12()(1)0,()(2)(2)120,0.,n n n n n n n n x x x f x n n n n x +--Γ++>=ΓΓ≤⎧⎪⎨⎪⎩(5.2)其图像如图5.1所示.此外,可以证明,若12(,)F F n n ,则222()(2)2n E F n n =>- , (5.3)221222122(224)()(4)(2)(4)n n n D F n n n n +-=>--. (5.4)212图5.1 12(,)F n n 分布的概率密度例5.1 已知()t t n ,求2t 的分布.解 由t 分布定义可知,随机变量U 与V 相互独立,使得U t =其中 (0,1)U N ,2()V n χ . 而2221UUt V nV n==,并且22(1)U χ , 所以由F 分布的定义知22(1,)Ut F n V n=.即2t 服从自由度为(1,)n 的F 分布.5.2 F 分布的上α分位点213定义5.2 设12(,)F F n n ,对于给定的正数(01)αα<<,称满足条件{}21212(,)()d (,)F n n P F F f x x n n αα+∞=>=⎰(5.5)的点12(,)F n n α为12(,)F n n 分布的上α分位点. 图5.2给出了12(,)F n n 分布的上α分位点12(,)F n n α.图5.2 F 分布的上α分位点12(,)F n n α若12(,)F F n n ,则由F 分布的定义知211(,)F n n F,从而,我们有112211(,)(,)F n n F n n αα-=. (5.6)事实上,对于给定的(01)αα<<,有 112112111{(,)}{}(,)P F F n n P FF n n ααα---=>=<112111{}(,)P FF n n α-=-≥,于是21411211{}(,)P FF n n αα->=,由于211(,)F n n F,因此,1121(,)F n n α-就是21(,)F n n 的上α分位点21(,)F n n α,即112211(,)(,)F n n F n n αα-=.书后附表6给出了12(,)F n n 分布的上α分位点的数值表,例如0.05(8,9)3.23F =,0.950.0511(15,12)0.403(12,15)2.48F F ===.5.3 关于F 分布的两个定理定理5.1 设两个正态总体211(,)X N μσ 和222(,)Y N μσ ,分别独立地从X 和Y 中抽取样本112,,,n X X X 和212,,,n Y Y Y ,则随机变量1222212211222112212112(,)()()n i n ii i X n n F F n n n n Yμσχσχμ===⋅⋅-=-∑∑ (5.7)证明 由定理3.1知121111221()(),=-=∑n i i X n μχσχ222221222()(),=-=∑n i i Y n μχχσ215并且两个样本112,,,n X X X 和212,,,n Y Y Y 相互独立,所以,由F 分布的定义,有1221221221112122(,).()()===⋅⋅--∑∑ i n ii n i n F F n n n X Yσσμμ定理 5.2 设两个正态总体211(,)X N μσ 和222(,)Y N μσ ,分别独立地从X 和Y 中抽取样本,样本容量分别为1n 和2n ,样本均值分别为X 和Y ,样本方差分别为21S 和22S ,则随机变量2221122212(1,1).=--S F F n n S σσ (5.8)证明 由定理3.2知222111121(1)(1),-=- n S n χχσ222222222(1)(1),-=- n S n χχσ并且21χ和22χ相互独立,由F 分布的定义知21222111222221221(1,1).1-==---S n F F n n S n χσχσ216例 5.2 设128,,...,X X X 是来自总体(,20)X N μ 的一个样本,1210,,...,Y Y Y 是来自总体(,33)Y N μ 的一个样本,21S 和22S 是各自的样本方差,并且总体X 和Y 相互独立,,求{}22122P S S ≥.解 由定理5.2知222211222122,33(79),20==S S F F S S σσ所以{}2221122222S P S S P S ≥=≥⎧⎫⎨⎬⎩⎭2122333322020S P S =≥⨯⎧⎫⎨⎬⎩⎭{}3.3.=≥P F 查F 分布表知{}221220.05.≥=P S S习 题 六(A )1.设128,,...,X X X 是来自服从(0,)θ 上均匀分布的总体的随机样本,0θ>为未知参数,求样本的概率密度.2. 设总体X 服从参数为λ的泊松分布,求样本12,,...,n X X X 的分布律.3. 若总体2(,)X N μσ ,其中2σ已知,但μ末知,而12,,,nX X X 为X 的样本,指出下列量中哪些是统计量,哪些不是统计量.217(1)11ni i X n=∑;(2)211()ni i X nμ=-∑;(3)2111()ni i X X n =--∑;(4);(5); (6)5X -4. 总体X 的一组容量为10的样本观测值为:0,0.2,0.25,0.3-,0.1-,2,0.15,1,0.7-,1-,求经验分布函数10()F x .5. 来自总体X 的一组样本观测值为:求样本均值X ,样本方差2S 和样本标准差S .6. 在总体2(52,6.3)N 中随机抽取一容量为36的样本,求样本均值X 在50.8到53.8之间的概率.7. 设随机变量X 与Y 相互独立,且222(,),()YX N n n σμχσ,证明()X t t n μ-= .8. 若总体X 有数学期望()E X μ=和方差2()D X σ=,取X 的容量为n 的样本,样本均值为X ,问n 多大时,有(0.1)0.95P X μσ-<≥.9. 设总体(150,400)X N ,(125,625)Y N ,并且X 与Y 相互独立,218现从两总体中分别抽取样本,,样本容量都是为5,样本均值分别为X 和Y ,求{}0P X Y -≤ .10. 设总体X 和Y 都服从正态分布2(,)N μσ,并且X 与Y 相互独立,X 与Y 分别是来自总体X 和Y 的容量都是n 的样本均值,确定n 的值,使{}00.01P X Y ->= .11. 设总体(0,1)X N ,126,,,X X X 为X 的一个样本,设22123456()()Y X X X X X X =+++++,求常数c ,使得cY 服从2χ分布.12. 设1210,,,X X X 为来自总体(0,0.N 的样本,求{}10211.44i i PX =>∑.13. 设125,,,X X X 是总体(0,1)X N 的一个样本,若统计量()()c X X U t n +=,确定常数c 与n .14. 设总体2(0,)X N σ ,12,X X 是样本,求212212()()X X Y X X +=-的分布.15. 设总体211(,)X N μσ ,222(,)Y N μσ ,从两个总体中分别抽取样本,得到下列数据:18n = ,10.5x =,2142.25s = ;210n = ,13.4y =,2192256.25s =,求概率22214.40P σσ<⎧⎫⎨⎬⎩⎭.(B )1. 设有N 个产品,其中有M 个次品,进行放回抽样,定义i X 如下:1,0,ii X i =⎧⎨⎩第次取得次品,第次取得正品.求样本12,,...,n X X X 的联合分布.2.设总体2(,)X N nσμ ,12,,...,nX X X 是样本,证明:()22241[()](1)nii E XX n σ=-=-∑.3.设129,,...,X X X 是来自正态总体的简单随机样本,21126789()6,()3Y X X X Y X X X =+++=++ ,9222712(),i i S X Y ==-∑212).ZY Y S =- 证明:统计量Z 服从(2)t 分布.【提供者:路磊】。