概率和数理统计样本和抽样分布
- 格式:ppt
- 大小:329.00 KB
- 文档页数:60
第一章 概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现. 样本空间S: E 的所有可能结果组成的集合. 样本点(基本事件):E 的每个结果. 随机事件(事件):样本空间S 的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(Φ):每次试验中一定不会发生的事件. 二. 事件间的关系和运算1.A ⊂B(事件B 包含事件A )事件A 发生必然导致事件B 发生.2.A ∪B(和事件)事件A 与B 至少有一个发生.3. A ∩B=AB(积事件)事件A 与B 同时发生.4. A -B(差事件)事件A 发生而B 不发生.5. AB=Φ (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=Φ且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德•摩根律 B A B A = B A B A = 三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率. (1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+… 2.性质(1) P(Φ) = 0 , 注意: A 为不可能事件 P(A)=0 .(2)有限可加性 对于n 个两两互不相容的事件A 1,A 2,…,A n ,P(A 1∪A 2∪…∪A n )=P(A 1)+P(A 2)+…+P(A n ) (有限可加性与可列可加性合称加法定理) (3)若A ⊂B, 则P(A)≤P(B), P(B -A)=P(B)-P(A) . (4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理 对于任意二事件A,B ,P(A ∪B)=P(A)+P(B)-P(AB) . 对于任意n 个事件A 1,A 2,…,A n()()()()+∑+∑-∑=≤<<≤≤<≤=nk j i k j i nj i j i ni i n A A A P A A P A P A A A P 11121…+(-1)n-1P(A 1A 2…A n )四.等可能(古典)概型1.定义 如果试验E 满足:(1)样本空间的元素只有有限个,即S={e 1,e 2,…,e n };(2)每一个基本事件的概率相等,即P(e 1)=P(e 2)=…= P(e n ).则称试验E 所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k 是A 中包含的基本事件数, n 是S 中包含的基本事件总数. 五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0).P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0) 3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S) ,则 当P(B i )>0时,当P(A)>0, P(B i )>0时,. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件. (1)两个事件A,B 相互独立⇔ P(B)= P (B|A) .2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.3.n 个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()kki i i i i i A P A P A P A A A P 2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x 2). (3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1). 二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为: (1)非负性 0≤P k ≤1 ; (2)归一性 11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=x k (k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()kn k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1) (3))X~π(λ)参数为λ的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (λ>0)三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数).2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(x x dx x f ; (4)若f (x)在点x 处连续,则f (x)=F / (x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 . 3.三种重要的连续型随机变量的分布(1)X ~U (a,b) 区间(a,b)上的均匀分布 ⎩⎨⎧=-0)(1a b x f 其它b x a << .(2)X 服从参数为θ的指数分布.()⎩⎨⎧=-0/1θθx ex f 00≤>x x 若若 (θ>0).(3)X~N (μ,σ2)参数为μ,σ的正态分布 222)(21)(σμσπ--=x e x f -∞<x<∞, σ>0.特别, μ=0, σ2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--xt dt e x 2221)(π, Φ(-x)=1-Φ(x) .若X ~N ((μ,σ2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z α}= P{Z<-z α}= P{|Z|>z α/2}= α,则点z α,-z α, ±z α/ 2分别称为标准正态分布的上,下,双侧α分位点. 注意:Φ(z α)=1-α , z 1- α= -z α. 四.随机变量X 的函数Y= g (X)的分布 1.离散型随机变量的函数若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律. 2.连续型随机变量的函数若X 的概率密度为f X (x),则求其函数Y=g(X)的概率密度f Y (y)常用两种方法: (1)分布函数法 先求Y 的分布函数F Y (y)=P{Y ≤y}=P{g(X)≤y}=()()dx x f ky X k∑⎰∆其中Δk (y)是与g(X)≤y 对应的X 的可能值x 所在的区间(可能不只一个),然后对y 求导即得f Y (y)=F Y /(y) .(2)公式法 若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为 ()()()()⎩⎨⎧'=0y h y h f y f X Y 其它βα<<y其中h(y)是g(x)的反函数 , α= min (g (-∞),g (∞)) β= max (g (-∞),g (∞)) .如果f (x)在有限区间[a,b]以外等于零,则 α= min (g (a),g (b)) β= max (g (a),g (b)) .第三章 二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义 若X 和Y 是定义在样本空间S 上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X ≤x,Y ≤y}称为(X,Y)的(X 和Y 的联合)分布函数. 2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- ∞)=0, F(-∞,y)=0, F(-∞,-∞)=0, F(∞,∞)=1 . (3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) . (4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 .(2)归一性 ∑∑=i jij p 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x yy ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-y xdudv v u f ),( 则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度. 2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f .(3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2(4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<∞}= F (x , ∞) . (X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<∞, Y ≤y}= F (∞,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }= ∑∞=1j ij p = p i · ( i =1,2,…) 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }= ∑∞=1i ij p = p ·j ( j =1,2,…) 归一性 11=∑∞=•j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X 关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dy y f Y五.相互独立的随机变量1.定义 若对一切实数x,y,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j = p i ··p ·j ( i ,j =1,2,…)对一切x i ,y j 成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立. 六.条件分布1.二维离散型随机变量的条件分布定义 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称P{X=x i |Y=y j } 为在Y= y j 条件下随机变量X 的条件分布律. 同样,对于固定的i,若P{X=x i }>0,则称 P{Y=y j |X=x i }为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X 离散型随机变量连续型随机变量分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛)⎰∞∞-dx x xf )((积分绝对收敛)方差D(X)=E{[X-E(X)]2} []∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2=E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛) 函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差σ(X)=√D(X) .,}{},{jji j j i p p y Y P y Y x X P •=====,}{},{•=====i j i i j i p p x X P y Y x X P二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .2.X,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X) 1.X~ (0-1)分布P{X=1}= p (0<p<1) p p (1- p) 2.X~ b (n,p) (0<p<1) n pn p (1- p)3.X~ π(λ) λ λ4.X~ U(a,b) (a+b)/2 (b-a) 2/125.X 服从参数为θ的指数分布 θ θ26.X~ N (μ,σ2) μ σ2 四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,… 随机变量X 的k 阶中心矩E{[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如:样本均值∑==n i i X n X 11 样本方差()∑--==n i i X X n S 12211 样本标准差S样本k 阶矩∑==n i k i k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==ni k i k X X n B 1)(1( k=1,2,…)二.抽样分布 即统计量的分布1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n . 特别,若X~ N (μ,σ2 ) ,则X ~ N (μ, σ2 /n) .2.χ2分布 (1)定义 若X ~N (0,1) ,则Y =∑=ni i X 12~ χ2(n)自由度为n 的χ2分布.(2)性质 ①若Y~ χ2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ χ2(n 1) Y 2~ χ2(n 2) ,则Y 1+Y 2~ χ2(n 1 + n 2). ③若X~ N (μ,σ2 ), 则22)1(σS n -~ χ2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ χ2(n),0< α <1 ,则满足αχχχχαααα=<>=<=>--))}(())({()}({)}({22/122/212n Y n Y P n Y P n Y P 的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为χ2分布的上、下、双侧α分位点.3. t 分布(1)定义 若X~N (0,1 ),Y~ χ2 (n),且X,Y 相互独立,则t=nY X~t(n)自由度为n 的t 分布. (2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (μ,σ2 )时, nS X μ-~ t (n-1) . ③两个正态总体相互独立的样本 样本均值 样本方差X~ N (μ1,σ12 ) 且σ12=σ22=σ2 X 1 ,X 2 ,…,X n1X S 12Y~ N (μ2,σ22 ) Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w(3)分位点 若t ~ t (n) ,0 < α<1 , 则满足αααα=>=-<=>)}({)}({)}({2/n t t P n t t P n t t P的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧α分位点. 注意: t 1- α (n) = - t α (n).4.F 分布 (1)定义 若U~χ2(n 1), V~ χ2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③)22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< α <1,则满足)},({)},({21121n n F F P n n F F P αα-<=>ααα=<>=-))},(()),({(212/1212/n n F F n n F F P的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧α分位点. 注意: .).(1),(12211n n F n n F αα=-第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数θ1, θ2,…, θk .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμ 解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθ ,以样本矩A l 取代总体矩μ l ( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A θθθθθθ,若代入样本值则得到矩估计值. 2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, θ1, θ2,…, θk ),称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθ 为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21 ,称为参数θ1, θ2,…,θk 的最大似然估计值,代入样本得到最大似然估计量.若L(θ1, θ2,…, θk )关于θ1, θ2,…, θk 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iLθ (i =1,2,…,k) 求出最大似然估计. 3.估计量的标准(1) 无偏性 若E(∧θ)=θ,则估计量∧θ称为参数θ的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=μk =E(X k ),即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩μk 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= θ, 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效. (3)一致性(相合性) 若n →∞时,θθP →∧,则称估计量∧θ是参数θ的相合估计量. 二.区间估计1.求参数θ的置信水平为1-α的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,θ),其中只有一个待估参数θ未知,且其分布完全确定. (2)利用双侧α分位点找出W 的区间(a,b),使P{a<W <b}=1-α. (3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求. 2.单个正态总体待估参数 其它参数 W 及其分布 置信区间μ σ2已知 nX σμ-~N (0,1) (2/ασz n X ±) μ σ2未知 nS X μ-~ t (n-1) )1((2/-±n t n S X α σ2 μ未知 22)1(σS n -~ χ2(n-1) ))1()1(,)1()1((22/1222/2-----n Sn n S n ααχχ 3.两个正态总体 (1)均值差μ 1-μ 2其它参数 W 及其分布 置信区间已知2221,σσ22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y X σσα+±-未知22221σσσ== 212111)(n n S Y X w +---μμ~t(n 1+n 2-2) )11)2((21212n n S n n t Y X w+-+±-α 其中S w 等符号的意义见第六章二. 3 (2)③.(2) μ 1,μ 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比σ12/σ22的置信区间为))1,1(1,)1,1(1(212/12221212/2221----⋅-n n F S S n n F S S αα注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标α/2改为α,另外的下(上)限取为-∞ (∞)即可.。
概率论与数理统计-ch6-样本与抽样分布概率论中,所研究的随机变量是假定其分布是已知的,在此前提下研究它的性质、数字特征等。
在数理统计中,所研究的随机变量的分布是未知或不完全知道的,通过重复独⽴的试验得到许多观察值去推断随机变量的种种可能分布。
1、随机样本总体:试验的全部可能的观察值。
=样本空间个体:每⼀个可能观察值。
=样本点容量:总体中所包含的个体的个数。
有限总体⽆限总体⼀个总体对应⼀个随机变量X,对总体的研究就是对随机变量X的研究。
所以将不区分总体与相应的随机变量,统称为总体X。
样本:在数理统计中,⼈们都是通过从总体中抽取⼀部分个体,根据获得的数据来对总体分布得出推断的,被抽出的部分个体叫做总体的⼀个样本。
对总体进⾏⼀次观察,就会得到⼀个随机变量X1,对总体进⾏n次重复的、独⽴的观察,就会得到n个随机变量X1,X2,...,Xn,这n个随机变量X1,X2,...,Xn是对总体随机变量X观察的结果。
则X1,X2,...,Xn是相关独⽴且与X具有相同分布,称为来⾃总体X的⼀个简单随机样本。
n称为样本的容量。
进⾏n次观察得到的⼀组实数x1,x2,...,xn是随机变量X1,X2,...,Xn的观察值,称为样本值,也称为X的n个独⽴的观测值。
2、抽样分布样本是统计推断的依据,但往往不直接使⽤样本本⾝,⽽是由样本构造的函数。
统计量:设X1,X2,...,Xn是来⾃总体X的⼀个样本,g(X1,X2,...,Xn)是其函数,且g中不含任何未知参数,则称g(X1,X2,...,Xn)是⼀统计量。
统计量也是⼀个随机变量。
g(x1,x2,...,xn)是统计量的观测值。
常⽤的统计量:经验分布函数:经验分布函数(empirical distribution function)是根据样本得到的分布函数.如设,是总体的样本值,将它们按⼤⼩顺序排列为,则称分布函数为经验分布函数是与总体分布函数相对应的统计量。
总体的分布函数是F(x),统计量的经验分布函数是F n(x),⽤F n(x)去推断F(x),当n⾜够⼤时,F n(x)以概率1收敛于F(x)。
概率论与数理统计教案-统计量和抽样分布一、教学目标1. 理解统计量的概念,掌握常见统计量的计算方法。
2. 了解抽样分布的定义,掌握正态分布、t分布、卡方分布等常见抽样分布的特点及应用。
3. 学会使用抽样分布进行假设检验和置信区间的估计。
二、教学内容1. 统计量的概念及计算方法统计量的定义样本均值、样本方差、样本标准差等常见统计量2. 抽样分布的定义及特点抽样分布的定义正态分布、t分布、卡方分布等常见抽样分布的特点3. 抽样分布的应用假设检验置信区间的估计三、教学方法1. 讲授法:讲解统计量的概念、计算方法,抽样分布的定义及特点。
2. 案例分析法:通过具体案例,让学生学会使用抽样分布进行假设检验和置信区间的估计。
3. 互动教学法:引导学生参与课堂讨论,提问、解答问题,提高学生的积极性和主动性。
四、教学步骤1. 引入统计量的概念,讲解样本均值、样本方差、样本标准差等常见统计量的计算方法。
2. 讲解抽样分布的定义,介绍正态分布、t分布、卡方分布等常见抽样分布的特点及应用。
3. 通过具体案例,让学生学会使用抽样分布进行假设检验和置信区间的估计。
五、课后作业1. 复习本节课的内容,整理笔记。
2. 完成课后习题,加深对统计量和抽样分布的理解。
3. 选择一个感兴趣的话题,运用抽样分布进行实际问题的分析。
六、教学评估1. 课堂提问:通过提问了解学生对统计量和抽样分布的理解程度。
2. 课后习题:检查学生对课堂内容的掌握情况。
3. 实际案例分析:评估学生运用抽样分布解决实际问题的能力。
七、拓展与延伸1. 引导学生探讨抽样分布在其他领域的应用,如经济学、生物学等。
2. 介绍与抽样分布相关的高级主题,如非参数统计、贝叶斯统计等。
3. 鼓励学生参加相关竞赛、研究项目,提高实践能力。
八、教学资源1. 教材:概率论与数理统计相关教材。
2. 课件:PPT课件,辅助学生理解统计量和抽样分布的概念及应用。
3. 案例资料:提供具体案例,方便学生学会使用抽样分布进行假设检验和置信区间的估计。
概率论与数理统计本篇笔记内容主要整理自笔者的教材——《概率论与数理统计》(第四版),作者为盛骤、试式千、潘承毅等人 ,高等教育出版社出版。
一、概率论的基本概念1. 什么是概率?描述性定义:随机事件A发生的可能性的大小的度量(非负值),称为事件A发生的概率。
公理化定义:在随机试验的样本空间的每一个事件A,都对应一个实数值P(A),如果函数P( · )满足下列条件:非负性:规范性:S是必然事件,有P(S) = 1;可列可加性:设A1,A2,...,是两两不相容的事件(即i≠j时,AiAj = ∅),有P(A1∪A2∪...∪An) = P(A1) + P(A2) + ... + P(An)不相容事件的并的概率 等于 这些事件的概率的和。
2. 古典概型有什么特点?随机试验的样本空间只包含有限个元素;随机试验中的每个基本事件发生的可能性都相同。
3. 几何概型有什么特点?样本空间 是一个可度量的有界区域;有无限个基本事件,每个基本事件发生的可能性都一样,即样本点落入 的某一个可度量子区域S可能性与S的几何度量成正比,而与S的位置及形状无关。
4. 什么是条件概率?在已知事件A发生的情况下事件B发生的概率为条件概率P(A|B),公式有5. 什么是全概率公式?有一些时候事件B的概率不容易直接求,可以通过计算给B在各个条件下Ai发生的概率P(B| · ),来研究B发生的概率。
6. 什么是贝叶斯公式?解释一下“先验”和“后验”的概念(按照课本的思路)通过已知信息B来修正A发生的概率(即后验概率),可以通过先验概率P(A)以及AB之间的关系来研究。
举个例子:假设由多年的统计数据可以知道某种疾病的发病率,有一种检测试剂的准确率为99%,即=99%,同时有=5%会误报(检测没有病的病人为阳性),可以通过全概率公式计算试剂表现为阳性的概率。
根据这些信息,就可以计算一个病人在这种试剂检测为阳性的情况下患病的概率7. 什么叫做事件相互独立?P(AB) = P(A)P(B)即一个事件的发生,不会影响另一个事件的发生。
高等教育自学考试辅导《概率论与数理统计(经管类)》第二部分数理统计部分专题一统计量及抽样的分布I.考点分析近几年试题的考点分布和分数分布II.内容总结一、总体与样本1.总体:所考察对象的全体称为总体;组成总体的每个基本元素称为个体。
2.样本:从总体中随机抽取n个个体x1,x2…,x n称为总体的一个样本,个数n称为样本容量。
3.简单随机样本如果总体X的样本x1,x2…,x n满足:(1)x1与X有相同分布,i=1,2,…,n;(2)x1,x2…,x n相互独立,则称该样本为简单随机样本,简称样本。
得到简单随机样本的方法称为简单随机抽样方法。
4.样本的分布(1)联合分布函数:设总体X的分布函数为F(x),x1,x2…,x n为该总体的一个样本,则联合分布函数为二、统计量及其分布1.统计量、抽样分布:设x1,x2…,x n为取自某总体的样本,若样本函数T=T(x1,x2…,x n)不含任何未知参数,则称T为统计量;统计量的分布称为抽样分布。
2.样本的数字特征及其抽样分布:设x1,x2…,x n为取自某总体X的样本,(2)样本均值的性质:①若称样本的数据与样本均值的差为偏差,则样本偏差之和为零,即②偏差平方和最小,即对任意常数C,函数时取得最小值. (5)样本矩(7)正态分布的抽样分布A.应用于小样本的三种统计量的分布的为自由度为n的X2分布的α分位点.求法:反查X 2分布表.III.典型例题[答疑编号918020101]答案:D[答疑编号918020102]答案:[答疑编号918020103]答案:B[答疑编号918020104]答案:1[答疑编号918020105]答案:B[答疑编号918020106]故填20.[答疑编号918020107]解析:[答疑编号918020108]答案:解析:本题考核正态分布的叠加原理和x2-分布的概念。
根据课本P82,例题3-28的结果,若X~N(0,1),Y~N(0,1),且X与Y相互独立,则X+Y~N(0+0,1+1)=N(0,2)。
第六章样本及抽样分布一、选择题1.设X1 , X 2 ,L , X n是来自总体X的简单随机样本, 则X1, X2,L , X n必然满足 ( )A. 独立但分布不同 ;B. 分布相同但不相互独立 ; C 独立同分布 ; D. 不能确定2.下列关于“统计量”的描述中,不正确的是().A.统计量为随机变量 B. 统计量是样本的函数C. 统计量表达式中不含有参数D. 估计量是统计量3 下列关于统计学“四大分布”的判断中,错误的是() .1~ F (n2 ,n1)A.若 F ~ F ( n1 , n2 ), 则FB.若 T ~ t( n),则 T 2 ~ F (1,n)C .若X ~ N ( 0,1),则X2~ x2(1)n) 2( X iD .在正态总体下i 1 2(n 1)2 ~ x4.设X i , S i2表示来自总体N ( i , i2 ) 的容量为 n i的样本均值和样本方差(i 1,2) ,且两总体相互独立,则下列不正确的是() .A. 22S12~ F (n1 1,n2 1) B.( X 1 X2) (1 2)2 2 2 2 ~ N (0,1) 1S2 1 2n1 n2C. X 1 1~ t(n1 ) D.(n 1)S2 2(n2 1) S1 / n1 2 2 2~ x21nX )25.设X1, X 2,L , X n是来自总体的样本, 则1 i ( X i 是( ).n 1A. 样本矩B. 二阶原点矩C. 二阶中心矩D. 统计量6 X1,X2,L , X n是来自正态总体N (0,1) 的样本, X , S2分别为样本均值与样本方差, 则( ).n X~ t( nA. X ~ N (0,1)B. nX ~ N (0,1)C. X i2 ~ x2 (n)D. 1)i 1 S9 9X i2 285, 则样本方差 S27. 给定一组样本观测值X1, X 2,L , X9且得X i 45,i 1 i 1的观测值为 ( ).A. 7.5B.60C. 20D.65 3 28 设X服从t (n)分布 , P{|X| } a ,则 P{ X } 为( ).A. 1a B. 2a C. 1 a D. 1 1 a2 2 29 设x1, x2,L , x n是来自正态总体N (0, 22 ) 的简单随机样本,若Y a( X 1 2X 2 ) 2 b( X 3 X 4 X 5)2 c( X 6 X 7 X 8 X 9 )2服从 x 2分布,则a, b, c 的值分别为() .A. 1,1,1B.8 12 161,1,1 C. 1,1,1 D. 1,1,120 12 16 3 3 3 2 3 410 设随机变量X和Y相互独立 , 且都服从正态分布N(0,32),设 X1,X2, , X9和9X iY1,Y2, ,Y9分别是来自两总体的简单随机样本,则统计量U i 1 服从分布是92Y ii 1( ).A. t(9)B. t (8)C. N (0,81)D. N (0,9)二、填空题1.在数理统计中,称为样本.2.我们通常所说的样本称为简单随机样本,它具有的两个特点是.3.设随机变量 X1,X2, , X n相互独立且服从相同的分布, EX , DX 2 ,令X 1 nX i ,则 EX ; DX . ni 14. (X1,X2, , X10) 是来自总体X ~ N(0,0.32) 的一个样本,则102P X i 1.44 .i 15.已知样本 X 1 , X 2 , , X 16 取自正态分布总体 N ( 2,1) ,X 为样本均值, 已知 P{ X} 0.5,则.10. 6 设总体 X ~ N(,2) , X 是样本均值, S n 2是样本方差, n 为样本容量,则常用的随2机变量 (n1)S n 服从分布 .2第七章 参数估计一、选择题1.设总体 X~N(, 2), X 1,, X n 为抽取样本,则 1 n ( X iX ) 2 是().n i 1( A) 的无偏估计 ( B)2的无偏估计(C )的矩估计(D )2的矩估计2 设 X 在 [0 , a] 上服从均匀分布, a 0 是未知参数,对于容量为 n 的样本 X 1 , , X n , a的最大似然估计为( )(A ) max{X 1,X 2,, X n }1n(B )X in i 1(C ) max{X 1,X 2, , X n } min{ X 1 , X 2 ,, X n }(D ) 11 n X i ;n i 13 设总体分布为 N ( , 2) ,,2为未知参数,则2的最大似然估计量为( ) .(A ) 1n( X i X ) 2( B ) 1n( X i X )2n i 1n 1 i 1(C ) 1n( X i) 2( D ) 11 i n( X i)2n i 1n 14 设总体分布为 N ( , 2) ,已知,则2的最大似然估计量为() .(A ) S2( B )n 1S 2n(C ) 1n( X i) 2( D ) 11 i n( X i)2n i 1n 15 X 1, X 2, X 3 设为来自总体 X 的样本,下列关于 E( X ) 的无偏估计中, 最有效的为().(A )1(X 1 X 2 )(B ) 1(X 1X 2 X 3 )23(C ) 1(X 1X 2 X 3 )(D ) 2X 12X 2 1 X 3)43336 设 X 1,X 2,, X n (n 2)是正态分布 N( ,2)的一个样本,若统计量n1K( X i 1 X i ) 2 为2的无偏估计,则K 的值应该为()i 1(A )1( B )11( C )1 2 (D )12n2n2nn 17. 设 为总体 X 的未知参数, 1 , 2 是统计量,1,2为 的置信度为 1 a(0a 1) 的置信区间,则下式中不能恒成的是() .A. P{ 12}1 aB.P{2}P{1}aC. P{2}1aD.P{2}P{1}a28设X~N( , 2)且2未知,若样本容量为 n ,且分位数均指定为“上侧分位数”时,则的 95%的置信区间为( )A. ( Xu0.025)B. ( XS t 0 .05(n1))nnC. ( XSD.( X St 0 .025 ( n1))t 0.025 (n))nn9 设 X ~ N ( ,2), ,2均未知,当样本容量为n 时,2的 95%)的置信区间为(A.(( n 1)S 2, (n 1)S 2B. ( (n 1)S 2 ( n 1)S 221) 2)2 (n , 2(n )x 0.975 ( n x 0.025 (n 1)x 0.025 1) x 0.975 1)(( n 1)S 2( n 1)S 2( XSt 0. 025 (n1)) C. 2, 2) D.nt 0. 025 (n 1) t 0.975 ( n 1)二、填空题1. 点估计常用的两种方法是:和.2. 若 X 是离散型随机变量,分布律是 P{ X x} P(x; ) ,( 是待估计参数) ,则似然函数是,X 是连续型随机变量,概率密度是f (x; ) ,则似然函数是.3. 设总体 X 的概率分布列为:X 012 3P p 2 2 p(1 -p ) p2 1- 2p 其中 p (0 p 1/ 2)是未知参数. 利用总体 X 的如下样本值:1 ,3,0,2,3,3,1,3则 p 的矩估计值为__ ___ ,极大似然估计值为.4. 设总体 X 的一个样本如下:,,,,则该样本的数学期望E(X ) 和方差 D(X ) 的矩估计值分别_ ___.5. 设总体 X 的密度函数为: f ( x) ( 1)x 0 x 10 其他,设 X 1 , , X n是X的样本,则的矩估计量为,最大似然估计量为.6. 假设总体 X ~ N( , 2),且 X 1 n X i , X1,X2, , X n 为总体 X 的一个样本,n i 1则 X 是的无偏估计 .7 设总体 X~N( , 2) , X1, X2, , X n为总体X的一个样本,则常数k=, 使nk X i X 为的无偏估计量 .i 18 从一大批电子管中随机抽取100只,抽取的电子管的平均寿命为1000小时,样本均方差为S 40 .设电子管寿命分布未知,以置信度为0.95 ,则整批电子管平均寿命的置信区间为(给定 Z0. 05 1.645 , Z0.025 1.96 ).9设总体X~N( , 2), , 2 为未知参数,则的置信度为 1-的置信区间为.10某车间生产滚珠,从长期实践可以认为滚珠的直径服从正态分布,且直径的方差为20.04 ,从某天生产的产品中随机抽取9 个,测得直径平均值为15 毫米,给定0.05则滚珠的平均直径的区间估计为. ( Z0.05 1.645 , Z 0.025 1.96)11.某车间生产滚珠,从某天生产的产品中抽取6 个,测得直径为:已知原来直径服从N ( ,0.06) ,则该天生产的滚珠直径的置信区间为,(0.05,Z0.05 1.645 , Z0.025 1.96).12.某矿地矿石含少量元素服从正态分布,现在抽样进行调查,共抽取12 个子样算得S 0.2 ,则的置信区间为(, 2 (11) 19.68 ,2 (11) 4.57 ).0.1 12 2第八章假设检验一、选择题1.关于检验的拒绝域W,置信水平, 及所谓的“小概率事件” , 下列叙述错误的是().A.的值即是对究竟多大概率才算“小”概率的量化描述B .事件 {( X1 , X 2 , , X n ) W |H0为真} 即为一个小概率事件C.设 W是样本空间的某个子集,指的是事件{( X1 , X 2 ,L , X n ) | H 0为真 }D.确定恰当的W是任何检验的本质问题2. 设总体 X~N( , 2 ), 2未知 , 通过样本X1, X2, , X n检验假设 H 0 : 0,要采用检验估计量 ( ).X 0B. X 0C.XD.XA.n S / n/ S/ n / n 3. 样本 X1, X 2, , X n来自总体 N ( ,122) ,检验 H 0 : 100 ,采用统计量( ).A. XB.X 100C.X 100D.X12 / n 12 / n S / n 1 S / n4设总体X ~ N( , 2 ), 2 未知 ,通过样本X1,X2, , X n检验假设 H 0 : 0,此问题拒绝域形式为.A. { X100 C} B. {X100 C } C. {X100 C} D. { X C}S / 10 S / n S / 105.设X1, X2, , X n为来自总体N ( ,32 ) 的样本,对于H 0 : 100 检验的拒绝域可以形如() .. { X C} { X 100 C} X 100C} { X 100 C}A B. C. {n D.S /6 、样本来自正态总体N( , 2 ) , 未知 ,要检验H0: 2 100 , 则采用统计量为( ).A. (n 1)S2B.(n 1) S2C.Xn D.nS 22 100 100 1007、设总体分布为N ( , 2),若已知,则要检验H0: 2 100 ,应采用统计量 ( ).n 2 n 2A. XB. (n 1)S2C. i 1 ( X i )D.i 1( Xi X ) S / n 2 100 100二、填空题1.为了校正试用的普通天平 , 把在该天平上称量为 100 克的 10 个试样在计量标准天平上进行称量 , 得如下结果 :, , , 101,2,,假设在天平上称量的结果服从正态分布, 为检验普通天平与标准天平有无显著差异, H0 为.2.设样本X1, X2, , X25来自总体 N( ,9), 未知.对于检验 H 0 : 0,H1: 0,取拒绝域形如X 0 k ,若取a 0.05,则 k 值为.第六章样本及抽样分布答案一、选择题1. ( C )2. ( C ) 注:统计量是指不含有任何未知参数的样本的函数3. ( D )对于答案 D, 由于 X i~ N (0,1), 1,2, , n ,且相互独立,根据 2 分布的定义有i Ln ) 2( X i2i 1(n)2~ x4.(C)注:X 11~ t (n 1 1) 才是正确的 .S 1 / n 15.(D)6C) 注: X ~ N(0,1),X ~ t(n 1)才是正确的 nS nP X 12 1 2PX 12 1 12PX1225 12512(5)1299222X i XX 9 Xi 2859 257.(A)S 2 i 11i 19 17.5 988.(A) 9.(B)解:由题意可知X 1 2X 2 ~ N(0,20) , X 3X 4 X 5 ~ N (0,12) ,X 6 X 7 X 8X 9 ~ N (0,16) ,且相互独立,因此222X 1 2X 2X 3 X 4 X 5X 6 X 7X 8 X 9 ~ 23,201216即 a1, b1, c120121610(A)999解:X i ~ N (0,9 2 )X i 9 ~ N 0,1 , Y i 2 9 ~29i 1i 1i 19X i 9由 t 分布的定义有i 1~t 992Y i 81i 1二、填空题1.与总体同分布,且相互独立的一组随机变量 2. 代表性和独立性 23.,n4. 0.16.2( n 1)第七章 参数估计一、选择题1. 答案: D.222?21 n2?1 n[ 解 ] 因为E(X )A 2X i,E (X) ,E(X )X i ,E( X ) A 1n i 1n i 1所以, ? 2?2?2( X )1n2.E( X) E( X i X )n i 12. 答案: A.[ 解 ] 因为似然函数 11 ,当 amax X i 时, L(a) 最大,L(a)(max X i ) n a nii所以, a 的最大似然估计为max{ X 1 , X 2 , , X n } .3答案A.n[ 解] 似然函数 L( ,2)i 11 exp 12 ( xi) 2 ,22由ln L 0, 2 ln L 0 ,得2A 2 .4. 答案 C.[ 解]在上面第 5题中用取代 X 即可.5答案 B.6. 答案 C. 7 答案 D. 8. 答案 D.9. 答案 B.二、填空题:1. 矩估计和最大似然估计;2.p(x i ; ) ,f ( x i ; );i i.31 , ; 4816/82,令 E(X)[ 解 ] ( 1) p 的矩估计值 X X i 3 4 pX ,i 1得 p的矩估计为p (3 X ) / 4 1/ 4 .?( 2)似然函数为8x i ) P( X 0)[ P( X 1)] 2P( X 2)[ P( X 3)] 4L( p)P( Xi 14 p(1 p) 2 (1 2 p)4ln L( p) ln 46ln p 2 ln(1 p) 4 ln(1 2 p)令 [ ln L ( p)]6 1 2 1 8 0 ,12 p 2 14 p 3 0pp2 pp (7 13) /12 . 由 0 p1/ 2 ,故 p (713) /12 舍去所以 p的极大似然估计值为 p (713) /120.2828 .?4、 ,;?? 2iX i 222[ 解 ]由矩估计有:),又因为 D(X) E( X ) [E(X)],E(X ) X,E(Xn?X 1.7 1.75 1.71.65 1.75 1.71所以 E(X)5?1n2( X iX )0.00138 .且D(X)n i 1n2X 1, n ln X i5、?? i 1 ;1 X n ln Xii 1[ 解 ] ( 1)的矩估计为:11 2 11E(X ) x ( 1) x d x x2 0 2样本的一阶原点矩为:1 nx i Xn i 1所以有:1 X ? 2X 12 1 X( 2)的最大似然估计为:n nL ( X 1 , , X n; ) ( 1) X i ( 1) n ( X i )i 1 i 1nln L n ln( 1) ln X ii 1d ln L n nln X i 0d 1 i 1n得:? n ln X ii 1.nln X ii 16、;[ 解] E(X) 1 nE( X i ) n .nn i 17、;2n(n1)[ 解] 注意到X1, X2, , X n的相互独立性,X i1X1 X2 (n 1) X i X n Xnn 1E( X i X ) 0, D ( X i 2X )n所以, X i X ~ N (0, n1 2),nz21n 1 22E(| X i X |) | z | e n dzn 12nz21 n 12 2 n 12 z e 2 dzn0 n 1 22nn nkn 2n 1因为: E k | X i X | k E | X i X |i 1 i 1 2 n所以, k2n( n 1).8、. [ , ] ;[ 解 ] 这是分布未知,样本容量较大,均值的区间估计,所以有:X 1000, S 40, 0.05 , Z 0.025 1.96 的 95%的置信区间是:[ X SZ0.025 , X S Z0.025 ] [ 992.16,1007.84] . n n9、(X St (n 1), XSt (n 1)) ;n 2 n 2[ 解 ] 这是 2 为未知的情形,所以X ~ t(n 1) .S / n10、 [ , ] ;[ 解 ] 这是方差已知均值的区间估计,所以区间为:[ x Z , xn Z ]n 2 2 由题意得: x 15 2 0.04 0.05 n 9 ,代入计算可得:[15 0.2 1.96,15 0.2 1.96] ,化间得:[14.869,15.131] .9 911、 [ ,];[ 解 ]这是方差已知,均值的区间估计,所以有:置信区间为: [ Xn Z , XnZ ]2 2由题得: X 1 (14.6 15.1 14.9 14.8 15.2 15.1) 14.95 60.05 Z0.025 1.96 n 6代入即得: [14.95 0.06 1.96,14.95 0.06 1.96]6 6所以为: [14.754,15.146]12、.[,];[ 解 ] 由2(n 1)S 2 2 得:1 22 22 (n 1) S2, 2(n 1)S22 2212所以的置信区间为: [ (n 1) S2,(n 1)S22 (11) 2] ,(11)212将 n 12 , S 0.2 代入得[ 0.15 , 0.31 ]. 第八章假设检验一、选择题、、、、、、、二、填空题1.1002.。
第六章 样本及抽样分布 总体与个体:我们将试验的全部可能的观察值称为总体,这些值不一定都不相同,数目上也不一定是有限的,每一个可能观察值称为个体 总体中所包含的个体的个数称为总体的容量 容量为有限的称为有限总体 容量为无限的称为无限总体设X 是具有分布函数F 的随机变量,若,,21X X …n X ,是具有同一分布函数F 的、相互独立的随机变量,则称,,21X X …n X ,为从分布函数F (或总体F 、或总体X )得到的容量为n 的简单随机样本,简称样本,它们的观察值,,21x x …n x ,称为样本值,又称为X 的n 个独立的观察值由定义得:若,,21X X …n X ,为F 的一个样本,则,,21X X …n X ,相互独立,且它们的分布函数都是F ,所以(,,21X X …n X ,)的分布函数为,,(21*x x F …)(),1∏==ni i n x F x又若X 具有概率密度f ,则(,,21X X …n X ,)的概率密度为,,(21*x x f …).(),1∏==ni i n x f x设,,21X X …n X ,是来自总体X 的一个样本,g(,,21X X …n X ,)是,,21X X …n X ,的函数,若g 中不含未知参数,则称g(,,21X X …n X ,)是一统计量设,,21X X …n X ,是来自总体X 的一个样本,n x x x ,^,,21是这一样本的观察值,定义:样本平均值∑==ni i X n X 11样本方差⎪⎭⎫ ⎝⎛--=--=∑∑==n i i n i i X n X n X X n S 12221211)(11样本标准差∑=--==ni i X X n S S 122)(11 样本k 阶(原点)矩,2,1,11==∑=k X n A n i ki k …样本k 阶中心矩,3,2,)(11=-=∑=k X X n B k ni i k …经验分布函数设,,21X X …n X ,是总体F 的一个样本,用∞<<-∞x x S ),(表示,,21X X …n X ,中不大于x 的随机变量的个数。