条件分布律条件分布函数条件概率密度
- 格式:ppt
- 大小:1.52 MB
- 文档页数:57
第一章 概率论的基本概念定义: 随机试验E 的每个结果样本点组成样本空间S ,S 的子集为E 的随机事件,单个样本点为基本事件.事件关系:1.A ⊂B ,A 发生必导致B 发生.2.A B 和事件,A ,B 至少一个发生,A B 发生. 3.A B 记AB 积事件,A ,B 同时发生,AB 发生. 4.A -B 差事件,A 发生,B 不发生,A -B 发生. 5.A B=?,A 与B 互不相容(互斥),A 与B 不能同时发生,基本事件两两互不相容.6.A B=S 且A B=?,A 与B 互为逆事件或对立事件,A 与B 中必有且仅有一个发生,记B=A S A -=.事件运算: 交换律、结合律、分配率略.德摩根律:B A B A =,B A B A =.概率: 概率就是n 趋向无穷时的频率,记P(A). 概率性质: 1.P (?)=0.2.(有限可加性)P (A 1 A 2 … A n )=P (A 1)+P (A 2)+…+P (A n ),A i 互不相容.3.若A ⊂B ,则P (B -A)=P (B)-P (A). 4.对任意事件A ,有)A (1)A (P P -=.5.P (A B)=P (A)+P (B)-P (AB).古典概型: 即等可能概型,满足:1.S 包含有限个元素.2.每个基本事件发生的可能性相同. 等概公式:中样本点总数中样本点数S A )A (==n k P . 超几何分布:⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛--⎪⎪⎭⎫ ⎝⎛=n N k n D N k D p ,其中ra C r a =⎪⎪⎭⎫ ⎝⎛. 条件概率: )A ()AB ()A B (P P P =. 乘法定理:)A ()A B ()AB C ()ABC ()A ()AB ()AB (P P P P P P P ==.全概率公式:)B ()B A ()B ()B A ()B ()B A ()A (2211n n P P P P P P P +++= ,其中i B 为S 的划分.贝叶斯公式: )A ()B ()B A ()A B (P P P P i i i =,∑==nj j j B P B A P A P 1)()()(或)()()()()()()(B P B A P B P B A P B P B A P A B P +=.独立性: 满足P (AB)=P (A)P (B),则A ,B 相互独立,简称A ,B 独立. 定理一: A ,B 独立,则.P (B |A)=P (B).定理二: A ,B 独立,则A 与B ,A 与B ,A 与B 也相互独立. 第二章 随机变量及其分布(0—1)分布:k k p p k X P --==1)1(}{,k =0,1 (0<p <1).伯努利实验:实验只有两个可能的结果:A 及A .二项式分布: 记X~b (n ,p ),kn kkn p p C k X P --==)1(}{. n 重伯努利实验:独立且每次试验概率保持不变.其中A 发生k 次,即二项式分布.泊松分布: 记X~π(λ),!}{k e k X P k λλ-==, ,2,1,0=k .泊松定理: !)1(lim k e p p C k kn k knn λλ--∞→=-,其中λ=np .当20≥n ,05.0≤p 应用泊松定理近似效果颇佳.随机变量分布函数: }{)(x X P x F ≤=,+∞<<∞-x .)()(}{1221x F x F x X x P -=≤<.连续型随机变量: ⎰∞-=xt t f x F d )()(,X 为连续型随机变量,)(x f 为X 的概率密度函数,简称概率密度.概率密度性质:1.0)(≥x f ;2.1d )(=⎰+∞∞-x x f ;3.⎰=-=≤<21d )()()(}{1221x x x x f x F x F x X x P ;4.)()(x f x F =',f (x )在x 点连续;5.P {X=a }=0.均匀分布: 记X~U(a ,b );⎪⎩⎪⎨⎧<<-=其它,,01)(bx a ab x f ;⎪⎩⎪⎨⎧≥<≤--<=b x b x a a b a x a x x F ,,,10)(. 性质:对a ≤c <c +l ≤b ,有 指数分布:⎪⎩⎪⎨⎧>=-其它,,001)(x e x f x θθ;⎩⎨⎧>-=-其它,,001)(x e x F x θ. 无记忆性: }{}{t X P s X t s X P >=>+>. 正态分布: 记),(~2σμN X ;]2)(ex p[21)(22σμσπ--=x x f ;t t x F xd ]2)(ex p[21)(22⎰∞---=σμσπ.性质: 1.f (x )关于x =μ对称,且P {μ-h <X ≤μ}=P {μ<X ≤μ+h };2.有最大值f (μ)=(σπ2)-1.标准正态分布: ]2exp[21)(2x x -=πϕ;⎰∞--=Φxt t x d ]2ex p[21)(2π.即μ=0,σ=1时的正态分布X ~N(0,1)性质:)(1)(x x Φ-=-Φ.正态分布的线性转化: 对),(~2σμN X有)1,0(~N X Z σμ-=;且有)(}{}{)(σμσμσμ-Φ=-≤-=≤=x x X P x X P x F .正态分布概率转化:)()(}{1221σμσμ-Φ--Φ=≤<x x x X x P ;1)(2)()(}{-Φ=-Φ-Φ=+<<-t t t t X t P σμσμ.3σ法则: P =Φ(1)-Φ(-1)=68.26%;P =Φ(2)-Φ(-2)=95.44%;P =Φ(3)-Φ(-3)=99.74%,P 多落在(μ-3σ,μ+3σ)内. 上ɑ分位点: 对X~N(0,1),若z α满足条件P {X>z α}=α,0<α<1,则称点z α为标准正态分布的上α分位点.常用 上ɑ分位点: 0.001 0.005 0.01 0.025 0.05 0.10 3.0902.5762.3261.9601.6451.282Y 服从自由度为1的χ2分布:设X 密度函数f X (x ),+∞<<∞-x ,若Y=X 2,则⎪⎩⎪⎨⎧≤>-+=000)]()([21)(y y y f y f y y f X XY ,,若设X ~N(0,1),则有⎪⎩⎪⎨⎧≤>=--00021)(221y y e y y f y Y ,,π定理:设X 密度函数f X (x ),设g (x )处处可导且恒有g ′(x )>0(或g ′(x )<0),则Y=g (X)是连续型随机变量,且有h (y )是g (x )的反函数;①若+∞<<∞-x ,则α=min{g (?∞),g (+∞)},β=max{g (?∞),g (+∞)};②若f X (x )在[a ,b ]外等于零,g (x )在[a ,b ]上单调,则α=min{g (a ),g (b )},β=max{g (a ),g (b )}.应用: Y=aX +b ~N(a μ+b ,(|a |σ)2).第三章 多维随机变量及其分布二维随机变量的分布函数:分布函数(联合分布函数):)}(){(),(y Y x X P y x F ≤≤= ,记作:},{y Y x X P ≤≤.),(),(),(),(},{112112222121y x F y x F y x F y x F y Y y x X x P +--=≤<≤<.F (x ,y )性质: 1.F (x ,y )是x 和y 的不减函数,即x 2>x 1时,F (x 2,y )≥F (x 1,y );y 2>y 1时,F (x ,y 2)≥F (x ,y 1). 2.0≤F (x ,y )≤1且F (?∞,y )=0,F (x ,?∞)=0,F (?∞,?∞)=0,F (+∞,+∞)=1. 3.F (x +0,y )=F (x ,y ),F (x ,y +0)=F (x ,y ),即F (x ,y )关于x 右连续,关于y 也右连续. 4.对于任意的(x 1,y 1),(x 2,y 2),x 2>x 1,y 2>y 1,有P {x 1<X ≤x 2,y 1<Y ≤y 2}≥0.离散型(X ,Y ):0≥ij p ,111=∑∑∞=∞=ij j i p ,ij yy x x p y x F i i ∑∑=≤≤),(.连续型(X ,Y ):v u v u f y x F yxd d ),(),(⎰⎰∞-∞-=.f (x ,y )性质: 1.f (x ,y )≥0.2.1),(d d ),(=∞∞=⎰⎰∞∞-∞∞-F y x y x f .3.y x y x f G Y X P G⎰⎰=∈d d ),(}),{(. 4.若f (x ,y )在点(x ,y )连续,则有),(),(2y x f yx y x F =∂∂∂.n 维: n 维随机变量及其分布函数是在二维基础上的拓展,性质与二维类似.边缘分布: F x (x ),F y (y )依次称为二维随机变量(X ,Y )关于X 和Y 的边缘分布函数,F X (x )=F (x ,∞),F Y (y )=F (∞,y ). 离散型: *i p 和j p *分别为(X ,Y )关于X 和Y 的边缘分布律,记}{1i ij j i x X P p p ==∑=∞=*,}{1j ij i j y Y P p p ==∑=∞=*. 连续型:)(x f X ,)(y f Y 为(X ,Y )关于X 和Y 的边缘密度函数,记⎰∞∞-=y y x f x f X d ),()(,⎰∞∞-=x y x f y f Y d ),()(. 二维正态分布:]})())((2)([)1(21exp{121),(2222212121212221σμσσμμρσμρρσπσ-+-------=y y x x y x f . 记(X ,Y )~N (μ1,μ2,σ12,σ22,ρ)]2)(exp[21)(21211σμσπ--=x x f X ,∞<<∞-x .]2)(exp[21)(22222σμσπ--=y y f Y ,∞<<∞-y . 离散型条件分布律:jij j j i j i p p y Y P y Y x X P y Y x X P *=======}{},{}{.*=======i ij i j i i j p p x X P y Y x X P x X y Y P }{},{}{.连续型条件分布:条件概率密度:条件分布函数:含义:当0→ε时,)|(d )|(}|{||y x F x y x f y Y y x X P Y X xY X =≈+≤<≤⎰∞-ε.均匀分布: 若⎪⎩⎪⎨⎧∈=其他,0),(,1),(Gy x Ay x f ,则称(X ,Y)在G 上服从均匀分布. 独立定义:若P {X ≤x ,Y ≤y }=P {X ≤x }P {Y ≤y },即F (x ,y )=F x (x )F y (y ),则称随机变量X 和Y 是相互独立的. 独立条件或可等价为:连续型:f (x ,y )=f x (x )f y (y );离散型:P {X =x i ,Y =y j }=P {X =x i }P {Y =y j }.正态独立: 对于二维正态随机变量(X ,Y ),X 和Y 相互对立的充要条件是:参数ρ=0.n 维延伸: 上述概念可推广至n 维随机变量,要注意的是边缘函数或边缘密度也是多元(1~n -1元)的.定理:设(X 1,X 2,…,X m )和(Y 1,Y 2,…,Y n )相互独立,则X i 和Y j 相互独立.又若h ,g 是连续函数,则h (X 1,X 2,…,X m )和g (Y 1,Y 2,…,Y n )相互独立.Z=X+Y 分布: 若连续型(X ,Y )概率密度为f (x ,y ),则Z=X+Y 为连续型且其概率密度为 ⎰∞∞-+-=y y y z f z f Y X d ),()(或⎰∞∞-+-=x x z x f z f Y X d ),()(.f X 和f Y 的卷积公式: 记⎰∞∞-+-==y y f y z f z f f f Y X Y X Y X d )()()(*⎰∞∞--=x x z f x f Y X d )()(,其中除继上述条件,且X 和Y 相互独立,边缘密度分别为f X (x )和f Y (y ).正态卷积:若X 和Y 相互独立且X ~N (μ1,σ12),记Y ~N (μ2,σ22),则对Z=X+Y 有Z ~N (μ1+μ2,σ12+σ22).1.上述结论可推广至n 个独立正态随机变量.2.有限个独立正态随机变量的线性组合仍服从正态分布. 伽马分布:记),(~θαΓX ,0>α,0>θ.⎪⎩⎪⎨⎧>Γ=--其他,,00)(1)(1x e x x f x θαααθ,其中⎰+∞--=Γ01d )(t e t tαα.若X 和Y 独立且X ~Γ(α,θ),记Y ~Γ(β,θ),则有X+Y~Γ(α+β,θ).可推广到n 个独立Γ分布变量之和.XYZ =: ⎰∞∞-=x xz x f x z f X Y d ),()(,若X 和Y 相互独立,则有⎰∞∞-=x xz f x f x z f Y X X Y d )()()(.XYZ =分布: ⎰∞∞-=xxzx f x z f XY d ),(1)(,若X 和Y 相互独立,则有⎰∞∞-=x x z f x f x z f Y X XY d )()(1)(. 大小分布:若X 和Y 相互独立,且有M =max{X ,Y }及N =min{X ,Y },则M 的分布函数:F max (z )=F X (z )F Y (z ),N 的分布函数:F min (z )=1-[1-F X (z )][1-F Y (z )],以上结果可推广到n 个独立随机变量的情况.第四章 随机变量的数字特征数学期望: 简称期望或均值,记为E (X );离散型:k k k p x X E ∑=∞=1)(.连续型:⎰∞∞-=x x xf X E d )()(.定理: 设Y 是随机变量X 的函数:Y =g (X )(g 是连续函数).1.若X 是离散型,且分布律为P {X =x k }=p k ,则:k k k p x g Y E )()(1∑=∞=.2.若X 是连续型,概率密度为f (x ),则:⎰∞∞-=x x f x g Y E d )()()(.定理推广: 设Z 是随机变量X ,Y 的函数:Z =g (X ,Y )(g 是连续函数).1.离散型:分布律为P {X =x i ,Y =y j }=p ij ,则:ij j i i j p y x g Z E ),()(11∑∑=∞=∞=. 2.连续型:⎰⎰∞∞-∞∞-=y x y x f y x g Z E d d ),(),()(期望性质:设C 是常数,X 和Y 是随机变量,则:1.E (C )=C .2.E (CX )=CE (X ).3.E (X +Y )=E (X )+E (Y ). 4.又若X 和Y 相互独立的,则E (XY )=E (X )E (Y ).方差: 记D (X )或Var(X ),D (X )=Var(X )=E {[X -E (X )]2}.标准差(均方差): 记为σ(X ),σ(X )= .通式:22)]([)()(X E X E X D -=. k k k p X E x X D 21)]([)(-∑=∞=,⎰∞∞--=x x f x E x X D d )()]([)(2.标准化变量:记σμ-=x X *,其中μ=)(X E ,2)(σ=X D ,*X 称为X 的标准化变量. 0)(*=X E ,1)(*=X D .方差性质: 设C 是常数,X 和Y 是随机变量,则:1.D (C )=0. 2.D (CX )=C 2D (X ),D (X +C )=D (X ).3.D (X +Y )=D (X )+D (Y )+2E {(X -E (X ))(Y -E (Y ))},若X ,Y 相互独立D (X +Y )=D (X )+D (Y ). 4.D (X )=0的充要条件是P {X =E (X )}=1.正态线性变换: 若),(~2ii iN X σμ,i C 是不全为0的常数,则),(~22112211i i ni i i ni n n C C N X C X C X C σμ∑∑+++== .切比雪夫不等式:22}{εσεμ≤≥-X P 或221}{εσεμ-≥<-X P ,其中)(X E =μ,)(2X D =σ,ε为任意正数.协方差:记)]}()][({[),Cov(Y E Y X E X E Y X --=.X 与Y 的相关系数:)()(),Cov(Y D X D Y X XY =ρ.D (X +Y )=D (X )+D (Y )+2Cov(X ,Y ),Cov(X ,Y )=E (XY )-E (X )E (Y ).性质: 1.Cov(aX ,bY )=ab Cov(X ,Y ),a ,b 是常数.2.Cov(X 1+X 2,Y )=Cov(X 1,Y )+Cov(X 2,Y ). 系数性质:令e =E [(Y -(a +bX ))2],则e 取最小值时有)()1(]))([(2200min Y D X b a Y E e XY ρ-=+-=,其中)()(00X E b Y E a -=,)(),Cov(0X D Y X b =.1.|ρXY |≤1.2.|ρXY |=1的充要条件是:存在常数a ,b 使P {Y =a +bX }=1.|ρXY |越大e 越小X 和Y 线性关系越明显,当|ρXY |=1时,Y =a +bX ;反之亦然,当ρXY =0时,X 和Y 不相关. X 和Y 相互对立,则X 和Y 不相关;但X 和Y 不相关,X 和Y 不一定相互独立. 定义: k 阶矩(k 阶原点矩):E (X k ). n 维随机变量X i 的协方差矩阵:⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=nn n n n n c c c c c c c c c 212222111211C , =E {[X i -E (X i )][X j -E (X j )]}. k +l 阶混合矩:E (X k Y l).k 阶中心矩:E {[X -E (X )] k }.k +l 阶混合中心矩: E {[X -E (X )]k [Y -E (Y )]l }.n 维正态分布:)}()(21ex p{det )2(1),,,(1T 221μX C μX C ---=-n n x x x f π ,T21T 21),,,(),,,(n n x x x μμμ ==μX .性质:1.n 维正态随机变量(X 1,X 2,…,X n )的每一个分量X i (i =1,2,…,n )都是正态随机变量,反之,亦成立. 2.n 维随机变量(X 1,X 2,…,X n )服从n 维正态分布的充要条件是X 1,X 2,…,X n 的任意线性组合l 1X 1+l 2X 2+…+l n X n 服从一维正态分布(其中l 1,l 2,…,l n 不全为零).3.若(X 1,X 2,…,X n )服从n 维正态分布,且Y 1,Y 2,…,Y k 是X j (j =1,2,…,n )的线性函数,则(Y 1,Y 2,…,Y k )也服从多维正态分布.4.若(X 1,X 2,…,X n )服从n 维正态分布,则“X i 相互独立”与“X i 两两不相关”等价.第五章 大数定律及中心极限定理弱大数定理:若X1,X2,…是相互独立并服从同一分布的随机变量序列,且E(X k)=μ,则对任意ε>0有11lim1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμknknXnP或→μPX,knkXnX11=∑=.定义:Y1,Y2,…,Y n ,…是一个随机变量序列,a是一个常数.若对任意ε>0,有则称序列Y1,Y2,…,Yn,…依概率收敛于a.记伯努利大数定理:对任意ε>0有1lim=⎭⎬⎫⎩⎨⎧<-∞→εpnfP An或0lim=⎭⎬⎫⎩⎨⎧≥-∞→εpnfP An.其中f A是n次独立重复实验中事件A发生的次数,p是事件A在每次试验中发生的概率.中心极限定理定理一:设X1,X2,…,X n ,…相互独立并服从同一分布,且E(X k)=μ,D(X k)=σ2 >0,则n→∞时有σμnnXknk)(1-∑=N(0,1)或nXσμ-~N(0,1)或X~N(μ,n2σ).定理二:设X1,X2,…,X n ,…相互独立且E(X k)=μ k,D(X k)=σ k2 >0,若存在δ>0使n→∞时,}|{|1212→-∑+=+δδμkknknXEB,则nknkknkBX)(11μ==∑-∑~N(0,1),记212knknBσ=∑=.定理三:设),(~pnbnη,则n→∞时,Npnpnpn~)1()(--η(0,1),knknX1=∑=η.第六章样本及抽样分布定义:总体:全部值;个体:一个值;容量:个体数;有限总体:容量有限;无限总体:容量无限.定义:样本:X1,X2,…,X n 相互独立并服从同一分布F的随机变量,称从F得到的容量为n的简单随机样本.频率直方图:图形:以横坐标小区间为宽,纵坐标为高的跨越横轴的几个小矩形.横坐标:数据区间(大区间下限比最小数据值稍小,上限比最大数据值稍大;小区间:均分大区间,组距Δ=大区间/小区间个数;小区间界限:精度比数据高一位).图形特点:外轮廓接近于总体的概率密度曲线.纵坐标:频率/组距(总长度:<1/Δ;小区间长度:频率/组距).定义:样本p分位数:记x p,有1.样本x i中有np个值≤x p.2.样本中有n(1-p)个值≥x p.箱线图:x p选择:记⎪⎩⎪⎨⎧∈+∉=++NnpxxNnpxxnpnpnpp当,当,][211)()()1]([.分位数x0.5,记为Q2或M,称为样本中位数.分位数x0.25,记为Q1,称为第一四分位数.分位数x0.75,记为Q3,称为第三四分位数.图形:图形特点:M为数据中心,区间[min,Q1],[Q1,M],[M,Q3],[Q3,max]数据个数各占1/4,区间越短数据密集.四分位数间距:记IQR=Q3-Q1;若数据X<Q1-1.5IQR或X>Q3+1.5IQR,就认为X是疑似异常值.抽样分布:样本平均值:样本方差:样本标准差:样本k阶(原点)矩:kinikXnA11=∑=,k≥1 样本k阶中心矩:kinikXXnB)(11-∑==,k≥2经验分布函数:)(1)(xSnxFn=,∞<<∞-x.)(xS表示F的一个样本X1,X2,…,X n 中不大于x的随机变量的个数.自由度为n 的χ2分布:记χ2~χ2(n),222212nXXX+++=χ,其中X1,X2,…,X n是来自总体N(0,1)的样本.E(χ2 )=n,D(χ2 )=2n.χ12+χ22~χ2(n1+n2).⎪⎩⎪⎨⎧>Γ=--其他,,)2(21)(2122yexnyfynn.χ2分布的分位点:对于0<α<1,满足αχχαχα==>⎰∞yyfnPn)(222d)()}({,则称)(2nαχ为)(2nχ的上α分位点.当n充分大时(n>40),22)12(21)(-+≈nznααχ,其中αz是标准正态分布的上α分位点.自由度为n 的t分布:记t~t(n),nYXt/=,其中X~N(0,1),Y~χ2(n),X,Y相互独立.h(t)图形关于t=0对称;当n充分大时,t分布近似于N(0,1)分布.t分布的分位点:对于0<α<1,满足ααα==>⎰∞t t hnttPnt)(d)()}({,则称)(ntα为)(nt的上α分位点.~ 近似的min Q1 M Q3 max由h (t )对称性可知t 1-α(n )=-t α(n ).当n >45时,t α(n )≈z α,z α是标准正态分布的上α分位点.自由度为(n 1,n 2)的F分布: 记F ~F (n 1,n 2),21n V n U F=,其中U~χ2(n 1),V~χ2(n 2),X ,Y 相互独立.1/F ~F (n 2,n 1) F 分布的分位点:对于0<α<1,满足αψαα==>⎰∞y y n n F FP n n F ),(2121d )()},({,则称),(21n n F α为),(21n n F 的上α分位点.重要性质:F 1-α(n 1,n 2)=1/F α(n 1,n 2).定理一: 设X 1,X 2,…,X n 是来自N (μ,σ2)的样本,则有),(~2n N X σμ,其中X 是样本均值.定理二:设X 1,X 2,…,X n 是来自N (μ,σ2)的样本,样本均值和样本方差分别记为 X ,2S ,则有1.)1(~)1(222--n S n χσ;2.X 与2S 相互独立.定理三:设X 1,X 2,…,X n 是来自N (μ,σ2)的样本,样本均值和样本方差分别记为X ,2S ,则有)1(~--n t nS X μ.定理四:设X 1,X 2,…,X n 1 与Y 1,Y 2,…,Y n 2分别是来自N (μ1,σ12)和N (μ2,σ22)的样本,且相互独立.设这两个样本的样本均值和样本方差分别记为 X ,Y ,21S,22S,则有1.)1,1(~2122212221--n n F S S σσ.2.当σ12=σ22=σ2时,)2(~)()(21121121-++-----n n t n n S Y X w μμ,其中2)1()1(212222112-+-+-=n n S n S n S w,2w w S S =. 第七章 参数估计定义: 估计量:),,,(ˆ21n X X X θ,估计值:),,,(ˆ21nx x x θ,统称为估计. 矩估计法:令)(ll X E =μ=li n i l X n A 11=∑=(k l ,,2,1 =)(k 为未知数个数)联立方程组,求出估计θˆ. 设总体X 均值μ及方差σ2都存在,则有 X A ==1ˆμ,212212122)(11ˆX X n X X n A A i n i i n i -∑=-∑=-===σ. 最大似然估计法:似然函数:离散:);()(1θθi ni x p L =∏=或连续:);()(1θθi ni x f L =∏=,)(θL 化简可去掉与θ无关的因式项.θˆ即为)(θL 最大值,可由方程0)(d d=θθL 或0)(ln d d=θθL 求得. 当多个未知参数θ1,θ1,…,θk 时:可由方程组0d d =L i θ或0ln d d =L iθ(k i ,,2,1 =)求得. 最大似然估计的不变性:若u =u (θ)有单值反函数θ=θ(u ),则有)ˆ(ˆθu u=,其中θˆ为最大似然估计. 截尾样本取样: 定时截尾样本:抽样n 件产品,固定时间段t 0内记录产品个体失效时间(0≤t 1≤t 2≤…≤t m ≤t 0)和失效产品数量. 定数截尾样本:抽样n 件产品,固定失效产品数量数量m 记录产品个体失效时间(0≤t 1≤t 2≤…≤t m ).结尾样本最大似然估计: 定数截尾样本:设产品寿命服从指数分布X~e (θ),θ即产品平均寿命.产品t i 时失效概率P {t =t i }≈f (t i )d t i ,寿命超过t m 的概率θm t m et tF -=>}{,则)(}){()(1i mi mn m m nt P t t F CL =-∏>=θ,化简得)(1)(m t s m e L ---=θθθ,由0)(ln d d =θθL 得:mt s m )(ˆ=θ,其中s (t m )=t 1+t 2+…+t m +(n -m )t m ,称为实验总时间. 定时截尾样本:与定数结尾样本讨论类似有s (t 0)=t 1+t 2+…+t m +(n -m )t 0,)(01)(t s m e L ---=θθθ,mt s )(ˆ0=θ,. 无偏性: 估计量),,,(ˆ21nX X X θ的)ˆ(θE 存在且θθ=)ˆ(E ,则称θˆ是θ的无偏估计量. 有效性:),,,(ˆ211n X X X θ与),,,(ˆ212n X X X θ都是θ的无偏估计量,若)ˆ()ˆ(21θθD D ≤,则1ˆθ较2ˆθ有效.相合性: 设),,,(ˆ21nX X X θθ的估计量,若对于任意0>ε有1}|ˆ{|lim =<-∞→εθθP n ,则称θˆ是θ的相合估计量. 置信区间:αθθθ-≥<<1)},,,(),,,({2121n n X X X X X X P ,θ和θ分别为置信下限和置信上限,则),(θθ是θ的一个置信水平为α-1置信区间,α-1称为置信水平,10<<α.正态样本置信区间: 设X 1,X 2,…,X n 是来自总体X ~N (μ,σ2)的样本,则有μ的置信区间:枢轴量W W 分布 a ,b 不等式 置信水平 置信区间其中z α/2为上α分位点 θ置信区间的求解: 1.先求枢轴量:即函数W =W (X 1,X 2,…,X n ;θ),且函数W 的分布不依赖未知参数.如上讨论标注2.对于给定置信水平α-1,定出两常数a ,b 使P {a <W <b }=α-1,从而得到置信区间.(0-1)分布p 的区间估计:样本容量n >50时,⇒--∞→)1,0(~)1()(lim N p np np X n n {}⇒-≈<--αα1)1()(2z p np np X n P0)2()(222222<++-+X n p z X n p z n αα⇒若令22αz n a +=,)2(22αz X n b +-=,2X n c =,则有置信区间(a ac b b 2)4(2---,a ac b b 2)4(2-+-).单侧置信区间: 若αθθ-≥>1}{P 或αθθ-≥<1}{P ,称(θ,∞)或(∞-,θ)是θ的置信水平为α-1的单侧置信区间.正态总体均值、方差的置信区间与单侧置信限(置信水平为α-1)待估 其他 枢轴量W 的分布置信区间单侧置信限一个正态总体μσ2已知ασμz nX +=,ασμz nX -=μ σ2未知αμt n S X +=,αμt nSX -= σ2μ未知2122)1(αχσ--=S n ,222)1(αχσS n -=两个正态总体 μ1-μ2 σ12,σ22 已知μ1-μ2 σ12=σ22=σ2 未知σ12/σ22μ1,μ2 未知ασσ-=1222122211F S S ,ασσF S S 122212221=单个总体X ~N (μ,σ2),两个总体X ~N (μ1,σ12),Y ~N (μ2,σ22).第八章 假设实验定义: H 0:原假设或零假设,为理想结果假设;H 1:备择假设,原假设被拒绝后可供选择的假设. 第Ⅰ类错误:H 0实际为真时,却拒绝H 0.第Ⅱ类错误:H 0实际为假时,却接受H 0.显着性检验:只对犯第第Ⅰ类错误的概率加以控制,而不考虑第Ⅱ类错误的概率的检验.P {当H 0为真拒绝H 0}≤α,α称为显着水平.拒绝域:取值拒绝H 0.临界点:拒绝域边界.双边假设检验:H 0:θ=θ0,H 1:θ≠θ0.右边检验:H 0:θ≤θ0,H 1:θ>θ0.左边检验:H 0:θ≥θ0,H 1:θ<θ0.正态总体均值、方差的检验法(显着性水平为α)原假设H 0备择假设H 1检验统计量拒绝域 1 σ2已知μ≤μ0μ>μ0z ≥z α μ≥μ0 μ<μ0 z ≤-z α μ=μ0μ≠μ0|z |≥z α/22 σ2未知μ≤μ0μ>μ0t≥tα(n-1) μ≥μ0μ<μ0t≤-tα(n-1) μ=μ0μ≠μ0|t|≥tα/2(n-1)3 σ1,σ2已知μ1-μ2≤δμ1-μ2>δz≥zαμ1-μ2≥δμ1-μ2<δz≤-zαμ1-μ2=δμ1-μ2≠δ|z|≥zα/24 σ12=σ22=σ2未知μ1-μ2≤δμ1-μ2>δt≥tα(n1+n2-2)μ1-μ2≥δμ1-μ2<δt≤-tα(n1+n2-2)μ1-μ2=δμ1-μ2≠δ|t|≥tα/2(n1+n2-2)5 μ未知σ2≤σ02σ2>σ02χ2≥χα2(n-1)σ2≥σ02σ2<σ02χ2≤χ21-α(n-1)σ2=σ02σ2≠σ02χ2≥χ2α/2(n-1)或χ2≤χ21-α/2(n-1)6 μ1,μ2未知σ12≤σ22σ12>σ22F≥Fα(n1-1,n2-1)σ12≥σ22σ12<σ22F≤F1-α(n1-1,n2-1)σ12=σ22σ12≠σ22F≥Fα/2(n1-1,n2-1)或F≤F1-α/2(n1-1,n2-1)7成对数据μD≤0 μD>0 t≥tα(n-1)μD≥0 μD<0 t≤-tα(n-1)μD=0 μD≠0 |t|≥tα-2(n-1)检验方法选择:主要是逐对比较法(成对数据)跟两个正态总体均值差的检验的区别,如上表即7跟3、4的区别,成对数据指两样本X和Y之间存在一一对应关系,而3和4一般指X和Y相互对立,但针对同一实体.关系:置信区间与假设检验之间的关系:未知参数的置信水平为1-α的置信区间与显着水平为α的接受域相同.定义:施行特征函数(OC函数):β(θ)=Pθ(接受H0).功效函数:1-β(θ).功效:当θ*∈H1时,1-β(θ*)的值.。
联合概率密度和条件概率密度范围概率密度函数是概率论中常用的一种描述随机变量概率分布的函数。
在概率论中,联合概率密度函数和条件概率密度函数是两个重要的概念。
联合概率密度函数是用来描述两个或多个随机变量的联合概率分布的函数。
具体来说,对于两个随机变量X和Y,联合概率密度函数f(x,y)定义为在二维平面上,事件(X=x,Y=y)发生的概率密度。
联合概率密度函数可以用来计算两个随机变量的联合概率分布以及它们之间的相关性。
通过对联合概率密度函数的积分,可以计算出两个随机变量的边缘概率密度函数。
条件概率密度函数是在给定某个事件发生的条件下,另一个事件发生的概率密度函数。
对于两个随机变量X和Y,条件概率密度函数f(y|x)表示在已知X=x的条件下,Y=y的概率密度。
条件概率密度函数可以用来计算在给定某个条件下,另一个事件发生的概率分布。
联合概率密度函数和条件概率密度函数在许多领域都有广泛的应用。
在统计学中,它们可以用来描述变量之间的关系,从而进行数据分析和建模。
在机器学习中,它们可以用来构建分类器和回归模型。
在信号处理中,它们可以用来分析和处理随机信号。
在金融学中,它们可以用来对金融市场进行建模和预测。
联合概率密度函数和条件概率密度函数的性质和计算方法与概率密度函数类似。
它们都满足非负性、归一性和可积性。
非负性要求概率密度函数的取值非负,归一性要求概率密度函数的积分等于1,可积性要求概率密度函数在定义域上可积。
计算联合概率密度函数和条件概率密度函数的方法主要有两种:参数估计和非参数估计。
参数估计是假设概率密度函数属于某个已知的函数族,通过最大似然估计或贝叶斯估计来确定概率密度函数的参数。
非参数估计则不对概率密度函数做任何假设,直接根据样本数据来估计概率密度函数。
在实际应用中,由于概率密度函数的计算复杂度较高,通常使用概率密度函数的近似方法来进行计算。
常用的近似方法包括直方图法、核密度估计法和混合模型法等。
联合概率密度函数和条件概率密度函数是概率论中重要的概念,它们可以用来描述随机变量之间的关系,进行数据分析和建模。
概率论与统计学的重要公式和解题思路⼀、基本概率公式及分布1、概率常⽤公式:P(A+B)=P(A)+P(B)-P(AB) ;P(A-B)=P(A)-P(AB) ; 如A、B独⽴,则P(AB)=P(A)P(B) ; P()=1-P(A) ;B发⽣的前提下A发⽣的概率==条件概率:P(A|B)=;或记:P(AB)=P(A|B)*P(B) ;2、随机变量分布律、分布函数、概率密度分布律:离散型X的取值是x k(k=1,2,3...), 事件X=x k的概率为:P{X=x k}=P k, k=1,2,3...; --- 既X的分布律;X X1 X2 .... xnPk P1 P2 ... pnX的分布律也可以是上⾯的表格形式,⼆者都可以。
分布函数:F(x)=P(X), -; 是概率的累积!P(x1离散型rv X; F(x)= P{X;(把X性质:F(; F(;⼆、常⽤概率分布:①离散:⼆项分布:事件发⽣的概率为p,重复实验n次,发⽣k 次的概率(如打靶、投篮等),记为B(n,p) P{X=k}=,k=0,1,2,...n; E(X)=np, D(X)=np(1-p);②离散:泊松分布:X~Π(λ)P{X=k}=,k=0,1,2,...; E(X)=λ, D(X)=λ;③连续型:均匀分布:X在(a,b)上均匀分布,X~U(a,b),则:密度函数:f(x)=分布函数F(x)==④连续型:指数分布,参数为,f(x)=⑤连续型:正态分布:X~N(most importment!密度函数f(x),表达式不⽤记!⼀定要记住对称轴x=µ, E(X)=µ,⽅差D(X)=; 当µ=0,时,N(0,1)称标准正态,图形为:分布函数F(x)为密度函数f(x)从(-∞,x)围成的⾯积。
当X~N(0,1),F(x)=Φ(x)(换个叫法), 由对称性有Φ(-a)=1-Φ(a);看到X~N(,求概率的题,⼀定要变成标准正态N(0,1);既把X变成;则~N(0,1);例题:已知X~N(;求P(-1解:(思路:µ=1,σ=2;变换式:)P(-1P()= Φ(1)- Φ(-1)= Φ(1)-[1-Φ(1)]=2Φ(1)-1;查表正态性质:如X~N(N(;则Z=aX+bY也是正态;Z~N(,其中µz=aµ1+bµ2 ;σz2=a2σ12+b2σ22;三、⼆维随机变量:离散型:(X,Y)可能取值(xi,yj)(i,j=1,2,...).联合分布律:P{X=xi,Y=yj)=pij, (i,j=1,2,3,..)联合分布律的表格形式:XYY1 Y2 Y3 P(X=I)X1 P11 P12 P13 P11+P12+P13X2 P21 P22 P23 P21+P22+P23X3 P31 P32 P33 P31+P32+P33P(Y= J) P11+P21+P31P12+P22+PP13+P23+P33边缘分布:P(X=1)=P11+P12+P13(横排相加); P(X=2),P(X=3)同样计算P(Y=1)=P11+P21+P31(竖排相加); P(Y=2) ,P(Y=3)类似计算;条件概率:X=X1条件下Y的分布律:P{Y=yj|X=x1}==; P{Y=y1|X=x1}=; P{Y=y2|X=x1}=; P{Y=y3|X=x1}=连续型:设f(x,y)是联合概率密度;(注意x,y常常有取值范围D的)则:F(x,y)=P(X如XY独⽴,则f(X,Y)=fx(X)*fy(Y); 反之也成⽴;X,Y⼆维正态密度中的参数则X,Y独⽴;题型:1、f(x)有未知常数,求未知常数;思路:注意x的定义域,利⽤F(∞)=求出参数;2、求P(X1)类,先画出x=y,x+y=1的图,确定积分上下限,并求积分;3、求Z=X+Y的分布:密度公式四、数学期望、⽅差数学期望E(X), ⽅差D(X) :离散:E(X)=; E(g(X))=;连续:E(X)=E(g(X))=性质:E(C)=C, E(CX)=CE(X);E(X+Y)=E(X)+E(Y)如X,Y独⽴,则E(XY)=E(X)*E(Y);D(X)=E(X; D(C)=0,D(CX)=C2X如X,Y独⽴,D(X五、样本及抽样分布中⼼极限定理:E(X)=µ,D(X)=σ2的独⽴同分布的X1,X2,X3...Xn,当n充分⼤时,有:~N(0,1);是Xi的和;样本及抽样分布:从总体X中抽取⼀个个体,独⽴抽n次,记为X1,X2,...Xn, 它们组成独⽴、同分布的随机变量,叫随机样本,n 是样本容量,X1,X2,..Xn的观测值x1,x2,x3...xn叫样本值。
分布概率密度函数什么是概率密度函数概率密度函数是描述随机变量分布的函数。
在概率论和统计学中,随机变量是一个具有随机性的变量,而分布则是随机变量取值的频率分布。
概率密度函数用于描述连续型随机变量的分布情况,通过函数的取值来表示对应随机变量值的概率。
在数学上,概率密度函数(probability density function,简称PDF)是一个定义在整个实数轴上的非负函数,用来描述连续型随机变量的概率分布。
对于连续型随机变量X,其概率密度函数是一个函数f(x),满足以下两个条件:1.非负性:对于任意的x,有f(x) ≥ 0,即概率密度函数的取值始终为非负数。
2.归一性:概率密度函数的积分等于1,即∫f(x)dx = 1,表示随机变量的取值范围包含所有可能的取值,概率等于1。
概率密度函数的性质概率密度函数具有以下重要的性质:1.概率密度函数可以用来计算随机变量落在某个区间内的概率。
给定一个连续型随机变量X和一个区间[a, b],X落在该区间内的概率可以通过计算概率密度函数在该区间内的积分来得到,即P(a ≤ X ≤ b) = ∫[a,b]f(x)dx。
2.概率密度函数可以用来计算随机变量的期望值。
随机变量的期望值表示其平均值,可以通过计算概率密度函数与随机变量取值相乘的积分来得到,即E(X) = ∫xf(x)dx。
3.概率密度函数可以用来计算随机变量的方差。
随机变量的方差表示其取值的离散程度,可以通过计算随机变量与其期望值的差的平方与概率密度函数相乘的积分来得到,即Var(X) = ∫(x-E(X))^2f(x)dx。
常见的概率密度函数在概率论和数理统计中,有一些常见的概率密度函数被广泛应用于描述不同的分布情况,以下是其中几个常见的概率密度函数:1.正态分布(Normal distribution):正态分布是一种非常重要的连续型概率分布,其概率密度函数呈钟形曲线,对称分布于均值周围。
正态分布的概率密度函数被广泛应用于自然科学、社会科学、工程技术等领域的研究中。
第三章 多维随机变量及其分布 二维随机变量:一般,设E 是一个随机试验,它的样本空间是S={e}.设X=X(e)和Y=Y(e)是定义在S 上的随机变量,由它们构成的一个向量(X,Y),叫做二维随机向量或二维随机变量。
设(X,Y)是二维随机变量,对于任意实数x,y,二元函数:)}(){(),(y Y x X P y x F ≤⋂≤=),(y Y x X P ≤≤=称为二维随机变量(X,Y )的分布函数,或称随机变量X 和Y 的联合分布函数分布函数F(x,y)具有以下基本性质: 1.F (x,y)是变量x 和变量y 的不减函数,即对于任意固定的y ,当);,(),(,1212y x F y x F x x ≥> 对于任意固定的x ,当),(),(,1212y x F y x F y y ≥> 2.0≤F(x,y)≤1,且对于任意固定的y ,F (-∞,y)=0, 对于任意固定的x, F (x ,-∞)=0, F (-∞,-∞)=0,F (∞,∞)=13.F(x,y )=F(x+0,y ),F(x,y+0),即F(x,y )关于x 右连续,关于y 也右连续4.对于任意,,),,(),,(21212211y y x x y x y x <<下述不等式成立 0),(),(),(),(21111222≥-+-y x F y x F y x F y x F离散型随机变量:如果二维随机变量(X,Y)全部可能取到的不相同的值是有限对或可列无限多对,则称(X,Y )是离散型随机变量称,2,1,,},{====j i p y Y x X P ij i i ……为二维离散型随机变量(X,Y )的分布律,或随机变量X 和Y 是联合分布律 表格形式表示联合分布律: Y X1x… i x… 1y11p … 1i p… ………j yj p 1… ij p… ………离散型随机变量X 和Y 的联合分布函数为∑∑≤≤=x x yy ij i i p y x F ),(,其中和式是对一切满足y y x x i i ≤≤,的i,j 来求和的连续型随机变量:对于二维随机变量(X,Y )的分布函数F (x,y),如果存在非负的函数f(x,y)使得对于任意x,y 有 ⎰⎰∞-∞-=y xdudv v u f y x F ),(),(,则称(X,Y )是连续型的二维随机变量,函数f(x,y)称为二维随机变量(X,Y )的概率密度,或称为随机变量X 和Y 的联合概率密度概率密度的性质: 1.f(x,y)≥0 2.⎰⎰∞∞-∞∞-=∞∞=1),(),(F dxdy y x f3.设G 是xOy 平面上的区域,点(X,Y )落在G 内的概率为 ⎰⎰=∈Gdxdy y x f G Y X P ),(}),{(4.若f(x,y)在点(x,y )连续,则有),(),(2y x f y x y x F =∂∂∂一般,设E 是一个随机试验,它的样本空间是S={e},设),(),(2211e X X e X X ==…),(,e X X n n =是定义在S 上的随机变量,由它们构成的一个n 维向量,,(21X X …),n X 叫做n 维随机向量或n 维随机变量对于任意n 个实数n x x x n ,,^,,21元函数},^,{),^,(111n n n x X x X P x x F ≤≤=称为n 维随机变量,,(21X X …),n X 的分布函数或随机变量n X X X ,^,,21的联合分布函数。
§3 条件分布我们由条件概率很自然地引出条件概率分布的概念. 设(X ,Y)是二维离散型随机变量,其分布律为,...,2,1,,}Y ,{X i ====j i p y x P ij j(X ,Y)关于X 和关于y 的边缘分布律分别为,...,2,1,.}{X 1====∑∞=i p p x P j ij i i,...,2,1,.}{Y 1====∑∞=j p p y P i ij j j设j p .>0,我们来考虑在事件{Y=j y }已发生的条件下事件{ X=i x ,)发生的概率,也就是来求事件,...2,1},{===i y Y x X j i , 的概率,由条件概率公式,可得 ,....2,1,.}{},{}{========i p p y Y P y Y x X P y Y x X P jij j j i j i易知上述条件概率具有分布律的性质: 1、;0}{≥==j i y Y x X P2、.1..1.}{..111======∑∑∑ℵ=∞=∞=jj i ij j iji jit p p p j p p p y Y x X P 于是我们引入以下的定义.定义 设(X .Y)是二维离散型随机变量,对于固定的j ,若P{Y=y,}>0, 则称,....2,1,.}{},{}{========i p p y Y P y Y x X P y Y x X P jij j j i j i (3.1)·为在Y=y ,条件下随机变量X 的条件分布律. 同样,对于固定的i .若P{X= i x }>0.则称 ,....2,1,}{},{}{.========j p p x X P y Y x X P x X y Y P i ij i j i i j (3.2)为在X =x ,条件下随机变量Y 的条件分布律.例l 在一汽车工厂中,一辆汽车有两道工序是由机器人完成的.其一是紧固3只螺栓,其二是焊接2处焊点,以X 表示由机器人紧固的螺栓紧固得不良的数目,以Y 表示由机器人焯接的小良焊点的数目,据积累的资料知(X ,Y)具有分布律:(1)求在X=1的条件下.Y 的条件分布律;(2)求在y=0的条件下,X 的条件分布律. 解 边缘分布律已经求出列在上表中.在X=1的条件下,Y 的条件分布律为,045.0030.0}1{}0,1{}10{=======X P Y X P X Y P,045.0010.0}1{}1,1{}11{=======X P Y X P X Y P,045.0005.0}1{}2,1{}12{=======X P Y X P X Y P或写成同样可得在例2 一射手进行射击,击中目标的概率为p(O<p<1),射击直至击中目标两次为止.设以X 表示首次击中目标所进行的射击次数,以Y 表示总共进行的射击次数,试求X 和Y 的联合分布律及条件分布律.解 按题意Y=n 就表示在第n 次射击时击中目标,且在第1次,第2次,……,第n-l 次射击中恰有一次击中目标.已知各次射击是相互独立的,于是不管m (m<n )是多少,概率P{X=m,Y=n )都应等于p .p.43421Λ个2-⋅⋅⋅n q q q =2p 2-n q(这里q=1-p ).即得X 和y 的联合分布律为P{X=m,Y=n)}= 2p 2-n q,n=2,3,…;m=1,2,...,n-l.又 P{x=m}=∑∞+=1m n p {X=m ,y=n )=212-∞+=∑n m n q p=2p21-∞+=∑n m n q=,...,2,1,1112==---m pq qq p m m P{Y=n}=∑-=11n m P {X=m ,y=n}=2112--=∑n n m q p =(n-1) 2p 2-n q ,n=2,3,.... 于是由(3.1),(3.2)式得到所求的条件分布律为当n-2,3,…时,P{X=m,Y=n}=2222)1(p ---n n q p n q =;1,...2,1,11-=-n m n当m=1,2,…时,P{Y=n ︱X=m}=122p --m n qp q =p 1--m n q ,n=m+1,m+2,… 例如.P{X=m ︱Y=3}=,21, m=1,2; P{Y=n ︱X=3}=,4-n pq, n=4,5,..现设(X ,Y)是二维连续型随机变量,这时由于对任意x ,y 有P{X=x}=0,P{Y=y}=0,因此就不能直接用条件概率公式引入¨条件分布函数”了.设(X .Y)的概率密度为f (x ,y),(X .Y)关于Y 的边缘概率密度为fy(y).给定y ,对于任意固定的ε>0,对于任意x ,考虑条件概率P{X ≤x ︱y<Y ≤y+ε}, 设P{y<X ≤y+ε}>0,则有P{X ≤x ︱y<Y ≤y+ε}=}{},{εε+≤<+≤<≤y Y y P y Y y x X P=.)(),(dyy f dx dy y x f ey yY xe y y ⎰⎰⎰+∞-+⎥⎦⎤⎢⎣⎡在某些条件下,当ε很小时,上式右端分子、分母分别近似于ε和dx y x f ⎰∞x-).(ε),(y f Y ,于是当ε很小时,有P{X ≤x ︱y<Y ≤y+ε)≈)(),(y f dxy x f Y xεε⎰∞-=.)(),(dx y f y x f xY ⎰∞- (3.3) 与一维随机变量概率密度的定义式第二章(4.1)式比较.我们给出以下的定义.定义 设二维随机变量(X ,Y)的概率密度为f(x ,y),(X ,Y)关于Y 的边缘概率密度为).(y f Y .若对于固定的y, ).(y f Y >0,则称)(),(y f y x f Y 为在Y=y 的条件下X 的条件概率密度,记为①.)(),()(y f y x f y x f Y Y X =(3.4) ———————————————————① 条件概率密度满足条件: .)(),()(y f y x f y x f Y Y X =≥0; dx y x f Y X )(-⎰∞∞=.)(),(dx y f y x f xY ⎰∞-=1),()(1=⎰∞∞-dx y x f y f Y 称dx y x f Y X )(-⎰∞∞=.)(),(dx y f y x f xY ⎰∞-为在Y=y 的条件下X 的条件分布函数,记为P {X ≤x ︱Y=y}或)(y x F YX ,即 )(y x F YX = P {X ≤x ︱Y=y}=.)(),(dx y f y x f xY ⎰∞- (3.5) 类似地,可以定义 =)(x y F X Y )(),(x f y x f x 和=)(x y F XY dy x f y x f xX ⎰∞-)(),(. 由(3.3)知道,当ε很小时,有 P{X ≤x ︱y<Y ≤y+ε}≈dx y x f xY X )(-⎰∞=)(y x F YX , 上式说明了条件密度和条件分布函数的含义.例3 设G 是平面上的有界区域,其面积为A .若二维随机变量(X ,Y)具有概率密度⎪⎪⎩⎪⎪⎨⎧∈=其他,,0),,(,1),(G y x A y x f则称(X ,Y)在G 上服从均匀分布,现设二维随机变量(X ,Y)在圆域22y x +≤1上服从均匀分布,求条件概率密度)(y x f YX . 解 由假设随机变量(X .Y)具有概率密度⎪⎪⎩⎪⎪⎨⎧≤+=其他,,0,1,1),(22y x y x f π且有边缘概率密度dx y x f y f Y ⎰∞∞-=),()(⎪⎪⎩⎪⎪⎨⎧≤≤--==⎰---.,0,11,12121122其他y y dx y y ππ于是当- l<y<l 时有)(y x F YX =⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧-≤≤---=.,0,11,121y -1212222其他y x y y ππ当y=0和y=21时)(y x f Y X 的图形分别如图3—6,图3-7所示.图3-6 图3-7例4 设数X 在区间(0,1)上随机地取值,当观察到X=x (0<x<1)时,数Y 在区间(x ,1)上随机地取值.求Y 的概率密度)(y f Y .解 按题意X 具有概率密度 =)(x f X ⎩⎨⎧<<.,0,10,1其他x对于任意给定的值x(0<x<1),在X=x 的条件下Y 的条件概率密度为=)(x y f XY ⎪⎪⎩⎪⎪⎨⎧<<-.,0,1,11其他y x x由(3.4)式得X 和Y 的联合概率密度为=),(y x f )(x y f XY =)(x f X ⎪⎪⎩⎪⎪⎨⎧<<<-.,0,10,11其他y x x于是得关于Y 的边缘概率密度为dx y x f y f Y ⎰∞∞-=),()(⎪⎪⎩⎪⎪⎨⎧<<--=-=⎰.0,10),1(110,其他,y y y In dx x。
第一章概率论的基本概念第五章ﻩ大数定律及中心极限定理伯努利大数定理:对任意ε>0有1lim=⎭⎬⎫⎩⎨⎧<-∞→εpnfP An或lim=⎭⎬⎫⎩⎨⎧≥-∞→εpnfP An.其中f A是n次独立重复实验中事件A发生的次数,p是事件A在每次试验中发生的概率.中心极限定理定理一:设X1,X2,…,Xn,…相互独立并服从同一分布,且E(X k)=μ,D(Xk)=σ2 >0,则n→∞时有σμnnXknk)(1-∑=N(0,1)或nXσμ-~N(0,1)或X~N(μ,n2σ).定理二:设X1,X2,…,X n ,…相互独立且E(X k)=μk,D(Xk)=σ k2 >0,若存在δ>0使n→∞时,}|{|1212→-∑+=+δδμkknknXEB,则nknkknkBX)(11μ==∑-∑~N(0,1),记212knknBσ=∑=.定理三:设),(~pnbnη,则n→∞时,Npnpnpn~)1()(--η(0,1),knknX1=∑=η.定义:总体:全部值;个体:一个值;容量:个体数;有限总体:容量有限;无限总体:容量无限.定义:样本:X1,X2,…,X n 相互独立并服从同一分布F的随机变量,称从F得到的容量为n的简单随机样本.频率直方图:图形:以横坐标小区间为宽,纵坐标为高的跨越横轴的几个小矩形.横坐标:数据区间(大区间下限比最小数据值稍小,上限比最大数据值稍大;小区间:均分大区间,组距Δ=大区间/小区间个数;小区间界限:精度比数据高一位).图形特点:外轮廓接近于总体的概率密度曲线.纵坐标:频率/组距(总长度:<1/Δ;小区间长度:频率/组距).定义:样本p分位数:记x p,有1.样本x i中有np个值≤xp.2.样本中有n(1-p)个值≥x p.箱线图:x p选择:记⎪⎩⎪⎨⎧∈+∉=++NnpxxNnpxxnpnpnpp当,当,][211)()()1]([.分位数x0.5,记为Q2或M,称为样本中位数.分位数x0.25,记为Q1,称为第一四分位数.分位数x0.75,记为Q3,称为第三四分位数.图形:图形特点:M为数据中心,区间[min,Q1],[Q1,M],[M,Q3],[Q3,max]数据个数各占1/4,区间越短数据密集.四分位数间距:记IQR=Q3-Q1;若数据X<Q1-1.5IQR或X>Q3+1.5IQR,就认为X是疑似异常值.抽样分布:样本平均值:iniXnX11=∑=样本方差:)(11)(11221212XnXnXXnSiniini-∑-=-∑-===样本标准差:2SS=样本k阶(原点)矩:kinikXnA11=∑=,k≥1样本k阶中心矩:kinikXXnB)(11-∑==,k≥2经验分布函数:)(1)(xSnxFn=,∞<<∞-x.)(xS表示F的一个样本X1,X2,…,X n 中不大于x的随机变量的个数.自由度为n的χ2分布:记χ2~χ2(n),222212nXXX+++=χ,其中X1,X2,…,Xn是来自总体N(0,1)的样本.E(χ2 )=n,D(χ2 )=2n.χ12+χ22~χ2(n1+n2).⎪⎩⎪⎨⎧>Γ=--其他,,)2(21)(2122yexnyfynn.~近似的min Q1 M Q3 max第七章ﻩ参数估计正态总体均值、方差的置信区间与单侧置信限(置信水平为)1122。