高等概率论
- 格式:doc
- 大小:575.50 KB
- 文档页数:8
§2.3 连续型随机变量及其分布一. 连续型随机变量的概率分布二. 三种常用分布一. 连续型随机变量及其分布定义2-4 注1:连续型v r .X 的分布函数)(x F 是连续函数。
注2:概率密度)(x f 具有如下性质:(1)0)(≥x f ;(2)⎰∞+∞-=1)(dx x f ;(3)⎰=-=<≤21)()()(}{1221x x dx x f x F x F x X x P ;若v r .X 的分布函数)(x F 可表示成 ⎰∞-=xdu u f x F )()( (2-7)其中)(x f 为一非负可积函数,则称X 为连续型v r .,)(x f 称为X 的概率密度(或概率分布、分布密度)。
(4)若)(x f 在x 点连续,则)()(x f x F ='。
由(2-8)式知,若不计高阶无穷小,则有 xx f x x X x P ∆=∆+<≤)(}{即X 落在小区间),[x x x ∆+上的概率近似等于x x f ∆)(。
注3:若X 是连续型v r .,则R a ∈∀,0}{==a X P 。
结论:若A 是不可能事件,则0)(=A P ,反之不然。
}{b X a P <≤}{b X a P <<= }{b X a P ≤<=}{b X a P ≤≤=几种常用分布:(1)均匀分布:设随机变量X 在有限区间][b a ,内取值,且其分布密度为⎪⎩⎪⎨⎧≤≤-=其他,,01)(bx a a b x f ,则称X在有限区间][b a ,上服从均匀分布,记为)(~b a U X ,。
其分布函数为(自行验证)⎪⎩⎪⎨⎧>≤<--≤=b x b x a a b ax a x x F ,,,10)(Uniform Distribution⎩⎨⎧≤>-=-0001)(x x e x F x,,λ 一般地,若随机变量X 的概率密度⎩⎨⎧≤>=-000)(x x e x f x,,λλ其中0>λ为常数,则称X 服从参数为 λ的指数分布。
§5.3 假 设 检 验再如糖厂用自动包装机装糖,每箱的标准重量规定为100kg ,某日开工后,抽测了9箱,其重量如下(单位kg ):99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.1,100.5,问此包装机是否正常工作。
例如要检查纺织厂中纱的强力是否达到了标准,我们只能抽出一小部分纱,然后根据这部分纱的质量来推断整批纱的质量是否合格。
上面两例具有一个共同特点,就是从样本出发,对总体的某种假设作出判断——假设是否成立。
如包装机装糖一例中,用μ表示糖箱的平均重量,则问题即为对假设1000=μ:H 作出肯定或否定的回答。
在统计上,对总体所作的种种假设称为统计假设, [引例] 某厂有一批产品共200件,须经检验合格才能出厂,按照国家标准次品率不得超过1%,今在其中任意抽取5件,发现这个5件中有次品,问这批产品能否出厂?解:设这批产品的次品率为μ,则问题化为检验假设01.00≤μ:H 是否成立。
由样本出发来判断统计假设是否成立称为假设检验。
现假定0H 成立,看会出现什么结果,此时200件产品中最多有二件次品,任意抽取5件,那么5件中无次品的概率为⎪⎪⎪⎩⎪⎪⎪⎨⎧=件中没有件次品时。
,当件中有一件次品时;,当件中有两件次品时;,当无次品200200200)(520052005200519952005198C C C C C C P 显然 95.052005198>≥C C P (无次品) 05.0<(有次品)P 上面的分析讨论中,我们基于一个基本原理——实际推断原理,同时用了反证法的思想.假设总体),(2~σμN X ,n X X X ,,,21 为来自总体X 的一个样本,其观察值为n x x x ,,, 21 。
一.2σ已知,检验假设000(μμμ=:H 已知) 构造统计量n X U 20σμ-= (5-49)则当0H 成立时,U 服从标准正态分布,即)10(~,N U ,对于给定的10<<α(α通常比较小),由 αλ=>}{U P (5-50)查标准正态分布表可求得λ。
第二章随机变量及其分布§2.1随机变量及其分布函数§2.2 离散型随机变量及概率分布§2.3 连续型随机变量及概率分布§2.4 多维随机变(向)量及其分布§2.5 随机变量的独立性§2.6随机变量函数的分布基本要求重点与难点JXHD2-7概率篇CH2LX基本要求1.理解随机变量、随机变量的分布函数概念及性质。
2.理解概率分布的概念及其性质。
3.会利用概率分布及分布函数计算有关事件的概率。
4.掌握六种常用分布,会查泊松分布、正态分布表。
5.了解多维随机变量的概念。
了解二维随机变量的联合分布函数及其性质,了解二维随机变量的联合概率分布及其性质,并会用它们计算有关事件的概率。
6.知道二维随机变量的边缘分布以及与联合分布的关系,了解条件分布。
7.理解随机变量独立性的概念及应用独立性进行有关计算。
8.会求简单随机变量函数的概率分布及两个独立随机变量的函数(和、最大值、最小值)的分布。
重点与难点1.随机变量的分布函数概念及性质。
2.概率分布(离散型随机变量的分布律,连续型随机变量的概率密度)的概念及性质。
3.概率分布与分布函数的关系及正态分布的有关计算。
4.二维随机变量的边缘分布以及与联合分布的关系。
5.随机变量独立性及应用。
6.简单随机变量函数的分布。
1.随机变量的分布函数、概率分布及其关系。
2.二维随机变量的边缘分布及计算。
3.随机变量函数的分布及两个独立随机变量的函数的分布。
§2.1 随机变量及其分布函数掷骰子试验}654321{,,,,,=Ω; 掷硬币试验}{T H ,=Ω 一.随机变量 [引例1] 掷骰子试验,}654321{,,,,,=Ω,令 ),,,,,(654321)(==i i i X 则X 是定义在Ω上的单值实函数,称X 为随机变量。
[引例2] 掷硬币试验,样本空间}{T H ,=Ω,令⎩⎨⎧===Te H e e Y ,,01)(则Y 是定义在Ω上的单值实函数,称 Y 为随机变量。
极大似然估计是点估计的一种重要方法。
若4/3=p ,则16/9)(=AB P ;若4/1=p ,则16/1)(=AB P 。
分析:设抽取一球是黑球的概率为 p ; A 表示“第一次取到黑球”;B 表示“第二次取到黑球”,则两次都取到黑球的概率为P AB ()。
如:设罐中装有许多白球和黑球,只知两种球的比数是3:1,但不知道是白球多还是黑球多,今若随机抽取两球(每次取一只,有放回)全为黑球,试问罐中白球多还是黑球多?Maximum Likelihood estimate设总体X 是离散型随机变量,事件“x X =”的概率为p x (,)θ,其中θ为待估计的未知参数。
假定x x x n 12,,, 是样本X X X n 12,,, 的一组观察值,即相当于事件""""""2211n n x X x X x X ===,,, 同时发生了,由于X X X n 12,,, 相互独立,且与总体同分布,所以这n 个事件同时发生的概率为)(2211n n x X x X x X P ===,,, )()()(2211n n x X P x X P x X P ==== ∏==ni i x p 1),(ˆθ显然它是θ的函数,称这个函数为似然函数,记作L ()θ,即L ()θ=∏=ni i x p 1),(θ (5-17)Likelihood function选择使L ()θ达最大的θ作为未知参数θ的真实值的估计,这种估计法称为极大似然估计法,即∏==ni i x p L 1),(max )ˆ(θθ所得估计 θ是n x x x ,,21 ,的函数,记为 (,,,)θθ=x x x n 12 ,称 θ为未知参数θ的极大似然估计值。
而称相应统计量(,,,)θX X X n12 为未知参数θ的极大似然估计量。
因此求 θ的问题归结为求L ()θ的极值问题。
如果L ()θ关于θ可微,则 θ应满足∂∂θL =0或 ∂∂θln L=0 (5-18) 对于连续型随机变量可用f x (,)θ来代替p x (,)θ。
高等概率论简介课程名称:高等概率论周学时 3先修课程:概率论,测度论 (实变函数)基本目的:1.在测度论的基础之上,准确掌握概率、事件、随机变量、独立性、特征函数等基本概念。
2.较准确理解大数定律与中心极限定理的内容,清楚各种收敛之间的关系。
内容提要:第一章测度论:(10学时)1) 概率空间(2学时)2) 随机变量及其分布(2学时)3) 积分及性质(2学时)4) 数学期望:各种不等式,积分收敛定理,随机变量函数的数学期望(2学时)5) 乘积测度,Fubini定理(2学时)第二章大数定律(12学时)1)随机变量的独立性:独立性的概念独立性成立的充分条件独立随机变量的性质(4学时)2) 弱大数定理:均方收敛与依概率收敛的概念与关系,三角列的弱收敛定理举例(2学时)3) Borel-Cantelli 引理, Kolmogorov’s 0-1律(2学时)4)随机列的收敛:强大数定律证明(一阶矩存在情况)( 2学时)5) 强大数定律及应用; 收敛速度介绍与大偏差介绍(2学时)第三章中心极限定理(18学时)1) 弱收敛:De Moivre-Laplace收敛定理介绍,弱收敛的定义,各种相关定理(4学时)2) 特征函数:特征函数定义,反演公式,特征函数收敛与弱收敛关系( 4学时)3)中心极限定理:i.i.d列的中心极限定理Linderberg-Feller定理各种应用( 3学时)4) Poisson 极限:收敛到Poisson分布的随机变量列(基本定理及一般定理),Poisson过程与等待时间,复合Poisson过程(3.6节)( 4学时)5)*平稳分布与无穷可分分布介绍(3.7-3.8节)( 1学时)6) 随机向量列的极限定理:弱收敛的等价形式,胎紧性,弱收敛与特征函数收敛关系(3.9节)( 2学时)教材与参考书:1.Durrett R., Probability Theory and Examples (4.1版), 2013 下载地址: (pdf.file)2.Chung K. L., A course in probability theory (第二版), 1974 程士宏《高等概率论》,19963.Kallenberg O., Foundations of Modern Probability, 19974.汪嘉冈现代概率论基础,19885.Patrick Billingsley, Probability and Measure, Second Edition, 19866.Patrick Billingsley, Convergence of Probability Measure, 19681 / 1。
§3.3 相关系数与相关阵一.协方差(Covariance) 与相关系数当Y X ,独立时,0))((=-=--EXEY EXY EY Y EX X E 定义3-5 设X 与Y 是两个随机变量,若))((EY Y EX X E --存在,则称其为随机变量X 与Y 的协方差,记为)(Cov Y X ,,即)(Cov Y X , =))((EY Y EX X E -- (3-17)称 DY DX Y X XY ),(Cov =ρ (3-18) 为X 与Y 的相关系数或标准协方差。
Correlation Coefficient Standard Covariance由前讨论知)(Cov Y X , EXEY EXY -= (3-19)且易证下面的等式DY DX Y X D +=+)(+2)(Cov Y X , (3-20) 由协方差的定义容易得到它有如下性质:(1))(Cov Y X ,=)(Cov X Y ,;(2))(Cov bY aX ,=ab )(Cov Y X ,,其中b a ,为常数;(3))(Cov 21Y X X ,+=)(Cov 1Y X ,+)(Cov 2Y X , 只证(3),其它自证。
(3))(Cov 21Y X X ,+=)(Cov 1Y X ,+)(Cov 2Y X ,事实上,)(Cov 21Y X X ,+))](([2121EY Y X X E X X E -+-+=+--=))([(11EY Y EX X E )])((22EY Y EX X --+--=))((11EY Y EX X E ))((22EY Y EX X E --)(Cov 1Y X ,=)(Cov 2Y X ,+ 定理3-4 设XY ρ是随机变量X 与Y 的相关系数,则有1≤XY ρ;且1=XY ρ的充要条件是X 与Y 依概率1线性相关,即存在常数b a ,使1}{=+=bX a Y P 。
第六章回归分析回归分析是研究变量间相关关系的一个统计分支,它主要解决以下面几个问题:(1)确定几个特定的变量之间是否存在相关关系,如果存在,找出它们之间合适的数学表达式;(2)根据一个或几个变量的值,预测或控制另一个变量的取值,并且要知道这种预测或控制可达到什么样的精确度;(3)进行因素分析,在共同影响一个变量的许多变量(因素)之间找出哪些因素重要,哪些因素次要,这些因素之间有什么关系等。
回归分析一元线性回归多元线性回归逐步回归非线性回归与回归诊断一元线性回归建立模型参数估计显著性检验预测预报一.建立模型引例1.一个作匀速直线运动的质点,在时刻t 的位置是S ,则S a bt =+,其中 a 为质点在t =0时刻的初始位置,b 为平均速度。
观测到的数据是ε+=s y ,其中ε是随机误差(测量误差)。
于是我们有ε+=s y ε++=bt a (6-1) 其中t 是非随机的,ε是随机的,通常认为E ε=0,显然y 也是随机的。
为了估计a 、b ,现在 n 个不同时刻作观察,得n 组观察值)(i i y t ,n i ,21 ,,=。
即 y i =i i bt a ε++ (i n =12,,, )用向量矩阵形式表示如下:εβ+=X Y 其中,⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n y y y Y 21,⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n εεεε 21,⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n t t t X 21111,⎪⎭⎫ ⎝⎛=b a β。
问题:如何利用Y X 、的观测值来估计参数a 、b ,进一步预测未来时刻t 质点的位置。
引例2.在硝酸钠(3NaNO )的溶解度试验中,测得在不同温度C X 0下溶解于100份水中的硝酸钠份数y 数据见下表:x i 0 4 10 15 21 29 36 51 68y i 66.7 71.0 76.3 80.6 85.7 92.9 99.4 113.6 125试找出X 与Y 之间的关系。
图6-1bx a +εy =+(6-2)20406080100120140020406080 Y X =+βε 问题:如何利用观测值来估计参数a 、b ,从而确定y 与x 的近似线性关系。
00.10.2
0.3
0.4
0.5
-4-3-2-101234
概率论与数理统计
电子教案研制单位:石油大学应用数学系
概率论与数理统计
绪论篇
概率论篇
数理统计篇
概率论篇
第一章随机事件与概率
第二章随机变量及其分布
第三章随机变量的数字特征第四章大数定律与中心极限定理
数理统计篇数理统计初步因素分析回归分析正交试验设计
数理统计是一个应用非常广泛的数学分支,它以概率论作为理论基础。
它的任务是:研究如何用有效地方法去搜集、整理和分析带有随机性影响的数据,并对所关心的问题作出推断和预测,直接为决策行动提供依据和建议。
凡是有大量数据出现的地方都要用到数理统计。
也就是说,数理统计是直接从随机现象的观察值去研究它的客观规律。
大学概率论知识点总结大学概率论是高等数学中的重要分支之一,它研究的是随机现象和随机事件的规律,是研究不确定性的数学理论。
本文将对大学概率论的知识点进行总结。
1. 概率的基本概念概率是描述随机事件发生可能性大小的数值,通常用一个介于0和1之间的实数表示。
0表示不可能事件,1表示必然事件。
事件的概率越大,其发生的可能性越高。
2. 随机变量与概率分布随机变量是指一种数值上具有不确定性的变量,它的取值由随机试验的结果决定。
概率分布是随机变量所有取值和其相应概率的分布关系,可以用分布函数、概率密度函数或概率质量函数来进行描述。
3. 离散型随机变量离散型随机变量的取值为有限个或可数个,其概率分布可以用概率分布列来表示。
常见的离散型随机变量有伯努利随机变量、二项随机变量、泊松随机变量等。
4. 连续型随机变量连续型随机变量的取值为连续的实数集合,其概率分布可以用概率密度函数来表示。
常见的连续型随机变量有均匀分布、正态分布、指数分布等。
5. 二维随机变量与联合分布二维随机变量是指具有两个未知数的随机变量,其概率分布可以用联合分布函数或联合概率密度函数来描述。
联合分布函数可以用来计算二维随机变量的概率。
6. 随机变量的独立性两个随机变量的独立性是指它们的联合分布等于其边缘分布的乘积,即P(X,Y)=P(X)P(Y)。
独立性是概率论中重要的概念,可以用来简化计算过程。
7. 条件概率和贝叶斯定理条件概率是指在已知一事件发生的条件下,另一事件发生的概率。
贝叶斯定理是利用条件概率计算事件的概率的一种重要方法,常用于统计学和机器学习中。
8. 随机变量的数字特征随机变量的数字特征是对其概率分布进行度量的方式,常见的数字特征有数学期望、方差、标准差等。
数学期望是随机变量取值的平均值,方差是随机变量取值与均值之间的离散程度的平均值。
9. 大数定律和中心极限定理大数定律是指随着试验次数增加,事件发生的频率会趋近于其概率。
中心极限定理是指在一定条件下,大量随机变量的和服从近似于正态分布。
第三章3・1四种收敛性车贝晓夫不等式2几乎处处收敛3依概率收敛4依分布收敛5r■阶收敛【引理】(马尔可夫不等式)设随机变量X有I•阶绝对矩,EX 「<00,则对任意£ > 0有P(\X\>s)<^4-【证明】设X的分布函数为F(x),则有:P(\X\>£)= f dF(x) < f x-\rdF(x)1 r00 ir< —-f x dF(x) 』J・8引理的特殊情况: P(|X|> £)<纟甲取一2,并以X ・E(X)代替X 得车贝晓夫不等式 * 【定理】(车贝晓夫不等式)设随机变量X 有2阶中心矩,E[X-E(X)] 则对任意£ > 0有P (|X -E (X )|>^)<^2【证明】设X 的分布函数为尸(兀),则有:DX = f (X -E(X))2JF(X )>f (x-E(X))2dF(x)\x-E(X)\^> J£2dF(x)= e 2P{\X-E(X)\>e}从而尸(|X - E(X)\ >e)< 代耳 <=^> P(\X 一 E(X)\ <^)>1-2^8 82 <00,P(\X-E(X)\<s)>l-^^ 8由车贝晓夫不等式可以看出,若b?越小,贝!I 事件[\X-E(X)\<£]的概率越大,即随机变量X集中在期望附近的可能性越大.特别地,若D(X)=O,则对任意£>0,恒<P{|X-EX|>g}|0- 因此P{X HE¥} = 0,即P{X = EX} = 1,所以方差为0的随机鑼是常数菱P{\X-E(X)\>当方差已知时,车贝晓夫不等式给出了/X与它的期望的偏差不小于8的概率的估计式・如取£ = 3b2P{IX-E(X)I> 3<r} <— ".1119(7 屋可见,对任给的分布,只要期望和方差亍存蠹则r.v X取值偏离超过3a的概率小于0.1117二车贝晓夫不等式的用途:车贝晓夫不等式只利用随机变量的数学期望及方差就可对的概率分布进行估计。
第四章大数定律与中心极限定理大数定律中心极限定理要求:1.理解解切比雪夫(Chebyshev)不等式;理解切比雪夫定理和伯努利定理。
2.理解林德伯格-列维定理(独立同分布的中心极限定理)和棣莫弗拉普拉斯定理(二项分布以正态分布为极限)。
概率篇引理(Chebyshev’s 不等式):若r v .X 具有期望EX =μ,方差DX =σ2,则对于任意的ε>0有 P X {}-≥≤μεσε22 (4-1) 证明:(只证连续型)设X 的概率密度为f x (),则 ⎰≥-=≥-εμεμx dx x f X P )(}{dx x f x x )()(22⎰≥--≤εμεμ2222)()(1εσμε=-≤⎰∞+∞-dx x f x §4.1 大数定律 或 P X {}-<≥-μεσε122 (4-2) 若X N ~(,)μσ2,则P X {}.-<=μσ30997,即事件“X -<μσ3”的发生几乎是可以肯定的。
但对任意的随机变量X (不知其分布),若EX DX ==μσ,2,那么事件“X -<μσ3”的概率又如何来估计呢?law of large numbers上式说明随机变量X 取值于开区间)(εμεμ+-,的概率不小于221εσ-,例如:设X 的分布未知,记EX =μ,DX =σ2,取εσ=3,则 显然方差2σ越小则221εσ-越大,从而随机变量X 取值于开区间)(εμεμ+-,的概率也越大。
即X 的取值越集中在均值μ的附近, 这说明方差是刻画随机变量的概率分布对均值的集中程度。
P X {}.-<≥-=-≈μσσσ3191190888922例如:设X 的分布未知,记EX =μ,DX =σ2,取εσ=3,则 P X {}.-<≥-=-≈μσσσ3191190888922若取σε4=,则P X {}.-<≥-=-≈μσσσ411611160935722这就是说无论X 服从什么分布,它落在σμ4<-x 内的概率不小于0.93,这种估计在实际应用中形成了所谓σ—原则。
概率论高数知识点归纳总结概率论高数知识点归纳总结概率论是高等数学领域中的一门重要学科,其研究对象是随机试验和随机现象的数学模型和规律。
在学习概率论的过程中,有许多重要的知识点需要掌握和理解。
本文将对概率论高数知识点进行归纳总结,以帮助读者更好地掌握相关概念和方法。
1. 随机试验与样本空间随机试验是指在相同的条件下,可以进行多次但结果不确定的实验。
每次试验的所有可能结果组成了样本空间,通常用Ω表示。
样本空间中的元素称为样本点。
2. 事件与概率事件是样本空间的子集,表示试验的某些结果。
概率是对事件发生的可能性的度量,用P(A)表示事件A发生的概率。
概率的取值范围在0到1之间。
3. 古典概型与条件概率古典概型是指样本空间中的每个样本点发生的概率相等的情况。
在古典概型下,事件A发生的概率可以通过计数的方法求解。
条件概率是指在某一事件B已经发生的条件下,事件A发生的概率,用P(A|B)表示。
4. 随机变量与概率分布随机变量是指实验结果的数字化表示,可以分为离散型和连续型。
离散型随机变量的取值只能是整数或者有限个实数,连续型随机变量的取值可以是任意实数。
概率分布是随机变量取各个值的概率。
5. 期望与方差期望是随机变量取值的加权平均数,用E(X)表示,其中X为随机变量。
方差是随机变量偏离其均值的度量,用Var(X)表示。
6. 常见概率分布在概率论中,有许多常见的概率分布,包括离散型分布和连续型分布。
离散型分布包括伯努利分布、二项分布和泊松分布;连续型分布包括均匀分布、正态分布、指数分布等。
7. 独立性与相关性两个事件为独立事件,表示事件A的发生与事件B的发生无关。
相关性是指两个随机变量之间的线性相互关系,可以通过协方差和相关系数来刻画。
8. 大数定律与中心极限定理大数定律指出,随着随机试验次数的增加,样本均值趋于总体均值。
中心极限定理则是指在独立随机变量的和的情况下,随着样本量的增加,样本的分布趋近于正态分布。
高等数学概率论与数理统计课件(一)高等数学概率论与数理统计课件1. 课程简介•高等数学概率论与数理统计是大学数学专业的一门重要课程。
•它是数学学科的基础,也是应用数学的重要工具。
•本课程旨在帮助学生掌握概率论与数理统计的基本概念、理论和方法。
2. 概率论部分2.1 概率的基本概念•概率的定义和性质•随机事件的概率计算方法•条件概率与独立事件2.2 随机变量和概率分布•随机变量的定义和性质•离散型随机变量和连续型随机变量•常见概率分布:离散型和连续型2.3 随机变量的数字特征•期望、方差、标准差的定义和计算•切比雪夫不等式•大数定律和中心极限定理3. 数理统计部分3.1 统计基础•总体和样本的统计特征•参数估计和区间估计•假设检验的基本思想3.2 参数估计•点估计和区间估计的概念•常见的参数估计方法:极大似然估计、矩估计等•置信区间的计算和解释3.3 假设检验•假设检验的基本原理•假设检验的步骤和流程•常见的假设检验方法:单样本、两样本和多样本检验4. 课程学习方法•注重理论和实践相结合,理论指导实践、实践检验理论。
•多做习题,通过刷题巩固知识点。
•参考相关教材和参考书,拓宽知识广度和深度。
•加强课后讨论和交流,与同学共同解决问题。
•关注概率论与数理统计的应用领域,扩展应用实践。
5. 课程考核方式•平时成绩:课堂参与、作业完成情况等。
•期中考试:对课程前半部分的知识进行考核。
•期末考试:对整个课程的知识进行考核。
•课程项目:根据实际情况进行论文、实验等形式进行综合评估。
6. 学习资源推荐•《高等数学》教材,北京大学出版社。
•《概率论与数理统计教程》教材,清华大学出版社。
•《概率论与数理统计习题集》辅导书,高等教育出版社。
•在线学习资源:Coursera、edX、网易云课堂等平台提供的相关课程。
7. 小结•高等数学概率论与数理统计课程是数学专业学生不可或缺的重要课程。
•本课程旨在帮助学生掌握概率论与数理统计的基本概念、理论和方法。
§7.2 多因素方差分析Variance analysis of multiple factor 建立模型参数估计统计检验7-1一.建立模型设A 、B 为两个因子,A 有k 个水平1A ,2A ,k A , ,B 有r 个水平r B B B ,,, 21,两个因子共有kr 个水平组合j i B A (k i ,,3,2,1 =;r j ,,3,2,1 =)。
设对每一个水平组合j i B A 做了n 次试验(这里只讨论每个水平所作试验次数相同的情形),试验结果为ijn ij ij y y y ,,,21 (k i ,,3,2,1 =;r j ,,3,2,1 =)。
假定对水平组合j i B A 试验结果的理论值为ij μ,即ijl Ey =ij μ,则ijl y 可分解为modelingijl ij ijl y εμ+= k i ,,3,2,1 =;r j ,,3,2,1 =; n l ,,2,1 = (7-9)其中ijl ε为试验误差,它是一个随机变量。
ijl ε(k i ,,3,2,1 =;r j ,,3,2,1 =;n l ,,2,1 =)独立同分布)0(2σ,N 。
通常假定为了反映因子A 、B 的水平变化对试验结果影响的大小,将ij μ再进行分解,记∑∑===ki rj ijkr 111μμ∑==rj ij i r 11μμ(k i ,,,21=) (7-10) ∑==ki ij j k v 11μ(r j ,,,21=) (7-11) 于是有=ij μ+μ+-)(μμi +-)(μj v )(μμμ+--j i ij v μ=ˆ++i α+j βijγ其中,i α=μμ-i ,j β=μ-j v ,ij γ=μμμ+--j i ij v ,不难验证:∑=ki i 1α=0, ∑==rj j 10β, ∑∑====ki rj ij ij 110γγ,两个因素方差分析的一般数学模型:⎪⎪⎩⎪⎪⎨⎧===⋅⋅==++++=∑∑∑∑====,,1,,1,,1),0( 0= 0= 0,2111r 1j n l r j k i dN i i y ijl k i k i r j ij ij j i ijl ij j i ijl ;;,,,,σεγγβαεγβαμ(7-12)需要解决如下问题:(1)估计未知参数μ,i α,j β,ij γ(n l r j k i ,,1,,1,,1 ===;;);(2)考察因子A 和因子B 的水平变化对试验结果的影响有无显著差异,以及因子A 和因子B 有无交互作用,归结为下述三个假设检验:需要解决如下问题:(1)估计未知参数μ,i α,j β,ij γ(n l r j k i ,,1,,1,,1 ===;;);(2)考察因子A 和因子B 的水平变化对试验结果的影响有无显著差异,以及因子A 和因子B 有无交互作用,归结为下述三个假设检验:02101====k H ααα :; 02110====r H βββ :;:11H ij γ=0,r j k i ,,1,,1 ==;。
1(A )三、解答题1•一颗骰子抛两次,以 X表示两次中所得的最小点数(1) 试求X 的分布律; (2)写出X 的分布函数.解:(1)分析:这里的概率均为古典概型下的概率,所有可能性结果共 36种,如果X=1,则表明两次中至少有一点数为1,其余一个1至6点均可,共有C 2 6-1 (这里C 2指任选某次点 数为1, 6为另一次有6种结果均可取,减1即减去两次均为1的情形,因为C ; 6多1 1算了一次)或C 2 5 1种,故P X 1 C 26-1C25 1耳,其他结果类似36 3636可得•0, X1P{X 1} ,1X 2P{X 1} P{X 2} ,2X3F(x)P{X 1} P{X 2} P{X 3}, 3 x 4P{X 1} P{X 2} P{X3}P{X 4}, 4 x 5 P{X1} P{X2} P{X 3} P{X4} P{X5}, 5 x 61 ,x 622 •某种抽奖活动规则是这样的:袋中放红色球及白色球各 5只,抽奖者交纳一元钱后得到一次抽奖的机会,然后从袋中一次取出 5只球,若5只球同色,则获奖100元,否则无奖,以X 表示某抽奖者在一次抽取中净赢钱数,求X 的分布律.解:注意,这里 X 指的是赢钱数,X 取0-1或100-1,显然P X 99k3.设随机变量 X 的分布律为P{X k} a ,k 0,1,2, k!k解:因为 a ae 1,所以a e k 0 k!4.设随机变量X 的分布律为X -1 2 3 p1/41/21/4(1)求X 的分布函数;1 3 512627,3 翌,4 3635,5 36x 2 x 3x 4 x 5x 6 62 1 C ;0 1260为常数,试求常数 a .3⑵求P{X 丄},P{- X 5},P{2 x 3}.2 2 2解:40, x -1布,而与时间间隔的起点无关(时间以小时计)(1) 求某一天中午12时至下午3时没有收到紧急呼救的概率. (2) 求某一天中午12时至下午5时至少收到一次紧急呼救的概率. 解:(1) X ~ P 0.5t P 1.5 P X 0 e 1.5. (2) 0.5t2.50, x -1P{X 1}, 1 x2(1) F (x)P{X 1} P{X 2}1, x 3⑵P 1XX1 124P 2 X 3 P X 2X 3 5.设随机变量X 的分布律为 P{X k}(1) P{X =偶数}(2) P{ X 5}(3) P{ X=3的倍数}2 x 33 , ,2x341, x 33 51 P — X P X2 —222P X2 3 P X 3.4扌,k 1,2, 求:解:(1) P X 偶数丄1丄 22 221 lim i1(2) P X 51 P X 4115 1 16 16⑶P X 3的倍数23236.某公安局在长度为i123ilim123t 的时间间隔内收到的紧急呼救的次数X 服从参数为0.5t 的泊松分2.5丄,1x2 45 7.某人进行射击,每次射击的命中率为0.02,独立射击400次,试求至少击中2次的概6解:设射击的次数为 X ,由题意知X ~ B 400,0.2i k k 400 kP X 2 1 P X 11 C 4000.02 0.98k 0查表泊松分布函数表得:P{X 2} 1 0.28 0.99728.设事件A 在每一次试验中发生的概率为 0.3,当A 发生不少于3次时,指示灯发出信(1)系数a ;(2) X 落在区间(0,[)内的概率.号•现进行5次独立试验,试求指示灯发出信号的概率.解:设X 为事件A 在5次独立重复实验中出现的次数,则指示灯发出信号的概率 X ~ B 5,0.3 p P X 3 1 P X 3 1 (C 00.3°0.75 C 50.310.74 C ;0.320.73) 1 0.8369 0.1631. 9.设顾客在某银行窗口等待服务的时间 X (以分钟计) 在窗口等待服务,若超过 务而离开窗口的次数.写出 服从参数为 5 10分钟,他就离开.他一个月要到银行 5次,以 Y 的分布律,并求P{Y 1}.指数分布•某顾客 Y 表示他未等到服 x 解:因为X 服从参数为5的指数分布,则F(x) 1 e T , P X 10 Y~ B5, e 2 , 1 F(10) e 2 ,则 P{Y k} C5 (e 2)k (1 e 2)5k,k 0,1, 5 P{Y 1} 1- P{Y 0} 1 (1 e 2)5 0.5167 a cosx. 10.设随机变量 X 的概率密度为 f(x)0,|x|~2,试求:|x |2解:(1)由归一性知:1 f (x)dx2a cosxdx 2a ,所以 a2由于上面二项分布的概率计算比较麻烦, 所以而且X 近似服P{X 2}18k ek 0k!7⑵-11.2.P{0 X —} ; cosxdx sin x |(424 .0,x011 . 设连续随机变量X的分布函数为F(x)Ax,0x 11,x1⑶X的概率密度.试求:(1) 解系数(1)A;由⑵X落在区间(0.3, 0.7)内的概率;的连续性可得lim F(x)F(x )在x=1 lim F(x) F(1),即A=1.x 1(2) 0.3 X 0.7 F(0.7) F(0.3) 0.4.(3) X的概率密度 f (x) F (x)2x,00,12.设随机变量X服从(0, 5)上的均匀分布,求的概率.x的方程4x2 4Xx X 0有实根解:因为X服从(0, 5)上的均匀分布,所以1f(x) 50x5其他2 2方程4x 4Xx X(x 2)( X2(4X) 16X1,所以有实根的概率为0有实根,则32 51dx2510dxX〜N(3, 4)13.设求P{2 X 5}, P{(1) X 10}, P{ X 2}, P{X解: 确定c使得P{X c}设d满足P{X d} 0.9,问d至多为多少?(1)因为X ~ N(3,4)所以P{X c};2 3P{2 X 5} P{〒穿}P{1}(1) (0.5) (1) (0.5) 1 0.8413 0.6915 0.5328P 4 X 108F(2)(2.5)经查表得1 (0),即2专)故斗214.设随机变量1.29,解:P XF(所以(k)15.设随机变量如何变化的?(3.5)2 0.999810 3 4 3(^)2 2(3.5) 2 (3.5)1 0.99962) 1(0.5)0.1,解:X ~ N(,(0.5)0.3023F(3),则P X2X2(2.5)0.6977(0)得c 3 ;由概率密度关于即(-d 3)20.42.X服从正态分布2 2 (k)0.95 , p XN(0,1 0.5 0.5.c 3 1F(c)(〒)-,x=3对称也容易看出。
一.填空题:1.设r v ⋅X 的概率密度为f x e x x ()=-+-1221π,则EX = ,DX = 。
由于X )(~2σμ,N ,其概率密度应为 f x e x ()()=--121222πσσμ分析:因此把所给密度函数变形为f x e x ()()=-⋅-12121212122π()1 1/2课堂练习三或 EX =x e dx x x -∞+∞-+-⎰==11221π DX =()x e dx x x -==-∞+∞-+-⎰11122212π 2.已知r v ⋅X 服从参数为2的泊松分布,则Z X =-32的期望EZ = 。
分析:由于X 服从参数为2的泊松分布,故知其数学期望EX ==λ2,又由数学期望的性质可得42623)23(=-=-=-=EX X E EZ 43.设X Y 、相互独立,且概率分布分别为 f x e x x ()=-+-1221π (-∞<<+∞x )ϕ()/y y =≤≤⎧⎨⎩12020,,其它则:E X Y ()+=( );D X Y ()2+=( );E X Y ()232-=( )。
4.设一次试验成功的概率为p ,进行100次独立重复试验,当p = 时,成功次数的标准差的值最大,其最大值为 。
3.设X Y 、相互独立,且概率分布分别为 f x e x x ()=-+-1221π (-∞<<+∞x )ϕ()/y y =≤≤⎧⎨⎩12020,,其它则:E X Y ()+=( );D X Y ()2+=( );E X Y ()232-=( )。
27/3–2分析:EX =1,DX =1/2,EY =1,DX =1/32))((32)32(22-=+-=-EY DY EX Y X E4.设一次试验成功的概率为p ,进行100次独立重复试验,当p = 时,成功次数的标准差的值最大,其最大值为 。
分析:依题意,可设X 为100次独立重复试验中一次试验成功次数,则X B p ~()100,。
§1.6 事件的独立性设B A 、为两个事件,0)(>B P ,一般)|()(B A P A P ≠。
[引例] 设试验E 为抛掷甲、乙两枚匀质硬币,观察正(H )、反(T )面出现的情况。
分析:设事件A 表示:“甲币出现正面”;事件B 表示:“乙币出现正面”,则试验E 的样本空间}{TT TH HT HH ,,,=Ω由此21)(=A P ,21)(=B P ,而2/1)(/)()|(==B P AB P B A P ,即2/1)()|(==A P B A P ,于是由乘法公式)|()()(B A P B P AB P =)()(A P B P =Independence of Event定义1-4 设B A 、两个事件,如果 )()()(A P B P AB P =则称B A 、为相互独立事件。
由定义1-4易证,若事件A 与事件B 相互独立,则 (1)B A 与、B A 与、B A 与也相互独立;(2))|()()|()(A B P B P B A P A P ==,。
证明:(1)欲证明B A 、相互独立,只需证)()()(B P A P B A P =即可。
而)()(AB A P B A P -=)()()(B P A P A P -=))(1)((B P A P -=)()(B P A P =所以事件A 与事件B 相互独立。
同理)()(AB B P B A P -=)()()(B P A P B P -= ))(1)((A P B P -=)()(B P A P =所以事件A 与事件B 相互独立。
)()(B A P B A P =)(1B A P -=)()()(1AB P B P A P +--=)()()()(1B P A P B P A P +--=)()()](1)][(1[B P A P B P A P =--=所以事件A 与事件B 相互独立。
对于事件A 与事件B ,由于例1-17 甲、乙两人各自同时向敌机射击,已知甲击中敌机的概率为0.6,乙击中敌机的概率为0.5,求敌机被击中的概率。
第一章:测度与积分第一节:集族与测度(Ω,Φ,μ)---------测度空间①Ω---------------非空集合-------------研究对象全体②Φ----------------σ代数(域)-------由Ω的一些子集组成 σ代数对集合的一切有限次或可数次运算封闭 Φ{,}φ=Ω-------------平凡的σ代数③μ:Φ+→R ([0,1])集函数(是Ω的元素的一种测度或度量)例:Ω=[0,1].(a,b]⊂Ω,((,])a b b a μ- ,I 是Ω的子集,I 为区间,()I μ=I 的长度,Φ=B ([0,1])=()σε--------包含ε的最小σ代数,[0,1]ε=中的一切开集测度的唯一扩张定理,{:()}n x x ωξω∀∈≤∈R Φ 称ξ是可测函数({})a b μξξ<≤---的分布①..()lim ()n x a e μξωμ→∞⎧⎪⎨⎪⎩几乎处处收敛依测度收敛依分布收敛(弱收敛)②ξ是一维可测函数,积分ξωμωΩ⎰()d ()-------数学期望积分的收敛性---------Lebesgue 控制收敛定理lim ()?lim ()n n x x d d ξωμξωμ→∞→∞ΩΩ=⎰⎰Fatou 引理,Levy 引理 记号、述语:大写英文字母表示Ω的子集(事件)花写英文字母表示Ω的子集组成的集合类(集类,集族)AαBβXχ∆δEεΦφΓγHηIιϑϕKκΛλMμNνOο∏πΘθPρ∑σTτYυςϖΩωΞξψψZζ 某集类对某种运算封闭:如A 对可数并封闭指:对∀A1,A2,…A n ∈A ,则1i ∞=A i ∈A第二节:集族与测度1. 集合序列的极限 设1,2,...,,...,A A An ⊂Ω111limsup {:}{,,...,}x K k k K k n kAn n An X A A Anωω→∞∞+=∞∞==∈Ω∃∈== 可数个不同的,使至少一个发生111lim inf {:}{,,...,}x k k k k n kAn n An A A Anωω→∞∞+=∞∞==∈Ω∈== 除有限个以外,都发生关系:lim inf lim sup n n An An →∞→∞⊂如果lim inf lim sup n n An An →∞→∞=,称{}An 的极限存在,记为lim x An →∞特例:单调上升集合列:121,lim n n A A An An ∞→∞=⊂=单调下降集合列:121,lim n n A A An An ∞→∞=⊃=例:A,B 是Ω的两个子集,221,,1,2,n n A A A B n -=== ,则lim sup ,lim inf n n An A B An A B →∞→∞==11((1),1(1))nn An n n=-+-,则lim sup [0,1],lim inf (0,1)n n An An →∞→∞==11(,1)(0,1)2211(,1)(0,1)22n n n n An Bn =-↑=-+↓2几种常用集类的定义:①A 称为一个π类:如果A 对有限交封闭 ②∆称为一个λ类:如果:(a).ω∈ ∆;(b). ∆对真差封闭:若,A B ∈∆,且A B ⊂,则B A -∈∆ (c )∆对单调上升(下降)集合列的极限封闭 ③环A :如果A 对有限并、差运算封闭(交:()A B A A B =-- )④代数Φ:如果Φ是环,且Ω∈Φ0(代数对一切有限次运算封闭)⑤σ环A :如果A 对可数并、差运算封闭(⇒可数交封闭,极限运算封闭)⑥σ代数(域)Φ:如果Φ是σ环,且Ω∈Φ(σ代数对一切可数次集合运算封闭) ⑦单调族M :如果M 对单调上升(下降)列的极限封闭,即:如果An ∈M ,且An ↑,则1n An ∞=∈ M如果An ∈M ,且An ↓,则1n An ∞=∈ M代数、且又是单调族σ⇒代数 π类、且又是λ类σ⇒代数A 是任意集类,分别称λ()A ,σ()A ,M (A )是由A 生成的最小λ类,最小σ代数,最小单调类。
如:σ()A 是A 生成的最小σ代数指:①σ()A 是σ代数,且σ⊃()A A ②如果Φ是σ∀代数,且Φ⊃A ,且σ⊂()A F ⇒σσ⊃=是代数()F AF A F单调类定理的两种形式和证明方法:λπ-类方法:设C 是一个π类,D 是λ类,且⊂C D ,则:σ⊃()D C 单调族方法:设0F 是一个代数,M 是一个单调族,且0⊃M F ,则σ⊃0()M F 推论:πλλσ==是类,(),则()()C D C C C0000σ==是代数,(),则()()F M M F M F F 证明:λσ⊂()()C C ,显然(σλ ()是包含的类C C ) 只要证λσ⊃()()C C ,令λ=()D C如果D 对有限交封闭,则D 是一个σ代数C 11111.2.A \A A 3.A ,,B ,B B ,B ,lim B n n C Cn k n k k k n n n k n k A A A ==∞→∞=Ω∈⎛⎫ ⎪∈Ω=∈ ⎪⎪∈==∈ ⎪ ⎪⎪⎪∴∈↑=∈ ⎪⎝⎭,D D D D D D D()σ∴⊃D C①A {B A B }A ∀∈=⊂Ω∈ 固定,令;C H D 验证:A A A B,CBC C-B A C A-B A λ⊃∈⊂∈ 是类,且,,则()=H H CH DA ∴⊃H D ,即对AB ,A B ∀∈∈∈ ,CD D②B B ={E :E B }∀∈⊂Ω∈ 固定,令D H D验证:B B B λλ⊃∴⊃=,且是类()H C H H D C , 即B ,E B E ∀∈∀∈∈ ,D D D #方法:实际中,要证明σ代数()σC 中集合(元素)具有某种性质(*),先证C 中元素具有性质(*),然后将定义类{:*}A A =∈Ω具有性质()D 。
验证D 是一个λ类,则:λσ⊃=()()D C C例:11R ,(R )()B 上Lebesgue 测度的1(R )------Borel σ代数B ,即由1R 得全体开集(开区间)生成的最小σ代数,也是左开右闭区间生成的最小σ代数。
在1R ()B 上定义一个集函数μ:使I =I μ()的长度,I 是区间,令{}=∞≤≤∞(a,b ):-a<b +C ,则C 是一个π类。
(,),b a a b μ-⎧∀∈⎨+∞⎩区间有限定义((a,b ))=区间无限C ,1iA R ,*(A)=inf{():A}i i i iI I I μμ∀∈∃∈⊃∑ 有限个,使C*i(A)=sup{():A}i i i iI I I μμ∃∈⊂∑ 有限个,使C1*{:*()()}A R A A μμ=⊂=⊃D C R λσ∴⊃1是一个类,()=()D D B C测度的连续性:n An An A An ()An An A ,..(),lim (n)()n A s t A A A μσμμμμμμμ→∞∀∈↑→∞∀∈↓∃<∞= 00n 设是代数的一个非负可数可加集函数(a)下方连续:,,()(b)上方连续:,,n 则F F F有限可加+连续性⇔可数可加性第三节:测度的扩张定理Ω 非空集,F (代数或σ代数)R μ+→:F ,集函数,满足:①μφ()=0;②具有可数可加性:即 1n n 1A ,,A An ∞=∀∈∈ ,且互不相交,且F F ,n 1n 1An An μμ∞∞==∑ ()=()(有限可加:1n A ,,A 有限个),称μ是上的一个测度F测度分类:11An ..,()1[0,1],([0,1])A A A R R I I I L An An n n n s t A A Borel μμσμσμμμμσμ∞=Ω∞Ω=∃∈Ω=<∞Ω==---∈Ω∀∈== 有限测度:()<+,概率测度()有限测度:,非有限无穷测度:()域,()=的长度,则是有限测度,且是概率测度(2)=,=(),区间()=的长度----ebesgue 测度则是有限测度。
令(-n,n ),(An)=2n.且:F F B F F B F n 1R (3)[0,1],A A A μμ∞=⎧⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪=∞∞⎪⎪Ω==Ω∈⎪⎪⎩(-,+)的一切子集,()中点的个数,是一个计数测度F F扩张的步骤:01P 是代数0F 上的概率测度:中单调上升序列的极限集全体0G =F =,将P 的定义扩张到G 上,0n A An An An lim P An μμ→∞∀∈∃∈↑ ,,,()(),在上具备的性质:G F G①0,0()1P A μφμμμΩ=≤≤()=0,()=1,F |; ②,,,()()()A B A B A B A B φμμμ∈==+ G ; ③,,A B A B A B μμ⊂∈≤、则()()G ; ④n An An A lim An A μμμ→∞∈↑在上下方连续,即,,且()=()G G02设=Ω的一切子集所成集类,E 将μ的定义扩张到E 上。
*A *A G G A μμμ∀∈∈⊃ (外侧度):,()inf{():,}E G G ,则:①***,0*A μμμφμμ=Ω≤≤,()=0,()=1()1G |; ②*A B +*A B *A +*B (),*A +*B 1A B μμμμμμ≤≥∀∈ ()()()()次可加性()()、E③A B *A *B μμ⊂≤,则()()④n *An An A lim *An *A μμμ→∞∈↑=下方连续,即,,则()()E证④:111n n n n 0,,,..,()*(),2,*()*()()lim ()1()*()()2lim *()lim *()A A *()*()*()lim *()n n n n n nnn n n n k n nnk n nk n kk k n n n n n G s t G A G A A A G G A G G G G A A A A A A A εεμμμμμμμμεμεμεμμμμ→∞===→∞→∞→∞∀>∀∃∈⊃≤+=⊂∈≤==<≤+>≤++≥≥∴≥∑且归纳法()=,,G G03令C {A :*()+*()=1}A A μμ=∈H E则H 是一个σ代数,且*μ在H 上是概率测度。
0⊃H F ,同时0*P μ=F |,(称*μ为μ的扩张)。
0是的扩张H F ,限制到σ⊂0()()F H 结论:0P **PσμμσμΩΩ=000(,,)扩张到了(,(),),使得*是()上的概率测度。
F F F F |04如果P 是0F 的一个有限测度,1, 1.2.....,P n n n n n ∞=∃Ω∈Ω=Ω=ΩΩ∞ 且互不相交,且()<将001~3用到00(,,),()()*,()n n n n n P P A P A μσΩΩ 扩张为一个F F 对01(),*()*()nn n A A A σμμ∞=∀∈=Ω∑ F ,00(,(),*)P σμΩΩ是(,,)F F 的扩张,且还是唯一的。