概率统计笔记
- 格式:pdf
- 大小:1016.96 KB
- 文档页数:16
概率统计笔记
概率统计是数学中的一个重要分支,它研究事件发生的可能性以及事件之间的联系和规律。
在现代科学和工程领域中,概率统计被广泛应用于数据分析、风险评估、决策制定等方面。
概率统计的基础是概率论,它研究随机事件的概率及其性质。
概率是指事件发生的可能性,通常用一个介于0和1之间的数值表示。
概率统计通过收集和分析数据,利用统计方法来研究事件发生的概率。
在概率统计中,常用的概念包括样本空间、事件、随机变量和概率分布。
样本空间是指一个随机试验中所有可能结果的集合,事件是指样本空间的一个子集,随机变量是指样本空间到实数集的映射,概率分布则描述了随机变量取值的概率。
概率统计的核心方法包括描述统计和推断统计。
描述统计是通过对已有数据的整理、汇总和分析来描述数据的特征和性质,常用的描述统计方法包括均值、方差、标准差等。
推断统计则是根据样本数据对总体特征进行推断,常用的推断统计方法包括假设检验、置信区间等。
在实际应用中,概率统计被广泛应用于各个领域。
在医学领域,概率统计被用来评估疾病的风险因素和治疗效果;在金融领域,概率统计被用来评估投资的风险和收益;在工程领域,概率统计被用来评估产
品的可靠性和寿命等。
总之,概率统计是一门重要的学科,它为我们提供了一种方法来理解和分析随机事件的可能性和规律。
通过概率统计的应用,我们可以更好地进行数据分析、风险评估和决策制定,从而提高我们的科学研究和工程实践的准确性和可靠性。
概率论与数理统计重点笔记
概率论与数理统计是数学中的重要分支,它涉及到随机现象的
规律性和统计规律的研究。
在学习概率论与数理统计时,重点笔记
可以包括以下内容:
1. 概率论的基本概念,包括样本空间、随机事件、事件的概率、事件的运算规律等内容。
重点理解事件的概率定义、概率的性质和
概率的运算法则。
2. 随机变量及其分布,重点掌握随机变量的定义、离散随机变
量和连续随机变量的概念,以及它们的分布律、密度函数、分布函
数等。
还要重点理解常见的离散分布(如二项分布、泊松分布)和
连续分布(如正态分布、指数分布)。
3. 大数定律和中心极限定理,重点掌握大数定律和中心极限定
理的表述和应用,理解随机变量序列的收敛性质,以及大样本时样
本均值的渐近正态性质。
4. 参数估计,包括点估计和区间估计的基本概念和方法,重点
理解最大似然估计、矩估计等常用的参数估计方法。
5. 假设检验,理解假设检验的基本思想、原理和步骤,掌握显著性水平、拒绝域、接受域等相关概念,重点理解假设检验的错误类别和势函数的概念。
6. 相关性和回归分析,重点理解相关系数、回归方程、残差分析等内容,掌握相关性和回归分析的基本原理和方法。
总之,在学习概率论与数理统计的过程中,重点笔记应该围绕着基本概念、常用分布、极限定理、参数估计、假设检验和回归分析展开,全面理解这些内容并掌握其应用是十分重要的。
希望以上内容能够帮助你更好地理解概率论与数理统计。
第一章随机事件与概率
第二章随机变量及其概率分布
第三章多维随机变量及其概率分布
第四章随机变量的数字特征
E(X)=
E(Y)=E[g(X)]=
E(X)=D(X)=
第五章大数定律及中心极限定理
第六章统计量及其抽样分布
第七章 参数估计
包含所要估计的未知参数(其中它与未知参数无关。
)的概率密度的对称性(见
未知时因为
,,,,;)]n x θ'时取最大值则取=。
的无偏估计,否则称
则称有效,即方差小参数估计越优。
,不等式.
不仅给出了统计量(对于已知时的置信区间),其中已知,而未
的置信度
可作为
采用
将上式开方即可得标准差
第八章假设检验
及备择假设
与
)分布,
的叫接受域,另一个的叫拒绝域,记为
则知小概率事件发生了,拒绝,接受
拒绝
时,
时,
时,
接受
落入接受域内时,则接受,拒绝
内,则拒绝,接受
未落在拒绝域内,则接受,拒绝
是从正态总体中抽取的一个样
为已知数,提出假设
引入统计量
相应的拒绝域
中抽取的一个样
本,其中
,其中
构造统计量
表求分位数
则拒绝域
未知,
本,欲检验假设:,其中
,可查
,即
若统计量,接受
若统计量,拒绝
第九章回归分析。
统计和概率知识点高一笔记统计和概率是数学中非常重要的分支之一,它们在各个领域都有广泛的应用。
高一学生首次接触这些知识点时,可能会感到有些吃力和困惑。
因此,本文将为大家简要介绍高一统计和概率的知识点,并给出一些例题进行讲解。
一、统计学基础知识1. 数据的收集和整理在统计学中,数据是非常重要的基础。
数据可以通过实地调查、问卷调查等不同方式进行收集。
在收集到数据后,需要对其进行整理和分类,以便后续的分析和运算。
2. 频数和频率频数是指某个数据在样本中出现的次数,而频率则是频数与样本容量的比值。
频率能够更好地反映数据的分布情况。
3. 统计图表统计图表是将数据以图形化的方式进行展示,常见的有条形图、折线图、饼图等。
通过观察统计图表,我们可以更直观地了解数据的分布、趋势等。
二、概率基础知识1. 随机事件与样本空间随机事件是指在某个随机试验中可能发生的事件。
样本空间是指该随机试验中所有可能结果的集合。
例如,掷一个骰子,出现的数字就是随机事件,而样本空间为1、2、3、4、5、6。
2. 事件的概率事件的概率是指该事件发生的可能性大小,通常用0到1之间的数值表示。
概率越大,事件发生的可能性越高。
例如,掷一个骰子,出现1的概率为1/6。
3. 事件的互斥与独立互斥事件是指两个事件不能同时发生,例如掷一个骰子,同时出现1和2是互斥事件。
独立事件是指两个事件的发生不受彼此影响,例如抛一枚硬币,第一次出现正面和第二次出现反面是独立事件。
三、统计与概率的应用1. 抽样调查与总体估计统计学中一个常用的应用是抽样调查与总体估计。
通过对一小部分样本进行调查并统计,然后推断出整个总体的情况。
例如,某地区的人口普查可以通过对一部分家庭进行抽样调查,从而估计该地区的总人口数量。
2. 随机变量与概率分布随机变量是指在随机试验中的一个可能结果,例如抛一次硬币,正面朝上和反面朝上可以看作是一个随机变量。
概率分布则描述了随机变量的取值与其对应概率的关系。
概率统计每章知识点总结第一章:基本概念1.1 概率的概念1.2 随机变量及其分布1.3 大数定律和中心极限定理第一章主要介绍了概率统计的基本概念,包括概率的定义、随机变量的概念以及大数定律和中心极限定律。
概率是描述事物发生可能性的数学工具,是对随机事件发生规律的度量和描述。
随机变量是描述随机现象的数学模型,可以用来描述随机现象的特征和规律。
大数定律和中心极限定律则是概率统计中重要的两个定律,它们描述了大量独立随机变量的和的分布规律。
第二章:随机事件的概率计算2.1 古典概型2.2 几何概型2.3 等可能概型2.4 条件概率2.5 独立性第二章主要介绍了随机事件的概率计算方法,包括古典概型、几何概型、等可能概型、条件概率和独立性。
古典概型是指实验的样本空间是有限的且每个样本点的概率相等的情形,可以直接计算出随机事件的概率。
几何概型是指随机事件的概率与其所在的几何形状有关,需要通过几何方法来计算。
等可能概型是指实验的样本空间是有限的,但不同样本点的概率不一定相等,需要通过计算总体概率来计算随机事件的概率。
第三章:随机变量及其分布3.1 随机变量及其分布3.2 数学期望3.3 方差3.4 常用离散型随机变量的分布3.5 常用连续型随机变量的分布第三章主要介绍了随机变量及其分布的知识,包括随机变量的概念、数学期望、方差以及常用的离散型和连续型随机变量的分布。
随机变量是描述随机现象的数学模型,可以是离散型的也可以是连续性的。
数学期望和方差是描述随机变量分布特征的重要指标,它们能够描述随机变量的集中程度和离散程度。
离散型随机变量常用的分布包括伯努利分布、二项分布、泊松分布;连续型随机变量常用的分布包括均匀分布、正态分布、指数分布等。
第四章:多维随机变量及其分布4.1 二维随机变量4.2 多维随机变量4.3 边际分布4.4 条件分布4.5 独立性第四章主要介绍了多维随机变量及其分布的知识,包括二维随机变量、多维随机变量、边际分布、条件分布和独立性。
《概率统计》知识点归纳总结1.加法公式结合独立性)()()()()(B P A P B P A P B A P -+=+例如:7.0)(,6.0)(==B P A P88.07.0*6.07.06.0)()()()()(=-+=-+=+B P A P B P A P B A P2. 分布函数的性质P39(其中分布函数)(x F 不是连续函数,非严格意义的单调递增性)3.方差的性质,二项分布)(p n B X ,~,泊松分布)(λπ~Y 的方差2,3.0,4===λp n44.312*97.0*3.0*4*16916)3()4()34(D =+=+=+=-DY DX Y D X D Y X4. ),(~2nN X σμ),N(~X 2σμ正态总体,b]U[a,~X 均匀总体),N(~X 2σμ正态总体,n X D X E 2)(,)(σμ==b]U[a,~X 均匀总体,n a b X D b a X E 12)()(,2)(2-=+=5总体均值()E X 的无偏估计量(系数相加等于1);P178:12(1)2121X 21X + ;5432151515151X 51X X X X ++++ 6加法公式结合独立性)()()()()(B P A P B P A P B A P -+=⋃减法公式结合独立性)()()()()()(B P A P A P AB P A P B A P -=-=-7.已知随机变量X 的分布律为记X 的分布函数为,则3F = 1 .8.平均值就是数学期望,P59:24; P117:11 9.置信区间10.假设检验中,犯第一类错误的概率就是显著性水平α犯第一类错误的概率,显著性水平α为 0.03,则在原假设 H 0成立的条件下,拒绝H 0的概率为___0.03________接受H 0的概率为______0.97_________ 11.A 和B 互斥(互不相容),A 和B 对立事件,P9,性质v12.概率等于0的事件,不一定是不可能的事件13.离散型随机变量,联合分布能唯一确定边缘分布,反之不成立14随机变量P143:(3.8),),1(~t 2n F15.显著性水平α是犯第I 类错误(弃真错误的概率)计算题: 16. 已知概率密度函数,利用概率密度函数求待定系数,分布函数,计算概率概率密度函数为⎩⎨⎧<≥=-0)(3x x Ae x f x 求{}01P X <<17.联合分布求边缘分布,判断独立性,判断是否相关,P7518.已知概率密度求方差(用方差的性质先化简),概率密度用P58:21(2),计算)13(XD19已知离散型随机变量的分布律求参数的最大似然估计值;P176:4(1),答案P6620全概率公式,贝叶斯公式的应用3. 已知一批产品中有95%是合格品,检查产品质量时,一个合格品被误判为次品的概率为0.02,一个次品被误判为合格品的概率是0.03.求(1)任意抽查一个产品,它被判为合格品的概率(2)一个经检查被判为合格的产品确实是合格品的概率.2、设A 表示合格品,A 表示次品,B 表示被检合格,则()0.95,()0.05,()1()0.98,()0.03P A P A P B A P B A P B A ===-== (1) 由全概率公式,得()=()()()()=0.950.98+0.050.03=0.9325P B P A P B A P A P B A +⨯⨯(2)由贝叶斯公式,得()()()()()()()P A P B A P A B P A P B A P A P B A =+=0.950.980.99840.950.980.050.03⨯=⨯+⨯3、某公司有甲、乙、丙三位秘书,让他们把公司文件的45%,40%,15% 进行归档,根据以往的经验,他们工作中出现错误的概率分别为0.01,0.02,0.05.现发现有一份文件归错档,试问该错误最有可能是谁犯的?解:设事件i A 表示“文件由第i 位秘书归档”()1,2,3i =,B 表示“文件归错档”. 依题意,()10.45P A =, ()20.4P A =, ()30.15P A =,()10.01P B A =, ()20.02P B A =,()30.05P B A =由全概率公式可知()()()()()()()112233P B P B A P A P B A P A P B A P A =++0.010.450.020.40.050.15=⨯+⨯+⨯0.02=()()()()1110.010.450.2250.02P B A P A P A B P B ⨯===()()()()2220.020.40.40.02P B A P A P A B P B ⨯===()()()()3330.050.150.3750.02P B A P A P A B P B ⨯===由此可见,这份文件由乙归错档的可能性最大.21. 正态分布计算概率;P59:28 答案P27。
概率论与数理统计复习第一章 概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现.样本空间S: E 的所有可能结果组成的集合. 样本点(基本事件):E 的每个结果.随机事件(事件):样本空间S 的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(Φ):每次试验中一定不会发生的事件.二. 事件间的关系和运算1.A ⊂B(事件B 包含事件A )事件A 发生必然导致事件B 发生.2.A ∪B(和事件)事件A 与B 至少有一个发生.3. A ∩B=AB(积事件)事件A 与B 同时发生.4. A -B(差事件)事件A 发生而B 不发生.5. AB=Φ (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=Φ且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德•摩根律 B A B A = B A B A =三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率.(1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+…2.性质(1) P(Φ) = 0 , 注意: A P(A)=0 .(2)有限可加性 对于n 个两两互不相容的事件A 1,A 2,…,A n ,P(A 1∪A 2∪…∪A n )=P(A 1)+P(A 2)+…+P(A n ) (有限可加性与可列可加性合称加法定理)(3)若A ⊂B, 则P(A)≤P(B), P(B -A)=P(B)-P(A) .(4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理 对于任意二事件A,B ,P(A ∪B)=P(A)+P(B)-P(AB) .对于任意n 个事件A 1,A 2,…,A n()()()()+∑+∑-∑=≤<<≤≤<≤=n k j i k j i n j i j i n i i n A A A P A A P A P A A A P 11121 …+(-1)n-1P(A 1A 2…A n )四.等可能(古典)概型1.定义 如果试验E 满足:(1)样本空间的元素只有有限个,即S={e 1,e 2,…,e n };(2)每一个基本事件的概率相等,即P(e 1)=P(e 2)=…= P(e n ).则称试验E 所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k 是A 中包含的基本事件数, n 是S 中包含的基本事件总数.五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0).P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0)3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S) ,则当P(B i )>0时,有全概率公式 P(A)=()()i ni i B A P B P ∑=1当P(A)>0, P(B i )>0时,有贝叶斯公式P (B i |A)=()()()()()()∑==n i i i i i i B A P B P B A P B P A P AB P 1. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件.(1)两个事件A,B 相互独立⇔ P(B)= P (B|A) .(2)若A 与B ,A 与B ,A 与B, ,A 与B 中有一对相互独立,则另外三对也相互独立.2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.3.n 个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()k k i i i i i i A P A P A P A A A P 2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x 2).(3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1).二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为:(1)非负性 0≤P k ≤1 ; (2)归一性 11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=x k (k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()k n k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1) (3))X~π(λ)参数为λ的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (λ>0) 三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数).2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(x x dx x f ; (4)若f (x)在点x 处连续,则f (x)=F / (x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 .3.三种重要的连续型随机变量的分布(1)X ~U (a,b) 区间(a,b)上的均匀分布 ⎩⎨⎧=-0)(1a b x f 其它b x a << . (2)X 服从参数为θ的指数分布.()⎩⎨⎧=-0/1θθx e x f 00≤>x x 若若 (θ>0). (3)X~N (μ,σ2 )参数为μ,σ的正态分布 222)(21)(σμσπ--=x e x f -∞<x<∞, σ>0.特别, μ=0, σ2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--x t dt e x 2221)(π , Φ(-x)=1-Φ(x) .若X ~N ((μ,σ2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z α}= P{Z<-z α}= P{|Z|>z α/2}= α,则点z α,-z α, ±z α/ 2分别称为标准正态分布的上,下,双侧α分位点. 注意:Φ(z α)=1-α , z 1- α= -z α.四.随机变量X 的函数Y= g (X)的分布1.离散型随机变量的函数若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律.2.连续型随机变量的函数若X 的概率密度为f X (x),则求其函数Y=g(X)的概率密度f Y (y)常用两种方法:(1)分布函数法 先求Y 的分布函数F Y (y)=P{Y ≤y}=P{g(X)≤y}=()()dx x f k y X k∑⎰∆其中Δk (y)是与g(X)≤y 对应的X 的可能值x 所在的区间(可能不只一个),然后对y 求导即得f Y (y)=F Y /(y) .(2)公式法 若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为 ()()()()⎩⎨⎧'=0y h y h f y f X Y 其它βα<<y 其中h(y)是g(x)的反函数 , α= min (g (-∞),g (∞)) β= max (g (-∞),g (∞)) .如果f (x)在有限区间[a,b]以外等于零,则 α= min (g (a),g (b)) β= max (g (a),g (b)) .第三章 二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义 若X 和Y 是定义在样本空间S 上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X ≤x,Y ≤y}称为(X,Y)的(X 和Y 的联合)分布函数.2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- ∞)=0, F(-∞,y)=0, F(-∞,-∞)=0, F(∞,∞)=1 .(3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) .(4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 .(2)归一性 ∑∑=i j ij p 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x y y ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-y xdudv v u f ),( 则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度.2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f . (3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2 (4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<∞}= F (x , ∞) .(X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<∞, Y ≤y}= F (∞,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }= ∑∞=1j ij p = p i · ( i =1,2,…) 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }= ∑∞=1i ij p = p ·j ( j =1,2,…) 归一性 11=∑∞=•j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dyy f Y五.相互独立的随机变量1.定义 若对一切实数x,y,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j = p i ··p ·j ( i ,j =1,2,…)对一切x i ,y j 成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立.六.条件分布1.二维离散型随机变量的条件分布定义 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称 },{j i j i p y Y x X P ==P{X=x i |Y=y j }为在Y= y j 条件下随机变量X 的条件分布律.同样,对于固定的i,若P{X=x i }>0,则称P{Y=y j |X=x i } 为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X离散型随机变量 连续型随机变量 分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛)⎰∞∞-dx x xf )((积分绝对收敛) 方差D(X)=E{[X-E(X)]2} []∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2 =E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛) 函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差σ(X)=√D(X) .二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .2.X,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0 ⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X)1.X~ (0-1)分布P{X=1}= p (0<p<1) p p (1- p),}{},{•=====i j i i j i p p x X P y Y x X P2.X~ b (n,p) (0<p<1) n p n p (1- p)3.X~ π(λ) λ λ4.X~ U(a,b) (a+b)/2 (b-a) 2/125.X 服从参数为θ的指数分布 θ θ26.X~ N (μ,σ2) μ σ2四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,…随机变量X 的k 阶中心矩E{[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如: 样本均值∑==n i i X n X 11 样本方差()∑--==n i i X X n S 12211 样本标准差S 样本k 阶矩∑==n i k i k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==n i k i k X X n B 1)(1( k=1,2,…) 二.抽样分布 即统计量的分布 1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n .特别,若X~ N (μ,σ2 ) ,则X ~ N (μ, σ2 /n) . 2.χ2分布 (1)定义 若X ~N (0,1 ) ,则Y =∑=ni i X 12~ χ2(n)自由度为n 的χ2分布.(2)性质 ①若Y~ χ2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ χ2(n 1) Y 2~ χ2(n 2) ,则Y 1+Y 2~ χ2(n 1 + n 2).③若X~ N (μ,σ2 ), 则22)1(σS n -~ χ2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ χ2(n),0< α <1 ,则满足αχχχχαααα=<>=<=>--))}(())({()}({)}({22/122/212n Y n Y P n Y P n Y P的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为χ2分布的上、下、双侧α分位点.3. t 分布(1)定义 若X~N (0,1 ),Y~ χ2(n),且X,Y 相互独立,则t=n Y X ~t(n)自由度为n 的t 分布. (2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (μ,σ2 )时,n S X μ-~ t (n-1) . ③两个正态总体 相互独立的样本 样本均值 样本方差X~ N (μ1,σ12 ) 且σ12=σ22=σ2 X 1 ,X 2 ,…,X n1 X S 12Y~ N (μ2,σ22 ) Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w (3)分位点 若t ~ t (n) ,0 < α<1 , 则满足αααα=>=-<=>)}({)}({)}({2/n t t P n t t P n t t P的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧α分位点.注意: t 1- α (n) = - t α (n).4.F 分布 (1)定义 若U~χ2(n 1), V~ χ2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③) 22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< α <1,则满足)},({)},({21121n n F F P n n F F P αα-<=>ααα=<>=-))},(()),({(212/1212/n n F F n n F F P的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧α分位点. 注意: .).(1),(12211n n F n n F αα=-第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数θ1, θ2,…, θk .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμ 解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθ ,以样本矩A l 取代总体矩μ l ( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A θθθθθθ,若代入样本值则得到矩估计值.2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, θ1, θ2,…, θk ),称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθ 为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21 ,称为参数θ1, θ2,…,θk 的最大似然估计值,代入样本得到最大似然估计量.若L(θ1, θ2,…, θk )关于θ1, θ2,…, θk 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iL θ (i =1,2,…,k) 求出最大似然估计. 3.估计量的标准(1) 无偏性 若E(∧θ)=θ,则估计量∧θ称为参数θ的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=μk =E(X k ),即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩μk 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= θ, 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效.(3)一致性(相合性) 若n →∞时,θθP →∧,则称估计量∧θ是参数θ的相合估计量.二.区间估计1.求参数θ的置信水平为1-α的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,θ),其中只有一个待估参数θ未知,且其分布完全确定.(2)利用双侧α分位点找出W 的区间(a,b),使P{a<W <b}=1-α.(3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求.2.单个正态总体待估参数 其它参数 W 及其分布 置信区间 μ σ2已知 n X σμ-~N (0,1) (2/ασz n X ±) μ σ2未知n S X μ-~ t (n-1) )1((2/-±n t n S X α σ2 μ未知22)1(σS n -~ χ2(n-1) ))1()1(,)1()1((22/1222/2-----n S n n S n ααχχ 3.两个正态总体(1)均值差μ 1-μ 2 其它参数 W 及其分布 置信区间已知2221,σσ 22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y X σσα+±-未知22221σσσ== 212111)(n n S Y X w +---μμ~t(n 1+n 2-2) )11)2((21212n n S n n t Y X w +-+±-α 其中S w 等符号的意义见第六章二. 3 (2)③. (2) μ 1,μ 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比σ12/σ22的置信区间为 ))1,1(1,)1,1(1(212/12221212/2221----⋅-n n F S S n n F S S αα 注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标α/2改为α,另外的下(上)限取为-∞ (∞)即可.。