第一章 概率统计基础知识(3)随机变量及其分布
- 格式:docx
- 大小:258.81 KB
- 文档页数:10
概率论与数理统计知识点第一章随机事件及其概率1.1 随机事件1.2 概率1.3 条件概率与全概公式1.4 事件的独立性与伯努利概型第二章随机变量及其分布2.1 随机变量与分布函数2.2 离散型随机变量及其分布2.3 连续型随机变量及其分布2.4 二维随机变量2.5 随机变量函数的分布第三章随机变量的数字特征3.1 数学期望3.2 方差3.3 几种常见分布的数学期望与方差3.4 随机变量矩、协方差与相关系数第四章大数定律与中心极限定理4.1 切比雪夫不等式4.2 大数定律4.3 中心极限定理第五章抽样分布5.1 总体与样本5.2 样本函数与样本分布函数5.3 抽样分布第六章参数估计6.1 点估计6.2 估计量的评价标准6.3 区间估计6.4 正态总体均值与方差的区间估计6.5 非正态总体参数的区间估计第七章假设检验7.1 假设检验的基本概念7.2 单个正态总体参数的假设检验7.3 两个正态总体参数的假设检验7.4非正态总体参数的假设检验7.5 总体分布的假设检验第八章方差分析8.1 问题的提出8.2 单因素试验方差分析8.3 单因素方差分析举例第九章回归分析9.1 问题的提出9.2 一元正态线性回归9.3 一元非线性回归简介9.4 多元线性回归9.5 多元回归应用举例第一章 随机事件及其概率知识要点及重要例题一、知识要点。
① 重要公式(1) A+A =Ω(2) A +B ̅̅̅̅̅̅̅̅=A ∙B ̅ A ∙B ̅̅̅̅̅̅=A +B̅ (德摩根定理) (3) P(A+B)=p(A)+P(B)-P(AB) (加法公式) (4) P(A-B)=P(A)-P(AB) (减法公式) (5) P(AB)=P(A)P(B|A)或P(AB)=P(A|B)P(B) (乘法公式) (6) P (B )=∑P (A i )P (B|A i )n i=0 (全概率公式) 由因求果(7) P(A j |B)=P(A j )P(B|A j )∑P (A i )ni=1P(B|A i )(叶贝斯公式) 由果索因② 概率定义(1) 统计定义:频率稳定在一个数附近,这个数称为事件的概率;(2) 古典定义:要求样本空间只有有限个基本事件,每个基本事件出现的可能性相等,则事件A所含基本事件个数与样本空间所含基本事件个数的比称为事件的古典概率;(3) 几何概率:样本空间中的元素有无穷多个,每个元素出现的可能性相等,则可以将样本空间看成一个几何图形,事件A看成这个图形的子集,它的概率通过子集图形的大小与样本空间图形的大小的比来计算;(4) 公理化定义:满足三条公理的任何从样本空间的子集集合到[0,1]的映射③ 随机事件(1) 事件的三种运算:并∪(和)、交∩(积)、差;注意差A-B可以表示成A与B的逆的积。
随机变量及其分布随机变量是概率论和统计学中的重要概念,它是描述随机现象结果的数学量。
随机变量可以是离散的,也可以是连续的。
在统计学中,我们通常用随机变量来描述随机试验的结果。
随机变量的分布则是描述随机变量可能取值的概率规律。
本文将介绍随机变量及其分布的基本概念,以帮助读者更好地理解这一重要的统计学概念。
**随机变量的定义**随机变量是一个函数,将样本空间中的每个事件映射到实数上。
简而言之,随机变量就是能够描述随机现象结果的一个变量。
例如,投掷一枚硬币,正面朝上可以用随机变量X=1表示,反面朝上可以用随机变量X=0表示。
在这个例子中,随机变量X的取值只能是1或0,因此X是一个离散的随机变量。
**随机变量的分类**根据随机变量的取值范围不同,可以将随机变量分为离散随机变量和连续随机变量两类。
离散随机变量的取值是有限个或可列无穷个,例如上面提到的投硬币问题;而连续随机变量的取值是连续的,通常对应于实数轴上的某个区间,例如一个人的身高、体重等。
在统计学中,我们常常使用概率密度函数(probability density function)来描述连续随机变量的分布。
**随机变量的分布**随机变量的分布是描述随机变量取各种值的概率规律。
对于离散随机变量,我们可以通过概率质量函数(probability mass function)来描述其分布。
概率质量函数给出了随机变量取每个可能值的概率。
例如,对于一个掷骰子的随机变量,其概率质量函数可以表示为P(X=x),其中X是随机变量,x是取值。
而对于连续随机变量,我们则使用概率密度函数来描述其分布。
概率密度函数在某一区间内的取值越大,该区间的概率越大。
常见的连续分布包括正态分布、均匀分布等。
**常见的随机变量分布**1. **离散分布**- 伯努利分布:伯努利分布是最简单的离散分布,只有两个可能的取值,例如抛硬币的结果。
- 二项分布:二项分布描述了n次独立重复的伯努利试验中,成功次数的概率分布,例如n次抛硬币后正面朝上的次数。
第一章:随机事件及其概率这一章的内容基本上属于高中学过的知识,除了第三节的全概率公式和Bayes公式。
但这两个公式只是把条件概率的计算换了一种形式。
一、随机事件及运算二、概率及其运算三、条件概率四、事件的独立性第二章:随机变量这一章将随机事件抽象成数字变量,并分为离散和连续两种进行研究。
最后用函数来表达两种变量的概率分布,再推广到多维变量。
其中运用了一些微积分知识。
一、离散型随机变量介绍离散型随机变量的概念和性质,介绍几种常见的离散性随机变量如:0-1分布、二项分布、泊松分布二、随机变量的分布函数将变量值及其概率用函数联系起来。
其实就是在不同的区间上变量值的概率。
但因为离散的关系,所以更像是数列而不是函数。
三、连续型随机变量变量值有无穷多的可能,所以变量的分布函数在各个区间上是连续的。
它和离散型随机变量的关系有些类似于函数和数列的关系。
四、一维随机变量的函数分布当变量和概率是一一对应时的函数分布,有归一、单调不减等性质。
概率密度是概率分布的导数,概率分布式概率密度的积分。
涉及到已知变量与另外一个变量具有函数关系,求另一个变量概率函数分布问题。
五、二维随机变量的联合分布当变量是成对出现时,概率的函数分布,同样有归一等性质。
变量的划分从各区间变为各区域。
涉及到二重积分、全微分等知识。
六、多维随机变量及其独立性其实就是二维的推广,此处将随机事件的独立性抽象为随机变量的独立性。
七、条件分布还是将随机事件的条件分布抽象化,用数字和符号来表示。
顺便将条件分布推广到多维随机变量。
八、多维随机变量函数的分布第三章:随机变量的数字特征一、随机变量的数学期望和高中所学的期望是一个东西,类似于加权平均分,不过现在要通过概率密度和概率分布去求。
二、方差体现变量的稳定性,和高中所学相同,不过同样需要用新的概念和知识去求解。
三、协方差和相关系数协方差是一个新的概念,用来判断两个随机变量是否相关。
相关系数是用来衡量两个变量之间的相关程度的量。
统计学中的随机变量与概率分布统计学是一门研究如何收集、处理、分析、解释、推断数据的学科,其中随机变量和概率分布是其中非常重要的概念。
一、随机变量随机变量是指一个试验所涉及的结果是随机的,但是这些结果可以用数值来表示。
比如,掷一枚硬币的结果可能是正面或者反面。
这个试验中,随机变量可能表示为X,如果正面朝上,就表示为X=1;如果反面朝上,就表示为X=0。
有两种类型的随机变量:离散随机犹豫和连续随机变量。
离散随机变量是指可能的结果是一个有限或者无限的集合,比如抛硬币的结果只能是正反两面。
概率分布列可以用来描述离散随机变量的概率分布。
连续随机变量是指可能的结果是一个无限但是连续的集合,比如一个人的体重或者收入。
概率密度函数可以用来描述连续随机变量的概率分布。
二、概率分布概率分布是随机变量的所有可能结果的概率分布,它们的总和为1。
概率分布的形式取决于随机变量的类型。
1. 离散随机变量的概率分布离散随机变量的概率分布可以用概率分布列来描述,即用一个数组来表示不同结果的概率。
例如,在抛掷一枚硬币的情况下,概率分布列可以表示如下:X 0 1P(X) 0.5 0.5其中,X是随机变量,0和1是离散随机变量的结果。
概率分布列表示X=0的概率为0.5,X=1的概率为0.5。
2. 连续随机变量的概率分布连续随机变量的概率分布不能用概率分布列来描述,因为连续随机变量的结果无限多,概率为0。
因此,使用概率密度函数。
概率密度函数描述了一个连续随机变量在某一点的概率密度,即该点附近可能出现的概率大小。
因此,概率密度函数只能表达相对概率,不能直接得到概率。
对于一个连续随机变量X,概率密度函数为f(x),则概率计算可以使用积分来计算,如下所示:P(a <= X <= b) = ∫[a, b]f(x)dx其中,a和b是X的两个不同值,∫[a, b]表示从a到b的积分。
统计学中常用的连续随机变量概率分布包括正态分布、t分布和F分布等。
概率与统计中的随机变量与分布函数概率与统计是数学中的一个重要分支,研究随机事件和随机现象的规律。
在概率与统计中,随机变量是一个特别重要的概念,用来描述随机事件的数量或性质。
而分布函数则是描述随机变量取值的概率分布规律的函数。
一、随机变量在概率与统计中,随机变量是指由随机事件的结果所对应的变量。
它可以看作是一种将样本空间中的元素和实数进行映射的函数。
随机变量可以分为两种类型:离散型和连续型。
离散型随机变量是指取有限或可数无限个取值的随机变量。
例如,投掷一枚骰子,其可能的取值为1、2、3、4、5、6,这就是一个离散型随机变量。
连续型随机变量是指其取值可以任意落在一个区间内的随机变量。
例如,某电子产品的寿命,可以取0至无穷大的实数值,这就是一个连续型随机变量。
随机变量可以直接由样本空间上的随机试验来确定,也可以通过对样本空间的一个个元素进行数值表示来确定。
二、分布函数分布函数是随机变量的重要描述工具,用来描述随机变量的取值在一定范围内的概率分布。
对于离散型随机变量,分布函数又称为累积分布函数;对于连续型随机变量,分布函数又称为概率密度函数。
1. 离散型随机变量的分布函数离散型随机变量的分布函数是指随机变量取值小于等于某个特定值的概率。
设X为一个离散型随机变量,其分布函数记为F(x),可以表示为:F(x) = P(X ≤ x)其中P(X ≤ x)表示随机变量X取值小于等于x的概率。
2. 连续型随机变量的分布函数连续型随机变量的分布函数是指随机变量取值小于等于某个特定值的概率密度。
设X为一个连续型随机变量,其分布函数记为F(x),可以表示为:F(x) = ∫f(t)dt, -∞ <x < +∞其中f(t)为X的概率密度函数。
概率密度函数f(t)表示在某个特定取值附近取到的概率。
三、随机变量与分布函数的应用随机变量与分布函数在概率与统计中有着广泛的应用。
它们可以帮助我们研究和描述各种随机现象和随机事件。
随机变量及其分布函数随机变量是描述随机事件的数学工具,它将随机事件映射到实数上。
我们可以将随机变量理解为一个函数,它将样本空间上的随机事件转化为一个实数。
随机变量的取值通常用大写字母来表示,例如X、Y、Z等,并且随机变量的取值可以是有限个或无限个。
随机变量的分布函数一个随机变量有着不同取值的可能性,而这些可能性可以用概率来描述。
针对一个随机变量而言,其取值在不同的范围内所对应的概率,就被称为该随机变量的分布函数。
分布函数通常用F(x)来表示,其中F是函数符号,x是随机变量的取值。
对于一个随机变量X,其分布函数定义为:F(x) = P(X≤x)其中P(X≤x)指的是随机变量X小于或等于x的概率。
因此,对于小于或等于x的所有可能取值,X的分布函数F(x)均可以计算出来。
随机变量的类型随机变量可以分为两类:离散随机变量和连续随机变量。
离散随机变量离散随机变量是只能取某些特定离散值的随机变量,它们通常意味着某个事件只能发生某些确定的次数。
例如,抛掷一颗骰子的结果就是一个典型的离散随机变量,因为其可能取的值只有1、2、3、4、5、6六种可能。
对于某个离散随机变量而言,它的分布函数是一个阶梯函数,在每个离散值处有一个跳跃,即:F(x) = P(X≤x) = ΣP(X=i),i≤x其中ΣP(X=i)表示随机变量取i的概率,i≤x表示X取i的所有取值小于或等于x。
例如,对于一个只能取0或1的离散随机变量X,其分布函数F(x)可以表示为:F(x) = P(X≤0) + P(X=1) = P(X=0) + P(X=1)其中P(X=0)和P(X=1)表示X取0和1的概率,因此:F(0) = P(X=0)F(1) = P(X=0)+P(X=1)连续随机变量连续随机变量是指可以取到任意实数值的随机变量,通常用于描述某个事件的结果可以连续变化的场景。
例如,衡量人的身高或体重就是一种典型的连续随机变量。
对于某个连续随机变量而言,由于它可以取到任意实数值,因此其分布函数也是一个连续函数。
随机变量及其概率分布随机变量是概率论和数理统计中的重要概念,描述了随机事件的数值特征。
概率分布则用于描述随机变量取值的概率情况。
本文将介绍随机变量及其概率分布的基本概念和常见的概率分布模型。
一、随机变量的定义与分类随机变量是对随机事件结果的数值化描述。
随机变量可分为离散型随机变量和连续型随机变量两种。
1. 离散型随机变量离散型随机变量只能取有限个或可数个值,常用字母X表示。
例如,抛掷骰子的点数就是一个离散型随机变量,可能取1、2、3、4、5、6之一。
2. 连续型随机变量连续型随机变量可以取某个区间内的任意值,通常用字母Y表示。
例如,测量某个物体长度的随机误差就可看作是一个连续型随机变量。
二、概率分布的概念与性质概率分布描述了随机变量取值的概率情况。
常见的概率分布包括离散型分布和连续型分布。
1. 离散型概率分布离散型概率分布描述了离散型随机变量取值的概率情况。
离散型概率分布函数可以用概率质量函数(probability mass function,PMF)来表示。
PMF表示了随机变量取某个特定值的概率。
离散型概率分布函数具有以下性质:①非负性,即概率大于等于0;②归一性,即所有可能取值的概率之和等于1。
常见的离散型概率分布有:伯努利分布、二项分布、几何分布、泊松分布等。
2. 连续型概率分布连续型概率分布描述了连续型随机变量取值的概率情况。
连续型概率分布函数可以用概率密度函数(probability density function,PDF)来表示。
PDF表示在随机变量取某个特定值附近的概率密度。
连续型概率分布函数具有以下性质:①非负性;②积分为1。
常见的连续型概率分布有:均匀分布、正态分布、指数分布等。
三、常见的1. 伯努利分布伯努利分布描述了一次随机试验中两个互斥结果的概率情况,取值为0或1。
其概率质量函数为:P(X=k) = p^k * (1-p)^(1-k),k=0或1其中,p为成功的概率,1-p为失败的概率。
随机变量及其分布知识点总结随机变量是数学中的一个基本概念,描述了一个随机事件的可能结果。
在概率论和统计学中,随机变量的分布是研究随机变量性质的重要工具。
本文将总结随机变量及其分布的相关知识,包括随机变量的定义、表示、分布、期望、方差等。
一、随机变量的定义随机变量是一种描述随机事件可能的变量,通常用符号 $X$ 表示。
随机变量的取值可以是离散的或连续的。
离散的随机变量只取有限或可数个取值,而连续的随机变量则取无限个取值。
二、随机变量的表示随机变量的表示通常用概率密度函数 $f_X(x)$ 或概率质量函数$g_X(x)$ 表示。
概率密度函数是描述随机变量取值分布的函数,通常用$f_X(x)$ 表示。
概率质量函数是描述随机变量离散程度的函数,通常用$g_X(x)$ 表示。
三、随机变量的分布随机变量的分布描述了随机变量取值的概率分布。
离散分布描述了随机变量只取有限或可数个取值的概率分布,连续分布描述了随机变量取无限个取值的概率分布。
1. 离散分布离散分布通常用 $P(X=x)$ 表示,其中 $x$ 是随机变量的取值。
离散分布的概率质量函数通常用 $g_X(x)$ 表示。
例如,正态分布的概率质量函数为:$$g_X(x) = frac{sqrt{2pi}}{x!}e^{-frac{(x-1)^2}{2}}$$2. 连续分布连续分布通常用 $P(X leq x)$ 表示,其中 $x$ 是随机变量的取值。
连续分布的概率质量函数通常用 $f_X(x)$ 表示。
例如,均匀分布的概率质量函数为: $$f_X(x) = begin{cases}1, & x in [0,1],0, & x in [1,2],end{cases}$$四、期望和方差随机变量的期望是随机变量的取值的总和。
离散分布的期望通常用$E(X)$ 表示,连续分布的期望通常用 $E[X]$ 表示。
期望的概率质量函数通常用$f_X(x)$ 表示。
概率与统计中的随机变量及其分布知识点总结在概率与统计学中,随机变量是一种具有概率分布的变量,它可以用来描述不确定性的现象和事件。
随机变量的理论是概率论的核心内容之一,掌握随机变量及其分布知识点对于理解概率与统计学的基本原理及应用具有重要意义。
本文将对概率与统计中的随机变量及其分布进行知识点总结。
一、随机变量的概念与分类随机变量(Random Variable)是指对于随机试验结果的数值描述。
随机变量可以分为离散型随机变量和连续型随机变量两类。
1. 离散型随机变量离散型随机变量(Discrete Random Variable)的取值为有限个或可数个。
常见的离散型随机变量有伯努利随机变量、二项分布随机变量、泊松随机变量等。
2. 连续型随机变量连续型随机变量(Continuous Random Variable)的取值可以是任意的实数。
通常用于表示测量结果或特定区间内的变化。
常见的连续型随机变量有均匀分布随机变量、正态分布随机变量等。
二、随机变量的分布函数与概率函数随机变量的分布函数和概率函数是描述随机变量的重要工具。
1. 分布函数分布函数(Distribution Function)是随机变量取值小于或等于某个值的概率,通常记作F(x),其中x为随机变量的取值。
分布函数的性质包括:非递减性、右连续性、左极限性质。
2. 概率函数(密度函数)概率函数(Probability Density Function)用于描述连续型随机变量的概率分布情况,通常记作f(x),其中x为随机变量的取值。
概率函数的性质包括:非负性、归一性。
三、常见的随机变量及其分布在概率与统计学中,有一些常见的随机变量及其分布是被广泛应用的。
1. 伯努利随机变量伯努利随机变量(Bernoulli Random Variable)是最简单的离散型随机变量,它只有两个取值,通常用来描述成功或失败的情况。
2. 二项分布随机变量二项分布随机变量(Binomial Random Variable)描述了n个独立的伯努利试验中成功的次数,其中n为试验次数,p为单次成功的概率。
概率统计每章知识点总结第一章:基本概念1.1 概率的概念1.2 随机变量及其分布1.3 大数定律和中心极限定理第一章主要介绍了概率统计的基本概念,包括概率的定义、随机变量的概念以及大数定律和中心极限定律。
概率是描述事物发生可能性的数学工具,是对随机事件发生规律的度量和描述。
随机变量是描述随机现象的数学模型,可以用来描述随机现象的特征和规律。
大数定律和中心极限定律则是概率统计中重要的两个定律,它们描述了大量独立随机变量的和的分布规律。
第二章:随机事件的概率计算2.1 古典概型2.2 几何概型2.3 等可能概型2.4 条件概率2.5 独立性第二章主要介绍了随机事件的概率计算方法,包括古典概型、几何概型、等可能概型、条件概率和独立性。
古典概型是指实验的样本空间是有限的且每个样本点的概率相等的情形,可以直接计算出随机事件的概率。
几何概型是指随机事件的概率与其所在的几何形状有关,需要通过几何方法来计算。
等可能概型是指实验的样本空间是有限的,但不同样本点的概率不一定相等,需要通过计算总体概率来计算随机事件的概率。
第三章:随机变量及其分布3.1 随机变量及其分布3.2 数学期望3.3 方差3.4 常用离散型随机变量的分布3.5 常用连续型随机变量的分布第三章主要介绍了随机变量及其分布的知识,包括随机变量的概念、数学期望、方差以及常用的离散型和连续型随机变量的分布。
随机变量是描述随机现象的数学模型,可以是离散型的也可以是连续性的。
数学期望和方差是描述随机变量分布特征的重要指标,它们能够描述随机变量的集中程度和离散程度。
离散型随机变量常用的分布包括伯努利分布、二项分布、泊松分布;连续型随机变量常用的分布包括均匀分布、正态分布、指数分布等。
第四章:多维随机变量及其分布4.1 二维随机变量4.2 多维随机变量4.3 边际分布4.4 条件分布4.5 独立性第四章主要介绍了多维随机变量及其分布的知识,包括二维随机变量、多维随机变量、边际分布、条件分布和独立性。
随机变量及其分布知识点总结随机变量是概率论中的基础概念之一,是描述随机事件的数学模型。
随机变量可以分为离散随机变量和连续随机变量,它们分别对应两种不同的概率分布函数。
随机变量及其分布是概率论和统计学中的重要概念,掌握它们的知识对理解概率和统计学的应用至关重要。
一、随机变量的定义在概率论中,将随机试验中的所有可能结果对应的实数量称为随机变量。
可以通过随机变量的取值和概率分布函数来描述随机试验的结果。
二、随机变量的分类1. 离散随机变量如果随机变量只能取离散的值,则称其为离散随机变量。
离散随机变量的概率分布函数(discrete probability function )可以用概率质量函数(probability mass function,PMF)表示。
离散随机变量的概率分布函数具有以下性质:1) P(X = x) ≥ 0,即每个值的概率非负。
2) ΣP(X = x) = 1,即所有可能取值的概率和为1。
3) PMF可以用折线图表示。
例如:伯努利试验中,试验的结果只有两种可能性,即成功和失败。
设X为成功的次数,则X是离散随机变量。
成功的概率为p,失败的概率为1-p。
则X的概率分布函数为:P(X = k) = p^k(1-p)^(1-k), k = 0,12. 连续随机变量如果随机变量可以取任意实数值,则称其为连续随机变量。
由于随机变量可以取无限多的值,因此相对于离散随机变量,它的概率分布函数有一些特殊的性质。
连续随机变量的概率密度函数(Probability Density Function,PDF)可以用函数表示。
由于随机变量连续,因此PDF不是一条折线,而是一条连续曲线。
连续随机变量的概率分布函数具有以下性质:1) P(X = x) = 0,即连续随机变量的每个单独取值的概率为0。
2) ∫f(x)dx = 1,即PDF下的所有面积和为13) 可以用PDF曲线下的面积计算概率。
例如:假设X表示一个信号在某个时间段内的功率,则X是一个连续随机变量。
概率论与数理统计知识点总结1. 概率论基础- 随机事件:一个事件是随机的,如果它可能发生也可能不发生。
- 样本空间:所有可能事件发生的集合。
- 事件的概率:事件发生的可能性的度量,满足0≤P(A)≤1。
- 条件概率:在另一个事件发生的条件下,一个事件发生的概率。
- 贝叶斯定理:描述了随机事件A和B的条件概率和边缘概率之间的关系。
- 独立事件:两个事件A和B是独立的,如果P(A∩B) = P(A)P(B)。
- 互斥事件:两个事件A和B是互斥的,如果它们不能同时发生,即P(A∩B) = 0。
2. 随机变量及其分布- 随机变量:将随机事件映射到实数的函数。
- 离散随机变量:取值为有限或可数无限的随机变量。
- 连续随机变量:可以在某个区间内取任意值的随机变量。
- 概率分布函数:描述随机变量取值的概率。
- 概率密度函数:连续随机变量的概率分布函数的导数。
- 累积分布函数:随机变量取小于或等于某个值的概率。
- 期望值:随机变量的长期平均值。
- 方差:衡量随机变量取值的离散程度。
3. 多维随机变量及其分布- 联合分布:描述两个或多个随机变量同时取特定值的概率。
- 边缘分布:通过联合分布求得的单个随机变量的分布。
- 条件分布:给定一个随机变量的值时,另一个随机变量的分布。
- 协方差:衡量两个随机变量之间的线性关系。
- 相关系数:协方差标准化后的值,表示变量间的线性相关程度。
4. 大数定律和中心极限定理- 大数定律:随着试验次数的增加,样本均值以概率1收敛于总体均值。
- 中心极限定理:独立同分布的随机变量之和,在适当的标准化后,其分布趋近于正态分布。
5. 数理统计基础- 样本:从总体中抽取的一部分个体。
- 总体:研究对象的全体。
- 参数估计:用样本统计量来估计总体参数。
- 点估计:给出总体参数的一个具体估计值。
- 区间估计:给出一个包含总体参数可能值的区间。
- 假设检验:对总体分布的某些假设进行检验。
- 显著性水平:拒绝正确假设的最大概率。
概率与统计中的随机变量和概率分布在概率与统计学中,随机变量和概率分布是重要的概念。
随机变量是随机试验中的数值结果,而概率分布描述了随机变量的可能取值和对应的概率。
一、随机变量随机变量是对随机试验结果的数值化描述。
它可以是离散的,也可以是连续的。
如果随机变量的取值是有限个或可数个,称为离散随机变量;如果随机变量的取值是一个区间或者一组区间,称为连续随机变量。
随机变量可以用大写字母表示,如X,Y等。
离散随机变量的取值通常用小写字母表示,如x,y等。
连续随机变量的取值通常用小写字母加积分符号表示,如∫f(x)dx。
二、概率分布概率分布描述了随机变量的所有可能取值以及对应的概率。
对于离散随机变量,概率分布可以用概率质量函数(Probability Mass Function, PMF)表示;对于连续随机变量,概率分布可以用概率密度函数(Probability Density Function, PDF)表示。
1. 离散随机变量的概率分布离散随机变量的概率分布可以用概率质量函数来表示。
概率质量函数给出了随机变量取某个值的概率。
例如,假设X是抛硬币的结果,正面为1,反面为0。
那么X的概率质量函数可以表示为:P(X=1) = 0.5P(X=0) = 0.52. 连续随机变量的概率分布连续随机变量的概率分布可以用概率密度函数来表示。
概率密度函数描述了随机变量取某个值的概率密度。
例如,假设X是一个服从正态分布的随机变量,其概率密度函数可以表示为:f(x) = (1/√(2πσ^2)) * exp(-(x-μ)^2/(2σ^2))其中,μ为均值,σ为标准差。
概率密度函数可以用来计算随机变量落在某个区间内的概率。
通过对概率密度函数进行积分,可以得到该区间的概率。
三、随机变量的期望和方差对于随机变量X,期望(Expectation)表示其取值的平均值。
可以用数学期望E(X)来表示。
对于离散随机变量,期望的计算公式为:E(X) = Σx * P(X=x)对于连续随机变量,期望的计算公式为:E(X) = ∫xf(x)dx方差(Variance)表示随机变量取值的离散程度。
第二节随机变量及其分布第二节随机变量及其分布一、随机变量表示随机现象结果的变量称为随机变量。
常用大写字母等表示,它们的取值用相应的小写字母x, y, z 等表示。
假如一个随机变量仅取数轴上有限个点或可列的个数点 (见图1.2-1) ,则称此随机变量为离散随机变量,或离散型随机变量。
假如一个随机变量的所有可能取值充满数轴上一个区间 (a,b)( 见图1.2-2) ,则称此随机变量为连续随机变量,或连续型随机变量,其中a可以是,b 可以是+ 。
[例1.2-1][例1.2-1] 产品的质量特性是表征产品性能的指标,产品的性能一般都具有随机性,所以每个质量特性就是一个随机变量。
例如:(1) 设x是一只铸件上的瑕疵数,则x是一个离散随机变量,它可以取0,1,2,…等值。
为了方便,人们常用随机变量x的取值来表示事件,如“x=0”表示事件“铸件上无瑕疵”;“x=2”表示事件“铸件上有两个瑕疵”;"x>2"表示事件“铸件上的瑕疵超过两个"等等。
这些事件可能发生,也可能不发生,因为x取0,1,2 …等值是随机的。
类似地,一平方米玻璃上的气泡数、一匹布上的疵点数、一台车床在一天内发生的故障数都是取非负整数 {0,1,2,3,…}的离散随机变量。
(2) 一台电视机的寿命x(单位:小时)是在[0,∞)上取值的连续随机变量。
"x=0" 表示事件"一台电视机在开箱时就发生故障";"x 10000" 表示事件:"电视机寿命不超过10000 小时";"x>40000" 表示事件"电视机寿命超过40000小时"。
(3) 检验一个产品,结果可能是合格品,也可能是不合格品。
设x表示检验一个产品的不合格品数,则x是只能取0或1两个值的随机变量。
"x=0"表示产品是合格品,"x=1" 表示产品是不合格品。
类似地,若检验10个产品,其中不合格品数x是仅可能取0,1,…,10等11个值的离散随机变量。
更一般的,在n个产品中的不合格品数x是可能取0,1,2,…,n等n+1 个值的离散随机变量。
二、随机变量的分布二、随机变量的分布(p15-20)虽然随机变量的取值是随机的,但其本质上还是有规律性的,这个规律性可以用分布来描述。
认识一个随机变量x的关键就是要知道它的分布,分布包含如下两方面内容:(1) x 可能取哪些值,或在哪个区间上取值。
(2) x 取这些值的概率各是多少,或x在任一区间上取值的概率是多少?下面分离散随机变量和连续随机变量来叙述它们的分布,因为这两类随机变量是最重要的两类随机变量,而它们的分布形式是有差别的。
(一) 离散随机变量的分布离散随机变量的分布可用分布列来表示,比如,随机变量x仅取n个值: ,随机变量取的概率为取的概率为,…,取的概率为p n 。
这些可用一张表清楚地表示:或用一个简明的数学式子表示: 作为一个分布,满足以下两个条件: 满足这两个条件的分布称为离散分布,这一组也称为分布的概率函数。
[例1.2-2 ][例1.2-2 ] 掷两颗骰子,点数分布的样本空间为:考察与这个随机现象有关的一些随机变量:(1)设x表示“掷两颗子骰子,6点出现的个数”,它的分布列为:(2)设y表示“掷两颗子,出现的点数之和”这些随机变量x, y 都是各从一个侧面表示随机现象的一种结果,每个随机变量的取值都是随机的,但其分布告诉我们该随机变量取每个值的概率,使人们不仅对全局做到心中有数,而且还看到了取哪些值的可能性大,x取哪些值的可能性小,比如:x取0可能性最大,x取2的可能性最小;y取7的可能性最大,y取2或12的可能性最小;这些分布中的概率都可用古典方法获得,每个概率都是非负的,其和均为1。
[例1.2-3][例1.2-3]设在10个产品中有2个不合格品,从中随机取出4个,其中不合格品数x 是离散随机变量,它仅可取0,1,2 等三个值。
x取这些值的概率为 (详见例1.1-4):具体计算后可得如下分布列:从表中可见,事件 "x=l" 出现的机会最大。
对同样的问题,若用放回抽样,则从10个产品(其中有2个不合格品)中随机取出4个,其中不合格品数y是另一个随机变量,它可取0,1,2,3,4 等五个值。
y取这些值的概率为(详见例1.1-6):m=0,1,2,3,4具体计算后可得如下分布列:这个分布显示了y取哪些值概率大,哪些值概率小。
还可计算有关事件的概率,比如:例[1.2-4][例1.2-4]某厂生产的三极管,每100 支装一盒,记x为一盒中不合格品数,厂方经多次抽查,根据近千次抽查的记录,用统计方法整理出如下分布:从这个分布可以看出,最可能发生的不合格品数在1到3之间,而超过5个不合格品的概率很小。
实际上,这两个事件的概率分别为:(二) 连续随机变量的分布(二) 连续随机变量的分布连续随机变量x的分布可用概率密度函数p(x)表示。
下面以产品的质量特性x,(如加工机械轴的直径)为例来说明p(x)的由来。
假定我们一个接一个地测量产品的某个质量特性值x, 把测量得到的x值一个接一个地放在数轴上。
当累积到很多x值时,就形成一定的图形,为了使这个图形得以稳定,把纵轴改为单位长度上的频率,由于频率的稳定性,随着被测质量特性值x的数量愈多,这个图形就愈稳定,其外形显现出一条光滑曲线。
这条曲线就是概率密度曲线,相应的函数表达式p(x)称为概率密度函数,它就是一种表示质量特性x随机取值的内在统计规律性的函数。
概率密度函数概率密度函数p(x)有多种形式,有的位置不同,有的散布不同,有的形状不同。
这些不同的分布形式反映了质量特性总体上的差别,这种差别正是管理层应该特别关注之处。
这里应强调的是:图上的纵轴原是“单位长度上的频率”,由于频率的稳定性,可用概率代替频率,从而纵轴就成为 "单位长度上的概率",这就是概率密度的概念,故最后形成的曲线称为概率密度曲线。
概率密度函数p(x)是连续随机变量特有的概念,它有如下性质。
(1)p(x)一定位于x轴上方,即p(x) > 0。
(2)p(x)与x轴所夹的面积恰好为1,即(3) 连续随机变量(3) 连续随机变量x在区间[a, b] 上的取值的概率为概率密度曲线下,在区间[a, b] 上所夹的曲边梯形面积 (见图1.2-3) 。
(4) 连续随机变量x取一点的概率为零,即p(x=a)=0,因为在一点上的积分永远为零。
(5)(5) ,这是因为,后者为零即得。
(6) 连续随机变量x 的分布函数f(x) 可用其密度函数算得,即所谓分布函数f(x) 就是概率密度函数从负无穷到x的积分,它表示随机变量取值从负无穷到x的概率,或相应区间的积分面积。
[例1.2-5 ][例1.2-5 ]考试得分是一个随机变量,下面是三个不同地区同一课程考试得分的概率密度函数 (见图1.2-4) 。
得分可以取0到100 分中的任意值,及格是50分,对每一地区,及格率大约是0.5 呢?还是大大超过0.5 ?还是大大低于0.5?解:在图1.2-4 上的50分处引一条垂线,则及格概率是:从50到100 之间的面积从图1.2-4 上可以看出: 地区(a) 的及格概率大大超过0.5 。
图1.2-4 三个地区考试得分的概率密度函数地区(b) 的及格概率大大低于0.5 。
地区(c) 的及格概率约为0.5 。
〔例1.2-6 〕〔例1.2-6 〕用指数函数表示的概率密度函数称为指数分布,它是一个常用分布,记为exp(λ),其中λ>0。
实际中不少产品发生失效的时间,或发生故障后需要维修的时间都服从指数分布,例如某厂生产的推土机发生故障后的维修霎时间t(单位:分)服从指数分布exp(0.02)。
其概率密度函数为:现转入现转入寻求一些事件的概率,在上述假定下,该推土机在100 分钟内完成维修的概率是图1.2-5 上左侧的一块阴影面积,这块面积可用积分计算:在计算面积时,一条直线的面积为0,在这个例子中p(t=100)=0即推土机完成维修时间不早不迟恰好在100 分钟的概率为0。
该推土机发生后在100 到300 分钟内完成维修的概率为:类似的:上述计算结果表明:此种推土机的86.47% 故障可在100 分钟内修好,有13.29% 的故障可在100 分钟到300 分钟修好,而超过300 分钟才能修好的故障只有0.24% 。
三、随机变量分布的均值、方差与标准差三、随机变量分布的均值、方差与标准差随机变量x的分布 (概率函数或密度函数)有几个重要的特征数,用来表示分布的集中位置 (中心位置)和散布大小。
1.均值:用来表示分布的中心位置,用e(x) 表示。
譬如e(x)=5 ,意味着随机变量x的平均值为5。
对于绝大多数的随机变量,在均值附近取值的机会较多。
它的计算公式是:其中xi,pi,和p(x)与上一小段中符号含义相同,这里不再重复。
2.方差:用来表示分布的散布大小,用var(x) 表示,方差大意味着分布的散布程度较大,也即比较分散,方差小意味着分布的散布程度小,也即分布较集中。
方差的计算公式是:3.标准差:方差的量纲是x的量纲的平方,为使表示分布散布大小的量纲与x的量纲相同,常对方差开平方,记它的正平方根为或,并称它为x的标准差:由于与x的量纲相同,在实际中更常使用标准差表示分布的散布大小,但它的计算通常是通过先计算方差,然后开方获得。
[例1.2-7][例1.2-7]现在来计算[例1.2-2]的有关分布的均值、方差和标准差。
在[例1.2-2]中随机变量“掷两粒骰子,点数之和y”的均值、方差和标准差分别为:[例1.2-8][例1.2-8]看图识方差(与标准差)。
图1.2—6(a) 、(b) 、(c) 、(d)上画出四个离散分布的线条图,其中垂线高度就是相应的概率。
现问这四个分布中哪个方差大,哪个方差小。
由方差的定义知:其中。
若要方差小,则和式中每一项都要小,这要求:(1) 若偏差-e(x) 的绝对值小,则相应概率可以大一些;(2) 若偏差-e(x) 的绝对值大,则相应概率必定要小。
这意味着:离均值e(x) 近的值发生的可能性大,远离均值e(x) 的值发生的可能性小,正如图1.2—6(d) 所示。
反之,若要方差大,则和式中必有某些乘积项较大,也就是说,有若干个大偏差-e(x) 发生的概率大,或者说远离均值e(x) 的值发生的可能性大,正如图1.2—6(a) 所示。
从上述说明可以看出图1.2—6上四个离散分布的方差(从而标准差)从上到下是逐渐减小的。
类似地,对连续分布也有类似解释,故图1.2—6(e) 、(f) 、(g)、(h) 上四个连续分布的方差(或标准差)从上到下也是逐渐减小的。