均值与方差正态分布
- 格式:ppt
- 大小:254.50 KB
- 文档页数:11
对数正态分布的均值和方差
对数正态分布是一种常见的概率分布,它的概率密度函数是由正态分布取对数得到的。
对数正态分布的均值和方差是对其进行统计分析时非常重要的参数。
对数正态分布的均值可以用以下公式计算:
μ = exp(μ' + σ'^2/2)
其中,μ'是正态分布的均值,σ'^2是正态分布的方差。
对数正态分布的方差可以用以下公式计算:
σ^2 = [exp(σ'^2) - 1]exp(2μ' + σ'^2)
需要注意的是,对数正态分布的均值和方差都是正实数。
在统计分析中,这些参数常常用于描述对数正态分布的中心位置和离散程度。
- 1 -。
§12.7 离散型随机变量的均值、方差及正态分布了解离散型随机变量的均值、方差、标准差的意义,会根据离散型随机变量的分布列求出均值、方差或标准差。
理解公式“E (a ξ+b )=aE ξ+b ”,以及“若ξB (n,p ),则E ξ=np ”.能熟练地应用它们求相应的离散型随机变量的均值或期望;了解方差公式“D (a ξ+b )=a 2D ξ”,以及“若ξ~Β(n ,—p )”,并会应用上述公式计算有关随机变量的方差 。
教学重点:离散型随机变量的均值或期望的概念;正态分布曲线的性质、标准正态曲线N(0,1) 。
教学难点:根据离散型随机变量的分布列求出均值或期望通过正态分布的图形特征,归纳正态曲线的性质。
再现型题组1.若离散型随机变量ξ的分布列为则称E ξ= 为随机变量ξ的均值,也称为期望,它反映了离散型随机变量取值的 。
把 叫做随机变量方差,D ξξ的 ,记作 。
随机变量的方差与标准差都反映了随机变量取值的 。
其中标准差与随机变量本身有 。
2.若η=a ξ+b (a,b 为常数),则E η=E(a ξ+b )=______________;D η=D(a ξ+b )=____________;若ξ服从两点分布,则E ξ= ,D ξ= ,若X 服从二项分布,即~(,)B n p ξ,则E ξ= ,D ξ= 。
3.函数,()______________x μσϕ=的图象称为正态密度曲线,简称正态曲线。
4.对于任何实数a b <,随机变量X 满足()____________,P a X b <≤≈则称X 的分布为正态分布,正态分布完全由参数 确定。
因此正态分布常记作 ,如果X 服从正态分布,则记为 。
5.正态分布的特点:(1)曲线在 ;(2)曲线关于直线 对称; (3)曲线在x μ=时 ;(4)当μ一定时,曲线的形状由σ确定,σ越大,曲线 ,表示总体的分布越 ;σ越小,曲线 ,表示总体的分布越 。
正态分布均值和方差
正态分布是描述实现随机变量或离散值的分布形态最常被用到的一种概率分布。
它以均值和标准差为参数,常用来描述自然界丰富多样的现象,如测量误差。
包括经济学、数量金融学、物理学、数学的大部分应用都是基于正态分布的。
均值是正态分布的主要参数之一。
它是所有估计量的中位数,描述了数据的"
平均",具有重要的统计学意义。
均值的定义能够极大概括数据的特点,受到相应
的影响。
即增加任意修正量都不会使均值改变。
方差是正态分布的另一参数,描述了数据"变异"大小。
方差值越大,越不集中;相反,方差越小,数据越集中。
方差的可视化表现形式是柱状图,数值越大,则标准正太分布曲线越趋近于垂直,越不集中。
我们经常使用均值和方差来描述大量数据,其中均值可以代表数据的中心,方
差可以代表数据变异程度,从而更好的描述和分析数据,发现数据之间的相关性以及因果关系。
正态分布的均值和方差对于模型的调参和优化非常重要,正确的参数设置是成功建模的关键。
10.8 离散型随机变量的均值与方差、正态分布知识梳理:1.离散型随机变量的均值与方差一般地,若离散型随机变量X(1)均值称E (X )=x 1p 1+x 2p 2+…+x i p i +…+x n p n 为随机变量X 的均值或数学期望.它反映了离散型随机变量取值的平均水平.(2)方差称D (X )=∑ni =1 (x i -E (X ))2p i 为随机变量X 的方差,它刻画了随机变量X 与其均值E (X )的平均偏离程度,并称其算术平方根D (X )为随机变量X 的标准差.2.均值与方差的性质(1)E (aX +b )=aE(X )+b .(2)D (aX +b )=a 2D (X ).(a ,b 为常数)3.两点分布与二项分布的均值、方差(1)若随机变量X 服从两点分布,则E (X )=p ,D (X )=p (1-p ).(2)若X ~B (n ,p ),则E (X )=np ,D (X )=np (1-p ).4.正态分布(1)正态曲线:函数φμ,σ(x )22()2x u σ--,x ∈(-∞,+∞),其中实数μ和σ为参数(σ>0,μ∈R ).我们称函数φμ,σ(x )的图象为正态分布密度曲线,简称正态曲线.(2)正态曲线的特点①曲线位于x 轴上方,与x 轴不相交;②曲线是单峰的,它关于直线x =μ对称;③曲线在x =μ处达到峰值1σ2π; ④曲线与x 轴之间的面积为1;⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x 轴平移,如图甲所示;⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示.(3)正态分布的定义及表示一般地,如果对于任何实数a,b (a <b ),随机变量X 满足P (a <X ≤b )=ʃb a φμ,σ(x )d x ,则称随机变量X 服从正态分布,记作X ~N (μ,σ2).正态总体在三个特殊区间内取值的概率值①P (μ-σ<X ≤μ+σ)=0.682 6;②P (μ-2σ<X ≤μ+2σ)=0.954 4;题型一:离散型随机变量的均值与方程(高频考点)离散型随机变量的均值与方差是高考命题的热点,多以解答题的形式呈现,多为中档题.高考对离散型随机变量的均值与方差的考查主要有以下两个命题角度:(1)古典概型背景下的离散型随机变量的均值与方差;(2)与二项分布有关的均值与方差.方法归纳:(1)求离散型随机变量ξ的均值与方差的步骤①理解ξ的意义,写出ξ可能的全部取值.②求ξ取每个值的概率.③写出ξ的分布列.④由均值的定义求E(ξ).⑤由方差的定义求D(ξ).(2)二项分布的期望与方差如果ξ~B(n,p),则用公式E(ξ)=np;D(ξ)=np(1-p)求解,可大大减少计算量.[提醒]均值E(X)由X的分布列唯一确定,即X作为随机变量是可变的,而E(X)是不变的,它描述X取值的平均水平.命题角度1.古典概型背景下的离散型随机变量的均值与方差例1.某小组共10人,利用假期参加义工活动.已知参加义工活动次数为1,2,3的人数分别为3,3,4.现从这10人中随机选出2人作为该组代表参加座谈会.(1)设A为事件“选出的2人参加义工活动次数之和为4”,求事件A发生的概率;(2)设X为选出的2人参加义工活动次数之差的绝对值,求随机变量X的分布列和数学期望与方差.跟踪训练1.为回馈顾客,某商场拟通过模拟兑奖的方式对1 000位顾客进行奖励,规定:每位顾客从一个装有4个标有面值的球的袋中一次性随机摸出2个球,球上所标的面值之和为该顾客所获的奖励额.(1)若袋中所装的4个球中有1个所标的面值为50元,其余3个均为10元,求:①顾客所获的奖励额为60元的概率;②顾客所获的奖励额的分布列及均值;(2)商场对奖励总额的预算是60 000元,并规定袋中的4个球只能由标有面值10元和50元的两种球组成,或标有均衡,请对袋中的4个球的面值给出一个合适的设计,并说明理由.命题角度2. 与二项分布有关的均值与方差例2.(2018·洛阳市第一次统一考试)雾霾天气对人体健康有伤害,应对雾霾污染、改善空气质量的首要任务是控制PM2.5,要从压减燃煤、严格控车、调整产业、强化管理、联防联控、依法治理等方面采取重大举措,聚焦重点领域,严格考核指标.某省环保部门为加强环境执法监管,派遣四个不同的专家组对A 、B 、C 三个城市进行治霾落实情况抽查.(1)若每个专家组随机选取一个城市,四个专家组选取的城市可以相同,也可以不同,求恰有一个城市没有专家组选取的概率;(2)每一个城市都要由四个专家组分别对抽查情况进行评价,并对所选取的城市进行评价,每个专家组给检查到的城市评价为优的概率为12,若四个专家组均评价为优则检查通过不用复检,否则需进行复检.设需进行复检的城市的个数为X ,求X 的分布列和期望.题型二:均值与方差的实际应用例3.(2018·长沙市统一模拟考试)张老师开车上班,有路线①与路线②两条路线可供选择.路线①:沿途有A ,B 两处独立运行的交通信号灯,且两处遇到绿灯的概率依次为12,23,若A 处遇红灯或黄灯,则导致延误时间2分钟;若B 处遇红灯或黄灯,则导致延误时间3分钟;若两处都遇绿灯,则全程所花时间为20分钟.路线②:沿途有a ,b 两处独立运行的交通信号灯,且两处遇到绿灯的概率依次为34,25,若a 处遇红灯或黄灯,则导致延误时间8分钟;若b 处遇红灯或黄灯,则导致延误时间5分钟;若两处都遇绿灯,则全程所花时间为15分钟.(1)若张老师选择路线①,求他20分钟能到校的概率;(2)为使张老师日常上班途中所花时间较少,你建议张老师选择哪条路线?并说明理由.方法归纳:均值与方差的实际应用(1)D (X )表示随机变量X 对E (X )的平均偏离程度,D (X )越大表明平均偏离程度越大,说明X 的取值越分散;反之,D (X )越小,X 的取值越集中在E (X )附近,统计中常用D (X )来描述X 的分散程度.(2)随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量取值偏离于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要的理论依据,一般先比较均值,若均值相同,再用方差来决定.跟踪训练2.1.(2018·广西三市第一次联考)某公司为招聘新员工设计了一个面试方案:应聘者从6道备选题中一次性随机抽取3道题,按照题目要求独立完成.规定:至少正确完成其中2道题的便可通过.已知6道备选题中应聘者甲有4道题能正确完成,2道题不能完成;应聘者乙每道题正确完成的概率都是23,且每道题正确完成与否互不影响. (1)分别求甲、乙两人正确完成面试题数的分布列及数学期望; (2)请分析比较甲、乙两人谁面试通过的可能性大?2.某投资公司在2019年年初准备将1 000万元投资到“低碳”项目上,现有两个项目供选择:项目一:新能源汽车.据市场调研,投资到该项目上,到年底可能获利30%,也可能亏损15%,且这两种情况发生的概率分别为79和29; 项目二:通信设备.据市场调研,投资到该项目上,到年底可能获利50%,可能损失30%,也可能不赔不赚,且这三种情况发生的概率分别为35,13和115. 针对以上两个投资项目,请你为投资公司选择一个合理的项目,并说明理由.3.为迎接2022年北京冬奥会,推广滑雪运动,某滑雪场开展滑雪促销活动.该滑雪场的收费标准是:滑雪时间不超过1小时免费,超过1小时的部分每小时收费标准为40元(不足1小时的部分按1小时计算).有甲、乙两人相互独立地来该滑雪场运动,设甲、乙不超过1小时离开的概率分别为14,16;1小时以上且不超过2小时离开的概率分别为12,23;两人滑雪时间都不会超过3小时. (1)求甲、乙两人所付滑雪费用相同的概率;(2)设甲、乙两人所付的滑雪费用之和为随机变量ξ,求ξ的分布列与均值E (ξ),方差D (ξ).题型三:正态分布例4.(1)(2018·长春质检)已知随机变量X 服从正态分布N (1,σ2),若P (X >2)=0.15,则P (0≤X ≤1)=( )A .0.85B .0.70C .0.35D .0.15(2)已知某批零件的长度误差(单位:毫米)服从正态分布N (0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为( )(附:若随机变量ξ服从正态分布N (μ,σ2),则P (μ-σ<ξ<μ+σ)≈68.27%,P (μ-2σ<ξ<μ+2σ)≈95.45%)A .4.56%B .13.59%C .27.18%D .31.74%例5.(2017·全国Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N (μ,σ2).(1)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ]之外的零件数,求P (X ≥1)及X 的均值;(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ]之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)试说明上述监控生产过程方法的合理性;(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.0410.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得x -=116∑i =116x i =9.97,s =116∑i =116 (x i -x -)2=116(∑i =116x 2i -16x -2)≈0.212,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)用样本平均数x -作为μ的估计值μ^ ,用样本标准差s 作为σ的估计值σ^ ,利用估计值判断是否需对当天的生产过程进行检查?剔除(μ^ -3σ^ ,μ^ +3σ^)之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z 服从正态分布N (μ,σ2),则P (μ-3σ<Z ≤μ+3σ)=0.997 4,0.997 416≈0.959 2,0.008≈0.09.跟踪训练3.1.若X~N(5,1),则P(3<X<4)=()A.0.954 5B.0.477 3 C.0.341 4 D.0.135 92.(2018·福建省毕业班质量检测)若随机变量X~N(μ,σ2),且P(X>5)=P(X<-1)=0.2,则P(2<X<5)=________.3.“过大年,吃水饺”是我国不少地方过春节的一大习俗.2019年春节前夕,A市某质检部门随机抽取了100包某种品牌的速冻水饺,检测其某项质量指标值,所得频率分布直方图如下:(1)求所抽取的100包速冻水饺该项质量指标值的样本平均数x(同一组中的数据用该组区间的中点值作代表);(2)①由直方图可以认为,速冻水饺的该项质量指标值Z服从正态分布N(μ,σ2),利用该正态分布,求Z落在(14.55,38.45]内的概率;②将频率视为概率,若某人从某超市购买了4包这种品牌的速冻水饺,记这4包速冻水饺中这种质量指标值位于(10,30)内的包数为X,求X的分布列和均值.附:计算得所抽查的这100包速冻水饺的质量指标值的标准差为σ=142.75≈11.95;若ξ~N(μ,σ2),则P(μ-σ<ξ≤μ+σ)=0.682 6,P(μ-2σ<ξ≤μ+2σ)=0.954 4.课堂小结:1.随机变量的均值、方差与样本的平均值、方差的关系随机变量的均值、方差是常数,它们不依赖于样本的抽取,而样本的平均值、方差是随机变量,它们随着样本的不同而变化.2.期望与方差的一般计算步骤(1)理解X的意义,写出X的所有可能取的值;(2)求X取各个值的概率,写出分布列;(3)根据分布列,正确运用期望与方差的定义或公式进行计算.3.若X服从正态分布,即X~N(μ,σ2),要充分利用正态曲线的关于直线X=μ对称和曲线与x轴之间的面积为1的性质.4.易错防范(1)E(X)是一个实数,由X的分布列唯一确定.随机变量X是可变的,可取不同的值,而E(X)是不变的,它描述X 取值的平均状态.(2)变量的方差与标准差都反映了随机变量取值的稳定与波动、集中与离散的程度,其中标准差与随机变量本身具有相同的单位.(3)方差也是一个常数,它不具有随机性,方差的值一定是非负的.。