高三数学正态分布和线性回归(知识点和例题)
- 格式:docx
- 大小:104.23 KB
- 文档页数:5
高三回归方程知识点汇总回归方程是数学中重要的数学模型,用于描述变量之间的关系和进行预测。
在高三阶段,学生需要掌握回归分析的基本知识和技巧。
本文将对高三数学中回归方程的知识点进行全面汇总,并提供一些实例和应用场景供参考。
一、线性回归方程1.1 线性关系与线性回归方程线性关系指的是两个变量之间存在直线关系,可用一条直线来近似表示。
线性回归方程是线性关系的数学表达式,常用形式为 y = kx + b,其中 k 表示直线的斜率,b 表示直线在 y 轴上的截距。
1.2 最小二乘法最小二乘法是确定线性回归方程中斜率 k 和截距 b 的常用方法。
它通过最小化观测值与回归直线的拟合误差平方和,找到最佳的拟合直线。
1.3 直线拟合与误差分析直线拟合是利用线性回归方程将观测数据点拟合到一条直线上。
误差分析可以评估回归方程的拟合优度,常用指标有决定系数R²、平均绝对误差 MAE 等。
二、非线性回归方程2.1 非线性关系与非线性回归方程非线性关系指的是两个变量之间的关系不能用一条直线来近似表示,而是需要使用曲线或其他非线性形式进行描述。
非线性回归方程可以是多项式方程、指数方程、对数方程等形式。
2.2 最小二乘法拟合非线性回归方程与线性回归相似,最小二乘法也可以用于拟合非线性回归方程。
但由于非线性方程的复杂性,通常需要借助计算工具进行求解,例如利用数学软件进行非线性拟合。
2.3 模型选择和拟合优度检验在选择非线性回归模型时,需要综合考虑模型的拟合优度和实际应用的需求。
常见的方法包括比较不同模型的决定系数 R²、检验残差分布等。
三、应用实例3.1 人口增长模型以某地区的人口数据为例,通过拟合合适的回归方程,可以预测未来的人口增长趋势,为城市规划和社会发展提供决策依据。
3.2 经济增长模型回归方程可以用于分析经济数据,例如拟合国民生产总值与时间的关系,预测未来的经济增长态势,为政府制定经济政策提供参考。
3.3 科学实验数据分析在科学研究中,常常需要利用回归方程对实验数据进行拟合和分析。
高三数学(理)正态分布、线性回归、复数 知识精讲 人教版一. 本周教学内容:正态分布、线性回归、复数二. 重点、难点:1. 正态分布,N (2,σμ) R x e x f x ∈=--222)(21)(σμσπ (μ、σ为参数,σ>0)(1)曲线在x 轴上方。
(2)关于μ=x 对称。
(3)μ=x 时y 最大。
(4)↓+∞↑-∞),(),(μμ2. 线性回归应验证 样本相关系数3. 复数),(R b a C bi a z ∈∈+=Z n i i i i i i n n n n ∈-=-===+++342414411【典型例题】[例1] 标准正态分布N (0,1),2221)(x e x f -=π,R x ∈的性质 解:R x e x f y x ∈==-2221)(π (1)偶函数(2)0=x π21max =y (3)↑-∞)0,(↓+∞),0((4))(1)()(000x x x P x -Φ-=<=Φ(5))()()(a b b x a P Φ-Φ=<<),(2σμN 转化为 )1,0(2N(6))()()(σμξ-Φ=<=x x P x F[例2] 一台自动包装机向袋中装糖果,标准是每袋64g ,但因随机性误差,每袋具体重量有波动,据以往资料认为袋装糖果的重量ξ服从正态分布)5.1,64(2N 。
试问随机抽一袋糖果,其重量超过65g 的概率是多少? 解:)5.16465()65(->=>t P P ξ )67.0(>=t P )67.0(1)67.0(1Φ-=<-=t P2514.07486.01=-=[例3] 假设数学会考成绩ξ近似服从正态分布)10,70(2N ,现知第100名学生的成绩为60分。
试问第20名的学生成绩为多少分。
(7486.0)67.0(=Φ,8413.0)1(=Φ,8319.0)96.0(=Φ) 解:1070-=ξt )107060(1)60(1)60(-<-=<-=≥t P P P ξξ )1()1(1)1(1Φ=-Φ-=-<-=t P=0.8413∴ 60分以上占总体的84.13% 总人数:1198413.0100≈人 前20名:1681.011920= 设第20名成绩为x∴1681.0)(=≥x P ξ1681.0)(1=<-x P ξ8319.01681.01)1070(=-=-<x t P ∴96.01070=-x 6.970=-x ∴6.79=x[例4] 为研究某市家庭平均收入与月平均生活支出的关系,该市统计调查,随机调查10个求回归直线方程。
正态分布、线性回归一、 知识梳理1.正态分布的重要性正态分布是概率统计中最重要的一种分布,其重要性我们可以从以下两方面来理解:一方面,正态分布是自然界最常见的一种分布。
一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用都不太大,则这个指标服从正态分布。
2.正态曲线及其性质正态分布函数:22()2()x f x μσ--=,x ∈(-∞,+∞)3.标准正态曲线标准正态曲线N (0,1)是一种特殊的正态分布曲线,00()1()x x Φ-=-Φ,以及标准正态总体在任一区间(a ,b)内取值概率)()(a b P Φ-Φ=。
4.一般正态分布与标准正态分布的转化由于一般的正态总体),(2σμN 其图像不一定关于y 轴对称,对于任一正态总体),(2σμN ,其取值小于x 的概率)()(σμ-Φ=x x F 。
只要会用它求正态总体),(2σμN 在某个特定区间的概率即可。
5.“小概率事件”和假设检验的基本思想“小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。
这种认识便是进行推断的出发点。
关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。
课本是借助于服从正态分布的有关零件尺寸的例子来介绍假设检验的基本思想。
进行假设检验一般分三步:第一步,提出统计假设。
课本例子里的统计假设是这个工人制造的零件尺寸服从正态分布),(2σμN ; 第二步,确定一次试验中的取值a 是否落入范围(μ-3σ,μ+3σ); 第三步,作出推断。
如果a ∈(μ-3σ,μ+3σ),接受统计假设;如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设。
6.相关关系研究两个变量间的相关关系是学习本节的目的。
高考正态分布知识点在统计学中,正态分布是一种重要的概率分布,也被称为钟形曲线或高斯分布。
在高考数学中,正态分布是一个常见的考察点,学生需要了解和掌握与正态分布相关的概念、性质和应用。
下面将详细介绍高考正态分布的知识点。
一、正态分布的定义和性质1. 正态分布的定义:正态分布是指在数理统计中,如果随机变量X服从一个数学期望为μ、方差为σ²的正态分布,则记为X~N(μ, σ²),其中N表示正态分布。
2. 正态分布的性质:(1)正态分布是对称的,其均值、中位数和众数都相等,即μ=中位数=众数。
(2)正态分布的图像呈现出典型的钟形曲线。
(3)正态分布的曲线在均值两侧呈现出逐渐减小的趋势,但是永远不会到达横轴。
(4)正态分布的曲线关于均值μ对称。
(5)正态分布的标准差σ越大,曲线越矮胖;标准差σ越小,曲线越瘦高。
(6)约68%的数据落在均值±1个标准差范围内;约95%的数据落在均值±2个标准差范围内;约99.7%的数据落在均值±3个标准差范围内。
二、正态分布的概率计算1. 标准正态分布:标准正态分布是指均值为0,标准差为1的正态分布。
记为Z~N(0, 1)。
对于标准正态分布,我们可以通过计算标准正态分布表来得到对应的概率值。
2. 普通正态分布:当随机变量X服从正态分布N(μ, σ²)时,可以进行标准化处理,将X转化为一个服从标准正态分布的随机变量Z。
即Z=(X-μ)/σ,这样就得到了一个标准正态分布。
对于普通正态分布,可以通过标准正态分布表和标准化公式来计算相应的概率值。
3. 概率计算:对于正态分布,我们常常需要计算在某个区间范围内的概率值。
对于标准正态分布,可以利用标准正态分布表查找对应的概率值。
对于普通正态分布,可以将其转化为标准正态分布进行计算。
三、正态分布的参数估计1. 样本均值的抽样分布:在统计学中,我们经常需要对总体的均值进行估计。
对于正态分布,样本均值的抽样分布也是一个正态分布,并且其均值等于总体均值,方差等于总体方差除以样本容量的平方根。
1.正态分布(1)正态曲线函数f(x)=x∈R.其中∈R,>0为参数.我们称f(x)为正态密度函数,称它的图象为正态密度曲线,简称正态曲线.(2)正态分布若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布,记为X N(,).特别地,当=0,=1时,称随机变量X服从标准正态分布.(3)正态分布的均值和方差若X N(,),则E(X)=,D(X)=.3.正态曲线的特点(1)曲线位于x轴上方,与x轴不相交;(2)曲线是单峰的,它关于直线x=对称;(3)曲线在x=;(4)当|x|无限增大时,曲线无限接近x轴;(5)对任意的>0,曲线与x轴围成的面积总为1;(6)在参数取固定值时,正态曲线的位置由确定,且随着的变化而沿x轴平移,如图甲所示;(7)当取定值时,正态曲线的形状由确定,当较小时,峰值高,曲线“瘦高”,表示随机变量X的分布比较集中;当较大时,峰值低,曲线“矮胖”,表示随机变量X的分布比较分散,如图乙所示.4.3原则(1)正态总体在三个特殊区间内取值的概率P(-+)0.6827;P(-2+2)0.9545;P(-3+3)0.9973.(2)3原则在实际应用中,通常认为服从正态分布N(,)的随机变量X只取[-3,+3]中的值,这在统计学中称为3原则.历届高考题最新模拟题选做1.已知随机变量ξ服从正态分布N(0,σ2),P(ξ>2)=0.023,则P(-2≤ξ≤2)=()AA.0.954B.0.977C.0.488D.0.4772.已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为(B)(随机变量ξ服从正态分布N(μ,σ2),则P(μ-σ<ξ<μ+σ)=68.26%,P(μ-2σ<ξ<μ+2σ)=95.44%)A.4.56%B.13.59%C.27.18%D.31.74%3.已知随机变量X~N(1,σ2),P(X≥0)=0.8,则P(X>2)=(A)A.0.2B.0.4C.0.6D.0.8[解析]由X~N(1,σ2),正态曲线关于X=1对称,∴P(X>2)=P(X<0)=1-P(X≥0)=0.2;故选A.3.已知三个正态密度函数φi(x)=−(x−μi)22σi2(x∈R,i=1,2,3)的图像如图所示,则()A.μ1=μ3>μ2,σ1=σ2>σ3B.μ1<μ2=μ3,σ1<σ2<σ3C.μ1=μ3>μ2,σ1=σ2<σ3D.μ1<μ2=μ3,σ1=σ2<σ3由题图中y=φi(x)的对称轴知:132u u u =,y=φ1(x)与y=φ2(x)(一样)瘦高,而y=φ3(x)胖矮,所以σ1=σ2<σ3.故选:D.4.已知随机变量X服从正态分布N(5,4),且P(X>k)=P(X<k-4),则k的值为(B) A.6B.7C.8D.9[解析]∵(k-4)+k2=5,∴k=7,故选B.5.随机变量ξ服从正态分布N(μ,σ2),若P(ξ<2)=0.2,P(2<ξ<6)=0.6,则μ=(C) A.6B.5C.4D.3[解析]由题意可知P(ξ≥6)=1-P(ξ<2)-P(2<ξ<6)=0.2,∴P(ξ≥6)=P(ξ<2),∴μ=6+22=4.选C.6.已知随机变量ξ服从正态分布N(1,σ2),若P(ξ<4)=0.9,则P(-2<ξ<4)=(D) A.0.2B.0.4C.0.6D.0.8[解析]由正态曲线的对称性知P(-2<ξ<4)=2P(1<ξ<4)=212-P(ξ>4)=212-(1-P(ξ<4))=0.8.故选D.7.若随机变量X服从正态分布N(μ,σ2)(σ>0),则P(|X-μ|≤σ)≈0.6826,P(|X-μ|≤2σ)≈0.9544,P(|X-μ|≤3σ)≈0.9974.已知某校1000名学生某次数学考试成绩服从正态分布N(110,100),据此估计该校本次数学考试成绩在130分以上的学生人数约为(C)A.159B.46C.23D.13[解析]由题意,μ=110,σ=10,故P(X>130)=P(X>μ+2σ)=1-0.95442=0.0228.∴估计该校本次数学考试成绩在130分以上的学生人数约为1000×0.0228=22.8≈23.故选C.8.已知随机变量X ~N(2,1),其正态分布密度曲线如图所示.若在边长为1的正方形OABC 内随机取一点,则该点恰好取自黑色区域的概率为(D)附:若随机变量ξ~N(μ,σ2),则P(μ-σ≤ξ≤μ+σ)=0.6826,P(μ-2σ≤ξ≤μ+2σ)=0.9544.A .0.1359B .0.6587C .0.7282D .0.8641[解析]由题意P(0<X ≤1)=12×(0.9544-0.6826)=0.1359.正方形OABC 内取一点,则点恰好落在阴影部分的概率为P =1×1-0.13591×1=0.8641.选D.9.近年来中国进入一个鲜花消费的增长期,某农户利用精准扶贫政策,贷款承包了一个新型温室鲜花大棚,种植销售红玫瑰和白玫瑰.若这个大棚的红玫瑰和白玫瑰的日销量分别服从正态分布N(μ,302)和N(280,402),则下列选项正确的是(ABD)附:若随机变量X 服从正态分布N(μ,σ2),则P(μ-σ<X<μ+σ)≈0.6826.A .若红玫瑰日销售量范围在(μ-30,280)的概率是0.6826,则红玫瑰日销售量的平均数约为250B .红玫瑰日销售量比白玫瑰日销售量更集中C .白玫瑰日销售量比红玫瑰日销售量更集中D .白玫瑰日销售量范围在(280,320)的概率约为0.3413[解析]对于选项A :μ+30=280,μ=250,正确;对于选项BC :利用σ越小越集中,30小于40,B 正确,C 不正确;对于选项D :P(280<X<320)=P(μ<X<μ+σ)≈0.6826×12≈0.3413,正确.故选ABD.10.已知某校高三年级有1000人参加一次数学模拟考试,现把这次考试的分数转换为标准分,标准分的分数转换区间为[60,300],若使标准分X 服从正态分布N(180,900).(参考数据:①P(μ-σ<X ≤μ+σ)=0.6827;②P(μ-2σ<X ≤μ+2σ)=0.9545;③P(μ-3σ<X ≤μ+3σ)=0.9973.则(BC)A .这次考试标准分超过180分的约有450人B .这次考试标准分在(90,270]内的人数约为997C .甲、乙、丙三人恰有2人的标准分超过180分的概率为38D .P(240<X ≤270)=0.0428[解析]这次考试标准分超过180分的约有500人,A 错;∵P(90<X<270)=P(μ-3σ<X<μ+3σ)=0.9973,∴标准分在(90,270)内的人数约为0.9973×1000≈997,∴B 正确.甲、乙、丙恰有2人超过180分的概率为C232×=38,∴C 正确;∵P(240<X<270)=P (90<X<270)-P (120<X<240)2=P (μ-3σ<X<μ+3σ)-P (μ-2σ<X<μ+2σ)2=0.9973-0.95452=0.0214,∴D 错误.故选BC .11.已知随机变量X~N 4,22,则P 8<X <10的值约为()附:若Y~N μ,σ2,则P μ−σ<Y <μ+σ≈0.6827,P μ−2σ<Y <μ+2σ≈0.9545,P μ−3σ<Y <μ+3σ≈0.9974A.0.0215B.0.1359C.0.8186D.0.9760【解题思路】由题意确定μ=4,σ=2,根据P8<X<10=12[Pμ−3σ<X<μ+3σ−Pμ−2σ<X<μ+ 2σ],即可得答案.由题意知随机变量X~N4,22,故μ=4,σ=2,故P8<X<10=12[Pμ−3σ<X<μ+3σ−Pμ−2σ<X<μ+2σ]≈12(0.9974−0.9545)=0.02145≈0.0215,故选:A.12.已知随机变量服从正态分布X~N(2,σ2),若P(X≤1−2a)+P(X≤1+a)=1,则a=()A.0B.2C.−1D.−2根据正态分布的性质可得P(X≥1−2a)=P(X≤1+a),即可得到1−2a、1+a关于x=2对称,从而得到方程,解得即可.解:因为P(X≤1−2a)+P(X≤1+a)=1,P(X≤1−2a)+P(X≥1−2a)=1,所以P(X≥1−2a)=P(X≤1+a),所以1−2a+1+a=2×2,解得a=−2.故选:D.13.已知随机变量X服从正态分布N6,σ,若P X<4+5P X>8=1,则P4<X<6=()A.16B.14C.13D.19根据正态分布的对称性可得:P X<4=P X>8,P4<X<6=12−P X<4,结合题意可求P X<4=16,进而可求P4<X<6.X~N6,σ,则P X<4=P X>8,∴P X<4+5P X>8=6P X<4=1,则P X<4=16,∴P4<X<6=12−P X<4=13,选:C.1.新型冠状病毒肺炎是一种急性感染性肺炎,其病原体是一种先前未在人类中发现的新型冠状病毒,即2019新型冠状病毒.2020年2月7日,国家卫健委决定将“新型冠状病毒感染的肺炎”暂命名为“新型冠状病毒肺炎”,简称“新冠肺炎”.患者初始症状多为发热、乏力和干咳,并逐渐出现呼吸困难等严重表现,基于目前流行病学调查,潜伏期为1~14天,潜伏期具有传染性,无症状感染者也可能成为传染源,某市为了增强民众防控病毒的意识,举行了“预防新冠病毒知识竞赛”网上答题,随机抽取10000人,答题成绩统计如图所示.(1)由直方图可认为答题者的成绩z服从正态分布N(μ,σ2),其中μ,σ2分别为答题者的平均成绩x-和成绩的方差s2,那么这10000名答题者成绩超过84.81分的人数估计有多少人?(同一组中的数据用该组的区间中点值作代表)(2)如果成绩超过56.19分的民众我们认为是“防御知识合格者”,用这10000名答题者的成绩来估计全市的民众,现从全市中随机抽取4人,“防御知识合格者”的人数为ξ,求P(ξ≤3).(精确到0.001)附:①s2=204.75,204.75=14.31;②z~N(μ,σ2),则P(μ-σ<z<μ+σ)=0.6826,P(μ-2σ<z<μ+2σ)=0.9544;③0.84134=0.501,0.84133=0.595.[解析](1)由题意知:x-=45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,因为z服从正态分布N(μ,σ2),其中μ=x-=70.5,σ2=D(ξ)=204.75,σ=14.31,∴z服从正态分布N(μ,σ2)=N(70.5,14.312),而P(μ-σ<z<μ+σ)=P(56.19<z<84.81)=0.6826,∴P(z≥84.81)=1-0.68262=0.1587,∴竞赛成绩超过84.81的人数估计为0.1587×10000=1587人.(2)由(1)知,成绩超过56.19的概率为1-0.1587=0.8413,而ξ~B(4,0.8413),∴P(ξ≤3)=1-P(ξ=4)=1-C44·0.84134=1-0.501=0.499.2.“过大年,吃水饺”是我国不少地方过春节的一大习俗.2018年春节前夕,A市某质检部门随机抽取了100包某种品牌的速冻水饺,检测其某项质量指标,检测结果如频率分布直方图所示.(1)求所抽取的100包速冻水饺该项质量指标值的样本平均数x-(同一组中数据用该组区间的中点值作代表);(2)①由直方图可以认为,速冻水饺的该项质量指标值Z服从正态分布N(μ,σ2),利用该正态分布,求Z落在(14.55,38.45)内的概率;②将频率视为概率,若某人从某超市购买了4包这种品牌的速冻水饺,记这4包速冻水饺中这种质量指标值位于(10,30)内的包数为X,求X的分布列和数学期望.附:①计算得所抽查的这100包速冻水饺的质量指标的标准差为σ=142.75≈11.95;②若Z~N(μ,σ2),则P(μ-σ<Z≤μ+σ)=0.6826,P(μ-2σ<Z≤μ+2σ)=0.9544.[解析](1)所抽取的100包速冻水饺该项质量指标值的样本平均数x-为:x-=5×0.1+15×0.2+25×0.3+35×0.25+45×0.15=26.5.(2)①∵Z服从正态分布N(μ,σ2),且μ=26.5,σ≈11.95,∴P(14.55<Z<38.45)=P(26.5-11.95<Z<26.5+11.95)=0.6826,∴Z落在(14.55,38.45)内的概率是0.6826.②根据题意得每包速冻水饺中这种质量指标值位于(10,30)内的概率为213.02.0=+X ~X 的取值为0,1,2,3,4,P(X =0)=16121404=⎪⎭⎫ ⎝⎛C ;P(X =1)=41421⎪⎭⎫ ⎝⎛C =14;P(X =2)=42421⎪⎭⎫ ⎝⎛C =38;P(X =3)=43421⎪⎭⎫ ⎝⎛C =14;P(X =4)=44421⎪⎭⎫ ⎝⎛C =116.∴X 的分布列为X 01234P116143814116∴E(X)=4×12=2.(1)估计这100位学生的数学成绩的平均值(2)根据整个年级的数学成绩可以认为学生的数学成绩本的标准差s 的近似值为10,用样本平均数位学生,求他的数学成绩恰在64分到0().6827P X μσμσ≤≤+≈-,(2P μσ-(3)该年级1班的数学老师为了能每天督促学生的网络学习,提高学生每天的作业质量及学习数学的积极性,。
资料范本本资料为word版本,可以直接编辑和打印,感谢您的下载高中数学正态分布知识点+练习地点:__________________时间:__________________说明:本资料适用于约定双方经过谈判,协商而共同承认,共同遵守的责任与义务,仅供参考,文档可直接下载或修改,不需要的部分可直接删除,使用时请详细阅读内容正态分布高考要求例题精讲(一)知识内容1.概率密度曲线:样本数据的频率分布直方图,在样本容量越来越大时,直方图上面的折线所接近的曲线.在随机变量中,如果把样本中的任一数据看作随机变量,则这条曲线称为的概率密度曲线.曲线位于横轴的上方,它与横轴一起所围成的面积是,而随机变量落在指定的两个数之间的概率就是对应的曲边梯形的面积.2.正态分布⑴定义:如果随机现象是由一些互相独立的偶然因素所引起的,而且每一个偶然因素在总体的变化中都只是起着均匀、微小的作用,则表示这样的随机现象的随机变量的概率分布近似服从正态分布.服从正态分布的随机变量叫做正态随机变量,简称正态变量.正态变量概率密度曲线的函数表达式为,,其中,是参数,且,.式中的参数和分别为正态变量的数学期望和标准差.期望为、标准差为的正态分布通常记作.正态变量的概率密度函数的图象叫做正态曲线.⑵标准正态分布:我们把数学期望为,标准差为的正态分布叫做标准正态分布.⑶重要结论:①正态变量在区间,,内,取值的概率分别是,,.②正态变量在内的取值的概率为,在区间之外的取值的概率是,故正态变量的取值几乎都在距三倍标准差之内,这就是正态分布的原则.(二)典例分析:已知随机变量服从正态分布,则()A.B.C.D.在某项测量中,测量结果服从正态分布,若在内取值的概率为,则在内取值的概率为.对于标准正态分布的概率密度函数,下列说法不正确的是()A.为偶函数 B.最大值为C.在时是单调减函数,在时是单调增函数 D.关于对称已知随机变量服从正态分布,,则()A. B. C. D.某种零件的尺寸服从正态分布,则不属于区间这个尺寸范围的零件约占总数的.已知,若,则()A. B. C. D.无法计算设随机变量服从正态分布,若,则.设,且,则的值是(用表示).设随机变量服从正态分布,,则下列结论正确的个数是.⑴⑵⑶⑷如果随机变量,求的值.正态变量,为常数,,若,求的值.下列函数是正态分布密度函数的是()A. B. C. D.若正态分布密度函数,下列判断正确的是()A.有最大值,也有最小值 B.有最大值,但没最小值C.有最大值,但没最大值 D.无最大值和最小值设的概率密度函数为,则下列结论错误的是()A.B.C.的渐近线是 D.某市组织一次高三调研考试,考试后统计的数学成绩服从正态分布,其密度函数为,则下列命题中不正确的是()A.该市这次考试的数学平均成绩为分B.分数在120分以上的人数与分数在分以下的人数相同C.分数在110分以上的人数与分数在分以下的人数相同D.该市这次考试的数学标准差为灯泡厂生产的白炽灯寿命(单位:),已知,要使灯泡的平均寿命为的概率为,则灯泡的最低使用寿命应控制在小时以上.一批电池(一节)用于手电筒的寿命服从均值为小时、标准差为小时的正态分布,随机从这批电池中任意取一节,问这节电池可持续使用不少于小时的概率是多少?某班有名同学,一次考试后的数学成绩服从正态分布,平均分为,标准差为,理论上说在分到分的人数是.已知连续型随机变量的概率密度函数,⑴求常数的值;⑵求.已知连续型随机变量的概率密度函数,求的值及.设随机变量具有概率密度,求的值及.美军轰炸机向巴格达某铁路控制枢纽投弹,炸弹落弹点与铁路控制枢纽的距离的密度函数为,若炸弹落在目标40米以内时,将导致该铁路枢纽破坏,已知投弹颗,求巴格达铁路控制枢纽被破坏的概率.设,且总体密度曲线的函数表达式为:,.⑴求;⑵求及的值.某校高中二年级期末考试的物理成绩服从正态分布.⑴若参加考试的学生有人,学生甲得分为分,求学生甲的物理成绩排名;⑵若及格(分及其以上)的学生有人,求第名的物理成绩.已知标准正态分布表.在某校举行的数学竞赛中,全体参赛学生的竞赛成绩近似服从正态分布.已知成绩在分以上(含分)的学生有名.⑴试问此次参赛学生总数约为多少人?⑵若该校计划奖励竞赛成绩排在前名的学生,试问设奖的分数线约为多少分?附:标准正态分布表.。
正态分布和线性回归
高考要求
1.了解正态分布的意义及主要性质
2.了解线性回归的方法和简单应用 知识点归纳
1.正态分布密度函数:
22
()21
()2x f x e
μσπσ
--=,(σ>0,-∞<x <∞)
其中π是圆周率;e 是自然对数的底;x 是随机变量的取值;μ为正态分布的均值;σ是正态分布的标准差.正态分布一般记为),(2
σμN
2.正态分布),(2
σμN )是由均值μ和标准差σ唯一决定的分布
例1、下面给出三个正态总体的函数表示式,请找出其均值μ和标准差σ.
(1)2
2
21)(x e
x f -
=
π
,(-∞<x <+∞
)
(2)2
(1)81
()22x f x e π
--=,
(-∞<x <+∞)
解: (1)0,1 (2)1,2
3.正态曲线的性质:正态分布由参数μ、σ唯一确定,如果随机变
量ξ~N(μ,σ2
),根据定义有:μ=E ξ,σ=D ξ。
正态曲线具有以下性质:
(1)曲线在x 轴的上方,与x 轴不相交。
(2)曲线关于直线x =μ对称。
(3)曲线在x =μ时位于最高点。
(4)当x <μ时,曲线上升;当x >μ时,曲线下降。
并且当曲线向左、
右两边无限延伸时,以x 轴为渐近线,向它无限靠近。
(5)当μ一定时,曲线的形状由σ确定。
σ越大,曲线越“矮胖”,表示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。
五条性质中前三条较易掌握,后两条较难理解,因此应运用数形结合的原则,采用对比教学
4.标准正态曲线:当μ=0、σ=l 时,正态总体称为标准正态总体,其
相应的函数表示式是2
221)(x e
x f -
=
π
,(-∞<x <+∞)
其相应的曲线称为标准正态曲线
标准正态总体N (0,1)在正态总体的研究中占有重要的地位 任何正态分布的概率问题均可转化成标准正态分布的概率问题
5.标准正态总体的概率问题:
对于标准正态总体N (0,1),)(0x Φ是总体取值小于0x 的概率, 即 )()(00x x P x <=Φ,
其中00>x ,图中阴影部分的面积表示为概率0()P x x < 只要有标准正态
分布表即可查表解决.从图中不难发现:当00<x 时,
)(1)(00x x -Φ-=Φ;而当00=x 时,Φ(0)=0.5
例2 设),(~2
σμN X ,且总体密度曲线的函数表达式为: 4
1
2221)(+--
=
x x e
x f π
,x ∈R 。
(1)求μ,σ;
(2)求)2|1(|<
-x P 的值。
分析:根据表示正态曲线函数的结构特征,对照已知函数求出μ和σ。
利用一般正态总体),(2
σμN 与标准正态总体N (0,1)概率间的关系,将一般正态总体划归为标准正态总体来解决。
解:(1)由于2
22)2(2)1(4
12221
21)(--
+--
⋅=
=
x x x e
e
x f ππ
,
根据一般正态分布的函数表达形式,可知μ=1,2=σ,故X ~N (1,2)。
(2))2121()2|1(|+<<-=<-x P x P
(1(1(1)(1)2(1)120.84131
F F =-=Φ-Φ=Φ-Φ-=Φ-=⨯- 6826.0=。
点评:在解决数学问题的过程中,将未知的,不熟悉的问题转化为已知的、熟悉的、已解决了的问题,是我们常用的手段与思考问题的出发点。
通过本例我们还可以看出一般正态分布与标准正态分布间的内在关联。
9.相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系 相关关系与函数关系的异同点如下: 相同点:均是指两个变量的关系
不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.
10.回归分析一元线性回归分析: 对具有相关关系的两个变量进行统计分析的方法叫做回归分析通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性
对于线性回归分析,我们要注意以下几个方面:
(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。
两个变量具有相关关系是回归分析的前提。
(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。
(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。
11.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度 粗略地看,散点分布具有一定的规律
12. 回归直线
设所求的直线方程为,^
a bx y +=,其中a 、
b 是待定系数.
11
22211
()()()n n
i i i i i i n n i i i i x x y y x y nxy b x x x nx a y bx
====⎧
---⎪
⎪==⎨--⎪⎪
=-⎩∑∑∑∑, ∑==n i i x n x 11,∑==n
i i y n y 11 相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析
13.相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y 与x 的一组观测值,把
∑∑∑===----=
n
i n
i i i
n
i i i
y y x x
y y x x
r 1
1
221
)()()
)((=
∑∑∑===---n
i n i i i n
i i
i y n y x n x y
x n y
x 1
1
22221
)
)((
叫做变量y 与x 之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.
14.相关系数的性质: r ≤1,且r 越接近1,相关程度越大;且r 越接近0,相关程度越小.一般的,当r ≥ 0.75 时,就可以判断其具有很强的相关性,这时求线性回归方程才有意义。
例3 假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如
(1)线性回归方程;
(2)估计使用年限为10年时,维修费用是多少?
分析:本题为了降低难度,告诉了y 与x 间呈线性相关关系,目的是训练公式的使用。
于是23.14
5905
453.112552
2
51
25
1=⨯-⨯⨯-=
--=
∑∑==x
x y
x y
x b i i i i
i , 08.0423.15=⨯-=-=bx y a 。
∴线性回归方程为:08.023.1^
+=+=x a bx y 。
(2)当x=10时,38.1208.01023.1^=+⨯=y (万元) 即估计使用10年时维修费用是12.38万元。
点评:本题若没有告诉我们y 与x 间是呈线性相关的,应首先进行相关性检验。
如果本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回归方程也是没有意义的,而且其估计与预测也是不可信的。