高三数学 正态分布和线性回归(知识点和例题)
- 格式:doc
- 大小:261.50 KB
- 文档页数:5
高三回归方程知识点汇总回归方程是数学中重要的数学模型,用于描述变量之间的关系和进行预测。
在高三阶段,学生需要掌握回归分析的基本知识和技巧。
本文将对高三数学中回归方程的知识点进行全面汇总,并提供一些实例和应用场景供参考。
一、线性回归方程1.1 线性关系与线性回归方程线性关系指的是两个变量之间存在直线关系,可用一条直线来近似表示。
线性回归方程是线性关系的数学表达式,常用形式为 y = kx + b,其中 k 表示直线的斜率,b 表示直线在 y 轴上的截距。
1.2 最小二乘法最小二乘法是确定线性回归方程中斜率 k 和截距 b 的常用方法。
它通过最小化观测值与回归直线的拟合误差平方和,找到最佳的拟合直线。
1.3 直线拟合与误差分析直线拟合是利用线性回归方程将观测数据点拟合到一条直线上。
误差分析可以评估回归方程的拟合优度,常用指标有决定系数R²、平均绝对误差 MAE 等。
二、非线性回归方程2.1 非线性关系与非线性回归方程非线性关系指的是两个变量之间的关系不能用一条直线来近似表示,而是需要使用曲线或其他非线性形式进行描述。
非线性回归方程可以是多项式方程、指数方程、对数方程等形式。
2.2 最小二乘法拟合非线性回归方程与线性回归相似,最小二乘法也可以用于拟合非线性回归方程。
但由于非线性方程的复杂性,通常需要借助计算工具进行求解,例如利用数学软件进行非线性拟合。
2.3 模型选择和拟合优度检验在选择非线性回归模型时,需要综合考虑模型的拟合优度和实际应用的需求。
常见的方法包括比较不同模型的决定系数 R²、检验残差分布等。
三、应用实例3.1 人口增长模型以某地区的人口数据为例,通过拟合合适的回归方程,可以预测未来的人口增长趋势,为城市规划和社会发展提供决策依据。
3.2 经济增长模型回归方程可以用于分析经济数据,例如拟合国民生产总值与时间的关系,预测未来的经济增长态势,为政府制定经济政策提供参考。
3.3 科学实验数据分析在科学研究中,常常需要利用回归方程对实验数据进行拟合和分析。
高三数学(理)正态分布、线性回归、复数 知识精讲 人教版一. 本周教学内容:正态分布、线性回归、复数二. 重点、难点:1. 正态分布,N (2,σμ) R x e x f x ∈=--222)(21)(σμσπ (μ、σ为参数,σ>0)(1)曲线在x 轴上方。
(2)关于μ=x 对称。
(3)μ=x 时y 最大。
(4)↓+∞↑-∞),(),(μμ2. 线性回归应验证 样本相关系数3. 复数),(R b a C bi a z ∈∈+=Z n i i i i i i n n n n ∈-=-===+++342414411【典型例题】[例1] 标准正态分布N (0,1),2221)(x e x f -=π,R x ∈的性质 解:R x e x f y x ∈==-2221)(π (1)偶函数(2)0=x π21max =y (3)↑-∞)0,(↓+∞),0((4))(1)()(000x x x P x -Φ-=<=Φ(5))()()(a b b x a P Φ-Φ=<<),(2σμN 转化为 )1,0(2N(6))()()(σμξ-Φ=<=x x P x F[例2] 一台自动包装机向袋中装糖果,标准是每袋64g ,但因随机性误差,每袋具体重量有波动,据以往资料认为袋装糖果的重量ξ服从正态分布)5.1,64(2N 。
试问随机抽一袋糖果,其重量超过65g 的概率是多少? 解:)5.16465()65(->=>t P P ξ )67.0(>=t P )67.0(1)67.0(1Φ-=<-=t P2514.07486.01=-=[例3] 假设数学会考成绩ξ近似服从正态分布)10,70(2N ,现知第100名学生的成绩为60分。
试问第20名的学生成绩为多少分。
(7486.0)67.0(=Φ,8413.0)1(=Φ,8319.0)96.0(=Φ) 解:1070-=ξt )107060(1)60(1)60(-<-=<-=≥t P P P ξξ )1()1(1)1(1Φ=-Φ-=-<-=t P=0.8413∴ 60分以上占总体的84.13% 总人数:1198413.0100≈人 前20名:1681.011920= 设第20名成绩为x∴1681.0)(=≥x P ξ1681.0)(1=<-x P ξ8319.01681.01)1070(=-=-<x t P ∴96.01070=-x 6.970=-x ∴6.79=x[例4] 为研究某市家庭平均收入与月平均生活支出的关系,该市统计调查,随机调查10个求回归直线方程。
正态分布知识点高考正态分布,又称为高斯分布,是一种常见的连续型概率分布。
它在高考中占据重要地位,因此我们有必要了解并掌握相关的知识点。
本文将从基本概念、特点、参数、性质和应用等方面,介绍正态分布相关知识。
一、基本概念正态分布是一种理想的连续型概率分布,其概率密度函数呈钟形曲线,两头低,中间高,左右对称。
它由两个参数完全确定,即均值μ和标准差σ,分别决定了曲线的位置和形态。
二、特点1. 对称性:正态分布曲线是关于均值μ对称的,即在μ左右等距离的两个点处曲线的取值相等。
2. 唯一性:给定均值μ和标准差σ,正态分布曲线是唯一确定的,即每个参数对应一个特定的曲线。
3. 演趋性:正态分布曲线随着距离均值的增加或减少而变得越来越平缓,曲线两端向横轴无限延伸但不与其相交。
三、参数1. 均值μ:正态分布曲线的对称轴,决定了曲线的位置。
2. 标准差σ:正态分布曲线的形状参数,决定了曲线的宽度。
标准差越大,曲线越宽。
四、性质1. 正态分布曲线下的面积总和为1,即概率密度函数的积分等于1。
2. 68-95-99.7法则:在正态分布曲线上,约68%的数据位于均值的一个标准差范围内,约95%的数据位于均值的两个标准差范围内,约99.7%的数据位于均值的三个标准差范围内。
3. 随机变量的线性组合仍然服从正态分布。
4. 标准正态分布是均值为0,标准差为1的正态分布。
五、应用正态分布广泛应用于各个领域,包括自然科学、社会科学和工程等。
在高考中,正态分布常被用来描述和分析一些量化问题,如考试成绩、身高体重等。
利用正态分布的特性,可以进行相关问题的计算和预测。
总结:正态分布是一种重要的概率分布,具有对称性、唯一性和演趋性等特点。
它由均值和标准差两个参数完全确定,广泛应用于各个领域。
在高考中,掌握正态分布的基本概念、特点、参数、性质和应用非常重要,能够帮助学生更好地理解和解答相关问题。
高三线性回归方程知识点线性回归是数学中的一种方法,用于建立一个自变量与因变量之间的关系。
在高三数学中,线性回归方程是一个重要的知识点。
本文将介绍高三线性回归方程的基本概念、推导过程以及应用范围。
一、基本概念1. 线性回归方程线性回归方程,也叫作线性回归模型,表示自变量x和因变量y之间的关系。
它可以用如下的一般形式表示:y = β0 + β1x + ε其中,y表示因变量,x表示自变量,β0和β1表示模型中的参数,ε表示误差项。
2. 参数估计线性回归方程中的参数β0和β1需要通过观测数据进行估计。
常用的方法是最小二乘法,即通过最小化实际观测值和预测值之间的差异,来得到最优的参数估计值。
二、推导过程1. 求解参数通过最小二乘法,可以得到线性回归方程中的参数估计值。
具体推导过程包括以下几个步骤:(1)确定目标函数:将观测值和预测值之间的差异平方和作为目标函数。
(2)对目标函数求偏导:对目标函数分别对β0和β1求偏导,并令偏导数为0。
(3)计算参数估计值:根据求得的偏导数为0的方程组,解出β0和β1的值。
2. 模型拟合度评估在得到参数估计值之后,需要评估线性回归模型的拟合度。
常用的指标包括相关系数R和残差平方和SSE等。
相关系数R可以表示自变量和因变量之间的线性相关程度,取值范围在-1到1之间,越接近1表示拟合度越好。
三、应用范围线性回归方程在实际问题中有广泛的应用,例如经济学、统计学、社会科学等领域。
它可以用来分析自变量和因变量之间的关系,并预测未来的结果。
1. 经济学应用在线性回归模型中,可以将自变量设置为经济指标,例如GDP、通货膨胀率等,将因变量设置为某一经济现象的数值。
通过构建线性回归方程,可以分析不同经济指标对经济现象的影响,为经济决策提供参考依据。
2. 统计学应用线性回归方程是统计学中的一项重要工具。
通过对观测数据的拟合,可以得到参数估计值,并进一步分析自变量和因变量之间的关系。
统计学家可以利用线性回归分析建立统计模型,为实验数据的解释提供更为准确的结论。
高考正态分布知识点在统计学中,正态分布是一种重要的概率分布,也被称为钟形曲线或高斯分布。
在高考数学中,正态分布是一个常见的考察点,学生需要了解和掌握与正态分布相关的概念、性质和应用。
下面将详细介绍高考正态分布的知识点。
一、正态分布的定义和性质1. 正态分布的定义:正态分布是指在数理统计中,如果随机变量X服从一个数学期望为μ、方差为σ²的正态分布,则记为X~N(μ, σ²),其中N表示正态分布。
2. 正态分布的性质:(1)正态分布是对称的,其均值、中位数和众数都相等,即μ=中位数=众数。
(2)正态分布的图像呈现出典型的钟形曲线。
(3)正态分布的曲线在均值两侧呈现出逐渐减小的趋势,但是永远不会到达横轴。
(4)正态分布的曲线关于均值μ对称。
(5)正态分布的标准差σ越大,曲线越矮胖;标准差σ越小,曲线越瘦高。
(6)约68%的数据落在均值±1个标准差范围内;约95%的数据落在均值±2个标准差范围内;约99.7%的数据落在均值±3个标准差范围内。
二、正态分布的概率计算1. 标准正态分布:标准正态分布是指均值为0,标准差为1的正态分布。
记为Z~N(0, 1)。
对于标准正态分布,我们可以通过计算标准正态分布表来得到对应的概率值。
2. 普通正态分布:当随机变量X服从正态分布N(μ, σ²)时,可以进行标准化处理,将X转化为一个服从标准正态分布的随机变量Z。
即Z=(X-μ)/σ,这样就得到了一个标准正态分布。
对于普通正态分布,可以通过标准正态分布表和标准化公式来计算相应的概率值。
3. 概率计算:对于正态分布,我们常常需要计算在某个区间范围内的概率值。
对于标准正态分布,可以利用标准正态分布表查找对应的概率值。
对于普通正态分布,可以将其转化为标准正态分布进行计算。
三、正态分布的参数估计1. 样本均值的抽样分布:在统计学中,我们经常需要对总体的均值进行估计。
对于正态分布,样本均值的抽样分布也是一个正态分布,并且其均值等于总体均值,方差等于总体方差除以样本容量的平方根。
高三数学正态分布知识点正文:正态分布是概率论和统计学中经常应用的一种重要分布。
其特点是在均值附近的概率较高,而在离均值较远处的概率较低。
在高中数学的学习中,正态分布也是一个重要的知识点。
本文将介绍高三数学正态分布的相关知识。
一、正态分布的定义正态分布,又称为高斯分布,是一种连续型概率分布。
对于一个服从正态分布的随机变量X,其概率密度函数可以表示为:f(x) = (1 / sqrt(2 * π * σ^2)) * exp(-(x - μ)^2 / (2 * σ^2))其中,μ是均值,σ是标准差。
二、正态分布的性质1. 对称性:正态分布是以均值为对称轴,两侧面积相等的曲线。
2. 峰度:正态分布的峰度是指曲线的陡峭程度,峰度值为3。
3. 切点:正态分布曲线与均值之间会有两个切点,也即均值加减标准差的位置。
三、标准正态分布标准正态分布是指均值为0,标准差为1的正态分布。
它是对正态分布进行标准化后的结果。
对于一个服从正态分布的随机变量X,可以通过以下公式将其转化为标准正态分布的随机变量Z:Z = (X - μ) / σ四、正态分布的应用正态分布在实际生活和科学研究中具有广泛的应用,以下是几个常见的应用场景:1. 质量控制:正态分布可以帮助企业在生产过程中进行质量控制,通过控制产品的均值和标准差,来确保产品的质量稳定。
2. 统计分析:正态分布在统计学中扮演了重要角色,可以用于分析和描述大量数据的分布情况,从而得出结论或进行预测。
3. 考试评分:在考试评分过程中,教师常常采用正态分布来确定分数段及相应的等级,从而更公平地进行评价。
4. 实验设计:科学实验中常常会涉及到测量误差和数据分布的问题,正态分布可以作为参考,帮助科研人员进行实验设计和数据分析。
五、常用的正态分布应用题1. 求解概率:给定正态分布的均值和标准差,可以求解指定区间的概率。
2. 求解分位数:给定正态分布的均值和标准差,可以求解给定概率下的分位数,即求解落在该概率下的随机变量取值。
高考正态分布知识点归纳作为中国高等教育的重要选拔方式,高考在很大程度上决定了学生的命运。
而统计学中的正态分布是高考中常出现的一个重要概念。
了解和掌握正态分布的相关知识点对于高考数学考试至关重要。
本文将从不同角度对高考正态分布知识点进行归纳和总结,以帮助考生更好地应对相关考题。
一、正态曲线和标准正态分布正态曲线是一种在统计学中经常使用的函数图形。
它呈现出钟形曲线的形状,具有中心对称、均值和标准差两个重要参数的特征。
高考中常见的正态分布问题会涉及到正态曲线的图形特点、标准差的计算等内容。
标准正态分布是指均值为0、标准差为1的正态分布。
对于任意一个正态分布,我们都可以通过标准化处理,将其转化为标准正态分布。
标准正态分布具有良好的性质,比如其面积一定等于1,可以使用标准正态分布表进行查找。
二、正态分布的性质和应用正态分布具有许多重要的性质,这些性质在高考中常常会涉及到。
首先是标准差的性质。
标准差越大,曲线越扁平;标准差越小,曲线越陡峭。
这个性质可以帮助我们察觉数据的分散程度。
其次是与正态分布有关的概率问题。
根据正态分布的特点,我们可以计算某个数值在一定范围内的概率。
例如,高考中常见的题目会要求计算某个班级或某个学生在全省排名中的百分位数。
最后是正态分布在抽样理论中的应用。
正态分布是许多统计方法的基础,比如样本均值的抽样分布、样本比例的抽样分布等。
这些应用在高考数学考试中也经常会出现。
三、正态分布与假设检验高考中的数学考卷通常涉及到学生的实际生活问题。
与实际问题相关的统计假设检验也常常和正态分布有关。
假设检验是一种通过收集样本数据,根据样本数据对总体参数进行推断的方法。
在高考中,常见的假设检验问题可能涉及到学生的身高、成绩等方面。
其中,若总体服从正态分布,则可以使用正态分布的性质进行假设检验。
对于高考数学考试中的假设检验问题,我们需要熟悉正态分布的假设检验步骤和相关公式,以便正确地解答相关题目。
四、高考试题中的正态分布问题在高考数学试卷中,正态分布相关的题目通常出现在概率与统计部分。
正态分布和线性回归高考要求1.了解正态分布的意义及主要性质2.了解线性回归的方法和简单应用知识点归纳1.正态分布密度函数:22()2()xf xμσ--=,(σ>0,-∞<x<∞)其中π是圆周率;e是自然对数的底;x是随机变量的取值;μ为正态分布的均值;σ是正态分布的标准差.正态分布一般记为),(2σμN2.正态分布),(2σμN)是由均值μ和标准差σ唯一决定的分布例1、下面给出三个正态总体的函数表示式,请找出其均值μ和标准差σ.(1)2221)(xexf-=π,(-∞<x<+∞)(2)2(1)8()xf x--=,(-∞<x<+∞)解:(1)0,1 (2)1,23.正态曲线的性质:正态分布由参数μ、σ唯一确定,如果随机变量ξ~N(μ,σ2),根据定义有:μ=Eξ,σ=Dξ。
正态曲线具有以下性质:(1)曲线在x轴的上方,与x轴不相交。
(2)曲线关于直线x =μ对称。
(3)曲线在x =μ时位于最高点。
(4)当x <μ时,曲线上升;当x >μ时,曲线下降。
并且当曲线向左、右两边无限延伸时,以x 轴为渐近线,向它无限靠近。
(5)当μ一定时,曲线的形状由σ确定。
σ越大,曲线越“矮胖”,表示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。
五条性质中前三条较易掌握,后两条较难理解,因此应运用数形结合的原则,采用对比教学4.标准正态曲线:当μ=0、σ=l 时,正态总体称为标准正态总体,其相应的函数表示式是2221)(x ex f -=π,(-∞<x <+∞)其相应的曲线称为标准正态曲线标准正态总体N (0,1)在正态总体的研究中占有重要的地位 任何正态分布的概率问题均可转化成标准正态分布的概率问题5.标准正态总体的概率问题:对于标准正态总体N (0,1),)(0x Φ是总体取值小于0x 的概率, 即 )()(00x x P x <=Φ,其中00>x ,图中阴影部分的面积表示为概率0()P x x < 只要有标准正态分布表即可查表解决.从图中不难发现:当00<x 时,)(1)(00x x -Φ-=Φ;而当00=x 时,Φ(0)=0.5例2 设),(~2σμN X ,且总体密度曲线的函数表达式为: 412221)(+--=x x ex f π,x ∈R 。
正态分布要求层次重难点正态分布A利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义.(一) 知识内容1.概率密度曲线:样本数据的频率分布直方图,在样本容量越来越大时,直方图上面的折线所接近的曲线.在随机变量中,如果把样本中的任一数据看作随机变量X ,则这条曲线称为X 的概率密度曲线. 曲线位于横轴的上方,它与横轴一起所围成的面积是1,而随机变量X 落在指定的两个数a b ,之间的概率就是对应的曲边梯形的面积. 2.正态分布⑴定义:如果随机现象是由一些互相独立的偶然因素所引起的,而且每一个偶然因素在总体的变化中都只是起着均匀、微小的作用,则表示这样的随机现象的随机变量的概率分布近似服从正态分布.服从正态分布的随机变量叫做正态随机变量,简称正态变量. 正态变量概率密度曲线的函数表达式为22()21()2πx f x eμσσ−−=⋅,x ∈R ,其中μ,σ是参数,且0σ>,μ−∞<<+∞.式中的参数μ和σ分别为正态变量的数学期望和标准差.期望为μ、标准差为σ的正态分布通常记作2(,)N μσ.正态变量的概率密度函数的图象叫做正态曲线.⑵标准正态分布:我们把数学期望为0,标准差为1的正态分布叫做标准正态分布. ⑶重要结论:①正态变量在区间(,)μσμσ−+,(2,2)μσμσ−+,(3,3)μσμσ−+内,取值的概率分别是68.3%,95.4%,99.7%.②正态变量在()−∞+∞,内的取值的概率为1,在区间(33)μσμσ−+,之外的取值的概率是0.3%,故正态变量的取值几乎都在距x μ=三倍标准差之内,这就是正态分布的3σ原则.例题精讲高考要求正态分布x=μOyx(二)典例分析:【例1】 已知随机变量X 服从正态分布2(3)N a ,,则(3)P X <=( )A .15B .14C .13D .12【例2】 在某项测量中,测量结果X 服从正态分布()()210N σσ>,,若X 在()01,内取值的概率为0.4,则X 在()02,内取值的概率为 .【例3】 对于标准正态分布()01N ,的概率密度函数()2212πx f x e−=,下列说法不正确的是( )A .()f x 为偶函数B .()f x 最大值为12πC .()f x 在0x >时是单调减函数,在0x ≤时是单调增函数D .()f x 关于1x =对称【例4】 已知随机变量X 服从正态分布2(2)N σ,,(4)0.84P X =≤,则(0)P X =≤( ) A .0.16 B .0.32 C .0.68 D .0.84【例5】 某种零件的尺寸服从正态分布(04)N ,,则不属于区间(44)−,这个尺寸范围的零件约占总数的 .【例6】 已知2(1)X N σ−,~,若(31)0.4P X −=≤≤-,则(31)P X −=≤≤( ) A .0.4 B .0.8 C .0.6 D .无法计算【例7】 设随机变量ξ服从正态分布(29)N ,,若(2)(2)P c P c ξξ>+=<−,则_______c =.【例8】 设~(01)N ξ,,且(||)(010)P b a a b ξ<=<<>,,则()P b ξ≥的值是_______(用a 表示).【例9】 设随机变量ξ服从正态分布(01)N ,,0a >,则下列结论正确的个数是____.⑴(||)(||)(||)P a P a P a ξξξ<=<+= ⑵(||)2()1P a P a ξξ<=<− ⑶(||)12()P a P a ξξ<=−< ⑷(||)1(||)P a P a ξξ<=−>【例10】 如果随机变量2~()1N E D ξμσξξ==,,,求(11)P ξ−<<的值.【例11】 正态变量2~(1)X N σ,,c 为常数,0c >,若(2)(23)0.4P c X c P c X c <<=<<=,求(0.5)P X ≤的值.【例12】 下列函数是正态分布密度函数的是( )A .2()21()2x r f x eσσ−=π B .222()2x f x e −=ππ C .2(1)41()22x f x e −=π D .221()2x f x e =π【例13】 若正态分布密度函数2(1)21()()2x f x ex −−=∈R π,下列判断正确的是( )A .有最大值,也有最小值B .有最大值,但没最小值C .有最大值,但没最大值D .无最大值和最小值【例14】 设ξ的概率密度函数为2(1)21()2x f x e−−=π,则下列结论错误的是( )A .(1)(1)P P ξξ<=>B .(11)(11)P P ξξ−=−<<≤≤C .()f x 的渐近线是0x =D .1~(01)N ηξ=−,【例15】 某市组织一次高三调研考试,考试后统计的数学成绩服从正态分布,其密度函数为2(80)2001()102x f x eπ−−=,则下列命题中不正确的是( )A .该市这次考试的数学平均成绩为80分B .分数在120分以上的人数与分数在60分以下的人数相同C .分数在110分以上的人数与分数在50分以下的人数相同D .该市这次考试的数学标准差为10【例16】 灯泡厂生产的白炽灯寿命ξ(单位:h ),已知2~(100030)N ξ,,要使灯泡的平均寿命为1000h的概率为99.7%,则灯泡的最低使用寿命应控制在_____小时以上.【例17】 一批电池(一节)用于手电筒的寿命服从均值为35.6小时、标准差为4.4小时的正态分布,随机从这批电池中任意取一节,问这节电池可持续使用不少于40小时的概率是多少?【例18】 某班有48名同学,一次考试后的数学成绩服从正态分布,平均分为80,标准差为10,理论上说在80分到90分的人数是______.【例19】 已知连续型随机变量ξ的概率密度函数01()1202x f x x a x x ⎧⎪=−<⎨⎪⎩≤≤≥,⑴求常数a 的值;⑵求3(1)2P ξ<<.【例20】 已知连续型随机变量ξ的概率密度函数201()1202x f x ax x x ⎧⎪=<⎨⎪⎩≤≤≥,求a 的值及3(1)2P ξ<<.【例21】 设随机变量X 具有概率密度30()00x ke x f x x −⎧=⎨<⎩≥,求k 的值及(0.1)P X >.【例22】 美军轰炸机向巴格达某铁路控制枢纽投弹,炸弹落弹点与铁路控制枢纽的距离X 的密度函数为100||||100()100000||100x x f x x −⎧⎪=⎨⎪>⎩≤,若炸弹落在目标40米以内时,将导致该铁路枢纽破坏,已知投弹3颗,求巴格达铁路控制枢纽被破坏的概率.【例23】 设2~()X N μσ,,且总体密度曲线的函数表达式为:22141()e2πx x f x −+−=,x ∈R .⑴求μσ,;⑵求(|1|2)P x −<及(12122)P x −<<+的值.【例24】 某校高中二年级期末考试的物理成绩ξ服从正态分布2(7010)N ,.⑴若参加考试的学生有100人,学生甲得分为80分,求学生甲的物理成绩排名; ⑵若及格(60分及其以上)的学生有101人,求第20名的物理成绩.已知标准正态分布表(0.97)0.833φ=.【例25】 在某校举行的数学竞赛中,全体参赛学生的竞赛成绩近似服从正态分布(70100)N ,.已知成绩在90分以上(含90分)的学生有12名. ⑴试问此次参赛学生总数约为多少人?⑵若该校计划奖励竞赛成绩排在前50名的学生,试问设奖的分数线约为多少分? 附:标准正态分布表(1.30)0.9032(1.31)0.9049(1.32)0.9066φφφ===,,.。
正态分布和线性回归高考要求
1.了解正态分布的意义及主要性质
2.了解线性回归的方法和简单应用
知识点归纳
1.正态分布密度函数:
2
2
()
2
()
2
x
f x e
μ
σ
πσ
-
-
=,(σ>0,-∞<x<∞)
其中π是圆周率;e是自然对数的底;x是随机变量的取值;μ为正态分布的均值;σ是正态分布的标准差.正态分布一般记为)
,
(2
σ
μ
N
2.正态分布)
,
(2
σ
μ
N)是由均值μ和标准差σ唯一决定的分布
例1、下面给出三个正态总体的函数表示式,请找出其均值μ和标准差σ.(1)2
2
2
1
)
(
x
e
x
f-
=
π
,(-∞<x<+∞)
(2)
2
(1)
8
()
22
x
f x e
π
-
-
=,(-∞<x<+∞)
解:(1)0,1 (2)1,2
3.正态曲线的性质:正态分布由参数μ、σ唯一确定,如果随机变量ξ~N(μ,σ2),根据定义有:μ=Eξ,σ=Dξ。
正态曲线具有以下性质:
(1)曲线在x轴的上方,与x轴不相交。
(2)曲线关于直线x =μ对称。
(3)曲线在x =μ时位于最高点。
(4)当x <μ时,曲线上升;当x >μ时,曲线下降。
并且当曲线向左、
右两边无限延伸时,以x 轴为渐近线,向它无限靠近。
(5)当μ一定时,曲线的形状由σ确定。
σ越大,曲线越“矮胖”,表示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。
五条性质中前三条较易掌握,后两条较难理解,因此应运用数形结合的原则,采用对比教学
4.标准正态曲线:当μ=0、σ=l 时,正态总体称为标准正态总体,其
相应的函数表示式是2
221)(x e
x f -
=
π
,(-∞<x <+∞)
其相应的曲线称为标准正态曲线
标准正态总体N (0,1)在正态总体的研究中占有重要的地位任何正态分布的概率问题均可转化成标准正态分布的概率问题
5.标准正态总体的概率问题:
对于标准正态总体N (0,1),)(0x Φ是总体取值小于0x 的概率, 即 )()(00x x P x <=Φ,
其中00>x ,图中阴影部分的面积表示为概率0()P x x <只要有标准正态
分布表即可查表解决.从图中不难发现:当00<x 时,
)(1)(00x x -Φ-=Φ;而当00=x 时,Φ(0)=0.5
例2 设),(~2
σμN X ,且总体密度曲线的函数表达式为:
4
1
2221)(+--
=
x x e
x f π
,x ∈R 。
(1)求μ,σ;
(2)求)2|1(|<
-x P 的值。
分析:根据表示正态曲线函数的结构特征,对照已知函数求出μ和σ。
利用一般正态总体),(2
σμN 与标准正态总体N (0,1)概率间的关系,将一般正态总体划归为标准正态总体来解决。
解:(1)由于2
22)2(2)1(4
1
22
2121)(--
+--
⋅=
=
x x x e
e
x f ππ
,
根据一般正态分布的函数表达形式,可知μ=1,2=σ,故X ~N (1,2)。
(2))2121()2|1(|+<<-=<
-x P x P
(1(1(1)(1)2(1)120.84131F F =-=Φ-Φ=Φ-Φ-=Φ-=⨯- 6826.0=。
点评:在解决数学问题的过程中,将未知的,不熟悉的问题转化为已知的、熟悉的、已解决了的问题,是我们常用的手段与思考问题的出发点。
通过本例我们还可以看出一般正态分布与标准正态分布间的内在关联。
9.相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系
相关关系与函数关系的异同点如下: 相同点:均是指两个变量的关系
不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.
10.回归分析一元线性回归分析: 对具有相关关系的两个变量进行统计分析的方法叫做回归分析通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性
对于线性回归分析,我们要注意以下几个方面:
(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。
两个变量具有相关关系是回归分析的前提。
(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。
(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。
11.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度粗略地看,散点分布具有一定的规律
12. 回归直线
设所求的直线方程为,^
a bx y +=,其中a 、
b 是待定系数.
11
22211
()()()n n
i i i i i i n n i i i i x x y y x y nxy b x x x nx a y bx
====⎧
---⎪
⎪==⎨--⎪⎪
=-⎩∑∑∑∑, ∑==n i i x n x 11,∑==n
i i y n y 11 相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析
13.相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y 与x 的一组观测值,把
∑∑∑===----=
n
i n
i i i
n
i i i
y y x x
y y x x
r 1
1
221
)()()
)((=
∑∑∑===---n
i n i i i n
i i
i y n y x n x y
x n y
x 1
1
22221
)
)((
叫做变量y 与x 之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.
14.相关系数的性质:r ≤1,且r 越接近1,相关程度越大;且r 越接近0,相关程度越小.一般的,当r ≥ 0.75 时,就可以判断其具有很强的相关性,这时求线性回归方程才有意义。
例3假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如
(1)线性回归方程;
(2)估计使用年限为10年时,维修费用是多少?
分析:本题为了降低难度,告诉了y 与x 间呈线性相关关系,目的是训练公式的使用。
于是23.14
5905
453.112552
2
51
25
1=⨯-⨯⨯-=
--=
∑∑==x
x y
x y
x b i i i i
i , 08.0423.15=⨯-=-=bx y a 。
∴线性回归方程为:08.023.1^
+=+=x a bx y 。
(2)当x=10时,38.1208.01023.1^
=+⨯=y (万元) 即估计使用10年时维修费用是12.38万元。
点评:本题若没有告诉我们y 与x 间是呈线性相关的,应首先进行相关性检验。
如果本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回归方程也是没有意义的,而且其估计与预测也是不可信的。