6.1 选择性样本模型
- 格式:ppt
- 大小:410.50 KB
- 文档页数:39
高中数学有哪些目?(必修第一册)第一章集合与常用逻辑用语1.1集合的概念列举法描述法1.2集合间的基本关系1.3集合的基本运算并集交集补集阅读与思考集合中元素的个数1.4充分条件和必要条件1.4.1充分条件与必要条件1.4.2充要条件阅读与思考几何命题与充分条件、必要条件1.5全称量词与存在量词1.5.1全称量词与存在量词1.5.2全称量词命题和存在量词命题的否定小结复习参考题1第二章一元二次函数、方程和不等式2.1等式性质与不等式性质2.2基本不等式2.3二次函数与一元二次方程、不等式小结复习参考题2第三章函数的概念与性质3.1函数的概念及其表示3.1.1函数的概念3.1.2函数的表示法阅读与思考函数概念的发展历程3.2函数的基本性质3.2.1单调性与最大小值3.2.2奇偶性信息技术应用用计算机绘制函数图像3.3幂函数探索与发现探究函数y=X+1/X的图像与性质3.4函数的应用(一)文献阅读和数学写作函数的形成与发展小结复习参考题3第四章指数函数与对数函数4.1指数4.1.1N次方根与分数指数幂4.1.2无理数指数幂及其运算性质4.2指数函数4.2.1指数函数的概念4.2.2指数函数的图像和性质阅读与思考放射性物质的衰减信息技术应用探究指数函数的性质4.3对数4.3.1对数的概念4.3.2对数的运算阅读与思考对数的发明4.4对数函数4.4.1对数函数的概念4.4.2对数函数的图像和性质4.4.3不同函数增长的差异探究与发现互为反函数的两个函数图象间的关系4.5函数的应用(二)4.5.1函数的零点与方程的解4.5.2用两分法求方程的近似解4.5.3函数模型的应用阅读与思考中外历史上的方程求解文献阅读与数学写作对数概念的形成与发展小结复习参考题4数学建模建立函数模型解决实际问题第五章三角函数5.1任意角和弧度制5.1.1任意角5.1.2弧度制5.2三角函数的概念5.2.1三角函数的概念5.2.2同角三角函数的基本关系阅读与思考三角学与天文学5.3诱导公式5.4三角函数的图象与性质5.4.1正弦函数、余弦函数的图像5.4.2正弦函数余弦函数的性质1周期性2奇偶性3单调性4最大值与最小值5.4.3正切函数的性质与图像1周期性2奇偶性3单调性4值域探究与发现函数y=Asin(wx+φ)及函数y=Acos(wx+φ)的周期探究与发现利用单位圆的性质研究正弦函数、余弦函数的性质5.5三角恒等变换5.5.1角和与差的正弦、余弦和正切公式1两角差的余弦公式2两角和与差的正弦、余弦、正切公式3两倍角的正弦、余弦、正切公式5.5.2简单的三角恒等变换信息技术应用利用信息技术制作三角函数表5.6函数y=Asin(wx+φ)5.6.1匀速圆周运动的数学模型5.6.2函数y=Asin(ωx+φ)的图像1探索φ对y=Asin(ωx+φ)图像的影响2探索ω(ω>0)对y=Asin(ωx+φ)图像的影响3探索A(A>0)对y=Asin(ωx+φ)图像的影响5.7三角函数的应用阅读与思考振幅、周期、频率、相位小结复习参考题5部分中英文词汇索引(必修第二册)第六章平面向量及其应用6.1平面向量的概念6.1.1向量的实际背景与概念6.1.2向量的几何表示6.1.3相等向量和共线向量阅读与思考向量及向量符号的由来6.2平面向量的运算6.2.1向量的加法运算6.2.2向量的加法运算6.2.3向量的数乘运算6.2.4向量的数量积6.3平面向量基本定理及坐标表示6.3.1平面向量基本定理6.3.2平面向量的正交分解和坐标表示6.3.3平面向量加、减运算的坐标表示6.3.4平面向量数乘运算的坐标表示6.3.5平面向量数量积的坐标表示6.4平面向量的应用6.4.1平面几何中的向量方法6.4.2向量在物理中的应用举例6.4.3余弦定理、正弦定理1余弦定理2正弦定理3余弦定理、正弦定理的应用举例阅读与思考海伦和秦九韶小结复习参考题6数学探究用向量法研究三角形的性质第七章复数7.1复数的概念7.1.1数系的扩充和复数的概念7.1.2复数的几何意义7.2复数的四则运算7.2.1.复数的加减运算及其几何意义7.2.2复数的乘除运算阅读与思考代数基本定理7.3复数的三角表示7.3.1复数的三角表示式7.3.2复苏乘除运算的三角表示及其几何意义探究与发现 1的n次方根小结复习参考题7第八章立体几何初步8.1 基本立体图形1棱柱2棱锥3棱台4圆柱5圆锥6圆台7球8简单组合体8.2立体图形的直观图阅读与思考画法几何与蒙日8.3 简单几何体的表面积与体积8.3.1棱柱、棱锥、棱台的表面积和体积1棱柱、棱锥、棱台的表面积2棱柱、棱锥、棱台的体积8.3.2圆柱、圆锥、圆台、球的表面积和体积1圆柱、圆锥、圆台的表面积和体积2球的表面积和体积探究与发现祖暅原理与柱体、锥体的体积8.4空间点、直线、平面之间的位置关系8.4.1平面8.4.2空间点、直线、平面之间的位置关系1空间中直线与直线的位置关系2空间中直线与平面的位置关系3空间中平面与平面的位置关系8.5空间直线、平面的平行8.5.1直线与直线平行8.5.2直线与平面平行8.5.3平面与平面平行8.6空间直线、平面的垂直8.6.1直线与直线垂直8.6.2直线与平面垂直8.6.3平面与平面垂直阅读与思考欧几里得《原本》与公理化方法文献阅读与数学写作几何学的发展小结发习参考题8第九章统计9.1随机抽样9.1.1简单随机抽样1抽签法2随机数法9.1.2分层次随机抽样9.1.3获取数据的途径1通过调查获取数据2通过实验获取数据3通过观察获取数据4通过查询获取数据阅读与思考如何得到敏感性问题的诚实反应信息技术应用统计软件的应用9.2用样本估计总体9.2.1总体取值规律的估计1求极差2决定组距和组数3将数据分组4列频率分布图5画频率分布直方图9.2.2总体百分位数的估计9.2.3总体集中趋势的估计9.2.4总体离散程度的估计阅读与思考统计学在军事中的应用——二战时德国坦克总量的估计问题阅读与思考大数据9.3统计案例公司员工的肥胖情况调查分析小结复习参考题9第十章概率10.1随机事件与概率10.1.1有限样本空间与随机事件10.1.2事件的空间与运算10.1.3古典概型10.1.4概率的基本性质10.2事件的相互独立性10.3频率与概率10.3.1频率的稳定性10.3.1随机模拟阅读与思考孟德尔遗传规律小结复习参考题10部分中英文词汇索引.(选择性必修)第一章空间向量与立体几何1.1空间向量及其运算1.1.1空间向量及其线性运算1.1.2空间向量及其数量积运算1.2空间向量基本定理1.3空间向量及其运算的坐标表示1.3.1空间直角坐标系1.3.2空间向量运算的坐标表示阅读与思考向量概念的推广与应用1.4空间向量的应用1.4.1用空间向量研究直线、平面的位置关系1空间中点、直线和平面的向量表示2空间中直线和平面的平行3空间中直线和平面的垂直1.4.2用空间向量研究距离、夹角问题小结复习参考题1第二章直线和圆的方程2.1直线的倾斜角与斜率2.1.1倾斜角和斜率2.1.2两条直线平行和垂直的判断2.2直线的方程2.2.1直线的点斜式方程2.2.2直线的两点式方程2.2.3直线的一般式方程探究与发现方向向量与直线的参数方程2.3直线的交点坐标与距离公式2.3.1两条直线的交点坐标2.3.2两点间的距离公式2.3.3点到直线的距离公式2.3.4两条平行直线间的距离公式阅读与思考笛卡儿与解析几何2.4圆的方程2.4.1圆的标准方程2.4.2圆的一般方程阅读与思考坐标法与数学机械化2.5直线与圆、圆与圆的位置关系2.5.1直线与圆的位置关系2.5.2圆与圆的位置关系小结复习参考题2第三章圆锥曲线的方程3.1 椭圆3.1.1椭圆及其标准方程3.1.2椭圆的简单几何性质1范围2对称性3顶点4离心率信息技术应用用信息技术探究点的轨迹:椭圆3.2双曲线3.2.1双曲线及其标准方程3.2.2双曲线的简单几何性质1范围2对称性3顶点4渐近线5离心率探究与发现为什么y=±b/aX是双曲线x²/a² - y²/b²= 1的渐近线3.3 抛物线3.3.1抛物线及其标准方程3.3.2抛物线的简单几何性质1范围2对称性3顶点4离心率探究与发现为什么二次函数y=ax2+bx+c的图象是抛物线阅读与思考圆锥曲线的光学性质及其应用文献阅读与数学写作解析几何的形成与发展小结复习参考题3部分中英文词汇索引(选择性必修第二册)第四章数列4.1 数列的概念阅读与思考斐波那契数列4.2等差数列4.2.1等差数列的概念4.2.2等差数列前n项和公式4.3等比数列4.3.1等比数列的概念4.3.2等比数列前n项和公式阅读与思考中国古代数学家求数列和的方法4.4数学归纳法小结复习参考题4第五章一元函数的导数及其应用5.1 导数的概念及其意义5.1.1变化率问题5.1.2导数的概念及其几何意义5.2 导数的运算5.2.1基本初等函数的导数5.2.2导数的四则运算法则5.2.3简单复合函数的导数探究与发现牛顿法——用导数方法求方程的近似解5.3 导数在研究函数中的应用5.3.1函数的单调性5.3.2函数的极值与最大(小)值1函数的极值2函数的最大(小)值信息技术应用图形技术与函数性质文献阅读与数学写作微积分的创立与发展小结复习参考题5部分中英文词汇索引(选择性必修第三册)第六章计数原理6.1分类加法计数原理与分步乘法计数原理探究与发现子集的个数有多少6.2排列与组合6.2.1排列6.2.2排列数6.2.3组合6.2.4组合数探究与发现组合数的两个性质6.3二项式定理6.3.1二项式定理6.3.2二项式系数的性质1对称性2增减性与最大值3各二项式系数的和小结复习参考题6数学探究杨辉三角的性质与应用第七章随机变量及其分布7.1条件概率与全概率公式7.1.1条件概率7.1.2全概率公式阅读与思考贝叶斯公式与人工智能7.2离散型随机变量及其分布列7.3离散型随机变量的数字特征7.3.1离散型随机变量的均值7.3.2离散型随机变量的方差7.4二项分布与超几何分布7.4.1二项式分布7.4.2超几何分布探究与发现二项分布的性质7.5正态分布信息技术应用概率分布图及概率计算小结复习参考题7第八章成对数据的统计分析8.1成对数据的统计相关性8.1.1变量的相关关系8.1.2样本相关系数8.2一元线性回归模型及其应用8.2.1一元线性回归模型8.2.2一元线性回归模型参数的最小二乘估计阅读与思考回归与相关8.3列联表与独立性检验8.3.1分类变量与列联表8.3.2独立性检验小结复习参考题8数学建模建立统计模型进行预测部分中英文词汇索引。
心理学研究中的样本选择方法在心理学研究中,样本选择是一个至关重要的环节。
研究者需要选择适当的样本来代表整个目标人群,并确保研究结果的可靠性和泛化性。
本文将介绍几种常见的心理学研究样本选择方法,并探讨其优缺点。
一、随机抽样随机抽样是最常见也是最基本的样本选择方法之一。
研究者通过随机的方式从目标人群中选取样本,以避免选择偏倚产生的影响。
随机抽样可以确保样本的代表性,并提高研究结果的可靠性。
然而,随机抽样也存在一些限制,如随机抽取的样本可能不够完全代表整个目标人群。
二、方便抽样方便抽样是一种常见且简单的样本选择方法。
研究者通过方便的方式选择样本,比如选择身边容易接触到的人或者调查问卷在网上的发布。
这种方法的好处是速度快、成本低,适用于一些小规模的初步研究。
然而,方便抽样存在着样本偏倚的问题,因为研究者无法保证所选择的样本能够代表整个目标人群。
三、分层抽样分层抽样是一种更加精细的样本选择方法,可以解决随机抽样的不足。
研究者将目标人群按照一定的特征进行分层,然后从每个层中随机选择样本。
这样做可以确保每个特征层中的样本都能被纳入研究,并且提高了样本的代表性。
然而,分层抽样也需要根据研究需求选择合适的特征层,否则可能导致样本选择过程的复杂性增加。
四、配对抽样配对抽样是一种常用的样本选择方法,适用于需要比较两组样本之间差异的研究。
研究者通过某种特定的标准将样本成对配对,以保证在配对因素上的相似性。
例如,在研究药物疗效时,可以将具有相似疾病病情的患者进行配对,以消除个体间差异对研究结果的干扰。
配对抽样的优点在于能够控制配对因素对结果的影响,但是需要大量的时间和精力来进行匹配。
五、整群抽样整群抽样是一种特殊的样本选择方法,适用于研究的目标是群体而非个体。
研究者可以选择某个具有代表性的群体作为样本,通过对该群体进行观察和调查来获取数据。
整群抽样适用于一些特定的研究场景,比如研究某个社区的心理健康状况。
然而,由于群体的异质性,整群抽样的结果可能无法泛化到其他群体中。
计量经济学试验 (完整版)——李子奈目录实验一一元线性回归 (4)一实验目的 (4)二实验要求 (4)三实验原理 (4)四预备知识 (4)五实验内容 (4)六实验步骤 (4)1.建立工作文件并录入数据 (4)2.数据的描述性统计和图形统计: (6)3.设定模型,用最小二乘法估计参数: (6)4.模型检验: (7)5.应用:回归预测: (7)实验二可化为线性的非线性回归模型估计、受约束回归检验及参数稳定性检验9一实验目的: (9)二实验要求 (10)三实验原理 (10)四预备知识 (10)五实验内容 (10)六实验步骤 (10)实验三多元线性回归 (11)一实验目的 (11)三实验原理 (11)四预备知识 (11)五实验内容 (11)六实验步骤 (12)6.1 建立工作文件并录入全部数据 (12)6.2 建立二元线性回归模型 (12)6.3 结果的分析与检验 (12)6.4 参数的置信区间 (12)6.5 回归预测 (13)6.6 置信区间的预测 (13)实验四异方差性 (14)一实验目的 (14)二实验要求 (14)三实验原理 (14)四预备知识 (14)五实验内容 (14)六实验步骤 (14)6.1 建立对象: (14)6.2 用普通最小二乘法建立线性模型 (14)6.3 检验模型的异方差性 (14)6.4 异方差性的修正 (15)实验五自相关性 (16)一实验目地 (16)二实验要求 (16)三实验原理 (16)四预备知识 (16)五实验内容 (16)六实验步骤 (17)6.1 建立Workfile和对象 (17)6.2 参数估计、检验模型的自相关性 (17)6.3 使用广义最小二乘法估计模型 (18)6.4 采用差分形式作为新数据,估计模型并检验相关性 (19)实验六多元线性回归和多重共线性 (20)一实验目的 (20)二实验要求 (20)三实验原理 (20)四预备知识 (20)五实验内容 (20)六实验步骤 (20)6.1 建立工作文件并录入数据 (20)6.2 用OLS估计模型 (20)6.3 多重共线性模型的识别 (20)6.4 多重共线性模型的修正 (21)实验七分布滞后模型与自回归模型及格兰杰因果关系检验 (21)一实验目的 (21)二实验要求 (21)三实验原理 (21)四预备知识 (21)五实验内容 (21)六实验步骤 (22)6.1 建立工作文件并录入数据 (22)6.2 使用4期滞后2次多项式估计模型 (22)6.3 格兰杰因果关系检验 (23)实验八联立方程计量经济学模型 (24)一实验目的 (24)二实验要求 (25)三实验原理 (25)四预备知识 (25)五实验内容 (25)六实验步骤 (25)6.1 分析联立方程模型。
研究设计中样本选择策略引言在科研领域,样本选择策略是研究设计中至关重要的一环,它决定了研究结果的有效性和可靠性。
样本选择策略的合理性和科学性直接关系到研究结论的可信度。
本文将探讨研究设计中样本选择策略的重要性以及常用的策略方法。
样本选择策略的重要性样本选择策略对研究结果的影响是很大的,一个合理的样本选择策略能够确保研究结果的准确性和代表性。
以下是样本选择策略的重要性体现:1. 统计可信性一个好的样本选择策略能够保证所选择的样本具有一定的代表性,从而提高研究结果的统计可信性。
如果样本选择不当,可能导致结果偏向某一方向,使得研究结果失去客观性。
2. 实验效率合理的样本选择策略可以提高实验效率。
通过选择适当的样本,可以降低数据收集和分析的成本,并提高研究进度。
样本选择策略的巧妙设计能够帮助研究者尽快得到有意义的结论。
3. 结果的泛化能力一个有效的样本选择策略应能够保证研究结果的泛化能力。
即通过选择一部分样本,可以推断出总体的性质和规律。
良好的样本选择策略能够保证研究结果的普遍适用性,使得研究结果具有更大的实用价值。
常用的样本选择策略方法在研究设计中,有许多常用的样本选择策略方法。
下面介绍几种常见的方法:1. 随机抽样随机抽样是最常见的样本选择策略方法之一。
通过随机抽取样本,可以保证每个样本都有相等的机会被选中。
这样可以降低偏见的引入,避免主观性对研究结果的影响。
2. 分层抽样分层抽样是基于总体的特点,将总体按照某种特征进行划分,并在每个层次内进行随机抽样。
这种方法可以保证各个层次的样本都具有一定的代表性,提高研究结果的可信度。
3. 整群抽样整群抽样是将总体划分为若干群体,然后从中选择少数代表性群体进行研究。
这种方法可以大大减少实验的复杂性和难度,提高实验效率。
同时,通过合理选择代表性群体,也可以保证研究结果的泛化能力。
4. 方便抽样方便抽样是一种简单但风险较高的样本选择策略方法。
通常情况下,研究者选择离自己最近或者最容易接触到的样本进行研究。
8.2 一元线性回归模型及其应用(精练)【题组一 样本中心求参数】1.(2021·全国·高二单元测试)某公司生产某种婴幼儿纸尿裤的产量x 与相应的生产能耗y 有如下样本数据:已知这组样本数据具有线性相关关系,由表中数据,求得回归直线的斜率为0.72,则这组样本数据的回归直线方程是( )A .ˆ0.72 2.05yx =+ B .ˆ0.720.35yx =+ C .ˆ0.720.26yx =+ D .ˆ0.350.72yx =+ 【答案】C【解析】设回归直线方程为ˆˆ0.72yx a =+,由样本数据,可得 4.5x =, 3.5y =, 因为回归直线经过点(),x y ,所以ˆ3.50.72 4.5a=⨯+,解得ˆ0.26a =, 所以回归直线方程为ˆ0.720.26yx =+. 故选:C .2.(2021·江西·吉安一中高二开学考试 )已知x 与y 之间的一组数据:()()()()13253749,,,,,,,,则y 与x 的线性回归方程为y bx a =+必过( )A .()26,B .()38,C .()2.56,D .()3.58,【答案】C【解析】由题意可知:1234 2.54x +++==,357964y +++==, ∴y 与x 的线性回归方程必过点()2.5,6.故选:C.3(2021·河南·孟津县第一高级中学 )为了庆祝建党100周年,某网站从7月1日开始推出党史类书籍免费下载活动,已知活动推出时间x (单位:天)与累计下载量y (单位:万次)的统计数据如表所示:根据上表,利用最小二乘法得到回归直线方程 1.4ˆˆyx a =+,据此模型预测,活动推出11天的累计下载量约A .13.8万次B .14.6万次C .16万次D .18万次【答案】C【解析】由表格数据知4567868910126,955x y ++++++++====,由回归直线方程的性质,得ˆ1.469a⨯+=,所以ˆ0.6a =,故ˆ 1.40.6y x =+, 所以当11x =时, 1.4110.616y =⨯+=(万次), 故选:C.4.(2021·河北·藁城新冀明中学高二月考)(多选)随着养生观念的深入,国民对餐饮卫生条件和健康营养的要求逐渐提高.据了解,烧烤食品含有强致癌物,因此吃烧烤的人数日益减少,烧烤店也随之减少.某市对2014年至2018年这五年间全市烧烤店盈利店铺的个数进行了统计,具体统计数据如下表所示:根据所给数据,得出y 关于t 的回归直线方程为273y bt =+,则下列说法正确的是( ) A .该市2014年至2018年全市烧烤店盈利店铺个数的平均数219y = B .y 关于t 的回归直线方程为18273y t =-+ C .估计该市2020年烧烤店盈利店铺的个数为147D .预测从2025年起,该市烧烤店盈利店铺的个数将不超过100 【答案】ABC【解析】由已知数据得3t =,219y =,故A 正确;因为y 关于t 的回归直线过点()3,219,所以2193273b =+,所以18b =-, 所以y 关于t 的回归直线方程为18273y t =-+.故B 正确;2020年的年份代码为7,故2020年该市烧烤店盈利店铺的个数约为187273147y =-⨯+=.故C 正确; 令18273100t -+≤,由*t N ∈,得10t ≥,故从2023年起,该市烧烤店盈利店铺的个数将不超过100.故D 不正确,故选:ABC.5.(2021·广东惠州 )(多选)某种产品的价格x (单位:元/kg )与需求量y (单位:kg )之间的对应数据如根据表中的数据可得回归直线方程为14.4y bx =+,则以下结论正确的是( ) A .y 与x 正相关 B .y 与x 负相关C .样本中心为()20,8D .该产品价格为35元/kg 时,日需求量大约为3.4kg【答案】BC【解析】由表格数据,随着价格x 的增加,需求量y 随之减少,所以y 与x 负相关. 因为1015202530205x ++++==,111086585y ++++==,故样本中心为()20,8由回归直线14.4y bx =+必过样本点的中心()20,8, 所以有82014.4b =⨯+,解得0.32b =-,所以当35x =时,0.323514.4 3.2y =-⨯+=,日需求量不为最大 故选:BC6.(2021·重庆市秀山高级中学校 )(多选)已知变量x ,y 之间的线性回归方程为0.710.3y x =-+,且变量x ,y 之间的一组相关数据如表所示,则下列说法正确的是( )A .变量x ,y 之间呈负相关关系B .可以预测,当20x 时, 3.7y =-C .4m =D .该回归直线必过点()9,4 【答案】ABD【解析】对于A :由线性回归方程为0.710.3y x =-+可知:0.70-<,所以变量x ,y 之间呈负相关关系,故对于B :当20x 时,0.72010.3 3.7y =-⨯+=-,故选项B 正确;对于C :68101294x +++==,6321144m m y ++++==,因为回归直线过样本中心点,所以110.7910.34m+=-⨯+,解得:5m =,故选项C 不正确; 对于D :由C 可知5m =,所以11544y +==,所以该回归直线必过样本中心点()9,4,故选项D 正确; 故选:ABD.7.(2021·贵州·贵阳一中 )某产品的广告费用x 与销售额y 的统计数据如下表:根据上表已得回归方程为8.6.8ˆ5yx =-,表中一数据模糊不清,请推算该数据的值为___________. 【答案】12【解析】由题中数据可得3,8.63 5.820x y ==⨯-=,故空白数据为12. 故答案为:128.(2021·全国·高二课时练习)已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且回归直线方程为ˆ0.95 2.6yx =+,那么表格中的数据m 的值为______.【答案】6.7 【解析】013424x +++==, 2.2 4.3 4.811.344m m y ++++==, 把(),x y 的坐标代入回归直线方程得11.30.952 2.64m+=⨯+, 解得 6.7m =. 故答案为:6.79.(2021·全国·高二课时练习)蟋蟀鸣叫的频率P (每分钟鸣叫的次数)与气温T (单位:℃)有着很大的关系.某观测人员根据下表中的观测数据计算出P 关于T 的线性回归方程ˆ 5.2168PT =-,则下表中k 的值为______.【答案】51【解析】计算()138414239404T =⨯+++=,()110929443644k P k +=⨯+++=, 将点10940,4k +⎛⎫ ⎪⎝⎭的坐标代入P 与T 的线性回归方程ˆ 5.2168P T =-中,得109 5.2401684k +=⨯-, 解得51k =. 故答案为:51.10.(2021·福建宁德·高三期中)某电子产品的成本价格由两部分组成,一是固定成本,二是可变成本,为确定该产品的成本,进行5次试验,收集到的数据如表:由最小二乘法得到回归方程ˆ0.6754.9yx =+,则a =___________. 【答案】75 【解析】1020304050305x ++++==,62688189600.25a y a ++++==+,因为线性回归方程过样本中心点,所以600.20.673054.975a a +=⨯+⇒=,故答案为:75 【题组二 线性回归方程】1.(2021·河北·藁城新冀明中学高二月考)假定产品产量x (千件)与单位成本y (元/件)之间存在相关关系.数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归直线方程,对于单位成本70元/件时,预报产量为多少; (3)计算各组残差,并计算残差平方和;【答案】(1)散点图见解析;(2)ˆ 1.8277.37yx =-+,4.050千件;(3)各组残差见解析,残差平方和为3.8182. 【解析】(1)解:散点图如下:(2)解:因为2343453.56x +++++==,737271736968716y +++++==,61279ii x==∑,611481i ii x y==∑,所以6162221614816 3.571ˆ 1.82796 3.56i i i i ix yx ybx x==-⋅-⨯⨯==≈--⨯-∑∑,ˆˆ71 1.82 3.577.37ay bx =-=+⨯=, 所以回归直线方程为ˆ 1.8277.37yx =-+,令70y =,则70 1.8277.37x =-+,解得 4.050x ≈, 所以单位成本70元/件时,预报产量约为4.050千件. (3)解:各组残差分别为:()11173 1.822ˆ77.370.73ˆey y =--⨯+=-=-, ()22272 1.82377.370.0ˆˆ9ey y =--⨯+==-, ()33371 1.82477.370.9ˆˆ1ey y =--⨯+==-, ()44473 1.82377.37 1.0ˆˆ9ey y =--⨯+==-, ()55569 1.824ˆ77.37 1.09ˆey y =--⨯+=-=-, ()66668 1.825ˆ77.370.27ˆey y =--⨯+=-=-, 残差的平方和为()()()2222621220.730.090.91 1.09 1.090.27 3.2ˆ818i i i y y=--+++--==++∑. 2.(2021·甘肃张掖)某家庭2015~2019年的年收入和年支出情况统计如表:(1)已知y 与x 具有线性相关关系,求y 关于x 的线性回归方程(系数精确到0.01);(2)假设受新冠肺炎疫情影响,该家庭2021年的年收入为9.5万元,请根据(1)中的线性回归方程预测该家庭2021年的年支出金额.附:回归方程ˆˆˆybx a =+中的斜率的最小二乘估计公式为()()()1122211ˆnni iiii i nniii i x ynx y xxy y b xnxxx====---==--∑∑∑∑.【答案】(1)ˆ0.780.24yx =+;(2)7.65万元. 【解析】(1)依题意,1(99.61010.411)105x =++++=,1(7.37.588.58.7)85y =++++=,则()5212.32i i x x=-=∑,()()511.8i ii x xy y =--=∑,则有()()()125151.8ˆ0.782.32iii ii x x y y bx x ==--==≈-∑∑,则ˆˆ0.24a y bx =-≈, 所以y 关于x 的线性回归方程为ˆ0.780.24yx =+; (2)当2021年的年收入为9.5万元时,即9.5x =,ˆ0.789.50.247.65y=⨯+=, 所以预测该家庭2021年的年支出金额为7.65万元.3.(2021·云南师大附中)大气污染物PM 2.5的浓度超过一定的限度会影响人的健康.为了研究PM 2.5的浓度是否受到汽车流量的影响,研究人员选择了24个社会经济发展水平相近的城市,在每个城市选择一个交通点统计24小时内过往的汽车流量x (单位:千辆),同时在低空相同的高度测定该时间段空气中的PM 2.5的平均浓度y(单位:μg/m 3),制作了如图所示的散点图:(1)由散点图看出,可用线性回归模型拟合y 与x 的关系,请用相关系数加以说明(精确到0.01); (2)建立y 关于x 的回归方程;(3)我国规定空气中的PM 2.5浓度的安全标准为24小时平均依度75μg/m 3,某城市为使24小时的PM 2.5浓度的平均值在60~130μg/m 3,根据上述回归方程预测汽车的24小时流量应该控制在什么范围内?附:参考数据: 1.4x =,95y =,2421() 2.1i i x x =-=∑,2421()60343i i y y =-=∑,241()()294i i i x x y y =--=∑,357.参考公式:相关系数()()nii xx y y r --∑,回归方程ˆˆˆya bx =+中斜率和截距的最小二乘估计公式分别为:121()()ˆ()niii nii x x yy b x x ==--=-∑∑,ˆˆay bx =-. 【答案】(1)答案见解析;(2)140101y x =-;(3)24小时的车流量应该控制在1150~1650辆. 【解析】1)由题得2940.82357r =≈, 因为y 与x 的相关系数近似为0.82,说明y 与x 具有很强的相关性, 从而可以用线性回归模型拟合y 与x 的关系.(2)由95y =得2412421()()ˆ()iii ii x x y y bx x ==--=-∑∑2941402.1==,95140 1.4101a y bx =-=-⨯=-, 所以y 关于x 的回归方程为140101y x =-. (3)当60y =时,由14010160x -=得 1.15x =; 当130y =时,由140101130x -=得 1.65x =. 所以24小时的车流量应该控制在1150~1650辆.4.(2021·全国·高三专题练习)实施新规后,某商场2020年1月份至10月份的收入情况如表.并计算得101890i i i x y ==∑,1021385i i x ==∑,101150i i y ==∑75.99.(1)是否可用线性回归模型拟合y 与x 的关系?请用相关系数r 加以说明;(当0.751r ≤≤时,那么变量x ,y 有较强的线性相关关系)(2)建立y 关于x 的回归方程ˆˆˆybx a =+(结果保留1位小数),并预测该商场12月份的收入情况.(结果保留整数)附:()()()1122211ˆn niii ii i nniii i x x y y x y nx ybx x xnx====---==--∑∑∑∑,ˆˆay bx =-. 【答案】(1)y 与x 有较强的线性相关关系,可用线性回归模型拟合,说明答案见解析;(2)ˆ0.810.7yx =+,预测该商场12月份的收入为20万元.【解析】(1)由题中数据得1011155 5.51010i i x x ===⨯=∑,10111150151010i i y y ===⨯=∑,1010 5.515825x y =⨯⨯=,于是得1010111()()1089082565i i i i i x x y y x y y x ==--=-=-=∑∑,75.99,从而10()()650.8675.99iix x y y r --==≈∑,0.75||1r ≤≤, 所以y 与x 有较强的线性相关关系,可用线性回归模型拟合;(2)由(1)知1011065i i i x y x y =-=∑,而1021385i i x ==∑,221010 5.5302.5x =⨯=,从而得10122110106565ˆ0.8385302.582.510i ii i i x y ybx xx ==-===≈--∑∑,65ˆˆ15 5.510.782.5ay bx =-=-⨯=, 所以y 关于x 的线性回归方程为ˆ0.810.7yx =+,当12x =时,ˆ0.81210.720y =⨯+≈, 从而预测该商场12月份的收入为20万元.5(2021·河南许昌 )某新型外贸出口公司对2021年过去9个月的出口销售数据进行整理,得到了今年第x 个月份与截止该月底的销售额y (单位:万元)之间的关系,如下表:(1)若y 与x 满足线性关系,求出y 关于x 的回归方程;(ˆa,ˆb 精确到整数位) (2)预测该公司10月份的销售额附:参考数据:913087i i y ==∑;9117524i i i x y ==∑;921285i i x ==∑;参考公式:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【答案】(1)ˆ35169yx =+;(2)答案见解析. 【解析】(1)5x =,343y =,919175249534317524154352089i i i x y xy =∴-=-⨯⨯=-=∑92221952859560ii x=-⨯=-⨯=∑,2089ˆ3560b ∴=≈, 2089ˆ343516960a=-⨯≈, ˆ35169yx ∴=+ (2)当10x =时,ˆ3510169519y=⨯+=, 所以预测该公司10月份销售额为519万元.6.(2021·福建·莆田第二十五中学高三月考)2021年东京奥运会,中国举重选手8人参赛,7金1银,在全世界面前展现了真正的中国力量;举重比赛根据体重进行分级,某次举重比赛中,男子举重按运动员体重分为下列十级:每个级别的比赛分为抓举与挺举两个部分,最后综合两部分的成绩得出总成绩,所举重量最大者获胜,在该次举重比赛中,获得金牌的运动员的体重以及举重成绩如下表 (1)根据表中的数据,求出运动员举重成绩y 与运动员的体重x 的回归直线方程(保留1位小数); (2)某金牌运动员抓举成绩为170公斤,挺举成绩为204公斤,则该运动员最有可能是参加的哪个级别的举重?参考数据:()()()992112620,7076i i i i i x x x x y y ==-=--=∑∑;参考公式:()()()121ˆˆˆ,niii nii x x yy bay bx xx ==--==--∑∑. 【答案】(1) 2.7155.4y x =+;(2)83公斤级举重. 【解析】(1)依题意,5459647076839199106789x ++++++++==,2913043373533633894064214303669y ++++++++==,()()()1217076ˆ 2.702620nii i nii xx y y bxx ==--===-∑∑, 则366 2.778155.4a y bx =-=-⨯=, 故回归方程为: 2.7155.4y x =+.(2)该运动员的抓举和挺举的总成绩为374公斤,根据回归方程可知:374 2.7155.4x =+, 解得81x ≈,即该运动员的体重应该在81公斤左右,即参加的应该是83公斤级举重.7.(2021·西藏·拉萨中学高二月考)珠海国际赛车场(简称ZIC)位于珠海经济特区金鼎镇.创建于1996年,是中国国内第一座符合国际汽车联盟一级方程式标准的国际级赛车场.目前该赛事已打造成集赛车竞技运动、汽车文化极致体验、主题休闲度假为一体的超级汽车文化赛事娱乐综合体.为了减少对环境的污染,某环保部门租用了特制环保车清洁现场垃圾.通过查阅近5年参会人数(万人)与所需环保车辆数量(辆),得到如下统计表:(1)根据统计表所给5组数据,求出关于,x y 的线性回归方程ˆˆy bxa =+. (2)已知租用的环保车平均每辆的使用成本费用C (元)与数量(辆)的关系为3000200035,N 2900t t 35,N t t t C t +<<∈⎧=⎨≥∈⎩,主办方根据实际参会人数投入所需环保车,租车每辆支付费用6000元,超出实际需要的车辆,主办方不支付任何费用.预计本次赛车会大约有14万人参加,根据(1)中求出的线性回归方程,预测环保部门在确保清洁任务完成的前提下,应租用多少辆环保车?获得的利润是多少? (注:利润L =主办方支付费用-使用成本费用C ).参考公式:()()()1122211ˆ,ˆˆn niii ii i nniii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑ 【答案】(1) 2.32y x =+;(2)为确保完成任务,需要租用35辆环保车,获得的利润108500元. 【解析】(1)11981012105x ++++==2823202529255y ++++== ()()()()()()()()()22222131******** 2.310111091081010101210ˆb ⨯+-⨯-+-⨯-++⨯===-+-+-+-+- ˆˆ2ay bx =-= 关于,x y 的线性回归方程 2.32y x =+ (2)将14x =代入 2.32y x =+得34.2y =为确保完成任务,需要租用35辆环保车, 所以290035101500C =⨯=获得的利润600035101500108500L =⨯-=元8.(2021·江西·新余市第一中学高二月考)某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,他们分别记录了3月1日至3月5日的每天昼夜温差与实验室每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从3月1日至3月5日中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 中至少有一个数小于25”的概率;(2)请根据3月2日至3月4日的数据,求出y 关于x 的线性回归方程y bx a =+.(参考公式:回归直线方程为y bx a =+,其中()1221ni ii nii x y nxyb xn x==-=-∑∑,a y bx =-)【答案】(1)710(2)532y x =-【解析】(1)从3月1日至3月5日中任选2天,m ,n 构成的基本事件(m ,n )有:(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(26,16),共有10个.记“m ,n 至少有一个数小于25”为事件A ,包括:(23,25),(23,30),(23,26),(23,16),(25,16),30,16),(26,16),共有7个基本事件 由古典概型概率公式:7()10P A = (2)11131225302612,27,33x y ++++==== 22221125133012263122751113123122b ⨯+⨯+⨯-⨯⨯==++-⨯. 于是,5271232a =-⨯=-故所求线性回归方程为532y x =- 9.(2021·全国·高二单元测试)某地区2013年至2019年居民纯收入y (单位:千元)的部分数据如表所示:2018和2019年的居民纯收入y (单位:千元)数据采用随机抽样的方式获得,用样本的均值来代替当年的居民人均纯收入,其数据如下:2018年抽取的居民纯收入(单位:千元)数据:5.2 4.8 6.5 5.6 6.0 7.1 6.1 7.3 5.9 7.5 2019年抽取的居民纯收入(单位:千元)数据:6.2 7.8 6.6 5.8 7.1 6.8 7.2 7.9 5.9 7.7 (1)求y 关于t 的线性回归方程;(2)当地政府为了提高居民收入水平,现从2018和2019年居民纯收入(单位:千元)高于7.0千元的样本中随机选择3人进行座谈,了解其工作行业及主要收入来源.设X 为选出的3人中2018年纯收入高于7.0千元的人数,求随机变量X 的分布列和数学期望.附:回归直线的斜率和截距的最小二乘法估计公式分别为:121()()()niii nii t t y y b tt ==--=-∑∑,a y bt =-.【答案】(1)ˆ0.5 3.3yt =+;(2)分布列见解析;期望为98. 【解析】(1)根据2018年的抽样数据可得2018年的人均纯收入为1(5.2 4.8 6.5 5.6 6.07.1 6.17.3 5.97.5) 6.210+++++++++= 千元,根据2019年的抽样数据可得2019年的人均纯收入为1(6.27.8 6.6 5.87.1 6.87.27.9 5.97.75) 6.910+++++++++=千元,由所给的数据得1(1234567)47t =++++++=,1(3.9 4.3 4.6 5.4 5.8 6.2 6.9) 5.37y =++++++=, ∴721()941014928i i t t =-=++++++=∑,71()()(3)( 1.4)(2)(1)(1)(0.7)00.110.520.93 1.614ii i tt y y =--=-⨯-+-⨯-+-⨯-+⨯+⨯+⨯+⨯=∑,∴71721()()14ˆ0.528()ii i ii tt y y btt ==--===-∑∑, 则ˆˆ 5.30.54 3.3ay bt =-=-⨯=, 则所求y 关于t 的线性回归方程为ˆ0.5 3.3yt =+; (2)由2018年和2019年的抽样数据可知,2018年居民纯收入高于7.0千元的有3人,2019年居民纯收入高于7.0千元的有5人,由题意可得,随机变量X 的可能取值为0,1,2,3,则35385(0)28C P X C ===,12353815(1)28C C P X C ===,21353815(2)56C C P X C ===,33381(1)56C P X C ===,∴随机变量X 的分布列为则X 的分布列为:则5151519()0123282856568E X =⨯+⨯+⨯+⨯= 【题组三 非线性回归方程】1.(2021·福建·泉州科技中学 )数独是源自18世纪瑞士的一种数学游戏,玩家需要根据99⨯盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(33⨯)内的数字均含1﹣9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP 上进行一段时间的训练,每天的解题平均速度y (秒)与训练天数x (天)有关,经统计得到如表的数据:现用by a x=+作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过100天训练后,每天解题的平均速度y约为多少秒?(2)小明和小红在数独APP 上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为34,已知在前3局中小明胜2局,小红胜1局.若不存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中1i t x =)参考公式:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计公式分别为:1221ni i i nii u v nu vunuβ==-⋅=-∑∑,v u αβ=-⋅.【答案】(1)1000130y x=+,经过100天训练后,每天解题的平均速度y 约为140秒;(2)243256.【解析】(1)由题意,1(990990450320300240210)5007y =++++++=,令1t x=,设y 关于t 的线性回归方程为y bt a =+,则 717221184570.3750010000.5577i ii i i t y t yb t t==-⨯-⨯-===⋅∑∑,则50010000.37130a =-⨯=. ∴1000130y t =+,又1t x=,∴y 关于x 的回归方程为1000130y x=+, 故100x =时,140y =.∴经过100天训练后,每天解题的平均速度y 约为140秒.(2)设比赛再继续进行X 局小明最终赢得比赛,则最后一局一定是小明获胜, 由题意知,最多再进行4局就有胜负.当2X =时,小明4:1胜,∴339(2)4416P X ==⨯=;当3X =时,小明4:2胜,∴123339(3)144432P X C ⎛⎫==⨯⨯-⨯= ⎪⎝⎭;当4X =时,小明4:3胜,∴21333327(4)1444256P X C ⎛⎫==⨯⨯-⨯= ⎪⎝⎭.∴小明最终赢得比赛的概率为99272431632256256++=. 2.(2021·云南大理 )2021年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.y x =+,模型②:ˆ14.4y =;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7yx a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益;(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附:刻画回归效果的相关指数()()22121ˆ1ni i i nii y yR y y ==-=--∑∑,且当2R 越大时,4.1≈.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-. 【答案】(1)模型②拟合精度更高、更可靠,72.93亿;(2)投入17亿元比投入20亿元时收益小. 【解析】(1)对于模型①, 对应的15222740485460=387y ++++++=,故对应的()12222111271750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为ˆ14.472.93=≈y. (2)当17x >时, 后五组的2122232425235x ++++==,68.56867.5+66+65675y ++==,由最小二乘法可得()ˆ670.72383.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1+574.172.93-⨯+=>,故投入17亿元比投入20亿元时收益小.3.(2021·全国·高二单元测试)某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y (元)与生产的产品数量x (千件)有关,经统计得到如下数据:根据以上数据,绘制了如下散点图.参考数据:(其中1iu x =) (1)观察散点图判断,by a x=+与y c dx =+哪一个适宜作为非原料成本y 与生产的产品数量x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程; (3)试预测生产该产品10千件时,每件产品的非原料成本为多少元? 【答案】(1)b y a x =+;(2)100ˆ11y x=+;(3)21元.【解析】(1)由题意,根据题设中的散点图,可得这些点分布在b y a x =+的两侧,所以选择函数by a x=+作为非原料成本y 与生产的产品数量x 的回归方程类型. (2)令1u x =,则by a x=+可转化为y a bu =+,则y 与u 的关系可看成线性相关关系. 因为360458y ==,所以8182218183.480.344561ˆ1001.5380.1150.618i ii ii u yu y b uu==-⋅-⨯⨯====-⨯-∑∑,则ˆˆ451000.3411a y bu =-=-⨯=,所以ˆ11100y u =+,代入1u x =,得100ˆ11y x=+.(3)当10x =时,100ˆ112110y=+=,所以预测生产该产品10千件时,每件产品的非原料成本为21元. 4.(2021·全国·高三课时练习)某芯片公司为制订下一年的研发投入计划,需了解年研发资金投入量x (单位:亿元)对年销售额y (单位:亿元)的影响,该公司对历史数据进行对比分析,建立了两个函数模型:①2y x αβ=+,②e x t y λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.现该公司对收集的近12年的年研发资金投入量i x 和年销售额i y (1,2,,12i =⋅⋅⋅)的数据作了初步处理,令2u x =,ln v y =,经计算得到如下数据:(1)设u 和y 的样本相关系数为1r ,x 和v 的样本相关系数为2r ,请从样本相关系数(精确到0.01)的角度判断,哪个模型拟合效果更好;(2)(i)根据(1)的选择及表中数据,建立y 关于x 的非线性经验回归方程;(ii)若下一年销售额y 需达到90亿元,预测下一年的研发资金投入量x 约为多少亿元? 参考数据为308477=⨯9.4868, 4.4998e 90≈.【答案】(1)模型e x t y λ+=的拟合效果更好;(2)(i)0.018 3.84ˆe x y+=;(ii)36.66亿元. 【解析】(1)()()121215000.8625000iiu u y y r --====∑,()()12214100.91770.211iix x v v r --====≈⨯∑,因为12r r <,所以从样本相关系数的角度判断,模型e x t y λ+=的拟合效果更好. (2)(i)先建立v 关于x 的经验回归方程. 由e x t y λ+=,得ln y x t λ=+,即v λx t =+.()()()121122114ˆ0.018770iii ii x x v v x x λ==--==≈-∑∑, ˆˆ 4.20.01820 3.84tv x λ=-=-⨯=, 所以v 关于x 的经验回归方程为0.01838ˆ.4vx +=, 所以0.0134ˆln 8.8x y=+,即0.018 3.84ˆe x y +=.(ii)若下一年销售额y 需达到90亿元,则由0.018 3.84ˆe x y+=,得0.018 3.8490e x +=, 又 4.4998e 90≈,所以4.49980.018 3.84x ≈+, 所以 4.4998 3.8436.660.018x -≈≈,所以预测下一年的研发资金投入量约为36.66亿元.5.(2021·全国·高二课时练习)噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了解声音强度D (单位:dB )与声音能量I (单位:2W cm -⋅)之间的关系,将测量得到的声音强度D 和声音能量I 的数据作了初步处理,得到如图所示的散点图:参考数据:111.0410I -⨯=,45.7D =,11.5W =-,()1022111.5610i i I I-=-=⨯∑,()10210.51i i W W=-=∑,()()101116.8810iii IID D -=--=⨯∑,()()1015.1i i i W W D D =-⋅-=∑,其中lg i i W I =,101110i i W W ==∑.(1)根据散点图判断,11D a b I =+与22lg D a b I =+哪一个适宜作为声音强度D 关于声音能量I 的回归模型?(给出判断即可,不必说明理由)(2)求声音强度D 关于声音能量I 的非线性经验回归方程.(3)假定当声音强度大于60dB 时,会产生噪声污染.城市中某点P 处共受到两个声源的影响,这两个声源的声音能量分别是a I 和b I ,且101410a bI I +=.已知点P 处的声音能量等于a I 与b I 之和.请根据(2)中的非线性经验回归方程,判断点P 处是否受到噪声污染,并说明理由.【答案】(1)22lg D a b I =+更适合;(2)ˆ10lg 160.7DI =+;(3)P 会受到噪声污染,理由见解析. 【解析】(1)22lg D a b I =+更适合. (2)设ˆˆD bW a =+,则 ∵()()()10110215.1ˆ100.51iii i i W W D D bW W==--===-∑∑, ∴ˆˆ160.7a D bW=-=, ∴D 关于W 的经验回归方程是ˆ10160.7DW =+,则D 关于I 的非线性经验回归方程是ˆ10lg 160.7DI =+. (3)设点P 处的声音能量为1I ,则1a b I I I =+. ∵101410a bI I +=, ∴()101010141410105910b a a b a b a b a b I I I I I I I I I I I ---=+=++=++≥⎛⎫⎛⎫ ⎪⎝⨯ ⎪⎝⎭⎭(当且仅当10310a I =,93510bI =⨯时等号成立) 根据(2)中非线性经验回归方程,知点P 处的声音强度D 的预报值的最小值,()10min 10lg 910160.710lg960.760D -=⨯+=+>,∴点P 会受到噪声污染.6.(2021·福建·福州三中高二期中)某地从2月20日开始的连续7天的某传染病累计确诊人数如下表:由上述表格得到如下散点图.(1)根据散点图判断lg =+y a b x 与x y c d =⋅(,c d 均为大于0的常数)哪一个更适合作为累计确诊人数y 与天数x 的回归方程类型(给出判断即可,不必说明理由),并求出y 关于x 的回归方程;(2)3月20日,该地的疾控中心接受了1000份血液样本,假设每份样本的检验结果是阳性还是阴性是相互独立的,且每份样本是阳性的概率是0.6,试剂把阳性样本检测出阳性结果的概率是0.99(试剂存在阳性样本检测不出来的情况,但不会把阴性样本检测呈阳性样本),求这1000份样本中检测出呈阳性的份数的期望.参考数据:其中11lg ,7i i i i v y v v ===∑参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ⋯,其回归直线ˆvu αβ=+的斜率和截距的最小二乘估计公式分别为1221,ni i i ni i u v nuvv u unuβαβ==-==--∑∑,v u αβ=-.【答案】(1)0.253.4710x x y c d y =⋅=⨯; (2)594【解析】(1)由散点图可知,x y c d =⋅更适合作为累计确诊人数y 与天数x 的回归方程类型. 把x y c d =⋅两边取对数,得lg lg lg y c x d =+, 令lg v y =,则lg lg v c x d =+,1(1234567)47x =++++++=,7211.54140i i v x ===∑,, 7172221750.1274 1.54lg 0.25140747i i i i i x v xvd x x==--⨯⨯===-⨯-∑∑,所以lg 1.540.2540.54c =-⨯=,则0.540.25v x =+, 所以y 关于x 的回归方程为0.253.4710x y =⨯; (2)设这1000份样本中检测出呈阳性的份数为X , 每份样本检测出阳性的概率为0.60.990.594P =⨯=, 由题意可知,(10000.594)XB ,,所以()10000.594594E X =⨯=份.故这1000份样本中检测出呈阳性的份数的期望为594.7.(2021·山西太原·高二期中(文))为了更好的指导青少年健康饮食,某机构调查了本地区不同身高的未成年男性,得到他们的体重的平均值,并对数据作了初步处理,得到下面的散点图及一些统计量的值.表中ln i i w y =(1)根据散点图判断,可采用x y a b =⋅作为这个地区未成年男性体重y 千克与身高x 厘米的回归方程.利用表中数据建立y 关于x 的回归方程;(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么该地区一名身高为175厘米,体重为78千克的在校男生的体重是否正常? 参考数据:0.020.71751.02,2,1.0231.99e e ===. 参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121ˆˆˆ,nii i nii uu v v v u uu βαβ==--==--∑∑.【答案】(1)2 1.02x y =⨯;(2)体重偏胖. 【解析】(1)由x y a b =⋅,得ln ln ln y a x b =+⋅, 设ˆˆˆw cx d=+,由表格中数据,得801ˆ0.02400050c ===, ˆ 3.40.021350.7d=-⨯=, 则0.70.02ln 0.7,ln 0.02,2, 1.02a b a e b e ======, 则y 关于x 的回归方程为2 1.02x y =⨯.(2)当175x =时,1752 1.02231.9963.98y =⨯=⨯=,因为63.98 1.276.77678⨯=<,所以该名在校男生的体重偏胖.。
第六章总体的比较到目前为止我们已经讨论了来自一个单一样本的数据分析。
在许多环境下,我们需要比较2个或者多个总体。
我们可以比较两个生产过程的平均值以及方差,去看看其中一个过程是否比另一个更加一致或精确。
我们可以比较一个新的过程和标准过程,或者许多过程,去了解是否存在差异。
在这一章中,我们将首先检查两个总体的比较问题,然后通过方差分析(ANOVA)表提出一个通用程序来比较任意数量的总体。
6.1 两个一直均值和方差的比较假定我们有兴趣比较两个过程的平均值,其中我们认为观察值来自同一个总体。
x ij 是来自第j 总体的第i 观察值,j μ是这个总体的平均值,ij ε表示第j 个总体中第i个观察值发生随机误差的概率。
因此,这个问题的模型:x ij j ij με=+其中,我们通常假定这些错误是独立的,同时服从平均值为0以及方差为2j σ的正态分布。
正在研究的过程 可能有不同的平均值,因为他们代表不同的处理方法,如两种化学添加剂、两个分析测量设备,或两个操作计划。
由于方差已知,通过标准正态变量我们可以用中心极限定理比较不同的处理方法;让,z (6.1.1)其中j x 是来自第j 个处理方法的j n 个观察值得平均值,2j σ是已知的方差。
为了保证这些观察值得独立性,它们是随机抽取而获得的。
因此,统计量12x x -的方差是221212n n σσ+。
为了测验0假设0H :12μμ-=0(或者是其它的值),或者是为了计算12μμ-的置信区间。
我们只需要参考标准正态偏差表。
例 6.1假设认为通过改变高速钻所在的冷却液流动速度可以使工具得寿命增加。
为了检验这个假设,应用标准流动速率(过程1)能够得到7个观察值,同时从新的流动速率(过程2)中得到6个观察值,所有的13种试验随机排列。
结果如下:121222221,20121212.4=713.6=6=1.0=1.0=zAx n x nHHσσμμμμ==<=小时,;小时,,其中同时也假设(小时),(小时)::由于-1.74比-1.645小很多(Pr(z<-1.645) = 0.05),流动度率对工件寿命无影响的假设不成立。