高中数学统计案例分析及知识点归纳总结
- 格式:docx
- 大小:645.62 KB
- 文档页数:31
高中数学统计知识点总结(全)
1. 数据的获取与整理
- 数据收集方法包括直接调查法、间接调查法和实验法。
- 数据整理技巧有频数表、频率表、累计频数表和累计频率表等。
2. 描述性统计
- 描述性统计是通过各种统计指标对数据进行概括和描述。
- 常用的统计指标包括平均数、中位数、众数和四分位数等。
3. 统计分布
- 统计分布指描述某一现象在不同取值上的分布状况。
- 常见的统计分布有正态分布、均匀分布和指数分布等。
4. 概率与统计
- 概率是描述事件发生可能性的数值。
- 统计是通过观察样本数据来推断总体特征的方法。
5. 随机变量与概率分布
- 随机变量是随机试验结果的数值表示。
- 概率分布描述了随机变量的可能取值及其对应的概率。
6. 假设检验
- 假设检验用于推断总体参数是否符合某种设定的分布。
- 假设检验的步骤包括建立原假设和备择假设、选择显著性水平和计算检验统计量。
7. 相关与回归
- 相关分析用于研究两个变量之间的关系及其强度。
- 回归分析用于根据自变量预测因变量。
8. 抽样与估计
- 抽样是从总体中选取样本的过程。
- 估计是通过样本数据推断总体参数的值。
9. 统计决策与误差分析
- 统计决策是根据统计分析结果做出决策。
- 误差分析用于评估统计结果的精确程度和可靠性。
以上是高中数学统计知识点的总结,希望对你的学习有所帮助!。
高三数学统计知识点归纳数学统计是高中数学中的一个重要内容,旨在通过搜集观测数据并对其进行整理、分析和解释,从而得出结论。
本文将对高三数学统计知识点进行归纳和总结,以帮助同学们更好地掌握和应用这些知识。
一、描述统计学描述统计学是数学统计的基础,它通过搜集、整理和分析数据,揭示数据的特征和规律。
1. 数据的分类和整理数据可以分为定性和定量两种类型。
定性数据是指具有特征或属性的数据,如性别、颜色等;定量数据是指可用数量表示的数据,如身高、体重等。
将数据分类后,我们可以采用表格、频数分布表、频率分布图等方式对数据进行整理和展示。
2. 数据的汇总和呈现数据的汇总可以使用简单统计量,如平均数、中位数、众数和极差等来描述数据的集中趋势和离散程度。
同时,通过制作直方图、饼图、柱状图等图表,可以直观地展示数据的分布情况。
二、概率与统计概率与统计是数学统计的核心内容,它包括了概率的基本概念、随机变量与概率分布、统计推断等知识点。
1. 概率的基本概念概率是描述随机事件发生可能性的数值,常用概率公式包括频率概率、古典概型和几何概型等。
此外,概率运算法则也是概率计算的重要工具,包括加法法则和乘法法则。
2. 随机变量与概率分布随机变量是指在试验过程中可能取得不同值的变量,分为离散随机变量和连续随机变量。
离散随机变量的概率分布可以用概率函数或概率分布列来描述,连续随机变量的概率分布则可以用概率密度函数描述。
3. 统计推断统计推断是根据样本数据对总体特征进行推断和估计的过程。
它包括参数估计和假设检验两个方面。
参数估计可以利用样本统计量来估计总体参数,常见的估计方法有点估计和区间估计。
假设检验则通过构建假设和检验统计量来判断样本数据是否支持某种假设。
三、相关性分析与回归分析相关性分析和回归分析是统计学在实际问题中的应用,旨在研究变量之间的关系和预测。
1. 相关性分析相关性分析用来研究两个或多个变量之间的相关性强度和方向。
常见的相关性指标包括皮尔逊相关系数、斯皮尔曼等级相关系数等,用来度量变量之间的线性关系和等级关系。
第二章:统计 1、抽样方法:①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显)注意:在N 个个体的总体中抽取出n 个个体组成样本, 每个个体被抽到的机会(概率)均为Nn。
2、总体分布的估计: ⑴一表二图:①频率分布表——数据详实 ②频率分布直方图——分布直观③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。
⑵茎叶图:①茎叶图适用于数据较少的情况, 从中便于看出数据的分布, 以及中位数、众位数等。
②个位数为叶, 十位数为茎, 右侧数据按照从小到大书写, 相同的数据重复写。
3、总体特征数的估计:⑴平均数:nx x x x x n++++=Λ321; 取值为n x x x ,,,21Λ的频率分别为n p p p ,,,21Λ, 则其平均数为n n p x p x p x +++Λ2211; 注意:频率分布表计算平均数要取组中值。
⑵方差与标准差:一组样本数据n x x x ,,,21Λ方差:212)(1∑=-=ni ix xns ;标准差:21)(1∑=-=ni ix xns注:方差与标准差越小, 说明样本数据越稳定。
平均数反映数据总体水平;方差与标准差反映数据的稳定水平。
⑶线性回归方程①变量之间的两类关系:函数关系与相关关系; ②制作散点图, 判断线性相关关系 ③线性回归方程:a bx y +=∧(最小二乘法)1221ni i i ni i x y nx y b x nx a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑注意:线性回归直线经过定点),(y x 。
第三章:概率1、随机事件及其概率:⑴事件:试验的每一种可能的结果, 用大写英文字母表示;⑵必然事件、不可能事件、随机事件的特点; ⑶随机事件A 的概率:1)(0,)(≤≤=A P nmA P . 2、古典概型:⑴基本事件:一次试验中可能出现的每一个基本结果;⑵古典概型的特点: ①所有的基本事件只有有限个; ②每个基本事件都是等可能发生。
高中数学教学案例分析一、引言在高中数学教学中,教师可以通过案例教学的方式来激发学生的学习兴趣,提高学习效果。
本文将通过分析一个高中数学教学案例,探讨案例教学的优势和教学策略。
二、案例背景在某高中数学课堂上,教师使用了一个有趣的案例进行教学。
案例内容为一个实际问题:某地有两座距离为30公里的火车站A和B,中间有一条铁轨,一辆火车以时速60公里/小时从A站开往B站,同时一只小狗以每小时20公里的速度从A站沿铁轨向B站追赶火车。
问火车和小狗相遇在哪里?三、案例分析通过这个案例,学生可以运用数学知识解决实际问题。
首先,学生需要了解速度的概念,并将火车和小狗的速度转换成距离与时间的关系。
然后,学生可以利用速度乘以时间等于距离的公式,列出方程来解决问题。
最后,学生需要通过计算来确定火车和小狗相遇的位置。
四、案例的优势1. 激发学生兴趣:案例教学实际、有趣,能够引起学生的兴趣和好奇心,增加学习的动力。
2. 提高学习积极性:案例教学能够让学生主动参与,通过解决实际问题来提高学习积极性。
3. 培养学生创新思维:案例教学要求学生从多个角度思考问题,培养学生的创新思维和解决问题的能力。
4. 加深理解记忆:通过案例教学,学生能够将抽象的数学知识与实际问题相结合,加深理解记忆。
五、案例教学策略1. 案例选择:选择与学生实际生活相关的案例,能够引起学生兴趣和共鸣。
2. 合作学习:鼓励学生进行小组合作,互相讨论,共同解决问题,培养合作与交流能力。
3. 提问引导:提出开放性的问题,引导学生思考和探索解决问题的方法。
4. 个性化辅导:根据学生不同的能力和需求,进行个性化指导和辅导,提高学生的学习效果。
5. 多媒体技术:结合多媒体教学技术,通过图片、动画等形式展示案例,增加学生的参与度和理解程度。
六、教学效果评价通过案例教学,学生能够积极参与,提高自主学习能力和解决实际问题的能力。
同时,案例教学能够激发学生的兴趣,增加对数学学科的喜爱度,进一步提升学习效果。
高中数学统计学在市场分析中的应用实例在当今竞争激烈的市场环境中,企业要想做出明智的决策,就需要对市场有深入的了解和准确的预测。
高中数学统计学作为一门重要的学科,为市场分析提供了强大的工具和方法。
本文将通过一些实际案例,展示高中数学统计学在市场分析中的广泛应用。
一、数据收集与整理市场分析的第一步是收集相关数据。
这些数据可以包括消费者的购买行为、产品的销售情况、市场份额、竞争对手的表现等等。
以一家手机制造商为例,他们可能会收集不同型号手机在各个地区的销售量、价格、消费者的年龄、性别、收入水平等信息。
在收集到大量的数据后,需要进行整理和分类。
例如,可以将消费者按照年龄分为不同的组别,将销售数据按照月份或季度进行汇总。
这时候就会用到统计学中的分类和汇总方法,如频数分布、分组等。
二、描述性统计分析描述性统计分析是对数据的基本特征进行概括和描述。
常见的指标包括均值、中位数、众数、方差、标准差等。
假设一家超市想要了解某种商品的销售情况。
通过计算该商品在一段时间内的平均销售量,可以了解其大致的销售水平;中位数能够反映出销售数据的中间位置,避免极端值的影响;众数则可以告诉我们哪种销售数量出现的频率最高。
方差和标准差则用于衡量数据的离散程度。
如果销售数据的方差较大,说明销售情况不稳定,波动较大;反之,则表示销售较为平稳。
三、概率与抽样在市场分析中,常常无法对整个市场进行全面调查,这时就需要抽样。
抽样是从总体中选取一部分样本进行研究,以推断总体的特征。
例如,一家市场调研公司想要了解消费者对某种新品牌饮料的喜好程度。
他们不可能调查所有的消费者,而是通过随机抽样的方法,选取一定数量的消费者进行问卷调查。
在抽样过程中,需要运用概率知识来保证样本的代表性和随机性。
同时,还可以通过计算抽样误差,评估样本对总体推断的准确性。
四、相关性分析相关性分析用于研究两个或多个变量之间的关系。
在市场中,很多因素是相互关联的。
比如,一家服装公司发现,当气温升高时,短袖衬衫的销售量往往会增加。
高中数学统计学总结知识点一、统计学的基本概念统计学是研究数据收集、整理、分析和解释的学科。
它在现代社会中具有重要的应用价值,可以帮助人们更好地理解事物发展规律,做出更科学的决策。
统计学的基本概念包括总体和样本、参数和统计量、频数和频率、统计图示等内容。
1. 总体和样本总体是指研究对象的全部个体,而样本是从总体中选取的一部分个体。
对于大规模的研究对象,通常采用抽样的方法选择样本,然后通过对样本的研究结果推断总体的性质。
样本的选择应该具有代表性,以确保研究结果的可靠性。
2. 参数和统计量参数是用来描述总体特征的数值,统计量是用来描述样本特征的数值。
常见的参数包括平均值、标准差、方差等,而统计量则包括样本均值、样本标准差、样本方差等。
通过对统计量的分析可以推断出总体参数的性质。
3. 频数和频率频数是指某一数值在样本中出现的次数,而频率是指某一数值出现的相对次数。
频率可以用来描述数据的分布规律,可以是相对频率、累积频率等形式。
4. 统计图示统计图示是指用图形的方式表示数据的分布规律。
常见的统计图示包括直方图、折线图、饼状图等,通过图示可以直观地了解数据的分布情况,方便研究和分析。
二、数据的描述性统计描述性统计是统计学中重要的内容,主要包括数据的集中趋势和离散程度的描述。
常见的描述性统计指标包括均值、中位数、众数、标准差、方差等。
1. 均值均值是一个样本或总体的平均数值,通常用符号表示,可以用来描述数据的集中趋势。
2. 中位数中位数是一组数据中间数值,可以用来描述数据的中间位置。
它不受极端值的影响,通常用来描述数据的分布。
3. 众数众数是一组数据中出现次数最多的数值,可以用来描述数据的集中趋势。
它在一些特定情况下比均值更具有代表性。
4. 标准差和方差标准差和方差是用来描述数据的离散程度,可以用来度量数据的波动性。
它们的计算需要借助均值,可以帮助研究者更全面地了解数据的分布。
三、概率统计概率统计是统计学中的另一个重要内容,主要包括概率的定义、概率的性质、离散型随机变量、连续型随机变量、概率分布函数等。
高中数学知识点:概率统计知识点总结概括高中数学知识点:概率统计知识点总结概括一.算法,概率和统计1.算法初步(约12课时)(1)算法的含义、程序框图①通过对解决具体问题过程与步骤的分析(如,二元一次方程组求解等问题),体会算法的思想,了解算法的含义。
②通过模仿、操作、探索,经历通过设计程序框图表达解决问题的过程。
在具体问题的解决过程中(如,三元一次方程组求解等问题),理解程序框图的三种基本逻辑结构:顺序、条件分支、循环。
(2)基本算法语句经历将具体问题的程序框图转化为程序语句的过程,理解几种基本算法语句--输入语句、输出语句、赋值语句、条件语句、循环语句,进一步体会算法的基本思想。
(3)通过阅读中国古代数学中的算法案例,体会中国古代数学对世界数学发展的贡献。
3.概率(约8课时)(1)在具体情境中,了解随机事件发生的不确定性和频率的稳定性,进一步了解概率的意义以及频率与概率的区别。
(2)通过实例,了解两个互斥事件的概率加法公式。
(3)通过实例,理解古典概型及其概率计算公式,会用列举法计算一些随机事件所含的基本事件数及事件发生的概率。
④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性。
⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异。
⑥形成对数据处理过程进行初步评价的意识。
(3)变量的相关性①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
②经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
二.常用逻辑用语1。
命题及其关系①了解命题的逆命题、否命题与逆否命题。
②理解必要条件、充分条件与充要条件的意义,会分析四种命题的相互关系。
高三数学统计案例知识点统计学是数学的一个分支,是研究数据收集、整理、分析和解释的科学方法和技术。
在高三数学中,统计学是一项重要的内容,本文将介绍高三数学统计案例的知识点。
一、数据的收集与整理1. 可数数据和连续数据:可数数据是指可以一一列举的数据,如人数、成绩等;连续数据是指在一定范围内取值的数据,如身高、体重等。
2. 调查和实验:调查是收集数据的方法之一,通过问卷、观察等方式获取数据;实验是进行有计划的操作来观察和测量,得出定量的数据。
3. 数据的整理与处理:数据整理包括数据的清理、汇总和分类,可以使用表格、图表等形式展示数据。
二、统计指标的计算与分析1. 中心倾向的度量:平均数是一组数据总和除以样本个数,可以衡量数据的中心位置;中位数是将一组数据按从小到大排列后,中间的数值。
2. 数据的离散程度:离差是指观察值与平均数的差值;标准差是离差的平均值的平方根,可以衡量数据的离散情况。
3. 分布的形态:偏态是指数据分布的不对称程度,正偏态表示右侧尾部较长,负偏态表示左侧尾部较长;峰态是指数据分布峰值的陡峭程度,正态分布峰态为3。
三、概率与统计1. 随机事件与概率:随机事件是指在一次试验中可能发生也可能不发生的事件,事件的概率是指事件发生的可能性大小。
2. 概率的计算:频率概率是指事件发生的频率与试验次数的比值;几何概率是指用几何方法计算概率。
3. 概率分布:离散型概率分布是指随机变量可能取值有限且可列的概率分布,如二项分布、泊松分布;连续型概率分布是指随机变量可能取值无限多的概率分布,如正态分布、指数分布。
四、统计推断1. 参数估计:点估计是用样本统计量估计总体参数的值,如样本均值估计总体均值;区间估计是用样本统计量构造总体参数估计的区间。
2. 假设检验:假设检验是根据样本数据对总体参数的假设进行统计推断的方法,包括设置原假设与备择假设、选择显著性水平、计算检验统计量等步骤。
3. 方差分析:方差分析可以判断几个样本均值是否有显著差异,包括单因素方差分析和多因素方差分析。
高中数学统计知识点总结高中数学统计知识点总结高中数学统计知识点总结1考点1:确定事件和随机事件考核要求:〔1〕理解必然事件、不可能事件、随机事件的概念,知道确定事件与必然事件、不可能事件的关系;〔2〕能区分简单生活事件中的必然事件、不可能事件、随机事件。
考点2:事件发生的可能性大小,事件的概率考核要求:〔1〕知道各种事件发生的可能性大小不同,能判断一些随机事件发生的可能事件的大小并排出大小顺序;〔2〕知道概率的含义和表示符号,理解必然事件、不可能事件的概率和随机事件概率的取值范围;〔3〕理解随机事件发生的频率之间的区别和联络,会根据大数次试验所得频率估计事件的概率。
〔1〕在给可能性的大小排序前可先用〝一定发生〞、〝很有可能发生〞、〝可能发生〞、〝不太可能发生〞、〝一定不会发生〞等词语来表述事件发生的可能性的大小;〔2〕事件的概率是确定的常数,而概率是不确定的,可是近似值,与试验的次数的多少有关,只有当试验次数足够大时才能更准确。
考点3:等可能试验中事件的概率问题及概率计算考核要求〔1〕理解等可能试验的概念,会用等可能试验中事件概率计算公式来计算简单事件的概率;〔2〕会用枚举法或画〝树形图〞方法求等可能事件的概率,会用区域面积之比解决简单的概率问题;〔3〕形成对概率的初步认识,理解时机与风险、规那么公平性与决策合理性等简单概率问题。
〔1〕计算前要先确定是否为可能事件;〔2〕用枚举法或画〝树形图〞方法求等可能事件的概率过程中要将所有等可能情况考虑完好。
考点4:数据整理与统计图表考核要求:〔1〕知道数据整理分析^p 的意义,知道普查和抽样调查这两种搜集数据的方法及其区别;〔2〕结合有关代数、几何的内容,掌握用折线图、扇形图、条形图等整理数据的方法,并能通过图表获取有关信息。
考点5:统计的含义考核要求:〔1〕知道统计的意义和一般研究过程;〔2〕认识个体、总体和样本的区别,理解样本估计总体的思想方法。
考点6:平均数、加权平均数的概念和计算考核要求:〔1〕理解平均数、加权平均数的概念;〔2〕掌握平均数、加权平均数的计算公式。
统计一.简单随机抽样:抽签法和随机数法1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。
2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。
抽签法的一般步骤:a、将总体的个体编号。
b、连续抽签获取样本号码。
3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。
随机数表法的步骤:a、将总体的个体编号。
b、在随机数表中选择开始数字。
c、读数获取样本号码。
4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。
二.系统抽样:1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。
系统抽样的一般步骤:(1)采用随机抽样的方法将总体中的N个个编号。
(2)将整体按编号进行分段,确定分段间隔k=N/n。
(k∈N,L≤k).(3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。
(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。
在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。
三.分层抽样:1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。
第八章 统计与统计案例第1节 随机抽样最新考纲:1.理解随机抽样的必要性和重要性;2.会用简单随机抽样方法从总体中抽取样本;3.了解分层抽样和系统抽样方法.会用随机抽样的基本方法解决一些简单的实际问题.1.简单随机抽样(1)定义:设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本.(1)先将总体的N 个个体编号.(2)确定分段间隔K ,对编号进行分段,当N n 是整数时,取k =N n ,当N n不是整数时,随机从总体中剔除余数,再取k =N ′n(N ′为从总体中剔除余数后的总数). (3)在第1段用简单随机抽样确定第一个个体编号l (l ≤k ).(4)按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),依次进行下去,直到获取整个样本.3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)分层抽样的应用范围: 当总体由差异明显的几个部分组成时,往往选用分层抽样.【例1】下列抽取样本的方式属于简单随机抽样的个数为( )①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.A .0B .1C .2D .3【例2】(2017•葫芦岛模拟)福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个二位号码中选取,小明利用如图所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列和第10列的数字开始从左到右依次选取两个数字,则第四个被选中的红色球号码为( )A .12B .33C .06D .16【例3】(教材习题改编)老师在班级50名学生中,依次抽取学号为5,10,15,20,25,30,35,40,45,50的学生进行作业检查,这种抽样方法是( )A .随机抽样B .分层抽样C .系统抽样D .以上都不是【例4】某地区有小学150所,中学75所,大学25所,现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.【例5】哈六中2016届有840名学生,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为________.【例6】(2017·西安质检)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3【变式1】(2017•大连二模)某单位员工按年龄分为A ,B ,C 三组,其人数之比为5:4:1,现用分层抽样的方法从总体中抽取一个容量为10的样本,已知C 组中某个员工被抽到的概率是91,则该单位员工总数为( )A .110B .10C .90D .80【变式2】(2017•黄州区三模)某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为( )A .16B .17C .18D .19【变式3】(2017•宣城二模)一支田径队共有运动员98人,其中女运动员42人,用分层抽样的方法抽取一个样本,每名运动员被抽到的概率都是72,则男运动员应抽取( ) A .18人B .16人C .14人D .12人1.为了了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是( )A .简单随机抽样B .按性别分层抽样C .按学段分层抽样D .系统抽样 2.从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射试验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( )A .5,10,15,20,25B .3,13,23,33,43C .1,2,3,4,5D .2,4,6,16,323.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从丙车间的产品中抽取了3件,则n =( )A .9B .10C .12D .134.将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为( )A .700B .669C .695D .6765.某防疫站对学生进行身体健康调查,欲采用分层抽样的办法抽取样本.某中学共有学生2 000名,抽取了一个容量为200的样本,已知样本中女生比男生少6人,则该校共有女生( )A .1030人B .97人C .950人D .970人第2节用样本估计总体最新考纲:1.了解分布的意义与作用,能根据概率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.1.频率分布直方图(1)频率分布表的画法: 第一步:求极差,决定组数和组距,组距=极差组数; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图.横轴表示样本数据,纵轴表示频率组距,每个小矩形的面积表示样本落在该组内的频率.2.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.样本的数字特征题型一 茎叶图【例1】(必修3P70改编)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5B.91.5和92C.91和91.5D.92和92【例2】(2016•唐山一模)为迎接即将举行的集体跳绳比赛,高一年级对甲、乙两个代表队各进行了6轮测试,测试成绩(单位:次/分钟)如表:(1)补全茎叶图并指出乙队测试成绩的中位数和众数;(2)试用统计学中的平均数、方差知识对甲乙两个代表队的测试成绩进行分析.【变式1】如图,茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A.2,5B.5,5C.5,8D.8,8【变式2】(2015秋•宣城期末)甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:(1)用茎叶图表示这两组数据;(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你认为选派哪位学生参加合适?请说明理由.题型二频率分布直方图【例1】(教材习题改编)某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有________人.【例2】(2017·济南调研)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,......,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为_______.【变式1】(2017•东台市模拟)从高三年级随机抽取100名学生,将他们的某次考试数学成绩绘制成频率分布直方图.由图中数据可知成绩在[130,140)内的学生人数为_______.【变式2】(2016秋•威海期末)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高在[100,110),[110,120),[120,130)三组内的学生中,用分层抽样的方法选取28人参加一项活动,则从身高在[120,130)内的学生中选取的人数应为_______.【例3】(2016·四川卷)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.【变式3】(2017•灵丘县四模)为对考生的月考成绩进行分析,某地区随机抽查了10000名考生的成绩,根据所得数据画了如下的样本频率分布直方图.(1)求成绩在[600,650)的频率;(2)根据频率分布直方图算出样本数据的中位数;(3)为了分析成绩与班级、学校等方面的关系,必须按成绩再从这10000人中用分层抽样方法抽出20人作进一步分析,则成绩在[550,600)的这段应抽多少人?【例4】(2017•唐山二模)共享单车的出现方便了人们的出行,深受我市居民的喜爱.为调查某校大学生对共享单车的使用情况,从该校8000名学生中按年级用分层抽样的方式随机抽取了100位同学进行调查,得到这100名同学每周使用共享单车的时间(单位:小时)如表:(1)已知该校大一学生由2400人,求抽取的100名学生中大一学生人数;(2)作出这些数据的频率分布直方图;(3)估计该校大学生每周使用共享单车的平均时间t(同一组中的数据用该组区间的中点值作代表).【变式4】(2014·全国Ⅰ卷)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(1)作出这些数据的频率分布直方图:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?【例5】(2017•肇庆三模)某市房产契税标准如下:从该市某高档住宅小区,随机调查了一百户居民,获得了他们的购房总额数据,整理得到了如下的频率分布直方图:(1)假设该小区已经出售了2000套住房,估计该小区有多少套房子的总价在300万以上,说明理由.(2)假设同组中的每个数据用该组区间的右端点值代替,估计该小区购房者缴纳契税的平均值.【变式5】(2016·北京卷)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.1.重庆市2016年各月的平均气温(℃)数据的茎叶图如图,则这组数据的中位数是()A.19B.20C.21.5D.232.我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石B.169石C.338石D.1365石3.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()A.45B.50C.55D.604.(2016·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图9-3-11中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个5.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为,[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?第3节线性回归方程最新考纲:1.会做两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归系数公式不要求记忆).3.了解回归分析的基本思想、方法及其简单应用.1.回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是散点图;统计量有相关系数与相关指数.(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系. 2.线性回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为y ^=b ^x +a ^,则∑∑∑∑====∧--=---=ni i ni ii ni i ni i ixn x yx n yx x x y y x xb 1221121)())((,x b y a ∧∧-=.其中,b ^是回归方程的斜率,a ^是在y轴上 的截距. 3.相关系数a .计算公式:∑∑∑===----=ni ni iini ii y yx x y yx x r 11221)()())((b .当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间相关性越弱.通常|r |大于0.75时,认为两个变量有很强的线性相关性.题型一 相关关系的判断【例】某公司2010~2015年的年利润x (单位:百万元)与年广告支出y (单位:百万元)的统计资料如下表所示:根据统计资料,则( )A.利润中位数是16,x与y有正线性相关关系B.利润中位数是17,x与y有正线性相关关系C.利润中位数是17,x与y有负线性相关关系D.利润中位数是18,x与y有负线性相关关系【变式】对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(u i,v i)(i =1,2,…,10),得散点图(2).由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关题型二线性回归分析【例1】(2017•延边州模拟)如表提供了某厂节能降耗改造后在生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据,根据表中提供的数据,求出y关于x的线性回归方程为yˆ=0.7x+0.35,则下列结论错误的是()A.线性回归直线一定过点(4.5,3.5)B.产品的生产能耗与产量呈正相关C .t 的取值必定是3.15D .A 产品每多生产1吨,则相应的生产能耗约增加0.7吨【变式1】(2017•南昌一模)设某中学的高中女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,3,…,n ),用最小二乘法近似得到回归直线方程为yˆ=0.85x−85.71,则下列结论中不正确的是( )A .y 与x 具有正线性相关关系B .回归直线过样本的中心点(y x ,)C .若该中学某高中女生身高增加1cm ,则其体重约增加0.85kgD .若该中学某高中女生身高为160cm ,则可断定其体重必为50.29kg【例2】(2017•西青区模拟)为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:据上表得回归直线方程a x b yˆˆˆ+=,其中76.0ˆ=b ,x b y a ˆˆˆ-=,据此估计,该社区一户收入为15万元家庭年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元【变式2】(2017•成都四模)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费和销售额进行统计,得到统计数据如表(单位:万元):由表可得到回归方程为a x y ˆ2.10ˆ+=,据此模型,预测广告费为10万元时的销售额约为( )A.101.2 B.108.8 C.111.2D.118.2题型三线性相关关系检验【例1】(2017•广西一模)在两个变量y与x的回归模型中,分别选择了四个不同的模型,它们的相关指数R2如下,其中拟合效果最好的为()A.模型①的相关指数为0.976 C.模型③的相关指数为0.076 B.模型②的相关指数为0.776 D.模型④的相关指数为0.351【例2】(2015春•祁县期中)某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:求年推销金额y与工作年限x之间的相关系数.【变式】(2017•泉州模拟)关于衡量两个变量y与x之间线性相关关系的相关系数r与相关指数R2中,下列说法中正确的是()A.r越大,两变量的线性相关性越强C.r的取值范围为(-∞,+∞)B.R2越大,两变量的线性相关性越强D.R2的取值范围为[0,+∞)题型四线性回归方程【例1】(2017•乐东县一模)某公司经营一批进价为每件4百元的商品,在市场调查时发现,此商品的销售单价x(百元)与日销售量y(件)之间有如下关系:(1)求y 关于x 的回归直线方程;(2)借助回归直线方程请你预测,销售单价为多少百元(精确到个位数)时,日利润最大?【变式1】(2017•全国模拟)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑==10180i ix,∑==10120i iy,∑==101184i ii yx ,∑==1012720i ix.(1)求家庭的月储蓄y 关于月收入x 的线性回归方程a x b yˆˆˆ+=; (2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.【例2】(2017•甘肃一模)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(2)建立y 关于t 的回归方程(系数精确到0.01),预测2017年我国生活垃圾无害化处理量.参考数据:32.971=∑=i iy,17.4071=∑=i ii yt ,55.0)(271=-∑=y yi i,646.27≈.参考公式:相关系数()()niit t y y r --=∑回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:121()()()nii i nii tt y y b tt==--=-∑∑,=.a y bt -【例3】(2017•河南一模)为了对2016年某校中考成绩进行分析,在60分以上的全体同学中随机抽出8位,他们的数学分数(已折算为百分制)从小到大排是60、65、70、75、80、85、90、95,物理分数从小到大排是72、77、80、84、88、90、93、95.(1)若规定85分以上为优秀,求这8位同学中恰有3位同学的数学和物理分数均为优秀的概率; (2)若这8位同学的数学、物理、化学分数事实上对应如下表:①用变量y 与x 、z 与x 的相关系数说明物理与数学、化学与数学的相关程度;②求y 与x 、z 与x 的线性回归方程(系数精确到0.01),当某同学的数学成绩为50分时,估计其物理、化学两科的得分.参考公式:相关系数∑∑∑===----=ni ni i i ni ii y y x x y yx x r 11221)()())((,∑∑==---=ni ini i ix xy y x xb 121)())((.参考数据:5.77=x ,85=y ,81=z ,1050)(812≈-∑=i ix x,456)(812≈-∑=i iy y,550)(812≈-∑=i iz z,668)()(81≈--∑=y y x xi i i,755)()(81≈--∑=z z x xi i i,4.321050≈,4.21456≈,5.23550≈.【变式2】(2017•汕头一模)二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格y (单位:万元/辆)进行整理,得到如下数据:下面是z关于x的折线图:(1)由折线图可以看出,可以用线性回归模型拟合z 与x 的关系,请用相关数加以说明;(2)求y 关于x 的回归方程并预测某辆A 型号二手车当使用年数为9年时售价约为多少?(a bˆ,ˆ小数点后保留两位有效数字).(3)基于成本的考虑,该型号二手车的售价不得低于7118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年?参考数据:4.18761=∑=i ii yx ,64.4761=∑=i ii zx ,139612=∑=i i x ,96.13)(261=-∑=y y i i,53.1)(261=-∑=z zi i,38.046.1ln ≈,34.07118.0ln ≈.【例4】(2015高考新课标1,文19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的宣传费i x 和年销售量()1,2,,8i y i =数据作了初步处理,得到下面的散点图及一些统计量的值.y46.6 56.3 6.8表中i w w =1881i i w =∑.(1)根据散点图判断,y a bx =+与y c d x =+,哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型(给出判断即可,不必说明理由);(2)根据(I )的判断结果及表中数据,建立y 关于x 的回归方程.附:对于一组数据),(),,(2211v u v u ,……,),(n n v u ,其回归线u v βα+=的斜率和截距的最小二乘估计分别为:∑∑==---=ni ini i iu uv v u u121)())((ˆβ.【变式3】(2017•衡水金卷一模)某种新产品投放市场一段时间后,经过调研获得了时间x(天数)与销售单价y(元)的一组数据,且做了一定的数据处理(如表),并作出了散点图(如图).于时间x的回归方程类型?(不必说明理由)(2)根据判断结果和表中数据,建立y关于x的回归方程;求该产品投放市场第几天的销售额最高?最高为多少元?1.(2015·全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关2.(2017·贵阳检测)若8名学生的身高和体重数据如下表:第3_____kg. 3.(2017•合肥三模)网络购物已经成为一种时尚,电商们为了提升知名度,加大了在媒体上的广告投入.经统计,近五年某电商在媒体上的广告投入费用x (亿元)与当年度该电商的销售收入y (亿元)的数据如下表:):(1)求y 关于x 的回归方程;(2)2017年度该电商准备投入广告费1.5亿元,利用(Ⅰ)中的回归方程,预测该电商2017年的销售收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:∑∑==---=ni ini i ix xy y x xb 121)())((,选用数据:1.1231=∑=ni ii yx ,1.512=∑=ni ix4.(2017•包头一模)如图是某企业2010年至2016年污水净化量(单位:吨)的折线图.注:年份代码1~7分别对应年份2010~2016.(1)由折线图看出,可用线性回归模型拟合y 和t 的关系,请用相关系数加以说明;(2)建立y 关于t 的回归方程,预测2017年该企业污水净化量; (3)请用数据说明回归方程预报的效果.附注:参考数据:54=y ,21))((71=--∑=i i i y y t t ,74.314≈,49)ˆ(712=-∑=i i i yy .参考公式:相关系数∑∑∑===----=ni ni i i ni i iy y t t y y t tr 11221)()())((,∑∑==---=ni ini i it ty y t tb121)())((ˆ.反映回归效果的公式为第4节独立性检验最新考纲:了解独立性检验(只要求2×2列联表)的思想、方法及其初步应用.一.2×2列联表1.列联表用表格列出的分类变量的频数表,叫做列联表。
高中数学统计知识点统计是一种数学方法,可以将数据做一定的处理,然后归纳,最后将结果清晰的呈现在人们面前。
下面是店铺为你整理的高中数学统计知识点,一起来看看吧。
高中数学统计知识点:统计1.1.1简单随机抽样1.总体和样本在统计学中 , 把研究对象的全体叫做总体.把每个研究对象叫做个体.把总体中个体的总数叫做总体容量.为了研究总体x 的有关性质,一般从总体中随机抽取一部分:x₁,x₂……,xn 研究,我们称它为样本.其中个体的个数称为样本容量.2.简单随机抽样,也叫纯随机抽样。
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
3.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。
4.抽签法:(1)给调查对象群体中的每一个对象编号(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。
5.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。
1.1.2系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
K(抽样距离)=N(总体规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。
可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。
如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。
高中数学的统计知识点总结一、总体和样本1. 总体和样本的概念总体是指研究对象的全部个体的集合,而样本是从总体中选取的一部分个体的集合。
在统计学中,我们通常通过对样本的研究来推断总体的特征。
2. 抽样方法抽样方法是指从总体中选取样本的方式,常见的抽样方法包括简单随机抽样、系统抽样、分层抽样、整群抽样等。
3. 总体参数和样本统计量总体参数是用来描述总体特征的指标,比如总体的均值、方差等;样本统计量是用来描述样本特征的指标,比如样本的均值、方差等。
二、数据的描述和分析1. 数据的类型数据可以分为定性数据和定量数据。
定性数据是指用文字描述的数据,比如性别、颜色等;定量数据是指用数字表示的数据,比如身高、体重等。
2. 数据的分布数据的分布是指数据的值在不同取值上的分布情况,我们通常用直方图、饼图等来描述数据的分布。
3. 样本的描述统计样本的描述统计是通过计算样本的均值、中位数、众数、标准差等指标来描述样本的特征。
4. 相关系数相关系数是用来描述两个变量之间相关性的指标,常见的相关系数包括皮尔逊相关系数、斯皮尔曼相关系数等。
5. 回归分析回归分析是一种用来研究变量之间关系的方法,通过回归分析可以得到变量之间的函数关系。
三、概率论1. 概率的基本概念概率是指事件发生的可能性,常用概率的表示方法是0到1之间的数。
2. 概率的性质概率有加法性、乘法性等性质。
在概率的计算中,我们可以利用这些性质来简化计算。
3. 随机变量和概率分布随机变量是指取值不确定的变量,概率分布是指随机变量在不同取值上的概率分布情况。
4. 期望和方差期望是指随机变量取值的平均值,方差是指随机变量离散程度的度量。
5. 大数定律和中心极限定理大数定律和中心极限定理是概率论中的两个重要定理,它们分别描述了大样本下随机变量的均值趋于期望和大样本下样本均值呈正态分布的情况。
四、统计推断1. 参数估计参数估计是指利用样本统计量来对总体参数进行估计,常见的参数估计方法有点估计和区间估计。
高中数学中的统计分析知识点总结统计分析是数学中一个重要的分支,旨在通过数据分析和推理来揭示事物的规律和特征。
在高中数学中,统计分析是一个必修的内容,具有一定难度和广泛的应用领域。
本文将对高中数学中的统计分析知识点进行总结。
一、数据的收集和整理数据的收集是统计分析的第一步,可以通过观察、实验、调查等方式获取。
对于收集到的数据,需要进行整理和归纳,以保证数据的可靠性和可操作性。
主要的整理方法有频数表、频率表、分组统计等。
二、数据的图表表示1. 条形图条形图是一种直观的数据展示方式,用于比较不同类别或不同时间段之间的数据差异。
条形图中,条的长度表示数据的数量或大小。
2. 折线图折线图常用于表示随时间变化的数据趋势。
通过连接不同时间点上的数据点,可以直观地展示数据的变化规律。
3. 饼图饼图主要用于表示不同类别数据所占比例的关系。
饼图的圆形面积表示不同类别的数据比例大小。
4. 散点图散点图用于表示两个变量之间的关系,通过数据点在坐标系中的位置来展示变量之间的相关性。
三、数据的测度指标1. 中心位置测度中心位置测度用于描述数据的集中趋势,常用的有平均数、中位数、众数等。
平均数是数据的总和除以数据的个数,中位数是将数据按照大小排序后,处于中间位置或两个中间位置的数的平均值,众数是出现次数最多的数。
2. 离散程度测度离散程度测度用于描述数据的分散程度,常用的有范围、方差、标准差等。
范围是数据的最大值与最小值之差,方差是各个数据与平均数偏离程度的平方和的平均值,标准差是方差的正平方根。
四、概率与统计1. 概率基本概念概率是统计学中一个重要的概念,用于描述事件发生的可能性。
概率的基本概念包括样本空间、事件、事件概率等。
2. 随机事件的概率计算随机事件的概率计算可以通过频率方法、古典方法和几何方法等进行。
频率方法通过实验的结果来计算事件的概率,古典方法通过理论计算来估计事件的概率,几何方法通过几何图形来计算事件的概率。
第十二章 统计12.1抽样方法一、 知识导学 1.抽签法:(1)将总体中的所有个体编号(号码可以从1到N );(2)将1到N 这N 个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作);(3)将号签放在同一箱中,并搅拌均匀;(4)从箱中每次抽出1个号签,并记录其编号,连续抽取k 次; (5)从总体中将与抽到的签的编号相一致的个体取出. 2.随机数表法:(1)对总体中的个体进行编号(每个号码位数一致); (2)在随机数表中任选一个数作为开始;(3)从选定的数开始按一定的方向读下去,得到的数码若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满为止; (4) 根据选定的号码抽取样本. 3.系统抽样(等距抽样):(1)采用随机的方式将总体中的个体编号; (2)将整个的编号按一定的间隔(设为k )分段,当nN(N 为总体中的个体数,n 为样本容量)是整数时,n N k =;当nN 不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N /能被n 整除,这时nN k /=,并将剩下的总体重新编号;(3)在第一段中用简单随机抽样确定起始的个体编号l ; (4)将编号为k n l k l k l l )1(.,,.........2,,-+++的个体抽出.4.分层抽样:(1)将总体按一定标准分层;(2)计算各层的个体数与总体的个数的比;(3)按各层个体数占总体的个体数的比确定各层应抽取的样本容量; (4)在每一层进行抽样(可用简单随机抽样或系统抽样). 二.疑难知识导析1.简单随机抽样是从总体中逐个不放回地抽取.2.简单随机抽样和系统抽样都是一种等概率抽样,即每个个体被抽到的可能性都是相同的. 3.简单随机抽样适用于总体中个体较少的情况;系统抽样适用于总体中个体数较多的情形;分层抽样用于总体由几个差异明显的部分组成的情况.4. 分层抽样时,在每一层内进行抽样时可根据具体情况,采用简单随机抽样或系统抽样. 5. 在使用分层抽样时,在每一层内抽样的比例相同. 三.经典例题导讲[例1]某工厂生产A,B,C,D 四种不同型号的产品,产品数量之比依次为2:3:5:1,现用分层抽样方法抽出一个容量为n 的样本,样本中A 型号有16件,那么此样本容量n 是多少?错解:样本容量1615322+++⨯=2(件)错因:混淆了A 型号产品与样本容量的比例关系.正解:在分层抽样中,每一层所抽的个体数的比例与总体中各层个体数的比例是一致的,所以,样本容量为881621532=⨯+++=n答:此样本容量为88件.[例2]从1002名学生中选取100名进行抽样检查.请用系统抽样法设计一种方案,叙述其步骤. 解:(1)将1002名学生进行编号,号码分别为1,2,……,1002; (2)用随机数表法剔除2个个体,并将剩下的学生重新编号,号码分别为1,2,……1000;(3)将1000个号码平均分成100组,并在第一组1,2,……,10中用简单随机抽样法确定一个号码(如l ); (2) 将号码为l l l l +++990,......20,10,的个体抽出.[例3]某学校有名学生,从中选取加学生代表大会,采用简单随机抽样方法进行抽样,是用抽签法还是随机数表法?如何具体实施?分析:由于学生人数较大,制作号签比较麻烦,所以决定用随机数表法 解:采用随机数表法 实施步骤:(1) 对名同学进行编号,0000-(2) 在随机数表中随机地确定一个数作为开始,如21行45列的数字9开始的4位:9706;依次向下读数,5595,4904,………,如到最后一行,转向左边的四位数字号码,并向上读,凡不在0000-范围内的,则跳过,遇到已读过的数也跳过,最后得到号码为:0011,0570,1449,1072,1338,0076,1281,1866,1349,0864,0842,0161,1839,0895,1326,1454,0911,1642,0598,1855的学生组成容量为本.[例4]某工厂有3条生产同一产品的流水线,每天生产的产品件数分别是3000件,4000件,8000件.若要用分层抽样的方法从中抽取一个容量为150件产品的样本,应该如何抽样? 解:总体中的个体数N=3000+4000+8000=15000样本容量n=150抽样比例为100115000150==N n 所以应该在第一条流水线生产的产品中随机抽取30001001⨯=30件产品 在第二条流水线生产的产品中随机抽取:40001001⨯=40件产品 在第三条流水线生产的产品中随机抽取:50001001⨯=50件产品这里因为每条流水线所生产的产品数都较多,所以,在每条流水线的产品中抽取样品时,宜采用系统抽样方法 四.典型习题导练1.为了解某班50名同学的会考及格率,从中抽取10名进行考查分析,则在这次考查中,考查的总体内个体总数为 样本容量为 .2.采用系统抽样从含有个个体的总体(编号为0000,0001,……,1999)中抽取一个容量为100的样本,则第一段的编号为 若在第一段中用简单随机抽样得到起始个体编号为0013,则前6个入样编号为 .3.某市为了了解职工的家庭生活状况,先将职工所在的国民经济行业分成13类,然后每个行业抽1001的职工家庭进行调查,这种抽样方法是 . 4.用分层抽样的方法在一个企业中抽取一个样本容量为50的样本,其中在管理营销部门抽了15人,技术部门10人,其余在生产工人中抽取,已知该企业有生产工人375人,那么这个企业共有多少职工?5.采用简单随机抽样从含有5个人的身高的总体{}173,171,161,167,162中抽取一个容量为2的样本,写出全部样本,并计算各个样本的平均值,各样本平均值的平均值.12.2频率分布直方图、折线图与茎叶图一、知识导学1.频率分布表:反映总体频率分布的表格.2.一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=组数全距;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.3. 频率(分布)直方图:利用直方图反映样本的频率分布规律. 4. 一般地,作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的组距频率,这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.5. 频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.6. 制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出. 二、疑难知识导析1. 在编制频率分布表时,要选择适当的组距和起始点才可以使频率分布表更好地反映数据的分布情况.2. 在编制频率分布表时,如果取全距时不利于分组(如不能被组数整除),可适当增大全距,如在左右两端各增加适当范围(尽量使两端增加的量相同).3. 频率折线图的优点是它反映了数据的变化趋势,如果将样本容量取得足够大,分组的组距取得足够小,则这条折线将趋于一条曲线,我们称这一曲线为总体分布的密度曲线. 4. 茎叶图对于分布在0~99的容量较小的数据比较合适,此时,茎叶图比直方图更详尽地表示原始数据的信息.5. 在茎叶图中,茎也可以放两位,后面位数多可以四舍五入后再制图. 三、典型例题导讲[例1]一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人用再用分层抽样方法抽出100人作进一步调查,则在[)3000,2500(元)月收入段应抽出 人.解析:由直方图可得[2500,3000)(元)月收入段共有100000.00055002500⨯⨯=人, 按分层抽样应抽出10025002510000⨯=人.故 答案 25点评:频率分布直方图中,关健要理解图中数据的意义,特别是图中每个小矩形的面积才是这一组距内个体的频率.[例2]从有甲乙两台机器生产的零件中各随机抽取15个进行检验,相关指标的检验结果为: 甲:534,517,528,522,513,516,527,526,508,533,524,518,522,512 乙:512,523,516,530,510,518,521,528,532,507,516,524,526,514 画出上述数据的茎叶图 错解:甲 乙 8 0 787632 1 024668 87642 2 013468 43 3 02 4错因:对于两位数是将两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出,对于三位数字,应该把前两位数字作为茎,最后一位数字作为叶,然后从图中观察数据的分布情况,而不是仍考虑两位数,尽管此题的效果一样. 正解:用前两位数作为茎,茎叶图为甲 乙 8 50 787632 51 024668 87642 52 013468 43 53 02 54从图中可以看出,甲机床生产的零件的指标分布大致对称,平均分在5,中位数和众数都是522,乙机床生产的零件的指标分布也大致对称,平均分也在5,中位数和众数分别是516,总的看,甲的指标略大一些.[例3]在绘制频率分布直方图的第三个矩形时,矩形高度① 与这个矩形的宽度(组距)有关; ② 与样本容量n 无关; ③ 与第三个分组的频数有关; ④ 与直方图的起始点无关. 以上结论中正确的共有()A .0个 B.1个 C. 2个 D.3个错解:D.错因:起始点与组距均影响第三组的频数,所以矩形高度与以上各因素均有关,①③正确,正解:C.[例4]根据中国银行的外汇牌价,第一季度的60个工作日中,欧元的现汇买入价(100欧元的外汇可兑换的人民币)的分组与各组频数如下:〔1050,1060〕:1,〔1060,1070〕:7,〔1070,1080〕:1080,1090〕:11,〔1090,1100〕:13,〔1100,1110〕:6,〔1110,112. (1)列出欧元的现汇买入价的频率分布表;(2)估计欧元的现汇买入价在区间1065~1105内的频率;(3)如果欧元的现汇买入价不超过x 的频率的估计值为0.95,求此x(2)欧元现汇买入价在区间1065~1105内的频率的估计值为84.01100111011001105100.0217.0183.0333.01060107010651070117.0=--⨯++++--⨯(3)因为0.017+0.117+0.333+0.183+0.217=0.867〈0.95,0.017+……+0.217+0.100=0.967〉0.95,所以x 在[1100,1110]内,且满足0.867+0.1003.1108,95.0110011101100≈∴=--⨯x x 即欧元现汇买入价不超过1108.3的频率的估计为0.95 [例如果80分以上(包括80分)定为成绩优秀,60分以上(包括60分)定为成绩及格.那么,在这个班级的这次成绩统计中,成绩不及格的频率是多少?成绩及格的频率是多少?成绩优秀的频率是多少?解:被统计的对象(参加这次考试的本班学生)共有2+6+12+21+7+2=50个.60分以上的有48个,80分以上的有所以成绩不及格的频率是04.0502=,成绩及格的频率是96.05048=,成绩优秀的频率是4.05020=.说明 要计算一组数据中某个对象的频率,要先计算数据的总的个数,再计算符合这个对象要求的数据的个数.某个对象可以是一个确定的数据,也可以是在某一范围内数据的总数.[例6]在英语单词frequency 和英语词组relative frequency 中,频数最大的各是哪个字母?它们的频数和频率各是多少?解:在frequency 和英语词组relative frequency 中,频数最大的字母都是e ,在单词frequency 中,e 的频数是2,频率是92;在词组relative frequency 中,e 的频数是4,频率是174.点评:在两组数据中,同一个对象的频数相等,但频率不一定相等,频数大,不一定频率大.在同一组数据中,某两个对象的频数相等,频率也相等;频数大,频率也大. 二、典型习题导练1.为了了解某地区高三学生的身体发育情况,抽查了该地区10龄为185.17-岁的男生体重kg ,得到频率分布直方图如下:根据上图可得这100名学生中体重在]5.64,5.56[的学生人数是( ). A . B.30 C.40 D. 502. 一个容量为800的样本,某组的频率为6.25%,则这一组的频数是 3. 某校随机抽取了生,测量得到的视力数据如下:4.7,4.2,5.0,4.1,4.0,4.9,5.1,4.5,4.8,5.2,5.0,4.0,4.5,4.8,4.7,4.8,4.6,4.9,5.3,4.0(1) 列出频率分布表(共分5组)(2) 估计该校学生的近视率(视力低于4.9)4. 用一个容量为样本制作频率分布直方图时,共分13组,组距为6,起始点为10,第4组的频数为25,则直方图中第4个小矩形的宽和高分别是多少? 5. 学生某次考试的成绩的分组及各组频率如下表:则及格率,优秀率()的估计分别是6.某地随机检查了140名成年男性红细胞(/1012L ),数据的分组及频率如下表:(1)完成上面的频率分布表(2)根据上面的图表,估计成年男性红细胞数在正常值(4.0~5.5)内的百分比7.名著《简爱》的中英文版本中,第一节部分内容每句句子所含单词(字)数如下:英文句子所含单词数10,52,56,40,79,9,23,11,10,21,30,31;中文句子所含字数11,79,7,3,33,45,36,87,9,11,37,17,18,71,75,51. (1)作出这些数据的茎叶图;(2)比较茎叶图,你能得到什么结论?12.3平均数、方差与标准差一、知识导学1.n 个数据1a ,2a ,…….n a 的平均数或平均值一般记为-a =na a a n+++........21.2.一般地,若取值n x x x ,......,,21的频率分别为n p p p ,......,,21,则其平均数为n n p x p x p x +++......2211.3.把一组数据的最大值与最小值的差称为极差.4. 一般地,设一组样本数据n x x x ,......,,21,其平均数为-x ,则称212)(1∑=--=n i i x x n s 为这个样本的方差,算术平方根21)(1∑=--=ni i x x n s 为样本的标准差,分别简称样本方差,样本标准差. 二、疑难知识导析1.平均数,中位数和众数都是总体的数字特征,从不同角度反映了分布的集中趋势,平均数是最常用的指标,也是数据点的“重心”位置,它易受极端值(特别大或特别小的值)的影响,中位数位于数据序列的中间位置,不受极端值的影响,在一组数据中,可能没有众数,也可能有多个众数.2.方差和标准差是总体的数字特征,反映了分布的分散程序(波动大小),标准差也会受极端值(特别大或特别小的值)的影响.3.分布的分散程序还可以用极差来描述,但较粗略.4.样本方差也可以用公式21221x x n s n i i -=∑=计算.三、经典例题导讲[例1]某人5次上班途中所花的时间(单位:分钟)分别为.9,11,10,,y x 已知这组数据的平均数为10,方差为2,则y x -的值为( )A .1 B.2 C.3 D.4解:由平均数公式为10,得1051)91110(=⨯++++y x ,则20=+y x ,又由于方差为2,则()()()()()[]25110910111010101022222=⨯-+-+-+-+-y x 得20822=+y x 1922=xy所以有()42222=-+=-=-xy y x y x y x ,故选D.[例2]数据n x x ,,1 是一名运动员的n 次射击的命中环数,则他的平均命中环数的估计是( ).A .样本平均数均值∑==ni i x n x 11 B .样本极差),,m in(),,m ax (11n n x x x x R -=C .样本方差212)(1x x n s n i i -=∑= D .样本平均差AD=∑=-n i i x x n 11错解:C.错因:后三个选项都表示了样本的波动程度,不能用于总体平均值的估计. 正解:A.[例3]某房间中10个人的平均身高为1.74米,身高为1.85米的第11个人,进入房间后,这11个人的平均身高是多少?解:原来的10个人的身高之和为17.4米,所以,这11个人的平均身高为1185.11074.1+⨯=1.75.即这11个人的平均身高为1075米[例4]若有一个企业,70%的人年收入1万,25%的人年收入3万,5%的人年收入11万,求这个企业的年平均收入及年收入的中位数和众数解:年平均收入为12%511%253%70=⨯+⨯+⨯(万);中位数和众数均为1万(1)计算所有人员的月平均收入;(2)这个平均收入能反映打工人员的月收入的一般水平吗?为什么?(3)去掉老板的收入后,再计算平均收入,这能代表打工人员的月收入的水平吗? (4)根据以上计算,以统计的观点对(3)的结果作出分析 解:(1)平均收入711=-x (3000+450+350+400+310)=750元 (2)这个平均收入不能反映打工人员的月收入水平,可以看出打工人员的收入都低于平均收入,因为老板收入特别高,这是一个异常值,对平均收入产生了较大的影响,并且他不是打工人员(3)去掉老板后的月平均收入612=-x (450+350+400+310)=375元.这能代表打工人员的月收入水平(4)由上可见,个别特殊数据可能对平均值产生大的影响,因此在进行统计分析时,对异常值要进行专门讨论,有时应剔除之 四、典型习题导练A .4 B.4.4 C.8 D.8.82.8名新生儿的身长(cm )分别为50,51,52,55,53,54,58,54,则新生儿平均身长的估计为 ,约有一半的新生儿身长大于等于 ,新生儿身长的最可能值是 .用上述分组资料计算得病人平均等待时间的估计值-x = ,病人等待时间的标准差的估计值s =4.样本1021,......,,x x x 的平均数为5,方差为7,则3()()()13,......,13,11021---x x x 的平均数、方差,标准差分别为5.下面是一个班级在一次测验时的成绩(已按从小到大的次序排列),分别计算男生和女生的成绩和平均值,中位数以及众数,试问中位数的含义是什么?对比两个平均值和中位数,你分析一下这个班级的学习情况男生:55,55,61,65,68,71,72,73,74,75,78,80,81,82,87,94女生:53,66,70,71,73,73,75,80,80,82,82,83,84,85,87,88,90,93,94,976.某工厂甲,乙两个车间包装同一产品,在自动包装传送带上每隔30min 抽一包产品,称其重量是否合格,分别记录抽查数据如下:甲车间:102,101,99,103,98,99,98;乙车间:110,105,90,85,75,115,110. (1)这样的抽样是何种抽样方法?(2)估计甲、乙两车间的均值与方差,并说明哪个车间的产品较稳定.12.4线性回归方程一、知识导学1. 变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数表示;一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达 2. 能用直线方程a bx y +=^近似表示的相关关系叫做线性相关关系当a,b 使2222211)(......)()(a bx y a bx y a bx y Q n n --++--+--=取得最小值时,就称a bx y +=∧为拟合这n 对数据的线性回归方程,将该方程所表示的直线称为回归直线.4.线性回归方程a bx y +=∧中的系数b a ,满足:⎪⎪⎩⎪⎪⎨⎧=+⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡+⎥⎦⎤⎢⎣⎡∑∑∑∑∑=====ni i ni i n i ii n i i n i i y na b x y x a x b x 111112 由此二元一次方程组便可依次求出a b ,的值:⎪⎪⎪⎩⎪⎪⎪⎨⎧-=⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡-=--=====∑∑∑∑∑x b y a x x n y x y x n b ni i n i i n i i n i i n i i i 2112111(*) 5.一般地,用回归直线进行拟合的一般步骤为: (1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,用公式(*)求出b a ,,并写出线性回归方程.二、疑难知识导析1.现实世界中两个变量的关系中更多的是相关关系而不是确定性关系,许多物理学中公式看起来是确定性关系,实际上由于公式的使用范围,测量误差等的影响,试验得到的数据之间是相关关系.2.用最小二乘估计方法计算得到的b a ,使函数()b a Q ,达到最小3.还有其他寻找较好的回归直线的原则(如使y 方向的偏差和最小,使各点到回归直线的距离之和最小等)4. 比较相关关系绝对值的大小可以比较一组变量之间哪两个变量有更强的(线性)相关关系.5. “最好的”直线方程中“最好”可以有多种解释,也就有不同的求解方法,现在广泛采用的最小二乘法所用的思想是找到使散点到直线a bx y +==在垂直方向上的距离的平方和最小的直线a bx y +=,用这个方法,b a ,的求解最简单 三、经典例题导讲问y 与x 的(样本)相关系数r 是多少?这是否说明y 与x 没有关系? 错解:040707))((7171=⨯⨯-=-=--∑∑==xy y x y y x xi i i i i i所以相关系数r=0,即y 与x 没有关系.错因:相关系数r=0并不是说明y 与x 没有关系,而是说明y 与x 没有线性相关关系,但有可能有非线性相关关系. 正解:040707))((7171=⨯⨯-=-=--∑∑==xy y x y y x xi i i i i i所以相关系数r=0,即y 与x 没有线性相关关系,但有可能有非线性相关关系. 此题中y 与x 之间存在着2x y =的二次相关关系的.分析:可将此问题转化为下面三个问题:(1)画出散点图,根据散点图,大致判断月总成本y 与月产量之间是否有线性相关关系; (2)求出月总成本y 与月产量x 之间的线性回归方程;(5) 若1月份该产品的计划产量是6吨,试估计该产品1月份的总成本. 错解:省去第一步,即把判断判断月总成本y 与月产量之间是否有线性相关关系的过程舍去,想当然其具有线性相关关系,直接代入公式,求出线性回归方程.错因:此题的月总成本y 与月产量x 之间确实是有线性相关关系,若不具有则会导致错误.因此判断的过程不可少. 正解:(1)散点图见下面,从图中可以看到,各点大致在一条直线附近,说明x 与y 有较强的线性相关关系.(2)代入公式(*)得:a=0.9100,b=0.6477,线性回归方程是:y=0.9100x+0.6477. (3)当x=6.0时,y=0.910011.66477.00.6≈+⨯(万元),即该产品1月份的总成本的估计值为6.11万元.[例3]变量y 与x 有线性回归方程a bx y +=,现在将y 的单位由cm 变为x m ,的单位由ms变为s ,则在新的回归方程**a xb y +=中.=*a .错解:0.1a错因:由 ⎪⎪⎪⎩⎪⎪⎪⎨⎧-=⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡-=--=====∑∑∑∑∑x b y a x x n y x y x n b n i i n i i n i i n i i ni i i 2112111且y 的值变为原来的210- ,x 的值变为原来的310-可得*a 的值应为原来的210-.正解:0.01a高度(距离)与时间之间的关系由公式22gt s =给出,这里g 是重力加速度的值. (1)画出s 关于t 的散点图,这些点在一条直线附近吗?(2)设2t x =,画出s 关于x 的散点图,这些点在一条直线附近吗?(3)求出s关于x的线性回归方程.解:(1)高度s关于时间t的散点图见下面,从图中可以看到这些点似乎在一条直线附近,也好像在一条抛物线附近(2)高度s关于x的散点图见下面,从图中可以看到这些散点大致在一条直线附近(3)可以求得s关于x的线性回归方程是s=0.0004901x-18.8458(2)求出y与x之间的线性回归方程;(3)如果父亲的身高为73英寸,估计儿子的身高.解:(1)散点图见下面:(2)从散点图可以看出,这些点都分布在一条直线附近,可求得线性回归方程为98.354645.0+=∧x y(3)当73=x 时,9.6998.35734645.0≈+⨯=∧y所以当父亲的身高为73英寸时,估计儿子的身高约为69.9英寸. 四、典型习题导练1.回归直线方程的系数a,b 的最小二乘估计使函数),(b a Q 最小,Q 函数指( ).A .21)(∑=--ni i ibx a yB.∑=--ni i i bx a y 1C .2)(i i bx a y -- D.i i bx a y --2.“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时,高尔顿提出的,他的研究结果是子代的平均身高向中心回归.根据他的结论在儿子的身高y 与父亲的身高x 的线性回归方程bx a y +=∧中,b ( ).A .在(-1,0)内 B.等于0 C .在(0,1)内 D.在[1,+∞]内3.在研究硝酸钠的可溶性程度时,对不同的温度观测它在水中的溶解度,得到观测结果如下:则由此得到的回归直线的斜率是 (保留4位有效数字)4.下面的数据是年龄在40至60岁的男子中随机抽取的6个样本,分别测定了心脏功能水5.某地区近年来冬季的降雨量x(cm)与次年夏季空气中碳氢化合物的最高平均浓度y (ppm ),你认为y与x是什么关系?y与n是什么关系?6.每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的托压强度(单位:kg/cm2)(2)如果y与x具有线性相关关系,求线性回归方程.。
高中数学案例分析高中数学案例分析数学是一门综合性很强的学科,对于学生的逻辑思维、分析能力和创造力都有着很大的培养作用。
在高中阶段,数学的学习更加深入和具体,需要学生独立思考和解决问题。
下面我们来分析一个高中数学的案例,以展示学生如何应用数学知识解决实际问题。
案例名称:购买手机背景描述:小明看中了一款手机,它的价格是1500元,而且商家还提供了一项优惠政策:如果购买该手机,可以选择一款价值不超过200元的手机壳作为赠品。
小明犹豫不决,不知道是否要购买该手机。
问题提出:小明应该选择购买还是放弃购买该手机呢?解决过程:首先,我们来计算一下如果小明购买手机,得到的实际价值。
1500元手机的实际价值 = 1500元 - 赠品手机壳的价值假设小明选了一款价值为x元的赠品手机壳,根据题意可以得出:x ≤ 200元。
实际价值 = 1500元 - x元接下来,我们来计算一下选择不购买手机,小明得到的实际价值。
实际价值 = 0对比一下这两种情况,如果购买手机的实际价值大于不购买手机的实际价值,那么小明就应该选择购买该手机。
1500元 - x元 > 01500元 > x元可得x < 1500元结论:由于根据题意可以得出x ≤ 200元,所以小明购买手机的实际价值应该大于不购买手机的实际价值。
又因为x < 1500元,所以小明应选择购买该手机。
讨论:在解决这个案例的过程中,我们运用了代数运算和逻辑推理的方法,将实际问题转化为数学问题,并通过对比和计算得出解决的结论。
这个案例既考察了学生对于数学知识的理解和运用,也培养了学生的逻辑思维和解决问题的能力。
总结:这个案例表明数学在实际生活中的应用很广泛,并且通过解决实际问题,可以提高学生的数学素养和解决问题的能力。
在高中数学的学习中,通过案例分析的方式,培养学生的数学思维和创造力,有助于学生将数学知识与实际问题相结合,更好地理解和应用数学知识。
统计一、知识点归纳1、抽样方法:①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显)注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为Nn 。
2、总体分布的估计: ⑴一表二图:①频率分布表——数据详实 ②频率分布直方图——分布直观③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。
⑵茎叶图:①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。
②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。
3、总体特征数的估计: ⑴平均数:nx x x x x n++++=321;取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。
⑵方差与标准差:一组样本数据n x x x ,,,21方差:212)(1∑=-=ni ix xns ; 标准差:21)(1∑=-=ni ix xns注:方差与标准差越小,说明样本数据越稳定。
平均数反映数据总体水平;方差与标准差反映数据的稳定水平。
⑶线性回归方程①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系③线性回归方程:a bx y +=∧(最小二乘法)1221ni i i nii x y nx y b x nx a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑ 注意:线性回归直线经过定点),(y x 。
二、典例分析§11.1 抽样方法基础自测1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 .答案 200个零件的长度2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 .答案①②③3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 .答案3,9,184.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= .答案80例1某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案.解抽签法:第一步:将18名志愿者编号,编号为1,2,3, (18)第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签;第三步:将18个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员.随机数表法:第一步:将18名志愿者编号,编号为01,02,03, (18)第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读;第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.第四步:找出以上号码对应的志愿者,就是志愿小组的成员.例2某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施.解(1)将每个人随机编一个号由0001至1003.(2)利用随机数法找到3个号将这3名工人剔除.(3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k =100001=100将总体均分为10段,每段含100个工人.(5)从第一段即为0001号到0100号中随机抽取一个号l .(6)按编号将l ,100+l ,200+l ,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.解 应采取分层抽样的方法. 3分 过程如下:(1)将3万人分为五层,其中一个乡镇为一层. 5分 (2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300×152=40(人); 300×155=100(人);300×152=40(人); 300×153=60(人),10分因此各乡镇抽取人数分别为60人,40人,100人,40人,60人. 12分(3)将300人组到一起即得到一个样本.14分练习:一、填空题1.某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现分层抽取容量为45的样本,那么高一、高二、高三年级抽取的人数分别为 . 答案 15,10,202.某牛奶生产线上每隔30分钟抽取一袋进行检验,则该抽样方法为①;从某中学的30名数学爱好者中抽取3人了解学习负担情况,则该抽样方法为②.那么①,②分别为 .答案 系统抽样,简单随机抽样3.下列抽样实验中,最适宜用系统抽样的是 (填序号).①某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样②某厂生产的2 000个电子元件中随机抽取5个入样 ③从某厂生产的2 000个电子元件中随机抽取200个入样 ④从某厂生产的20个电子元件中随机抽取5个入样 答案 ③4.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是 . 答案 分层抽样法5.某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则下列判断不正确的是 (填序号). ①高一学生被抽到的概率最大 ②高三学生被抽到的概率最大 ③高三学生被抽到的概率最小 ④每名学生被抽到的概率相等 答案 ①②③6.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 . 答案 67.一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工 人. 答案 108.将参加数学竞赛的1 000名学生编号如下0001,0002,0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,…,0020,从第一部分随机抽取一个号码为0015,则第40个号码为 . 答案 07959.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取? 解 用分层抽样抽取. (1)∵20∶100=1∶5, ∴510=2,570=14,520=4∴从副处级以上干部中抽取2人,一般干部中抽取14人,从工人中抽取4人.(2)因副处级以上干部与工人人数较少,可用抽签法从中分别抽取2人和4人;对一般干部可用随机数表法抽取14人.(3)将2人、4人、14人编号汇合在一起就得到了容量为20的样本.10.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n 的样本.如果采用系统抽样法和分层抽样法抽取,不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n . 解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为n36,分层抽样的比例是36n ,抽取工程师36n ×6=6n (人),抽取技术人员36n ×12=3n (人),抽取技工36n×18=2n (人).所以n 应是6的倍数,36的约数即n =6,12,18,36.当样本容量为(n +1)时,在总体中剔除1人后还剩35人,系统抽样的间隔为135+n ,因为135+n 必须是整数,所以n 只能取6,即样本容量为6.总体分布的估计与总体特征数的估计1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为 . 答案 52.右图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为 . 答案 303.63.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组在频率分布直方图的高为h ,则|a -b |= . 答案 hm4.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为 .分数 5 4 3 2 1 人数 20 10 30 30 10 答案 51025.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg ),得到频率分布直方图如下:根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是 . 答案 40典型例题:例1 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交 作品的件数按5天一组分组统计,绘制了频率分布直方基础自测图(如图所示),已知从左到右各长方形高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件? (3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高? 解 (1)第三组的频率为1464324+++++=51又因为第三组的频数为12,∴参评作品数为5112=60.(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×1464326+++++=18(件).(3)第四组的获奖率是1810=95,第六组上交的作品数量为60×1464321+++++=3(件),∴第六组的获奖率为32=96,显然第六组的获奖率高.例4(14分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min 抽取一包产品,称其重量,分别 记录抽查数据如下:甲:102, 101, 99, 98, 103, 98, 99; 乙:110, 115, 90, 85, 75, 115, 110. (1)这种抽样方法是哪一种? (2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定.解 (1)因为间隔时间相同,故是系统抽样. 2分 (2)茎叶图如下:5分(3)甲车间: 平均值:1x =71(102+101+99+98+103+98+99)=100,7分方差:s 12=71[(102-100)2+(101-100)2+…+(99-100)2]≈3.428 6. 9分乙车间:平均值:2x =71(110+115+90+85+75+115+110)=100,11分 方差:s 22=71[(110-100)2+(115-100)2+…+(110-100)2]≈228.571 4.13分∵1x =2x ,s 12<s 22,∴甲车间产品稳定.14分练习:1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)参加这次测试的学生人数是多少?(3)在这次测试中,学生跳绳次数的中位数落在第几小组内? 解 (1)第四小组的频率=1-(0.1+0.3+0.4)=0.2. (2)设参加这次测试的学生人数是n , 则有n =第一小组频率第一小组频数=5÷0.1=50(人).(3)因为0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10,即第一、第二、第三、第四小组的频数分别为5、15、20、10,所以学生跳绳次数的中位数落在第三小组内.练习:一、填空题1.下列关于频率分布直方图的说法中不正确的是 . ①直方图的高表示取某数的频率②直方图的高表示该组上的个体在样本中出现的频率 ③直方图的高表示该组上的个体数与组距的比值④直方图的高表示该组上的个体在样本中出现的频率与组距的比值 答案 ①②③2.甲、乙两名新兵在同样条件下进行射击练习,每人打5发子弹,命中环数如下:甲:6,8,9,9,8;乙:10,7,7,7,9.则这两人的射击成绩 比 稳定. 答案 甲 乙4.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果分成六组:右图是得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x ,成绩大于等于15秒且小于17秒的学生人数为y ,则从频率分布直方图中可分析出x 和y 分别为 . 答案 0.9, 356.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示,若甲、乙两人的平均成绩分别是x 甲、x 乙,则x 甲 x 乙, 比 稳定. 答案 < 乙 甲7.已知总体的各个体的值由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a 、b 的取值分别是 . 答案 10.5、10.5二、解答题10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.解 (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:391517424+++++=0.08.又因为频率=样本容量第二小组频数, 所以样本容量=第二小组频率第二小组频数=08.012=150. (2)由图可估计该学校高一学生的达标率约为39151742391517++++++++×100%=88%.(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.线性回归方程1.下列关系中,是相关关系的为(填序号).①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.答案①②2.为了考察两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l1和l2.已知在两人的试验中发现变量x的观测数据的平均值恰好相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是(填序号).①直线l1,l2有交点(s,t)②直线l1,l2相交,但是交点未必是(s,t)③直线l1,l2由于斜率相等,所以必定平行④直线l1,l2必定重合答案①3.下列有关线性回归的说法,正确的是(填序号).①相关关系的两个变量不一定是因果关系②散点图能直观地反映数据的相关程度③回归直线最能代表线性相关的两个变量之间的关系④任一组数据都有回归直线方程答案①②③4.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线yˆ=bˆx+aˆ及回归系数bˆ,可以估计和预测变量的取值和变化趋势.其中正确命题的序号是 .答案①②③5.已知回归方程为yˆ=0.50x-0.81,则x=25时,yˆ的估计值为 .答案11.69例1下面是水稻产量与施化肥量的一组观测数据:施化肥量15 20 25 30 35 40 45水稻产量320 330 360 410 460 470 480(1)将上述数据制成散点图;基础自测(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解(1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长. 例2(14分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出(1)判断家庭平均收入与月平均生活支出是否相关?(2)若二者线性相关,求回归直线方程.解(1)作出散点图:5分观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系.7分1 (0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,(2)x=101(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,y=109分bˆ=∑∑==-•-ni ini i i x n xyx n y x 1221≈0.813 6,a ˆ=1.42-1.74×0.813 6≈0.004 3, 13分∴回归方程yˆ=0.813 6x +0.004 3.14分例3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨)标准煤的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程yˆ=b ˆx +a ˆ; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解 (1)散点图如下图:(2)x =46543+++=4.5,y =45.4435.2+++=3.5∑=41i ii yx =3×2.5+4×3+4×5+6×4.5=66.5.∑=412i ix=32+42+52+62=86∴bˆ=24124144x x yx yx i i i ii -•-∑∑===25.44865.45.345.66⨯-⨯⨯-=0.7aˆ=y -b ˆx =3.5-0.7×4.5=0.35. ∴所求的线性回归方程为yˆ=0.7x +0.35. (3)现在生产100吨甲产品用煤y =0.7×100+0.35=70.35,∴降低90-70.35=19.65(吨)标准煤.1.科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,℃),并作了统计.年平均气温 12.51 12.84 12.84 13.69 13.33 12.74 13.05 年降雨量748542507813574701432(1)试画出散点图;(2)判断两个变量是否具有相关关系. 解 (1)作出散点图如图所示,(2)由散点图可知,各点并不在一条直线附近,所以两个变量是非线性相关关系. 2.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:温度(x ) 0 10 20 50 70 溶解度(y )66.776.085.0112.3128.0由资料看y 与x 呈线性相关,试求回归方程. 解 x =30,y =50.1283.1120.850.767.66++++=93.6.bˆ=25125155x xyx yx i ii ii -•-∑∑==≈0.880 9.aˆ=y -b ˆx =93.6-0.880 9×30=67.173. ∴回归方程为yˆ=0.880 9x +67.173.3.(1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元? 解 (1)n =6,∑=61i i x =21,∑=61i i y =426,x =3.5,y =71,∑=612i i x =79,∑=61i i i y x =1 481,bˆ=26126166x xyx yx i ii ii -•-∑∑===25.3679715.364811⨯-⨯⨯-=-1.82.aˆ=y -b ˆx =71+1.82×3.5=77.37. 回归方程为yˆ=a ˆ+b ˆx =77.37-1.82x . (2)因为单位成本平均变动bˆ=-1.82<0,且产量x 的计量单位是千件,所以根据回归系数b 的意义有:产量每增加一个单位即1 000件时,单位成本平均减少1.82元. (3)当产量为6 000件时,即x =6,代入回归方程:yˆ=77.37-1.82×6=66.45(元) 当产量为6 000件时,单位成本为66.45元.一、填空题1.观察下列散点图,则①正相关;②负相关;③不相关.它们的排列顺序与图形对应顺序是 .答案 a ,c ,b2.回归方程yˆ=1.5x -15,则下列说法正确的有 个. ①y =1.5x -15 ②15是回归系数a ③1.5是回归系数a ④x =10时,y =0 答案 13.某地区调查了2~9岁儿童的身高,由此建立的身高y (cm)与年龄x (岁)的回归模型为yˆ=8.25x +60.13,下列叙述正确的是 .①该地区一个10岁儿童的身高为142.63 cm②该地区2~9岁的儿童每年身高约增加8.25 cm ③该地区9岁儿童的平均身高是134.38 cm④利用这个模型可以准确地预算该地区每个2~9岁儿童的身高 答案 ②4.三点(3,10),(7,20),(11,24)的回归方程是 .答案 yˆ=1.75x +5.75 5.某人对一地区人均工资x (千元)与该地区人均消费y (千元)进行统计调查,y 与x 有相关关系,得到回归直线方程yˆ=0.66x +1.562.若该地区的人均消费水平为7.675千元,估计该地区的人均消费额占人均工资收入的百分比约为 .答案 83%6.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取8对观测值,计算,得∑=81i i x =52, ∑=81i i y =228, ∑=812i i x =478, ∑=81i i i y x =1 849,则其线性回归方程为 .答案 yˆ=11.47+2.62x 7.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是 . 答案 ①③④8.若y 对x 呈线性相关关系,则回归直线方程yˆ=b ˆx +a ˆ表示的直线一定过定点 .答案 (4,5) 二、解答题9.(1(2)请你画出两科成绩的散点图,结合散点图,认识(1)的结论的特点. 解 (1)数学成绩和物理成绩具有相关关系.(2)以x 轴表示数学成绩,y 轴表示物理成绩,可得相应的散点图如下:由散点图可以看出,物理成绩和数学成绩对应的点不分散,大致分布在一条直线附近. 10.(1(2)求线性回归方程,并在散点图中加上回归直线. 解 (1)数据对应的散点图如图所示:(2)x =109,y =23.2,∑=512i i x =60 975,∑=51i iiy x=12 952,bˆ=25125155x xyx yx i ii ii -•-∑∑==≈0.196 2aˆ=y -b ˆx ≈1.814 2∴所求回归直线方程为yˆ=0.196 2x +1.814 2. 11.(1(2)求回归直线方程;(3)估计销售总额为24千万元时的利润. 解 (1)散点图如图所示:(2)x =71(10+15+17+20+25+28+32)=21,y =71(1+1.3+1.8+2+2.6+2.7+3.3)=2.1, ∑=712i ix=102+152+172+202+252+282+322=3 447,∑=71i iiy x=10×1+15×1.3+17×1.8+20×2+25×2.6+28×2.7+32×3.3=346.3,bˆ=27127177x x yx yx i i i ii -•-∑∑===221744731.22173.346⨯-⨯⨯-≈0.104, aˆ=y -b ˆx =2.1-0.104×21=-0.084, ∴yˆ=0.104x-0.084. (3)把x =24(千万元)代入方程得,yˆ=2.412(千万元). ∴估计销售总额为24千万元时,利润为2.412千万元.12.(1)画出散点图;(2)求回归直线方程;(3)试预测广告费支出为10百万元时,销售额多大? 解 (1)根据表中所列数据可得散点图如下:(2因此,x =525=5,y =5250 =50,∑=512i i x =145, ∑=512i i y=13 500, ∑=51i i i y x =1 380.于是可得:bˆ=25125155x xyx yx i ii ii -•-∑∑===55514550553801⨯⨯-⨯⨯-=6.5;aˆ=y -b ˆx =50-6.5×5=17.5. 因此,所求回归直线方程为:yˆ=6.5x +17.5. (3)根据上面求得的回归直线方程,当广告费支出为10百万元时,yˆ=6.5×10+17.5=82.5(百万元),即这种产品的销售收入大约为82.5百万元.§11.4 统计案例1.对有线性相关关系的两个变量建立的回归直线方程yˆ=a ˆ+b ˆx 中,回归系数b ˆ与0的大小关系为 .(填序号)①大于或小于 ②大于 ③小于 ④不小于答案 ①2.如果有90%的把握说事件A 和B 有关系,那么具体计算出的数据χ2 2.706.(用“>”,“<”,“=”填空) 答案 >3.对两个变量y 与x 进行回归分析,分别选择不同的模型,它们的相关系数r 如下,其中拟合效果最好的模型是 . ①模型Ⅰ的相关系数r 为0.98 ②模型Ⅱ的相关系数r 为0.80 ③模型Ⅲ的相关系数r 为0.50 ④模型Ⅳ的相关系数r 为0.25 答案 ①4.下列说法中正确的有:①若r >0,则x 增大时,y 也相应增大;②若r <0,则x 增大时,y 也相应增大;③若r =1或r =-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个点均在一条直线上 . 答案 ①③例1 (14分)调查339名50岁以上人的吸烟习惯与患慢性气管炎的情况,获数据如下:患慢性气管炎 未患慢性气管炎 总计 吸烟 43 162 205 不吸烟 13 121 134 合计 56 283 339试问:(1)吸烟习惯与患慢性气管炎是否有关? (2)用假设检验的思想给予证明. (1)解 根据列联表的数据,得到χ2=))()()(()(2c d b d c a b a bc ad n ++++- 2分 =13428356205)1316212143(3392⨯⨯⨯⨯-⨯⨯=7.469>6.6356分 所以有99%的把握认为“吸烟与患慢性气管炎有关”.9分(2)证明 假设“吸烟与患慢性气管炎之间没有关系”,由于事件A ={χ2≥6.635}≈0.01,即A 为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有基础自测1%. 14分例2 一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有 缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:(1(2)如果y 与x 有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内? 解 (1)x =12.5,y =8.25,∑=41i iiy x=438,4x y =412.5,∑=412i i x =660,∑=412i i y =291,所以r =)4)(4(42412241241y yx xyx yx i ii ii ii --•-∑∑∑====)25.272291()625660(5.412438-⨯--=25.6565.25≈62.2550.25≈0.995 4.因为r >r 0.05,所以y 与x 有很强的线性相关关系.(2)yˆ=0.728 6x -0.857 1. (3)要使yˆ≤10⇒0.728 6x -0.857 1≤10, 所以x ≤14.901 3.所以机器的转速应控制在14.901 3转/秒以下.例3 下表是某年美国旧轿车价格的调查资料,今以x 表示轿车的使用年数,y 表示相应的年均价格,求y 关于x 的回归 方程y解作出散点图如图所示.可以发现,各点并不是基本处于一条直线附近,因此,y与x之间应是非线性相关关系.与已学函数图象比较,用yˆ=e a x bˆˆ 来刻画题中模型更为合理,令zˆ=ln yˆ,则zˆ=bˆx+aˆ,题可以用线性回归方程拟合.由表中数据可得r≈-0.996.|r|>r0.05.认为x与z之间具有线性相关关系,由表中数据得bˆ≈-0.298,aˆ≈8.165,所以zˆ=-0.298x+8.165,最后回代zˆ=ln yˆ,即yˆ=e-0.298x+8.165为所求.1.某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:(1抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?说明理由.解(1)随机抽查这个班的一名学生,有50种不同的抽查方法,由于积极参加班级工作的学生有18+6=24人,所以有24种不同的抽法,因此由古典概型的计算公式可得抽到积极参加班级工作的学生的概率是P1=5024=2512,又因为不太主动参加班级工作且学习积极性一般的学生有19人,所以抽到不太主动参加班级工作且学习积极性一般的学生的概率是P 2=5019.(2)由2χ统计量的计算公式得2χ=25252624)761918(502⨯⨯⨯⨯-⨯⨯≈11.538,由于11.538>10.828,所以可以有99.9%的把握认为“学生的学习积极性与对待班级工作的态度有关系”.2.某个体服装店经营某种服装,一周内获纯利y (元)与该周每天销售这种服装的件数x 之间的一组数据如下:已知∑=712i i x =280, ∑=712i i y =45 309, ∑=71i i i y x =3 487,此时r 0.05=0.754.(1)求x ,y ;(2)判断一周内获纯利润y 与该周每天销售件数x 之间是否线性相关,如果线性相关,求出回归直线方程.解 (1)x =71(3+4+5+6+7+8+9)=6,y =71 (66+69+73+81+89+90+91)≈79.86.(2)根据已知∑=712i i x =280, ∑=712i i y =45 309, ∑=71i i i y x =3 487,得相关系数 r =)86.79730945)(67280(86.7967487322⨯-⨯-⨯⨯-≈0.973.由于0.973>0.754,所以纯利润y 与每天销售件数x 之间具有显著线性相关关系. 利用已知数据可求得回归直线方程为 yˆ=4.746x +51.386. 3.某种书每册的成本费y (元)与印刷册数x (千册)有关,经统计得到数据如下:检验每册书的成本费y 与印刷册数的倒数x1之间是否具有线性相关关系,如有,求出y对x 的回归方程.解 首先作变量置换,令u =x1,题目所给数据变成如下表所示的10对数据:。