11111统计与统计案例
- 格式:doc
- 大小:221.26 KB
- 文档页数:4
统计与统计案例统计概述统计学是一门关于在数据中收集、准确描述、分析、解释和预测现象的科学和技术。
统计学不仅在学术研究中有应用,而且在商业、政治和政策制定中也具有重要作用。
统计学可以用来了解各种数据,并从中得出有关样本或总群体的。
统计学的原则和方法主要包括调查设计、数据描述、概率、假设检验和参数估计等。
其中,假设检验是根据样本数据推断总体特征的重要方法。
统计学的结果应该是客观、可验证的,并且可以用于系统决策。
统计案例(一)调查调研统计学最常见的应用之一是调查调研。
通过问卷调查、样本调查、群体访谈等方式,收集数据,从而更好地了解受访者的需求、看法和态度。
以下是一个调查调研的案例。
案例描述某地区政府正在确定针对失业人士的培训课程。
政府委托调查公司进行调查,以了解需要哪些课程。
调查结果将用于决策,以便提供实施这些培训计划的机构。
调查设计调查对象为失业者群体。
调查方式采用在线问卷的形式,问卷包括以下几个方面的问题:失业者的学历和技能水平、求职经历、兴趣、培训需求和意愿等。
数据收集和处理随机选中1000名失业者进行问卷调查。
数据收集后,统计调查结果,计算得出以下数据: - 60%的人表示需要技术培训 - 50%的人表示需要求职技巧培训 - 20%的人表示需要职业素养培训 - 10%的人表示需要创业培训分析和解读失业者的培训需求主要集中在技术培训和求职技巧培训上,政府可以在这些方面提供更多的培训机会。
与此同时,政府还需要按照实际情况开展其他培训项目,以更好地满足失业者的需求。
(二)产品质量控制统计学也可以应用于产品质量控制。
通过对生产过程中质量数据的监测和分析,可以实现产品质量的控制和优化。
以下是一个产品质量控制的案例。
案例描述某工厂生产塑料袋,需要通过质量控制确保产品达到标准。
为此,工厂制定了质量控制计划,包括每小时抽取5个样本、每个样本5个塑料袋,共记录10批次数据。
质量数据由于每个样本包含5个塑料袋,所以每批次共抽取了50个塑料袋。
第八章统计与统计案例第1节随机抽样最新考纲:1.理解随机抽样的必要性和重要性;2.会用简单随机抽样方法从总体中抽取样本; 3•了解分层抽样和系统抽样方法.会用随机抽样的基本方法解决一些简单的实际问题.1知识梳1.简单随机抽样(1)定义:设一个总体含有N个个体,从屮逐个不放冋地抽取n个个体作为样本5WN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.2.系统抽样的步骤假设要从容量为N的总体屮抽収容量为n的样本.(1)先将总体的N个个体编号.(2)确定分段间隔K,对编号进行分段,当号是整数时,取当号不是整数时,随机从总体中剔除余数,再取k=*(N为从总体屮剔除余数后的总数).(3)在第1段用简单随机抽样确定第一个个体编号/(/<«.(4)按照一定的规则抽取样本,通常是将I加上间隔k得到第2个个体编号吐再加k得到第3个个体编号(Z+2Q,依次进行下去,直到获取整个样本.3.分层抽样(1)定义:在抽样时,将总体分成互不交义的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)分层抽样的应用范围:当总体由渥异明显的儿个部分组成时,往往选用分层抽样.2题型分【例1】下列抽取样本的方式屈于简单随机抽样的个数为()①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿汕一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.A.0B. 1C. 2D. 3【例2】(2017*葫芦岛模拟)福利彩票“双色球”中红球的号码可以从01, 02, ()3,…,32, 33这33个二位号码屮选取,小明利用如图所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列和第10 列的数字开始从左到右依次选取两个数字,则第四个被选屮的红色球号码为()A.12B. 33C. 06D. 16【例3】(教材习题改编)老师在班级50名学生中,依次抽取学号为5,10,15,20,25,30,35,40,45,50的学生进行作业检查,这种抽样方法是()A.随机抽样B.分层抽样C.系统抽样D.以上都不是【例4】某地区有小学150所,中学75所,大学25所,现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取_____________ 所学校,中学中抽取________ 所学校.【例5】哈六中2016届有840名学生,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…, 84()随机编号,则抽取的42人中,编号落入区间[481,720]的人数为__________ .【例6](2017-西安质检)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为0, “2,力,贝9()A・P\=P2<P3 B. P2=P3<P I C. p\=py<P2 D. P\=P2=P3【变式(2017*大连二模)某单位员工按年龄分为A, B, C三组,其人数Z比为5: 4: 1,现用分层抽样的方法从总体中抽取一个容量为10的样本,已知C组中某个员工被抽到的概率是丄,则该单位员工总数9为()A.110B. 10C. 90D. 80【变式2? (2017-黄州区三模)某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1〜1000进行编号,现已知笫18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为()A.16B. 17C. 18D. 19【变式3? (2017-宣城二模)一支田径队共有运动员98人,其中女运动员42人,用分层抽样的方法抽取2一个样本,每名运动员被抽到的概率都是兰,则男运动员应抽取()7A.18 人B. 16 人C. 14 人D. 12 人3已课后作1.为了了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样2.从编号为1〜50的50枚最新研制的某种型号的导弹中随机抽収5枚來进行发射试验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A・ 5,10,15,20,25 B. 3,13,23,33,43 C. 1,2,3,4,5 D. 2,4,6,16,323.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为川的样木进行调查,其屮从丙车间的产品屮抽取了3件,贝山=()A.9B. 10C. 12D. 134.将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015, 则抽取的第35个编号为()A.700B. 669C. 695D. 6765.某防疫站对学生进行身体健康调查,欲釆用分层抽样的办法抽取样本.某中学共有学生2 000名,抽取了一个容量为200的样本,已知样本中女生比男生少6人,则该校共有女生()A.1030 人B. 97 人C. 950 人D. 970 人第2节用样本估计总体最新考纲:1•了解分布的意义与作用,能根据概率分布表画频率分布直方图、频率折线图、茎 叶图,体会它们各自的特点2理解样本数据标准差的意义和作用,会计算数据标准差3能从样 本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释4会用样本的频率分布 估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思 想,会用样本估计总体的思想解决一些简单的实际问题. 1.频率分布直方图⑴频率分布表的画法:笫二步:金组,通常对组内数值所在区I'可取左闭右开区间,最后一组取闭区I'可;2. 茎叶图统计屮还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的 数. 3. 样本的数字特征 数字特征定义 众数 在一组数据屮,出现次数竝的数据叫做这组数据的众数中位数 将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数 据的平均数)叫做这组数据的中位数.在频率分布直方图中,中位数左边和右边的直方图的面积相等平均数 样本数据的算术平均数,即;/+町••卄方差52=~[(X J — X )2 +(X2— X )2+...+(X n — X )2],其屮 S 为标准差2题型分题型一茎叶图【例1](必修3P70改编)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位 数和平均数分别是()第一步: 求极差,决定组数和组距,组距=极差组数; 第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图.横轴表示样木数据,纵轴表 一频率在该组内的频率.每个小矩形的面积表示样木落【例2】(2016-唐山一模)为迎接即将举行的集体跳绳比赛,高一年级对甲、乙两个代表队各进行了 6轮 测试,测试成绩(单位:次/分钟)如表: 轮次 —- 三 四 五 六 甲 7366 S2 72 63 76 乙83 75 62 69 75 6S(1) 补全茎叶图并指岀乙队测试成绩的屮位数和众数;(2) 试用统计学中的平均数、方差知识对甲乙两个代表队的测试成绩进行分析.【变式1】如图,茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组 数据的中位数为15,乙组数据的平均数为16.8,则兀,丿的值分别为()甲组乙组90 9 jr 21 5 v 8 7 42 4 A. 2,【变式2】(2015秋•宣城期末)甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干 次预赛成绩中随机抽取8次,记录如下:甲 8281 79 7S 95 S8 93 S4 乙92 95 80 75 83 80 90 S5(1) 用茎叶图表示这两组数据;(2) 现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你 认为选派哪位学生参加合适?请说明理由.A ・ 91.5 和 91.5B. 91.5 和 92 C ・ 91 和 91.5 D. 92 和 92D. 8,8题型二频率分布直方图【例1】(教材习题改编)某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40), [40,45), [45,50), [50,55), [55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有_________ 人.【例2] (2017-济南调研)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12, 13), [13, 14), [14, 15), [15, 16), [16, 17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为____________________ ・【变式1】(2017-东台市模拟)从高三年级随机抽取100名学生,将他们的某次考试数学成绩绘制成频率分布直方图.由图中数据可知成绩在[130, 140)内的学生人数为___________ .【变式2】(2016秋•威海期末)从某小学随机抽収100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高在[100, 110) , [110, 120) , [120, 130)三组内的学生中,用分层抽样的方法选取28人参加一项活动,则从身高在L120, 130)内的学生中选取的人数应为__________ .【例3] (2016-四川卷)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0, 0.5), [0.5, 1),……, [4, 4.5]分成9组,制成了如图所示的频率分布直方图.(2)设该市有30万居民,估汁全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.【变式3】(2017-灵丘县四模)为对考生的月考成绩进行分析,某地区随机抽查了10000名考生的成绩, 根据所得数据画了如下的样本频率分布直方图.(1)求成绩在[600, 650)的频率;(2)根据频率分布直方图算出样本数据的中位数;(3)为了分析成绩与班级、学校等方面的关系,必须按成绩再从这10000人中用分层抽样方法抽出20 人作进一步分析,则成绩在[550, 600)的这段应抽多少人?【例4】(2017-唐山二模)共亨单车的出现方便了人们的出行,深受我市居民的喜爱.为调查某校大学生对共享单车的使用情况,从该校8000名学生中按年级用分层抽样的方式随机抽取了100位同学进行调查,得到这1()0名同学每周使用共亭单车的时间(单位:小时)如表:使用时间 [0,21 (2,4] (4,6] (6,8] (8,10] 人数104025205使用(1) 已知该校大一学生由2400人,求抽取的100名学生屮大一学生人数; (2) 作出这些数据的频率分布直方图;(3) 估计该校大学生每周使用共亨单车的平均吋间;(同一组中的数据用该组区I'可的中点值作代表).【变式4] (2014-全国I 卷)从某企业生产的某种产品屮抽取100件,测量这些产品的一项质量指标值,由测 量结果得如下频数分布表:0.225 0.200 0.175 0.150 0.125 0.100 0.075 0.050 0.025频数62638228(1)(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规泄?【例5】(2017-肇庆三模)某市房产契税标准如下:购房总价(万)(0,200](200,400](400,+oo]税率1% 1.5%3%从该市某高档住宅小区,随机调查了一百户居民,获得了他们的购房总额数据,整理得到了如下的频率分布直方图:(1) 假设该小区已经出售了 2000套住房,估计该小区有多少套房子的总价在300万以上,说明理由.(2) 假设同组中的每个数据用该组区间的右端点值代替,估计该小区购房者缴纳契税的平均值.【变式5】(2016-北京卷)某市居民用水拟实行阶梯水价,每人月用水量中不超过⑷立方米的部分按4元/立 方米收费,超出⑷立方米的部分按10元/立方米收费.从该市随机调查了 10000位居民,获得了他们某月的 用水量数据,整理得到如下频率分布直方图:(1) 如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少 定为多少?(2) 假设同组中的每个数据用该组区间的右端点值代替•当⑷=3时,估计该市居民该月的人均水费.3课后作1. 重庆市2016年各月的平均气温(°C )数据的茎叶图如图,则这组数据的中位数是()购房总价(百万)频率123A. 19 B- 20 C. 21.5 D. 232.我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷, 抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A. 134 石B. 169 石C・ 338 石 D. 1365 石3.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40), [40,60), [60,80), [80,100].若低于60分的人数是15,则该班的学生人数是()频率组距0.020.0150.0100.005--- ----020 40 60 80 100 成绩屈A. 45B. 50C. 55D. 604.(2016-全国卷III)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图9-3-11中4点表示十月的平均最高气温约为15 °C, 8点表示四月的平均最低气温约为5 °C. 下面叙述不正确的是()5.(2015・广东)某城市100户居民的月平均用电量(单位:度),以L160, 180) , [180, 200) , [200, 220), 1220, 240) ,821A.各月的平均最低气温都在0 °C以上C.三月和十一月的平均最高气温基本相同B.七月的平均温差比一月的平均温差大D.平均最高气温高于20 °C的月份有5个一月•…•平均故低任温——平均最高气温[240, 260) , [260, 280) , [280, 300)分组的频率分布直方图如图.频率(1)求直方图中兀的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为,1220, 240) , 1240, 260) , [260, 280) , [280, 300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220, 240)的用户中应抽取多少户?第3节线性回归方程最新考纲:1.会做两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系2 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归系数公式不要求记忆)3了解回归分析的基本思想、方法及其简单应用.1.回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是散点图;统计量有相关系数与相关指数.(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系.2.线性回归方程(1)最小二乘法:使得样本数据的点到冋归直线的里离的蛋方型最小的方法叫做最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(七,八),(疋,),2),…,(心,%),其回归方A A A A工3 J)®") 1>必7石a _ _ A程为y=bx+a f则b = ---------- = --------- , a = y-bx .K'l1,方是冋归方程的斜率,a是在y/=! /=1轴上的截距.3・相关系数工(兀・-兀)(儿.-刃a・计算公式:厂=J ”V /=i /=ib・当Q0时,表明两个变量正相•关;当Y0时,表明两个变量负相关.厂的绝对值越接近于1,表明两个变量的线性相关性越强.厂的绝对值越接近于0,表明两个变量之间相关性越弱.通常大于0.75时,认为两个变量有很强的线性相关性.2)题型分题型一相关关系的判断【例】某公司2010〜2015年的年利润x (单位:百万元)与年广告支出y (单位:百万元)的统计资料如下表所示:【变式】对变量兀,y 有观测数据(益,刃(=1,2,…,10),得散点图⑴;对变量u, v 有观测数据(⑷,v/)(Z= 1,2,…,10),得散点图(2).由这两个散点图可以判断()图⑴ A. 变量兀与y 正相关, B. 变量兀与歹正相关, C. 变量x 与y 负相关, D. 变量兀与y 负相关, 题型二线性回归分析【例1】(2017・延边州模拟)如表提供了某厂节能降耗改造后在生产A 产品过程中记录的产量兀(吨)与 相应的生产能耗y (吨)的几组对应数据,根据表中提供的数据,求出y 关于兀的线性回归方程为$二0.7兀+0.35, 则下列结论错误的是()X3 4L6 y2.5t44.5A. 线性回归直线一定过点(4.5, 3.5)B. 产品的生产能耗与产量呈正相关C. r 的取值必定是3.15D ・A 产品每多生产1吨,则相应的生产能耗约增加0.7吨【变式1】(2017-南昌一模)设某中学的高中女生体重y (单位:焰)与身高兀(单位:an )具有线性相关 关系,根据一组样本数据(冷必)(匸1,2, 3,用最小二乘法近似得到回归直线方程为$ =0.85x-85.71, 则下列结论中不正确的是()A. y 与x 具有正线性相关关系根据统计资料,则( )A. 利润中位数是16,B. 利润中位数是17,C. 利润中位数是17,D. 利润小位数是18, x 与y 有正线性相关•关系 兀与y 有正线性相关关系x 与),有负线性相关关系 x 与有负线性相关关系0 1 23 4567 X 0 1 234567 u图⑵"与u 正相关 〃与v 负相•关 "与v 正相关 "与u 负相关B.回归直线过样本的中心点(x,v)C. 若该屮学某高屮女生身高增加lcm,则其体重约增加0.85kg D ・若该屮学某高屮女生身高为160cm,则可断定其体重必为50.29kg【例2】(2017-西青区模拟)为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家 庭,得到如下统计数据表:据上表得回归直线方程y = bx + a.其中b = 0.76, a = y-bx,据此估计,该社区一户收入为15万元家庭 年支出为()A. 11.4万元B. 11.8万元C. 12.0万元D. 12.2万元【变式2】(2017・成都四模)广告投入对商品的销售额有较大影响.某电商对连续5个年度的 广告费和销售额进行统计,得到统计数据如表(单位:万元):由表可得到回归方程为$ul0.2x + &,据此模型,预测广告费为10万元时的销售额约为( )题型三线性相关关系检验【例1】(2017-广西一模)在两个变量y 与兀的回归模型中,分别选择了四个不同的模型,它们的相关指 数R ?如下,其中拟合效果最好的为()A.模型①的相关指数为0.976B.模型②的相关指数为0.776C.模型③的相关指数为0.076 D.模型④的相关指数为0.351【例2】(2015春•祁县期中)某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:B. 108.8C. 111.2D. 118.2 A. 101.2求年推销金额y与工作年限兀之间的相关系数.【变式】(2017-泉州模拟)关于衡量两个变量y与兀之间线性相关关系的相关系数厂与相关指数R2*!',下列说法中正确的是()A.,•越大,两变量的线性相关性越强B. 2越大,两变量的线性相关性越强C. 7•的取值范围为(-00, +8)D. /的取值范围为[0, +00)题型四线性回归方程【例1】(2017-乐东县一模)某公司经营一批进价为每件4百元的商品,在市场调查时发现,此商品的销售单价兀(百元)与日销售量y (件)之间有如下关系:(1)求y关于兀的回归直线方程;(2)借助回归直线方程请你预测,销售单价为多少百元(精确到个位数)吋,日利润最大?【变式1】(2017-全国模拟)从某居民区随机抽取10个家庭,获得笫i个家庭的月收入兀•(单位:千元)10 10 10 10与月储蓄幵(单位:千元)的数据资料,算得》>产80,工必=20,工兀必=184,工坷2 =720./=! /=! /=1 /=!(1)求家庭的月储蓄y关于月收入x的线性回归方程y = bx^-a;(2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.【例2】(2017*甘肃一模)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(1)由折线图看出,可用线性回归模型拟合y与f的关系,请用相关系数加以说明;(2)建立y关于『的回归方程(系数精确到0.01),预测2017年我国生活垃圾无害化处理量.7 7 7 _参考数据:工必=9.32,工口・=40.17, 工(开一$)2 =0.55, "“.646./=1 /=! V /=1工(右-/)(牙-刃参考公式:相关系数厂=一「,回归方程y = a + bt^斜率和截距的最小二乘估计公式血a-门吃(y厂疔V /=1 :=1£©-门(必-刃 _ .分别为:b = —-- ----------- , a=y-bt.【例3] (2017-河南一模)为了对2016年某校中考成绩进行分析,在60分以上的全体同学中随机抽出8 位,他们的数学分数(已折算为百分制)从小到大排是60、65、70、75、80、85、90、95,物理分数从小到大排是72、77、80、84、88、90、93、95.(1)若规定85分以上为优秀,求这8位同学中恰有3位同学的数学和物理分数均为优秀的概率;(2)若这8位同学的数学、物理、化学分数事实上对应如下表:①用变量y与兀、z与x的相关系数说明物理与数学、化学与数学的相关程度;②求)',与兀、z与兀的线性回归方程(系数精确到0.01),当某同学的数学成绩为50分吋,估计英物理、化学两科的得分.X(旺7)(兀一y)X(兀一兀)(%一刃参考公式:相关系数z / ”.,b= —-——.£a・一;)吃(开-y)2刃习_x)2V /=1 /=l "T_ _ _ 8 _ 8 _ 8参考数据:X = 77.5 , y = 85 , z = 81 , -x)2 « 1050 , ^(>; -y)2«456 ,Z=1 /=1 Z=18 _ _ 8 _ _ _________________________________________________________________________ ___________________ ____________________工(X - - y)« 668, 工(石-匚)(召-亠755, Jl050 = 32.4, V456«21.4 , ^550«23.5 .Z=1 1=1【变式2] (2017-汕头一模)二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到如下数据:使用年数X34■67售价y2012S 6.4 4.43z=lnvJ3.00 2.48 2.08 1.86 1.48 1.10(1)rh折线图可以看岀,可以用线性回归模型拟合z与兀的关系,请用相关数加以说明;(2)求y关于x的回归方程并预测某辆A型号二手车当使用年数为9年时售价约为多少?(乙力小数点后保留两位有效数字).(3)基于成本的考虑,该型号二手车的售价不得低于7118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年?6 6 6 1~62~ r~6 ]~参考数据:工习”=187.4,=47.64, ^X/2=139, -y)2 = 13.96 , ^(z,--z)2 = 1.53 , /=1 /=1 i=l V /=1 V /=1lnl.46«0.38, ln0.7118« 0.34 .【例4] (2015高考新课标1,文19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y (单位:/)和年利润z (单位:千元)的影响,对近8年的宣传费无和年销售量= 出)数据作了初步处理,得到下面的散点图及一些统计量的值.520 •500 - •480 34 36 38 40 42 44 46 48 50 52 54 56 勺宜传优/千元X W8 _£ 3-兀)21=18 _ 工(Wj-W)2 i=l8 _ _ 工(兀-兀心-y)/=!8 _ _ 工(鸭―w)(X —y) /=146.656.3 6.8289.8 1.61469108.8表中W产肩,⑷二!工吟O /=!(1)根据散点图判断,y = a + bx与尸c + d長,哪一个适宜作为年销售量y关于年宣传费兀的回归,方程类型(给出判断即可,不必说明理由);(2)根据(I)的判断结果及表中数据,建立丿关于兀的冋归方程.附:对于一组数据(绚,气),他宀),……,其冋归线v = a + /3u的斜率和截距的最小二乘估计分别为: 620600580560540 二聽盜£射nY(W/ -2/)(V z -V)【变式3】(2017-衡水金卷一模)某种新产品投放市场一段时间后,经过调研获得了时间兀(天数)与销售单价歹(元)的一组数据,且做了一定的数据处理(如表),并作出了散点图(如 图).根据散点图判断,y = bx-^a, y = - + c 哪一个更适宜作价格关 2 根据判断结果和表中数据,建立y 关于x 的回归方程;3若该产品的日销售量g (x )(件)与时间x 的函数关系为g (Q =』+ 120 (xeNO ,求该产品投放市场笫几天的销售额最高?最高为多少元?-VV10 Z CvrD 1 2 3 /=1 10X 3厂乔尸 7=110 迟(X 厂壬)0厂亍) 7=110迟(W 厂祁)0厂丿) /—11.6337.80.S95.150.92-20.618.40叱・•表屮 (1)兀的冋归方程类型?(不必说明理由)于时间=123.1,附:回归直线的斜率和截距的最小二乘估计公式分别为:b =,选用数据: n艺(习-兀)(〉;•-y ) 匸1 £(兀-孑1=13课后作1. (2015-全国卷II )根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论屮不正确的是()A. 逐年比较,2008年减少二氧化硫排放量的效果最显著B. 2007年我国治理二氧化硫排放显现成效C. 2006年以来我国二氧化硫年排放塑呈减少趋势D. 2006年以来我国二氧化硫年排放量与年份正相关 2. (2017•贵阳检测)若8名学生的身高和体重数据如下表:编号 1 2 3 4 5 6 7 8 身高/cm 165 165157 170 175 165 155 170 体重/kg48575464614359第3名学生的体重漏填,但线性回归方程是j-0.849x-85.712,则第3名学生的体重估计为 ______________ kg.3. (2017-合肥三模)网络购物已经成为一种时尚,电商们为了提升知名度,加大了在媒体上的广告投入.经 统计,近五年某电商在媒体上的广告投入费用兀(亿元)与当年度该电商的销售收入y (亿元)的数据如下 表:):年份 2012 年 2013 年 2014 2015 2016 广告投入x 0.8 0.9 1 1.1 1.2 销售收入:1623252630(1) 求y 关于X 的回归方程;(2) 2017年度该电商准备投入广告费1.5亿元,利用(I )中的回归方程,预测该电商2017年的销售收A.1 9002004^2005^ 2006^n2 700 2600 2500 2400 2300 2 200 2100 2 0004. (2017*包头一模)如图是某企业2010年至2016年污水净化量(单位:吨)的折线图.注:年份代码1〜7分别对应年份2010〜2016.(1) 由折线图看岀,可用线性回归模型拟合y 和r 的关系,请用相关系数加以说明;(2) 建立y 关于r 的回归方程,预测2017年该企业污水净化量;7 QV14 » 3.74 , ~ = — •/=14工(右一0(开一刃 Q---------------- 仮映冋归效果的公式为工(51=1A・(3) 请用数据说明回归方程预报的效杲._ 7 _附注:参考数据:$ = 54,工(“-;)(”•-亍) = 21, 为4 一/)(必一刃参考公式:相关系数厂二心1&-b 2£a-y)212 3 45 6 7 年份代号(。
统计与统计案例第一部分:统计的基本概念和原理统计是一门研究收集、整理、分析和解释数据的学科。
它在各个领域都有广泛的应用,包括科学研究、社会调查、市场分析等等。
统计的基本概念和原理对于理解和应用统计方法非常重要。
1.1 统计的定义统计是通过收集、整理、分析和解释数据来推断总体特征和规律的学科。
它可以帮助我们认识事物的本质和变化规律,从而进行决策和预测。
1.2 数据的类型在统计学中,数据可以分为两大类:定性数据和定量数据。
定性数据是描述事物性质、特征和类别的数据,例如性别、政治取向、产品类型等等。
定性数据常用于描述和推断总体的特征和规律。
定量数据是具有数量意义的数据,可以进行数值计算和比较。
例如身高、体重、销售额等等。
定量数据常用于测量和比较事物的数量差异和变化趋势。
1.3 统计的基本原理统计的基本原理包括随机性、规模效应和抽样误差。
•随机性指的是在统计过程中,数据的选择和变异都是有机会发生的。
通过随机抽取和处理数据,可以将个体特征和规律推广到总体上。
•规模效应指的是样本容量对统计推断的影响。
样本容量越大,假设检验的准确性也越高,结果的可靠性也就越高。
•抽样误差是由于从总体中选取有限的样本而引入的估计误差。
通过使用合适的抽样方法和增加样本容量,可以减小抽样误差。
第二部分:统计案例分析2.1 假设检验假设检验是统计推断的一种方法,用于检验关于总体参数的假设。
主要包括以下几个步骤:1.建立原假设(H0)和备择假设(H1);2.选择适当的统计检验方法;3.根据样本数据计算统计量的值;4.根据显著性水平和自由度确定拒绝域;5.比较统计量的值与拒绝域,得出结论。
假设检验的目的是通过样本数据对总体参数进行推断,判断某种差异是否具有统计学意义。
2.2 方差分析方差分析是一种用于比较多个总体均值差异的统计方法。
它主要包括单因素方差分析和多因素方差分析两种类型。
单因素方差分析用于比较一个因素(如不同治疗方法)对一个响应变量(如疾病治愈率)的影响。
精品文档精品文档统计与统计案例第一节随机抽样1下面的抽样方法是简单随机抽样的是()A 在某年明信片销售活动中,规定每1万张为一个开奖组,通过随机抽取的方式确定号码的后四位为 279的为三等奖B某车间包装一种产品,在自动包装的传送带上,每隔3分钟抽一包产品,称其重量是否合格C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D 用抽签方法从1件产品中选取3件进行质量检验答案D2总体由编号为1 , 2,…,19,2的2个个体组成.利用下面的随机数表选取 5个个体,选取方法是从随机数表第 1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()78166572826314724369972819832492344935823623486969387481A.8B. 7C. 2D. 1答案D3为了解1 名学生的学习情况,采用系统抽样的方法,从中抽取容量为4的样本,贝吩段的间隔为()A.A. 5B . 4C . 25D . 2答案C4某单位有844某单位有84名职工,现采用系统抽样方法抽取42人做问卷调查,将84人按1, 2,…,84随机编号,则抽取的42人中,编号落入区间[481,72]的人数为84随机编号,则抽取的11 B. 12 C. 13 D. 14答案B5在一次马拉松比赛中,35名运动员的成绩(单位分钟)的茎叶图如图所示5在一次马拉松比赛中,若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取 7人,则其中成若将运动员按成绩由好到差编为绩在区间[139,151]上的运动员人数是答案46某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在类别人数老年教师9中年教师1 8青年教师1 6合计4 3抽取的样本中,青年教师有32抽取的样本中,青年教师有32人,则该样本中的老年教师人数为A . 9 B. 1C. 18D. 3答案C7某校高一年级有9名学生,其中女生 47某校高一年级有学生中抽取一个容量为45的样本,则应抽取的男生人数为答案58某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3 : 5 : 7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=()A. 54B. 9C. 45 D . 126答案B9某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位人).篮球组书画组乐器组冋453a高二1512学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取 3人,结果篮球组被抽出12人,则a的值为.答案31甲、乙两套设备生产的同类型产品共 4 8件,采用分层抽样的方法从中抽取一个容量为8的样本进行质量检测.若样本中有5件产品由甲设备生产,则乙设备生产的产品总数为件.答案18某市有A、B、C三所学校,共有高三文科学生 1 5人,且A、B、C三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为12的样本,进行成绩分析,则应从 B校学生中抽取人.答案4第二节用样本估计总体根据下面给出的24年至213年我国二氧化硫年排放量(单位万吨)柱形图,以下结论中不正确的是()AA .逐年比较,27年我国治理二氧化硫排放显现成效26年以来我国二氧化硫年排放量呈减少趋势D . 26年以来我国二氧化硫年排放量与年份正相关答案D13某电子商务公司对1 名网络购物者214年度的消费情况进行统计,发现消费金额(单位万元)都在区间[.3,.9]内,其频率分布直方图如图所示.TOC \o "1-5" \h \z 直方图中的 a=;在这些购物者中,消费金额在区间[.5,.9]内的购物者的人数为.答案①3 ②614某地政府调查了工薪阶层 1 人的月工资收入,并根据调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对月工资收入的满意程度,要用分层抽样的方法从调查的 1人中抽出1人做电话询访,则(3,35](百元)月工资收入段应抽出人.答案1515某学校随机抽取2个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为 5将数据分组成[,5),[5,1),…,[3,35) , [35,4]时,所作的频率分布直方图是()TOC \o "1-5" \h \z 7 317 6 4 137 5 5 4 3 2H 5 3 d答案A16某市为了考核甲、乙两部门的工作情况,随机访问了5位市民根据这5位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下甲绑门乙部门979766533211555514133321 6&552 61222594481 22456777891L23468BL 23期 51146fiQ分别估计该市的市民对甲、乙两部门评分的中位数;分别估计该市的市民对甲、乙两部门的评分高于9的概率;根据茎叶图分析该市的市民对甲、乙两部门的评价.答案①由所给茎叶图知,5位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66壬68=67,所以该市的市民对乙部门评分的中位数的估计值是 6②由所给茎叶图知,5 85位市民对甲、乙部门的评分高于9的比率分别为5",5=.16,故该市的市民对甲、乙部门的评分高于9的概率的估计值分别为.1, .1由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.17某城市1户居民的月平均用电量 (单位:度),以[16,18) ,[18,2) ,[2,22) ,[22,24), [24,26), [26,28) , [28,3]分组的频率分布直方图如图.⑵求月平均用电量的众数和中位数;在月平均用电量为[22,24) , [24,26), [26,28) , [28,3]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在 [22,24)的用户中应抽取多少户?答案(1)由(.2 + .9 5 + .11 + .12 5 + x+ .5 + .2 5) X 2=1 得 x=.7 5, 直方图中x 的值为.7(2)月平均用电量的众数是22(2)月平均用电量的众数是22+242=23./ (.2 + .9 5 + .11)X 2=.45V .5,月平均用电量的中位数在[22,24)内,设中位数为 a,则(.2 + .9 5 + .11)X 2+ .12 5 X (a - 22)=.5,解得 a=224,即中位数为 22(3)月平均用电量在[22,24)的用户有.12 5 X 2X 1=25(户),同理可求月平均用电量为[24,26) , [26,28) , [28,3)的用户分别有 15户、1户、5户,故抽取比例为11=125+ 15+ 1+ 5=51从月平均用电量在[22,24)的用户中应抽取25X;=5(户).51重庆市213年各月的平均气温(C )数据的茎叶图如下图,则这组数据的中位数是()L 2 52 ()L 2 52 ()A.19B. 2C. 25D. 23答案B14时的19为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这514时的气温数据(气温数据(单位:C )制成如图所示的茎叶图考虑以下结论:甲乙9 8 628 91 13L 2①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.A .①③B .①④ C.②③ D .②④答案B2.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均环数73887方差s25624从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是()A .甲B .乙C .丙D .丁答案C第三节变量间的相关关系、统计案例TOC \o "1-5" \h \z 1判断下列结论的正误.(正确的打“V”,错误的打“X”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系. ()(2)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示.()(3)通过回归方程y=bx+a可以估计和观测变量的取值和变化趋势.()(4)任何一组数据都对应着一个回归直线方程. ()(5)事件X, Y关系越密切,则由观测数据计算得到的 K2的观测值越大.()答案(1)X (2) V (3)V ⑷ X (5) V观察下列各图:x134y2387其中两个变量x, y其中两个变量x, y具有相关关系的图是(A .①②B .①④ C.③④ D .②③解析选C由散点图知③④具有相关关系.已知x, y的取值如下表,从散点图可以看出则 a=()y与x线性相关,且回归方程为y=.95x+ a,A.25B. 6C. 2D.解析选B 由已知得x=2, y=5,因为回归方程经过点(x , y ),所以a=5 —.95 X 2=4若回归直线方程为y=2— 5x,则变量x增加一个单位,y()A .平均增加5个单位 B.平均增加2个单位C.平均减少5个单位D.平均减少2个单位解析选C 因为回归直线方程为y=2— 5x,所以b=— 5,则变量x增加一个单位, y平均减少5个单位.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A .若K2的观测值为k=635,我们有99%的把握认为吸烟与患肺病有关系,那么在1个吸烟的人中必有 99人患有肺病B .从独立性检验可知,有 99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病C.若从统计量中求出有 95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误以上三种说法都不正确解析选C 根据独立性检验的思想知 C项正确.6下列四个散点图中,变量 x与y之间具有负的线性相关关系的是()rUy* ■/■I-]....,TB 丘C'D 1答案D7为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用回归直线方程y=bx+ a近似地刻画其相关B 线性相关关系较强,CB 线性相关关系较强,C.线性相关关系较强,b的值为.83b的值为一.87D .线性相关关系较弱,无研究价值答案B已知变量x和y满足关系y=— .1x+ 1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关答案C某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份262821212214需求量(万吨)236246257276286(i)利用所给数据求年需求量与年份之间的回归直线方程 y=bx+ a;⑵利用⑴中所求出的回归直线方程预测该地216年的粮食需求量.解(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:年份—21—4—224需求量—257—21—111929对预处理后的数据,容易算得,x=, y=2 ,bb=— 4 X — 21 + — 2 X — 11 + 2X 19+ 4 X 29 — 5 X X 2b=— 4 2+ — 2 2+ 22+ 42 — 5 X 2264264-=5A — A —a=y — b x=由上述计算结果,知所求回归直线方程为y— 257=b(x — 21) + a=5(x — 21) + 2,即 b=5(x— 21) + 262(*)⑵利用回归直线方程(*),可预测 216年的粮食需求量为5(216 — 21) + 26.2=5X 6+ 26.2=292(万吨).某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在4分以下的学生后,共有男生3名,女生2名现采用分层抽样的方法,从中抽取了1名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下所示频数分布表 .分数段[4,5)[5,6)[6,7)[7,8)[8,9)[9,1)男39181569女6451132(1)估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果看,数学成绩与性别是否有关;(2)规定8分以上为优分(含8分),请你根据已知条件作出2X 2列联表,并判断是否有9%以上的把握认为“数学成绩与性别有关”优分非优分总计男生女生总计1附表及公式P(K2> k).1.5.1.1k768416351.828宀 nad — be2a+ b c+ d a+ e b+ d[听前试做](1) x 男=45X .5 + 55X .15 + 65 X .3+ 75 X .25 + 85X .1 + 95X .15= 75,x 女=45 X .15+ 55 X .1 + 65 X .125 + 75X .25 + 85 X .325+ 95 X .5=75,从男、女生各自的平均分来看,并不能判断数学成绩与性别有关.(2)由频数分布表可知在抽取的 1名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得2 X 2列联表如下优分非优分总计男生15456女生15254总计3712 1 X 15X 25- 15X 45 2可得K2=疋79,6X 4 X 3X 7因为79<76,所以没有9%以上的把握认为“数学成绩与性别有关。
上饶中学高二数学寒假作业--统计(理科潜能班)
1、某单位有老年人28 人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36样本,则老年人、中年人、青年人分别各抽取的人数是( )
A 、6,12,18
B 、7,11,19
C 、6,13,17
D 、7,12,17 2、甲、乙两位同学都参加了由学校举办的篮球比赛,它们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲、乙两同学在这次篮球比赛活动中,发挥得更稳定的是( )
A 、甲
B 、乙
C 、甲、乙相同
D 、不能确定
3.在1000个有机会中奖的号码(编号为000-999)中,在公证部门监督下按照随机抽取的方法确定后两位数为的号码为中奖号码,该抽样运用的抽样方法是 ( ) A .简单随机抽样 B .系统抽样 C . 分层抽样 D .以上均不对
4.某人5次上班途中所花的时间(单位:分钟)分别为x,y ,10,11,9,已知这组数据的平均数为10,方差为2,则y
x -的值为( )
A .1
B .2
C .3
D .4
5.为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,下列正确的是( )
A 1l 与2l 一定平行
B 1l 与2l 相交于点),(y x
C 1l 与2l 重合
D 无法判断1l 和2l 是否相交 6、对于散点图下列说法中正确一个是( ) (A )通过散点图一定可以看出变量之间的变化规律 (B )通过散点图一定不可以看出变量之间的变化规律 (C )通过散点图可以看出正相关与负相关有明显区别 (D )通过散点图看不出正相关与负相关有什么区别 7.在回归直线方程 y a bx =+中,回归系数b 表示( )
A.当0x =时,y 的平均值 B.x 变动一个单位时,y 的实际变动量 C.y 变动一个单位时,x 的平均变动量 D.x 变动一个单位时,y 的平均变动量 8.下列结论正确的是( )
①函数关系是一种确定性关系; ②相关关系是一种非确定性关系 ③回归分析是对具有函数关系的两个变量进行统计分析的一种方法 ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
A. ①② B. ①②③ C. ①②④ D. ①②③④
9.在研究打酣与患心脏病之间的关系中,通过收集数据、整理分析数据得“打酣与患心脏病有关”的结论,并且有99%以上的把握认为这个结论是成立的。
下列说法中正确的是( )
A.100个心脏病患者中至少有99人打酣
B.1个人患心脏病,那么这个人有99%的概率打酣
C.在100个心脏病患者中一定有打酣的人
D.在100个心脏病患者中可能一个打酣的人都没有
10.经过对2
K的统计量的研究,得到了若干个临界值,当2 3.841
K>时,我们()A.有95%的把握认为A与B有关B.有99%的把握认为A与B有关
C.没有充分理由说明事件A与B有关系D.有97.5%的把握认为A与B有关
11、一个容量为20的样本数据,分组后,组距与频数如下:(]
20,30,
10,20,2;(] 3;(]
60,70,2。
则样本在区间[)
50,+∞
40,50,5;(]
50,60,4 ;(]
30,40,4;(]
上的频率为_______。
12、有一个简单的随机样本:10, 12, 9, 14, 13,则样本平均数x=______ ,样本方差2s=______ 。
13. 一个总体中的80个个体编号为0,l,2, (79)
并依次将其分为8个组,组号为0,1,…,7,要用(错位)
系统抽样的方法抽取一个容量为8的样本.即规定先在第0
组随机抽取一个号码,记为i,依次错位地得到后面各组的
号码,即第k组中抽取个位数为i+k(当i+k<10)或i+k
-10(当i+k≥10)的号码.在i=6时,所抽到的8个号码
是.
14.已知回归直线方程 y bx a
=+,其中a=且样本点中
心为(12)
,,则回归直线方程为________
15.在对某小学的学生进行吃零食的调查中,得到如下表数据:
吃零食不吃零食合计男学生25 25 50
女学生10 40 50
合计35 65 100
根据上述数据分析,我们得出的2
K=________。
16.甲、乙两位学生参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲82 81 79 78 95 88 93 84
乙92 95 80 75 83 80 90 85
(Ⅰ)用茎叶图表示这两组数据。
(Ⅱ)现要从中选派一人参加数学竞赛,从统计学的角度)考虑,你认为选派哪位学生参加合适?请说明理由.
17.某种产品的广告费用支出x与销售额之间有如下的对应数据:
x 2 4 5 6 8
y30 40 60 50 70 (1)画出散点图;(2)求回归直线方程;(3)据此估计广告费用为10销售收入y的值。
18、某班有50名学生,在学校组织的一次数学质量抽测中,如果按照抽测成绩的分数段[60,65),[65,70),…[95,100) 进行分组,得到的分布情况如图所示.求:
(1)该班抽测成绩在[70,85)之间的人数; (2)该班抽测成绩不低于85分的人数占全班总人数的百分比。
(3)画出频率分布直方图。
19.在研究色盲与性别的关系调查中,调查了男性480人,其中有38人患色盲,调查的520个女性中6人患色盲,(1)根据以上的数据建立一个2*2的列联表; (2)若认为“性别与患色盲有关系”,则出错的概率会是多少
5
10 15
20 成绩
人数 60 65 70 75 80 85 90 95 100。