10巩固练习_《统计案例》全章复习与巩固_不分层(1)
- 格式:pdf
- 大小:208.72 KB
- 文档页数:7
专题10北师大版(2019)第六章统计知识点与基础巩固题——寒假作业10(原卷版)知识点:方法一:简单随机抽样;1、基本原理:根据研究目的选定总体,首先对总体中所有的观察单位编号,遵循随机原则,采用不放回抽取方法,从总体中随机抽取一定数量观察单位组成样本。
2、具体做法:①随机数字法;②抽签法;3、优缺点分析:优点:基本原理比较简单;当总体容量不大时比较方便;抽样误差的计算较方便;缺点:对所有观察单位编号,当数量大时,有难度;方法二:系统抽样;1、基本原理:先将总体的观察单位按某顺序号等分成n个部分再从第一部分随机抽第k号观察单位,依次用相等间隔,机械地从每一部分各抽取一个观察单位组成样本;2、优缺点分析:优点:抽样方法简便,特别是容量比较大的时候;易得到一个按比例分配的样本,抽样误差较小;缺点:仍需对每个观察单位编号;当观察单位按顺序有周期趋势或单调性趋势时,产生明显偏性;方法三:分层抽样;1、基本原理:先将总体按某种特征分成若干层,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。
2、具体做法:第一步:计算每一层个体数与总体容量的比值;第二步:用样本容量分别乘以每一层的比值,得出每层应抽取的个体数;第三步:用简单随机抽样的方法产生样本;3、优缺点分析:优点:在一定程度上控制了抽样误差,尤其是最优分配法;缺点:总体必须要能分成差别比较大的几层时才能用,局限性比较大;总结:以上三种抽样方法的共同特征是每个个体被抽中的可能性相同;知识点五:常用的几个统计学图表;图表一:频率分布直方图与频率分布折线图;1、说明几个基本概念:(1)频数:符合某一条件的个体个数;(2)频率:频率=频数总数;(在必要情况下,可以近视的看作概率;所有组的频率之和是1;)2、认识频率分布直方图:试卷第2页,总9页(1) 横标是分组的情况;(2) 纵标不是频率,而是频率/组距;小方框的面积才是频率;所有的面积和为1;3、 画频率分布直方图:第一步:求极差;第二步:分组,确定组距;第三步:列频率分布表;第四步:作图;4、 画频率分布折线图:将频率分布直方图中每个方框的顶边的中点用直线连起来形成的折线图;5、 利用频率分布直方图估计样本的统计学数字特征量:(1)中位数:取图中方框面积和达到12时的横坐标; (2) 众数:取最高的那个方框的中点横坐标;(3) 平均数:1()()n k k k E x xP x x ==•=∑;其中k x 表示第k 组的中点横坐标,()k P x x =表示第k 组的频率;(4) 方差:21()[()]n k k D x xE x ==-∑;图表二:茎叶图;定义:若数据为整数,一般用中间的数表示个位数以上的部分,两边的数表示个位数字;若数据是小数,一般用中间的数表示整数部分,两边的数表示小数部分形成的图表;一、单选题1.在“我爱你,中国”为主题的演讲比赛中,七位评委对甲参赛选手的评分如图茎叶图所示,去掉一个最高分和一个最低分,所剩数据的方差为()A.65B.75C.85D.952.有4个大小、形状相同的小球,装在一个不透明的袋子中,小球上分别标有数字1,2,3,4.现每次有放回地从中随机取出一个小球,直到标有偶数的球都取到过就停止.小明用随机模拟的方法估计恰好在第4次停止摸球的概率,利用计算机软件产生随机数,每1组中有4个数字,分别表示每次摸球的结果,经随机模拟产生了以下21组随机数:1314 1234 2333 1224 3322 1413 3124 4321 234124131224 2143 4312 2412 1413 4331 2234 4422 32414331 4234,由此可以估计恰好在第4次停止摸球的概率为()A.23B.13C.27D.5213.2020年10月1日是中秋节和国庆节双节同庆,很多人外出旅行或回家探亲,因此交通比较拥堵.某交通部门为了解从A城到B城实际通行所需时间,随机抽取了n台车辆进行统计,结果显示这些车辆的通行时间(单位:分钟)都在[30,55]内,按通行时间分为[30,35),[35,40),[40,45),[45,50),[50,55]五组,频率分布直方图如图所示,其中通行时间在[50,55]内的车辆有125台,则通行时间在[45,50)内的车辆台数是()A.450 B.325 C.470 D.5004.已知高一(1)班有学生45人,高一(2)班有50人,高一(3)班有55人,现在要用分层抽样的方法从这三个班中抽30人参加学校“遵纪守法好公民”知识测评,则高一(2)班被抽出的人数为()试卷第4页,总9页A .10B .12C .13D .155.甲、乙、丙、丁四人参加国际奥林匹克数学竞赛选拔赛,四人的平均成绩和方差如表:从这四人中选择一人参加国际奥林匹克数学竞赛,最佳人选是 ( )A .甲B .乙C .丙D .丁6.下列问题中,最适合用简单随机抽样方法抽样的是( )A .某报告厅有32排座位,每排有40个座位,座位号是140~,有一次报告厅坐满了观众,报告会结束以后听取观众的意见,要留下32名观众进行座谈B .从十台冰箱中抽取3台进行质量检验C .某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人.教育部门为了解大家对学校机构改革的意见,要从中抽取容量为20的样本D .某乡农田有山地8000亩,丘陵12000亩,平地24000亩,洼地4000亩,现抽取农田480亩估计全乡农田平均产量7.在30名运动员和6名教练员中用分层抽样的方法共抽取n 人参加新闻发布会,若抽取的n 人中教练员只有1人,则n =( )A .5B .6C .7D .88.某次歌唱比赛中,7位评委为某选手打出的分数分别为83,91,91,94,94,95,96,去掉一个最高分和一个最低分后,所剩数据的平均数为( )A .94B .93C .92D .91 9.如果数据12,,,n x x x 的平均数为x ,方差为2s ,则1231,31,,31n x x x ---的平均数和方差分别为( )A .2,x sB .231,x s -C .231,3x s -D .231,9x s - 10.2019年第十三届女排世界杯共12支队伍参加,中国女排不负众望荣膺十冠王.将12支队伍的积分制成茎叶图如图所示,则这组数据的中位数和平均数分别为( )A .17.5和17B .17.5和16C .17和16.5D .17.5和16.511.已知样本9,10,11,x,y的平均数是10,方差是2,则xy =( )A.100 B.102 C.98 D.9612.某单位200名职工的年龄分布情况如图所示,现要从中抽取25名职工进行问卷调查,若采用分层抽样方法,则40~50岁年龄段应抽取的人数是()A.7B.8C.9D.10二、填空题13.在“互联网+”时代,国家积极推动信息化技术与传统教学方式的深度融合,实现线上、线下融合式教学模式变革.某校高一、高二和高三学生人数如图所示.采用分层抽样的方法调查融合式教学模式的实施情况,在抽取样本中,高一学生有16人,则该样本__________.中的高三学生人数为557 430 774 044 227 884 260 433 460 952280 797 065 774 572 565 765 929 976 860719 138 675 413 581 824 761 554 559 552274 237 865 348 559 064 729 657 693 61015.某组统计数据的茎叶图如图所示,则这组数据的中位数是________ .试卷第6页,总9页16.已知样本123,,,,n x x x x 方差21s =,则样本12321,21,21,,21n x x x x ++++的方差为_______.三、解答题 17.某学校现有学生3000人,为了解学生的体质健康情况,对学生进行了体质测评,得分分布在[50,100]之间,按[)50,60,[)60,70,[)70,80,[)80,90,[]90,100分组,得到的频率分布直方图如图所示:(1)求a 的值;(2)估计该校学生体质测评分数在[)70,90的人数.18.某良种培育基地正在培育一种小麦新品种A .将其与原有的一个优良品种B 进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A :357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B :363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)作出茎叶图;(2)通过观察茎叶图,对品种A 与B 的亩产量及其稳定性进行比较,写出统计结论. 19.从一批产品中随机抽取10000件测量其内径,将测得数据进行统计整理后得到如下图所示的频率分布直方图.(Ⅰ)求这10000件产品中,内径在[)25,30内的产品数量;(Ⅱ)试估计这批产品内径的中位数;(Ⅲ)直接比较这批产品内径的平均数x 与30(单位毫米)的大小关系,不必说明理由.20.如图是总体的一个样本频率分布直方图,且在[)15,18内频数为16.(1)求样本容量;(2)若在[)12,15内的小矩形面积0.06,求在[)12,15内的频数;(3)在(2)的条件下,求样本在)18,33⎡⎣内的频率.21.某校为了解毕业班学业水平考试学生的数学考试情况,抽取了该校100名学生的数学成绩,将所有数据整理后,画出了样频率分布直方图(所图所示),若第1组、第9组的频率各为x .(1)求x的值,并估计这次学业水平考试数学成绩的众数;(2)若全校有1500名学生参加了此次考试,估计成绩在[80,100)分内的人数. 22.某学校组织高一、高二年级学生进行了“纪念建国70周年”的知识竞赛.从这两个年级各随机抽取了40名学生,对其成绩进行分析,得到了高一年级成绩的频率分布直方图.和高二年级成绩的频数分布表成绩分组频数[)75,802[)80,856[)85,9016[)90,9514[)95,1002(1)若成绩不低于80分为“达标”,估计高一年级知识竞赛的达标率;95,100的学生中随机选取2名学生,代表学校外出(2)在抽取的学生中,从成绩为[]试卷第8页,总9页参加比赛,求这2名学生来自于同一年级的概率.。
答案2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。
2.82.9 (L U 。
(2)17.21=s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
2019-2020学年高一数学课堂巩固:《统计》全章复习与巩固1.一个容量为n 的样本,分成若干组,已知某数的频数和频率分别为40、0.125,则n 的值为( )A.640B.320C.240D.1602. 一个单位有500名职工,其中不到35岁的有125人,35-49岁的有280人,50岁以上的有95人,要从中抽取一个容量为100的样本,较为恰当的抽样方法是( )A.简单随机抽样B.系统抽样C.分层抽样D.以上三种均可3. 从N 个编号中抽取n 个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为( )A .n N B .n C .⎥⎦⎤⎢⎣⎡n N D.1+⎥⎦⎤⎢⎣⎡n N 4.下列说法错误的是 ( )A .在统计里,把所需考察对象的全体叫做总体B .一组数据的平均数一定大于这组数据中的每个数据C .平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D .一组数据的方差越大,说明这组数据的波动越大5.要从已编号(160)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( )A .5,10,15,20,25,30B .3,13,23,33,43,53C .1,2,3,4,5,6D .2,4,8,16,32,486. 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为()A.0.6 hB.0.9 hC.1.0 hD.1.5 h7.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……;第六组,成绩大于等于18秒且小于等于19秒.下图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为()A.0.9,35 B.0.9,45 C.0.1,35 D.0.1,45 8.根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图(如图).从图中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是()A.48米B.49米C.50米D.51米9.用系统抽样法要从160名学生抽取容量为20的样本,将160名学生从1~160编号.按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组应抽出的号码为126,则第一组中抽签方法确定的号码是________.10.从一堆苹果中任取了20只,并得到它们的质量(单位:克)数据分布表如下:则这堆苹果中,质量不小于...120克的苹果数约占苹果总数的%.11.某校有学生2000人,其中高三学生500人,为了解学生的身体素质情况,采用按年级分层抽样的方法,从该校学生中抽取一个200人的样本,则样本中高三学生的人数为.12.甲,乙两人在相同条件下练习射击,每人打5发子弹,命中环数如下则两人射击成绩的稳定程度是__________________。
第十章 统计、统计案例第一节 随机抽样强化训练当堂巩固1.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是( )A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对答案:C2.某校有高一学生300人,高二学生270人,高三学生210人,现教育局督导组欲用分层抽样的方法抽取26名学生进行问卷调查,则下列判断正确的是( )A.高一学生被抽到的概率最大B.高三学生被抽到的概率最大C.高三学生被抽到的概率最小D.每位学生被抽到的概率相等答案:D3.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在抽取20人进行某项调查,若采用分层抽样,则各年龄段应抽人数分别是( )A.7,4,6B.9,5,6C.6,4,9D.4,5,9答案:B解析:各年龄段所抽人数分别为20459100⨯=,20100⨯20255306100=,⨯=. 4.要检查一个工厂产品的合格率,从1 000件产品中抽出50件进行检查,检查者在其中随意取了50件,这种抽法为 .答案:简单随机抽样5.某装订厂平均每小时大约装订图书362册,要求检验员每小时抽取40册图书,检查其质量状况.请你设计一个调查方案.解:用系统抽样抽取,具体步骤如下(1)分段:362/40商是9余数为2,抽样距为9;(2)先用简单随机抽样从这些书中抽取2册书不检验;(3)将剩下的书编号:0,1, (359)(4)从第一组(编号为0,1,…,8)书中按照简单随机抽样的方法抽取一册书,比如其编号为k;(5)顺序地抽取编号为下面数字的书:k+9(139)n n ≤≤,总共得到40个样本.课后作业巩固提升见课后作业B题组一 简单随机抽样1.已知总体容量为106,若用随机数表法抽取一个容量为10的样本.下面对总体的编号正确的是 ( )A.1,2,…,106B.0,1,…,105C.00,01,…,105D.000,001,…,105答案:D题组二 系统抽样和分层抽样2.要完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;②从某中学的15名艺术特长生中选出3人调查学习负担情况.宜采用的抽样方法依次为( )A.①简单随机抽样法,②系统抽样法B.①分层抽样法,②简单随机抽样法C.①系统抽样法,②分层抽样法D.①②都用分层抽样法答案:B解析:①中总体由差异明显的几部分构成,宜采用分层抽样法,②中总体中的个体数较少,宜采用简单随机抽样法.3.将参加夏令营的600名学生编号为:001,002,…,600,采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区.三个营区被抽中的人数依次为( )A.26,16,8B.25,17,8C.25,16,9D.24,17,9答案:B解析:根据系统抽样,将600名学生分成50组,每组12人,因3002512=,故在第Ⅰ营区抽中25人,从301到492含有1921612=组,495为第25+16+1=42组中第三个,故第Ⅱ营区抽取17人,故三个营区抽取的人数依次为25,17,8.4.某公司有职员150人,中级管理人员40人,高级管理人员10人,要从这200人中抽取40人进行身体检查,如果采用分层抽样的方法,则职员、中级管理人员、高级管理人员各抽取的人数为( )A.25,10,5B.30,8,2C.30,6,4D.32,6,2答案:B解析:职员、中级管理人员、高级管理人员应各抽取的人数分别为:11115030408555⨯=,⨯=,⨯10=2.5.某学校高一、高二、高三年级的人数依次是750人,750人,500人.现要用分层抽样的方法从这些学生中抽取一个容量为60的样本,则高三年级应抽取的人数为( )A.15B.18C.16D.24答案:A解析:该学校共有2 000人,抽取一个容量为60的样本,设高三年级应抽取的人数为x,则605002000x=,因此x=15.题组三抽样的综合应用6.某中学高一年级有学生1 200人,高二年级有学生900人,高三年级有学生1 500人,现用分层抽样的方法从中抽取一个容量为720的样本进行某项调查,则高二年级应抽取的学生数为( )A.180B.240C.480D.720答案:A解析:抽取学生数为72090012009001500⨯=++180(人),∴选A.7.甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生( )A.30人,30人,30人B.30人,45人,15人C.20人,30人,40人D.30人,50人,10人答案:B解析:分层抽样就是按比例抽样,甲、乙、丙三校学生人数比例为2:3:1,样本容量为90,抽取学生样本分别为30人,45人,15人,∴选B.8.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数为人.答案:760解析:设该校女生人数为x,则男生人数为(1 600-x).由已知200(11600,⨯ 200600)101600x x --⋅=,解得x=760. 故该校的女生人数为760人.9.某高校对全校男女学生共3 200名进行健康调查,选用分层抽样法抽取一个容量为100的样本.已知男生抽了52人,则该校的男生人数应是 人.答案:1 664解析:由521003200x =,得x=1 664. 10.某工厂生产A,B,C,D 四种不同型号的产品,产品数量之比依次为2∶3∶5∶1,现用分层抽样方法抽出一个容量为n 的样本,样本中A 型号有16件,那么此样本容量n 是多少?解:在分层抽样中,每一层所抽的个体数的比例与总体中各层个体数的比例是一致的, 所以,样本容量235116882n +++=⨯=. 11.某单位组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的14,且该组中,青年人占50%,中年人占40%,老年人占10%,为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定(1)游泳组中,青年人、中年人、老年人分别所占的比例;(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.解:(1)设登山组人数为x,游泳组中,青年人、中年人、老年人各占比例分别为a 、b 、c, 则有40%3xb 474x x+=.5%, 10%3xc 104x x+=%, 解得b=50%,c=10%.故a=100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人各占比例分别为40%、50%、10%.(2)游泳组中,抽取的青年人数为3200404⨯⨯%=60(人); 抽取的中年人数为3200504⨯⨯%=75(人); 抽取的老年人数为3200104⨯⨯%=15(人).。
第1章统计案例章末复习学案(含答案)章末复习学习目标1.理解独立性检验的基本思想及实施步骤.2.会求线性回归方程,并用回归直线进行预测122列联表22列联表如表所示B合计Aababcdcd合计acbdn其中nabcd为样本容量2最小二乘法对于一组数据xi,yi,i1,2,,n,如果它们线性相关,则线性回归方程为x,其中,.3独立性检验常用统计量2来检验两个变量是否有相关关系.类型一独立性检验例1为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的22列联表喜爱打篮球不喜爱打篮球合计男生6女生10合计48已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为.1请将上面的22列联表补充完整;不用写计算过程2能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关说明你的理由考点独立性检验及其基本思想题点独立性与均值的综合应用解1列联表补充如下喜爱打篮球不喜爱打篮球合计男生22628女生101020合计3216482由24.286.因为4.2863.841,所以能在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关反思与感悟独立性检验问题的求解策略通过公式2,先计算出2,再与临界值表作比较,最后得出结论跟踪训练1某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数,如图所示说明图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主1根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯;2根据以上数据完成如表所示的22列联表;主食蔬菜主食肉类合计50岁以下50岁以上合计3在犯错误的概率不超过0.01的前提下,是否能认为“其亲属的饮食习惯与年龄有关”考点独立性检验及其基本思想题点分类变量与统计.概率的综合应用解130位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉类为主222列联表如表所示主食蔬菜主食肉类合计50岁以下481250岁以上16218合计xx3032106.635,故在犯错误的概率不超过0.01的前提下认为“其亲属的饮食习惯与年龄有关”类型二线性回归分析例2某城市理论预测xx年到xx年人口总数与年份的关系如表所示年份201x年01234人口数y万57811191请画出上表数据的散点图;2请根据上表提供的数据,求出y关于x的线性回归方程x;3据此估计xx年该城市人口总数考点回归分析思想的应用题点回归分析思想的应用解1散点图如图2因为2,10,iyi051728311419132,021*********,所以3.2,3.6.所以线性回归方程为3.2x3.6.3令x9,则3.293.632.4,故估计xx年该城市人口总数为32.4万反思与感悟解决回归分析问题的一般步骤1画散点图根据已知数据画出散点图2判断变量的相关性并求回归方程通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程3实际应用依据求得的回归方程解决实际问题跟踪训练2以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据房屋面积m21109080100120销售价格万元33312834391画出数据对应的散点图;2求线性回归方程解1数据对应的散点图如图所示2i11090801001xx0,i333128343933.11029028021002120251000.iyi11033903180281003412039 16740.所以0.24,330.241009.所以线性回归方程为x0.24x9.1下面是一个22列联表y1y2合计x1a2170x25c30合计bd100则bd________.考点题点答案8解析a702149,c30525,b49554,d212546,bd8.2“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时由高尔顿提出的,他的研究结果是子代的平均身高向中心回归根据他的结论,在儿子的身高y与父亲的身高x的线性回归方程x中,的取值范围是________考点线性回归分析题点线性回归方程的应用答案0,1解析子代平均身高向中心回归,应为正的真分数3假如由数据1,2,3,4,2,2,4,4,5,6,3,3.6可以得出线性回归方程x,则经过的定点是以上点中的________考点题点答案3,3.6解析易知,线性回归方程x经过定点,,根据计算可知这几个点中满足条件的是3,3.64考古学家通过始祖鸟化石标本发现其股骨长度xcm与肱骨长度ycm的线性回归方程为1.197x3.660,由此估计,当股骨长度为50cm时,肱骨长度的估计值为________cm.考点题点答案56.19解析根据线性回归方程1.197x3.660,将x50代入,得y56.19,则肱骨长度的估计值为56.19cm.5对于线性回归方程x,当x3时,对应的y的估计值是17,当x8时,对应的y的估计值是22,那么,该线性回归方程是________,根据线性回归方程判断当x________时,y的估计值是38.考点线性回归分析题点线性回归方程的应用答案x1424解析首先把两组值代入线性回归方程,得解得所以线性回归方程是x14.令x1438,可得x24,即当x24时,y的估计值是38.1独立性检验是研究两个分类变量间是否存在相关关系的一种案例分析方法利用假设的思想方法,计算出某一个2统计量的值来判断更精确些2建立回归模型的基本步骤1确定研究对象,明确哪个变量是自变量,哪个变量是因变量2画出散点图,观察它们之间的关系3由经验确定回归方程的类型4按照一定的规则估计回归方程中的参数.。
《统计初步》全章复习与巩固【巩固练习】 一.选择题1. 为了了解某校七年级1300名学生的视力情况,从各班分别随机抽取了10名学生进行了解,这次对每班抽取的10名学生进行了解的作用是( ).A.样本B.用样本估计总体C.抽样D.以上都不对2.小明家上个月支出共计800元,各项支出如图所示,其中用于教育上的支出是( ).A.80元B.160元C.200元D.232元 3. 我国五座名山的海拔高度如下表:A.条形统计图B.折线统计图C.扇形统计图D.都可以4. 池塘中放养了鲤鱼8000条,鲢鱼若干. 在几次随机捕捞中,共抓到鲤鱼320条,鲢鱼400 条. 估计池塘中原来放养了鲢鱼( )条.A.10000B.8000C.9000D.87005.甲、乙两名学生进行射击练习,两人在相同条件下各射靶5次,射击成绩统计如下:A .甲比乙高B .甲、乙一样C .乙比甲高D .不能确定设两队队员身高的平均数依次为x 甲,x 乙身高的方差依次为2s 甲,2s 乙,则下列关系中完全正确的是( ).A .x x =甲乙,22s s >乙甲B .x x =甲乙,22s s <乙甲C .x x >甲乙,22s s >乙甲D .x x <甲乙,22s s <乙甲7. 随着经济的发展,人们的生活水平不断提高.如图所示分别是某景点2010~2012年游客总人数和旅游收入年增长率统计图.已知该景点2011年旅游收入4500万元.下列说法:①三年中该景点2012年旅游收入最高;②与2010年相比,该景点2012年的旅游收入增加了[4500×(1+29%)-4500×(1-33%)]万元;③若按2012年游客人数的年增长率计算,2013年该景点游客总人数将达到280×2802551255-⎛⎫+⎪⎝⎭万人次.其中正确的个数是( ).A .0B .1C .2D 38. 某次考试中,某班级的数学成绩统计图如图所示,下列说法错误的是( ).A .得分在70~80分之间的人数最多B .该班的总人数为40C .得分在90~100分之间的人数最少D .及格(≥60分)人数是26 二.填空题9. 在一次捐款活动中,某班50名同学人人拿出自己的零花钱,有捐5元、10元、20元的,还有捐50元和100元的.如图所示的统计图反映了不同捐款数的人数比例,那么该班同学平均每人捐款________元.10.如图所示,是甲、乙两地5月下旬的日平均气温统计图,则甲、乙两地这10天日平均气温的方差大小关系为:2s甲________2s乙.11.在一节综合实践课上,五名同学手工作品的数量(单位:件)分别是:3,8,5,3,4,则这组数据的中位数是________件.12.某班学生理化生实验操作测试成绩的统计结果如下表:则这些学生成绩的众数为________.13.如图,统计了四年级(1)班的一次数学测验的成绩,并画出了频数分布直方图,则落在60~70小组内的频数是_____________,90~100小组的组中值为_____________.14.如图所示是一组数据的折线统计图,这组数据的最大值与最小值的差是________,平均数是________.15.学校篮球队五名队员的年龄分别为17,15,17,16,15,其方差为0.8,则三年后邀五名队员年龄的方差为________.16.在一次测验中,A组有10人,数学平均成绩是84分,B组有20人,数学平均成绩是78分,如果把A、B两组合并,那么合并后的数学平均成绩是________分.三.解答题17. 某中学八年级(1)班共40名同学开展了“献爱心”的活动.活动结束后,生活委员小林将捐款情况进行了统计,并绘制成如图所示的统计图.(1)求这40名同学捐款的平均数;(2)该校共有学生1200名,请根据该班的捐款情况,估计这个中学的捐款总数大约是多少元?请你根据上述内容,解答下列问题:(1)该公司“高级技工”有________名;(2)所有员工月工资的平均数x为2500元,中位数为________元,众数为________元;(3)小张到这家公司应聘普通工作人员.请你回答图小张的问题,并指出用(2)中的哪个数据向小张介绍员工的月工资实际水平更合理些;(4)去掉四个管理人员的工资后,请你计算出其他员工的月平均工资y(结果保留整数),并判断y能否反映该公司员工的月工资实际水平.19.为选派一名学生参加全市实践活动技能竞赛,A、B两位同学在校实习基地现场进行加工直径为20mm的零件测试,他俩各加工的10个零件的相关数据依次如图所示(单位:mm).根据测试得到的有关数据,试解答下列问题:(1)考虑平均数与完全符合要求的个数,你认为________的成绩好些.s的大小,考虑平均数与方差,说明谁的成绩好些.(2)计算出2B(3)考虑图中折线走势及竞赛中加工零件个数远远超过10个的实际情况,你认为派谁去参赛较合适?说明你的理由.20.某校为了了解九年级学生的体能情况,抽调了一部分学生进行一分钟跳绳测试,将测试成绩整理后作出如图所示的统计图.甲同学计算出前两组的频率和是0.12.同学计算出跳绳次数不少于100次的同学占96%,丙同学计算出从左至右第二、三、四组的频率比为4:17:15.结合统计图回答下列问题.(1)这次共抽调了多少人?(2)若跳绳次数不少于130次为优秀,则这次测试成绩的优秀率是多少?(3)如果这次测试成绩的中位数是120次,那么这次测试中,成绩为120次的学生至少有多少人?【答案与解析】一.选择题1.【答案】B;2.【答案】C;【解析】800×25%=200(元)3.【答案】A;【解析】条形统计图容易很清楚地看到各组数据的区别.4.【答案】A;【解析】(条).5.【答案】B;【解析】27281085x ⨯+⨯+==甲,7183985x ⨯+⨯+==乙.故从平均数评价甲、乙两人的射击水平可知,甲、乙一样.6.【答案】B ; 【解析】因为1(177176175172175)1755x =++++=甲, 1(170175173174183)1755x =++++=乙,所以x x =甲乙,2222221[(177175)(176175)(175175)(172175)(175175) 2.85s =-+-+-+-+-=甲2222221[(170175)(175175)(173175)(174175)(183175)]18.85s =-+-+-++-+-=乙,所以22s s <乙甲. 7.【答案】C;【解析】从旅游收入年增长率统计图中得到2011年收入比2010年收入增长33%,2012年收入比2011年收入增长29%,故2012年旅游收入最高,①正确.2012年收入为4500(1+29%)万元,2010年收入为[4500÷(1+33%)]万元,则②错误.2012年旅游人数增长率为280255255-,则2013年该景点人数为2802552801255-⎛⎫⨯+ ⎪⎝⎭万人次,则③正确.故其中正确的个数是2. 8.【答案】D ;【解析】观察统计图可得得分在70~80分的人数最多,是14;该班总人数为4+12+14+8+2=40;得分在90~100分的人数最少,是2;及格(≥60分)的人数是12+14+8+2=36,不是26,故D 项错误.二.填空题9.【答案】31.2;【解析】2044%1020%5016%10012%58%31.2⨯+⨯+⨯⨯+⨯+⨯=. 10.【答案】>【解析】方差是用来衡量一组数据的波动大小的量,方差较大的波动也较大,本题中两组数据的个数相同,明显甲组数据的波动大于乙组数据,又无需写出计算过程,因此可通过分析得出答案.11.【答案】4; 12.【答案】9;【解析】9分的人数最多. 13.【答案】4;95; 14.【答案】31;46.5;【解析】最大值与最小值的差是59-28=31;平均数1(322854505956)46.56x =⨯+++++=. 15.【答案】0.8;【解析】三年后五位队员的年龄都大了3岁,而平均年龄也大了3岁,由方差的计算公式可知方差并没有变化,仍为0.8.16.【答案】80; 【解析】84107820801020⨯+⨯=+.三.解答题 17.【解析】 解:(1)140×(20×9+30×12+50×16+100×3)=41(元); 所以这40名同学捐款的平均数为41元. (2)41×1200=49200(元).所以这个中学的捐款总数大约是49200元. 18.【解析】解:(1)高级技工人数为:50-(1+3+2+3+24+1)=16(名). (2)中位数为:1600180017002+=,众数为1600.(3)这个经理的介绍不能反映该公司员工的月工资实际水平. 用1700元或1600元来介绍更合理些. (4)2500502100084003173146y ⨯--⨯=≈(元).y 能反映该公司员工的月工资实际水平. 19.【解析】 解:(1)B (2)222221[5(2020)3(19.920)(20.120)(20.220)]0.00810B s =⨯⨯-+⨯-+-+-=, 又220.026A B s s =>,在平均数相同的情况下,因22A Bs s >,即B 的波动性小些,所以B 的成绩好些.(3)从图中折线走势可知,尽管A 前面的成绩起伏较大,但后来的成绩逐渐稳定,误差在逐渐减小,在竞赛加工零件数远远超过10个的情况下,预测A 的潜力较大,可选派A 去参赛.20.【解析】解:(1)第一小组的频率为1-0.96=0.04,第二小组的频率为0.12-0.04=0.08,∴121500.08=(人), ∴ 这次共抽调了150人.(2)第一小组人数为150×0.04=6(人), 第二小组人数为150×0.08=12(人),由于第二、三、四小组的频率比为4:17:15, 故第三、四小组人数分别为51人和45人. 这次测试的优秀率为1506125145100%24%150----⨯=.(3)成绩为120次的学生至少有7人.。
141第十章 统计调查单元复习巩固(2)班级 姓名 座号 月 日主要内容:熟练掌握频数分布直方图、折线图一、课堂练习:1.下面是1998年参加国际教育评估的15个国家学生的数学平均成绩()x 的统计图:(1)图 B 能很好地说明一半以上国家的学生成绩在6070x ≤<之间;(2)图 A 能更好地说明学生成绩在7080x ≤<的国家多于5060x ≤<的国家.2.在同一条件下,对同一型号的30辆汽车耗油1升所行驶的路程进行测试,结果如下(单位:km ):14.1 12.3 13.7 14.0 12.8 12.9 13.1 13.6 14.4 13.8 13.8 12.6 13.2 13.3 14.2 13.9 12.7 13.0 13.2 13.5 13.6 13.4 13.6 12.1 12.5 13.1 13.5 13.2 13.4 12.6 填写下列频数分布表,并画出频数分布直方图和扇形统计图分析汽车的耗油情况.解(2)分析:这种汽车耗油一升可行驶12km 以上,最多行驶.144km ,且73.3%的汽车可行驶13km 以上等.13≤<12.5x <13B 图6070x ≤<5060x ≤<4050x ≤<7080x ≤<A 图142 二、课后作业:3.下面的折线图描述了某地的气温变化情况.(1)这一天的最高气温是 31 C , :1400 时达到最高气温;(2)这一天的最低气温是 22 C , :400 时达到最低气温;(3)估计这一天7时、11时、15时和19时的气温分别为 24 C 、 .285 C 、.305 C 、 .285 C .4.某小区便民超市为了了解顾客的消费情况,在该小区居民中进行调查,询问每户人家每周到超市的次数,如图所示的图形是根据调查结果绘制的,请问:(1)这种统计图通常被称为什么统计图?(2)此次调查共询问了多少户人家?(3)超过半数的居民每周去多少次超市(4)请将这幅图改为扇形统计图.解:(1)这种统计图通常被称为频数分布直方图 (2)此次调查共询问了户数是 50+300+250+100+100+100+50+50=1000(户) (3)超过半数的居民每周去1~2次超市108()每组只含最大值不含最小值18。
【走向高考】2016届高三数学一轮基础巩固 第10章 第2节 统计、统计案例 北师大版一、选择题1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60);4;[60,70],2,则在区间[10,50)上的数据的频率是( )A .0.05B .0.25C .0.5D .0.7[答案] D[解析] 由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为1420=0.7.2.某厂10名工人在一个小时内生产零件的个数分别是15、17、14、10、15、17、17、16、14、12,设该组数据的平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a [答案] D[解析] 把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a =110×(10+12+14+14+15+15+16+17+17+17)=14.7,中位数b =15+152=15,众数是c =17,则a <b <c ,选D .3.一个样本数据按从小到大的顺序排列为:13,14,19,x,23,27,28,31,其中,中位数为22,则x 等于( )A .21B .22C .23D .20 [答案] A[解析] 因为样本数据个数为偶数,中位数为x +232=22,故x =21.4.一个容量为100的样本,其数据的分组与各组的频数如下:A .0.13B .0.39C .0.52D .0.64[答案] C[解析] 由列表可知样本数据落在 (10,40]上的频数为52,故其频率为0.52. 5.(2014·山东高考)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18[答案] C[解析] 第一、二两组的频率为0.24+0.16=0.4 ∴志愿者的总人数为200.4=50(人).第三组的人数为:50×0.36=18(人) 有疗效的人数为18-6=12(人)6.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差 [答案] C[解析] 本题考查了数理统计中的平均数、中位数、方差、极差及条形图等问题. x -甲=15(4+5+6+7+8)=6,x -乙=15(5×3+6+9)=6,甲的成绩的方差为15(22×2+12×2)=2,乙的成绩的方差为15(12×3+32×1)=2.4.故选C .二、填空题7.为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图所示),已知图中从左到右的前3个小组的频率之比为,第2小组的频数为12,则报考飞行员的总人数是________.[答案] 48[解析] 据频率分布直方图可得第4小组及第5小组的频率之和为5×(0.013+0.037)=0.25,故前3个小组的频率为1-0.25=0.75,第2小组的频率为0.75×21+2+3=0.25,又其频数为12,故总人数为120.25=48(人). 8.抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:[答案] 2[解析] 本题考查统计中方差的计算. x -甲=90,且S 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,x -乙=90,且S 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.由于S 2甲>S 2乙,所求方差为2.9.如图所示,是海尔电视机厂产值统计图,产值最少的是第________季度,产值最多的是第________季度.第四季度比第二季度增产________%.[答案] 二四150[解析] 折线图描述某种现象在时间上的发展趋势.图中折线表示了海尔电视机厂四个季度产值先减少后增多,且第二季度最少,第四季度最多.第四季度比第二季度增产15万元,增产150%.三、解答题10.(2014·新课标Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?[解析] (1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.一、选择题1.小波一星期的总开支分布图如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为( )A .30%B .10%C .3%D .不能确定[答案] C[解析] 本题考查了扇形图,条形图.由图2知小波一星期的食品开支为300元,其中鸡蛋开支为30元.占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%.2.甲、乙两名同学在五次考试中数学成绩统计用茎叶图表示如图所示,则下列说法正确的是( )甲 乙9 8 5 8 59 10 115 6 8 2 4A .甲的平均成绩比乙的平均成绩高B .甲的平均成绩比乙的平均成绩低C .甲成绩的方差比乙成绩的方差大D .甲成绩的方差比乙成绩的方差小 [答案] C[解析] 本题考查茎叶图知识及样本数据中的均值与方差的求解及其意义.可以求得两人的平均成绩相同,均为107,又S 2甲=15[(98-107)2+(99+107)2+(105-107)2+(115-107)2+(118-107)2]=66.8,而S 2乙=15[(95-107)2+(106-107)2+(108-107)2+(112-107)2+(114-107)2]=44,故选C .二、填空题3.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.[答案] 0.030 3[解析] 由所有小矩形面积为1不难得到a =0.030,而三组身高区间的人数比为,由分层抽样的原理不难得到[140,150]区间内的人数为3人.4.(2014·江苏高考)设抽测的树木的底部周长均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.[答案] 24[解析] 本题考查频率分布直方图.由题意在抽测的60株树木中,底部周长小于100cm 的株数为(0.015+0.025)×10×60=24.频率分布直方图中的纵坐标为频率组距,此处经常误认为纵坐标是频率.三、解答题5.若某产品的直径长与标准值的差的绝对值不超过...1mm 时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:(1)(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.[解析] (1)(2)(1,3]内的概率约为0.50+0.20=0.70.(3)设这批产品中的合格品数为x 件, 依题意有505 000=20x +20,解得x =5 000×2050-20=1 980.所以该批产品的合格品件数估计是1 980件.6.近年来,某市为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收物和其他垃圾三类,并分别设置了相应的垃圾箱,为调查居民生活垃圾分类投放情况,现随机抽取了该市三类垃圾箱中总计1000t 生活垃圾,数据统计如下(单位:t):(2)试估计生活垃圾投放错误的概率;(3)假设厨余垃圾在“厨余垃圾”箱、“可回收物”箱、“其他垃圾”箱的投放量分别为a 、b 、c 其中a >0,a +b +c =600.当数据a 、b 、c 的方差s 2最大时,写出a ,b ,c 的值(结论不要求证明),并求此时s 2的值.(注:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为数据x 1,x 2,…,x n 的平均数)[解析] (1)厨余垃圾投放正确的概率为“厨余垃圾”箱里厨余垃圾量厨余垃圾总量=400400+100+100=23.(2)设生活垃圾投放错误为事件A ,则事件A 表示生活垃圾投放正确.事件A 的概率为“厨余垃圾”箱里厨余垃圾量、“可回收物”箱里可回收物量与“其他垃圾”箱里其他垃圾量的总和除以生活垃圾总量,即P (A )≈400+240+601000=0.7.所以P (A )≈1-0.7=0.3.(3)当a =600,b =c =0时,s 2取得最大值. 因为x =13(a +b +c )=200,所以s 2=13[(600-200)2+(0-200)2+(0-200)2]=80 000.。
【巩固练习】 一、选择题1.下面4个散点图中,不能用线性回归模型拟合的两个变量是( )2.散点图在回归分析过程中的作用是( )A .查找个体个数B .比较个体数据的大小关系C .探究个体分类D .粗略判断两个变量是否相关,具备哪种相关关系3.(2014春 无为县校级期中)用独立性检验来考察两个分类变量x 与y 是否有关系,当统计量K 2的观测值( ) A .越大,“x 与y 有关系”成立的可能性越小B .越大,“x 与y 有关系”成立的可能性越大C .越小,“x 与y 没有关系”成立的可能性越小D .与“x 与y 有关系”成立的可能性无关4.(2016 德州一模)为了增强环保意识,某校从男生中随机制取了60人,从女生中随机制取了50人参加环保知识测试,统计数据如下表所示:附:22112212211212()n n n n n x n n n n ++-=++则有( )的把握认为环保知识是否优秀与性别有关。
A .90%B .95%C .99%D .99.9%5.已知某车间加工零件的个数x 与花费时间y (h )之间的线性回归方程为0.010.5y x =+,则加工600个零件大约需要( )A .6.5 hB .5.5 hC .3.5 hD .0.5 h6.(2016春 龙岩校级月考)为了调查中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )A .平均数B .方差C .回归分析D .独立性检验7.(2015春 兴宁市校级期中)在下列命题中,真命题的个数是( )①若K 2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②由样本数据得到的回归直线y bx a =+必过样本点的中心(,)x y ; ③残差平方和越小的模型,拟合的效果越好;④若复数z=m 2-1+(m+1)i 为纯虚数,则实数m=±1。