数学必修3第二章 统计复习
- 格式:ppt
- 大小:704.00 KB
- 文档页数:27
高中数学 2.3.4第二章统计复习小结测试文新人教A版必修3一、选择题1.下列说法错误的是()A.在统计里,把所需考察的对象的全体叫做总体B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越大2.为了了解参加一次知识竞赛的1252名学生的成绩,决定采用系统抽样的方法抽取一个样本容量为10的样本,那么从总体中应随机剔除个体的数目是()A.2 B.3 C.4 D.53.从某年级2000名学生中抽取200名学生进行体重的统计分析,就这个问题来说,下列说法正确的是()A.应采用分层抽样抽取样本B.每个被抽查的学生是个体C.抽取的200名学生的体重是一个样本D.抽取的200名学生的体重是样本容量4.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别各抽取的人数是()A.7,11,9 B.6,12,18 C.6,13,17 D.7,12,175.下列抽样问题中最适合用系统抽样发抽样的是()A.从全班48名学生中随机抽取8人参加一项活动B.一个城市有210家百货商店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,要从中抽取一个容量为21的样本C.从参加模拟考试的1200名高中生中随机抽取100人分析试题作答情况D.从参加模拟考试的1200名高中生中随机抽取10人了解某些情况6.已知某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图(如图所示),则()3 6 8 2 54 3 8 9 3 1 6 1 6 7 9 2 4 4 9 15 0A.甲篮球运动员比赛得分更稳定,中位数为26B.甲篮球运动员比赛得分更稳定,中位数为27C.乙篮球运动员比赛得分更稳定,中位数为31D.乙篮球运动员比赛得分更稳定,中位数为367. 某人5次上班途中所花的时间(单位:分钟)分别为x ,y ,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为( ) A .1 B .2 C .3 D .4A.0.001B.0.1C.0.2D.0.38. 给出两组数据x 、y 的对应值如下表,若已知x 、y 是线性相关的,且线性回归方程:x b a yˆˆˆ+=,经计算知:4.1ˆ-=b ,则=a ˆ( )A.17.4B.-1.74C.0.6D.-0.69. 某中学有学生270人,其中一年级108人,二、三年级各81人,现在用抽样方法抽取10人形成样本,将学生按一、二、三年级依次统一编号为1,2,…,270,如果抽得号码有下列四种情况:①5,9,100,107,111,121,180,195,200,265; ②7,34,61,88,115,142,169,196,223,250; ③30,57,84,111,138,165,192,219,246,270;④11,38,65,92,119,146,173,200,227,254;其中可能是由分层抽样得到,而不可能是由系统抽样得到的一组号码为( ) A. ①② B.②③ C.①③ D.①④ 二、填空题11.一组数据:23,27,20,18,x ,12,它们的平均数为21,那么x 是 .12.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是 13.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性方程x b a yˆˆˆ+=中2ˆ-=b ,据此预测当气温为5℃时,用电量的度数约为 .14.某单位有技工18人,技术员12人,工程师6人,需要从这些人中抽取一个容量为n 的样本;如果采用系统抽样和分层抽样方法,都不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中剔除一个个体,则样本容量n 为 . 15.某班12位学生父母年龄的茎叶图如图所示,则12位同学母亲的年龄的中位数是 ,三、解答题16.一批产品中,有一级品100个,二级品60个,三级品40个,分别用系统抽样和分层抽样的方法,从这批产品中抽取一个容量为20的样本.17.要从甲、乙两名运动员中选拔一人参加射击比赛,为此对他们的射击水平进行了测试,两人在相同条件下各射击10次,命中的环数如下: 甲:7 8 6 8 6 5 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7(1)计算甲、乙两人射击命中环数的平均数和标准差; (2)比较两人的成绩,然后决定选择哪一人参加比赛.18.为了研究三月下旬的平均气温(x )与四月棉花害虫化蛹高峰(y )的关系,某地区观察了2003年至2008年的情况,得到下面数据:已知与之间具有线性相关关系,据气象预测该地区在2010年三月下旬平均气温为27℃,试估计2010年四月化蛹高峰日为哪天?19.为参加连队组织的射击比赛,班长在本班安排射击选拔赛,每人每轮10发,共安排10(1)根据表中数据画出茎叶图(以个数为叶,并且排序);(2)请你替班长选出1名战士参加连队的射击比赛,并说明理由.20.一般来说,一个人的身高越高,他的手就越大.为调查这一问题,对10名高三男生的身高与右手一拃长测量得如下数据(单位:cm):(2)如果近似成线性关系,求回归方程.(3)如果一个学生身高185cm,估计他的右手一拃长.21.某花木公司为了调查某种树苗的生长情况,抽取了一个容量为100的样本,测得树苗的高度(cm)数据的分组及相应频数如下:[107,109〕3株;[109,111〕9株;[111,113〕13株;[113,115〕16株;[115,117〕26株;[117,119〕20株;[119,121〕7株;[121,123〕4株;[123,125〕2株.(1)列出频率分布表;(2)画出频率分布直方图;(3)据上述图表,估计数据[109,121〕范围内的可能性是百分之几?必修3 第二章《统计》单元测试题[供教师备课参考]参考答案: BACBC DDDAC11.26 12.62.8 3.6 13.40 14.6 15.42 3 16.解:(1)系统抽样的方法:先将200个产品随机编号,001,0020,…,200,再将200个产品按001~010,011~020,…,191~200,分成20组,每组10个产品,在第一组内用简单随机抽样确定起始的个体编号,按事先确定的规则,从每组中分别抽取样本,这样就得到一个容量为20的样本.(2)分层抽样的方法:先将总体按其级别分为三层,一级品有100个,产品按00,01,…,99编号,二级品有60个,产品按00,01,…,59编号,三级品有40个,产品按00,01,…,39编号.因总体个数:样本容量为10:1,故用简单随机抽样的方法,在一级品中抽10个,二级品中抽6个,三级品中抽4个.这样就得到一个容量为20的样本.17.解:(1).10.1,73.1,7ˆ,7ˆ≈≈==乙甲乙甲s s x x(2)由(1)知,甲、乙两人的平均成绩相等,但甲乙s s <,这表明乙的成绩比甲的成绩稳定一些,从成绩的稳定性考虑,可以选择乙参赛.18.解: 由题意知:,6.71ˆˆ,2.266ˆ,6.1222,92.5130,5,7,13.2926126161612≈-=-≈--=∴===≈∑∑∑∑====x b y ax xy x yx by x x y x i iii i i i i i i∴回归方程为6.712.2ˆ+-=x y. 当27=x 时,2.126.71272.2ˆ=+⨯-=y,据此,可估计该地区2010年4月12日或13日为化蛹高峰期日.19.解: (1)(2)应当安排战士乙参加比赛,因为这两个战士的平均成绩都是95环,叶的分布是“单峰”的,从叶在茎上的分布情况看,乙战士的得分更集于峰值附近,这说明乙战士的发挥更稳定,所以若只要派去的选手发挥水平,应选战士乙.20.解:(1)散点图如图:由上图可见,身高与右手一扎长之间的总体趋势成一条直线,即它们线性相关.(2).264.31303.0ˆ-=x y(3)当x=185时,.791.24264.31185303.0ˆ=-⨯=y即学生身高185cm 时,他的右手一拃长约为24.791cm. 21.解:(1)画出频率分布表如下:18 19 20 21 22 23 24 25 26167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182一拃长 身高0.14 0.12 0.1 0.08 0.06 0.04 0.02 0树苗高度/cm(2)频率分布直方图如下:(3)由上述图表可知数据落在[109,121〕范围内的频率为:0.94-0.03=0.91,即数据落在[109,121〕范围内的可能性是91%.频率/组距。
(数学3必修)第二章 统计[基础训练A 组] 一、选择题1 10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( ) A c b a >> B a c b >> C b a c >> D a b c >> 2 下列说法错误的是 ( )A 在统计里,把所需考察对象的全体叫作总体B 一组数据的平均数一定大于这组数据中的每个数据C 平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D 一组数据的方差越大,说明这组数据的波动越大3 某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是( ) A 3.5 B 3- C 3 D 5.0-4 要了解全市高一学生身高在某一范围的学生所占比例的大小,需知道相应样本的( )A 平均数B 方差C 众数D 频率分布5 要从已编号(160 )的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( )A5,10,15,20,25,30 B3,13,23,33,43,53 C1,2,3,4,5,6 D2,4,8,16,32,486A 14和0.14B 0.14和14 C141和0.14 D31和141二、填空题1 为了了解参加运动会的2000名运动员的年龄情况,从中抽取100名运动员;就这个问题,下列说法中正确的有 ;① 2000名运动员是总体;②每个运动员是个体;③所抽取的100名运动员是一个样本; ④样本容量为100;⑤这个抽样方法可采用按年龄进行分层抽样;⑥每个运动员被抽到的概率相等2 经问卷调查,某班学生对摄影分别执“喜欢”、“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢”态度的多12人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出的2位“喜欢”摄影的同学、1位“不喜欢”摄影的同学和3位执“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班人数的一半还多 人3 数据70,71,72,73的标准差是______________4 数据123,,,...,n a a a a 的方差为2σ,平均数为μ,则(1)数据123,,,...,,(0)n ka b ka b ka b ka b kb ++++≠的标准差为 ,平均数为(2)数据123(),(),(),...,(),(0)n k a b k a b k a b k a b kb ++++≠的标准差为 ,平均数为5 观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在(]2700,3000的三、解答题1 试求全校初二男生俯卧撑的平均成绩2为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数(1)求出表中,,,m n M N所表示的数分别是多少?(2)画出频率分布直方图(3)全体女生中身高在哪组范围内的人数最多?3某校高中部有三个年级,其中高三有学生1000人,现采用分层抽样法抽取一个容量为185的样本,已知在高一年级抽取了75人,高二年级抽取了60人,则高中部共有多少学生?4从两个班中各随机的抽取10名学生,他们的数学成绩如下:画出茎叶图并分析两个班学生的数学学习情况数学3(必修)第二章 统计 [基础训练A 组]参考答案一、选择题1 D 总和为147,14.7a =;样本数据17分布最广,即频率最大,为众数,17c =;从小到大排列,中间一位,或中间二位的平均数,即15b = 2 B 平均数不大于最大值,不小于最小值3 B 少输入9090,3,30=平均数少3,求出的平均数减去实际的平均数等于3-4 D5 B60106=,间隔应为106 A 频数为100(1013141513129)14-++++++=;频率为140.14100=二、填空题1 ④,⑤,⑥ 2000名运动员的年龄情况是总体;每个运动员的年龄是个体;23 3位执“一般”对应1位“不喜欢”,即“一般”是“不喜欢”的3倍,而他们的差为12人,即“一般”有18人,“不喜欢”的有6人,且“喜欢”是“不喜欢”的6倍,即30人,全班有54人,1305432-⨯=327071727371.5,4X +++==2s ==4 (1)k σ,k b μ+(2)k σ,k kb μ+(1)1212......n nka b ka b ka ba a a X kb k b nnμ+++++++++==⋅+=+s kk σ===(2)1212()()...()...n nk a b k a b k a b a a a X k nb k nb nnμ+++++++++==⋅+=+s kk σ===5 0.3 频率/组距0.001=,组距300=,频率0.0013000.3=⨯=三、解答题1解:1089685716645743313607.25050X⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯===2解:(1)150,50(1420158)20.02M m===-++++=21,0.0450N n===(2)…(3)在153.5157.5范围内最多3解:从高三年级抽取的学生人数为185(7560)50-+=而抽取的比例为501100020=,高中部共有的学生为1185370020÷=4解:乙班级总体成绩优于甲班。
第2课时统计课后篇巩固探究A组1.下列不具有相关关系的是()A.单产不为常数时,土地面积和总产量B.人的身高与体重C.季节与学生的学习成绩D.学生的学习态度与学习成绩.2.某中学采用系统抽样方法,从该校高一年级全体800名学生中抽取50名学生做牙齿健康检查.现将800名学生从1到800进行编号.已知从33~48这16个数中抽到的数是39,则在第1小组1~16中随机抽到的数是()A.5B.7C.11D.13k==16,即每16人抽取一个人.因为39=2×16+7,所以第1小组中抽取的数为7.3.在一次歌手大奖赛上,七位评委为某歌手打出的分数如下:9.48.49.49.99.69.49.7去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A.9.4,0.484B.9.4,0.016C.9.5,0.04D.9.5,0.016=9.5.方差s2=[(9.4-9.5)2+(9.4-9.5)2+(9.6-9.5)2+(9.4-9.5)2+(9.7-9.5)2]=0.016.4.某地区有300家商店,其中大型商店有30家,中型商店有75家,小型商店有195家,为了掌握各商店的营业情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的中型商店为() A.2家B.3家C.5家D.13家1:在整个抽样过程中,每个个体被抽到的可能性为,则抽取的中型商店为75×=5(家).方法2:因为大、中、小型商店数的比为30∶75∶195=2∶5∶13,所以抽取的中型商店为20×=5(家).答案:C5.某商场在五一促销活动中,对5月1日9时至14时的销售额进行统计,其频率分布直方图如图,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为()A.6万元B.8万元C.10万元D.12万元解析:由频率分布直方图可知,11时至12时的销售额占全部销售额的,即销售额为25×=10(万元).答案:C6.从一堆苹果中任取了20个,并得到它们的质量(单位:g)数据分布表如下:分组[90,100) [100,110) [110,120) [120,130) [130,140) [140,150)频数 1 2 3 10 1则这堆苹果中,质量不小于120 g的苹果数约占苹果总数的.解析:由表中可知这堆苹果中,质量不小于120 g的苹果数为20-1-2-3=14.故约占苹果总数的=0.70=70%.答案:70%7.某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元 4 2 3 5销售额y/万元49 26 39 54根据上表可得回归方程x+中的为9.4,据此模型预报广告费用为6万元时销售额约为元.解析:=3.5,=42,∴=42-9.4×3.5=9.1,∴回归方程为=9.4x+9.1,∴当x=6时,=9.4×6+9.1=65.5..58.现有同一型号的电脑96台,为了了解这种电脑每开机一次所产生的辐射情况,从中抽取10台在同一条件下做开机实验,测量开机一次所产生的辐射,得到如下数据:13.712.914.413.813.312.713.513.613.113.4(1)写出采用简单随机抽样抽取上述样本的过程;(2)根据样本,请估计总体平均数与总体标准差的情况.解:(1)利用随机数表法或抽签法.具体过程如下:方法一(抽签法):①将96台电脑随机编号为1~96;②将以上96个分别写在96X相同的小纸条上,揉成小球,制成号签;③把号签放入一个不透明的容器中,充分搅拌均匀;④从容器中逐个抽取10个号签,每次取完后再次搅拌均匀,并记录上面的;⑤找出和所得对应的10台电脑,组成样本.方法二(随机数表法):①将96台电脑随机编号,编号为00,01,02, (95)②在随机数表中任选一数作为开始,然后依次向右读,每次读两位,凡不在00~95中的数和前面已读过的数跳过不读,直到读出10个符合条件的数;③这10个数所对应的10台电脑即是我们所要抽取的样本.(2)=13.44;s2=≈0.461.故总体平均数为13.44,总体标准差约为0.461.9.对某班50人进行智力测验,其得分如下:48,64,52,86,71,48,64,41,86,79,71,68,82,84,68,64,62,68,81,57,90,52,74,73,56,78,47,66,5 5,64,56,88,69,40,73,97,68,56,67,59,70,52,79,44,55,69,62,58,32,58.(1)这次测试成绩的最大值和最小值各是多少?(2)将[30,100)平分成7个小区间,试画出该班学生智力测验成绩的频数分布图.(3)分析这个频数分布图,你能得出什么结论?解:(1)最小值是32,最大值是97.(2)7个区间分别是[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100),每个小区间的长度是10,统计出各小区间内的数据频数,列表如下:区间[30,40) [40,50) [50,60) [60,70) [70,80) [80,90) [90,100)频数 1 6 12 14 9 6 2频数分布图如下图所示.(3)可以看出,该班智力测验成绩大体上呈两头小、中间大、左右对称的钟形状态,说明该班学生智力特别好或特别差的是极少数,而智力一般的是多数,这是一种最常见的分布.10.导学号17504078已知学生的总成绩与数学成绩之间有线性相关关系,下表给出了5名同学在一次考试中的总成绩和数学成绩(单位:分).学生编号1 2 3 4 5成绩总成绩/x482 383 421 364 362数学成绩/y78 65 71 64 61(1)求数学成绩与总成绩的回归直线方程.(2)根据以上信息,如果一个学生的总成绩为450分,试估计这个学生的数学成绩;(3)如果另一位学生的数学成绩为92分,试估计其总成绩是多少?解:(1)列出下表,并进行有关计算.编号x y x2xy1 482 78 232 324 37 5962 383 65 146 689 24 8953 421 71 177 241 29 8914 364 64 132 496 23 2965 362 61 131 044 22 082合计 2 012 339 819 794 137 760由上表可得,可得≈0.132,-0.132×≈14.683.故数学成绩y对总成绩x的回归直线方程为=14.683+0.132x.(2)由(1)得当总成绩x为450分时,=14.683+0.132×450≈74(分),即数学成绩大约为74分.(3)若数学成绩为92分,将=92代入回归直线方程=14.683+0.132x中,得x≈586(分).故估计该生的总成绩在586分左右.B组1.设样本数据x1,x2,…,x10的均值和方差分别为1和4,若y i=x i+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为()A.1+a,4B.1+a,4+aC.1,4D.1,4+a解析:=+a=1+a.s2===4.答案:A2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m e,众数为m o,平均值为,则()A.m e=m o=B.m e=m o<C.m e<m o<D.m o<m e<解析:由题目所给的统计图示可知,30个得分中,按大小顺序排好后,中间的两个得分为5,6,故中位数m e==5.5,又众数m o=5,平均值(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)=,故m o<m e<.答案:D3.某市为加强教师基础素质建设,开展了“每月多读一本书,提高自身修养”的读书活动.设该市参加读书活动的教师平均每人每年读书的本数为x(单位:本),按读书本数分下列四种情况统计:①0~10本;②11~20本;③21~30本;④30本以上.现有10 000名教师参加了此项活动,如图是此次调查中某一项的程序框图,其输出的结果为6 200,则该市参加活动的教师中平均每年读书本数在0~20之间的频率是()A.3 800B.6 200C.0.38D.0.62解析:由程序框图知,当x>20时,S=S+1,故输出的S值应是10 000名教师中读书本数大于20的人数,故S=6 200,∴在0~20之间的频率为=0.38.答案:C4.(2017某某某某二中高三一模)某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,…,第十组46~50号,若在第三组中抽得为12的学生,则在第八组中抽得为的学生.解析:由题意得,在第八组中抽得为12+(8-3)×5=37.答案:375.某公司为改善职工的出行条件,随机抽取50名职工,调查他们的居住地与公司的距离d(单位:千米).若样本数据分组为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],由数据绘制的频率分布直方图如图所示,则样本中职工居住地与公司的距离不超过4千米的人数为.解析:样本中职工居住地与公司的距离不超过4千米的频率为(0.1+0.14)×2=0.48,所以样本中职工居住地与公司的距离不超过4千米的人数为50×0.48=24.答案:246.导学号17504079从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85) [85,95) [95,105) [105,115) [115,125)频数 6 26 38 22 8(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解:(1)(2)质量指标值的样本平均数为=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.7.导学号17504080某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元8 8.2 8.4 8.6 8.8 9销量y/件90 84 83 80 75 68(1)求回归直线方程x+,其中=-20,;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)=8.5,=80.∵=-20,,∴=80+20×8.5=250.∴回归直线方程为=-20x+250.(2)设工厂获得的利润为L元,则L=x(-20x+250)-4(-20x+250)=-20(x-8.25)2+361.25,∴该产品的单价定为8.25元时,工厂获得的利润最大.。
高中数学必修三课后习题答案第一章 算法初步 1.1算法与程序框图练习(P5) 1、算法步骤:第一步,给定一个正实数r .第二步,计算以r 为半径的圆的面积2S r π=.第三步,得到圆的面积S .2、算法步骤:第一步,给定一个大于1的正整数n .第二步,令1i =.第三步,用i 除n ,等到余数r .第四步,判断“0r =”是否成立. 若是,则i 是n 的因数;否则,i 不是n 的因数. 第五步,使i 的值增加1,仍用i 表示.第六步,判断“i n >”是否成立. 若是,则结束算法;否则,返回第三步.练习(P19)算法步骤:第一步,给定精确度d ,令1i =.的到小数点后第i 位的不足近似值,赋给a 的到小数点后第i 位的过剩近似值,赋给b . 第三步,计算55b am =-.第四步,若m d <,则得到5a;否则,将i 的值增加1,仍用i 表示.返回第二步. 第五步,输出5a.程序框图:习题1.1 A 组(P20)1、下面是关于城市居民生活用水收费的问题.为了加强居民的节水意识,某市制订了以下生活用水收费标准:每户每月用水未超过7 m 3时,每立方米收费1.0元,并加收0.2元的城市污水处理费;超过7m 3的部分,每立方收费1.5元,并加收0.4元的城市污水处理费.设某户每月用水量为x m 3,应交纳水费y 元,那么y 与x 之间的函数关系为 1.2,071.9 4.9,7x x y x x ≤≤⎧=⎨->⎩我们设计一个算法来求上述分段函数的值.算法步骤:第一步:输入用户每月用水量x .第二步:判断输入的x 是否不超过7. 若是,则计算 1.2y x =;若不是,则计算 1.9 4.9y x =-.第三步:输出用户应交纳的水费y .程序框图:2、算法步骤:第一步,令i =1,S=0.第二步:若i ≤100成立,则执行第三步;否则输出S. 第三步:计算S=S+i 2.第四步:i = i +1,返回第二步.程序框图:3、算法步骤:第一步,输入人数x ,设收取的卫生费为m 元.第二步:判断x 与3的大小. 若x >3,则费用为5(3) 1.2m x =+-⨯;若x ≤3,则费用为5m =.第三步:输出m .程序框图:B 组 1、算法步骤:第一步,输入111222,,,,,a b c a b c ..第二步:计算21121221b c b c x a b a b -=-.第三步:计算12211221a c a c y ab a b -=-.第四步:输出,x y .程序框图:INPUT “a ,b=”;a ,bsum=a+b diff=a -b pro=a*b quo=a/bPRINT sum ,diff ,pro ,quoEND2、算法步骤:第一步,令n =1第二步:输入一个成绩r ,判断r 与6.8的大小. 若r ≥6.8,则执行下一步;若r<6.8,则输出r ,并执行下一步.第三步:使n 的值增加1,仍用n 表示.第四步:判断n 与成绩个数9的大小. 若n ≤9,则返回第二步;若n >9,则结束算法.程序框图:说明:本题在循环结构的循环体中包含了一个条件结构.1.2基本算法语句 练习(P24) 1、程序:2、程序:3、程序:练习(P29) 1、程序:INPUT “a ,b ,c=”;a ,b ,cIF a+b>c AND a+c>b AND b+c>a THEN PRINT “Yes.” ELSEPRINT “No.” END IF INPUT “a ,b ,c=”;a ,b ,cp=(a+b+c)/2 s=SQR(p*(p -a) *(p -b) *(p -c)) PRINT “s=”;s END INPUT “F=”;F C=(F -32)*5/9 PRINT “C=”;C END4、程序: INPUT “a ,b ,c=”;a ,b ,csum=10.4*a+15.6*b+25.2*c PRINT “sum =”;sum END2、本程序的运行过程为:输入整数x . 若x 是满足9<x <100的两位整数,则先取出x 的十位,记作a ,再取出x 的个位,记作b ,把a ,b 调换位置,分别作两位数的个位数与十位数,然后输出新的两位数. 如输入25,则输出52. 34练习(P32) 1 2习题1.2 A 组(P33)1、1(0)0(0)1(0)x x y x x x -+<⎧⎪==⎨⎪+>⎩23、程序: 习题1.2 B 组(P33) 1、程序:23 41.3算法案例 练习(P45) 1、(1)45; (2)98; (3)24; (4)17. 2、2881.75.3、2200811111011000=() ,820083730=() 习题1.3 A 组(P48) 1、(1)57; (2)55. 2、21324.3、(1)104; (2)7212() (3)1278; (4)6315().4、习题1.3 B 组(P48)1、算法步骤:第一步,令45n =,1i =,0a =,0b =,0c =.第二步,输入()a i .第三步,判断是否0()60a i ≤<. 若是,则1a a =+,并执行第六步. 第四步,判断是否60()80a i ≤<. 若是,则1b b =+,并执行第六步. 第五步,判断是否80()100a i ≤≤. 若是,则1c c =+,并执行第六步. 第六步,1i i =+. 判断是否45i ≤. 若是,则返回第二步.2、如“出入相补”——计算面积的方法,“垛积术”——高阶等差数列的求和方法,等等. 第二章复习参考题A组(P50)1、(1)程序框图:程序:1、(2)程序框图:程序:2、见习题1.2 B组第1题解答.INPUT “x=”;x IF x<0 THENy=0ELSEIF x<1 THENy=1ELSEy=xEND IFEND IFPRINT “y=”;y ENDINPUT “x=”;x IF x<0 THENy=(x+2)^2 ELSEIF x=0 THENy=4ELSEy=(x-2)^2 END IFEND IFPRINT “y=”;y END34、程序框图:程序:INPUT “t=0”;t IF t<0 THEN PRINT “Please input again.”ELSE IF t>0 AND t<=180 THENy=0.2ELSEIF (t -180) MOD 60=0 THENy=0.2+0.1*(t-180)/60ELSEy=0.2+0.1*((t-180)\60+1)END IFEND IFPRINT “y=”;yEND IF END INPUT “n=”;n i=1 S=0WHILE i<=n S=S+1/i i=i+1 WENDPRINT “S=”;S END5、 (1)向下的运动共经过约199.805 m (2)第10次着地后反弹约0.098 m (3)全程共经过约299.609 m 第二章 复习参考题B 组(P35)1、 2、3、算法步骤:第一步,输入一个正整数x 和它的位数n . 第二步,判断n 是不是偶数,如果n 是偶数,令2n m =;如果n 是奇数,令12n m -=. 第三步,令1i =i=100 sum=0 k=1 WHILE k<=10 sum=sum+i i=i /2 k=k+1 WEND PRINT “(1)”;sum PRINT “(2)”;i PRINT “(3)”;2*sum -100 ENDINPUT “n=”;n IF n MOD 7=0 THEN PRINT “Sunday ” END IF IF n MOD 7=1 THEN PRINT “Monday ” END IF IF n MOD 7=2 THEN PRINT “Tuesday ” END IF IF n MOD 7=3 THEN PRINT “Wednesday ” END IF IF n MOD 7=4 THEN PRINT “Thursday ” END IF IF n MOD 7=5 THEN PRINT “Friday ” END IF IF n MOD 7=6 THEN PRINT “Saturday ” END IF END第四步,判断x 的第i 位与第(1)n i +-位上的数字是否相等. 若是,则使i 的值增加1,仍用i 表示;否则,x 不是回文数,结束算法.第五步,判断“i m >”是否成立. 若是,则n 是回文数,结束算法;否则,返回第四步.第二章 统计 2.1随机抽样 练习(P57)1、.况之间有误差. 如抽取的部分个体不能很好地代表总体,那么我们分析出的结果就会有偏差. 2、(1)抽签法:对高一年级全体学生450人进行编号,将学生的名字和对应的编号分别写在卡片上,并把450张卡片放入一个容器中,搅拌均匀后,每次不放回地从中抽取一张卡片,连续抽取50次,就得到参加这项活动的50名学生的编号. (2)随机数表法:第一步,先将450名学生编号,可以编为000,001, (449)第二步,在随机数表中任选一个数. 例如选出第7行第5列的数1(为了便于说明,下面摘取了附表的第6~10行).16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28第三步,从选定的数1开始向右读,得到一个三位数175,由于175<450,说明号码175在总体内,将它取出;继续向右读,得到331,由于331<450,说明号码331在总体内,将它取出;继续向右读,得到572,由于572>450,将它去掉. 按照这种方法继续向右读,依次下去,直到样本的50个号码全部取出,这样我们就得到了参加这项活动的50名学生. 3、用抽签法抽取样本的例子:为检查某班同学的学习情况,可用抽签法取出容量为5的样本. 用随机数表法抽取样本的例子:部分学生的心理调查等.抽签法能够保证总体中任何个体都以相同的机会被选到样本之中,因此保证了样本的代表性.4、与抽签法相比,随机数表法抽取样本的主要优点是节省人力、物力、财力和时间,缺点是所产生的样本不是真正的简单样本. 练习(P59)1、系统抽样的优点是:(1)简便易行;(2)当对总体结构有一定了解时,充分利用已有信息对总体中的个体进行排队后再抽样,可提高抽样调查;(3)当总体中的个体存在一种自然编号(如生产线上产品的质量控制)时,便于施行系统抽样法.系统抽样的缺点是:在不了解样本总体的情况下,所抽出的样本可能有一定的偏差. 2、(1)对这118名教师进行编号;(2)计算间隔1187.37516k==,由于k不是一个整数,我们从总体中随机剔除6个样本,再来进行系统抽样. 例如我们随机剔除了3,46,59,57,112,93这6名教师,然后再对剩余的112位教师进行编号,计算间隔7k=;(3)在1~7之间随机选取一个数字,例如选5,将5加上间隔7得到第2个个体编号12,再加7得到第3个个体编号19,依次进行下去,直到获取整个样本.3、由于身份证(18位)的倒数第二位表示性别,后三位是632的观众全部都是男性,所以这样获得的调查结果不能代表女性观众的意见,因此缺乏代表性.练习(P62)1、略2、这种说法有道理,因为一个好的抽样方法应该能够保证随着样本容量的增加,抽样调查结果会接近于普查的结果. 因此只要根据误差的要求取相应容量的样本进行调查,就可以节省人力、物力和财力.3、可以用分层抽样的方法进行抽样. 将麦田按照气候、土质、田间管理水平的不同而分成不同的层,然后按照各层麦田的面积比例及样本容量确定各层抽取的面积,再在各层中抽取个体(这里的个体是单位面积的一块地).习题2.1 A组(P63)1、产生随机样本的困难:(1)很难确定总体中所有个体的数目,例如调查对象是生产线上生产的产品.(2)成本高,要产生真正的简单随机样本,需要利用类似于抽签法中的抽签试验来产生非负整值随机数.(3)耗时多,产生非负整数值随机数和从总体中挑选出随机数所对的个体都需要时间.2、调查的总体是所有可能看电视的人群.学生A的设计方案考虑的人数是:上网而且登录某网址的人群,那些不能上网的人群,或者不登录某网址的人群就被排除在外了. 因此A方案抽取的样本的代表性差.学生B的设计方案考虑的人群是小区内的居民,有一定的片面性. 因此B方案抽取的样本的代表性差.学生C的设计方案考虑的人群是那些有电话的人群,也有一定的片面性. 因此C方案抽取的样本的代表性.所以,这三种调查方案都有一定的片面性,不能得到比较准确的收视率.3、(1)因为各个年级学习任务和学生年龄等因素的不同,影响各年级学生对学生活动的看法,所以按年级分层进行抽样调查,可以得到更有代表性的样本.(2)在抽样的过程中可能遇到的问题如敏感性问题:有些学生担心提出意见对自己不利;又如不响应问题:由于种种原因,有些学生不能发表意见;等等.(3)前面列举的两个问题都可能导致样本的统计推断结果的误差.(4)为解决敏感性问题,可以采用阅读与思考栏目“如何得到敏感性问题的诚实反应”中的方法设计调查问卷;为解决不响应问题,可以事先向全体学生宣传调查的意义,并安排专人负责发放和催收调查问卷,最大程度地回收有效调查问卷.4、将每一天看作一个个体,则总体由365天组成. 假设要抽取50个样本,将一年中的各天按先后次序编号为0~364天用简单随机抽样设计方案:制作365个号签,依次标上0~364. 将号签放到容器内充分搅拌均匀,从容器中任意不放回取出50个号签. 以签上的号码所对应的那些天构成样本,检测样本中所有个体的空气质量.用系统抽样设计抽样方案:先通过简单随机抽样方法从365天中随机抽出15天,再把剩下的350天重新按先后次序编号为0~349. 制作7个分别标有0~7的号签,放在容器中充分搅拌均匀. 从容器中任意取出一个号签,设取出的号签的编号为a,则编号为7(050)a k k +≤<所对应的那些天构成样本,检测样本中所有个体的空气质量.显然,系统抽样方案抽出的样本中个体在一年中排列的次序更规律,因此更好实施,更受方案的实施者欢迎.5、田径队运动员的总人数是564298+=(人),要得到28人的样本,占总体的比例为27.于是,应该在男运动员中随机抽取256167⨯=(人),在女运动员中随机抽取281612-=(人).这样我们就可以得到一个容量为28的样本.6、以10为分段间隔,首先在1~10的编号中,随机地选取一个编号,如6,那么这个获奖者奖品的编号是:6,16,26,36,46.7、说明:可以按年级分层抽样的方法设计方案. 习题2.1 B 组(P64)1、说明:可以按年级分层抽样的方法设计方案,调查问卷由学生所关心的问题组成. 例如:(1)你最喜欢哪一门课程? (2)你每月的零花钱平均是多少? (3)你最喜欢看《新闻联播》吗? (4)你每天早上几点起床? (5)你每天晚上几点睡觉?要根据统计的结果和具体的情况解释结论,主要从引起结论的可能原因及结论本身含义来解释.2、说明:这是一个开放性的题目,没有一个标准的答案. 2.2用样本估计总体 练习(P71) 1、说明:由于样本的极差为364.41362.51 1.90-=,取组距为0.19,将样本分为10组. 可以按照书上的方法制作频率分布表、频率分布直观图和频率折线图. 2、说明:此题目属于应用题,没有标准的答案.3、茎叶图为:由该图可以看出30名工人的日加工零件个数稳定在120件左右. 练习(P74)这里应该采用平均数来表示每一个国家项目的平均金额,因为它能反应所有项目的信息. 但平均数会受到极端数据2000万元的影响,所以大多数项目投资金额都和平均数相差比较大.练习(P79)1、甲乙两种水稻6年平均产量的平均数都是900,但甲的标准差约等于23.8,乙的标准差约等于41.6,所以甲的产量比较稳定.2、(1)平均重量496.86x ≈,标准差 6.55s ≈.(2)重量位于(,)x s x s -+之间有14袋白糖,所占的百分比约为66.67%.3、(1)略. (2)平均分19.25x ≈,中位数为15.2,标准差12.50s ≈.这些数据表明这些国家男性患该病的平均死亡率约为19.25,有一半国家的死亡率不超过15.2,15.2x >说明存在大的异常数据,值得关注. 这些异常数据使标准差增大. 习题2.2 A 组(P81) 1、(1)茎叶图为:(2)汞含量分布偏向于大于1.00 ppm 的方向,即多数鱼的汞含量分布在大于1.00 ppm 的区域. (3)不一定. 因为我们不知道各批鱼的汞含量分布是否都和这批鱼相同. 即使各批鱼的汞含量分布相同,上面的数据只能为这个分布作出估计,不能保证平均汞含量大于1.00 ppm. (4)样本平均数 1.08x ≈,样本标准差0.45s ≈.(5)有28条鱼的汞含量在平均数与2倍标准差的和(差)的范围内.2比较短,所以在这批棉花中混进了一些次品.3、说明:应该查阅一下这所大学的其他招生信息,例如平均数信息、最低录取分数线信息等. 尽管该校友的分数位于中位数之下,而中位数本身并不能提供更多录取分数分布的信息.在已知最低录取分数线的情况下,很容易做出判断;在已知平均数小于中位数很多,则说明最低录取分数线较低,可以推荐该校友报考这所大学,否则还要获取其他的信息(如标准差的信息)来做出判断. 4、说明:(1)对,从平均数的角度考虑; (2)对,从标准差的角度考虑;(3)对,从标准差的角度考虑; (4)对,从平均数和标准差的角度考虑; 5、(1)不能. 因为平均收入和最高收入相差太多,说明高收入的职工只占极少数. 现在已知知道至少有一个人的收入为50100x =万元,那么其他员工的收入之和为4913.55010075ii x==⨯-=∑(万元)每人平均只有1.53. 如果再有几个收入特别高者,那么初进公司的员工的收入将会很低. (2)不能,要看中位数是多少.(3)能,可以确定有75%的员工工资在1万元以上,其中25%的员工工资在3万元以上.(4)收入的中位数大约是2万. 因为有年收入100万这个极端值的影响,使得年平均收入比中位数高许多.6、甲机床的平均数=1.5x 甲,标准差=1.2845s 甲;乙机床的平均数 1.2z y =,标准差0.8718z s =. 比较发现乙机床的平均数小而且标准差也比较小,说明乙机床生产出的次品比甲机床少,而且更为稳定,所以乙机床的性能较好. 7、(1)总体平均数为199.75,总体标准差为95.26. (2)可以使用抓阄法进行抽样. 样本平均数和标准差的计算结果和抽取到的样本有关. (3) (4)略 习题2.2 B 组(P82)1、(1)由于测试1T 的标准差小,所以测试1T 结果更稳定,所以该测试做得更好一些. (2)由于2T 测出的值偏高,有利于增强队员的信心,所以应该选择测试2T .2、说明:此题需要在本节开始的时候就布置,先让学生分头收集数据,汇总所收集的数据才能完成题目.2.3变量间的相关关系 练习(P85)1、从已经掌握的知识来看,吸烟会损害身体的健康. 但除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果. 我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题. 但吸烟引起健康问题的可能性大,因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.2、从现在我们掌握的知识来看,没有发现根据说明“天鹅能够带来孩子”,完全可能存在既能吸引天鹅和又使婴儿出生率高的第3个因素(例如独特的环境因素),即天鹅与婴儿出生率之间没有直接的关系,因此“天鹅能够带来孩子”的结论不可靠.而要证实此结论是否可靠,可以通过试验来进行. 相同的环境下将居民随机地分为两组,一组居民和天鹅一起生活(比如家中都饲养天鹅),而另一组居民的附近不让天鹅活动,对比两组居民的出生率是否相同. 练习(P92)1、当0x =时,147.767y =,这个值与实际卖出的热饮杯数150不符,原因是:线性回归方程中的截距和斜率都是通过样本估计的,存在随机误差,这种误差可以导致预测结果的偏差;即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x ,预报值y 能够等于实际值y . 事实上:y bx a e =++. (这里e 是随机变量,是引起预报值y 与真实值(1)散点图如下: y 之间的误差的原因之一,其大小取决于e 的方差.)2、数据的散点图为:从这个散点图中可以看出,鸟的种类数与海拔高度应该为正相关(事实上相关系数为0.793). 但是从散点图的分布特点来看,它们之间的线性相关性不强. 习题2.3 A 组(P94)1、教师的水平与学生的学习成绩呈正相关关系. 又如,“水涨船高”“登高望远”等.2、(3)基本成正相关关系,即食品所含热量越高,口味越好.(4)因为当回归直线上方的食品与下方的食品所含热量相同时,其口味更好. 3、(1)散点图如下:(2)回归方程为:0.66954.933y x =+.(2)回归直线如下图所示:(3)加工零件的个数与所花费的时间呈正线性相关关系. 4、(1)散点图为:(2)回归方程为:0.546876.425y x =+.(3)由回归方程知,城镇居民的消费水平和工资收入之间呈正线性相关关系,即工资收入水平越高,城镇居民的消费水平越高. 习题2.3 B 组(P95) 1、(1)散点图如下:(2)回归方程为: 1.44715.843y x =-.(3)如果这座城市居民的年收入达到40亿元,估计这种商品的销售额为42.037y ≈(万元). 2、说明:本题是一个讨论题,按照教科书中的方法逐步展开即可.第二章 复习参考题A 组(P100)1、A .2、(1)该组的数据个数,该组的频数除以全体数据总数; (2)nmN. 3、(1)这个结果只能说明A 城市中光顾这家服务连锁店的人比其他人较少倾向于选择咖啡色,因为光顾连锁店的人使一种方便样本,不能代表A 城市其他人群的想法. (2)这两种调查的差异是由样本的代表性所引起的. 因为A 城市的调查结果来自于该市光顾这家服装连锁店的人群,这个样本不能很好地代表全国民众的观点.4、说明:这是一个敏感性问题,可以模仿阅读与思考栏目“如何得到敏感性问题的诚实反应”来设计提问方法.5、表略. 可以估计出句子中所含单词的分布,以及与该分布有关的数字特征,如平均数、标准差等.6、(1)可以用样本标准差来度量每一组成员的相似性,样本标准差越小,相似程度越高. (2)A 组的样本标准差为 3.730A S ≈,B 组的样本标准差为11.789B S ≈. 由于专业裁判给分更符合专业规则,相似程度应该高,因此A 组更像是由专业人士组成的.7、(1)中位数为182.5,平均数为217.1875.(2)这两种数字特征不同的主要原因是,430比其他的数据大得多,应该查找430是否由某种错误而产生的. 如果这个大数据的采集正确,用平均数更合适,因为它利用了所有数据的信息;如果这个大数据的采集不正确,用中位数更合适,因为它不受极端值的影响,稳定性好. 8、(1)略.(2)系数0.42是回归直线的斜率,意味着:对于农村考生,每年的入学率平均增长0.42%.(3)城市的大学入学率年增长最快. 说明:(4)可以模仿(1)(2)(3)的方法分析数据.第二章 复习参考题B 组(P101)1、频率分布如下表:从表中看出当把指标定为17.46千元 时,月65%的推销员 经过努力才能完成销 售指标.2、(1)数据的散点图如下:(2)用y 表示身高,x 表示年龄,则数据的回归方程为 6.31771.984y x =+. (3)在该例中,斜率6.317表示孩子在一年中增加的高度.(4)每年身高的增长数略. 3~16岁的身高年均增长约为6.323 cm. (5)斜率与每年平均增长的身高之间之间近似相等.第三章 概率3.1随机事件的概率 练习(P113) 1、(1)试验可能出现的结果有3个,两个均为正面、一个正面一个反面、两个均为反面. (2)通过与其他同学的结果汇总,可以发现出现一个正面一个反面的次数最多,大约在50次左右,两个均为正面的次数和两个均为反面的次数在25次左右. 由此可以估计出现一个正面一个反面的概率为0.50,出现两个均为正面的概率和两个均为反面的概率均为0.25. 2、略 3、(1)例如:北京四月飞雪;某人花两元钱买福利彩票,中了特等奖;同时抛10枚硬币,10枚都正面朝上.(2)例如:在王府井大街问路时,碰到会说中文的人;去烤鸭店吃饭的顾客点烤鸭;在1~1000的自然数任选一个数,选到的数大于1. 练习(P118)1、说明:例如,计算机键盘上各键盘的安排,公交线路及其各站点的安排,抽奖活动中各奖项的安排等,其中都用到了概率. 学生可能举出各种各样的例子,关键是引导他们正确分析例子中蕴涵的概率思想.2、通过掷硬币或抽签的方法,决定谁先发球,这两种方法都是公平的. 而猜拳的方法不太公平,因为出拳有时间差,个人反应也不一样.3、这种说法是错误的. 因为掷骰子一次得到2是一个随机事件,在一次试验中它可能发生也可能不发生. 掷6次骰子就是做6次试验,每次试验的结果都是随机的,可能出现2也可能不出现2,所以6次试验中有可能一次2都不出现,也可能出现1次,2次,…,6次. 练习(P121)1、0.72、0.6153、0.44、D5、B 习题3.1 A 组(P123) 1、D . 2、(1)0; (2)0.2; (3)1.3、(1)430.067645≈; (2)900.140645≈; (3)7010.891645-≈.4、略5、0.136、说明:本题是想通过试验的方法,得到这种摸球游戏对先摸者和后摸者是公平的结论. 最好把全班同学的结果汇总,根据两个事件出现的频率比较近,猜测在第一种情况下摸到红球的概率为110,在第二种下也为110. 第4次摸到红球的频率与第1次摸到红球的频率应该相差不远,因为不论哪种情况,第4次和第1次摸到红球的概率都是1 10.习题3.1 B组(P124)1、D.2、略. 说明:本题是为了学生根据实际数据作出一些推断. 一般我们假定每个人的生日在12个月中哪一个月是等可能的,这个假定是否成立,引导学生通过收集的数据作出初步的推断.3.2古典概率练习(P130)1、110. 2、17. 3、16.练习(P133)1、38,38.2、(1)113;(2)1213;(3)14;(4)313;(5)0;(6)213;(7)12;(8)1.说明:模拟的方法有两种.(1)把1~52个自然数分别与每张牌对应,再用计算机做模拟试验.(2)让计算机分两次产生两个随机数,第一次产生1~4的随机数,代表4个花色;第二次产生1~13的随机数,代表牌号.3、(1)不可能事件,概率为0;(2)随机事件,概率为49;(3)必然事件,概率为1;(4)让计算机产生1~9的随机数,1~4代表白球,5~9代表黑球.4、(1)16;(2)略;(3)应该相差不大,但会有差异. 存在差异的主要原因是随机事件在每次试验中是否发生是随机的,但在200次试验中,该事件发生的次数又是有规律的,所以一般情况下所得的频率与概率相差不大.习题3.2 A组(P133)1、游戏1:取红球与取白球的概率都为12,因此规则是公平的.游戏2:取两球同色的概率为13,异色的概率为23,因此规则是不公平的.游戏3:取两球同色的概率为12,异色的概率为12,因此规则是公平的.2、第一位可以是1~9这9个数字中的一个,第二位可以是0~9这10个数字中的一个,所以(1)190;(2)18919090-=;(3)9919010-=3、(1)0.52;(2)0.18.4、(1)12;(2)16;(3)56;(4)16.5、(1)25;(2)825.6、(1)920;(2)920;(3)12.习题3.2 B组(P134)1、(1)13;(2)14.2、(1)35;(2)310;(3)910.说明:(3)先计算该事件的对立事件发生的概率会比较简单.3、具体步骤如下:①建立概率模型. 首先要模拟每个人的出生月份,可用1,2,…,11,12表示月份,用产生取整数值的随机数的办法,随机产生1~12之间的随机数. 由于模拟的对象是一个有10个人的集体,故把连续产生的10个随机数作为一组模拟结果,可模拟产生100组这样的结果.②进行模拟试验. 可用计算器或计算机进行模拟试验.如使用Excel软件,可参看教科书125页的步骤,下图是模拟的结果:其中,A,B,C,D,E,F,G,H,I,J的每一行表示对一个10人集体的模拟结果. 这样的试验一共做了100次,所以共有100行,表示随机抽取了100个集体.③统计试验的结果. K,L,M,N列表示统计结果. 例如,第一行前十列中至少有两个数相同,表示这个集体中至少有两个人的生日在同一月. 本题的难点是统计每一行前十列中至少有两个数相同的个数. 由于需要判断的条件态度,所以用K,L,M三列分三次完成统计.其中K列的公式为“=IF(OR(A1=B1,A1=C1,A1=D1,A1=E1,A1=F1,A1=G1,A1=H1,A1=I1,A1=J1,B1=C1,B1=D1,B1=E1,B1=F1,B1=G1,B1=H1,B1=I1,B1=J1,C1=D1,C1=E1,C1=F1,C1=G1,C1=H1,C1=I1,C1=J1,D1=E1,D1=F1,D1=G1,D1=H1,D1=I1,D1=J1),1,0)”,L列的公式为“=IF(OR(E1=F1,E1=G1,E1=H1,E1=I1,E1=J1,F1=G1,F1=H1,F1=I1,F1=J1,G1=H1,G1=I1,G1=J1,H1=I1,H1=J1,I1=J1),1,0)”,M列的公式为“=IF(OR(K1=1,L1=1),1,0)”,M列的值为1表示该行所代表的10人集体中至少有两个人的生日在同一个月. N1表示100个10人集体中至少有两个人的生日在同一个月的个数,其公式为“=SUM(M$1:M$100)”. N1除以100所得的结果0.98,就是用模拟方法计算10人集体中至少有两个人的生日在同一个月的概率的估计值. 可以看出,这个估计值很接近1.3.3几何概率。
高中苏教版数学③第2章统计水平测试题一、选择题1.某学院有四个饲养房,分别养有18、54、24、48只白鼠供实验用.某项实验需抽取24只白鼠,你认为最合适的抽样方法为()A.在每个饲养房各抽取6只B.把所有白鼠都戴上编有不同号码的颈圈,用简单随机抽样法抽取24只C.把所有白鼠进行编号用系统抽样法抽取24只D.先确定这四个饲养房应分别抽取3、9、4、8只样品,再从各饲养房用简单随机抽样法确定各自需捕出的对象答案:D2.有一个容量为50的样本数据,分组和各组的频数如下:[)[)[)1.261.5631.561.8681.862.1692.162.4611 2.462.7610 2.763.065,;,;,;,;,;,;[)[)[)[),之间的数据大约占()1.862.763.063.364,.估计总体中在[)A.60%B.92%C.5%D.65%答案:A3.下列两个量之间为相关关系的是()A.正方形的面积和边长B.汽车行驶的平均速度和行驶路程C.生活小区内某户居民的用电量和电费D.一个人的身高和年龄答案:D4.如果将一组数据中的每一个数据都加上同一个非零常数,那么这组数据的()A.平均数与方差都不变B.平均数不变,方差改变C.平均数改变,方差不变D.平均数和方差都改变答案:C5.设回归直线方程为 23=-,则变量x增加一个单位时()y xA.y平均减少3个单位B.y平均增加2个单位C.y平均增加3个单位D.y平均减少2个单位答案:A6.对于样本频率直方图与总体密度曲线的关系,下列说法正确的是()A.频率分布直方图与总体密度曲线无关B.频率分布直方图就是总体密度曲线C.样本容量很大的频率分布直方图就是总体密度曲线D.如果样本容量无限增大,分组的组距离无限减小,那么频率分布直方图就会无限接近于总体密度曲线答案:D7.已知样本数据12n x x x ,,,的平均数为h ,1y ,2y ,…,m y 的平均数为k ,则把两组数据合并成一组以后,这组样本的平均数为( ) A.2h k+ B.nh mkm n++ C.mh nk m n++ D.h km n ++答案:B8.若一棉农分别种两种不同品种的棉花,连续五年的亩产量(单位:千克/亩)如下表:品种甲68 72 70 69 71品种乙6971 68 68 69则平均产量较高与产量较稳定的分别是( ) A.品种甲,品种甲 B.品种甲,品种乙C.品种乙,品种甲 D.品种乙,品种乙 答案:B9.如右图所示,有5组数据,去掉哪组数据后, 剩下的4组数据的线性相关关系数最大( ) A.E B.D C.B D.A 答案:B10.已知一个样本x ,1,y ,5.其中x ,y 是方程组22210x y x y +=⎧⎨+=⎩的解,则这个样本的标准差是( )A.2 B.2 C.5 D.5 答案:C11.在抽查产品的尺寸过程中,将其尺寸分成若干组.[)a b ,是其中的一组,抽查出的个体在该组上的频率为m ,该组上的直方图的高为h ,则a b -=( ) A.hmB.m hC.h m D.h m + 答案:B12.回归直线的系数a ,b 的最小二乘估计,使函数()Q a b ,最小,Q 函数指的是( ) A.2221122()()()n n y bx a y bx a y bx a --+--++--B.1122n n y bx a y bx a y bx a --+--++-- C.211()y bx a -- D.11y bx a --答案:A 二、填空题13.一个容量为10的样本数据,分组后,组距与频数如下:组距 (]12,(]23,(]34,(]45,]56,(]67,频数1 123 1 2则样本落在区间(]5-∞,的频率是 .答案:0.714.某班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:平均分标准差第一组 90 6第二组80 4则全班的标准差为 . 答案:5115.若施化肥量x (kg )与水稻产量y 的回归直线方程为 5250y x =+,则当施化肥量为80kg 时,预计的水稻产量为 . 答案:650kg16.某学校在一次演讲比赛中,共有7个评委,学生最后得分为去掉一个最高分和一个最低分的平均分,某学生所得的分数为:9.6,9.4,9.6,9.7,9.7,9.5,9.6,这组数据的众数 是 ,学生最后得分为 . 答案:9.6;9.6 三、解答题17.某运输队有货车1201辆,客车800辆,从中抽取110调查车辆的使用和保养情况.请给出抽样过程.解:因为货车和客车的使用和保养情况有明显的差别,所以用分层抽样.统 计 量组 别第一步,明确货车和客车各应抽取多少辆,货车应抽取1120112010⨯≈辆,客车应抽取18008010⨯=辆; 第二步:先用简单随机抽样法从货车中随机选取一辆剔除,再用系统抽样方法分别抽取货车120辆,客车80辆, 这此货车和客车便组成了所要抽取的样本.18.从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)79.5~89.5这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格). 解:(1)观察频率分布直方图易知,79.589.5 这一组的频率为:0.025100.25⨯=,频数为:600.2515⨯=;(2)由于0.015100.03520.025100.005100.75⨯+⨯+⨯+⨯=,故估计这次环保知识竞赛的及格率为0.75.19.对甲、乙同学的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:甲60 80 70 90 70 乙8060 70 80 75问甲、乙谁的平均成绩好?谁的各门功课发展较平衡?解:1(6080709070)745x =++++=甲,1(8060708075)735x =++++=乙,2222221(1464164)1045s =++++=甲,2222221(713372)565s =++++=乙;因为x x >甲乙,22s s >乙甲, 所以甲的平均成绩较好,乙的各门功课发展较平衡.20.已知数据12345x x x x x ,,,,是互不相等的正整数,且3x =,中位数为3,求该组数据的方差.解:不妨设1234x x x x <<<,由中位数的条件,知33x =. 又12345x x x x x *∈N ,,,,, 所以1212x x ==,.又3x =,所以459x x +=. 所以44x =,55x =,所以2222221[(13)(23)(33)(43)(53)]25s =-+-+-+-+-=.故这组数据的方差为2.21.某展览馆22天中每天进馆参观的人数如下: 180 158 170 185 189 180 184 185 140 179 192 185 190 165 182 170 190 183 175 180 185 148计算参观人数的中位数、众数、平均数、标准差. 解:(1)将数据从小到大排列可知,第11个数是180,第12个数是182,所以中位数为181; (2)因为185有4个,其余数均少于4个,所以众数为185; (3)平均数为(140192)22177x =++÷≈ ; (4)计算器计算,得2221221()()()13.3522s x x x x x x =-+-++-≈ . 22.某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从这个工业部门内随机抽取了10个部门作样本,有如下资料:产量 x (千件) 40424855657988100120140生产费用 y (千元)150140160170150162185165190185(1)画出散点图;(2)若两个变量之间线性相关,求出回归直线方程. 解:(1)散点图略; (2)77.7x =,165.7y =,102170903i i x ==∑,101132938i i i x y ==∑,21329381077.7165.70.398709031077.7b -⨯⨯=≈-⨯,165.70.39877.7134.8a =-⨯≈. 故所求回归直线方程为 0.398134.8y x =+.。
§2 统计◆ 基本定义:(1)总体:在统计中,所有考查对象的全体叫做全体.(2) 个体:在所有考查对象中的每一个考查对象都叫做个体. (3) 样本:从总体中抽取的一部分个体叫做总体的样本. (4) 样本容量:样本中个体的数目叫做样本容量.❖ 抽样方法:(1)简单随机抽样(simple random sampling ):设一个总体的个数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时每个个体被抽到的概率相等,就称这样的抽样为简单的随机抽样,简单随机抽样常用的方法有抽签法和随机数表法. (关于制签和随机数表的制作,请参照课本第41页)(2)系统抽样(systematic sampling):将总体平均分成几个部分,然后按照一定的规则,从每一部分抽取一个个体作为样本。
先用随机的方法将总体进行编号,如果整除不能被n N 就从中用随机数表法剔除几个个体,使得能整除,然后分组,一般是样本容量是多少,就分几组,间隔nNk =,然后从第一组中用简单实际抽样的方法抽取一个个体,假设编号为 l ,然后就可以将编号为()k n l k l k l l 1...2,,-+++++ 的个体抽出作为样本,实际就是从每一组抽取与第一组相同编号的个体。
(3)分层抽样(stratifed sampling ):当已知总体是由有差异明显的几部分组成时,常将总体分成几部分,然后按各部分所占的比例进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层.样本容量越大,估计越精确!颜老师友情提醒:1. 把每一种抽样的具体步骤看清楚,要求会写过程2. 个体数N 的总体中抽取一个样本容量为n 的样本,那么在整个抽样过程中每个个体被抽到的概率都相等,且等于Nn.其实三种抽样的每一个个体都是等几率的被抽到的 3. 三种抽样都是不放回的抽样 4. 在具体问题中对于样本,总体,个体应该时代单位的,如考察一个班级的学生的视力状况,从中抽取20个同学,则个体应该是20名同学的视力,而不是20名同学,样本容量则为20,同样的总体也是全班级同学的视力♦ 两种抽样方法的区别与联系:★ 典型例题剖析:例1、一个总体含有6个个体,从中抽取一个样本容量为2的样本,说明为什么在整个抽样过程中每个个体被抽到的概率相等.解:设任意一个个体为α,那么个体α被抽到分两种情况:(1)第一次被抽到:根据等可能事件概率得P 1=61, (2)第二次被抽到:即是个体α第一次没被抽到、第二次被抽到这两件事都发生.个体α第一次没被抽到的概率是65, 个体α第一次没被抽第二次被抽到的概率是51.根据相互独立事件同时发生的概率公式, 个体α第二次被抽到的概率是P 2=65×51=61.(也可这样分析:根据等可能事件的概率求得,一共取了两次,根据分步原理所有可能结果为6×5=30,个体α第一次没被抽到第二次被抽到这个随机事件所含的可能结果为5×1=5,所以个体α第二次被抽到的概率是P 2=305=61) 个体α在第一次被抽到与在第二次被抽到是互斥事件,根据互斥事件的概率加法公式,在先后抽取2个个体的过程中,个体α被抽到的概率P= P 1+ P 2=61+61=31. 由个体α的任意性,说明在抽样过程中每个个体被抽到的概率都相等(都等于31) 点评:注意区分“任一个个体α每次抽取时被抽到的概率”与“任一个个体α在整个抽样过程中个体α被抽到的概率”的区别,一般地,如果用简单随机抽样从个体数为N 的总体中抽取一个容量为n 的样本,那么“任一个个体α每次抽取时被抽到的概率”都相等且等于N1,“任一个个体α在整个抽样过程中被抽到的概率”为Nn . 例2、(1)在120个零件中,一级品24个,二级品36个,三级品60个,从中抽取一个容量为20的一个样本,求 ① 每个个体被抽到的概率,② 若有简单随机抽样方法抽取时,其中个体α第15次被抽到的的概率, ③ 若用分层抽抽样样方法抽取时其中一级品中的每个个体被抽到的概率.解:① 因为总体个数为120,样本容量为20,则每个个体被抽到的概率P 1=12020=61② 因为总体个数为120,则体α第15次被抽到的的概率P 2=1201 ③ 用分层抽样方法:按比例12020=61分别在一级品、二级品、三级品中抽取24×61=4个,36×61=6个,60×61=10,所以一级品中的每个个体被抽到的概率为P 3=244=61.注:其实用分层抽样方法抽取时二级品、三级品中每个体被抽到的概率也都为61.点评:本题说明两种抽样方法都能保证在抽样过程中,每个个体被抽到的概率都相等.且为Nn . 例3、某地区有3000人参加今年的高考,现从中抽取一个样本对他们进行分析,每个考生被抽到的概率为101,求这个样本容量. 解:设样本容量为n ,则3000n =101,所以n=300.点评:“在整个抽样过程中个体α被抽到的概率”为Nn这一结论的逆用. 例4、下列抽取样本的方式是否属于简单随机抽样?说明理由. (1) 从无限多个个体中抽取50个个体作样本.(2) 盒子里共有100个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.解:(1) 不是简单随机抽样.由于被抽取样本的总体个数是无限的.(2) 不是简单随机抽样.由于不符合“逐个抽取”的原则,且抽出的结果可能是只有一个零件重复出现.点评:简单随机抽样的特点:(1) 它要求被抽取样本的总体个数是有限的. (2) 它是从总体中逐个地进行抽取. (3) 它是一种不放回抽样.例5、 某校有学生1200人,为了调查午休对学习成绩的影响情况,计划抽取一个样本容量为60的样本,问此样本若采用简单随机抽样将如何进行?解:可用两种方法: 方法一:(抽签法)(1)编号: 将1200名学生进行随机编号为1,2, …,1200,(可按学生的学号或按学生的生日进行编号).(2)制签:做1200个大小、形状相同的号签,分别写上这1200个数,放在个容器里,并进行均匀搅拌.(3)逐个抽取:连续抽取60个号签,号签对应的同学即为样本. 方法二:(随机数表法)(1)编号: 将1200名学生进行编号分别为0000,0001,…, 1199,(2)选数:在课本附表1随机数表中任选一个数作为开始.(如从第11行第7列的数9开始)(3) 读数:从选定的数开始向右(或向上、向下、向左)读下去,选取介于范围的号码,直到满60个号码为止.(4) 抽取:抽取与读出的号码相对应的学生进行分析.点评:抽签法和随机数表法是常见的两种简单随机抽样方法,本问题显然用随机数表法更方便一些,因为总体个数较多.另外随机数表法编号时,位数要一样,首数确定后,可向左、向右、向上、向下各个确定的方向进行抽取.例6、某工厂中共有职工3000人,其中,中、青、老职工的比例为5∶3∶2,从所有职工中抽取一个样本容量为400的样本,应采取哪种抽样方法较合理?且中、青、老年职工应分别抽取多少人?解:采用分层抽抽样样方法较为合理.由样本容量为400,中、青、老职工的比例为5∶3∶2,所以应抽取中年职工为400×105=200人, 应抽取青年职工为400×103=120人, 应抽取青年职工为400×102=80人. 例6. 见课本43P 例1.点评:因为总体由三类差异较明显的个体构成,所以应采用分层抽抽样样方法进行抽取.总体分布的估计ⅰ.频率分布表:见课本第51页: ★ 例11. 注意全距,组距的确定。
第二章:统计复习课学习目标1.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的问题;2.能通过对数据的分析,为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.二.知识梳理本章知识共分为三部分:1.随机抽样:三种方法------简单随机抽样、系统抽样、分层抽样2.用样本估计总体:两种方法------用样本的频率a:分布估计总体分布、用样本的数字特征估计总体的数字特征.①用样本的频率分布估计总体分布:频率分布直方图的特征.画茎叶图的步骤.②用样本的数字特征估计总体的数字特征:利用频率分布直方图估计众数、中位数、平均数.b:标准差,方差.3.变量间的相关关系:①变量之间的相关关系:a、确定性的函数关系.b、带有随机性的变量间的相关关系.②两个变量的线性相关:a、散点图的概念.b、正相关与负相关的概念.c、线性相关关系.d、线性回归方程.※ 典型例题1.在一次有奖明信片的100 000个有机会中奖的号码(编号00000—99999)中,邮政部门按照随机抽取的方式确定后两位是23的作为中奖号码,这是运用了________抽样方法.2.某单位有500名职工,其中不到35岁的有125人,35岁~49岁的有280人,50岁以上的有95人.为了了解该单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本,应该用___________抽样法.3.某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取1个容量为100户的样本,记做①;某学校高一年级有12名女排运动员,要从中选出3个调查学习负担情况,记做②.那么完成上述2项调查应采用的抽样方法是( )A.①用简单随机抽样法,②用系统抽样法B.①用分层抽样法,②用简单随机抽样法C.①用系统抽样法,②用分层抽样法D.①用分层抽样法,②用系统抽样法4.某公司生产三种型号的轿车,产量分别为1200辆,6000辆和2000辆.为检验该公司的产品质量,现用分层抽样的方法抽取46辆舒畅行检验,这三种型号的轿车依次应抽取______________辆.5.有一个样本容量为50的样本数据分布如下,[)5.15,5.12 3; [)5.18,5.15 8;[)5.21,5.18 9; [)5.24,5.21 11;[)5.27,5.2410; [)5.30,5.27 6;[)5.33,5.30 3.估计小于30的数据大约占有 ( ) A.9400 B.600 C.8800 D.1200※ 动手试试1.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为S12= 13.2,S22=26.26,则( ).A .甲班10名学生的成绩比乙班10名学生的成绩整齐B .乙班10名学生的成绩比甲班10名学生的成绩整齐C .甲、乙两班10名学生的成绩一样整齐D .不能比较甲、乙两班10名学生成绩的整齐程度7.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输人为15,那么由此求出的平均数与实际平均数的差是( ).A .3.5B .-3C .3D .-0.58.如果一组数中每个数减去同一个非零常数,则这一组数的( ).A .平均数不变,方差不变B .平均数改变,方差改变C.平均数不变,方差改变D.平均数改变,方差不变三、总结提升※ 学习小结本章主要介绍最基本的获取样本数据的方法,以及集中从样本数据中提取信息的统计方法,其中包括用样本估计总体分布、数字特征和线性回归等内容。
2.2.2 用样本的数字特征估计总体的数字特征第2课时方差、标准差课时目标1.理解方差、标准差的意义,会计算一组数据的方差和标准差,掌握用样本方差或标准差去估计总体方差或总体标准差的方法.2.会用平均数和方差对数据进行处理与比较.识记强化标准差及方差考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s表示.标准差的平方s2叫做方差,也为测量样本数据分散程度的工具.若样本数据是x1,x2,…,x n,x表示这组数据的平均数,则s=1n[x1-x2+x2-x2+…+x n-x2];s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].课时作业一、选择题1.下列说法正确的是( )A.在两组数据中,平均值较大的一组方差较大C .2x -+3和s 2D .2x -+3和4s 2+12s +9 答案:B解析:由平均数、方差的求法可得.6.甲、乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲、乙两同学在这次篮球比赛活动中,发挥得更稳定的是( )A .甲B .乙C .甲、乙相同D .不能确定 答案:B解析:方差或标准差越小,数据的离散程度越小,表明发挥得越稳定.∵5.09>3.72,故选B.二、填空题7.已知样本9、10、11、x 、y 的平均数是10,方差是2,则xy =________. 答案:96解析:由平均数得9+10+11+x +y =50,∴x +y =20,又由(9-10)2+(10-10)2+(11-10)2+(x -10)2+(y -10)2=(2)2×5=10,得x 2+y 2-20(x +y )=-192,(x +y )2-2xy -20(x +y )=-192,xy =96.8.如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.答案:6.8解析:x =15(8+9+10+13+15)=11,s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.9.若k 1,k 2,…,k 8的方差为3,则2(k 1-3),2(k 2-3),…,2(k 8-3)的方差为________. 答案:12解析:设k 1,k 2,…,k 8的平均数为k ,则18[(k 1-k )2+(k 2-k )2+…+(k 8-k )2]=3,而2(k 1-3),2(k 2-3),…,2(k 8-3)的平均数为2(k -3),解析:x 9=x 8+19(x 9-x 8)=5+19×(4-5)=449,s 29=89[s 28+19(x 9-x 8)2]=89[22+19(4-5)2]=29681. 13.下图为我国10座名山的“身高”统计图,请根据图中信息回答下列问题。
第二章 2.1 随机抽样2.1.1简单随机抽样1.理解并掌握简单随机抽样的概念、特点和步骤.2.掌握简单随机抽样的两种方法.知识梳理自主学习题型探究重点突破当堂检测自查自纠知识梳理自主学习知识点一统计的相关概念名称定义总体所要考察对象的全体叫做总体样本从总体中抽取出的若干个个体组成的集合叫做总体的一个样本个体总体中的每一个考察对象叫做个体样本容量样本中个体的数目叫做样本容量思考样本与样本容量有什么区别?答样本与样本容量是两个不同的概念.样本是从总体中抽取的个体组成的集合,是对象;样本容量是样本中个体的数目,是一个数.答案知识点二简单随机抽样1.简单随机抽样的定义设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的特点特点说明个体数有限要求总体的个体数有限,这样便于通过随机抽取的样本对总体进行分析逐个抽取从总体中逐个进行抽取,这样便于在抽取过程中进行操作不放回抽样由于抽样试验中多采用不放回抽样,使其具有广泛的应用性,而且所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算等可能抽样在整个抽样过程中,各个个体被抽取的机会都相等,从而保证了这种抽样方法的公平性知识点三最常用的简单随机抽样的方法1.抽签法(1)抽签法(抓阄法):抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.(2)抽签法的步骤:①编号:对总体中的N个个体进行编号(号码可以是1~N,也可以使用已知的号码);②制签:将1~N这N个编号写在大小、形状都相同的号签上(号签可以是纸条、卡片或小球等);③均匀搅拌:将写好的号签放入一个不透明的容器中,搅拌均匀;④抽签:从容器中每次不放回地抽取一个号签,连续抽取n次,并记录其编号;⑤确定样本:从总体中找出与号签上的号码所对应的个体,组成样本.2.随机数法(1)随机数法:利用随机数表、随机数骰子或计算机产生的随机数进行抽样.(2)随机数表法的一般步骤:①编号:将总体中的每个个体进行编号;②选定初始值(数);为保证所选数字的随机性,在面对随机数表之前就指出开始数字的位置;③选号:从选定的数字开始按照一定的方向读下去,若得到的号码不在编号中或已被选用,则跳过,直到选满所需号码为止;④确定样本:从总体中找出按步骤③选出的号码所对应的个体,组成样本.3.抽签法与随机数法的异同点抽签法随机数表法不同点①抽签法比随机数法简单;②抽签法适用于总体中的个体数相对较少的情况①随机数法要求编号的位数相同;②随机数法适用于总体中的个体数相对较多的情况相同点①都是简单随机抽样,并且要求被抽取样本的总体的个数有限;②都是从总体中逐个不放回地抽取思考(1)简单随机抽样是不放回抽样,对于放回的抽样可以是简单随机抽样吗?答不可以.简单随机抽样是从总体逐个抽取的,是一种不放回抽样,也就是每次从总体中取出元素后不放回总体,若放回,则一定不是简单随机抽样.(2)采用抽签法抽取样本时,为什么将编号写在形状、大小相同的号签上,并且将号签放在同一个箱子里搅拌均匀?答为了使每个号签被抽取的可能性相等,保证抽样的公平性.题型探究重点突破题型一简单随机抽样的判断例1下列5个抽样中,简单随机抽样的个数是()①从无数个个体中抽取50个个体作为样本;②仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;③某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴青海参加抗震救灾工作;④一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.⑤箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出1个零件进行质量检验后,再把它放回箱子里.A.0B.1C.2D.3跟踪训练1在简单随机抽样中,某一个体被抽到的可能性()BA.与第几次抽样有关,第一次抽到的可能性大一些B.与第几次抽样无关,每次抽到的可能性都相等C.与第几次抽样有关,最后一次抽到的可能性要大些D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不一定解析在简单随机抽样中,每一个个体被抽到的可能性都相等,与第几次抽样无关,故A,C,D不正确,B正确.题型二抽签法的应用例2为迎接2016年里约热内卢奥运会,奥委会现从报名的某高校20名志愿者中选取5人组成奥运志愿小组,请用抽签法设计抽样方案.解(1)将20名志愿者编号,号码分别是01,02, (20)(2)将号码分别写在20张大小、形状都相同的纸条上,揉成团儿,制成号签;(3)将所得号签放在一个不透明的袋子中,并搅拌均匀;(4)从袋子中依次不放回地抽取5个号签,并记录下上面的编号;(5)所得号码对应的志愿者就是志愿小组的成员.跟踪训练2从20架钢琴中抽取5架进行质量检查,请用抽签法确定这5架钢琴.解第一步,将20架钢琴编号,号码是01,02, (20)第二步,将号码分别写在一张纸条上,揉成团,制成号签.第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀.第四步,从袋子中逐个不放回地抽取5个号签,并记录上面的编号.第五步,所得号码对应的5架钢琴就是要抽取的对象.题型三随机数法例3为了检验某种药品的副作用,从编号为1,2,3,…,120的服药者中用随机数法抽取10人作为样本,写出抽样过程.解第一步,将120名服药者重新进行编号,分别为001,002,003, (120)第二步,在随机数表(教材P)中任选一数作为初始数,如选第9行第7103列的数3;第三步,从选定的数3开始向右读,每次读取三位,凡不在001~120中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到074,100,094,052,080,003,105,107,083,092;第四步,以上这10个号码所对应的服药者即是要抽取的对象.跟踪训练3总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法:从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.01编号不一致致错易错点例4某工厂的质检人员对生产的100件产品,采用随机数法抽取10件进行检查,对100件产品采用下面的编号方法:①1,2,3, (100)②001,002,003,…,100;③00,01,02,03,…,99.其中最恰当的序号是________.当堂检测 1 2 3 4 5 1.某学校为了解高一800名新入学同学的数学学习水平,从中随机抽取100名同学的中考数学成绩进行分析,在这个问题中,下列说法正确的是()DA.800名同学是总体B.100名同学是样本C.每名同学是个体D.样本容量是100解析据题意,总体是指800名新入学同学的中考数学成绩,样本是指抽取的100名同学的中考数学成绩,个体是指每名同学的中考数学成绩,样本容量是100,故只有D正确.B2.抽签法确保样本代表性的关键是()A.制签B.搅拌均匀C.逐一抽取D.抽取不放回解析若样本具有很好的代表性,则每一个个体被抽取的机会相等,故需要对号签搅拌均匀.3.对于简单随机抽样,下列说法正确的是()D①它要求总体中的个体数有限,以便对其中各个个体被抽取的概率进行分析;②它是从总体中逐个地进行抽取,以便在抽取实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的机会相等,而且在整个抽样过程中,各个个体被抽取的机会也相等,从而保证了这种抽样方法的公平性.A.①②③B.①②④C.①③④D.①②③④解析由简单随机抽样的概念,知①②③④都正确.4.从某批零件中抽取50个,然后再从50个中抽出40个进行合格检查,发现合格品有36个,则该产品的合格率约为( )A.36%B.72%C.90%D.25% 解析 ×100%=90%. 3640C5.某总体共有60个个体,并且编号为00,01,…,59. 现需从中抽取一个容量为8的样本,请从随机数表的倒数第5行(下表为随机数表的最后5行)第11、12列的18开始.依次向下读数,到最后一行后向右,直到取足样本为止(大于59及与前面重复的数字跳过),则抽取样本的号码是________.95 33 95 22 00 18 74 72 00 18 38 79 58 69 32 81 76 80 26 92 82 80 84 25 39 90 84 60 79 80 24 36 59 87 38 82 07 53 89 35 56 35 23 79 18 05 98 90 07 35 46 40 62 98 80 54 97 20 56 95 15 74 80 08 32 16 46 70 50 80 67 72 16 42 79 20 31 89 03 43 38 46 82 68 72 32 14 82 99 70 80 60 47 18 97 63 49 30 21 30 71 59 73 05 50 08 22 23 71 77 91 01 93 20 49 82 96 59 26 94 66 39 67 98 60课堂小结1.要判断所给的抽样方法是不是简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点:总体有限、逐个抽取、无放回抽样、等可能抽取.2.一个抽样试验能否用抽签法,关键看两点:一是制作号签是否方便,二是号签是否容易被搅拌均匀.一般地,当总体容量和样本容量都较少时可用抽签法.3.利用随机数法抽取个体时,关键是先确定以表中的哪个数(哪行哪列)作为起点,以哪个方向作为读数的方向.需注意读数时结合编号特点进行读取,编号为两位,则两位、两位地读取;编号为三位,则三位、三位地读取.本课结束。
第二章统计一、随机抽样三种常用抽样方法:1.简单随机抽样:设一个总体的个数为N。
如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。
实现简单随机抽样,常用抽签法和随机数表法。
(1)抽签法制签:先将总体中的所有个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌;抽签:抽签时,每次从中抽出1个号签,连续抽取n次;成样:对应号签就得到一个容量为n的样本。
抽签法简便易行,当总体的个体数不多时,适宜采用这种方法。
(2)随机数表法编号:对总体进行编号,保证位数一致;数数:当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。
在读数过程中,得到一串数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。
成样:对应号签就得到一个容量为n的样本。
结论:①用简单随机抽样,从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时任一个体被抽到的概率为1/N;在整个抽样过程中各个个体被抽到的概率为n/N;②基于此,简单随机抽样体现了抽样的客观性与公平性;③简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样。
2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)。
系统抽样的步骤可概括为:(1)将总体中的个体编号。
采用随机的方式将总体中的个体编号;(2)将整个的编号进行分段。
为将整个的编号进行分段,要确定分段的间隔k .当N/n 是整数时,k=n/N ;当N/n 不是整数时,通过从总体中剔除一些个体使剩下的个体数N ´能被n 整除,这时k=N ’/n ;(3)确定起始的个体编号。
2020年高中数学必修三第二章《统计》2.3.1变量之间的相关关系2.3.2两个变量的线性相关学习目标 1.了解变量间的相关关系,会画散点图;2.根据散点图,能判断两个变量是否具有相关关系;3.了解线性回归思想,会求回归直线的方程.知识点一变量间的相关关系思考1粮食产量与施肥量间的相关关系是正相关还是负相关?答案在施肥不过量的情况下,施肥越多,粮食产量越高,所以是正相关.思考2怎样判断一组数据是否具有线性相关关系?答案画出散点图,若点大致分布在一条直线附近,就说明这两个变量具有线性相关关系,否则不具有线性相关关系.梳理1.相关关系的定义变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系.2.散点图将样本中n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形叫做散点图.3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.知识点二两个变量的线性相关思考任何一组数据都可以由最小二乘法得出线性回归方程吗?答案用最小二乘法求线性回归方程的前提是先判断所给数据是否具有线性相关关系(可利用散点图来判断),否则求出的线性回归方程是无意义的.梳理 回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:回归直线对应的方程叫做回归直线的方程,简称回归方程. (3)最小二乘法:求线性回归方程y ^=b ^x +a ^时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b ^x ,其中,b ^是线性回归方程的斜率,a ^是线性回归方程在y 轴上的截距.类型一 相关关系的判断与应用 命题角度1 判断两个变量的相关性例1 为了研究质量对弹簧长度的影响,对6根相同的弹簧进行测量,所得数据如下:判断它们是否有相关关系,若有,判断是正相关还是负相关. 解 散点图如图:由散点图可以看出两个变量对应的点大致分布在一条直线附近,因此可以得出结论:质量与弹簧长度这两个变量具有相关关系,且它们是正相关关系.反思与感悟在研究两个变量之间是否存在某种关系时,必须从散点图入手,对于散点图,可以作出如下判断:(1)如果所有的样本点都落在某一函数曲线上,那么就用该函数来描述变量之间的关系,即变量之间具有函数关系;(2)如果所有的样本点都落在某一直线附近,那么变量之间就有线性相关关系;(3)如果散点图中的点的分布几乎没有什么规律,那么这两个变量之间不具有相关关系,即两个变量之间是相互独立的.跟踪训练1下表是某地的年降雨量与年平均气温的统计表,判断两者是否具有相关关系,求线性回归方程有意义吗?解以x轴为年平均气温,y轴为年降雨量,可得相应的散点图如图.因为图中各点并不在一条直线的附近,所以两者不具有线性相关关系,没必要用回归直线进行拟合,即使用公式法求出线性回归方程也是没有意义的.命题角度2函数关系与相关关系的区别与联系例2下列关系中,是相关关系的是________.①正方形的边长与面积之间的关系;②农作物的产量与施肥量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.答案②④解析①中,正方形的边长与面积之间的关系是函数关系;②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人达到一定年龄后,身高就不发生明显变化了,所以它们不具有相关关系;④中,降雪量与交通事故的发生率之间具有相关关系. 反思与感悟 相关关系与函数关系的区别与联系如表所示:跟踪训练2 下列图形中两个变量具有相关关系的是( )答案 C解析A 是一种函数关系;B 也是一种函数关系;C 中从散点图中可看出所有点看上去都在某条直线附近波动,具有相关关系,而且是一种线性相关;D 中所有的点在散点图中没有显示任何关系,因此变量间是不相关的. 类型二 回归直线的求解与应用例3 一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:(1)画出散点图;(2)如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系;(3)在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内? 解 (1)散点图如图所示:(2)近似直线如图所示:(3)由y ≤10得5170x -67≤10,解得x ≤14.9,所以机器的运转速度应控制在14转/秒内.引申探究1.本例(3)中近似方程不变,若每增加一个单位的转速,生产有缺点的零件数近似增加多少? 解 因为y =5170x -67,所以当x 增加一个单位时,y 大约增加5170.2.本例(3)中近似方程不变,每小时生产有缺点的零件件数是7,估计机器的转速. 解 因为y =5170x -67,所以当y =7时,7=5170x -67,解得x ≈11.反思与感悟 求线性回归方程的一般步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)计算x ,y,∑i =1nx 2i ,∑i =1nx i y i .(5)代入公式计算b ^,a ^,公式为⎩⎪⎨⎪⎧b ^=∑i =1nx i y i-n x y ∑i =1nx 2i-n x2,a ^=y -b ^x .(6)写出线性回归方程y ^=b ^x +a ^.跟踪训练3 (1)变量y 与x 满足线性回归方程y ^=b ^x +a ^,现在将y 的单位由厘米变为米,x的单位由毫米变为米,则在新的线性回归方程y ^=b ^*x +a ^*中,b ^*是b ^的____________倍.(2)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地区若干户家庭的年收入x (单位:万元)和年教育支出y (单位:万元),调查显示年收入x 与年教育支出y 具有相关关系,并由调查数据得到y 对x 的线性回归方程为y ^=0.15x +0.2.由线性回归方程可知,家庭年收入每增加1万元,年教育支出平均增加________万元. 答案 (1)10 (2)0.15解析 (1)由回归系数公式知,当y 的值变为原来的10-2倍,x 的值变为原来的10-3倍时,b^*的值应为原来的10倍.(2)回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.1.设有一个线性回归方程为y ^=2-1.5x ,则变量x 增加1个单位时,y 平均( ) A .增加1.5个单位 B .增加2个单位 C .减少1.5个单位 D .减少2个单位答案 C2.由三点(3,10),(7,20),(11,24)确定的线性回归方程为( ) A.y ^=1.75x -5.75 B.y ^=1.75x +5.75 C.y ^=-1.75x +5.75 D.y ^=-1.75x -5.75答案 B解析 设线性回归方程为y ^=b ^x +a ^, 则b ^=x 1y 1+x 2y 2+x 3y 3-3x y x 21+x 22+x 23-3x2=3×10+7×20+11×24-3×7×189+49+121-3×49=1.75,a ^=y -b ^x =18-1.75×7=5.75. 故y ^=1.75x +5.75,故选B.3.某地区近10年居民的年收入x 与年支出y 之间的关系大致符合y ^=0.8x +0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元. 答案 12.1解析 将x =15代入y ^=0.8x +0.1,得y ^=12.1.4.某市居民2012~2016年家庭年平均收入x (单位:万元)与年平均支出y (单位:万元)的统计资料如表所示:根据统计资料,居民家庭年平均收入的中位数是__________万元,家庭年平均收入与年平均支出有________线性相关关系. 答案 13 正解析 考查中位数的定义,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时需取中间两数的平均数.由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.5.某5名学生的总成绩和数学成绩(单位:分)如表所示:(1)画出散点图;(2)求y 对x 的线性回归方程(结果保留到小数点后3位数字); (3)如果一个学生的总成绩为450分,试预测这个学生的数学成绩. 解 (1)散点图如图所示:(2)由题中数据计算可得x =391.6,y =67.8,∑i =15x 2i =770 654,∑i =15x i y i =133 548.代入公式得b ^=133 548-5×391.6×67.8770 654-5×391.62≈0.204,a ^=67.8-0.204×391.6≈-12.086,所以y 对x 的线性回归方程为y ^=-12.086+0.204x .(3)由(2)得当总成绩为450分时,y ^=-12.086+0.204×450≈80,即这个学生的数学成绩大约为80分.1.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关. 2.求线性回归方程时应注意的问题(1)知道x 与y 成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出线性回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的. (2)用公式计算a ^、b ^的值时,要先计算b ^,然后才能算出a ^.3.利用回归方程,我们可以进行估计和预测.若回归方程为y ^=b ^x +a ^,则x =x 0处的估计值为y ^0=b ^x 0+a ^.40分钟课时作业一、选择题1.某商品销售量y (件)与销售价格x (元/件)负相关,则其线性回归方程可能是( ) A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200 D.y ^=10x -200答案 A解析 x 的系数为负数,表示负相关,排除B 、D ,由实际意义可知x >0,y >0,C 中,散点图在第四象限无意义,故选A.2.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关 答案 D解析 由柱形图可知:A 、B 、C 均正确,2006年以来我国二氧化硫年排放量在逐渐减少,所以排放量与年份负相关,所以D 不正确.3.对变量x ,y 有观测数据(x i ,y i )(i =1,2,3,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,3,…,10),得散点图2,由这两个散点图可以判断( )A .y 与x 正相关,v 与u 正相关B .y 与x 正相关,v 与u 负相关C .y 与x 负相关,v 与u 正相关D .y 与x 负相关,v 与u 负相关 答案 C解析 根据散点图直接进行判断.4.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( ) A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5 D.y ^=-0.3x +4.4答案 A解析 由变量x 与y 正相关知C 、D 均错,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误.故选A. 5.已知x 与y 之间的一组数据:若y 与x 线性相关,则y 与x 的回归直线y ^=b ^x +a ^必过( ) A .点(2,2) B .点(1.5,0) C .点(1,2) D .点(1.5,4)答案 D 解析 ∵x =0+1+2+34=1.5,y =1+3+5+74=4, ∴回归直线必过点(1.5,4).故选D. 6.已知x ,y 的取值如表所示:如果y 与x 线性相关,且线性回归方程为y ^=b ^x +132,则b ^等于( )A .-12B.12 C .-110D.110答案 A 解析 ∵x =2+3+43=3,y =6+4+53=5, ∴回归直线过点(3,5),∴5=3b ^+132,∴b ^=-12,故选A.二、填空题7.为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的数据,计算得回归方程为y ^=0.85x -0.25.由以上信息,可得表中c 的值为________.答案 6解析 x =3+4+5+6+75=5,y =2.5+3+4+4.5+c 5=14+c 5,代入回归方程中得14+c5=0.85×5-0.25,解得c =6.8.如图所示的五组数据(x ,y )中,去掉________后,剩下的四组数据相关性增强.答案 (4,10)解析 去掉点(4,10)后,其余四点大致在一条直线附近,相关性增强. 9.在一次试验中测得(x ,y )的四组数据如下:根据上表可得线性回归方程y ^=-5x +a ^,据此模型预报当x =20时,y 的值为________. 答案 26.5解析 x =16+17+18+194=17.5,y =50+34+41+314=39,∴回归直线过点(17.5,39), ∴39=-5×17.5+a ^, ∴a ^=126.5,∴当x =20时,y =-5×20+126.5=26.5.10.某工厂对某产品的产量与成本的资料分析后有如下数据:由表中数据得到的线性回归方程y ^=b ^x +a ^中b ^=1.1,预测当产量为9千件时,成本约为________万元. 答案 14.5解析 由表中数据得x =4,y =9,代入线性回归方程得a ^=4.6,∴当x =9时,y ^=1.1×9+4.6=14.5. 三、解答题11.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求两变量之间的回归方程y ^=b ^x +a ^;(2)利用(1)中所求出的回归方程预测该地第6年的粮食需求量. 解 (1)由所给数据得 x =3,y =5.8,b ^=∑i =15(x i -x )(y i -y )∑i =15(x i -x )2=1.1,a ^=y -b ^x =2.5, ∴y ^=1.1x +2.5.故所求的回归方程为y ^=1.1x +2.5. (2)第6年的粮食需求量约为 y ^=1.1×6+2.5=9.1(万吨).12.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求月储蓄y (千元)关于月收入x (千元)的线性回归方程; (2)若该居民区某家庭的月收入为7千元,预测该家庭的月储蓄. 解 (1)由题意知n =10,x =1n ∑i =110x i =110×80=8,y =1n ∑i =110y i =110×20=2,又∑i =110x 2i -n x 2=720-10×82=80, ∑i =110x i y i -n x y =184-10×8×2=24,由此得b ^=2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4, 故所求线性回归方程为y ^=0.3x -0.4.(2)将x =7代入线性回归方程,可以得到该家庭的月储蓄约为y ^=0.3×7-0.4=1.7(千元). 13.为了分析某高三学生的学习状态,对其下一阶段的学习提供指导性建议,现对他前7次考试的数学成绩x 、物理成绩y 进行分析.下面是该生7次考试的成绩(单位:分).(1)他的数学成绩与物理成绩哪个更稳定?并说明理由;(2)已知该学生的物理成绩y 与数学成绩x 是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少分,并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.解 (1)x =100+-12-17+17-8+8+127=100,y =100+-6-9+8-4+4+1+67=100,s 2数学=142,s 2物理=2507,因为s 2数学>s 2物理, 所以他的物理成绩更稳定.(2)由于x 与y 之间具有线性相关关系,经计算得b ^=0.5,a ^=100-0.5×100=50. 所以线性回归方程为y ^=0.5x +50. 当y =115时,x =130. 估计他的数学成绩是130分.建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.。
专题突破一例析频率分布直方图中的统计问题一、求样本中限制条件下的个体所占频率例1观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)的频率为()A.0.001 B.0.1C.0.2 D.0.3思维切入求对应区间上的小矩形的面积.答案 D解析由直方图的意义可知,在区间[2 700,3 000)内取值的频率为(3 000-2 700)×0.001=0.3. 点评频率为直方图中相应小长方形的面积,即频率=纵坐标×横坐标差的绝对值.跟踪训练1某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分),现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如下图所示.已知图中从左到右的第一、三、四、五小组的频率分别为0.30,0.15,0.10,0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________. 答案 100 0.15解析 设参赛的人数为n ,第二小组的频率为1-(0.30+0.15+0.10+0.05)=0.4, 依题意40n=0.4,∴n =100,优秀的频率是0.10+0.05=0.15. 二、求样本中限制条件下的个体的频数例2 某市高三数学抽样考试中,对90分以上的成绩进行统计,其频率分布如图所示.若130~140分数段的人数为90,则90~100分数段的人数为________.思维切入 对应区间上的频数即为对应区间的频率×样本总体. 答案 810解析 由于90分以上的考试人数是样本总体,则图中5个分数段的频率之和等于1,设130~140分数段的频率为p ,则0.45+0.25+0.15+0.10+p =1,即0.95+p =1,则p =0.05,设该样本总体共有n 个学生的分数,且设90~100分数段的人数为x ,则由频率概念得⎩⎪⎨⎪⎧ 0.05×n =90,0.45×n =x ,解得⎩⎪⎨⎪⎧n =1 800,x =810,故90~100分数段的人数为810. 点评 本题是频率分布条形图.由于各分数段的人数与频率成正比,则可由x 90=0.450.05,求出x ;题设条形图的纵坐标是“频率”这是有别于常规的,在审题时不能混淆.跟踪训练2 为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.答案 12解析 志愿者的总人数为20(0.24+0.16)×1=50,所以第三组人数为50×0.36×1=18, 所以有疗效的人数为18-6=12. 三、求频率分布直方图中的参数问题例3 为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力,得到频率分布直方图,如图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生数为b ,则a ,b 的值分别为( )A .0.27,78B .0.27,83C .2.7,78D .2.7,83思维切入 根据频率分布直方图的性质列方程求解. 答案 A解析 注意到纵轴表示频率组距,由图象可知,前4组的公比为3,最大频率a =0.1×33×0.1=0.27, 设后6组公差为d ,则0.01+0.03+0.09+0.27×6+5×62·d =1,解得d =-0.05,即后6组频率的公差为-0.05, 所以,视力在4.6到5.0之间的学生数为 (0.27+0.22+0.17+0.12)×100=78, 故选A.点评 解答本题关键是要利用频率分布直方图中残缺不全的数据,分析它们之间存在的内在关系.跟踪训练3 某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图所示),其中上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100]. (1)求频率分布直方图中x 的值;(2)如果上学所需时间不少于1小时的学生可申请在学校住宿,请估计学校600名新生中有多少名学生可以申请住宿.解(1)由频率分布直方图可得20×x+0.025×20+0.006 5×20+0.003×2×20=1,所以x=0.012 5.(2)由频率分布直方图可知,新生上学所需时间不少于1小时的频率为0.003×2×20=0.12.因为600×0.12=72,所以估计600名新生中有72名学生可以申请住宿.四、频率分布直方图中的数字特征例4从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).(1)由图中数据求a的值;(2)若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为多少?(3)估计这所小学的小学生身高的众数、中位数(保留两位小数)及平均数.思维切入众数即为出现次数最多的数,所以它的频率最大,在最高的小矩形中.中位数即为从小到大中间的数(或中间两数的平均数).解(1)因为直方图中的各个矩形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.(2)由直方图知,身高在[120,130),[130,140),[140,150]三组的学生总数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]的学生人数为10,所以从身高在[140,150]内选取的学生人数为1860×10=3.(3)根据频率分布直方图知,身高在[110,120)的小矩形最高,所以这所小学的小学生身高的众数为110+1202=115(cm).又0.005×10+0.035×10=0.4<0.5,0.4+0.030×10=0.7>0.5,所以中位数在[120,130)内,可设为x,则(x-120)×0.030+0.4=0.5,解得x≈123.33,所以中位数为123.33 cm.根据频率分布直方图,计算平均数为105×0.05+115×0.35+125×0.3+135×0.2+145×0.1=124.5(cm).点评用频率分布直方图求得的众数、中位数不一定是样本中的具体数.跟踪训练4某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数为()A.20 B.25 C.22.5 D.22.75答案 C解析产品的中位数出现在频率是0.5的地方.自左至右各小矩形的面积依次为0.1,0.2,0.4,0.15,0.15,设中位数是x,则由0.1+0.2+0.08×(x-20)=0.5,得x=22.5,故选C.1.统计某校1 000名学生的数学水平测试成绩,得到样本的频率分布直方图如图所示.若满分为100分,规定不低于60分为及格,则及格率是()A.20% B.25% C.60% D.80%答案 D2.在中秋的促销活动中,某商场对9月14日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知12时到14时的销售额为7万元,则10时到11时的销售额为()A.1万元B.2万元C.3万元D.4万元答案 C3.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案94.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.答案25解析由频率分布直方图可得[2 500,3 000)(元)月收入段共有10 000×0.000 5×500=2500(人),按分层抽样应抽出2 500×10010 000=25(人).5.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.估计居民月均用水量的中位数.解由(0.08+0.16+a+0.42+0.50+a+0.12+0.08+0.04)×0.5=1,解得a=0.30.设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.6.某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如图所示的频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/方立米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.解(1)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1),[1,1.5),[1.5,2),[2,2.5),[2.5,3)内的频率依次为0.1,0.15,0.2,0.25,0.15.所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:根据题意,该市居民该月的人均水费估计为4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).一、选择题1.从向阳小区抽取100户居民进行月用电量调查,为制定阶梯电价提供数据,发现其月用电量都在50到350度之间,制作频率分布直方图(如图所示)的工作人员粗心大意,位置t处未标明数据,则t等于()A.0.004 1 B.0.004 2C.0.004 3 D.0.004 4答案 D解析由题意得50×(0.006+t+0.003 6+0.002 4×2+0.001 2)=1,故t=0.004 4.故选D. 2.有一容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为()A.18 B.36 C.54 D.72答案 B解析易得样本数据落在区间[10,12]内的频率为0.18,则样本数据落在区间[10,12]内的频数为36.3.测量某地新生婴儿的体重,得到其频率分布直方图如图所示,则新生婴儿的体重(单位:g)在[2 700,3 000)的频率为()A.0.001 B.0.1 C.0.2 D.0.3答案 D解析由频率分布直方图可知,所求频率为0.001×300=0.3.4.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图可知,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B.60 C.120 D.140答案 D解析设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D.5.如图是某班50名学生身高的频率分布直方图,那么身高(单位:cm)在区间[150,170)内的学生人数为()A.16 B.20 C.22 D.26答案 B解析根据频率分布直方图可知身高在区间[150,170)内的频率为(0.01+0.03)×10=0.4,所以身高在区间[150,170)内的学生人数为50×0.4=20,故选B.6.某学校对高二年级一次考试进行抽样分析,如图是根据抽样分析后的考试成绩绘制的频率分布直方图,其中抽样成绩的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中成绩小于100分的人数是36.则样本中成绩大于或等于98分且小于104分的人数是()A.90 B.75 C.60 D.45答案 A解析因为样本中成绩小于100分的人数是36,其对应频率之和为0.050×2+0.100×2=0.3,所以样本总数为36÷0.3=120,所以样本中成绩大于或等于98分且小于104分的人数为120×2×(0.100+0.150+0.125)=90,故选A.7.如图是某校高一一次数学考试成绩的样本频率分布直方图(样本容量n=200),若成绩不低于60分为及格,则样本中的及格人数是()A.6 B.36 C.60 D.120答案 D解析由题中频率分布直方图得,成绩不低于60分的人数为(0.012+0.018)×20×200=120.8.为了解学生在课外活动方面的支出情况,抽取了n 个同学进行调查,结果显示这些学生的支出金额(单位:元)都在[10,50]内,其中支出金额在[30,50]内的学生有117人,频率分布直方图如图所示,则n 等于( )A .180B .160C .150D .200 答案 A解析 [30,50]对应的概率为1-()0.01+0.025×10=0.65,所以n =1170.65=180. 二、填空题9.为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在区间[40,80]中,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在区间[40,60)内的汽车有________辆.答案 80解析 由频率分布直方图得:时速在区间[40,60)内的汽车的频率为(0.01+0.03)×10=0.4.∴时速在区间[40,60)内的汽车有0.4×200=80(辆).10.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用的时间的条形图(如图所示)根据条形图可得这50名学生这一天平均每人的课外阅读时间为________.答案0.9解析这50名学生这一天平均每人的课外阅读时间为(0×5+0.5×20+1.0×10+1.5×10+2.0×5)÷50=0.9(小时).故选B.三、解答题11.为了了解小学生的体能情况,抽取某校一个年级的部分学生进行一分钟跳绳次数的测试,将数据整理后,画出频率分布直方图如图所示.已知图中从左到右前三个小组的频率分别为0.1,0.3,0.4,且第一小组的频数为5.(1)求第四小组的频率;(2)求参加这次测试的学生的人数;(3)若一分钟跳绳次数在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标率.解(1)第四小组的频率为1-0.1-0.3-0.4=0.2.(2)设参加这次测试的学生有x人,则0.1x=5,解得x=50,故参加这次测试的学生有50人.(3)由题意及频率分布直方图知,样本数据的达标率约为0.3+0.4+0.2=0.9,∴可估计该年级学生跳绳测试的达标率为90%.12.为组织好“市九运会”,组委会征集了800名志愿者,现对他们的年龄调查统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:(1)年龄分组[25,30)对应小长方形的高度为________.(2)这800名志愿者中年龄在[25,35)内的人数为________.答案(1)0.04(2)440解析(1)因为各个小长方形的面积之和为1,所以年龄分组[25,30)对应小长方形的高度为1-(5×0.01+5×0.07+5×0.06+5×0.02)5=0.04.(2)年龄在[25,35)内的频率为0.04×5+0.07×5=0.55,人数为0.55×800=440.13.某校100名学生的期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)若这100名学生的语文成绩在某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.解 (1)由频率分布直方图知(2a +0.02+0.03+0.04)×10=1,解得a =0.005.(2)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20. 由题中给出的比例关系知数学成绩在上述分数段的人数依次为 5,40×12=20,30×43=40,20×54=25.故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.。
高中数学第二章统计 2.1 随机抽样教材习题点拨新人教B版必修3练习A1.什么是简单随机抽样?解:一般地,从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.2.在一般“调查”时,为什么要进行抽样调查?解:做一般“调查”最好是对每一个个体逐一进行“调查”,但这样做有时费时、费力,有时根本无法实现,一个行之有效的办法就是在每一个个体被抽取的机会均等的前提下从总体中抽取部分个体,进行抽样调查.3.如果想了解你所在班上同学喜欢听数学课的比例,计划抽取8名同学做调查.请你用抽签法抽取一个样本.解:(1)将班内60名同学的学号1,2,…,60分别写在相同的60X纸片上.(2)将60X纸片放在一个容器里均匀搅拌之后,就可以抽样.(3)抽出一X纸片,记下上面的,然后均匀搅拌,继续抽取第2X纸片,记下这个,重复这个过程,直到取得8个时终止.(4)于是,和这8个对应的同学就构成了一个简单随机样本.练习B1.某居民区有730户居民,居委会计划从中抽取25户调查其家庭收入状况,你能帮助居委会抽出一个简单随机样本吗?解:随机数表法:(用教材第87页的随机数表)(1)将730户居民编号为001,002, (730)(2)给出的随机数表是5个数一组,使用各个5位数组的后3位,从各个数组中任选一个后3位小于或等于730的数作为起始,如从第2行的第6组开始,取出572作为25户中的第1个代号;(3)继续向右读,每组后3位符合要求的数取出,前面已经取出的跳过,到行末转下一行从左向右继续读,得数据:572,483,459,073,242,372,048,088,600,636,171,247,303,422,421,183,546,385,120,042 ,320,500,219,225,059.编号为以上所选的25个的居户被选中.2.使用计算器或计算机制作一X1 000个一位数的随机数表,并检查0~9这10个数在表中出现的可能性是否相同?解:相同.练习A1.什么是系统抽样?系统抽样有什么优点?解:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.系统抽样的优点:它很好地解决了当总体容量和样本容量都较大时,用简单随机抽样不方便的问题.2.从编号为1~900的总体中用系统抽样的办法抽取一个容量为9的样本.解:按编号顺序分成9组,每组100个号,先在第一组用简单随机抽样方式抽出k(1≤k≤100)号,其余的k+100n(n=1,2,…,8)也被抽到,即可得所需样本.练习B1.某批产品共有1 563件,产品按出厂顺序编号,为从1~1 563.检测员要从中抽取15件产品作检测,请你给出一个系统抽样方案.解:S1 将产品的调整为0001,0002,0003, (1563)S2 从总体中剔除3件产品(剔除方法可用随机数表法),将剩下的1 560件产品重新编号(分别为0001,0002,…,1560),并分成15段;S3 在第一段0001,0002,...,0104,这104个编号中用简单随机抽样抽出一个(如0003)作为起始,则各段对应编号分别为0003,0107,0211, (1459)S4 将编号为0003,0107,0211,…,1459的个体抽出,即得到一个容量为15的样本.2.要考察某商场2003年的日销售额,从一年时间中抽取52天的销售额作为样本,请给出你的系统抽样方案.并说说你的抽样方案的优点和不足.解:S1 用随机数表法从365天中随机剔除1天;S2 将其余的364天编号,为001,002,003,…,364,并将依次分为52段;S3 在第一段001,002,…,007这7个中用抽签法选取一个,如002;S4 将为002,009,016,…,359的日期找出,组成样本.该抽样方案的优点是:抽取的样本能代表总体;缺点是:所抽取的日期与日常用的日期相比规律性差,不便于该方案的操作.练习A1.某校高一学生共500名,经调查,喜欢数学的学生占全体学生的30%,不喜欢数学的人数占40%,介于两者之间的学生占30%.为了考查学生的期中考试的数学成绩,如何用分层抽样抽取一个容量为50的样本.解:由题意知喜欢数学的学生有150人,不喜欢数学的有200人,介于两者之间的有150人.三个层次的学生人数之比为3∶4∶3.所以应抽喜欢数学的学生15人,不喜欢数学的学生20人,介于两者之间的学生15人.用随机数表法抽样分别从对应的部分抽取相应的人数即可.2.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人.为了调查员工的身体健康状况,从中抽取100名员工,用分层抽样应当怎样抽取?解:S1 确定抽样比100500=15,所以不到35岁的应抽取125÷5=25(人),35~49岁的应抽取280÷5=56(人),50岁以上的应抽取95÷5=19(人);S2 用简单随机抽样法或系统抽样法分别抽取不到35岁的25人,35~49岁的56人;50岁以上的19人.这些人便组成了我们要抽取的样本.3.某大学就餐中心为了了解新生的饮食习惯,以分层抽样的方式从1 500名新生中抽取200名进行调查,新生中的南方学生有500名,北方学生有800名,西部地区的学生有200名,应如何抽取?解:由题意知南方学生有500名,北方学生有800名,西部地区的学生有200名.样本容量与总体容量的比为200∶1 500=2∶15.所以应抽取南方学生约67名,北方学生约106名,西部地区的学生约27名.用分层抽样法分别从对应的部分抽取相应的人数即可.练习B某市电视台在因特网上征集电视节目的现场参与观众,报名的共有12 000人,分别来自4个城区,其中东城区2 400人,西城区4 605人,南城区3 795人,北城区1 200人.用分层抽样的方式从中抽取60人参加现场节目,应当如何抽取?解:从12 000人中抽取60人,抽取比例为12 000∶60=200∶1,所以应在东城区抽取 2 400÷200=12(人),在西城区抽取 4 605÷200≈23(人),在南城区抽取 3 795÷200≈19(人),在北城区抽取1 200÷200=6(人).用系统抽样法分别从对应的部分抽取相应的数即可.练习A1.想一想怎样可以得到你所在班级同学的身高数据.解:设计调查问卷请每位同学填写自己的身高,然后汇总即可.2.你还能想到哪些可以得到数据资料的途径?解:如:教材或教材提供的数据;课堂数据(它们是在教室中收集的,主要与班上的学生有关,而不问结论是否对于更大的群体也成立).练习B为了了解中学生如何度过课余时间,请你设计一份关于中学生课余活动的调查问卷,实际调查后写出调查分析报告.解:提示:在设计调查问卷时,设计的题目意思要明确,覆盖面要广,不要有答题倾向即可.习题2-1A1.为了考察某地10 000名高一学生的体重情况,从中抽出了200名学生做调查.这里的总体、个体、样本、样本容量各指什么?为什么我们一般要从总体中抽取一个样本,通过样本来研究总体?解:统计的总体是指该地10 000名高一学生的体重;个体是指这10 000名学生中每一名学生的体重;样本是指这10 000名学生中抽出的200名学生的体重;样本容量为200.若对每一个个体逐一进行“调查”,有时费时、费力,有时根本无法实现,一个行之有效的办法就是在每一个个体被抽取机会均等的前提下从总体中抽取部分个体,进行抽样调查.2.要从编号为1~100的100道选择题中随机抽取20道题组成一份考卷,请你用抽签法给出考题的编号.解:(1)编号1~100;(2)制作大小相同的号签,并写上;(3)放入一个大容器,均匀搅拌;(4)依次抽取20个签(注意每次都要均匀搅拌),具有这20个编号的题组成一份考卷.3.某商店有590件货物,要从中选出50件货物做质量检查,请你用随机数表法给出一个抽样方案.解:(1)将590件货物编号为001,002, (590)(2)给出的随机数表是5个数一组,使用各个5位数组的中间3位,从各个数组中任选中间3位小于或等于590的数作为起始,如从第3行的第4列数037开始,取出037作为590件货物中的第1个代号;(3)继续向右读,将每组中间3位符合要求的数取出,已取出重复的跳过,到行末转下一行从左向右继续读,得数据:037,104,460,463,317,290,030,042,142,237,318,154,038,212,404,132,…,编号为以上所选的50个的货物被选中,即得到一个容量为50的样本.4.故宫博物院某天接待游客10 000人(假设把他们编号为0~9 999),如果要从这些游客中随机选出10名幸运游客,请你用系统抽样的方式给出幸运游客的编号.解:按编号顺序分成10组,每组1 000个号,先在第1组用简单随机抽样方式取出k(0≤k≤999)号,其余的k+1 000n(n=1,2,…,9)也被抽到,即可得到所需样本.5.一支田径队中有男运动员56人,女运动员42人,用分层抽样的方式从全队中抽取28名运动员.解:从男运动员中抽16人,女运动员中抽12人.6.某市有210家百货商店,其中大型商店有20家,中型商店有40家,小型商店有150家.为了了解商店的销售情况,要从中抽取21家商店进行调查,请你用分层抽样的方式进行抽取.解:大型商店、中型商店、小型商店分别抽取2家、4家、15家.习题2-1B1.某公园为了考察每天游览的人数,从一年中要抽取30天进行统计,请你分别用随机数表法、系统抽样法、分层抽样法给出样本,并根据样本比较这3种抽样方式.解:方法1:随机数表法S1 将一年的365天编号为001,002, (365)S2 在教材第一节提供的随机数表中任选一数作为开始,任选一方向作为读数方向,比如,选第1行第6个数“5”,向右读;S3 从数“5”开始,向右读,每次读取3位,凡不在001~365中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到30个符合要求的;S4 以上对应的日期就是抽取的对象.方法2:系统抽样法S1 将365天用随机方式编号;S2 从总体中剔除5天(剔除方法可用随机数表法),将剩下的360天重新编号(分别为001,…,360),并分成30段;S3 在第一段001,…,012这12个编号中用简单随机抽样抽出一个(如003)作为起始;S4 将编号为003,015,027,…,351的日期抽出,组成样本.方法3:分层抽样法S1 将一年分为春、夏、秋、冬四个层次;S2 在每个层次中用随机数表法抽取8天;S3 4×8=32,再用抽签法剔除2天,剩下的30天组成样本.点拨:3种抽样方法的共同点是每个个体被抽到的可能性均相等.2.随着互联网络的发展与普及,网络调查方式的使用越来越多.你能比较一下传统的调查方式与网络调查方式的优劣吗?解:网络调查省时、省力,但有时也不具备代表性.如调查农业方面的问题,应该调查农民,但农民上网的人数很少;传统调查方式虽费时、费力,但针对性强.。