统计学课后习题和答案
- 格式:doc
- 大小:2.75 MB
- 文档页数:55
《统计学》课后题答案第一章导论一、选择题1.C2.A3.C4.C5.C6.B7.A8.D9.C 10.D 11.A 12.C 13.C 14.A 15.B 16.A 17.C 18.B 19.D 20.A 21.D 22. D23.B 24.C 25.A 26.A 27.A 28.B 29.A 30.D 31.C 32.A 33.B第二章数据的收集一、选择题1.A2.B3.A4.D5.B6.C7.D8.D9.D 10.C 11.C 12.A 13.D 14.D 15.C 16.A 17.D 18.C 19.B 20.B 21.A 22.B 23.C 24.A 25.B 26.B 27.A 28.B 29.C 30.C (A)二、判断题1.∨2.∨3.×4. ∨5. ×6. ×7. ∨8. ×9. ×10. ×第三章数据整理与显示一、选择题CABCD CBBAB BACBD DDBC第四章数据分布特征的测度一、选择题1.A2.C3.B4.C5.D6.D7.A8.B9.A 10.B 11.A 12.D 13.C 14.C 15.D 16.A 17.A 18.B 19.A 20.B 21.A 22.A 23.B 24.C 25.C 26.D 27.D 28.A 29.D 30.C 31.C 32.D二、判断题1. ×2. ∨3. ×4. ×5. ×6. ×7. ∨8. ×9. × 10. ∨ 11. ∨ 12. ×四、计算题1. 11399073.8954ki ii kii x fx f=====∑∑甲11.96σ===甲73.89100%100% 6.18%11.96x σν=⨯=⨯=甲73.8100%100%7.43%9.93x σν=⨯=⨯=乙甲的代表性强2. 10.2510.966ki ii kii x fx f====∑∑0.250.056σ==0.250.056100%100% 5.834%0.966xσν=⨯=⨯= 1114.534ki ii kii x fx f====∑∑10.1295σ==10.1295100%100% 2.857%4.534xσν=⨯=⨯=该教练的说法不成立。
版权归wagxjysys所有违者必究第1章绪论1.什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。
3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
统计学课后习题答案附录三:部分习题参考解答老师说这份答案有些错误,慎重参考哈~~第一章(15-16)一、判断题2.答:对。
3.答:错。
实质性科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供合适的方法,特别是数量分析的方法。
4.答:对。
5.答:错。
描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。
6.答:错。
有限总体全部统计成本太高,经常采用抽样调查,因此也必须使用推断技术。
7.答:错。
不少社会经济的统计问题属于无限总体。
例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。
8.答:对。
二、单项选择题1.A;2.A;3.A;4.B。
三、分析问答题1.答:定类尺度的数学特征是“=”或“”,所以只可用来分类,民族可以区分为汉、藏、回等,但没有顺序和优劣之分,所以是定类尺度数据。
;定序尺度的数学特征是“”或“”,所以它不但可以分类,还可以反映各类的优劣和顺序,教育程度可划分为大学、中学和小学,属于定序尺度数据;定距尺度的主要数学特征是“+”或“-”,它不但可以排序,还可以用确切的数值反映现象在两方面的差异,人口数、信教人数、进出口总额都是定距尺度数据;定比尺度的主要数学特征是“”或“”,它通常都是相对数或平均数,所以经济增长率是定比尺度数据。
3.答:如考察全国居民人均住房情况,全国所有居民构成统计总体,每一户居民是总体单位,抽查其中5000户,这被调查的5000户居民构成样本。
第二章(45-46)一、单项选择题1.C;2.A;3.A。
二、多项选择题1.A.B.C.D;2.A.B.D;3.A.B.C.三、简答题1.答:这种说法不对。
从理论上分析,统计上的误差可分为登记性误差、代表性误差2.答:统计报表的日常维持需要大量的人力、物力、财力;而且统计报表的统计指标、指标体系不容易调整,对现代社会经济调查来说很不合适。
第一章总论一、单项选择题1.威廉·配第是(B )的代表人物。
A.记述学派B.政治算术学派C.社会学派D.数理统计学派2.以下属于推断统计学研究范围的是(D)。
A.数据调查与收集B.数据的计算C.数据汇总D.抽样估计3.调查某企业职工的健康状况,总体单位是(D )。
A.这个企业B.所有的职工C.每个职工D.每个职工的健康状况4.数量指标表现为(C)。
A.相对数В.平均数C.绝对数D.变异数5.名义级数据可以用来(A )。
A.分类B.比较大小C.加减运算D.加、减、乘、除四则运算6.间距级数据之间不可以(D )。
A.比较是否相等B.比较大小C.进行加减运算D.进行乘除运算7.2个大学生的身高分别为165厘米、172厘米,则165、172是(D )。
A.2个变量B. 2 个标志C.2个指标D. 2个数据8.总体与总体单位的确定(A)。
A.与研究目的有关B.与研究目的无关C.与总体范围大小有关D.与研究方法有关9,通过有限数量的种子发芽试验结果来估计整批种子的发芽率,这种统计方法属于(A)。
A. f断统计学B.描述统计学C.数学D.逻辑学10.国势学派对统计学的主要贡献是(C)A.采用了数量分析方法B.引入了大数法则C.提出了“统计学"一词D.证明了小样本理论11.统计学是一门关于研究客观事物数量方面和数量关系的(C )。
A.社会科学B.自然科学C.方法论科学D.实质性科学12.数理统计学的奠基人是(C )。
A.威廉·配第B.阿亭瓦尔C.凯特勒D.恩格尔13.统计学研究的特点是(B)A.大量性、总体性、变异性B.数量性、总体性、变异性C.大量性、总体性、同质性D.数量性、总体性、同质性14.通过测量或计算取得其值的是(B)A.品质变量B.连续变量C.离散变量D.以上都不对15.统计学的创始人是(A)。
A.威廉·配第B.阿享瓦尔C.凯特勒D.恩格尔二、多项选择题1.“统计”一词有三层含义,即(BD)。
1.1什么是统计学?统计学是一门研究随机现象,以推断为特征的方法论科学,“由部分推及全体”的思想贯穿于统计学的始终。
具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。
用统计来认识事物的步骤是:研究设计—>抽样调查—>统计推断—>结论。
这里,研究设计就是制定调查研究和实验研究的计划,抽样调查是搜集资料的过程,统计推断是分析资料的过程。
显然统计的主要功能是推断,而推断的方法是一种不完全归纳法,因为是用部分资料来推断总体。
增加定义:是关于收集、整理、分析和解释统计数据的科学,是一门认识方法论性质的科学,其目的是探索数据内在的数量规律性,以达到对客观事物的科学认识。
统计学是收集、分析、表述和解释数据的科学1.2解释描述统计和推断统计描述统计学(Descriptive Statistics)研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征。
内容包括统计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括与分析方法等。
推断统计学(1nferential Statistics)则是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。
统计研究过程的起点是统计数据,终点是探索出客观现象内在的数量规律性。
在这一过程中,如果搜集到的是总体数据(如普查数据),则经过描述统计之后就可以达到认识总体数量规律性的目的了;如果所获得的只是研究总体的一部分数据(样本数据),要找到总体的数量规律性,则必须应用概率论的理论并根据样本信息对总体进行科学的推断。
<<统计学 >> 课后习题参考答案第四章1. 计划完成相对指标二一8% 100% =102.9%1+5%2. 计划完成相对指标二1一6% 100% =97.9%1—4%3.4.5.解:⑴计划完成相对指标=14防13 100%"5.56%(2)从第四年二季度开始连续四季的产量之和为:10+11 + 12+14=47该产品到第五年第一季 已提前完成任务,提前 完成的天数90•该产品总共提前10个月零15天完成任务。
6.解:计划完成相对指标10 11 12 14-45V 天 14 一10156 230 540 279 325 470 535200 1040.1% 100% =126.75%(2) 156+230+540+279+325+470=2000 (万吨)所以正好提前半年完成计划7.第五章平均指标与标志变异指标1 . X 甲= :.26 27 28 29 30 31 32 3334=309—20 25 28 30 32 34 36 38 40 '1.44X乙二9AD甲二26-30卩27 -30 28-30 29 -30 30-30 |31 -30 32 - 30 亠|33 - 30 叫34 - 309-2.22AD乙二20—31.44” 25—31.44 十2〔8—31.44 屮30—31.44 +|32|— 31.44 + 34卜31.44 + 網 + 31.44 + 38—|31.44 + 4Q — 9= 5.06R 甲=34-26=8R 乙=40-20=20(26一30)2 (27 一30)2 (28一30)2 (29一30)2 (30 一 30)2 ⑶ 一 30)2 (32 一 30)2 (33一 30)2 (34一33)2--------------------------------------------------------------------- 9=2.58(T 乙一(20 -31.44)2 - (25 -31.44)2 (28 —31.44)2 (30 -31.44)2 (32 -31.44)2 (34-31.44)2 (36 -31.44)2 • (38-31.44)2 • (40_31.44)2----------------------------------------------------------------------------------------- 9=6.06 2 58 V 甲二 100%=8.6% 30V 乙二100% =19.3%31.44 所以甲组的平均产量代表性大一些2. 解:计算过程如下表:3. 解:计算过程如下表:X 甲80 77600X 乙=80= 970(元)X 甲=9550 119.480 (件)X 乙二 9660120.8=80(件)V 甲二旦06100%=7.58%119.4V 乙二!08! 100% =8.94%120.8所以甲厂工人的平均产量的代表性要高些4. 解:55 3 65 7 75 18 85 12 95 5=11 =7010=76.4718-7 18-1245 “10=70 上 10 = 76.94185.解:(1)上期的平均计划完成程度为100% =99.67%CT 甲=6568.7580二 9.06 (件)9355'80-10.81(件)3 7 18 12 5 18 -780 110% 700 108% 1000 100% 1500 95%80 700 1000 1500(2)下期的平均计划完成程度为:96 810 1200 1400------------------------------------------ =103.37%96 810 1200 1400110% 107% 101% 103%6解:P =300 _28100% =90.67%300X P二P = 90.67%二P「90.67% 1 -90.67% =0.2910.291V P100% =32.1%0.9067432.604 321.255 506.943 1042884.3兀/t 432.604 321.255 506.943、 4----------- +------------- +------------ ix 102800 2900 2950 丿苗吾第八章1.= 8722.a =600 670 2 .670 840 2 . 840 1020 1 . 1020 900 2 • 900 980 3 980 4030 ?2 2 2 2 2 23.解:全年月平均计划完成程 度为: 303 306 324 310 350 368 410 412 485 463 350 385 303 306 ------ + -------- 101% 102% 435 如00% = 105.85%324 310 350 368 410 412 485 463 350 385 + ------- + -------- + -------- + ------- + -------- + -------- + ------- + ------- + --------- + --------- 110% 105% 106% 98% 112% 105% 120% 97% 102% 113%576 4500 462亠 100% =79.63% 580 620 580 600 - 2 25.解:⑴甲工区上半年建筑安装 工人的月平均工资为:680 620 620 680 680 720 720 690 690 700 700 710 /汇600+ 汇620+ 江640+ 汇645 + ^625+ 汉610 2 2 2 680 620 680 720 690 7002 22乙工区上半年建筑安装工人的月平均工资为:650 670 670 680 “c 680 730 730 655 655 710 一 710 690640 600 620 655 615600 =623.7(元)2 650 + 670 + 680+730 + 655 + 710 +2 2 二 621.6(元)6■解:平均增长速度=4黔1皿7% 2000年该县粮食产量为:500 1 4.67% 10 = 788.7(万吨) 7解:计算过程如下表a y=竺=45.44 n 9则直线趋势方程为:y = a bt1994年的地方财政支出额为:45.44, 4.3 5 =66.94(万元)二次曲线方程为:y = 0.0108x2 + 4.1918x + 24.143过程略)指数曲线方程为:y = 26.996e0.0978x8.解:计算过程如下表原数列趋势图日期9•解:(1)同季平均法求季节比率的过程如下表第一季第二季第三季度第四季合计1987 13 18 311988 5 8 14 18 451989 6 10 16 22 541990 8 12 19 25 641991 15 17 32平均8.5 11.75 15.5 20.75 14.125 季节比率60.2% 83.2% 109.7% 146.9% 100.0%⑵趋势剔除法测定的季节变动如下表第一季第二季第三季度第四季合计19871988 44.94 71.11 123.08 153.191989 48.98 76.92 116.36 154.391990 53.78 76.8 112.59 136.051991平均49.23 74.94 117.34 147.88 389.40校正系数 1.0272214 1.027221366 1.027221366 1.02722137季节比率50.57 76.98 120.54 151.90 400.00第七章统计指数' q i Z。
第三章统计数据的整理和显示习题二、单项选择题1.统计分组的关键问题是( A >A确定分组标志和划分各组界限 B确定组距和组数C确定组距和组中值 D确定全距和组距4.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为(C >b5E2RGbCAP每个组上限与下限的中点值称为组中值,对于开口组的组限是按相邻组的组距来计算的,所以末组开口组的组中值=末组下限+邻组组限/2=200+<200-170)=230p1EanqFDPwA260 B 215 C 230 D 1855.下列分组中按品质标志分组的是( B >品质标志是说明事物的性质或属性特征的,它反映的是总体单位在性质上的差异,它不能用数值来表现。
A人口按年龄分组 B产品按质量优劣分组C企业按固定资产原值分组 D乡镇按工业产值分组6.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于( C >A简单分组 B平行分组 C复合分组 D再分组7.用组中值代表各组内的一般水平的假定条件是( D > A各组的次数均相等 B各组的组距均相等C各组的变量值均相等 D各组次数在本组内呈均匀分布9.对某地区的全部商业企业按实现的销售额多少进行分组,这种分组属于( A >A变量分组 B属性分组 C分组体系 D复合分组10.在频数分布中,频率是指( C >A各组频数之比 B各组频率之比 C各组频数与总频数之比 D 各组频数与各组次数之比11.频数分布用来表明( A >A总体单位在各组的分布状况 B各组变量值构成情况C各组标志值分布情况 D各组变量值的变动程度12.在分组时,若有某单位的变量值正好等于相邻组的下限时,一般应将其归在( B >A上限所在组 B下限所在组C任意一组均可 D另设新组13.在编制组距数列时,当全距不变的情况下,组距与组数的关系是( B >A正例关系 B反比例关系 C乘积关系 D毫无关系14.统计表的宾词是用来说明总体特征的( C >A标志 B总体单位 C统计指标 D统计对象15.统计表的主词是统计表所要说明的对象,一般排在统计表的( A >A左方 B上端中部 C右方 D下方三、多项选择题1.统计分组的作用在于( BCD >A区分现象的类型 B反映现象总体的内部结构变化C比较现象间的一般水平 D分析现象的变化关系 E研究现象之间数量的依存关系2.指出下表表示的分布数列所属的类型(ABC >A品质数列 B变量数列 C分组数列 D异距数列 E等距数列3.指出下列分组哪些是品质分组( ABCD >A人口按性别分组 B企业按产值多少分组C家庭按收入水平分组 D在业人口按文化程度分组E宾馆按星级分组6.从形式上看,统计表由哪些部分构成(CDE>A总标题 B主词 C纵栏标题 D横行标题 E宾词7.按主词是否分组,统计表可分为( AC >A单一表 B简单表 C分组表 D复合表 E综合表9.统计数据整理的内容一般有( BCE >A对原始数据进行预处理 B对统计数据进行分组C 对统计数据进行汇总 D对统计数据进行分析E编制统计表、绘制统计图11.某单位100名职工按工资额分为300以下、300-400、400-600、600-800、800以上等五个组。
第一章复习思考题与练习题:一、思考题1.统计的基本任务是什么?2.统计研究的基本方法有哪些?3.如何理解统计总体的基本特征。
4.试述统计总体和总体单位的关系。
5.标志与指标有何区别何联系。
二、判断题1、社会经济统计的研究对象是社会经济现象总体的各个方面。
()2、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。
()3、总体单位是标志的承担者,标志是依附于单位的。
()4、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。
()5、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的()。
三、单项选择题1、社会经济统计的研究对象是()。
A、抽象的数量关系B、社会经济现象的规律性C、社会经济现象的数量特征和数量关系D、社会经济统计认识过程的规律和方法2、某城市工业企业未安装设备普查,总体单位是()。
A、工业企业全部未安装设备B、工业企业每一台未安装设备C、每个工业企业的未安装设备D、每一个工业3、标志是说明总体单位特征的名称,标志有数量标志和品质标志,因此()。
A、标志值有两大类:品质标志值和数量标志值B、品质标志才有标志值C、数量标志才有标志值D、品质标志和数量标志都具有标志值4、统计规律性主要是通过运用下述方法经整理、分析后得出的结论()。
A、统计分组法B、大量观察法C、综合指标法D、统计推断法5、指标是说明总体特征的,标志是说明总体单位特征的,所以()。
A、标志和指标之间的关系是固定不变的B、标志和指标之间的关系是可以变化的C、标志和指标都是可以用数值表示的D、只有指标才可以用数值表示答案:二、 1.× 2.× 3.√ 4.× 5.×三、 1.C 2.B 3.C 4.B 5.B第三章一、复习思考题1.什么是平均指标?平均指标可以分为哪些种类?2.为什么说平均数反映了总体分布的集中趋势?3.为什么说简单算术平均数是加权算术平均数的特例?4.算术平均数的数学性质有哪些?5.众数和中位数分别有哪些特点?6.什么是标志变动度?标志变动度的作用是什么?7.标志变动度可分为哪些指标?它们分别是如何运用的?8.平均数与标志变动度为什么要结合运用?二、练习题(教材第四章P108课后习题答案)1.某村对该村居民月家庭收入进行调查,获取的资料如下:按月收入分组(元)村民户数(户)500~600 600~700 700~800 800~900 900以上20 30 35 25 10合计120 要求:试用次数权数计算该村居民平均月收入水平。
1.指出下面的变量哪一个属于分类变量()。
A.年龄B.工资C.汽车产量D.购买商品时的支付方式(现金、信用卡、支票)2.指出下面的变量哪一个属于顺序变量()。
A.年龄B.工资C.汽车产量D.员工对企业某项改革措施的态度(赞成、中立、反对)3.指出下面的变量哪一个属于数值型变量()。
A.年龄B.性别C.企业类型D.员工对企业某项改革措施的态度(赞成、中立、反对)4.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的总体是()。
A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入5.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的样本是()。
A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入6.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的参数是()。
A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入7.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的统计量是()。
A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入8.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%回答他们的消费支付方式是用信用卡。
这里的总体是()。
A.IT业的全部从业者B.500个IT从业者C.IT从业者的总收入D.IT从业者的消费支付方式9.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%回答他们的消费支付方式是用信用卡。
这里的“月收入”是()。
第四章思考与习题一、思考题1.什么是集中趋势?测度集中趋势常用指标有哪些?2.算术均值.众数和中位数有何关系?3.什么是几何平均数?其适用场合是什么?4.什么叫离散趋势?测度离散趋势常用指标有哪些?5.为什么要计算离散系数?二、练习题(一)填空题1.统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的__________,反映所有数据向其中心值靠拢或聚集的程度;二是分布的__________,反映各数据远离其中心值的趋势;三是分布的__________,反映数据分布的形状。
2.在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080.750.1080.850.960.2000.1050.1080.760.1080.950.1080.660,则其众数为,中位数为。
3.算术均值有两个重要数学性质:各变量值与其算术均值的__________等于零;各变量值与其算术均值的__________等于最小值。
4.简单算术均值是__________的特例。
4.几何均值主要用于计算__________的平均。
5.在一组数据分布中,当算术均值大于中位数大于众数时属于________分布;当算术均值小于中位数小于众数时属于________分布。
6.__________是各变量值与其均值离差平方的平均数,是测度数值型数据__________最主要的方法。
7.为了比较人数不等的两个班级学生的学习成绩的优劣,需要计算__________;而为了说明哪个班级学生的学习成绩比较整齐,则需要计算________。
8.偏态是对数据分布__________或__________的测度;而峰度是对数据分布_________的测度。
(二)判断题1.众数的大小只取决于众数组与相邻组次数的多少。
()2.当总体单位数n为奇数时,中位数=(n+1)/2。
()3.根据组距分组数据计算的均值是一个近似值。
()4.若已知甲企业工资的标准差小于乙企业,则可断言:甲企业平均工资的代表性好于乙企业。
统计学习题和答案解析[完整]第一部分计量资料的统计描述一、最佳选择题1、描述一组偏态分布资料的变异度,以()指标较好。
A、全距B、标准差C、变异系数D、四分位数间距E、方差2.用均数和标准差可以全面描述()资料的特征。
A.正偏态分布 B.负偏态分布 C.正态分布D.对称分布 E.对数正态分布3.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变 B.均数改变,标准差不变C.两者均不变 D.两者均改变 E.以上都不对4.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距5.偏态分布宜用()描述其分布的集中趋势。
A.算术均数 B.标准差 C.中位数 D.四分位数间距 E.方差6.各观察值同乘以一个不等于0的常数后,()不变。
A.算术均数 B.标准差 C.几何均数 D.中位数 E.变异系数7.()分布的资料,均数等于中位数。
A.对数正态 B.正偏态 C.负偏态 D.偏态 E.正态8.对数正态分布是一种()分布。
(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)A.正态 B.近似正态 C.左偏态 D.右偏态 E.对称9.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。
A.均数 B.标准差 C.中位数 D.四分位数间距 E.几何均数10.血清学滴度资料最常用来表示其平均水平的指标是()。
A.算术平均数 B.中位数 C.几何均数 D.变异系数 E.标准差二、简答题1、对于一组近似正态分布的资料,除样本含量n外,还可计算,S和,问各说明什么?2、试述正态分布、标准正态分布及对数正态分布的某单位1999年正常成年女子血清联系和区别。
甘油三酯(mmol/L)测量结果3、说明频数分布表的用途。
4、变异系数的用途是什么?组段频数5、试述正态分布的面积分布规律。
0.6~ 10.7~ 3三、计算分析题0.8~ 91、根据1999年某地某单位的体检资料,116名正常 0.9~ 13成年女子的血清甘油三酯(mmol/L)测量结果如右表, 1.0~ 19 请据此资料: 1.1~ 25(1)描述集中趋势应选择何指标?并计算之。
第四章 统计描述【4.1】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。
试分别计算产量、成本、劳动生产率的计划完成程度。
【解】产量的计划完成程度=%5.112100%4045100%=⨯=⨯计划产量实际产量即产量超额完成12.5%。
成本的计划完成程=84%.96100%5%-18%-1100%-1-1≈⨯=⨯计划降低百分比实际降低百分比即成本超额完成3.16%。
劳动生产率计划完=85%.101100%8%110%1100%11≈⨯++=⨯++计划提高百分比实际提高百分比即劳动生产率超额完成1.85%。
【4.2】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的0.1%,在五年中,该矿实际开采原煤情况如下(单位:万吨)试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。
【解】本题采用累计法:(1)该煤矿原煤开采量五年计划完成=100%⨯数计划期间计划规定累计数计划期间实际完成累计 =75%.12610210253574=⨯⨯ 即:该煤矿原煤开采量的五年计划超额完成26.75%。
(2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。
【4.3】我国1991年和1994年工业总产值资料如下表:要求:(1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)? (3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几? 【解】(1)(2)是比例相对数;1991年轻工业与重工业之间的比例=96.01.144479.13800≈;1994年轻工业与重工业之间的比例=73.04.296826.21670≈(3)%37.251%)451(2824851353≈-+即,94年实际比计划增长25.37%。
第四章 统计描述【4.1】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。
试分别计算产量、成本、劳动生产率的计划完成程度。
【解】产量的计划完成程度=%5.112100%4045100%=⨯=⨯计划产量实际产量即产量超额完成12.5%。
成本的计划完成程=84%.96100%5%-18%-1100%-1-1≈⨯=⨯计划降低百分比实际降低百分比即成本超额完成3.16%。
劳动生产率计划完=85%.101100%8%110%1100%11≈⨯++=⨯++计划提高百分比实际提高百分比即劳动生产率超额完成1.85%。
【4.2】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的0.1%,在五年中,该矿实际开采原煤情况如下(单位:万吨)试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。
【解】本题采用累计法:(1)该煤矿原煤开采量五年计划完成=100%⨯数计划期间计划规定累计数计划期间实际完成累计 =75%.12610210253574=⨯⨯ 即:该煤矿原煤开采量的五年计划超额完成26.75%。
(2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。
【4.3】我国1991年和1994年工业总产值资料如下表:要求:(1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)?(3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几? 【解】(1)(2)是比例相对数;1991年轻工业与重工业之间的比例=96.01.144479.13800≈;1994年轻工业与重工业之间的比例=73.04.296826.21670≈(3)%37.251%)451(2824851353≈-+即,94年实际比计划增长25.37%。
思考题与练习题参考答案【友情提示】请各位同学完成思考题和练习题后再对照参考答案。
回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。
学而不思则罔,如果直接抄答案,对学习无益,危害甚大。
想抄答案者,请三思而后行!第一章绪论思考题参考答案1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。
即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。
2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。
3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。
练习题参考答案一、填空题1.调查。
2.探索、调查、发现。
3. 目的。
二、简答题1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。
2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。
不解决问题时,重复第②-⑥步。
3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。
三、案例分析题1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:姓名;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。
第一章1*.下面的列联表是根据一个小城市的居民教育水平(以获得了高中文凭和没有获得高中文凭分类)和就业状况(以全职和非全职分类)所做出如果原假设即在教育水平和工作状态之间没有联系为真,那么下列哪一个选项表明了获得了高中文凭并且是全职工作的期望值? A.9252157g B. 9282157g C.528292g D. 655292g E. 925282g 1*. Answer :BAnalysis :本题考查二维表中两个变量的独立性,如果原假设独立成立,那么cell “earned at least a high school diploma ”和“ employed full time ”的期望值为:92829282(,)()()157157157157P Earned Employed Total P Earned P Employed Total ===g g g g g g2*.一次实验中,每一个随机样本中的成人都有他的最喜爱的颜色,下表展示了按年龄分组的试验结果。
如果对于颜色的偏好是同年龄组相互独立,下列哪一个选项表明了年龄组30到50岁,喜爱绿色的人数的期望值? A.(99)(108)314 B. (69)(108)314 C. (99)(35)108 D. (35)(108)314 E. (99)(35)3142*. Answer :A Analysis :本题考查二维表中两个变量的独立性,如果两个变量独立,那么cell “aged 30 to 50”和“prefer green ”的期望值为:1089999108(3050,)(3050)()314314314314P green Total P P green Total -=-==g g g g g g 第二章1*.下面的直方图代表了五种不同的数据集的分布,每个都包含28个整数,从1到7,水平和垂直比例对所有图形都是相同的。
下面哪个图代表了有最大标准差的数据集?A. B.C. D.E.2*..这张图是一次统计学考试中40个成绩的累积相对频率直方图,下列哪一个选项可以从这张A.较低的20个分数的差异大于较高的20个分数的差异B.中位数小于50C.60%的学生的分数高于80分D.如果设定及格线是70,那么大多数人没通过这次考试E.这张图的平均水平组是60分,低于这个组的分数出现的频率更高F.1*. Answer:DG.Analysis:本题考查如何判断直方图的spread,显然,图D的标准差是最大的。
1*. Answer:DAnalysis:本题考查如何判断直方图的spread,显然,图D的标准差是最大的。
这张图是一次统计学考试中40个成绩的累积相对频率直方图,下列哪一个选项可以从这张图中得出?A.较低的20个分数的差异大于较高的20个分数的差异B.中位数小于50C.60%的学生的分数高于80分D.如果设定及格线是70,那么大多数人没通过这次考试E.这张图的平均水平组是60分,低于这个组的分数出现的频率更高2*. Answer:AAnalysis:本题考查累计频数分布图,较低的20个分数累积的比较快,较高的20个分数累积的比较慢,所以,较低的20个分数的变异性较大。
3*.Set ISet II20 30 45 50 60这张箱线图表明了两个统计数据组,根据这张箱线图,下列哪一个选项不能推断出来?A.1组的范围和2组的范围一样B.1组的四分位差和2组的四分位差一样C.1组的中位数比2组的中位数小D.1组的数据同2组的数据有相同的数据量E.2组大约75%的数据大于或等于1组中大约50%的数据Analysis:本题考查平行箱线图的数值特征。
I和II的极差相同;IQR就是箱子的宽度,I和II 相同;中间的竖线是中位数,I小于II;从图中看不出I和II的数据量是否相同;I的中位数和II的下四分位数相同,所以II中至少有75%的数据比I中50%的数据大。
4*.植物学家正在研究两种不同种类的百合花的花瓣长度(以毫米计)。
上面的箱线图是选取两个不同物种的相同大小的样本的花瓣长度收集的数据。
根据这个箱线图,哪一个选项是这次研究出的正确结果?A.两组的四分位差相同B.B种花的长度范围大于A种花C.A种花的长度同B种花的长度相比有更多长于70mm的花瓣D.B种花的长度同A种花的长度相比有更多长于40mm的花瓣E.B种花的长度同A种花的长度相比有更多少于30mm的花瓣4*. Answer:EAnalysis:本题考查平行箱线图的数值特征。
A的IQR比B的小;A和B的极差相同;大于70的数据A比B的少;大于40的数据A比B多;大于30的数据A比B多。
5*.詹妮尔收集了一个大样本中每一个顾客在当地一个商店中停留的时间。
这些数据被分为男士组和女士组。
下图是这些数据的箱线图。
下面哪一个说法是正确的?A.男士组在商店停留的时间的极差是40分钟B.男士组平均在商店停留的时间大约为20分钟C.男士组的3/4位数大约是45分钟D.样本中女士组的四分位差是15分钟E.样本中大约一半的男士在商店停留的时间至少同女士一样多Analysis:本题考查平行箱线图的数值特征。
解题思路同第3、4题,不再赘述。
6*.在1830年,土地测量员开始调查路易斯安那州的土地购买。
他们的部分任务是调查该区下列哪一个选项表示了累积相对频率表中树木直径在12到16英寸的组A. 0.615 - 0.325B. 0.615 - 0.473C. 0.726 - 0.325D. 0.726 - 0.473E. 0.731 - 0.325 6*. Answer :CAnalysis :本题考查通过累积频率计算相应的区间。
注意,题目问的是直径在12到16英尺之间,包括12和16。
所以应该是11对应的相对频率0.325到16对应的相对频率0.726。
B. 问答题1*.美国每个州每年公立学校招收学生与雇佣老师的数量的数据由美国每个州记录。
从这些记录中,每个州学生和老师的数量比值(p-t 比)可以被计算出来。
下面的柱状图显示了每个州在2001 - 2002学年的p-t 比。
左边的柱状图显示了密西西比河以西的24个周的比率,右边的柱状图显示了密西西比河以东的26和州的比率(a ) 描述你如何估计这两组数据的中位数的方法。
然后用你所描述的方法估计西部地区的中位数和东部地区的中位数。
(b ) 简单用几句话比较2001-2002学年这两组数据p-t 值。
(c ) 用你从(a )和(b )中的答案,来比较2001-2002学年这两组p-t 值的均值大小 1*. Analysis :本题考查直方图的相关知识。
(a) 找出中位数,根据中位数的定义M e 的位置是12n ,n 1 = 24,n 2 = 26。
所以两个中位数所在的组都是15~16。
(b) shape :west 右偏,east 接近对称;center :中位数相同;spread :the range of west = 22 – 12 = 10,the range of east = 19 – 12 = 7。
(c) west 右偏,有mean > median ;east 接近对称,有mean = median 。
两者中位数相同,所以,mean west > mean east 。
第三章1*.下面的茎叶图显示了16年来两家不同的公司股票每股收益的比较下列哪一个选项是正确的?A.A公司的收益的中位数小于B公司收益的中位数B.A公司收益的范围小于B公司的收益范围C.A公司的3/4位数小于B公司的3/4位数D.A公司收益的均值比B公司收益的均值大E.A公司的四分位差是B公司的四分位差的两倍1*. Answer:DAnalysis:本题考查背靠背茎叶图的数值特征。
A的中位数为1.955,B的中位数为1.32;A 的极差为3.32,B的极差为1.71;A的上四分位数为2.49,B的上四分位数为1.65;A的均值为2.1475,B的均值为1.38625;A的IQR为1.06,B的IQR为0.67。
2*. 一个公司想要确定员工的医疗费用。
对一个25个雇员的样本进行采访,确定他们上一年的医疗花费。
后来该公司发现,最高的医疗费用在样本被错误地记录为10倍的实际金额。
但是,在纠正错误之后,正确的数字依然大于或等于样本中任何其他的医疗花费数字。
下列哪个样本统计量必须在更正后保持不变?A. Mean 均值B. Median 中位数C. Mode 众数D. Range 范围E. Variance 方差2*. Answer:BAnalysi:本题考查变量取值的变化对变量数字特征的影响。
题中把数据错误变为原来的10倍。
改正后数据还是偏大,那么和正确的相比,只有中位数不会变化。
3*. 从总人口中随机选取一个10人大小的随机样本。
这个样本的方差是0。
下列哪一个选项是正确的?1:总人口的方差也是0。
2:样本的均值和样本的中位数一样。
3:这10个样本数据数学上相等A. I only 只有1B. II only 只有2C. III only 只有3D. I and II 1和2E. II and III 2和33*. Answer:EAnalysis:本题考查样本均值与中位数的关系受方差变化的影响。
样本方差为0,说明样本数据没有波动,即样本中每个数据都是相同的,但这并不意味着总体也是如此。
所以样本均值和中位数相等。
4*.一个教授教两个统计学班。
早上的课有25个学生,他们的第一次测试平均分是82。
晚上的课有15个学生,他们的第一次测试成绩是74。
考虑他两个班的情况,教授所教全部学生的平均测试成绩是多少? A. 76 B. 78 C. 79 D. 80E. The average cannot be calculated since individual scores of each student are not available. 由于不是每个学生成绩都知道所以不可计算 4*. Answer :CAnalysis :本题考查平均数的计算。
两个班级的平均成绩为:25821574792515⨯+⨯=+5*. 从芒廷维尤学区抽取一个25个家庭的随机样本进行调查。
在这次调查中,收集的数据是每一个家庭中生活的最小的小孩。
下面的直方图展示了这次调查中得到的数据。
下面哪一个组包含了这次调查中的均值A. 0 years old to less than 2 years old 0岁到小于2岁B. 4 years old to less than 6 years old 4岁到小于6岁C. 6 years old to less than 8 years old 6岁到小于8岁D. 8 years old to less than 10 years old 8岁到小于10岁E. 10 years old to less than 12 years old 10岁到小于12岁 5*. Answer :DAnalysis :本题考查中位数的计算。