(完整版)统计书后习题答案(可编辑修改word版)
- 格式:docx
- 大小:177.41 KB
- 文档页数:39
统计学课后习题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】第四章 统计描述【】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。
试分别计算产量、成本、劳动生产率的计划完成程度。
【解】产量的计划完成程度=%5.112100%4045100%=⨯=⨯计划产量实际产量即产量超额完成%。
成本的计划完成程=84%.96100%5%-18%-1100%-1-1≈⨯=⨯计划降低百分比实际降低百分比即成本超额完成%。
劳动生产率计划完=85%.101100%8%110%1100%11≈⨯++=⨯++计划提高百分比实际提高百分比即劳动生产率超额完成%。
【】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%,试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。
【解】本题采用累计法:(1)该煤矿原煤开采量五年计划完成=100%⨯数计划期间计划规定累计数计划期间实际完成累计 =75%.12610210253574=⨯⨯ 即:该煤矿原煤开采量的五年计划超额完成%。
(2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。
【】我国1991年和1994年工业总产值资料如下表:要求:(1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)(3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几?1991年轻工业与重工业之间的比例=96.01.144479.13800≈;1994年轻工业与重工业之间的比例=73.04.296826.21670≈(3)%37.251%)451(2824851353≈-+即,94年实际比计划增长%。
统计学(第五版)课后习题答案(完整版)第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
统计学课后习题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】第四章 统计描述【】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。
试分别计算产量、成本、劳动生产率的计划完成程度。
【解】产量的计划完成程度=%5.112100%4045100%=⨯=⨯计划产量实际产量即产量超额完成%。
成本的计划完成程=84%.96100%5%-18%-1100%-1-1≈⨯=⨯计划降低百分比实际降低百分比即成本超额完成%。
劳动生产率计划完=85%.101100%8%110%1100%11≈⨯++=⨯++计划提高百分比实际提高百分比即劳动生产率超额完成%。
【】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%,试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。
【解】本题采用累计法:(1)该煤矿原煤开采量五年计划完成=100%⨯数计划期间计划规定累计数计划期间实际完成累计 =75%.12610210253574=⨯⨯ 即:该煤矿原煤开采量的五年计划超额完成%。
(2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。
【】我国1991年和1994年工业总产值资料如下表:要求:(1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)? (3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几?1991年轻工业与重工业之间的比例=96.01.144479.13800≈;1994年轻工业与重工业之间的比例=73.04.296826.21670≈(3)%37.251%)451(2824851353≈-+即,94年实际比计划增长%。
<<统计学 >> 课后习题参考答案第四章1. 计划完成相对指标二一8% 100% =102.9%1+5%2. 计划完成相对指标二1一6% 100% =97.9%1—4%3.4.5.解:⑴计划完成相对指标=14防13 100%"5.56%(2)从第四年二季度开始连续四季的产量之和为:10+11 + 12+14=47该产品到第五年第一季 已提前完成任务,提前 完成的天数90•该产品总共提前10个月零15天完成任务。
6.解:计划完成相对指标10 11 12 14-45V 天 14 一10156 230 540 279 325 470 535200 1040.1% 100% =126.75%(2) 156+230+540+279+325+470=2000 (万吨)所以正好提前半年完成计划7.第五章平均指标与标志变异指标1 . X 甲= :.26 27 28 29 30 31 32 3334=309—20 25 28 30 32 34 36 38 40 '1.44X乙二9AD甲二26-30卩27 -30 28-30 29 -30 30-30 |31 -30 32 - 30 亠|33 - 30 叫34 - 309-2.22AD乙二20—31.44” 25—31.44 十2〔8—31.44 屮30—31.44 +|32|— 31.44 + 34卜31.44 + 網 + 31.44 + 38—|31.44 + 4Q — 9= 5.06R 甲=34-26=8R 乙=40-20=20(26一30)2 (27 一30)2 (28一30)2 (29一30)2 (30 一 30)2 ⑶ 一 30)2 (32 一 30)2 (33一 30)2 (34一33)2--------------------------------------------------------------------- 9=2.58(T 乙一(20 -31.44)2 - (25 -31.44)2 (28 —31.44)2 (30 -31.44)2 (32 -31.44)2 (34-31.44)2 (36 -31.44)2 • (38-31.44)2 • (40_31.44)2----------------------------------------------------------------------------------------- 9=6.06 2 58 V 甲二 100%=8.6% 30V 乙二100% =19.3%31.44 所以甲组的平均产量代表性大一些2. 解:计算过程如下表:3. 解:计算过程如下表:X 甲80 77600X 乙=80= 970(元)X 甲=9550 119.480 (件)X 乙二 9660120.8=80(件)V 甲二旦06100%=7.58%119.4V 乙二!08! 100% =8.94%120.8所以甲厂工人的平均产量的代表性要高些4. 解:55 3 65 7 75 18 85 12 95 5=11 =7010=76.4718-7 18-1245 “10=70 上 10 = 76.94185.解:(1)上期的平均计划完成程度为100% =99.67%CT 甲=6568.7580二 9.06 (件)9355'80-10.81(件)3 7 18 12 5 18 -780 110% 700 108% 1000 100% 1500 95%80 700 1000 1500(2)下期的平均计划完成程度为:96 810 1200 1400------------------------------------------ =103.37%96 810 1200 1400110% 107% 101% 103%6解:P =300 _28100% =90.67%300X P二P = 90.67%二P「90.67% 1 -90.67% =0.2910.291V P100% =32.1%0.9067432.604 321.255 506.943 1042884.3兀/t 432.604 321.255 506.943、 4----------- +------------- +------------ ix 102800 2900 2950 丿苗吾第八章1.= 8722.a =600 670 2 .670 840 2 . 840 1020 1 . 1020 900 2 • 900 980 3 980 4030 ?2 2 2 2 2 23.解:全年月平均计划完成程 度为: 303 306 324 310 350 368 410 412 485 463 350 385 303 306 ------ + -------- 101% 102% 435 如00% = 105.85%324 310 350 368 410 412 485 463 350 385 + ------- + -------- + -------- + ------- + -------- + -------- + ------- + ------- + --------- + --------- 110% 105% 106% 98% 112% 105% 120% 97% 102% 113%576 4500 462亠 100% =79.63% 580 620 580 600 - 2 25.解:⑴甲工区上半年建筑安装 工人的月平均工资为:680 620 620 680 680 720 720 690 690 700 700 710 /汇600+ 汇620+ 江640+ 汇645 + ^625+ 汉610 2 2 2 680 620 680 720 690 7002 22乙工区上半年建筑安装工人的月平均工资为:650 670 670 680 “c 680 730 730 655 655 710 一 710 690640 600 620 655 615600 =623.7(元)2 650 + 670 + 680+730 + 655 + 710 +2 2 二 621.6(元)6■解:平均增长速度=4黔1皿7% 2000年该县粮食产量为:500 1 4.67% 10 = 788.7(万吨) 7解:计算过程如下表a y=竺=45.44 n 9则直线趋势方程为:y = a bt1994年的地方财政支出额为:45.44, 4.3 5 =66.94(万元)二次曲线方程为:y = 0.0108x2 + 4.1918x + 24.143过程略)指数曲线方程为:y = 26.996e0.0978x8.解:计算过程如下表原数列趋势图日期9•解:(1)同季平均法求季节比率的过程如下表第一季第二季第三季度第四季合计1987 13 18 311988 5 8 14 18 451989 6 10 16 22 541990 8 12 19 25 641991 15 17 32平均8.5 11.75 15.5 20.75 14.125 季节比率60.2% 83.2% 109.7% 146.9% 100.0%⑵趋势剔除法测定的季节变动如下表第一季第二季第三季度第四季合计19871988 44.94 71.11 123.08 153.191989 48.98 76.92 116.36 154.391990 53.78 76.8 112.59 136.051991平均49.23 74.94 117.34 147.88 389.40校正系数 1.0272214 1.027221366 1.027221366 1.02722137季节比率50.57 76.98 120.54 151.90 400.00第七章统计指数' q i Z。
第一章统计学及基本概念 3第二章数据的收集与整理10第三章统计表与统计图19第四章数据的描述性分析25第五章参数估计37第六章假设检验49第七章方差分析62第八章非参数检验70第九章相关与回归分析78第十章多元统计分析89第十一章时间序列分析101第十二章指数108第十二章指数108第十三章统计决策120第十四章统计质量管理128第一章统计学及基本概念统计的涵义(统计工作、统计资料和统计学)统计学的内容(统计学分类:理论统计学和应用统计学;描述统计学与推断统计学)统计学的发展史(学派与主要代表人物)数据类型(定类、定序、定距和定比;时间序列、截面数据和面板数据;绝对数、相对数、平均数)变量:连续与离散;确定与随机总体、样本与个体标志、指标及指标体系统计计算工具习题一、单项选择题1. 推断统计学研究()。
(知识点:答案:D)A.统计数据收集的方法B.数据加工处理的方法C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法2. 在统计史上被认为有统计学之名而无统计学之实的学派是()。
(知识点:答案:D)A.数理统计学派B.政治算术学派C.社会统计学派D.国势学派3. 下列数据中哪个是定比尺度衡量的数据()。
(知识点:答案:B)A.性别B.年龄C.籍贯D.民族4. 统计对现象总体数量特征的认识是()。
(知识点:答案:C)A.从定性到定量B.从定量到定性C.从个体到总体D.从总体到个体5. 调查10个企业职工的工资水平情况,则统计总体是()。
(知识点:答案:C)个企业个企业职工的全部工资个企业的全部职工个企业每个职工的工资6. 从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体是().(知识点:答案:A)A. 样本B. 总体单位C. 个体D. 全及总体7. 三名学生期末统计学考试成绩分别为80分、85分和92分,这三个数字是()。
(知识点:答案:D)A. 指标B. 标志C. 变量D. 标志值8. 以一、二、三等品来衡量产品质地的优劣,那么该产品等级是()。
第一章总论一、判断题1. √2. √3.×4. √5. ×6.×7.×8.×二、单选题1.C2.B3.D4.B5.C6.C7.C8.A9.B 10.C 11.A三、多选题1.ABCD(题目中的“五个”应去掉)2.ABE3.BDE4.BE5.AC6.AC第二章统计调查一、判断题1.×2.×3.×4.×5.√6.×7.×8.×9.× 10.√ 11.× 12.× 13.× 14.√ 15.√二、单选题1.B2.C3.C4.C5.C6.D7.D8.C9.D 10.D 11.D 12.C 13.A 14.C 15.A 16.B 17.A 18.B 19.A 20.D三、多选题1.ABCDE2.ABE3.BDE4.ABCD5.ABCDE第三章统计整理一、判断题1.×2.×3.×4.√5.√6.√7.×8.×9.× 10.× 11.√ 12.√二、单选题1.B2.B3.B4.A5.A6.C7.D8.C9.B 10.C 11.D 12.B 13.B三、多选题1.ADE2.CDE3.ABCD4.CD5.ACD6.ABCD7.CDE8.BC9.BCE四、计算题1.某班学生英语考试成绩频数分配表2.某生产车间工人日加工零件数频数分配表第4章综合指标一、判断题1. √2. ×3. ×4. √5. √6. ×7. ×8. ×9. × 10. ×11. × 12. √ 13. × 14. × 15. ×三、单选题1. B2. D3. C4. D5. C6. D7. C8. D9. B 10. A 11. D 12. B四、多项选择题1. ACE2. ABC3.BD4. BCD5. BCD6. ABD7. BCDE8. ACE 五、计算题 1.⑴ 企业2008年2007年实际销售额 2008年销售额为2007年的百分比(%) 计划 实际 完成计划(%)销售额比重(%) 销售额比重(%)甲 1200 30 1224 30.91 102 1100 111.27 乙 1000 25 1026 25.91 102.6 900 114 丙 1800 45 1710 43.18 95 1640 104.27 合计 40001003960100993640108.79⑵ 略2. ⑴ 计划完成程度=%108%10010028272726=⨯+++⑵ 设在第五年第二季度提前天X 完成,则:()100919127759123=-⨯++X X (天)5.45=X 即提前两个季度(6个月)又45天半完成5年计划。
第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
1.已知下表资料:25 20 10 500 2.5 30 50 25 1500 7.5 35 80 40 2800 14 40 36 18 1440 7.2 4514 7 630 3. 15 合 计200100687034. 35_y xf 6870根据频数计算工人平均日产量:〒=金^ =北* = 34.35 (件)£f 200结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
第一章复习思考题和练习题:一、思考题1.统计的基本任务是什么?2.统计研究的基本方法有哪些?3.如何理解统计总体的基本特征。
4.试述统计总体和总体单位的关系。
5.标志和指标有何区别何联系。
二、判断题1、社会经济统计的研究对象是社会经济现象总体的各个方面。
()2、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。
()3、总体单位是标志的承担者,标志是依附于单位的。
()4、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。
()5、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的()。
三、单项选择题1、社会经济统计的研究对象是()。
A、抽象的数量关系B、社会经济现象的规律性C、社会经济现象的数量特征和数量关系D、社会经济统计认识过程的规律和方法2、某城市工业企业未安装设备普查,总体单位是()。
A、工业企业全部未安装设备B、工业企业每一台未安装设备C、每个工业企业的未安装设备D、每一个工业3、标志是说明总体单位特征的名称,标志有数量标志和品质标志,因此()。
A、标志值有两大类:品质标志值和数量标志值B、品质标志才有标志值C、数量标志才有标志值D、品质标志和数量标志都具有标志值4、统计规律性主要是通过运用下述方法经整理、分析后得出的结论()。
A、统计分组法B、大量观察法C、综合指标法D、统计推断法5、指标是说明总体特征的,标志是说明总体单位特征的,所以()。
A、标志和指标之间的关系是固定不变的B、标志和指标之间的关系是可以变化的C、标志和指标都是可以用数值表示的D、只有指标才可以用数值表示答案:二、 1.× 2.× 3.√ 4.× 5.×三、 1.C 2.B 3.C 4.B 5.B第三章一、复习思考题1.什么是平均指标?平均指标可以分为哪些种类?2.为什么说平均数反映了总体分布的集中趋势?3.为什么说简单算术平均数是加权算术平均数的特例?4.算术平均数的数学性质有哪些?5.众数和中位数分别有哪些特点?6.什么是标志变动度?标志变动度的作用是什么?7.标志变动度可分为哪些指标?它们分别是如何运用的?8.平均数和标志变动度为什么要结合运用?二、练习题(教材第四章P108课后习题答案)1.某村对该村居民月家庭收入进行调查,获取的资料如下:按月收入分组(元)村民户数(户)500~600 600~700 700~800 800~900 900以上20 30 35 25 10合计120 要求:试用次数权数计算该村居民平均月收入水平。
第一章绪论思考题1.什么是统计学?请简要说明一下它的发展过程。
统计学是关于数据搜集、整理、归纳、分析的方法论科学。
统计学的发展主要经历了三个阶段:(1)17 世纪中叶至18 世纪,统计学的产生和形成阶段;(2)18 世纪末至20 世纪中叶,统计推断方法和理论体系确立的阶段;(3)20 世纪50 年代以来,统计理论、方法和应用进入了一个全面发展的阶段。
2.统计学、统计数据,以及统计活动之间有什么关系?统计活动直接影响统计数据的数量和质量;统计学是统计实践活动的理论概括,同时,它又用理论和方法研究分析统计实践活动,统计学和统计活动是理论与实践的关系。
3.统计学的研究方法有哪些,它们有怎样的关系?并举例说明。
主要方法有两个:(1)描述统计:搜集由试验或调查所获得的资料,进行整理、归类,计算出各种用于说明总体数量特征的数据,并运用图形或表格的形式将它们显示出来。
(2)推断统计:指利用概率论的理论,根据试验或调查获得的样本信息科学地推断总体的数量特征。
关系:描述统计和推断统计都是统计方法的两个组成部分,前者是统计学的基础,后者是现代统计学的主要内容。
由于现实问题中,要获得总体数据存在很大的难度,能够获得的数据多为样本数据,因此,推断统计在现代统计学中的地位和作用越来越重要,它已成为统计学的核心内容。
当然,描述统计的重要性不可忽略,通过它得到可靠的统计数据并为后面的推断统计提供有效的样本信息,只有这样,才可以运用推断统计方法得出符合实际情况的结论。
4.简要说明总体、样本、变量的概念。
总体:根据一定的目的确定的所要研究对象的全体,它是统计问题最基本的要素;样本:从总体中随机抽取的若干单位构成的集合体,它是统计问题的第二要素;变量:可变的数量;变量的具体表现,即可变数量的不同取值,称为变量值。
5.简述SPSS 统计软件的特点和应用领域。
(1)特点:第一,工作界面友好完善、布局合理、操作简便,大部分统计分析过程可以借助鼠标,通过菜单命令的选择、对话框参数设置、点击功能按钮来完成,不需要用户记忆大量的操作命令。
菜单分类合理,并且可以灵活编辑菜单以及设置工具栏。
第二,具有完善的数据转换接口,可以方便地和 Windows 其他应用程序进行数据共享和交换。
可以读取 Excel、FoxPro、Lotus 等电子表格和数据库软件产生的数据文件,可以读取ASCII 数据文件。
第三,提供强大的程序编辑能力和二次开发能力,方便高级用户完成更为复杂的统计分析任务的需要,具有丰富的内部函数和统计功能。
第四,附带丰富的数据资料实例和完善的使用指南,为用户学习掌握软件的使用方法提供更多的方便。
软件启动后,用户可直接上网访问 SPSS 公司主页获得更多的帮助和信息。
(2)应用领域:社会科学、自然科学、经济管理、商业金融、医疗卫生、体育运动等。
6.SPSS 软件的数据编辑器包括哪些内容?(1)标题栏,显示当前工作文件名称。
(2)主菜单栏,排列 SPSS 的所有菜单命令。
(3)工具栏,排列系统默认的标准工具图标按钮,此栏图标按钮可以通过单击 View 菜单的Toolbars 命令选择隐藏、显示或更改。
(4)状态栏,状态栏位于 SPSS 窗口底部,它反映了工作状态。
当用户将光标置于不同的区域时或者进行不同的操作时将显示不同的内容。
(5)数据编辑栏,用户通过键盘输入的数据首先显示在这里。
(6)数据显示区域。
它是一个二维的表格,编辑确认的数据都将在这里显示,其中每一个矩形格为单元格(Cell),其中边框加黑的单元格称为选定单元格。
数据显示区域的左边缘排列观测量序号,上边缘排列要定义的各变量名。
7.调查表明,顾客每周花在某超市蛋糕的平均费用是30 元,他们选择经常购买蛋糕的主要原因是该蛋糕味道很好。
要求:(1)总体是什么?(2)该项研究所使用的方法是描述统计方法还是推断统计方法?(1)总体是所有的购买蛋糕的顾客;(2)推断统计方法。
第二章数据整理和描述思考题1.获取统计数据有哪两种途径?一种是直接向调查对象搜集反映调查单位的统计数据,一般称为原始数据或第一手数据;另一种是搜集已经加工、整理过的、说明总体现象的数据,一般称为次级数据或第二手数据。
2.统计数据的搜集有哪几种方法?直接观察法、访问法、报告法、问卷法。
3.对统计数据进行搜集时,有哪几种组织方式?普查、抽样调查、重点调查、典型调查。
4.什么是数据分组?数据分组的方式有哪几种?(1)统计数据分组是根据统计研究目的,按某一标志将数据分别列入不同的组,使组与组之间有比较明显的差别,而在同一组内的单位具有相对的同质性,即同一组内各单位之间具有某些共同的特征。
(2)统计数据分组可以按品质标志分组和按数量标志分组。
(一)按品质标志分组就是按照事物的性质和属性特征进行分组。
一般来言,按品质标志分组的操作比较容易,分组也相对稳定。
如人口按性别分组、职工按文化程度分组等;(二)按数量标志分组,就是按照事物的数量特征进行分组。
例如,企业按职工人数、产值、产量等标志分组,人口按年龄分组等。
5.简述组距、组限、组数与组中值的含义以及它们的计算方法。
(1)组距是指各组中最大变量值与最小变量值之差,用i 表示。
计算方法为:i=R/n, 其中,n 表示组数,R 表示变量最大值与最小值之差(即全距);(2)组限是指限定各组组距的数值。
各组的较大值称上限,较小值称下限;(3)组数是指数据被分成的组个数。
计算方法为:n = 1 + 3.322 lg N式中:n 表示组数;N 表示变量值个数;(4)组中值是上限到下限之间的中点数值,其计算公式为:组中值=(上限+下限)/26.向上积累和向下积累的数据有什么区别?累计频数(或频率)可以是向上累计频数(或频率),也可以是向下累计频数(或频率)。
(1)向上累计频数(或频率),通常是指由变量值小的组向变量值大的组依次累计;(2) 向下累计频数(或频率),通常是指由变量值大的组向变量值小的组依次累计。
7.什么是频数分布?试描述频数分布表的编制过程。
(1)分布数列是指在统计分组的基础上,将总体的所有单位按一定标志分组整理,并按一定顺序排列,形成总体单位在各组的分布;(2)一、确定变量数列的形式。
根据变量的类型和变量值的多少及现象本身的特点确定是编制单项数列还是编制组距数列。
二、组距式变量数列编制方法:计算全距、确定组数、确定组距、确定组限、计算组中值、计算累计频数和累计频率。
8.对统计数据进行描述时,有哪几种统计图表表达方式?有统计表和统计图,其中统计图包括:直方图、折线图、曲线图。
9.直方图和折线图有什么区别和关系?折线图可以在直方图的基础上,将直方图的每个长方形的顶端中点用折线连点而成。
如果不绘直方图,也可以用组中值与频数求出坐标点,连接而成。
它们与横轴围成的区域面积相等。
10.请举出自己实际生活中的一组数据,对它进行分组,然后绘制直方图、折线图以及箱线图,分析该组数据的结构特征。
略练习题1.某地区7 月份的气温数据(单位:摄氏度)如下:28 31 32 29 31 33 30 32 34 29 32 30 38 38 37 39 34 36 36 33 34 30 37 36 32 38 35 30 34 35 35(1)对以上数据进行适当的分组;(2)绘制直方图,说明该城市气温分布的特点。
解:(1) 频数分布如下:[28,30) 3;[30,32) 6;[32,34) 6;[34,36) 7;[36,38) 5;[38,40) 4;(2) 直方图略。
从直方图可以看出,该地区7 月份气温集中在34~36 摄氏度的天数最多,其次多的时间集中在30~32 摄氏度或32~34 摄氏度。
2.某人的家位于城市的A 地,工作单位位于城市的B 地,为了确定A、B 两地的车程,他记录了60 天(来回共乘车120 次)内往返于A、B 两地所花的时间(单位:分钟),所得数据如(1)利用SPSS 对以上数据进行排序。
(2)以组距10 进行等距分组,编制频数分布表,并绘制直方图。
解:(1) 略(2) 频数分布表如下:[80,90) 10,[90,100) 37,[100,110) 33,[110,120) 25,[120,130) 15; 直方图略。
(1)用SPSS 对以上数据进行适当的分组,编制频率分布表。
(2)计算出累积频数和累积频率。
(3)绘制直方图和折线图。
解:(1)、(2)(3) 略。
4.为评价某餐馆服务质量,随机调查了120 个顾客对它的评价。
评价服务质量的等级分为(1)编制频率分布表;(2)绘制条形图,找出对该餐馆评价等级的分布。
解:(1)(2) 略(1)对该校四年级学生的成绩绘制直方图;(2)根据直方图分析四年级学生的成绩分布特点。
解:(1) 略;(2) 左偏分布。
6.为了确定灯泡的使用寿命(单位:h),在一批灯泡中随机抽取100 只进行测试,所得结果(1)利用SPSS 对上面的数据进行排序;(2)以10 为组距进行等距分组,构建频率分布表;(3)根据分组数据绘制茎叶图和箱线图,说明数据分布的特点。
解:(1) 略;(2)(3)略。
第三章数据特征的度量思考题1.数据分布的特征可以从哪些方面进行度量和描述?(1)数据集中程度度量的常用方法有均值(算术平均数)、调和平均数、几何平均数、众数、中位数。
(2)数据离散程度的测度方法,常用的有极差、内距、标准差及离散系数。
2.简述中位数、四分位数、十分位数的概念,并举例说明。
中位数是将顺序排列的统计数据从中间分成相等的两部分;四分位数就是将排序后的数据 4 等分的三个数值,每部分包含25%的数据,其中中间的四分位数就是中位数,其余两项分别为下四分位数(Q1)和上四分位数(Q3);十分位数和百分位数分别是将排序后的数据10 等分和100 等分的数值。
3.简述众数、中位数和均值的特点和关系。
(1)关系:当数据呈对称分布时,均值、中位数、众数必定相等,即有x =Me =Mo ;当数据呈左偏分布时,均值小于中位数且小于众数,即有x <Me <Mo ;当数据呈右偏分布时,均值大于中位数且大于众数,即有x >Me >Mo ;(2)特点:均值是根据所有数据计算的一般水平代表值,数据信息的提取足够充分,特别是当用样本信息估计总体特征时,均值就更显示其良好的特征。
因而在统计数据分析中均值起着很重要的作用。
众数、中位数虽然数据信息利用不够充分,但当数据有极端值出现时,中位数的优势就显现了。
4.简述内距、极差、标准差的概念,并举例说明。
(1)内距:又称为四分位数差,是指上四分位数和下四分位数之差,通常用Q d表示;(2)极差:也称全距,它是一组数据的最大值与最小值之差;在组距式数列中,极差可以是最高组的上限与最低组下限之差;(3)标准差:也称均方差,是各数据和均值离差平方平均数的平方根。