当前位置:文档之家› 统计书后习题答案汇总

统计书后习题答案汇总

统计书后习题答案汇总
统计书后习题答案汇总

第一章绪论

思考题

1.什么是统计学?请简要说明一下它的发展过程。

统计学是关于数据搜集、整理、归纳、分析的方法论科学。

统计学的发展主要经历了三个阶段:

(1)17世纪中叶至18世纪,统计学的产生和形成阶段;

(2)18世纪末至20世纪中叶,统计推断方法和理论体系确立的阶段;

(3)20世纪50年代以来,统计理论、方法和应用进入了一个全面发展的阶段。

2.统计学、统计数据,以及统计活动之间有什么关系?

统计活动直接影响统计数据的数量和质量;统计学是统计实践活动的理论概括,同时,它又用理论和方法研究分析统计实践活动,统计学和统计活动是理论与实践的关系。

3.统计学的研究方法有哪些,它们有怎样的关系?并举例说明。

主要方法有两个:

(1)描述统计:搜集由试验或调查所获得的资料,进行整理、归类,计算出各种用于说

明总体数量特征的数据,并运用图形或表格的形式将它们显示出来。

(2)推断统计:指利用概率论的理论,根据试验或调查获得的样本信息科学地推断总体

的数量特征。

关系:描述统计和推断统计都是统计方法的两个组成部分,前者是统计学的基础,后者是现代统计学的主要内容。由于现实问题中,要获得总体数据存在很大的难度,能够获得的数据多为样本数据,因此,推断统计在现代统计学中的地位和作用越来越重要,它已成为统计学的核心内容。当然,描述统计的重要性不可忽略,通过它得到可靠的统计数据并为后面的推断统计提供有效的样本信息,只有这样,才可以运用推断统计方法得出符合实际情况的结论。

4.简要说明总体、样本、变量的概念。

总体:根据一定的目的确定的所要研究对象的全体,它是统计问题最基本的要素;

样本:从总体中随机抽取的若干单位构成的集合体,它是统计问题的第二要素;

变量:可变的数量;变量的具体表现,即可变数量的不同取值,称为变量值。

5.简述SPSS统计软件的特点和应用领域。

(1) 特点:

第一,工作界面友好完善、布局合理、操作简便,大部分统计分析过程可以借助鼠标,通过菜单命令的选择、对话框参数设置、点击功能按钮来完成,不需要用户记忆大量的操作命令。菜单分类合理,并且可以灵活编辑菜单以及设置工具栏。

第二,具有完善的数据转换接口,可以方便地和Windows其他应用程序进行数据共享和交换。可以读取Excel、FoxPro、Lotus等电子表格和数据库软件产生的数据文件,可以读取ASCII数据文件。

第三,提供强大的程序编辑能力和二次开发能力,方便高级用户完成更为复杂的统计分析任务的需要,具有丰富的内部函数和统计功能。

第四,附带丰富的数据资料实例和完善的使用指南,为用户学习掌握软件的使用方法提供更多的方便。软件启动后,用户可直接上网访问SPSS公司主页获得更多的帮助和信息。

(2) 应用领域:社会科学、自然科学、经济管理、商业金融、医疗卫生、体育运动等。

6.SPSS软件的数据编辑器包括哪些内容?

(1) 标题栏,显示当前工作文件名称。

(2) 主菜单栏,排列SPSS的所有菜单命令。

(3) 工具栏,排列系统默认的标准工具图标按钮,此栏图标按钮可以通过单击View菜单的Toolbars命令选择隐藏、显示或更改。

(4) 状态栏,状态栏位于SPSS窗口底部,它反映了工作状态。当用户将光标置于不同的区域时或者进行不同的操作时将显示不同的内容。

(5) 数据编辑栏,用户通过键盘输入的数据首先显示在这里。

(6) 数据显示区域。它是一个二维的表格,编辑确认的数据都将在这里显示,其中每一个矩形格为单元格(Cell),其中边框加黑的单元格称为选定单元格。数据显示区域的左边缘排列观测量序号,上边缘排列要定义的各变量名。

7. 调查表明,顾客每周花在某超市蛋糕的平均费用是30元,他们选择经常购买蛋糕的主要原因是该蛋糕味道很好。要求:

(1) 总体是什么?

(2) 该项研究所使用的方法是描述统计方法还是推断统计方法?

(1) 总体是所有的购买蛋糕的顾客;

(2) 推断统计方法。

第二章数据整理和描述

思考题

1.获取统计数据有哪两种途径?

一种是直接向调查对象搜集反映调查单位的统计数据,一般称为原始数据或第一手数据;另一种是搜集已经加工、整理过的、说明总体现象的数据,一般称为次级数据或第二手数据。

2.统计数据的搜集有哪几种方法?

直接观察法、访问法、报告法、问卷法。

3.对统计数据进行搜集时,有哪几种组织方式?

普查、抽样调查、重点调查、典型调查。

4.什么是数据分组?数据分组的方式有哪几种?

(1)统计数据分组是根据统计研究目的,按某一标志将数据分别列入不同的组,使组

与组之间有比较明显的差别,而在同一组内的单位具有相对的同质性,即同一组

内各单位之间具有某些共同的特征。

(2)统计数据分组可以按品质标志分组和按数量标志分组。

(一)按品质标志分组就是按照事物的性质和属性特征进行分组。一般来言,按品质标志分组的操作比较容易,分组也相对稳定。如人口按性别分组、职工按文化程度分组等;

(二)按数量标志分组,就是按照事物的数量特征进行分组。例如,企业按职工人数、产值、产量等标志分组,人口按年龄分组等。

5.简述组距、组限、组数与组中值的含义以及它们的计算方法。

(1) 组距是指各组中最大变量值与最小变量值之差,用i表示。计算方法为:

i=R/n, 其中,n表示组数,R表示变量最大值与最小值之差(即全距);

(2) 组限是指限定各组组距的数值。各组的较大值称上限,较小值称下限;

(3) 组数是指数据被分成的组个数。计算方法为:

1+

=

.3

322

N

n lg

式中:n表示组数;N表示变量值个数;

(4) 组中值是上限到下限之间的中点数值,其计算公式为:

组中值=(上限+下限)/2

6. 向上积累和向下积累的数据有什么区别?

累计频数(或频率)可以是向上累计频数(或频率),也可以是向下累计频数(或频率)。

(1) 向上累计频数(或频率),通常是指由变量值小的组向变量值大的组依次累计;

(2) 向下累计频数(或频率),通常是指由变量值大的组向变量值小的组依次累计。

7. 什么是频数分布?试描述频数分布表的编制过程。

(1) 分布数列是指在统计分组的基础上,将总体的所有单位按一定标志分组整理,并

按一定顺序排列,形成总体单位在各组的分布;

(2) 一、确定变量数列的形式。

根据变量的类型和变量值的多少及现象本身的特点确定是编制单项数列还是编制组距数列。

二、组距式变量数列编制方法:

计算全距、确定组数、确定组距、确定组限、计算组中值、计算累计频数和累计频率。

8. 对统计数据进行描述时,有哪几种统计图表表达方式?

有统计表和统计图,其中统计图包括:直方图、折线图、曲线图。

9. 直方图和折线图有什么区别和关系?

折线图可以在直方图的基础上,将直方图的每个长方形的顶端中点用折线连点而成。如果不绘直方图,也可以用组中值与频数求出坐标点,连接而成。

它们与横轴围成的区域面积相等。

10. 请举出自己实际生活中的一组数据,对它进行分组,然后绘制直方图、折线图以及箱线图,分析该组数据的结构特征。

练习题

1.某地区7月份的气温数据(单位:摄氏度)如下:

28 31 32 29 31 33 30 32 34 29 32 30 38 38 37 39 34 36 36 33 34 30 37 36 32 38 35 30 34 35 35

(1) 对以上数据进行适当的分组;

(2) 绘制直方图,说明该城市气温分布的特点。

解:(1) 频数分布如下:[28,30) 3;[30,32) 6;[32,34) 6;[34,36) 7;[36,38) 5;[38,40) 4;

(2) 直方图略。从直方图可以看出,该地区7月份气温集中在34~36摄氏度的天数最多,其次多的时间集中在30~32摄氏度或32~34摄氏度。

2. 某人的家位于城市的A地,工作单位位于城市的B地,为了确定A、B两地的车程,他记录了60天(来回共乘车120次)内往返于A、B两地所花的时间(单位:分钟),所得数据如下:

98 101 120 112 94 96 89 108 106 111 113 109 108 112 99 93 98 100 87 89 125 120 118 103 117 111 119 100 105 108 98 96 110 123 117 115 109 103 92 99 88 80 83 86 93 98 90 120 93 98 90 111 109 103 108 112 123 120 109 118 92 91 89 87 95 121 119 123 108 99 103 92 97 95 102 108 113 99 114 89 95 106 109 100 108 112 109 123 121 110 110 124 108 109 113 96 123 105 109 112 96 98 108 112 99 90 93 96 99 96 105 111 120 98 92 103 102 90 113 120

(1) 利用SPSS对以上数据进行排序。

(2) 以组距10进行等距分组,编制频数分布表,并绘制直方图。

解:(1) 略

(2) 频数分布表如下:[80,90) 10,[90,100) 37,[100,110) 33,[110,120) 25,[120,130) 15; 直方图略。

3. 某百货公司冬天连续60天的销售额数据如下(单位:万元):

372 338 403 321 286 357 328 309 329 318 368 349 369 372 353 380 331 347 302 308 383 326 329 333

342 349 351 324 369 362 370 319 342 356 393 382 401 396 377 379 380 356 352 349 363 370 321 316 322 320 336 343 389 369 375 398 359 364 354 350

(1) 用SPSS对以上数据进行适当的分组,编制频率分布表。

(2) 计算出累积频数和累积频率。

(3) 绘制直方图和折线图。

解:(1)、(2)

分组频数频率分布表向下累积向上累积

[285,300) 1 1/60 1 60

[300,315) 3 1/20 4 59

[315,330) 12 1/5 16 56

[330,345) 7 7/60 23 44

[345,360) 13 13/60 36 37

[360,375) 11 11/60 47 24

[375,390) 8 2/15 55 13

[390,405) 5 1/12 60 5

(3) 略。

4. 为评价某餐馆服务质量,随机调查了120个顾客对它的评价。评价服务质量的等级分为五种:A. 优;B. 较好;C. 中等;D. 较差;E. 极差。调查结果如下表所示:

A C C

B D B E

C

D C A B D C C D B C B C C

E D A A C D D E D B B D C C D A B D E E B C C E D A C D E B B A C A C E B B A B C C D E D E B A A C B C A E A A C D C C B E B C D E A E B C C B E D C B A B E E D B A C

B A

C C

D A D B

E C B D D B E

(1) 编制频率分布表;

(2) 绘制条形图,找出对该餐馆评价等级的分布。

解:(1) 频率分布表如下:

评价等级频数频率

A 19 19/120

B 27 9/40

C 32 4/15

D 23 23/120

E 19 19/120

(2) 略

5. 某小学对该校四年级160位学生的数学成绩分组如下:

成绩60分以下60~70 70~80 80~90 90~100 所占比例9.1% 14.4% 32.2% 29.3% 15%

(1) 对该校四年级学生的成绩绘制直方图;

(2) 根据直方图分析四年级学生的成绩分布特点。

解:(1) 略;

(2) 左偏分布。

6. 为了确定灯泡的使用寿命(单位:h),在一批灯泡中随机抽取100只进行测试,所得结果如下:

688 717 696 703 729 704 726 725 699 713 693 697 664 681 721 720 677 679 695 691 692 683 712 733 717 683 707 718 671 701 688 689 683 685 702 741 698 713 676 702 727 708 749 673 651 696 689 736 690 694 706 692 691 747 699 682 698 700 710 722 698 696 666 698 658 674 697 693 710 668 708 729 694 681 695 685 706 661 735 665 701 707 692 690 708 691 722 712 715 706 700 716 728 719 685 709 691 684 705 718

(1) 利用SPSS对上面的数据进行排序;

(2) 以10为组距进行等距分组,构建频率分布表;

(3) 根据分组数据绘制茎叶图和箱线图,说明数据分布的特点。

解:(1) 略;

(2) 频率分布表如下:

分组频数频率

[650,660) 2 1/50

[660,670) 5 1/20

[670,680) 6 3/50

[680,690) 14 7/50

[690,700) 26 13/50

[700,710) 18 9/50

[710,720) 13 13/100

[720,730) 10 1/10

[730,740) 3 3/100

[740,750) 3 3/100 (3) 略。

第三章 数据特征的度量

思考题

1. 数据分布的特征可以从哪些方面进行度量和描述?

(1) 数据集中程度度量的常用方法有均值(算术平均数)、调和平均数、几何平均数、

众数、中位数。

(2) 数据离散程度的测度方法,常用的有极差、内距、标准差及离散系数。

2. 简述中位数、四分位数、十分位数的概念,并举例说明。 中位数是将顺序排列的统计数据从中间分成相等的两部分;

四分位数就是将排序后的数据4等分的三个数值,每部分包含25%的数据,其中中间的四分位数就是中位数,其余两项分别为下四分位数(Q 1)和上四分位数(Q 3); 十分位数和百分位数分别是将排序后的数据10等分和100等分的数值。

3. 简述众数、中位数和均值的特点和关系。 (1) 关系:

当数据呈对称分布时,均值、中位数、众数必定相等,即有Mo Me x ==; 当数据呈左偏分布时,均值小于中位数且小于众数,即有Mo Me x <<; 当数据呈右偏分布时,均值大于中位数且大于众数,即有Mo Me x >>;

(2) 特点:均值是根据所有数据计算的一般水平代表值,数据信息的提取足够充

分,特别是当用样本信息估计总体特征时,均值就更显示其良好的特征。因而在统计数据分析中均值起着很重要的作用。众数、中位数虽然数据信息利用不够充分,但当数据有极端值出现时,中位数的优势就显现了。

4. 简述内距、极差、标准差的概念,并举例说明。

(1) 内距:又称为四分位数差,是指上四分位数和下四分位数之差,通常用Q d 表示; (2) 极差:也称全距,它是一组数据的最大值与最小值之差;

在组距式数列中,极差可以是最高组的上限与最低组下限之差; (3) 标准差:也称均方差,是各数据和均值离差平方平均数的平方根。

5. 什么是离散系数?为什么要计算离散系数?

(1) 常用的离散系数主要有标准差系数,也称均方差系数,它是数据的标准差与其相应

的均值之比;

(2) 原因:总体和样本的离散程度除了受变量值之间的离散程度影响外,还受变量值本身水平高低的影响,因此,在比较不同总体和样本的离散程度时,应消除由于变量值水平不同或计量单位不同带来的影响。在统计分析中,用离散系数来比较不同总体和不同样本的均值的代表性。

6. 简述偏度和峰度的概念。

偏度:偏度是对分布偏斜方向及程度的度量;

峰度:是对数据分布尖峭程度的度量,它可以衡量频数分布的集中程度。

练习题

1. 对某公司28位员工的年龄进行统计,得到数据如下(单位:周岁):

28 29 32 22 23 46 42 23 29 40 26 30 32 37 44 25 25 27

42 30 24 43 25 33 33 31 39 27

(1) 计算员工年龄的众数、中位数和平均数; (2) 计算标准差;

(3) 绘制员工年龄的茎叶图,说明员工年龄的分布特征。 解:(1) 众数:25,中位数:30,平均数:887===31.6786;2828

S x (2) 7.2011; (3) 略。

2. 某地区7月份上半月的气温数据如下(单位:摄氏度):

35 37.5 28 32 37 39 37 36.5 33 35 37 29 27 30 31 (1) 计算该地区7月份上半月气温的众数、中位数和算术平均数; (2) 计算几何平均数; (3) 计算气温的标准差;

(4) 绘制直方图,说明气温分布的特点。 解:(1) 众数:37,中位数:35,算术平均数:504===33.6;1515

S x (2) 几何平均数:11153537.531 2.6710;G =???=?

(3) 3.874; (4) 略。

(将第3题改成了分组数据)

3. 某百货公司冬天连续60天的销售额数据分组如下(单位:万元):

按销售额分组(万元)

频数(i f )

组中值(i x )

280~290 1 285 290~300 3 295 300~310 9 305 310~320 10 315 320~330 13 325 330~340 11 335 340~350 8 345 350~360

5

355

试计算该组数据的平均数、中位数、众数。 解:(1)

325.1667,x =

(2)/230320~33060-23

2320+*10325.3846,

13

N Me =≈≈由确定中位数在组内,故

(3)由题中数据分布知,众数在出现次数最多的320~330组内,故

13-10

320+

*10326.(13-10)+(13-11)

Mo ≈≈

s=

4. 一项对大学生身高状况的调查表明,男生的平均身高为175cm ,标准差为5cm ,女生的平均身高为165cm ,标准差为5cm 。试问是男生的身高差异大还是女生的身高差异大? 解:比较男、女生身高的离散系数,

5

5===0.02857===0.0303,175165

v v x x σσ男

女男女男女,

,v v <男女故女生的身高差异大。

5. 对10名男生和10名女生的体重(单位:Kg)进行抽样调查,结果如下:

男生组 64 56 60 62 68 54 52 60 65 61 女生组

52

54

45

50

48

47

54

55

46

50

(1) 现在要比较男生和女生的体重差异,应采用什么方法?

(2) 比较分析哪一组的体重差异大? 解:(1) 采用离散系数进行比较; (2)

602

==60.2=5.0067==0.083210x v x σσ男男男男男

,,,

501

==50.1=3.573==0.071310x v x σσ女女女女女

,,,

>v v 男女由于,故女生组体重差异大。(男生组体重差异大)

6. 一种机器由多个零组件组成,在使用之前需要人工组装,现在有四种组装方法,为选取最好的方法,随机抽取10个工人,由他们分别用四种方法进行组装。工人们分别采用四种方法组装的机器数量(单位:台)如下:

方法A 方法B 方法C 方法D 92 65 82 79 93 69 88 73 90 59 78 69 85 60 70 70 89 62 79 75 91 67 83 68 87 56 85 65 82 58 80 70 83 63 79 72 90

62

78

71

试采用一种你认为比较好的方法来评价组装方法的优劣。 解:下表给出了一些主要描述统计量:

方法A 方法B 方法C 方法D 平均数 88.2 62.1 80.2 71.2 中位数 89.5 62 79.5 70.5 众数 90 62 78、79 70 标准差 3.795 4.0675 4.8488 3.8816 极差

11

13

18

14

最小值 82 56 70 65 最大值 93

69

88

79

7. A 、B 、C 三个工厂生产3种产品的单位成本和总成本资料如下(单位:元):

产品名称 单位成本

总成本 A 工厂 B 工厂 C 工厂 甲 乙 丙

7 11 18

3410 4000 3890

2000 5200 5420

4150 3820 3000

试比较三个工厂哪一个总平均成本高? 解:比较三个工厂的总平均成本:

34104000389011300

10.592,3410400038901066.8901

71118A x ++=

==++

2000520054201262011.911,2000520054201059.5521

71118B x ++===++

415038203000109709.911,4150382030001106.7967

71118C x ++===++

故B 工厂总平均成本最高。

(将第8题删除)

8. 一应试者准备参加某公司的招聘测试,该测试分三个过程,在A 项测试中,其平均分

数是120分,标准差为20分;在B 项测试中,其平均分数是360分,标准差为40分,在C 项测试中,其平均分数是500分,标准差为60分。这位应试者参加测试后,在A 项测试中考了125分,在B 项测试中得了380分,在C 项测试中得了530分。与平均分数相比,该应试者哪一项测试更为理想? 解:通过计算标准化值来判断,

125120380360530500

0.25,0.5,0.5,204060

A B C Z Z Z ---=

===== 说明在A 项测试中该应聘者比平均分数高出0.25个标准差,而B 、C 项测试中均高出0.5

个标准差,由于B 、C 测试的标准化值A 项测试,所以B 、C 项测试比较理想。

(将第9题删除或者放在第2章作为计算调和平均数的例子) 9. 两个菜场有关销售资料如下:

绿叶蔬菜

单价(元/公斤)

甲市场的销售额(元)

乙市场的销售量(公斤)

A 5 2200 330

B 5.6 1960 350 C

7

1500

430

试计算比较两个菜场价格的高低,并说明原因。 解:2200+1960+15005660

=

==5.6362200196015001004.2857

++5 5.67

x 甲,

3305+350 5.6+43076620===5.964330+350+4301110

x ???乙,

故乙菜场平均价格较高。

原因:尽管两个菜场的单价相同,但单价较低的蔬菜在甲菜场的销售量中所占比重较大,故拉低了其平均价格。

10. 某班学生《统计学》考试成绩表如下:

成绩(分) 频率(%) (

f ∑) /f

50~60 6.7 60~70 13.3 70~80 30.0 80~90 36.7 90~100 13.3 合计

100.0

试计算该班学生的平均成绩。

解:这里是分组数据,取组中值为代表,

=55 6.7%+6513.3%+7530.0%+8536.7%+9513.3%=3.685+8.645+22.5+31.195+12.635=78.66.

x ?????

x<-c(55,65,75,85,95)

f<-c(.067,.133,.30,.367,.133) > sum(x*f) [1] 78.66

> sqrt(sum((x-78.66)^2*f)) [1] 10.79835

> sqrt(sum((x-78.66)^2*f*100)/99) [1] 10.85275

第四章 统计指数

思考题

1. 什么是统计指数?统计指数与数学上的指数函数有何区别? (1) 统计指数:是表明复杂现象综合变动的相对数; (2) 统计指数与数学上的指数函数是两种完全不同的概念。

2. 统计指数的种类有哪些?

统计指数可以按不同的角度作不同的分类:

(一) 指数按其反映的对象范围的不同,可以分为个体指数和总指数;

(二) 指数按其所反映的社会经济现象特征的不同,分为数量指标指数和质量指标指数; (三) 指数按其采用基期的不同,分为定基指数和环比指数; (四) 指数按其对比内容的不同,分为动态指数和静态指数;

(五) 指数按照常用的计算总指数的方法或形式,可以分为综合指数和平均指数。

3. 综合指数和平均数指数有何区别和联系?

(1) 综合指数是以“先综合,后对比”的方式来编制得到的,就是将对比指标加总之后进

行对比的结果;

(2) 平均指数是以“先对比,后平均”的方式编制得到的,就是对个体指数进行平均的结

果。

4. 什么是拉式指数和帕氏指数?

(1) 拉氏指数是将同度量因素固定在基期水平上,因此也称基期综合指数,公式具体形式如下:

1000

,p p q L p q

=

∑∑ 100

;q q p L q p

=

∑∑

(2) 帕氏指数将同度量因素固定在报告期水平上,因此也称报告期综合指数。公式具体形式如下:

1101

,p

p q P p q

=

∑∑ 110

1

.q q p P q p

=

∑∑

5. 为何要建立指数体系?指数体系有哪两种不同的含义?

(1) 在经济分析中,一个指数通常只能说明某一方面的问题,而实践中往往需要将多个指

数结合起来加以运用,这就需要建立相应的指数体系。

(2) A. 广义的指数体系类似于指标体系的概念,泛指由若干个内容上相互关联的统计指数

所结成的体系;

B. 狭义的指数体系仅指几个指数之间在一定的经济联系基础上所结成的较为严密的数量关系式。

6. 试举一日常生活中的实例来进行总量变动的因素分析。

7. 目前常见的经济指数有哪几种?

常用的经济指数有:居民消费价格指数、生产者物价指数(PPI)、股票价格指数、零售价格指数、农副产品收购价格指数。 练习题

1. 某工厂共生产三种不同的产品,其产量、成本和销售价格数据如下: 商品名称

计量单位

基期产量

报告期 产量

单位成本 销售价格 甲 台 29 33 720 850 乙 个 300 280 380 450 丙

198

230

45

60

计算下列指数:把(1)删除,只保留(2)

分别以单位产品成本和销售价格为同度量因素,编制该工厂的产量指数,并比较说明两种产量指数具有何种不同的经济分析意义。 解:以单位产品成本为同度量因素得

1101

33720+280380+23045140510

=

=

==0.9772,29720+300380+19845143790

q q c

P q c

??????∑∑

以销售价格为同度量因素得

11

1

33850+280450+23060167850

=

=

==0.9785.29850+300450+19860171530

q

q p P q p

??????∑∑

同度量因素不同,以致在计算过程中产量的权数不同。

2. 某市场上四种水果的销售资料如下表:

品种 销售量( kg ) 销售价格(元/ kg) 基期

报告期 基期 报告期 苹果 800 890 5.80 6.00 葡萄 520 572 5.50 5.80 荔枝 608 698 4.80 5.10 香蕉 746 800 3.60 3.40 合计

2674

2960

计算下列指数:

(1) 用拉式公式编制四种水果的销售量指数和价格指数。 (2) 用帕式公式编制四种水果的销售量指数和价格指数。 (3) 比较两种公式编制出来的销售量指数和价格指数的差异。

解:(1) 1

00

890 5.8+572 5.5+698 4.8+800 3.614538.4

=

=

==1.1095,800 5.8+520 5.5+608 4.8+746 3.613104

q

q p L q p

????????∑∑

1000

6800+5.8520+5.1608+3.474613453.2

=

=

==1.0266;5.8800+5.5520+4.8608+3.674613104p p q L p q

????????∑∑

(2) 11

1

8906+572 5.8+698 5.1+800 3.414937.4

=

=

==1.11,8006+520 5.8+608 5.1+746 3.413453.2

q

q p P q p

????????∑∑

1101

6890+5.8572+5.1698+3.480014937.4

=

=

==1.027;5.8890+5.5572+4.8698+3.680014538.4

p p q P p q

????????∑∑

(3) 二者差异不大,帕式指数比拉式公式稍微大一些。

3. 某基层供销社向农民收购农产品的有关资料如下表:

农产品名称

报告期收购价格占基期的%

实际收购额(千元) 基期

报告期 甲 乙 丙 丁

110 115 125 140

1200 800 320 80

1360 920 416 140

要求:

(1) 计算农产品收购价格总指数,以及由于收购价格提高使农民增加的货币收入是多少? (2) 计算农产品收购量总指数,以及由于收购量的变动给农民货币收入带来的影响; (3) 计算报告期收购额与基期收购额的发展速度,及其变动差额。

解:10

00

1.11200 1.15800 1.25320 1.4802752(1) 1.1467,1200800320802400p

p q I p q ?+?+?+?=

===+++∑∑

1000

27522400352;p q p q -=-=∑∑

10001360920416140

2469.16361.1 1.15 1.25 1.4(2) 1.0288,120080032080

2400q q p I q p +++==

==+++∑∑ 10

2469.1636240069.1636;q p q p

-=-=∑∑

13609204161402836

(3)

1.1817,1200800320802400

+++==+++

变动差额为:2836-2400=436千元。

4. 利用指数体系之间的关系回答下列问题:

(1) 某企业今年与去年相比,各种产品的产量增长了10%,总生产费用增长了15%。试问:该企业今年的单位成本有何变化?

(2) 某企业今年职工平均工资水平提高了10%,职工人数增加了3%,问该企业工资总额增长了多少?

解:(1) 设去年的单位成本为1,那么今年的单位成本为

1+15% 1.15

==1+4.55%,1+10% 1.1

比去年的单位成本增加了4.55%;

(2) 设该企业去年的工资总额为1,那么今年的工资总额为

(1+10%)(1+3%)=1.1 1.03=1+13.3%,?

比去年工资总额增加了13.3%.

5. 设有四种金融业类股票的价格和发行量数据如下:

股票名称

价格/元

发行量/万股

前收盘

本日收盘 甲 3.29 3.06 250000 乙 12.03 12.56 7500 丙 13.12 14.02 9000 丁

16.47

16.45

1230 计算股票价格指数,并对股价指数的变动作简要分析。 解:

10 3.06250000+12.567500+14.029000+16.4512301005613.5

=

=

==0.9568,

3.29250000+12.037500+13.129000+16.4712301051063.1

i i p

i i

p q I p q

????????∑∑即股票价格指数下降了4.32%.

6. 某商场出售三种商品销售资料如下表所示: 商品 名称

计量 单位

销售量q 价格p(元) 销售额(元)

基期0q

报 告 期 1q

0p

报 告 期 1p 00p q 11p q

甲 乙 丙 台 件 吨 100 250 400 120 300 600 80 18 40 82 20 50 8000 4500 16000 9840 6000 30000

合计 —

试计算:

(1) 三种商品销售额总指数; (2) 三种商品的价格综合指数; (3) 三种商品的销售量综合指数;

(4) 分析销售量和价格变动对销售额影响的绝对数和相对数。 解:在表中把最后两列补上, (1) 11

00

984060003000045840

1.6084;800045001600028500

p q v p q

++==

==++∑∑

(2)

1101

458404584045840

1.1754;12803001860040960054002400039000p p q I p q

=

=

===?+?+?++∑∑

(3) 01

00

39000

1.368428500

q p q I p q

=

=

=∑∑;

(4) 从绝对变动水平来看,

110011010100458402850017340=45840-39000=6840=39000-28500=10500p q p q p q p q p q p q =-=-=-=-=∑∑∑∑∑∑销售额变动,价格变动的影响额,

销售量变动的影响额,

17340()=6840()+10500(),三者之间的数量关系为元元元

即报告期与基期相比,该商场出售的3种商品的销售额增加了17340元,其中由于价格变动使销售额增加了6840元,由于销售量变动使销售额增加了10500元。

三者之间的数量关系为1.6084=1.1754 1.3684

即报告期与基期相比,该商场出售的3种商品的销售额提高了60.84%,其中由于零售价格的变动使销售额提高了17.54%,由于销售量的变动使销售额提高了36.84%.

统计学习题活页及答案

第三章统计表与统计图 1. 根据数据集03,按“性别”和“教育程度”计算相应的平均工资。用标准的统计表表现用Excel操作所得出的结果。 按“性别”和“教育程度”分类的平均工资 答:(1)男性的平均工资为41283.90;女性的平均工资为26037.59。 (2)平均工资最低的是受教育年限为8年的女性;平均工资最高的是受教育年限为19年的男性。 2. 根据数据集03,按“教育程度”和“性别”计算2007年考核时各个档次的人数。用标准的统计表表现按“教育程度”和“性别”分类的2007年考核为“优”的人数。 3. 根据王小毛、吴燕燕和朱青新三人的一年的销售记录,汇总出各种产品的销售量。答:

(1)一月份A产品的销售总量是486,其原始资料共有四笔:王小毛123,吴燕燕123,95,朱青新145 (2)八月份F产品的销售总量是24,其原始资料共两笔:王小毛12,吴燕燕12 (3)十一月份F产品的销售总量是22,其原始资料只一笔:王小毛22 4. 根据数据集01中C列的“国内生产总值”指标,绘制1952-2006年GDP的趋势图。根据Excel作出的图形,手绘出该趋势图的大概形状。 5. 仿照例题3.3,根据数据集01中的相关资料,编制1953、1963、1973、1983和1993年的饼图,比较这六年产业结构的变化状态,并根据这六年的资料绘制三维百分比堆积柱形图。根据Excel作出的图形,手绘出1953年的饼图和六年的三维百分比堆积柱形图的大概形状。 第四章数据的描述性分析 (1) (2)(分) 2.(1)产量计划完成百分比: (2)实际优质品率: 3.(1) (2)乙菜场比甲菜场平均价格高0.16元,原因是销售结构不同,乙菜场价格高的蔬菜销售的比重占得较大。 4.(1);; (2) (3)、(4)原数列原数列+10 原数列-10 原数列×10 原数列/10

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

统计学习题及答案

单选 问题:下列不属于相关关系的现象是( 3 )。 选项一:企业的投资与产出 选项二:居民的收入与存款 选项三:电视机产量与西红柿产量 选项四:商品销售额与商品销售价格 问题:抽样调查中的抽样误差是指(3 ) 选项一:在调查过程中由于观察、测量等差错所引起的误差 选项二:在调查中违反随机原则出现的系统误差 选项三:随机抽样而产生的代表性误差 选项四:人为原因所造成的误差 问题:企业职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长( 2 )。 选项一:10.0% 选项二:7.1% 选项三:7.0% 选项四:7.2% 问题:在假设检验中,原假设与备择假设( 3 ) 选项一:都有可能被接受 选项二:都有可能不被接受 选项三:只有一个被接受而且必有一个被接受 选项四:原假设一定被接受,备择假设不一定被接受 问题:小王收集了1978年以来历年我国人均GDP与人均消费额的资料,如果要反映这一时期我国生产与消费的关系,用什么图形最为合适?(2 ) 选项一:直方图 选项二:散点图 选项三:饼图 选项四:折线图 问题:若回归直线方程中的回归系数为0,则直线相关系数( 3 )。 选项一:r=1

选项二:r=-1 选项三:r=0 选项四:r 无法确定 问题:若消费者价格指数为95%,则表示( 4 )。 选项一:所有商品的价格都上涨了 选项二:所有商品的价格都下跌了 选项三:商品价格有涨有落,总体来说是上涨了 选项四:商品价格有涨有落,总体来说是下跌了 问题:某连续变量数列末位组为开口组,下限为200,相邻组组中值为170,则末位组中值为( 1 )。选项一:230 选项二:200 选项三:210 选项四:180 问题:若两变量的r=0.4,且知检验相关系数的临界值为,则下面说法正确的是( 3 )。 选项一:40%的点都密集分布在一条直线的周围 选项二:40%的点低度相关 选项三:两变量之间是正相关 选项四:两变量之间没有线性关系 问题:下列指标中包含有系统性误差的是(1 ) 选项一:SSA 选项二:SSE 选项三: 选项四: 问题:人口普查规定标准时间是为了( 1 )。 选项一:避免登记的重复与遗漏 选项二:将来资料具有可比性 选项三:确定调查单位 选项四:登记的方便 问题:SST的自由度是(4 )。 选项一:r-1

统计学习题及答案a

统计学习题及答案a Company Document number:WTUT-WT88Y-W8BBGB-BWYTT-19998

单选 问题:下列不属于相关关系的现象是( 3 )。 选项一:企业的投资与产出 选项二:居民的收入与存款 选项三:电视机产量与西红柿产量 选项四:商品销售额与商品销售价格 问题:抽样调查中的抽样误差是指(3 ) 选项一:在调查过程中由于观察、测量等差错所引起的误差 选项二:在调查中违反随机原则出现的系统误差 选项三:随机抽样而产生的代表性误差 选项四:人为原因所造成的误差 问题:企业职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长( 2 )。 选项一:% 选项二:% 选项三:% 选项四:% 问题:在假设检验中,原假设与备择假设( 3 ) 选项一:都有可能被接受 选项二:都有可能不被接受 选项三:只有一个被接受而且必有一个被接受 选项四:原假设一定被接受,备择假设不一定被接受 问题:小王收集了1978年以来历年我国人均GDP与人均消费额的资料,如果要反映这一时期我国生产与消费的关系,用什么图形最为合适(2 ) 选项一:直方图 选项二:散点图 选项三:饼图 选项四:折线图 问题:若回归直线方程中的回归系数为0,则直线相关系数( 3 )。 选项一:r=1 选项二:r=-1 选项三:r=0

选项四:r 无法确定 问题:若消费者价格指数为95%,则表示( 4 )。 选项一:所有商品的价格都上涨了 选项二:所有商品的价格都下跌了 选项三:商品价格有涨有落,总体来说是上涨了 选项四:商品价格有涨有落,总体来说是下跌了 问题:某连续变量数列末位组为开口组,下限为200,相邻组组中值为170,则末位组中值为( 1 )。选项一:230 选项二:200 选项三:210 选项四:180 问题:若两变量的r=,且知检验相关系数的临界值为,则下面说法正确的是( 3 )。 选项一:40%的点都密集分布在一条直线的周围 选项二:40%的点低度相关 选项三:两变量之间是正相关 选项四:两变量之间没有线性关系 问题:下列指标中包含有系统性误差的是(1 ) 选项一:SSA 选项二:SSE 选项三: 选项四: 问题:人口普查规定标准时间是为了( 1 )。 选项一:避免登记的重复与遗漏 选项二:将来资料具有可比性 选项三:确定调查单位 选项四:登记的方便 问题:SST的自由度是(4)。 选项一:r-1 选项二:n-r 选项三:r-n 选项四:n-1 问题:科学家为了解土壤的理化性质,在实验室中测定土壤样品中的重金属含量,得到数据为( 4 )。

南财统计学活答案

上一篇下一篇共933篇 分享站内信统计学习题活页及答案2012年06月20日20:13:59 第三章统计表与统计图 1、根据数据集03,按“性别”与“教育程度”计算相应的平均工资。用标准的统计表表现用Excel操作所得出的结果。 问:(1)男性的平均工资为______________;女性的平均工资为_____________。 (2)平均工资最低的就是哪类人?_____________ 最高的就是哪类人?________________ 根据数据集03,按“教育程度”与“性别”计算2007年考核时各个档次的人数。用标准的统计表表现按“教育程度”与“性别”分类的2007年考核为“优”的人数。 3、根据王小毛、吴燕燕与朱青新三人的一年的销售记录,汇总出各种产品的销售量。问: (1)一月份A产品的销售总量就是_________,其原始资料就是: (2)八月份F产品的销售总量就是_________,其原始资料就是: (3)十一月份F产品的销售总量就是_________,其原始资料就是: 4、根据数据集01中C列的“国内生产总值”指标,绘制1952-2006年GDP的趋势图。根据Excel作出的图形,手绘出该趋势图的大概形状。 5、仿照例题3、3,根据数据集01中的相关资料,编制1953、1963、1973、1983与1993年的饼图,比较这六年产业结构的变化状态,并根据这六年的资料绘制三维百分比堆积柱形图。根据Excel作出的图形,手绘出1953年的饼图与六年的三维百分比堆积柱形图的大概形状。第四章数据的描述性分析 : 要求:(1)计算工人生产零件的算术平均数;(2)计算工人生产零件的标准差与标准差系数。2.某公司所属三个企业生产同种产品,2007年实际产量、计划完成情况及产品优质品率资料如下: 要求:(1)计算两个菜场蔬菜的平均价格;(2)比较价格的高低,并说明原因。 4.打开Ex4_1,其中有15个数据。

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

统计学习题带答案

统计学习题答案 第一章绪论 一、单项选择 1、某森林公园的一项研究试图确定哪些因素有利于成年松树长到60英尺以上的高度。经估计,森林公园生长着25 000棵成年松树,该研究需要从中随机抽取250棵成年松树并丈量它们的高度后进行分析。该研究的总体是(B )。 A. 250棵成年松树 B.公园中25 000棵成年松树 C.所有高于60英尺的成年松树 D.森林公园中所有年龄的松树 2、推断统计的主要功能是(D )。 A.应用总体的信息描述样本 B.描述样本中包含的信息 C.描述总体中包含的信息 D.应用样本信息描述总体 3、对高中生的一项抽样调查表明,85%的高中生愿意接受大学教育,这一叙述是(D )的结果。 A.定性变量 B.试验 C.描述统计 D.推断统计 4、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此他观察了200名新生,发现他们每个学期平均在教科书上的花费是250元。该研究人员感兴趣的总体是( C )。 A.该大学的所有学生 B.所有的大学生 C.该大学所有的一年级新生 D.样本中的200名新生 5、在下列叙述中,关于推断统计的描述是( B )。 A.一个饼图描述了某医院治疗过的癌症类型,其中2%是肾癌,19%是乳腺癌 B.从一个果园中抽取36个橘子的样本,用该样本的平均重量估计果园中橘子的平均重量 C.一个大型城市在元月份的平均汽油价格 D.反映大学生统计学成绩的直方图 6、你询问了你们班8位同学的经济学成绩,这些成绩的平均数是65分。基于这种信息,你认为全班的经济学平均成绩不超过70分。这个例子属于统计学的哪个分支( C )? A.参数统计 B.描述统计 C.推断统计 D.理论统计 7、某手机厂商认为,如果流水线上组装的手机出现故障的比率每天不超过3%,则认为组装过程是令人满意的。为了检验某天生产的手机质量,厂商从当天生产的手机中随机抽取了30部进行检测。手机厂商感兴趣的总体是( A )。 A.当天生产的全部手机 B.抽取的30部手机 C. 3%有故障的手机 D.30部手机的检测结果

南财统计学活页标准答案

. 上一篇下一篇共933篇 分享站内信统计学习题活页及答案2012年06月20日20:13:59 第三章统计表与统计图 1. 根据数据集03,按“性别”和“教育程度”计算相应的平均工资。用标准的统计表表现用Excel操作所得出的结果。 问:(1)男性的平均工资为______________;女性的平均工资为_____________。 (2)平均工资最低的是哪类人?_____________ 最高的是哪类人?________________ 根据数据集03,按“教育程度”和“性别”计算2007年考核时各个档次的人数。用标准的统计表表现按“教育程度”和“性别”分类的2007年考核为“优”的人数。 3. 根据王小毛、吴燕燕和朱青新三人的一年的销售记录,汇总出各种产品的销售量。问:(1)一月份A产品的销售总量是_________,其原始资料是: (2)八月份F产品的销售总量是_________,其原始资料是: (3)十一月份F产品的销售总量是_________,其原始资料是: 4. 根据数据集01中C列的“国内生产总值”指标,绘制1952-2006年GDP的趋势图。根据Excel 作出的图形,手绘出该趋势图的大概形状。 5. 仿照例题3.3,根据数据集01中的相关资料,编制1953、1963、1973、1983和1993年的饼图,比较这六年产业结构的变化状态,并根据这六年的资料绘制三维百分比堆积柱形图。根据Excel作出的图形,手绘出1953年的饼图和六年的三维百分比堆积柱形图的大概形状。 第四章数据的描述性分析 1.一个车间200名工人某日生产零件的分组资料如下: 零件分组(个)工人数(人) 20 -50 4040 60 50-80 60-70 50 80 70-10 90 -80200 合计 要求:(1)计算工人生产零件的算术平均数;(2)计算工人生产零件的标准差与标准差系数。2.某公司所属三个企业生产同种产品,2007年实际产量、计划完成情况及产品优质品率资料如 下: 企业实际产量(万件)完成计划(%)实际优质品率(%)

统计学习题与答案解析

第一章绪论 一、填空题 1.统计一词从不同角度理解有三种涵义,即统计工作、统计资料和统计学。 2.社会经济统计的研究对象是社会经济现象的数量方面。 3.统计总体具有的特点是大量性、同质性和差异性。 4.标志是说明总体单位特征的,可以分为品质标志和数量标志。 5.统计指标是说明总体特征的,其构成要素有6个,即指标名称、数值、计量单位、计算方法、时间范围、空间范围。 6.职工的文化程度是品质标志,工龄是数量标志。 7.企业的机器台数和职工人数是属于离散变量,而固定资产原值和销售收入是连续变量。 8.要了解我国乳品企业的生产情况,总体是所有乳品企业,总体单位是每一个乳品企业。 9.要了解我国乳品企业的设备状况,总体是所有乳品企业,总体单位是每一个乳品企业。 10.学生的性别、民族属于品质标志,而学生的身高、体重是数量标志。 11.统计指标的概念完整表述为:“说明社会经济现象总体的数量特征的概念和具体数值”。 12.按统计指标的性质不同,统计指标可分为数量指标和质量指标。 二、判断题 1.随着研究目的的不同,总体与总体单位之间是可以变换的,指标与标志也是可以变换的。( T ) 2.张明同学期末数学成绩85分,这是统计指标。( F ) 3.总体单位的特征用指标来说明,总体的特征用标志来说明。( F ) 4.标志可以用文字表现,也可以用数字表现。(T ) 5.指标可以用文字表现,也可以用数字表现。( F ) 6.指标值是由标志值汇总计算而得到。( T ) 7.在全国人口普查中,“年龄”是变量。(T ) 8.某班学生学习情况调查中,班级名称和学生姓名都是可变标志。( F ) 9.张明同学期末数学成绩85分,“成绩”是连续变量,“85分”是变量值。( F ) 10.某企业职工的姓名、民族、年龄、工种等都是品质标志。( F ) 11.统计的研究对象是社会经济现象总体的数量方面。( F ) 三、单项选择题 1.社会经济统计学的研究对象是( A )。 A社会经济现象的数量方面B人类生活现象的数量方面 C自然科学研究的数量方面 D社会经济现象的质量方面2.在确定统计总体时必须注意( A )。

社会统计学复习题有答案

社会统计学复习题有答 案 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。

9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于数量指标;单位成本属于质量指标。 13、如果相关系数r=0,则表明两个变量之间不存在线性相关关系。 二、判断题 1、在季节变动分析中,若季节比率大于100%,说明现象处在淡季;若季节比率小于100%,说明现象处在旺季。(×;答案提示:在季节变动分析中,若季节比率大于100%,说明现象处在旺季;若季节比率小于100%,说明现象处在淡季。 ) 2、工业产值属于离散变量;设备数量属于连续变量。(×;答案提示:工业产值属于连续变量;设备数量属于离散变量) 3、中位数与众数不容易受到原始数据中极值的影响。(√;) 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√)

社会统计学习题和答案--相关与回归分析

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数 第四节 定距变量的相关分析 相关表与相关图·积差系数的导出与计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5~0、8之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不就是随机的;

统计学习题集含答案

第1章导论 一、判断题 1. 在对全国工业设备进行普查中,全国工业企业设备是统计总体,每台工业设备是总体单位。() 2. 总体单位是标志的承担者,标志是依附于总体单位的。() 3. 品质标志表明单位属性方面的特征,其标志值只能用文字来表现,所以品质标志不能转化为统计指标。() 4. 数量指标的表现形式是绝对数,质量指标的表现形式是相对数和平均数。 5. 统计的研究对象是客观现象总体的各个方面。() 6. 统计具有信息、咨询和监督的整体功能,在上述三个职能中,以提供咨询为主。() 7. 某生产小组有5名工人,日产零件为68件、69件、70件、71件、72件,因此说这是5个数量标志或5个变量。() 8. 统计指标有的用文字表示,叫质量指标;有的用数字表示,叫数量指标。() 二、单选题 1.要了解某企业职工的文化水平情况,则总体单位是() A、该企业的全部职工 B、该企业每一个职工的文化程度 C、该企业的每一个职工 D、该企业每一个职工的平均文化程度 2.下列总体中,属于无限总体的是() A、全国的人口总数 B、大海里的鱼 C、城市流动人口数 D、某市工业企业设备数 3.统计工作的全过程各阶段的顺序是() A、统计设计、统计分析、统计调查、统计整理 B、统计调查、统计设计、统计分析、统计整理 C、统计设计、统计分析、统计调查、统计整理 D、统计设计、统计调查、统计整理、统计分析 4.由工人组成的总体所计算的工资总额是() A、数量标志 B、数量指标 C、标志值 D、质量指标

5.几位工人的月工资分别是500元、520元、550元、600元,这几个数字是() A、指标 B、变量 C、变量值 D、标志 6.统计标志用以说明() A、总体属性和特征 B、总体某一综合数量特征的社会经济范畴 C、单位具有的属性和特征 D、总体单位在一定时间、地点条件下动作的结果 7.变异性是指() A、在不同单位可以有不同的标志值 B、总体单位有许多不同的标志 C、现象总体可能存在各式各样的指标 D、品质标志的具体数值 8.下列各项中,属于统计指标的是() A、小王英语考试成绩为85分 B、广州至北京的机票价格为1360元 C、光华公司1999年4~6月份的利润为200万元 D、钢材20吨 9.总体和单位不是固定不变的,而是有() A、在某些场合是要互相变换的 B、只存在总体变换为总体单位的情况 C、只存在总体单位变换为总体的情况 D、所有的标志都能变换为单位 10.离散变量可以() A、被无限分割,无法一一列举 B、按一定次序一一列举,通常取整数 C、用相对数表示 D、用平均数表示 11.下列变量中,属于连续变量的是() A、企业个数 B、企业的职工人数 C、用相对数表示的数据 D、企业拥有的设备台数 12.统计指标体系是指() A、各种相互联系的指标所构成的整体

活页习题

第三章统计表与统计图 1. 根据有关汽车信息数据集ex3_1,(1)按“产地”计算平均每加仑油可行走的英里数(不考虑权数),回答问题。(2)按“汽缸数”计算平均每加仑油可行走的英里数(不考虑权数),回答问题。(3)按“产地”和“汽缸数”交叉分类计算平均每加仑油可行走的英里数(保留两位小数),作出标准的统计表。 问:(1)哪个产地平均每加仑油可行走的英里数最多______________; 哪个产地平均每加仑油可行走的英里数最少______________。 (2)汽缸数为4的车平均每加仑油可行走的英里数为__________; 汽缸数为8的车平均每加仑油可行走的英里数为__________。 2. 根据有关1995年各国信息数据集ex3_2,(1)将所有国家按“地区类型”进行分类,回答问题;(2)将各国人口分为5组,生成新变量“人口类型”:500万人(不包括500万)以下为特小国;500-1000万人(不包括1000万)为小国;1000-5000万人为中等国家;5000-1亿人为大国;1亿人以上为特大国,回答问题;(提示:用Excel帮助功能学习IF函数的用法)(3)按“人口类型”和“地区类型”交叉分类计算平均人均GDP(不考虑人口权数,保留到整数),作出标准的统计表。 问:(1)拉丁美洲有__________个国家;OECD有__________个国家。 (2)特大国有________个国家,占所有国家个数的百分比为_______。 特小国有________个国家,占所有国家个数的百分比为_______。

3. 四位同学组成社会实践小组,用一周的时间销售各类报纸与杂志。根据四人的销售记录ex3_3_1~ex3_3_4,汇总出各类报纸与杂志的销售量。问: (1)“扬子晚报”在一周中销售总量是_________, (2)“扬子晚报”周一的销售量是_________,其原始资料是: (3)“读者”在一周中的销售总量是_________, (4)“读者”周一的销售量是_________,其原始资料是: (5)四位同学在一周内共销售了多少报纸与杂志?________ (6)哪天销售的报纸与杂志的总量最多?________,销售了多少?________ 4. 根据数据集ex3_2,用Excel绘图功能分别绘制条形图和饼图以反映1995年人口类型数据。手绘出统计图的大概形状。 5. 根据数据集ex3_4提供的1952-2009年江苏地区生产总值指标,绘制趋势图。根据Excel作出的图形,手绘出该趋势图的大概形状。(请大家用折线图和散点图分别作图,考虑一下对于我们给出的资料,应该用哪个作图功能是正确的。)

南财统计学活页标准答案

上一篇 下一篇共933篇 分享站内信统计学习题活页及答案2012年06月20日 20:13:59 第三章 统计表与统计图 1. 根据数据集03,按“性别”和“教育程度”计算相应的平均工资。用标准的统计表表现用Excel 操作所得出的结果。 问:(1)男性的平均工资为______________;女性的平均工资为_____________。 (2)平均工资最低的是哪类人_____________ 最高的是哪类人________________ 根据数据集03,按“教育程度”和“性别”计算2007年考核时各个档次的人数。用标准的统计表表现按“教育程度”和“性别”分类的2007年考核为“优”的人数。 3. 根据王小毛、吴燕燕和朱青新三人的一年的销售记录,汇总出各种产品的销售量。问: (1)一月份A 产品的销售总量是_________,其原始资料是: (2)八月份F 产品的销售总量是_________,其原始资料是: (3)十一月份F 产品的销售总量是_________,其原始资料是: 4. 根据数据集01中C 列的“国内生产总值”指标,绘制1952-2006年GDP 的趋势图。根据Excel 作出的图形,手绘出该趋势图的大概形状。 5. 仿照例题,根据数据集01中的相关资料,编制1953、1963、1973、1983和1993年的饼图,比较这六年产业结构的变化状态,并根据这六年的资料绘制三维百分比堆积柱形图。根据Excel 作出的图形,手绘出1953年的饼图和六年的三维百分比堆积柱形图的大概形状。 第四章 数据的描述性分析 1.一个车间200名工人某日生产零件的分组资料如下: 要求:(1)计算工人生产零件的算术平均数;(2)计算工人生产零件的标准差与标准差系数。 2.某公司所属三个企业生产同种产品,2007年实际产量、计划完成情况及产品优质品率资料如下: 要求:(1)计算该公司产量计划完成百分比;( 2)计算该公司实际的优质品率。 3.甲、乙两个菜场三种蔬菜的销售资料如下:

(完整版)社会统计学复习题(有答案),DOC

o o 海量资源,欢迎共阅 社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为比较相对指标;某企业男女职工人数之比为比例相对指标;某产品的废品率为结构相对指标;某地区福利机构网点密度为强度相 对指标。2最小 值。345、正J 6于 重点7;总 8计划超额完成程度为;若某 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程 度为。 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。

海量资源,欢迎共阅 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位 13 1 100%, ) 2 3 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√) 5、统计调查按调查范围划分可以分为全面调查和非全面调查。(√) 6、用移动平均法修匀时间数列时,如果移动项数为偶数项,只要进行一次移动平均;如果移动项数为奇数项,则要进行二次移动平均。(×;答案提示:用移动平均法修匀时间数列 时,如果移动项数为奇数项,只要进行一次移动平均;如果移动项数为偶数项,则要进行二

最新班级学号姓名统计学习题活页

最新班级学号姓名统计学习题活页 1.一个车间200 要求:(1)计算工人生产零件的众数、中位数和算术平均数;(2)说明该数列的分布特征;(3)计算工人生产零件的标准差与标准差系数。 2 要求:(1)计算该公司产量计划完成百分比;(2)计算该公司实际的优质品率。 3.某企业2007 要求:(1)计算平均等级指标说明二季度比一季度产品质量的变化情况;(2)由于质量变化而给该企业带来的收益(或损失)。 4 要求:(1)计算两个菜场蔬菜的平均价格;(2)比较价格的高低,并说明原因。

5.打开Ex4_1,其中有15个数据。 要求:(1)计算这组数据的算术平均数、调和平均数和几何平均数,(2)比较三种平均数的大小;(3)将这组数据减少10、增加10,计算新生成的两组数列的算术平均数、标准差和标准差系数;(4)将这组数据乘以10、除以10,计算新生成的两组数列的算术平均数、标准差和标准差系数。 6.打开Ex4_2,其中是经济学专业2个班级的微积分的期末考试成绩。 要求:(1)计算这个专业微积分成绩的最高分、最低分、算术平均数和标准差(用工具“描述统计”);(2)分别计算这两个班级微积分成绩的最高分、最低分、算术平均数和标准差(用工具“描述统计”);(3)分别统计并做表列出两个班级各档分数的次数(用函数“Frequency”)与所占比重、列出向上、向下累计的次数与频率。 7.打开Ex4_3,其中是2005年江苏省52个县市人均地区生产总值。 要求:计算各项指标,并选择答案: (1)江苏省52个县市的平均人均地区生产总值是多少元? A. 20725 B. 18674 C. 15721 D. 19711 E.85124 (2)江苏省52个县市人均地区生产总值的标准差是多少? A. 36023 B. 11969 C. 9837 D. 5632 E. 21773 (3)江苏省52个县市人均地区生产总值的中位数是多少? A. 6923 B. 4292 C. 13119 D. 5798 E. 14992 (4)江苏省52个县市人均地区生产总值的偏态系数是多少? A. 0.55 B. -1.23 C. 2.56 D. 2.48 E. -0.10 (5)江苏省52个县市人均地区生产总值的峰度系数是多少? A. 8.92 B. -5.28 C. 2.02 D. 6.57 E. -0.54 (6)江苏省52个县市人均地区生产总值的全距是多少? A. 10964 B. 108647 C. 108586 D. 32948 E. 25124 (7)根据斯透奇斯规则对52个县市数据进行分组,组数是多少? A. 9 B. 5 C. 7 D. 6 E. 8 (8)若采用等距数列,根据组数和全距的关系,确定的组距是多少? A. 18500 B. 16300 C. 29400 D. 17000 E. 23200 (9)人均地区生产总值在20600~36900元之间的县市个数是多少? A. 35 B. 8 C. 5 D. 6 E. 20 (10)人均地区生产总值大于20600元的县市个数占全部县市比例是多少? A. 32.7% B. 20.2% C. 25.0% D. 15.6% E. 28.8%

社会统计学期末复习题与答案整理

社会统计学期末复习训练 一、单项选择题(20=2×10) 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样 本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是.样本 2.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查, 以推断所有家庭的年均收入水平。这项研究的总体是 332.1户家庭的年均收入 3.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查, 以推断所有学生的每月生活费用水平。这项研究的总体是 22000名学生的每月生活费用 4.为了解地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。此处5000户是样本5.从变量分类看,下列变量属于定序变量的是产品等级 6.下列变量属于数值型变量的是工资收入 7.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的 机会入选样本,这样的抽样方式称为.简单随机抽样 8.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从 女生中抽取8名学生进行调查。这种调查方法属于分层抽样 9.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽 样的方式抽取子样本,这样的抽样方式称为分层抽样 10.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前 十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。这种调查方法属于系统抽样 11.在频数分布表中,某一小组中数据个数占总数据个数的比例称为频率 12.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为累积频率 13.在频数分布表中,频率是指各组频数与总频数之比 14.在频数分布表中,比率是指不同小组的频数之比 15.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用环形图16.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据线图 17.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形环形图 18.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为 39.19 19.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是 89 20.某企业职工的月收入水平分为五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值为 3250元21.为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:万元)分 别为65、23、54、45、39,那么这5家企业12月份利润额均值为 45.2 22.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那 么该班考试成绩的中位数是88 23.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值 近似为5.5小时

统计学习题及答案(全套完整)2

统计学习题及答案(全套完整)2

————————————————————————————————作者:————————————————————————————————日期: 2

第一部分计量资料的统计描述 一、最佳选择题 1、描述一组偏态分布资料的变异度,以()指标较好。 A、全距 B、标准差 C、变异系数 D、四分位数间距 E、方差 2.用均数和标准差可以全面描述()资料的特征。 A.正偏态分布B.负偏态分布C.正态分布 D.对称分布E.对数正态分布 3.各观察值均加(或减)同一数后()。 A.均数不变,标准差改变B.均数改变,标准差不变 C.两者均不变D.两者均改变E.以上都不对 4.比较身高和体重两组数据变异度大小宜采用()。 A.变异系数B.方差C.极差D.标准差E.四分位数间距 5.偏态分布宜用()描述其分布的集中趋势。 A.算术均数B.标准差C.中位数D.四分位数间距E.方差 6.各观察值同乘以一个不等于0的常数后,()不变。 A.算术均数B.标准差C.几何均数D.中位数E.变异系数 7.()分布的资料,均数等于中位数。 A.对数正态B.正偏态C.负偏态D.偏态E.正态 8.对数正态分布是一种()分布。 (说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?) A.正态B.近似正态C.左偏态D.右偏态E.对称 9.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。 A.均数B.标准差C.中位数D.四分位数间距E.几何均数 10.血清学滴度资料最常用来表示其平均水平的指标是()。 A.算术平均数B.中位数C.几何均数D.变异系数E.标准差 二、简答题 1、对于一组近似正态分布的资料,除样本含量n外,还可计算,S和,问各说明什么? 2、试述正态分布、标准正态分布及对数正态分布的某单位1999年正常成年女子血清 联系和区别。甘油三酯(mmol/L)测量结果 3、说明频数分布表的用途。 4、变异系数的用途是什么?组段频数 5、试述正态分布的面积分布规律。0.6~ 1 0.7~ 3 三、计算分析题0.8~ 9 1、根据1999年某地某单位的体检资料,116名正常0.9~ 13 成年女子的血清甘油三酯(mmol/L)测量结果如右表, 1.0~ 19 请据此资料: 1.1~ 25 (1)描述集中趋势应选择何指标?并计算之。 1.2~ 18 (2)描述离散趋势应选择何指标?并计算之。 1.3~ 13 (3)求该地正常成年女子血清甘油三酯的95%参考值范围。 1.4~ 9 (4)试估计该地正常成年女子血清甘油三酯在0.8mmol/L 1.5~ 5 以下者及1.5mmol/L以下者各占正常女子总人数的百分比。 1.6~1.7 1 合计116 3

相关主题
文本预览
相关文档 最新文档