当前位置:文档之家› 统计学第九章练习题

统计学第九章练习题

统计学第九章练习题
统计学第九章练习题

第九章时间数列分析与预测

一、填空题

9.1.1 时间数列一般由两个基本要素构成:一是现象所属的________________________,二是反映客观现象的________________________。

9.1.2 时间数列按其观察值具体表现形式不同可分为三种:绝对数时间数列、

数列和_______________________数列。

_______________________

9.1.3 同一时间数列中,各期环比发展速度的连乘积等于相应的_______________________。

9.1.4 _________________数列中,各期的指标值直接累计相加有意义。

9.1.5 某公司2007年的利额比2003年增长25%,2006年比2003年增长20%,则2007年比2006年增长_______________________,2004年至2007年平均每年增长_______________________。

9.1.6 某地2006年1季度的GDP为100亿元,2006年3季度的GDP为125亿元,则其年度化增长率为______________。

9.1.7 计算平均发展速度有两种方法,即_____________________和_______________________,它们的数理依据、侧重点、计算方法和应用场合都不相同。

9.1.8 影响时间序列的因素主要有四种,它们是______________、______________、_____________和______________。

9.1.9 时间数列变动的趋势有直线趋势和曲线趋势。在建立模型之前,先要确定现象变动的形态。判定趋势变动形态的方法常用的有两种,即______________和_____________。

9.1.10 若时间数列的_______________________大致相等,则该现象的发展趋势近似于一条直线,可拟合一条直线趋势方程。

9.1.11 如果时间数列中各期二次逐期增减量大致相等,则应拟合方程;如果各期环比发展速度大致相等,则应拟合方程。

9.1.12 某些社会经济现象,随着季节的更换或社会因素的影响而引起的在年度内比较有规律性的变动称_______________________,测定它的变动常用且最简便的方法是

_______________________

9.1.13 客观社会经济现象在一个相当长的时间内,受某些基本因素的影响所呈现的一种基本发展趋势称_______________________。

9.1.14 最小平方法是测定长期趋势最常用的方法,它对趋势线的基本要求是____________。

9.1.15 按月份资料计算的季节指数之和必须等于_____________ ,若不等这个数时,要计算__________________进行调整。

9.1.16 将原时间数列经过逐项移动计算序时平均数对时间数列进行修匀的方法称

_______________________

9.1.17 __________________说明环比增降速度中每增降一个百分点所代表的绝对额。

9.1.18 在对时间数列进行长期趋势分析时当同一时间数列可以配合多种趋势线时,往往以选择___________最小的为宜。

9.1.19 如果时间数列属于各期观察值不含长期趋势及季节变动成分,只是受不规则性波动这一随机因素的影响的平稳时间数列,可运用_____________进行预测。

9.1.20 如果时间数列不受季节波动的影响,而长期趋势是它的主要影响因素,并假定

事物未来的发展趋势与过去的轨迹大致一样,那么可以用_________________进行预测。

9.1.21 在预测中,如果一个时间数列存在明显的长期趋势、季节波动影响,则应考虑季节因素的影响,建立______________模型进行预测。

9.1.22 预测误差是社会经济现象的_____________之差。显然,预测误差越小模型的效果越好。

二、单项选择题(在每小题的3个备选答案中选出1个正确答案,并将其字母填在题干后面的括号内。)

9.2.1 由职工平均工资构成的时间数列属于 ( ) A .平均数时间数列 B .相对数时间数列 C .时期数列

9.2.2 下列数列中属于时点数列的是 ( ) A . 年末人口总数数列 B .年出生人数数列 C .单位播种面积的粮食产量数列

9.2.3 累计增减量与逐期增减量的关系表现为 ( ) A .逐期增减量之差等于累计增减量 B .逐期增减量之和等于累计增减量 C .逐期增减量之商等于累计增减量

9.2.4 发展速度和增长速度的关系表现为 ( ) A .发展速度-1=增长速度 B .发展速度+1=增长速度 C .增长速度-1=发展速度

9.2.5 某企业月初1000人,月内职工变动情况为:10日增加5人,16日增加5人,20日减少10人,则该月的平均职工人数为 ( ) A .1002人 B .1000人 C . 1005人

9.2.6 已知某地2003年1月实现的销售利润50亿元,2007年2月实现销售利润90亿元,则年度化增长率为 ( )

A .80%

B .15.4824%

C .55.5556%

9.2.7 依据最小二乘法的原理,要求 ( ) A .

∑=-min )?(i i

y

y

B .∑=-0)?(2i i y y

C .∑=-min )?(2i i y y 9.2.8 某地区人均国内生产总值2007年比2002年增长45%,每增降1%的绝对值为135元,则 ( ) A .五年间人均国内生产总值共增6075元 B .五年间人均国内生产总值每年递增9% C .五年间人均国内生产总值每年递增10%

9.2.9 已知,∑y =432,n =20, ∑t 2=2470, ∑t =190 ∑ty =4737。根据这些资料用最小二乘法可求得( )。 A .

..?i

t y

1360952=+ B ...?i

t y 1260952=+ C .

..?i

t y

136092=+

9.2.10 根据月度资料计算的季节指数之和为 ( ) A .400% B .100% C .1200%

9.2.11 按季度资料计算的季节指数S j 的取值范围为 ( ) A .0≤S j ≤4 B .0≤S j ≤1 C .0≤S j ≤12

9.2.12 已知 ∑t =0 ,∑t ·logy =36.9,∑logy=8.4,n=5 。根据这些资料可以求得( ) A .A=1.68 B .B=40.04 C .A=16.8

9.2.13 采用移动平均法修匀时间数列时,所得的移动平均数组成的新时间数列的项数比原时间数列的项数少。如果原时间数列有20项,选用5项进行移动平均,则所得到的移动平均数时间数列的项数有 ( )

A .15项

B .16项

C .17项

9.2.14 如果时间数列各逐期增减量的环比值大致相等,则根据该现象的发展趋势特征,可拟合 ( )

A .修正的指数曲线方程

B .指数曲线方程

C .二次曲线方程 9.2.15 对于曲线趋势方程中参数K 、a 、b 的求解,可用的方法多样,其中常用的方法之一是:首先将时间数列等分为三部分,使每部分有n 个时期,根据每部分趋势值的总和与观察值的总和相等建立三元联立方程式,求解三个参数K 、a 、b 。这种方法称为 ( )

A .最小二乘法

B .三和法

C .方程法

9.2.16 测定季节变动时,先采用一定的方法将时间数列中的长期趋势剔除,然后依据已剔除长期趋势的数据计算季节指数来反映季节波动的方法,称为 ( )

A .同期平均法

B .趋势剔除法

C .移动平均法

19.2.7 如果时间数列不受季节波动的影响,而长期趋势是它的主要的构成因素,并假定事物未来的发展趋势与过去的轨迹大致一样,那么进行预测时可以用 ( )

A .趋势外推法

B .趋势季节预测法

C .散点图法

9.2.18 实际工作中要进行考虑季节波动的预测时,需要将年值模型转换为季值趋势模型。若令时间数列的第一年为t=1,且以此资料建立的直线趋势方程为:T

=a+bt ?y ,转换

为季值趋势模型为 ( )

A .t b b a y i

16

165.14?++= B .t b b a y i

144

1445.512?++= C .?

416

=

+i

a b t y

三、多项选择题(在下列4个备选答案中,至少有二个是正确的,请将其全部选出,并把字母填在题干后面的括号内。)

9.3.1 由下列指标构成的数列中,属于时期数列的有 ( ) A .国民生产总值 B .国内生产总值 C .年出生人口数 D .年末人口总数

9.3.2 下列数列中属于相对数时间数列的有 ( ) A .年新增人口时间数列 B .年人口出生率时间数列 C .人均粮食产量时间数列 D .年人口自然增长率时间数列

9.3.3 简单算术平均法适合于计算 ( ) A .时期数列的序时平均数 B .连续型时点数列的序时平均数 C .间隔相等时点数列的序时平均数 D .间隔不等时点数列的序时平均数

9.3.4 某企业四月份总成本为35000元,平均单位成本为14元;五月份总成本40000,平均单位成本降到10元;六月份总成本45000元,平均单位成本仅8元。则该企业第二季

度平均单位成本和平均总成本分别为()A.9.90元B.40000元

C.10.67元D.12元

9.3.5 平均发展速度的计算方法有()

A.算术平均法B.几何平均法

C.调和平均法D.方程法

9.3.6 时间数列中,各项观察值不能直接相加的有()

A.时期数列B.时点数列

C.平均数时间数列D.相对数时间数列

9.3.7 测定长期趋势的方法很多,常用的有()

A.模型拟合法B.移动平均法

C.几何平均法D.趋势剔除法

9.3.8 平均发展速度的两种计算方法,几何平均法和方程法的区别在于()

A.要求资料的侧重点不同B.计算方法不同

C.应用场合不同D.达到的数量目标不同

9.3.9 增长速度和发展速度的关系表现为()

A.增长速度=发展速度—1

B.发展速度=增长速度+1

C.各环比发展速度的连乘积=相应的定基增长速度

D.两定基发展速度之比—1=定基增长速度

9.3.10 某地2007年人均国民生产总值比2003年增长40%,每增降1%的绝对值为150元,则()A.四年间人均国内生产总值共增加6000元

B.2003年人均国内生产总值为15000元

C.四年间人均国内生产总值平均每年递增8.8%

D.四年间人均国内生产总值平均每年递增10%

9.3.11 测定季节变动,可以依据的数据有()

A.年度数据B.月度数据

C.季度数据D.截面数据

9.3.12 对平稳时间数列进行短期预测的方法有()

A.简单序时平均预测法

B.简单移动平均法

C. 加权移动平均法D.趋势剔除法

四、判断题

9.4.1 若时间数列中各期环比发展速度相等,则各期增降速度一定相等。()

9.4.2 如果按季度(或月)编制的时间数列,为了消除季节变动的影响,可计算定基发展速度考察现象发展的程度。()

9.4.3 因为时点观察值没有长度,所以时点数列的每一观察值的大小不直接受时期长短

的影响。 ( )

9.4.4 计算平均发展速度的几何平均法侧重于考察现象的累计发展总量 。 ( )

9.4.5 用趋势剔除法测定季节变动的目的是计算没有长期趋势影响的季节指数。( )

9.4.6 对同一时间数列,分别用几何平均法和方程法计算平均发展速度,一般而言,其结果是相同的。 ( )

9.4.7 增降1%的绝对值是指发展速度中每一个百分点所代表的绝对额。 ( )

9.4.8 若直线趋势方程为.?i

t y

215=-,则该现象呈下降趋势。 ( )

9.4.9 若时间数列各期的环比发展速度相等,则各期逐期增长量一定相等。 ( )

9.4.10 在奇数项数列中,同一资料用最小二乘法的一般法和简捷法计算的直线趋势方程的参数a 、b 是相同的。 ( )

9.4.11 最小二乘法的数理依据是:∑=-min )(2y y

i

。 ( )

9.4.12 平均发展水平是一种序时平均数,平均发展速度也是一种序时平均数。 ( )

9.4.13 若时间数列的二次逐期增减量大致相等,根据现象发展呈现的趋势特征,应该拟合指数曲线方程。 ( )

9.4.14 用移动平均法对平稳时间数列进行预测时,若选用偶数项进行移动平均,则需要平均两次才能计算出预测值。 ( )

9.4.15 如果现象的发展在季度上有明显的季节变动,则其季节指数一般会大于或小于100%。 ( )

9.4.16 一般来说,当季节指数S j <400%时,表明现象此时处于淡季。 ( )

9.4.17 移动平均法是加权平均的一种特殊形式,它既可以用于对平稳时间数列进行预测,也可以用于对非平稳时间数列进行修匀以消除随机波动的影响。 ( )

9.4.18 在预测中,如果一个时间数列存在明显的长期趋势、季节波动影响,则应考虑季节因素的影响,建立趋势模型进行预测。 ( )

9.4.19 趋势季节模型的一般表达式为s y y

s ?=??。 ( )

9.4.20 预测误差是现象的观察值与预测值之差。一般来说,预测误差越小模型拟合效果越好。()

五、简答题

9.5.1 简述依据相对数时间数列计算平均发展水平的基本思想。

9.5.2 举例说明时期数列和时点数列的特点。

9.5.3 简述时间数列的影响因素。

9.5.4 简述依据具体的时间数列选择适合的趋势模型的指标判别标准。

9.5.5 简述同期平均法计算季节指数的基本原理。

9.5.6 简述年度模型转换为季度模型的思想。

9.5.7 简述时间数列比较分析的主要内容。

9.5.8 采用移动平均法测定长期趋势应注意哪些问题?

六、计算题

9.6.1 已知武汉市人均GDP(单位:元)数据如下表:

(1) 逐期增减量和累计增减量;

(2) 环比增降速度和定基增降速度;

(3) 增降1%的绝对值。

9.6.2已知我国2000-2005年有关资料如下:

(1) “十五”期间年平均国民生产总值;

(2) “十五”期间年平均人口数;

(3) “十五”期间国民生产总值的平均增长速度。

9.6.3某企业2007年工业总产值及职工人数资料如下:

要求计算:(1) 2007年该企业年平均职工人数;(2) 2007年该企业全年劳动生产率。

9.6.4 某建筑企业2006年第二季度全体职工及工人人数资料如下:

9.6.5 某商场2006年下半年的零售额、库存额及流通费用额资料(单位:万元)

另知

和平均流通费用率。

9.6.6 某地区2004年粮食产量为500万吨,若2008年要求达到600万吨,则每年必须以怎样的速度递增?如该地区一直以这一速度增长,到2009年时粮食产量将达到多少?

9.6.7 某企业2002~2006年某种产品的产量资料如下:(单位:万吨)

(1) 用最小二乘法配合直线趋势方程,并预测该地区2007年、2008年该种产品的产量;

(2) 该产品产量季节指数的经验数据如下表,试预测2007年、2008年该产品各季的产量。

9.6.8 已知某地2000~2006年地方财政支出额资料如下:

曲线趋势方程。

9.6.9 某企业某种商品的销售资料如下:

9.6.10 某企业2007年上半年总产值及平均工人人数资料如下:

(1) 第一、第二季度的月平均每个工人的产值;

(2) 第一、第二季度平均每个工人的产值;

(3) 上半年的平均每个工人的产值。

9.6.11某企业2007年钢材库存量资料如下:

9.6.12 已知某厂的销售额受长期趋势和季节变动的影响,且两因素相互作用,依据2000~2007年分季度数据计算的该厂销售额的直线趋势方程为(单位:万元)

?y=160+0.5t(t=1表示2000年第一季度)

各季的季节指数

统计学第二章习题

第二章统计调查与统计整理 一、单项选择题 1、统计调查按调查对象包括范围的不同,可分为( )。 A、统计报表和专门调查 B、全面调查和非全面调查 C、定期和不定期调查 D、经常性和一次性调查 2、统计调查按组织方式的不同,可分为( )。 A、统计报表和专门调查 B、经常性和一次性调查 C、定期和不定期调查 D、全面调查和非全面调查 3、一次性调查()。 A、只能是定期的 B、只能是不定期的 C、可以是经常性的 D、可以是定期和不定期的 4、在统计调查中,调查项目的承担者是( )。 A、调查对象 B、调查单位 C、填报单位 D、统计报表 5、在统计调查中,负责向上报告调查内容的单位是( )。 A、调查对象 B、调查单位 C、填报单位 D、统计报表 6、在国营工业企业设备普查中,调查单位是( )。 A、国营工业企业的每台设备 B、每个国营工业企业 C、国营工业企业的全部设备 D、所有国营工业企业 7、某市1995年工业企业经济活动成果的统计年报的呈报时间为1996年元月31日,则调查期限为( )。 A、1年零1个月 B、1年 C、1个月 D、1天 8、对我国各铁路交通枢纽的货运量进行的调查,属于()。 A、普查 B、重点调查 C、抽样调查 D、典型调查 9、某手表厂为了解手表产品质量情况而进行的调查,属于()。 A、普查 B、重点调查 C、抽样调查 D、典型调查 10、某市1995年社会商品零售总额统计年报的呈报时间为1996年元月31日,则调查时间为( )。 A、1年零1个月 B、1年 C、1个月 D、1天

11、调查大庆、胜利、大港、中原等几个大油田,以了解我国石油工业生产的基本情况,这种调查属于()。 A、普查 B、重点调查 C、抽样调查 D、典型调查 12、有意识地选取若干块水田,测算其粮食产量来估算该地区的粮食产量,这种调查属于()。 A、普查 B、重点调查 C、抽样调查 D、典型调查 13、统计报表一般多属于()。 A、经常性的非全面调查 B、经常性的全面调查 C、一次性的非全面调查 D、一次性的全面调查 14、第四次全国人口普查是()。 A、重点调查 B、典型调查 C、一次性调查 D、经常性调查 15、对某地区五金交电商品的零售物价进行一次全面调查,则调查单位是()。 A、该地区所有经营五金交电商品的商店 B、全部五金交电商品 C、每一个经营五金交电商品的商店 D、每一种五金交电商品 16、下列情况的统计调查,哪一种属于一次性调查()。 A、商品销售额 B、商品购进额 C、商品库存量 D、商品销售量 17、统计报表,按填表报单位的不同分为()。 A、定期报表和不定期报表C、基层报表和综合报表 C、全面报表和非全面报表 D、电讯和邮寄两种 18、在全国人口普查中,调查单位是()。 A、全国的人口 B、每一个人 C、全国的居民户 D、每一户 19、统计分组对总体而言是()。 A、将总体区分为性质相同的若干部分 B、将总体区分性质相异的若干部分 C、将总体单位区分为成性质相同的若干部分 D、将不同的总体分为性质相异的若干部分 20、按某一标志分组的结果就表现为()。 A、组内差异性、组间同质性 B、组内同质性、组间同质性 C、组内同质性、组间差异性 D、组内差异性、组间差异性

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

(完整版)医学统计学第六版课后答案

第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

统计学 第二章练习题

第二章练习题 一、单项选择题 ⒈某地区对小学学生情况进行普查,则每所小学是() ①调查对象②调查单位③填报单位④调查项目 ⒉对百货商店工作人员进行普查,调查对象是() ①各百货商店②各百货商店的全体工作人员 ③一个百货商店④每位工作人员 ⒊对某停车场上的汽车进行一次性登记,调查单位是() ①全部汽车②每辆汽车③一个停车场④所有停车场 ⒋在统计调查阶段,对有限总体() ①只能进行全面调查②只能进行非全面调查 ③既能进行全面调查,也能进行非全面调查④以上答案都对 ⒌某城市拟对占全市储蓄额五分之四的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是() ①普查②典型调查③抽样调查④重点调查 ⒍有意识地选择三个农村点调查农民收入情况,这种调查方式属于() ①重点调查②普查③抽样调查④典型调查 ⒎统计报表大多属于() ①一次性全面调查②经常性全面调查 ③经常性非全面调查④一次性非全面调查 ⒏目前我国进行的职工家庭收支调查是() ①普查②重点调查③全面调查④抽样调查 ⒐人口普查规定统一的标准时间是为了() ①避免登记的重复和遗漏②具体确定调查单位 ③确定调查对象的范围④为了统一调查时间、一齐行动 ⒑第五次人口普查的标准时点为2000年11月1日零点,11月1日调查员在各家调查时,得知王××家10月31日23点38分生了一个小孩,过了半小时李家也生了一个小孩,则这两个小孩如何登记?() ①两家小孩均应登记③王家的小孩应予登记,李家小孩不应登记 ②两家小孩均不予登记④王家小孩不应登记,李家小孩应予登记

⒒.在统计调查中,调查单位和填报单位之间() ①一致的③是无关联的两个概念 ②是无区别的④一般是有区别的,但有时也一致 ⒓在统计调查中,填报单位是() ①调查项目的承担者②构成调查对象的每一个单位 ③负责向上报告调查内容的单位④构成统计总体的每一个单位 ⒔区别重点调查和典型调查的标志是() ①调查单位数目不同②搜集资料方法不同 ③确定调查单位标准不同④确定调查单位目的不同 ⒕非全面调查中最完善、最有计量科学根据的方式方法是() ①重点调查②典型调查③抽样调查④非全面统计报表 ⒖统计调查时间是() ①调查工作的时限②调查资料所属时间 ③调查登记的时间④调查期限 ⒗问卷法属于() ①直接观察法②询问法③报告法④一次性调查 二、多项选择题 ⒈普查是( ) ①非全面调查②专门调查③全面调查④经常性调查⑤一次性调查⒉非全面调查形式有( ) ①重点调查②抽样调查③典型调查④非全面统计报表⑤统计报表⒊乡镇企业抽样调查中,抽取的每一个乡镇企业是( ) ①调查主体②调查对象③调查单位④调查项目⑤填报单位 ⒋全国工业企业普查中( ) ①全国工业企业数是调查对象②每个工业企业是调查单位 ③每个工业企业是填报单位④全国工业企业数是统计指标 ⑤全国工业企业是调查主体 ⒌属于一次性调查的有( ) ①人口普查②大中型基本建设项目投资效果调查 ③职工家庭收支变化调查④单位产品成本变动调查

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

统计学练习题

第一章 一、单项选择题(在每小题的四个备选答案中,选出一个正确答案) 1.在下列叙述中,不正确的是()。 A.“statistics”可以表示统计学 B.“statistics”可以表示统计数据 C.“statistics”可以表示统计资料 D.“statistics”可以表示统计检验 2.在下列叙述中,关于推断统计的描述是()。 A.一个饼图描述了某医院治疗的癌症类型,其中2%是肾癌,19%是乳腺癌 B.从一个果园中抽取36个橘子的样本,用该样本的平均重量估计果园中橘子的平均重量 C.一个大型城市在元月份的平均汽油价格 D.反映大学生统计学成绩的条形图 3.连续变量()。 A.表现形式为整数 B.取值可一一列举 C.取值连续不断,不能一一列举 D.一般都四舍五入取整数 4.某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。在研究中,该研究人员感兴趣的变量是()。 A.该大学一年级新生的教科书费用 B.该大学的学生数 C.该大学一年级新生的教科书数量 D.大学生的生活成本 5.根据样本计算的用于描述总体特征的度量工具(如均值)被称为()。 A.参数 B.总体 C.样本 D.统计量 6.为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。在该研究中,样本是()。 A.100所中学 B.20个城市 C.全国的高中生 D.100所中学的高中生 7.以一个企业作为总体,下列属于质量统计指标的是()。 A.商品销售额 B.产品合格率 C.商品库存量 D.产品产量 8.在某市工业设备普查中,调查单位是()。 A. 该市每一家工业企业 B. 该市全部工业设备 C. 该市全部工业企业 D. 该市全部工业企业中的每一台工业生产设备 9.某公司新推出了一种饮料产品,欲了解该产品在市场上的受欢迎程度,公司派人到各商

《统计学》 第二章 统计调查

第二章统计调查 (一)填空题 1、按调查对象包括的范围的不同来划分,统计调查可分为全面调查和非全面调查。 2、按调查登记的时间是否连续来划分,统计调查可分为经常性调查和一次性调查。 3、按组织形式的不同来划分,统计调查可分为统计报表调查和专门调查。 4、一般来说,统计调查方案的内容必须包括:调查的目的、调查对象和调查单位、调查项目和调查表、调查时间和调查期限。 5、调查单位是标志的承担者,而填报单位则是的单位。 6、普查的组织方式有和。 7、重点调查是一种,它所选择的重点单位的总量占总体全部单位的总量的绝大部分。 8、抽样调查特点可概括为和。 9、普查是一种专门组织的一次性的全面性调查,它主要用来调查一定时点上的社会经济现象总量。 10、统计报表是按照国家有关法规的规定,自上而下地统一布置,定期的自下而上地逐级提供统计资料的一种统计调查方式方法。 11、统计报表按报表内容和实施范围的不同,可分为国家统计报表、部门统计报表和地方统计报表。 12、统计报表按报送周期长短不同,可分为日报、周报、旬报、月报、季报、半年报和年报。 13、统计报表资料来源于基层单位的原始记录,从原始记录到统计报表,中间还要经过统计台帐和企业内部报表。 14、统计台帐是基层单位根据和本单位的需要而设置的一种系统的表册。 (二)单项选择题(在每小题备选答案中,选出一个正确答案) 1、在国有工业企业设备普查中,每一个国有工业企业是( C) A. 调查对象 B. 调查单位 C. 填报单位 D. 调查项目 2、通过调查大庆、胜利等几大主要油田来了解我国石油生产的基本情况,这种调查方式属于( C ) A、普查 B、典型调查 C、重点调查 D、抽样调查 3、区别重点调查和典型调查的标志是( C ) A. 调查单位数目不同 B. 收集资料方法不同 C. 确定调查单位标准不同 D. 确定调查单位目的不同 4、了解某企业的期末在制品数量,由调查人员亲自到现场观察计数,这种收集资料的方式属于( B )。 A、采访法 B、直接观察法 C、大量观察法 D、报告法 5、非全面调查中最完善、最有计量科学根据的方式是( C ) A. 重点调查 B. 典型调查 C. 抽样调查 D. 非全面统计报表 6、我国目前收集统计资料的主要形式是( D ) A、全面调查 B、普查 C、抽样调查 D、统计报表

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

统计学 补充练习题

第一章补充练习题 一、选择题 (一)A1型:每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。 1.下面的变量中,属于分类变量的是__________。 A.脉搏 B. 血型 C.肺活量 D.红细胞计数 E.血压 2下面的变量中,属于定量变量的是__________。 A.性别 B.体重 C.血型 D.职业 E.民族 3.某人记录了50名病人体重的测定结果:小于50Kg的13人,介于50Kg和70 Kg间的20人,大于70 Kg的17人,此种资料属于__________。 A.定量资料 B.分类资料 C.有序资料 D.二分类资料 E.以上都不正确 5.若要通过样本作统计推断, 样本应是__________。 A.总体中典型的一部分 B.总体中任一部分 +C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 6.统计量__________。 A.是统计总体数据得到的量 B.反映总体统计特征的量 C.是根据总体中的全部数据计算出的统计指标 D.是用参数估计出来的 E. 是由样本数据计算出的统计指标 (二)A2型:每一道题以一个小案例出现,其下面都有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。 1. 教材中提及美国人1954年实施了旨在评价索尔克(Salk)疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验。有180万儿童参与,约有1/4参与者得到了随机化。这180万儿童是__________。 A. 目标总体 B. 研究总体 C. 1份样本 D. 1份随机样本

E. 180万份样本 2. 上述试验最终肯定了索尔克疫苗的效果。请问此结论是针对__________而言。 A. 180万儿童 B. 每个儿童 C. 所有使用索尔克疫苗的儿童 D. 所有儿童 E. 180万儿童中随机化的1/4 二、是非题 1.定量变量、分类变量和有序变量可以相互转换。(F ) 3.离散变量在数值很大时,单位为“千”或“万”时可以取小数值,此时可近似视为连续型变量。(T) 4.同质的个体间不存在变异。(F ) 5.如果个体间有变异,则它们一定不是来自同一总体。(F ) [参考答案] 一、选择题 (一) (二) 二、是非题 1. 3. 4. 5. 第二章补充练习题 选择题 (一)A1型:每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。 1. 用频率表计算平均数时,各组的组中值应为。 A. 本组段变量值的平均数 B. 本组段变量值的中位数 C. 本组段的上限值 D. 本组段的下限值 E. (本组段上限值+本组段下限值)/2 2.离散型定量变量的频率分布图可以用表达。 A. 直方图 B.直条图 C.百分条图 D. 箱式图 E.复式条图 3. 变异系数越大说明。

统计学课后习题参考问题详解

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题和练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。 3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3. 目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题; ②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:市大学生;单位:市的每个大学生。(2)如果调查中了解的是价格高低,为定序尺度;如果调查中了解的是商品丰富、价格合适、节约时间,为定类尺度。(3)市大学生在网上购物的平均花费。(4)是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)4 0%;(6)30%。 第二章收集数据

统计学练习题 第二章 统计调查

第二章统计调查 一、填空题: l、统计调查的基本要求是、、和。 2、统计调查按其组织形式分为和;按调查对象包括的范围不同,可分为和;按调查登记时间是否连续,可分为和。 3、全面调查有和两种;非全面调查则主要指调查、调查和调查。 4、要了解某城市中工业企业的职工素质情况,调查对象是,调查单位是,填报单位。 二、单项选择 1、统计调查按其组织方式不同,可分为() A、统计报表(或定期全面统计报表)和专门调查 B、全面调查和非全面调查 C、经常性调查和一次性调查 D、定期调查和不定期调查 2、一次性调查() A、只能是定期的 B、只能是不定期的 C、可以是定期或不定期的 D、可以是经常性的 3、在统计调查中,负责向上级报告调查内容的单位是:() A、调查对象 B、调查单位 C、填报单位 D、总体单位 4、在统计调查中,调查标志的承担者是:() A、调查对象 B、调查单位 C、填报单位 D、调查表 5、某乡为测算其粮食产量,随机地抽取了若干块地进行实地调查,这种调查属于() A、普查 B、重点调查 C、典型调查 D、抽样调查 6、进行户籍登记,根据包括总体单位的范围看,这是() A、全面调查 B、抽样调查 C、重点调查 D、典型调查 7、对占煤炭开采量75%的大矿井进行劳动生产率调查,根据所包括的总体单位范围看,这是:()A、全面调查B、抽样调查 C、重点调查 D、典型调查 三、判断题: 1、统计调查是统计工作的基础。() 2、调查单位就是进行调查工作的单位。() 3、填报单位也就是调查单位。() 4、普查和统计报表都是全面调查,所以这两种方法可以互相代替。() 5、经常性调查需对调查对象进行连续不断的登记。() 6、典型调查、重点调查、抽样调查都可以用来推断总体特征。() 7、典型调查中所选的单位是有代表性的典型单位。() 8、在抽样调查中每个总体单位被抽取的机会均等。()

统计学第二章数据的搜集

1 了解某年全国规模以上工业企业生产和销售情况,则调查对象为( )。 A、工业企业 B、每个工业企业 C、所有工业企业产业活动单位 D、所有规模以上工业企业 正确答案:D 我的答案:D得分:4.0分 2 了解某年全国规模以上工业企业生产和销售情况,则调查单位为( )。 A、每一个规模以上工业企业 B、每个工业企业 C、所有工业企业产业活动单位 D、所有规模以上工业企业 正确答案:A 我的答案:A得分:4.0分 3 统计调查可以收集的资料是( )。 A、数字资料 B、原始资料和次级资料 C、只能是原始资料 D、不能是次级资料 正确答案:B 我的答案:B得分:4.0分 4 按调查的组织形式分,统计调查可分为( )。 A、全面调查和非全面调查 B、连续调查和不连续调查 C、统计报表和专门调查 D、重点调查和典型调查 正确答案:C 我的答案:A得分:0.0分 5 乡镇企业局为总结推广先进管理经验,选择几个先进乡镇企业调查,这种调查为( )。 A、抽样调查 B、典型调查 C、重点调查 D、普查 正确答案:B 我的答案:B得分:4.0分 6 调查几个铁路枢纽,了解我国铁路货运量的基本情况和问题,这种调查方式属于( )。 A、典型调查 B、抽样调查 C、重点调查 D、普查 正确答案:C 我的答案:C得分:4.0分 7

抽样调查和重点调查的主要区别是( )。 A、原始资料来源不同 B、取得资料的方法不同 C、调查的单位数多少不同 D、抽取调查单位的方式方法不同 正确答案:D 我的答案:D得分:4.0分 8 经常性调查与一次性调查的划分,是以( )。 A、调查组织划分的 B、最后取得的资料是否全面来划分的 C、调查对象所包括的单位是否完全划分的 D、调查登记的时间是否连续来划分的 正确答案:D 我的答案:D得分:4.0分 9 重点调查的重点单位是指( )。 A、标志值很大的单位 B、这些单位的单位总量占总体全部单位总量的绝大比重 C、这些单位的标志总量占总体标志总量的绝大比重 D、经济发展战略中的重点部门 正确答案:C 我的答案:C得分:4.0分 10 在统计调查中,总体单位和调查单位( )。 A、是一致的 B、是不一致的 C、是一致或不一致的 D、一般是一致的 正确答案:C 我的答案:C得分:4.0分 二.多选题(共5题,20.0分) 1 统计调查( )。 A、取得的有原始资料和次级资料 B、调查中首先考虑的是取得第一手资料 C、调查的主要要求是经济性 D、可分为全面调查与非全面调查 正确答案:AD 我的答案:得分:0.0分 2 统计调查的要求是( )。 A、准确性 B、全面性 C、具体性 D、及时性 正确答案:ABD 我的答案:ABD得分:4.0分 3 普查属于( )。

统计学思考题

思考题: 1、什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1)反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨(,依据(意)帕累托(V.Pareto)的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0~1之间 ①基尼系数小于0.2,表明分配平均;②在0.2~0.4之间,分配比较适当;③0.4 是收入分配不公平的警戒线,超过0.4,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;(2)区别:概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同? 答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布; ⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(B ) A 条图 B 百分条图或圆图 C 线图 D 直方图 2、均数和标准差可全面描述D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5 岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95% 或99% 正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99% 的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是(A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为(D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A 和B 均不是 D. A 和B 均是 8、两样本均数比较用t 检验,其目的是检验(C ) A 两样本均数是否不同 B 两总体均数是否不同 C 两个总体均数是否相同 D 两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B 总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t 值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A 各总体率不同或不全相同 B 各总体率均不相同 C 各样本率均不相同 D 各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8 人。该资料宜选用的统计方法为(A ) A.四格表检验B. 四格表校正检验C t 检验D U 检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

统计学1-3章练习题参考答案

第一章统计总论 一、单项选择题 1.属于统计总体的是() A.某县的粮食总产量 B.某地区的全部企业 C.某商店的全部商品销售额 D.某单位的全部职工人数 B 2.构成统计总体的个别事物称为()。 A.调查单位 B.标志值 C.品质标志 D.总体单位 D 3.对某城市工业企业未安装设备进行普查,总体单位是()。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 B 4.工业企业的设备台数、产品产值是()。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 D 5.在全国人口普查中()。 A.男性是品质标志 B.人的年龄是变量 C.人口的平均寿命是数量标志 D.全国人口是统计指标 B 6.总体的变异性是指()。 A.总体之间有差异 B.总体单位之间在某一标志表现上有差异 C.总体随时间变化而变化 D.总体单位之间有差异 B 7.几位学生的某门课成绩分别是67分、78分、88分、89分、96分,“学生成绩”是()。 A.品质标志 B.数量标志 C.标志值 D.数量指标 B 8.某年级学生四门功课的最高考分分别是98分、86分、88分和95,这四个数字是() A.指标 B.标志 C.变量 D.标志值 D 9.下列指标中属于质量指标的是()。 A.社会总产值 B.产品合格率 C.产品总成本 D.人口总数 B 10.下列属于质量指标的是() A.产品的产量 B.产品的出口额 C.产品的合格品数量 D.产品的评价 D 11.下列属于离散型变量的是() A.职工的工资 B.商品的价格 C.粮食的亩产量 D.汽车的产量

统计学思考题

第一章导论 1、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。按照统计数据 的收集方法,可以将其分为观测数据和实验数据。按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。 分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。顺序数据是只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的,是用文字来表述的。数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。现实中处理的大多数都是数值型数据。 2、解释分类数据、顺序数据和数值数据的意义。 对分类数据,我们通常计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析和x2检验等;对顺序数据,可以计算其中位数和四分位差,计算等级相关系数等;对数值型数据,可以用更多的统计方法进行分析,如计算各种统计量,进行参数估计和检验等 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含所研究的全部个体的集合,它通常由所研究的一些个体组成。如多个企业构成的集合,多个居民户构成的集合,多个人构成的集合 样本:是从总体中抽出的一部分元素的集合。如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。 参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。在统计中,总体参数通常用希腊字母表示,如,总体平均数用u(miu)表示,总体标准差用(sigma)表示,总体比例用(pai)表示,等。 统计量:是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。样本统计量通常用英文字母来表示。如,样本平均数用(x-bar)表示,样本标准车用s表示,样本比例用p表示,等。 变量:是说明现象某种特征的概念。如,商品销售额,受教育程度,产品的质量等级等。 4、变量可分为哪几类? 变量可以分为分类变量、顺序变量、数值型变量,数值型变量根据其取值的不同,又可分为离散型变量和连续型变量。分类变量是说明事物类别的一个名称,顺序变量是说明事物有序类别的一个名称,数值型变量是说明事物数字特征的一个名称。 5、举例说明离散型变量和连续性变量。 离散型变量是只能取可数值的变量,只能取有限个值,而且其取值都以整位数断开,可以一一列举,如,企业量,产品数量;连续型变量是可以在一个或多个区间中取任何值的变量。它的取值是连续不断的,不 能一一列举,如,年龄,温度,零件尺寸的误差等。 第二章数据的搜集 1、比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样也称随机抽样,是指遵守随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。它具有以下几个特点:首先,抽样时是按一定的概率以随机抽样原则抽取样本;其次,每个单位被抽中的概率是已知的,或是可以计算出来的;最后,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。 非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。 如果调查的目的在于掌握研究对象总体的数量特征,根据调查的结果对总体参数进行评估,得到总体参数的置信区间,就应当采用概率抽样的方法。非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析做好准备。非抽样调查也适合市场调查中概念测试,如产品包装测试、广告测试等。第三章数据的图表表示 1、分类数据和顺序数据的整理和图示方法各有那些? 分类数据的整理方法有频数和频数分布,图示方法有条形图、帕累托图、饼图、环形图;顺序数据的整理方法有累积频数和累积频率,图示方法有累积频数分布和频率图。 2、数值型数据的分组方法有哪些?简述组距分组的步骤。 数据分组的方法有单变量值分组和组距分组。 组距分组的步骤:(1)确定组数,一般数据所分组数不应少于5组且不多于15组;(2)确定各组的组距,组距=(最大值-最小值)/组数,组距宜取5或10的倍数;(3)确定上下限,第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值。 3、直方图与条形图有何区别? 直方图与条形图不同。首先,条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是 分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章数据的概括性变量 1、一组数据的分布特征可以从那几个方面进行测度? 一组数据的分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。 2、对于比率数据的平均为什么采用几何平均? 3、简述众数、中位数、和平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜采用众数。众数主要适合作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。中位数主要适合作为顺序数据的集中趋势测度值。 平均数是针对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等时,这时则应选择平均数作为集中趋势的测度值。但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是偏斜程度较大时,可以考虑选择中位数或众数,这时它们的代表性要比平均数好。 4、为什么要计算离散系数? 方差和标准差是反映数据离散程度的绝对值,其数值的大小一方面受原变量值自身水平高低的影响,也就是与变量的平均数大小有关,变量值绝对水平高的,离散程度的测度值自然也就大,绝对水平低的离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的,为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。 离散系数也成为变异系数,它是一组数据的标准差与其相应的平均数之比,其计算公式为:v s=s/(x-bar),离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说 明数据的离散程度也大;离散系数小,说明数据的离散程度也小。 第五章参数估计 1、怎样理解置信区间? 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限,由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。 2、解释95%的置信区间 如果抽取了许多不同的样本,比如说抽取了100个样本,根据每一个样本构造一个置信区间,这样,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%则没包含,则95%这个值称为置信水平。一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例成为置信水平,也称为置信度或置信系数。 第六章假设检验 1、什么是假设检验中的显著性水平?统计显著是什么意思? 通常把(a-er-fa)称为显著性水平,显著性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取0.05或0.01. 2、什么是假设检验中的两类错误? 对于原假设提出的命题,我们需要做出判断,这种判断可以用“原假设正确”或“原假设错误”来表述。当然,这是依据样本提供的信息进行判断的,也就是由部分来推断,总体。因而判断有可能正确,也有可能错误,也就是说,我们面临着犯错误的可能。所犯的错误有两种类型,第一类错误是原假设H0为真却被我们拒绝了,犯这种错误的概率用(a-er-fa)表示所以成为其真错误;第二类错误是原假设为伪我们却没有拒绝,犯这类错误的概率用(bei-ta)表示,所以成为取伪错误。 3、解释假设检验中的P值。 P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由就越充分。 第七章方差分析 1、什么是方差分析?它研究的是什么? 方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型隐变量是否有显著影响。 方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是分类型自变量对数值型因变量的影响。 2、简述方差分析的基本思想。 为了研究分类型自变量对对数值型因变量的影响,需要从对数据误差来源的分析入手,误差主要分为组内误差和组间误差,组内误差只包含随机误差,而组间误差除了包含随机误差,还会包含系统误差。3、解释组内误差和组间误差的含义。 组内误差(SSE):反映组内误差大小的平方和,也称为残差平方和,是由于抽样的随机性所造成的随机误差。它反映了每个样本内各观测值之间的离散状况。 组间误差(SSA):反映组间误差大小的平方和,也称为因素平方和,是随机误差和系统误差的总和。它反映了样本均值之间的差异程度。 4、解释则内方差和组间方差的含义。 组间误差和组内误差经过平均后的数值称为均方或方差。 组间方差(MSA)=组间平方和/自由度(SSA/k-1) 组内误差(MSE)=组内平方和/自由度(SSE/n-k) 5、简述方差分析的基本步骤。 1、提出假设; 2、构造检验的统计量;(1)计算各样本的均值(2)计算全部观测值的总均值(3)计算各误差平方和(4)计算统计量 3、统计决策; 4、方差分析表; 5、用Excel进行方差分析。 第八章一元线性回归 1、解释相关关系的含义,说明相关系的特点。 相关关系1)变量间关系不能用函数关系精确表达;2)一个变量的取值不能由另一个变量唯一确定;3)当变量x 取某个值时,变量y 的取值可能有几个。 2、相关分析主要解决那些问题? 相关分析就是对两个变量之间线性关系的描述和度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本之间的变量关系是否能代表总体变量之间的关系? 3、解释回归模型、回归方程、估计的回归方程的含义。 回归模型:描述因变量y如何依赖于自变量x和误差项ε的方程。 回归方程:描述因变量y的期望值如何依赖于自变量x的方程。 估计的回归方程:根据样本数据求出的回归方程的估计。 4、解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的联系。 总平方和(SST):是全部观测值Xij与总均值x-两bar的误差平方和。 残差平方和(SSE):反映组内误差大小的平方和。 回归平方和(SSR):反映了y的总变差中由于x与y之间的线性关系引起的y的变化部分。 SST=SSR+SSE 5、解释判定系数(R2)的含义和作用。 含义:判定系数是对估计的回归方程拟合优度的度量。判定系数等于相关系数的平方,即r2=(r)2 作用:反映回归直线的拟合程度;R2越接近1,说明回归方程拟合的越好;R2越接近0,说明回归方程拟合的越差。 6、在回归分析中,F检验和t检验各有什么作用? F检验是检验自变量和因变量之间的线性关系是否显著,或者说,它们之间能否用一个线性模型y= 来表示。 t检验的显著性检验是要检验自变量对因变量的影响是否显著。在一元线性回归模型y= 中,如果白塔1=0,则回归线是一条水平线,表面因变量y的取值不依赖与自变量x,即两个变量之间没有线性关系。 7、简述线性关系检验和回归系数检验的具体步骤。 线性关系检验:1、提出假设,H0:回归系数等于0,两个变量之间的线性关系不显著;2、计算检验统计量F=(SSR/1)/(SSE/(n-2));3、做出决策,根据显著性水平,分子自由度和分母自由度查F分布表,找到相应的临界值,比较与F的大小,判断是否拒绝原假设 回归系数检验:1、提出检验;2、计算检验统计量t;3、做出决策

相关主题
文本预览
相关文档 最新文档