当前位置:文档之家› 统计学名词解释 简答 填空

统计学名词解释 简答 填空

统计学名词解释 简答 填空
统计学名词解释 简答 填空

填空题

1.统计学的研究对象是社会经济现象的数量方面。

2.统计调查的基本要求包括准确性、及时性和完整性。

3.统计分组的关键是正确选择分组标志。

4.标志变异指标是度量统计分布离散/离中趋势的统计指标。

5.平均发展水平在统计上又称为序时平均数或动态平均数。

6.综合指数是总指数的基本形式。

7.抽样推断必须遵循随机原则。

8.反映变量之间的相关方向及程度的统计指标是相关系数。

9.国民经济核算的基本原则是平衡原则

10.统计学的研究对象是社会经济现象的数量方面(数量特征和数量关系)。

11.总体具有大量性、同质性、差异性三大特点。

12.根据分组标志的特征不同,统计总体可以按同质标志分组,也可以按数量标志分组。 检查长期计划的完成程度时,若计划任务规定的是长期计划末期应达到的水平,检查计划完成程度应采用水平法。

13.统计指数的基本特性有两点:一是综合性;二是平均性。

14.抽样平均误差与总体标志变动度的大小成正比,与样本容量的平方根成反比,如果其他条件不变,抽样平均误差要减少到原来的1/4,则样本容量应扩大为原来的16倍。

15.在考察变量的关系时,不必确定变量中哪个是自变量,哪个是因变量的数量分析称为 相关分析。

16.一个完整的统计工作过程一般可分为统计设计、统计调查、统计整理和统计分析四个主要阶段。

17.一个完整的统计调查方案应包括调查目的、调查对象、调查项目、调查时间和调查的组织工作。

18.已知一个数列最后一组的下限为900,其相邻组的组中值为850,则最后一组的上限和组中值分别为1000和950。

19.每增长1%的绝对值是前期水平除以100的绝对值。

20.抽样误差是指由抽样的随机性而产生的误差,它是所抽取的样本指标与总体指标之间的误差平均值。

21.在考察变量的关系时,必须事先确定哪个是自变量,哪个是因变量的数量分析称为回归分析。

22.当分配数列的分布为右偏斜时,算术平均数、众数、中位数三者数量上的大小关系为算术平均数>中位数>众数。

23.影响时间序列的因素很多,一般可以分解为长期趋势、季节变动、循环变动和不规则变动。

24.在组距式数列中,经常用组中值代表各组的一般水平。这样做的假定前提是各组内各单位的变量均匀分布。

25.抽样误差是由于抽样的随机性而产生的误差,这种误差不可避免,但是可以预防并加以控制。

26.在是非总体中,如果用P 表示总体中具有某种特征的单位数所占比重,则是非标志的标准差为)1(p p 。

27.在因变量i y 的总变差平方和中,回归直线解释的变差平方和占总变差平方和的比例称为

可决系数。

28.平均发展速度的计算有几何平均法(水平法)和方程式法(累计法)两种方法。

29.按数据的收集方法分类,可以将统计数据分为观测数据和实验数据。

30.变量分配数列可以分为单项式数列和组距式数列。

31.众数是指一组数据中出现次数最多的变量值(或标志值)。

32.平均差是各变量值与其算术平均数离差绝对值的平均数。

33.根据采用的基期不同,增长量有逐期增长量和累积增长量之分。

34.综合指数是总指数的基本形式。

35.用r表示变量x与y的相关系数,当| r |=1时,变量x与y为完全线性相关。

36.目前比较公认的看法认为“统计”有三种含义,即统计活动、统计数据和统计学。

37.统计数据的直接来源主要有两个渠道,一是调查(或观察);二是实验。

38.统计整理的基本内容或步骤为统计分组、统计分组和编制统计表。

39. 为了抽样方便,必须有一份关于抽样单元的名册或清单,这样的名册或清单称为抽样框。

40. 时间序列由两大要素构成:一是现象数值所属的时间,二是统计指标的具体数值。

41.古典统计学时期出现了三个学派,它们是国势学派、概率论学派和政治算术学派。

42.统计调查问卷的问题类型有两类,一类是开放性问题;另一类是封闭性问题。

43.用来表明总体内部各个组成部分在总体中所占比重的相对指标是结构相对指标;而用来反映一个总体内部各个组成部分之间数量对比关系的相对指标是比例相对指标。

44.综合指数的编制,关键时要在现象的经济联系中寻找同度量因素。

45.经济变量之间的数量关系,存在着两种不同的类型,一种是函数关系,另一种是相关关系。

简答题

1.简述标志与指标的区别联系。

区别:(1)标志是说明总体单位特征的,而指标是说明总体特征的;(1分)

(2)标志有不能用数值表示的品质标志和能用数值表示的数量标志,而不论什么指标,都能用数值表示。(2分)

联系:(1)有些统计指标的数值是从数量标志值汇总得到的;

(2)在一定的研究范围内,指标和数量标志之间存在着变换关系。(各1分)

2.什么是统计指数?其重要作用有哪些?

广义:指数是用以反映社会经济现象数量方面在不同时间、不同空间上的变化情况以及计划完全情况的统计相对数,一般用百分数表示

狭义:指数是用以反映多种事物或复杂现象总体数量综合变动的统计相对数

(1)综合反映多种事物或复杂现象总体数量的变动方向和变动程度

(2)分析受多因素影响的现象数量总变动中,各个因素的影响方向和程度

(3)分析现象在较长时间条件下的变动趋势(各1分)

3.试说明相关关系和函数关系的区别联系。

联系:(1)有共同的研究对象(1分)

(2)在具体应用时,常常必须互相补充(1分)

区别:(1)相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测

另一个变量的变化情况。不必确定变量中哪个是自变量,哪个是因变量,其所涉及的变量可以都是随机变量。(1分)

(2)回归分析则是研究变量之间相互关系的具体形式,它对具有相关关系的变量之间的数量联系进行测定,确定一个相关的数学方程式,根据这个数学方程式可以从已知量来推测未知量,从而为估算和预测提供了一个重要的方法。回归分析则必须事先研究确定具有相关关系的变量中哪个为自变量,哪个为因变量。一般地说,回归分析中因变量是随机的,而把自变量作为研究时给定的非随机变量。(2分)

4.怎样正确选择分组标志?

(1)研究目的

(2)选择反映事物本质区别的标志

(3)考虑经济发展变化及历史条件(各1分)

5.应用平均指标应该注意哪些问题?

(1)平均指标只能应用于同质总体(1分)

(2)用组平均数来补充说明总平均数(1分)

(3)用分配数列补充说明平均数(1分)

(4)平均分析与具体分析相结合(1分)

6.按月(或季)平均法进行季节变动分析的基本步骤是什么?

(1)求若干年内同月(或同季)平均数

(2)求若干年内总的月(或季)平均数

(3)对比(各1分)

7.什么是向上累计和向下累计? (3分)

向上累计是各组上限以下的累计频数或累计频率。向下累计是各组下限以上的累计频数或累计频率。

8.相关分析与回归分析之间有何区别?(3分)

区别:(1)相关分析与回归分析在研究目的和方法上是有明显区别的。相关分析研究变量之间相关的方向和相关的程度。但是,相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。回归分析则是研究变量之间相互关系的具体形式,它对具有相关关系的变量之间的数量联系进行测定,确定一个相关的数学方程式,根据这个数学方程式可以从已知量来推测未知量,从而为估算和预测提供了一个重要的方法(2)相关分析可以不必确定变量中哪个是自变量,哪个是因变量,而回归分析则必须事先研究确定具有相关关系的变量中哪个为自变量,哪个为因变量。(3)相关分析所涉及的变量可以都是随机变量。一般地说,回归分析中因变量是随机的,而把自变量作为研究时给定的非随机变量

9.确定必要抽样单位数目要考虑哪些主要影响因素? (4分)

(一)总体的标志变异程度(二)允许的误差范围即抽样极限误差(三)抽样推断的置信度即概率保证程度(四)抽样方法和组织形式

10.请写出时间序列的速度分析指标的名称及基本计算公式。

答:发展速度=报告期水平/基期水平(1分)

增长速度=(报告期水平-基期水平)/基期水平(1分)

平均发展速度=项数次

最初水平

最末水平

或用累计法(2分)

平均增长速度=平均发展速度-1(1分)

11.简述抽样调查、重点调查和典型调查的异同。

答:相同点:都是非全面调查,都要从总体的全部单位数中抽取一部分进行调查(1分)不同点:

(1)抽取部分调查单位的方式不同。抽样调查按随机原则;重点调查是抽取重点单位,重点单位是这部分单位在总体中占的比重并不大,但就主要调查变量而言,其标志总量在总体标志总量中占绝大比重;典型调查是有意识的抽取典型单位进行调查。(2分)

(2)调查的目的不同(1分)

(3)误差的形式不同(1分)

12.请说明相关分析和回归分析的联系和区别。

答:二者的联系

相关分析与回归分析都是研究和处理变量之间相关关系的数理统计方法。(1分)

回归分析和相关分析是互相补充,密切联系的。回归分析是建立在相关分析的基础上,对于具有密切相关的两个变量进行深入分析,建立它们之间的数学关系式,并进行统计推断,是相关分析的拓展。而相关分析是回归分析的前提,对于相关程度很低的两个变量进行回归分析是没有实际意义的。(1分)

二者的区别

(1)相关分析主要通过相关系数来判断两个变量之间是否存在着相互关系及其关系的密切程度,其前提条件是两个变量都是随机变量,且变量之间不必区别自变量和因变量。而回归分析研究一个随机变量(Y)与另一个非随机变量(X)之间的相互关系,且变量之间必须区别自变量和因变量。(1分)

(2)相关系数只能观察变量间相关关系的密切程度和方向,不能估计推算具体数值。而回归分析可以根据回归方程,用自变量数值推算因变量的估计值。(1分)

(3)互为因果关系的两个变量,可以拟合两个回归方程,且互相独立、不能互相替换。而相关系数却只有一个,即自变量与因变量互换相关系数不变。(1分)

13.简述标志与指标的区别联系。

区别:

(1)标志是说明总体单位特征的,而指标是说明总体特征的。(2分)

(2)标志中的数量标志可以用数值表示,而品质标志不能用数值表示;指标都是用数值表示的。(1分)

联系:

(1)有些统计指标的数值是在总体单位的数量标志值基础上直接汇总得到的。(1分)(2)在一定条件下,指标和标志之间可以相互转化。(1分)

14.什么是总量指标?其主要作用有那些?

总量指标是反映社会经济现象总体在一定的时间、地点、条件下的总规模或总水平的统计指

标。(2分)

作用:①总量指标可以反映一个国家、地区、部门或单位的基本情况;(1分)

②总量指标是制定政策、编制计划以及进行科学管理的重要依据;(1分)

③总量指标是计算相对指标和平均指标的基础。(1分)

15. 简要说明时间数列的编制原则。

保证时间数列中指标值之间的可比性,是编制时间数列的基本原则。(1分)

具体有以下几点:

(1)时期长短应尽量统一。(1分)

(2)总体范围应该一致。(1分)

(3)指标的经济内容应该一致。(1分)

(4)计算口径应该统一。(1分)

相同点:三者都是非全面调查,都是选取总体中的一部分单位进行观察和研究。(1分)

16.常用的统计调查组织方式有哪些?简要说明一下每种方式。

答:实际中常用的调查组织方式有普查、抽样调查、统计报表、重点调查和典型调查。

①普查是为了某一特定目的而专门组织的一次性全面调查方式,如人口普查、工业普查等。普查通常是一次性或周期性的,且一般需要规定统一的标准调查时间。

②抽样调查是按照一定的概率从总体中抽取一部分单位构成样本,并根据样本信息推断总体数量特征的一种非全面调查。

③统计报表是按照国家有关法规规定,自上而下统一布置,自下而上逐级填报的一种调查组织方式。

④重点调查是这样一种调查组织方式,它只从全部总体单位中选择少数重点单位进行调查,这些重点单位尽管在全部总体单位中出现的频数极少,但其某一数量标志却在所要研究的数量标志值总量中占有很大的比重。

⑤典型调查是从全部总体单位中选择一个或几个有代表性的单位进行深入细致调查的一种调查组织方式。

17.季节变动分析中,按月(季)平均法和趋势剔除法有什么不同?

答:按月(季)平均法是直接根据原时间序列通过简单平均来计算季节指数的一种常用的方法,该方法的基本思想是:计算出各年同月平均数,以消除随机影响,作为该月(季)的代表值;然后计算出全部月(季)的总平均数,作为全年的代表值;再将同月(同季)的平均数与全部的总平均数进行对比,即为季节指数。这种办法计算简单,易于理解,但有一个基本假定:原时间序列没有明显的长期趋势和循环波动。……(3分)

趋势剔除法的基本思想是:先将时间序列中的长期趋势予以消除,然后再计算季节指数。一般按照除法(或减法)法则将长期趋势剔除掉,再用同月(同季)平均数除以总平均数即得季节指数。

18.简述相关分析与回归分析之间的关系。

答:二者的联系:二者都是研究和处理变量之间相关关系的数理统计方法。回归分析是建立在相关分析的基础上,对于密切相关的两个变量进行深入分析,建立它们之间的数学关系式,并进行统计推断,是相关分析的拓展。而相关分析是回归分析的前提,对于相关程度很低的两个变量进行回归分析是没有实际意义的。……(2分)

二者的区别:①相关分析主要通过相关系数来判断两个变量之间是否存在着相互关系及其关

系的密切程度,其前提条件是两个变量都是随机变量,且变量之间不必区别自变量和因变量;而回归分析研究一个随机变量Y与另一个随机变量X之间的相互关系,且变量之间必须区别自变量和因变量。②相关系数只能观察变量间相关关系的密切程度和方向,不能估计推算具体数值;而回归分析可以根据回归方程,用自变量数值推算因变量的估计值。③互为因果关系的两个变量,可以拟合两个回归方程,且互相独立、不能互相替换;而相关系数却只有一个,即自变量与因变量互换相关系数不变。……(3分)

18.简述统计指标和标志之间的关系。

答:统计指标和标志是两个既有区别又有联系的概念。

标志和指标的主要区别是:①标志是说明总体单位的特征的,而指标是说明总体特征的。②标志中的数量标志可以用数值表示,而品质标志不能用数值表示;所有的统计指标都是用数值表示的,不存在不能用数值表示的统计指标。

标志和指标的联系主要表现在:①有些统计指标的数值是在总体单位的数量标志值基础上直接汇总得到的,如一个县的粮食总产量是所属各项粮食产量的合计数。②在一定条件下,指标和标志可以相互转化。当研究目的发生变化以后,原来的总体转化为总体单位,统计指标也就当然地变为数量标志了,反之亦然。

19.简述编制变量分配数列的步骤。

答:①将原始资料顺序排列。②确定变量值的变动范围,以及最大值、最小值等,能看出基本的集中趋势。③确定组数和组距。组数可以根据实际情况而定;之后可以采用单项式分组或组距式分组;组距=(最大值-最小值)÷组数。④确定组限和组限的表示方法。这里可以采用重叠式组限或非重叠式组限;确定组限时要注意,最低组的下限要小于最小变量值,最高组的上限应大于最大变量值。⑤计算频率、频数等编制成一个变量分配数列。

20.简述移动平均法的基本思想及其注意事项。

移动平均法的基本思想是:通过扩大原时间序列的时间间隔,并按一定的间隔长度逐期移动,分别计算出一系列移动平均数,由这些平均数形成的新的时间序列对原时间序列的波动起到一定的修匀作用,削弱了原序列中短期偶然因素的影响,从而呈现现象发展的变动趋势。注意事项:①修匀程度的大小与平均的项数多少有关;②选取项数时根据具体情况而定,一般选取周期的长度;③移动平均法采用奇数项时一次即得趋势值,偶数项需做移正平均;④移动平均后的数列比原数列要少,奇数项时丢失K-1项,偶数项时丢失K项。

单项选择题

1.下列选项中属于数量标志的是( B )

A.性别

B.年龄

C.职称

D.健康状况

2.要了解400个学生的学习情况,则总体单位是( B )

A.400个学生

B.每一个学生

C.400个学生的学习成绩

D.每一个学生的学习成绩

3.有意识地选取几十块地来估算某地区粮食产量,这种调查方式是( A )

A.典型调查

B.重点调查

C.普查

D.抽样调查

4.某连续变量数列,其末组组限为500以上,又知其邻组的组中值是480,则末组的组中值是( A )

A.520

B.510

C.500

D.490

5.下列指标中属于时点指标的是( B )

A.年出生人口数

B.居民储蓄存款余额

C.国内生产总值

D.商品销售量

6.某企业计划规定劳动生产率比上年提高5%,实际提高了8%,则劳动生产率提高的计划完成程度为( C )

A.160%

B.3%

C.102.86%

D.108.58%

7.加权算术平均数等于简单算术平均数时,是因为( D )

A.各组标志值相同

B.各组次数都相等

C.各组组距都相等

D.各组变量都相等

8.对于不同水平的同类现象对比平均数代表性大小时应采用( D )

A.全距

B.平均差

C.标准差

D.标准差系数

9.编制时间序列的基本原则是保证数列中各个指标值的( C )

A.连续性

B.精确性

C.可比性

D.完整性

10.定基发展速度等于相应各个环比发展速度( C )

A.之和

B.之差

C.之积

D.之商

11.某工厂1999年比1998年产量提高了15%,产值增长了20%,则产品的价格提高了( A )

A.4.35%

B.5%

C.35%

D.33.33%

12.所谓大样本,是指样本容量达到或超过( B )

A.20

B.30

C.40

D.50

13.抽样平均误差一般来说( D )

A.大于抽样极限误差

B.等于抽样极限误差

C.小于抽样极限误差

D.可能大于、等于、小于抽样极限误差

14.显著相关是指相关系数的取值在( A )

A.0.5≤∣r∣< 0.8

B.0.3≤∣r∣< 0.5

C.0.8≤∣r∣< 1

D. 0 <∣r∣< 0.3

15.我国国民经济核算体系的核心总量指标是( A )

A.国内生产总值

B.国民生产总值

C.国民经济总产出

D.国民可支配总收入

1.下列说法正确的是( D )

A、标志是说明总体特征的

B、指标是说明总体单位特征的

C、无论什么标志,都能用数值表示

D、无论什么指标,都能用数值表示

2.利用各种统计指标对现象总体的数量特征进行综合、计算和分析的统计研究方法称为

( C )

A、大量观察法

B、分组法

C、综合指标法

D、总量指标法

3.保定市工商银行要了解2005年第一季度全市储蓄金额的基本情况,调查了储蓄金额最高的几个储蓄所,这种调查属于( A )

A、重点调查

B、典型调查

C、抽样调查

D、普查

4.在进行组距式分组时,凡遇到某单位的标志值刚好等于相邻两组上下限的数值时,一般是( B )

A、将此值归入上限所在组

B、将此值归入下限所在组

C、A、B均可

D、另行分组

5.下列哪一种资料,适合编制单项式数列( B )

A、连续型变量且各变量值变动比较均匀

B、离散型变量且各变量值变动比较均匀

C、连续型变量且各变量值变动幅度较大

D、离散型变量且各变量值变动幅度较大

6.某企业男性职工占80%,月平均工资为450元,女性职工占20%,月平均工资为400元,该企业全部职工的平均工资为( D )

A、425元

B、430元

C、435元

D、440元

7.在时点序列中,“间隔”通常是指 ( A )

A、各指标数值之间相隔的时间距离

B、各指标数值所属的时间长短

C、最初水平与最末水平之差

D、最初水平和最末水平之间的距离

8.假定被研究现象基本上每期按不变的发展速度发展,为描述现象的趋势,应拟合如下的

哪个趋势方程( C )

A、直线趋势方程

B、二次曲线方程

C、指数曲线方程

D、直线或曲线方程均可

9.下列算术平均指数公式正确的是( C )

A、

1

1

1

q

p

q

p

q

q

B、

1

1

1

1

1

q

p

q

p

p

p

C、

1

q

p

q

p

q

q

D、

1

1

1

q

p

q

p

p

p

10.抽样误差产生于 ( D )

A、登记性误差

B、系统性误差

C、登记性误差与系统性误差

D、随机性的代表性误差

11.在物价上涨的情况下,商品需求量相应减少,则物价上涨幅度与商品需求量减少幅度之

间是( C )

A、复相关

B、正相关

C、负相关

D、不相关

12.某市规定2004年工业经济活动成果年报呈报时间是2005年1月31日,则调查时限为

( C )

A、一天

B、一年

C、一个月

D、一年零一个月

13.某企业工人劳动生产率,计划提高5%,实际提高了10%,则劳动生产率的计划完成程

度为( A )

A、104.76%

B、95.45%

C、200%

D、4.76%

14.当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于( B )

A、相关关系

B、函数关系

C、回归关系

D、随机关系

15.对两工厂工人工资做纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差一样,

但第二个工厂总的工人数多一倍,则抽样平均误差( B )

A、第一个工厂大

B、第二个工厂大

C、两个工厂一样大

D、不能下结论

1.统计研究的基本特点是( B )

A、从数量上认识总体单位的性质和规律性

B、从数量上认识总体的性质和规律性

C、从性质上认识总体单位的性质和规律性

D、从性质上认识总体的性质和规律性

2.下列说法正确的是( D )

A、标志是说明总体特征的

B、指标是说明总体单位特征的

C、无论什么标志,都能用数值表示

D、无论什么指标,都能用数值表示

3.某地区为了掌握化肥生产的质量情况,拟对占该地区化肥总产量80%的五大化肥生产企业的生产情况进行调查,这种调查方式是( D )

A、普查

B、典型调查

C、抽样调查

D、重点调查

4.用组中值代表各组内的一般水平的假定条件是

( D )

A 、各组的次数均相等

B 、各组的组距均相等

C 、各组的变量值均相等

D 、各组次数在本组内呈均匀分布

5. 对企业按经济类型分组,在此基础上再按企业规模分组,这样的分组,属于( C )

A 、简单分组

B 、平行分组

C 、复合分组

D 、再分组

6. 比较两个不同水平数列总体标志的变异程度,必须利用 ( B )

A 、标准差

B 、标志变异系数

C 、平均差

D 、全距

7. 第一组工人的平均工龄为6年,第二组为8年,第三组为10年,第一组工人数占总数的30%,第二组占50%,则三组工人的平均工龄为 ( D )

A 、8年

B 、7.55年

C 、32.5年

D 、7.8年

8. 采用交叉权数编制的指数形式是 ( A )

A 、马——埃公式

B 、帕氏公式

C 、费暄公式

D 、拉斯贝尔公式

9. 某工厂总生产费用,今年比去年上升了60%,产量增加了25%,则单位成本提高了

( D )

A 、35%

B 、24%

C 、65%

D 、28%

10. 当相关系数r = 0时,说明 ( D )

A 、现象之间完全相关

B 、现象之间相关程度较小

C 、现象之间完全无关

D 、现象之间不存在直线相关

11.是非标志的标准差是 ( A ) A、)1(P P - B、)1(P P - C、)1(-P D、P -1

12.下面四个动态数列中,属于时点序列的是 ( C )

A、历年招生人数动态数列 B 、历年增加在校生人数动态数列

C 、历年在校生人数动态数列

D 、历年毕业生人数动态数列

13.置信区间的大小代表了区间估计的 ( B )

A、可靠性 B、准确性 C、显著性 D、及时性

14.调查某大学2000名学生的学习成绩,则总体单位是 ( C )

A、2000名学生 B 、2000名学生的成绩 C 、每一名学生 D 、每一名学生的成绩

15.按指数的性质不同,指数可分为 ( A )

A、个体指数和总指数 B、简单指数和加权指数

C、数量指标指数和质量指标指数 D、动态指数和静态指数

1. 要了解某市国有工业企业生产设备情况,则统计总体是( D )

A 、该市国有的全部工业企业

B 、该市国有的每一个工业企业

C 、该市国有工业企业的每一台设备

D 、该市国有工业企业的全部生产设备

2. 人均收入,固定资产投资额,平均寿命,人口自然增长率,这四个指标中属于质量指标

的有( C )

A 、1个

B 、2个

C 、3个

D 、4个

3. 在钟形分布、适度偏斜的情况下,众数与中位数以及算术平均数的距离关系为( C )

A 、x

m m e 230-= B 、)2(310x m m e += C 、)3(21

0m m x e -= D 、e m m x m -=-00)(2

4. 对某河流污染状况进行统计调查,需采用( B )

A 、典型调查

B 、抽样调查

C 、普查

D 、重点调查

5. 已知生产同种产品的三个企业的产品合格率分别为95%、97%和98%,则三个企业该产

品的平均合格率是( D )

A 、3

%

98%97%95++ B 、%98%97%95?? C 、98.0197.01

95.011

++ D 、无法计算

6. 用简单随机重复抽样抽取样本,在其它条件不变的情况下,如果要使抽样平均误差降低

50%,则样本容量需增加( B )

A 、2倍

B 、3倍

C 、4倍

D 、5倍

7. 已知某工业局所属各企业职工的平均工资和职工人数资料,要计算该工业局职工的平均

工资,应选择的权数是各企业的( A )

A 、职工人数

B 、平均工资

C 、工资总额

D 、以上都不行

8. 某集团总公司所属企业报告期与基期相比,单位产品成本降低了3%,产量增长了8%,

则总成本变动情况为( C )

A 、增长了5%

B 、增长了11%

C 、增长了4.76%

D 、减少了11%

9. 对两工厂工人工资做简单随机不重复抽样调查,调查的工人数一样,两工厂工资方差一样,但第二个工厂工人数多一倍,则抽样平均误差( B )

A 、第一个工厂大

B 、第二个工厂大

C 、两个工厂一样大

D 、不能做结论

10. 某企业生产某种产品,其产量每年增加5万吨,则该产品产量的环比增长速度( A )

A 、年年下降

B 、年年增长

C 、年年保持不变

D 、无法做结论

11. 每一单位产品成本(元)倚废品率(%)变动的回归方程为:x y

c 856+=,这意味着

( C )

A 、 废品率每增加1%,成本每单位增加64元

B 、 废品率每增加1%,成本每单位增加8%

C 、 废品率每增加1%,成本每单位增加8元

D 、 废品率每增加1%,成本每单位为56元

12. 设p 为商品价格,q 为销售量,指出下列指数公式哪个是帕氏价格指数( B ) A 、11

00p q p q ∑

∑ B 、11

01p q p q ∑∑ C 、01

00p q p q ∑∑ D 、11

10p q p q ∑∑

13. 下列等式中,不正确的是( C )

A 、发展速度=增长速度+1

B 、定基发展速度=相应各环比发展速度的连乘积

C 、定基增长速度=相应各环比增长速度的连乘积

D 、平均增长速度=平均发展速度-1

14. 一个企业产品销售收入计划增长8%,实际增长20%,则计划超额完成程度为(D )

A 、12%

B 、150%

C 、111.11%

D 、11.11%

15. 将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为( D )

A 、动态相对指标

B 、结构相对指标

C 、比例相对指标

D 、比较相对指标

16. 要了解50个学生的统计学学习情况,则总体单位是( B )

A 、50个学生

B 、每一个学生

C 、50个学生的统计学成绩

D 、每一个学生的统计学成绩

17. 调查鞍钢、武钢、宝钢、包钢等几个大型钢厂,以了解我国钢铁生产的基本情况,这种

调查方式属于( C )

A 、普查

B 、典型调查

C 、重点调查

D 、抽样调查

18. 某连续变量数列,其末组组限为500以上,又知其邻组的组中值是480,则末组的组中

值是( A )

A 、520

B 、510

C 、500

D 、490

19. 下列指标中属于强度相对数的是( C )

A 、粮食亩产量

B 、工人平均工资

C 、全国人均钢产量

D 、炼钢车间人均钢产量

20. 已知某企业两个车间连续加工生产某种产品的产品合格率分别为96%、98%,则该产品

的平均合格率为( B )

A 、

2%

98%96+ B 、%98%96? C 、%981%9611

+ D 、无法计算

21. 某个企业产品单位成本计划降低3%,实际降低了5%,则成本降低的计划完成程度为

( D )

A 、95.00%

B 、166.67%

C 、101.94%

D 、97.94%

22. 最易受极端值影响的离散程度测度指标是( A )

A 、全距

B 、平均差

C 、标准差

D 、方差

23. 是非标志方差的最大值,是当P 值趋近于( D )

A 、0.1

B 、0.9

C 、0.8

D 、0.5

24. 抽样平均误差( D )

A 、大于抽样极限误差

B 、小于抽样极限误差

C 、等于抽样极限误差

D 、可能大于、小于或等于抽样极限误差

25. 某地区粮食产量的环比增长速度,2005年为3%,2006年为5%,则2005—2006年该地

区粮食产量共增长了( C )

A、2.5%

B、8%

C、8.15%

D、15%

26.某市2000年GDP为200亿元,2006年GDP为340亿元,则用水平法计算该市该时期GDP

的年平均发展速度时,需开( B )

A、5次方

B、6次方

C、7次方

D、8次方

27.按季平均法计算的各季度季节比率之和为( C )

A、100%

B、200%

C、400%

D、1200%

28.若零售价格增长2%,零售商品销售量增长5%,则零售商品销售额将会增长( A )

A、7.1%

B、7%

C、10%

D、3%

29.显著相关是指相关系数r的取值在( A )

A、0.5≤∣r∣< 0.8

B、0.3≤∣r∣< 0.5

C、0.8≤∣r∣< 1

D、 0 <∣r∣< 0.3

30.在回归分析中,要求两变量( D )

A、都随机

B、都不随机

C、只有自变量随机

D、只有因变量随机

1.统计学的研究对象是( C )。

A.社会经济现象

B.社会经济现象的数量方面

C.社会经济现象总体的数量关系和数量特征

D.统计工作和统计活动

2.全国人口普查中,总体单位是( D )。

A.全国各省、市

B.全国每一个县

C.全国所有家庭或全国所有的人

D.全国每一个家庭或每一个人

3.某银行想要知道平均每户活期存款余额并估计其总量,根据存折账号顺序,每50本存折抽出一本登记其余额。这样的抽样组织形式是( C )。

A.分层抽样

B.整群抽样

C.系统抽样

D.纯随机抽样

4.某市农民人均纯收入达到2500元,众数为2560元,那么该市农民人均纯收入的分布是( B )。

A.对称分布

B.左偏分布

C.右偏分布

D.不能下结论

5.对某市进行调查得到资料如下:每户平均年收入为6800元,标准差为800;每户平均年消费掷出为5200元,方差为40000。我们可以确定( B )。

A.家庭年收入的变异程度比家庭年消费的低

B.家庭年收入的变异程度比家庭年消费的高

C.家庭年收入和年消费的变异程度一样

D.家庭年收入和年消费不能做比较

6.已知生产同种产品的三个企业的产品合格率分别为95%、97%和98%,则三个企业该产品的平均合格率是( A )。

A.

3%

98%97%95++ B.3%98%97%95?? C.98.01

97.01

95.011

++ D.无法计算

7.重复抽样过程中,为了使抽样误差减少25%,样本容量应( A )。

A.增加275.01倍

B.增加225.01

倍 C.减少275.0 D.减少2

25.0 8.决定系数与相关系数试两个既有联系又有区别的指标,则( A )。

A.决定系数是反映自变量对因变量的影响程度,用于评价回归方程的拟合优度

B.相关系数用于反映自变量和因变量之间线性关系的密切程度

C.相关系数r 是决定系数的开方2r ,其数值大于决定系数

D.这两个系数都是既能反映正相关,又能反映负相关

9.1990-1995年某地区汽车客运量(百万人)的趋势方程为

t t Y 09.1100?=,

n t ,,2,1 =,则1991年的客运量为( D )百万人。 A.206 B.103 C.106.90 D.118.81

10.下列属于相关关系的是( B )。

A.物体体积随着温度升高而膨胀

B.学历影响收入

C.圆的面积随着半径的变化而变化

D.商品流转额取决于商品出售量和价格

1.统计总体具有的三个特征是( B )。

A.大量性、总体性、社会性

B.同质性、大量性、变异性

C.大量性、总体性、变异性

D.同质性、变异性、广泛性

2.某工厂几位工人的工资分别是1500元、1520元、1550元、1600元,这几个数字是( B )。

A.变量

B.变量值

C.指标

D.标志

3.重点调查中重点单位指的是( A )。

A.某个标志总量在总体中占有很大的比重

B.具有典型意义或代表性的单位

C.那些具有反映食物属性差异的品质标志的单位

D.能用以推算总体标志总量的单位

4.有5辆汽车在同一距离的公路上行驶速度的资料

)5,,1( =i x i ,为了确定汽车平均

每小时的行驶速度,计算公式为( C )。 A.n x i ∑ B.∑∑f xf C.∑)/1(x n D.∑∑)/(x m m

5.大学生按照年龄分为“15~20”岁、“20岁以上”两组,下面的描述正确的是( B )。

A.20岁的学生属于“15~20岁”一组

B.“20岁以上”这组的组中值为22.5

C.两组的组距均为5岁

D.这种分组方式称为等距式分组

6.下列指标中属于强度相对数的是( C )。

A.粮食亩产量

B.工人平均工资

C.全国人均钢产量

D.炼钢车间人均钢产量

7.下面属于时期数列的是( B )。

A.农村居民家庭按纯收入的分布

B.2002年每个月某工业企业的总产值

C.某地区1995-2000年每年人均家庭金融资产年末余额

D.2000年6月30日我国人口的民族构成

8.假如每年增长量稳定不变,那么每年的逐期增长速度会( A )。

A.下降

B.稳定不变

C.增长

D.无法判断

9.报告期同基期相比,商品销售量增长5%,价格降低5%,那么商品销售额变动( C )。

A.增加5%

B.减少5%

C.减少0.25%

D.没有变动

10.劳动生产率(万元)和工资(元)之间的回归方程为

x y c 7010+=,这意味着

( D )。 A.如果劳动生产率等于1万元,那么工资必须等于70元

B.如果劳动生产率提高1万元,那么工资提高80元

C.如果劳动生产率没有变化,那么工资为80元

D.如果劳动生产率提高1万元,那么工资提高70元

多项选择题(多选、错选无分,少选得1分。每小题2分,共10分)

1.一般而言,“统计”一词的含义包括(ACE )

A.统计资料

B.统计模型

C.统计工作

D.统计技术

E.统计学

2.下列指标中属于强度相对指标的是(BCE )

A.年平均人口数

B.人口出生率

C.人均GDP

D.经济增长率

E.商品流通费用率

3.抽样调查的组织形式有(ABCDE )

A.分层抽样

B.机械抽样

C.整群抽样

D.多阶段抽样

E.简单随机抽样

4.季节变动的测定方法包括(AE )

A.按月(季)平均法

B.时距扩大法

C.几何平均法

D.剩余法

E.移动平均趋势剔除法

5.国民经济核算的基础方法包括(ACD )

A.统计核算方法

B.经济核算方法

C.业务核算方法

D.会计核算方法

E.数学模型核算方法

1.若每个企业是总体单位,以下有关某企业的数据,哪些是数量标志(DE )

A 、经济类型

B 、资产负债率

C 、产品合格率

D 、职工人数

E 、年上缴利税额

2.抽样调查(ABCD )

A 、是一种非全面调查

B 、按照随机原则选取调查单位

C 、永远存在抽样误差

D 、目的在于用样本指标推断总体指标

E 、是一种全面调查

3.下列应采取加权调和平均数计算的是 (ABD)

A 、已知各级工人的月工资水平和工资总额,求月平均工资

B 、已知某工厂各车间废品率和废品量,求平均废品率

C 、已知某工厂计划完成百分比和计划产量,求平均计划完成百分比

D 、假定企业按工人劳动生产率分组,已知各组产量,求平均劳动生产率

E 、已知某厂各种产品产量及单位成本,求平均单位成本

4.下列社会经济现象属于时期序列的有(BCE)

A 、某商店各月商品库存额

B 、某商店各月商品销售额

C 、某工业企业历年产品产量

D 、某供销社某年各月末人数

5.某工业企业历年内部职工调动工种人次数

某种商品基期售出500吨,报告期售出600吨,指数为120%,该指数是(ADE )

A 、数量指标指数

B 、综合指数

C 、总指数

D 、销售量指数

E 、个体指数

1. 质量指标(BC )

A 、可以用绝对数表示

B 、可以用相对数表示

C 、可以用平均数表示

D 、不能用平均数表示

E 、不能用相对数表示

2. 人口普查是(ADE )

A 、专门调查

B 、非全面调查

C 、经常性调查

D 、一次性调查

E 、全面调查

3. 下列指标中属于结构相对数的有(AE )

A 、科技人员比重

B 、人均绿地面积

C 、新生儿性别比

D 、人口密度

E 、食品支出比重

4. 平均指数的特点包括(ADE )

A 、必须以个体指数为基础计算

B 、借助同度量因素进行平均

C 、无法编制总指数

D 、权数可以是00q p 、11q p ,也可用固定权数

E 、可以用全面资料,也可以用非全面资料

5. 下列现象中哪些属于相关关系(ADE )

A 、农作物收获量与施肥量之间的关系

B 、商品销售额与利润率之间的关系

C 、产品产量与单耗之间的关系

D 、家庭收入与消费支出之间的关系

E 、学习时间与学习成绩之间的关系

1. 总体、总体单位、指标和标志这几个概念之间的相互关系表现为(BCD )

A . 没有总体单位就没有总体,总体单位也离不开总体而独立存在

B . 总体单位是标志的承担者

C . 统计指标的数值来源于标志

D . 指标是说明总体特征的,标志是说明总体单位特征的

E . 指标和标志都能用数值表现

2. 下列情况的统计调查,哪些属于连续性调查(BCE )

A.商店的商品库存量

B.运输部门的客运周转量

C.企业发生的工伤事故次数

D.学校年底在校生人数

E.某地区年出生人数

3. 下列应采取加权调和平均数计算的是 (ABD)

A 、已知各级工人的月工资水平和工资总额,求月平均工资

B 、已知某工厂各车间废品率和废品量,求平均废品率

C 、已知某工厂计划完成百分比和计划产量,求平均计划完成百分比

D 、假定企业按工人劳动生产率分组,已知各组产量,求平均劳动生产率

E 、已知某厂各种产品产量及单位成本,求平均单位成本

4. 指出下列各回归方程中哪些肯定是错误的(ACE )

A 、

75.0,64.05.17-=+=r x y c B 、82.0,05.10.15=+=r x y c C 、

91.0,72.053-=+=r x y c D 、63

.0,85.02.18-=-=r x y c E 、86.0,64.125=--=r x y c 5. 下面属于时点数列的是(BDE )

A.历年旅客周转量

B.某工厂每年设备台数

C.历年商品销售量

D.历年牲畜存栏数

E.某银行储户存款余额

6. 统计一词的涵义包括(ACE )

A 、统计资料

B 、统计设计

C 、统计工作

D 、统计分析

E 、统计学

7. 普查属于(ABC)

A 、专门调查

B 、全面调查

C 、一次性调查

D 、连续性调查

E 、典型调查

8. 次数分布的主要类型包括(DE )

A 、钟型分布

B 、U 型分布

C 、X 型分布

D 、S 型分布

E 、J 型分布

9. 不受极端值影响的平均指标是(ABCDE )

A 、 算术平均数

B 、几何平均数

C 、调和平均数

D 、中位数

E 、众数

10. 抽样调查的组织形式有(ABE )

A 、分层抽样

B 、机械抽样

C 、整群抽样

D、类型抽样

E、简单随机抽样

1.下面关于总体与样本的关系描述中,正确的是(ABC)。

A.样本从总体中抽取出来的,作为代表这一总体的部分单位组成的集合体

B.总体是唯一确定的,样本是随机的

C.借助样本来推断总体特征是推断统计学的基本特征

D.样本也符合总体的概念,也是由许多单位构成的

2.关于统计分组,以下说法正确的是(ABC)。

A.组数的多少与组距的大小互为因果关系

B.组距过大,组数很少,无异于把性质上不同的单位归并到同一组中

C.以鞋子的号码作为分组标志,适宜进行单项式分组

D.以学生的年龄作为分组标志,适宜进行组距式分组

3.关于是非标志,以下说法正确的是(ABC)。

A.是非标志方差能取得最大值,是当p等于0.5时

B.总体中标志表现都为“是”时,方差为0

C.总体中标志表现都为“非”时,标志变异不存在

D.是非标志互换是非位置之后,方差不再一样了

4.关于移动平均法,下列陈述正确的有(ACD)。

A.是将原来的时间序列时距扩大,经过逐项移动计算序时平均数而得到的

B.应该尽量扩大时距,越大越好

C.通过移动平均法,可以消除序列中由于偶然因素引起的不规则变动

D.可以反映现象发展的总趋势

5.抽样调查的组织形式有(ABCE)。

A.分层抽样

B.系统抽样

C.整群抽样

D.多阶段抽样

1.下列对于典型调查和重点调查的一些特点比较阐述正确的有(ABC)。

A.典型调查是调查研究的基本方法,调查单位都是有意识地选择出来的

B.重点调查单位的确定没有主观因素

C.重点调查不具有推断总体数量特征的条件

D.典型调查有可能用来推断总体数量

2.下面关于众数的描述中,正确的有(CD)。

A.众数是次数分布中最大的那个频数或频率

B.众数可以将分配数列分为两个同等的部分

C.在统计分布中,若将频数改为频率,众数并不会发生变化

D.众数是次数分布中频数最大的那个标志值

3.影响抽样误差大小的因素有(BCD )。

A.样本各单位标志值的差异程度

B.总体各单位标志值的差异程度

C.样本单位数

D.抽样方法和组织形式

4.计算数量指标指数时,权数可以(ABCD )。

A.固定在基期水平上

B.固定在报告期上

C.采用报告期和基期水平的交叉或折中

D.由经济内容决定

5.下列各回归方程中肯定错误的是(AC )。

A.

75.0,64.05.17-=+=r x y c B. 82.0,05.10.15=+=r x y c C.

91.0,72.053-=+=r x y c D.

86.0,64.125=--=r x y c

第一章

1、 时期指标与时点指标(定义、特点),也可能多选,课件

(1)时点指标——反映现象在某一特定时点所处的状态。规定标准时刻。

n ①时点指标数值只能间断计数,它的每个数据都表示社会经济现象发展到一定时点上所处的水平。

n ②不同的时点的指标数值不具有可加性,即相加后不具有实际意义。

n ③时点指标的数值大小与其时间间隔长短无直接关系。

(2)时期指标——反映现象在一段期间内发展过程的总量。规定现象的起止时间。 n ①时期指标数值是连续登记、累计的结果。

n ②不同时期的时期指标数值具有可加性,相加后表示较长时期现象总的发展水平。 n ③时期指标数值大小与包含的时期长短成正比。

2、 指标与标志的区别联系,见课件

(1)区别:

n ①标志是说明总体单位的特征和属性;而指标则是说明总体的数量特征。

n ②标志有不能用数值表示的品质标志与能用数值表示的数量标志;而指标都是能用数值表示的。

(2)联系:

n ①有许多统计指标的数值是从总体单位的数量标志值汇总而来的。

n ②指标与数量标志之间存在变换关系。

第二章

3、概率抽样的特点P19

(1)按随机原则从总体中抽选样本单位。

随机原则:(a)每个单位有相同的中选可能性。(b)每个单位的中选不中选不是主观所决定的。

(2)根据部分实际资料对调查对象总体的数量特征做出估计。

(3)是运用概率的估计方法。

(4)抽样推断的误差可以事先计算,并加以控制。

4、统计调查误差P24,举例,简答(抽样误差的不可避免性,非抽样误差的可避免性)(1)由于随机性的原因致使样本的结构无法充分地代表总体的特征,由此而产生的误差即抽样误差,抽样误差是可以根据数理统计的原理加以估算并进行控制的;

(2)各种形式的调查、调查的各个环节都有可能产生非抽样误差,包括抽样框误差、无回答误差、计量误差;

5、统计分组的原则P26——穷尽原则和互斥原则

6、分组标志的选择原则,见课件

(1)应根据研究的目的与任务选择分组标志。

(2)要选择能够反映事物本质或主要特征的标志。

(3)要根据现象的历史条件变化来选择分组标志。

7、等距分组与异距分组,课件2—64

n 等距分组:标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。一般用于标志值变动比较均匀的场合。

n 异距分组:各组的组距不相等。主要用于:

第一,标志值分布很不均匀的场合。

第二,标志值相等的量具有不同意义的场合。

第三,标志值按一定比例发展变化的场合。

8、抽样调查、重点调查与典型调查,课件,书P20

n 抽样调查是一种非全面调查。它是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据所获得的样本数据,对调查对象的总体特征做出具有一定可靠度的推算。n 重点调查是指在调查对象中,只选择一部分重点单位(这些单位在全部单位中只是一部分,但它们在所研究现象的标志总量中却占有绝大的比重)进行的非全面调查。

n 典型调查是在对调查对象有一定了解的基础上,有意识地选择少数典型单位(指在数量表现上具有普遍意义和代表性的总体单位,可以用来推断总体的数量)进行调查的一种非全面调查组织方式。

第三章

9、平均指标与强度相对指标的区别

n 在计算平均指标时,分子与分母必须同属一个总体,具有一一对应关系,即有一个总体单位,必有一个标志值与之对应。

n 强度相对指标是两个有联系的不同总体的总量指标对比的结果,这两个总量指标没有依存关系。

10、调和平均数适用于那些组合(多选题,非简答)

(1)作为算术平均数的变形使用。

(2)对相对指标(或平均指标)计算平均数

11、比较调和、几何、算术平均数的大小(什么时候相等),还有不同平均数指标间的关系作用(课件3—1—48)

n 调和平均数<几何平均数<算术平均数;当各变量相等时,三者相等。

n 在非对称分布时,算术平均数受极端值的影响最大;中位数只受极端值的位置影响,不受其数值影响;众数不受极端值的影响。

(1)当次数分布呈右偏(正偏)时,算术平均数受极大值影响最大。

(2)当次数分布呈左偏(负偏)时,算术平均数受极小值影响最大。

n 皮尔生法则:在适度偏态情况下,算术平均数和众数的距离约等于算术平均数与中位数距离的三倍。即

12、变异系数(公式,为是么要用变异系数;标准差系数)P77

n 当水平不同或计量单位不同的总体之间比较离散程度时,不宜直接用平均差(标准差、极差)等变异指标,而要用变异系数(平均差系数、标准差系数、极差系数等)。

公式:标准差系数:

n 应用:用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小——标准差系数小的总

体,其平均数的代表性大;反之,亦然。

第四、五章

13、总体参数估计的两个要求(可能简答,课件4—27)

n 一是估计的精度要求,所谓精度就是估计误差的最大范围,即误差的最大值,可通过极限误差来反映;

n 二是可靠性要求,所谓可靠性是指估计结果正确的概率大小。

14、极限误差的估计,课件4—28,多选或判断

n 设待估计的总体参数是θ,用以估计该参数的统计量是,抽样估计的极限误差是Δ,即。极限误差是根据研究对象的变异程度和分析任务的性质来确定的允许误差范围。显然,Δ越小,估计的精度要求越高,Δ越大,估计的精度要求越低。极限误差的确定要以实际需要为基本标准。

15、影响样本容量n的因素

n 5个因素(P115):概率度()、极限误差()、总体容量( N )、总体方差()、总体成数(P)

16、抽样的平均误差受哪些因素影响,课件4-71,重点掌握抽样设计中的概念,不考计算n 抽样平均误差受以下几方面的因素影响:一是总体的变异性,即与总体的标准差大小有关;二是样本容量;三是抽样方法(重置与不重置);还有一个重要的因素,就是抽样的组织形式。

17、各种抽样方法如何贯彻随机原则,自己总结+课件4-102

n 类型抽样先将总体分成不同的部分,再从每一个部分中抽取出一些单位,共同组成样本。因为每一部分都需进行抽样,虽然划分过程不存在随机性,但是,再从每部分中取样时,就必须遵从随机原则。

n 对整群抽样也是这样,虽然对抽中的群进行全面调查,不存在随机性要求,但是是把“群”看成抽样单元,通过简单随机抽样抽出来的,在抽取群时,就满足随机原则了。

n 等距抽样将总体各单位按某一标志进行排序,然后按固定的间隔来抽取样本单位。在确定随机起点时应遵循随机原则。而后抽取的样本单位是按固定间隔来获得的,不存在随机性。

18、类型抽样与整群抽样区别,抽取的过程+课件4-103

统计学名词解释简答

名词解释 统计总体:指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。统计总体的特征:同质性、差异性、大量性。 总体单位:个体,指构成总体的各个单位。 统计指标:简称指标,用来反映社会经济现象总体的数量特征的概念及其数值。任一概念都包含指标名称和指标数值。特征有总体性、数量性、综合性、具体性。 统计标志:在统计中,总体单位所具有的属性或特征的名称。标志是统计研究的起点,总体单位是标志的载体,是标志的承担者,统计研究是从登记标志开始的,并通过对标志的综合来反映总体的数 量特征。可分为品质标志和数量标志,或不变标志和变异标志。 统计调查:就是根据统计研究的预定目的、要求和任务,运用各种科学的调查方法,有计划、有组织地搜集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的原始资料的工作过程。 统计调查是整个统计工作的基础环节。统计调查的好坏,将影响统计资料的正确与否,从而影 响统计质量。统计调查的要求:准确性、及时性、全面性、系统性。 普查:是根据统计任务的特定目的而专门组织的一次性全面调查。调查范围:1.属于一定时点的社会经济现象的总量(如人口普查)。2.反映一定时期现象的总量(如出生人口总数)。优点:所获资料 更详细,有较高的准确性和时效性。缺点:工作量大,花费时间长,耗费大量的人力、物力和 财力。主要作用:在于掌握某些关系国计民生、国情国力的数据,获得比较准确的信息。 抽样调查:指从所要研究的总体中,按照随机原则,抽取部分单位进行调查,并将调查整理得出的数量特征,用以推断总体综合数量特征的一种非全面调查组织形式。特点:随机性、推断性。优点: 经济性、时效性、准确性、灵活性。应用范围:①对总体不可能或不必要进行全面调查,但要 掌握总体某些现象的全面数值②用抽样调查资料修正全面调查资料。作用:①承担全面调查无 法或很难承担的调查任务。如气象调查。②与全面调查结合,可以发挥相互补充、校对的作用。 ③进行生产过程的质量控制。④用来检验总体特征的某些假设,为行动决策提供依据。抽样调 查的组织形式:纯随机抽样、机械抽样、类型抽样、整群抽样、阶段抽样。 典型调查:根据调查目的和要求,在对研究总体作全面分析后,有意识地从中选取少数具有代表性的单位进行深入调查研究的一种非全面调查。优点:节省人力、物力,既可搜集统计资料,又可分析 研究问题。缺点:资料不齐全,缺乏代表性。主要作用:1.弥补全面调查不足(获取其它统计调 查方法不能得到的统计资料;补充完善统计报表;验证全面调查数据的真实性。2.进行估算某些 指标数值。 重点调查:是一种非全面调查,是在调查对象中选择重点单位进行的调查,但这部分重点单位占总体的绝大比重。优点:省事、省力,能用较少的代价及时搜集到总体的基本情况和基本趋势。缺点: 资料受重点单位影响大,资料一般不齐全。 统计整理:就是根据统计研究的预定目的,对所搜集到的资料进行科学加工,使之条理化、系统化,建立统计数据库,以满足多方面、多层次的反复需要的工作过程。作用:统计整理是统计工作过程 的重要阶段,它是实现从个体单位标志值过渡到总体数量特征值的必经阶段,是统计分析的前 提。其质量的好坏会直接影响统计分析的效果。 绝对指标:又称总量指标,有时也称绝对数。是用来说明一定社会经济现象的规模、水平的总量。它包括总体总量和标志总量。 相对指标:又称相对数,是两个相联系指标的比值。作分母的指标为基数,分子为表数。通过相对指标可反映现象间的相互关系和对比关系。一般分为有名数和无名数。种类有:计划完成相对指标、 结构相对指标、比较相对指标、动态相对指标、强度相对数。 平均指标:又称统计平均数,它是度量频率分布集中趋势或中心位置的指标。也是社会经济统计中最常用的综合指标。它是在同质总体内各总体单位某一数量标志的一般水平。一般有两种分类:静态 平均数、动态平均数。

统计学名词解释

统计学名词解释 第一章绪论 1.随机变量:在统计学上,把取值之间不能预料到什么值的变量。 2.总体:又称母全体、全域,指具有某种特征的一类事物的全体。 3.个体:构成总体的每个基本单元称为个体。 4.样本:从总体中抽取的一部分个体,称为总体的一个样本。 5.次数:指某一事件在某一类别中出现的数目,又称为频数。 6.频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。 7.概率:某一事物或某一情在某一总体中出现的比率。 8.观测值:一旦确定了某个值。就称这个值为某一变量的观测值。 9.参数:又称为总体参数,是描述一个总体情况的统计指标。 10.统计量:样本的那些特征值叫做统计量,又称特征值。 第二章统计图表 1.统计表:是由纵横交叉的线条绘制,并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。一般由表号、名称、标目、数字、表注组成。 2.统计图:一般采用直角坐标系,通常横轴表示事物的组别或自变量x,称为分类轴。纵轴表示事物出现的次数或因变量,称为数值轴。一般由图号及图题、图目、图尺、图形、图例、图组成。 3.简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表,适合数据个数和分布范围比较小的时候用。 4.分组次数分布表:数据量很大时,应该把所有的数据先划分在若干区间,然后将数据按其数值大小划归到相应区域的组别内,分别统计各个组别中包括的数据个数,再用列表的形式呈现出来,适合数据个数和分布范围比较大的时候用。 5.分组次数分布表的编制步骤: (1)求全距 (2)定组距和组数 (3)列出分组组距 (4)登记次数 (5)计算次数 6.分组次数分布的意义: (1)优点:A.可将杂乱无章数据排列成序,以发现各数据的出现次数及分布状况。B.可显示一组数据的集中情况和差异情况等。 (2)缺点:原始数据不见了,从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入,出现误差,即归组效应。 7.相对次数分布表:用频数比率或百分数来表示次数 8.累加次数分布表:把各组的次数由下而上,或由上而下加在一起。最后一组的累加次数等于总次数。 9.双列次数分布表:对有联系的两列变量用同一个表表示其次数分布。

统计学名词解释

1、统计学 统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。 2、指标和标志 标志是说明总体单位属性或特征的名称。指标是说明总体综合数量特征和数量关系的数字资料。 3、总体、样本和单位 统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。简称总体。构成总体的个体则称为总体单位,简称单位。样本是从总体中抽取的一部分单位。 4、统计调查 统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。它是取得统计数据的重要手段。 5、统计绝对数和统计相对数 反映总体规模的绝对数量值,在社会经济统计中称为总量指标。统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。 6、时期指标和时点指标 时期指标是反映总体在一段时期内累计总量的数字资料,是流量。时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。 7、抽样估计和假设检验 抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。 8、变量和变异 标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。数量标志和指标在统计中称为变量。 9、参数和统计量 参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。 10、抽样平均误差 样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。重复抽样的抽样平均误差为总体标准差的1/n。 11、抽样极限误差 抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。 12、重复抽样和不重复抽样 重复抽样也称为回置抽样,是从总体中随机抽取一个样本时,每次抽取一个样本单位时都放回的抽样方式。不重复抽样也叫不回置抽样,它是在每次抽取样本单位时都不放回的抽样方式。13、点估计和区间估计 点估计也叫定值估计,就是直接用抽样平均数代替总体平均数,用抽样成数代替总体成数。区间估计是在一定概率保证下,用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。 14、统计指数 广义上来说,它是表明社会经济现象的数量对比关系的相对指标。狭义上来说,它是反映不能直接相加对比的复杂总体综合变动的动态相对数。 15、综合法总指数 凡是一个总量指标可以分解为两个或两个以上的因素指标时,将其中一个或一个以上的因素指

统计学名词解释及公式

第1章统计与统计数据 一、学习指导 统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。 概念:统计学,描述统计,推断统计。 统计在工商管理中的应用。 统计的其他应用领域。 概念:分类数据,顺序数据,数值型数据。 不同数据的特点。 概念:观测数据,实验数据。 概念:截面数据,时间序列数据。 统计数据的间接来源。 二手数据的特点。 概念:抽样调查,普查。 数据的间接来源。 数据的收集方法。 调查方案的内容。 概念。抽样误差,非抽样误差。 统计数据的质量。 概念:总体,样本。 概念:参数,统计量。 概念:变量,分类变量,顺序变量,数值 型变量,连续型变量,离散型变量。 二、主要术语 1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 2.描述统计:研究数据收集、处理和描述的统计学分支。 3.推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 4.分类数据:只能归于某一类别的非数字型数据。 5.顺序数据:只能归于某一有序类别的非数字型数据。 6.数值型数据:按数字尺度测量的观察值。 7.观测数据:通过调查或观测而收集到的数据。 8.实验数据:在实验中控制实验对象而收集到的数据。 9.截面数据:在相同或近似相同的时间点上收集的数据。 10.时间序列数据:在不同时间上收集到的数据。

11.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推 断总体特征的数据收集方法。 12.普查:为特定目的而专门组织的全面调查。 13.总体:包含所研究的全部个体(数据)的集合。 14.样本:从总体中抽取的一部分元素的集合。 15.样本容量:也称样本量,是构成样本的元素数目。 16.参数:用来描述总体特征的概括性数字度量。 17.统计量:用来描述样本特征的概括性数字度量。 18.变量:说明现象某种特征的概念。 19.分类变量:说明事物类别的一个名称。 20.顺序变量:说明事物有序类别的一个名称。 21.数值型变量:说明事物数字特征的一个名称。 22.离散型变量:只能取可数值的变量。 23.连续型变量:可以在一个或多个区间中取任何值的变量。 四、习题答案 1.D 2.D 3.A 4.B 5.A 6.D 7.C 8.B 9.A 10.A 11.C、12.C 13.B 14.A 15.C 16.D 17.C 18.A 19.C 20.D 21.A 22.C 23.C 24.B 25.D 26.C 27.B 28.D 29.A 30.D 31.A 32.B 33.C 34.A 35.A 36.A 37.D 38.B 39.B 40.C 41.C 42.D 43.C 44.D 45.A 46.B 47.C 48.A 49.C 50.D 51.A 52.C 53.D 54.A 55.B

【缩印整理版】医学统计学名词解释及问答题

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。 总体(population):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。 抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准误描述其大小。 标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数 区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。 参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常 置信区间揭示的是按一定置信度估计总体参数所在的范围。t分布法、正态分布法(标准误)、二项分布法。置信区间估计总体参数所在范围 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。它的确切含义是:可信区间包含总体参数的可 能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。 参数统计(parametric statistics) 非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。 变异(variation):对于同质的各观察单位,其某变量值之间的差异 同质(homogeneity):研究对象具有的相同的状况或属性等共性。 回归系数有单位,而相关系数无单位 β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。 线性相关系数(linear correlation coefficient):又称Pearson积差相关系数(Pearson product moment coefficient),是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。 参数(parameter):描述总体特征的统计指标。 统计量(statistic):描述样本特征的统计指标。实验设计的基本原则 对照 (control) 对受试对象不施加处理因素的状态。在确定接受处理因素的实验组时,要同时设立对照组 重复 (replication)相同实验条件下进行多次实验或多次观察。整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。作用是估计变异大小和降低变异 随机化(randomization) 采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。 I类错误(假阳性错误)真实情况为H0是成立的,但检验结果为H0不成立,这样的错误称为I类错误。其发生的概率用α表示。在假设检验中作为检验水准。一般取0.05或0.01。 II类错误(假阴性错误)真实情况为H1是成立的,但检验结果为H1不成立,这样的错误称为II类错误。其发生的概率用β表示。由于其取值取决于H1 ,因此在假设检验中无法确定。 变异指标是用于描述一组观察值围绕中心位置散布的范围,即描述离散趋势的统计指标。数值越大,说明数据越离散,反之越集中。极差 (range);四分位数间距(quartile range);方差(variance);标准差(standard deviation);变异系数(coefficient of variation 平均数指标用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。算术均数(arithmetic mean);几何均数(geometric mean);中位数(median);众数(mode) 单纯抽样将调查总体的全部观察单位编号,从而形成抽样框架,在抽样框架中随机抽取部分观察单位组成样本。每个观察对象都有相同的机会被抽中系统抽样又称机械抽样。按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。最常用的方法是等距抽样 分层抽样先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。分层特征与研究目的有关。按各层比例抽样。为减少抽样误差,要求层内误差最小,层间误 差最大。 整群抽样先将总体分成若干“群”,从中随机抽取 几个群,抽取群内的所有观察单位组成调查样本。 “群”的确定与研究目的无关。为减少抽样误差, 需多抽几个“群”。 方差分析:又称变异数分析或 F检验,适用于对多 个平均值进行总体的假设检验,以检验实验所得的 多个平均值是否来自相同总体。 析因设计(factorial design)实验:凡同时配置两个 或两个以上处理因素,这些因素的各水平又具有完 全组合的实验,统称为析因设计(factorial design) 实验。 随机区组设计(randomized block design)是事先 将全部受试对象按某种可能与实验因素有关的特征 分为若干个区组(block),使每一区组内的受试对 象例数与处理因素的分组数相等,使每个实验组从 每一区组得到一例受试对象。 单向方差分析(one way analysis of variance)是指 处理因素只有一个。这个处理因素包含有多个离散 的水平,分析在不同处理水平上应变量的平均值是 否来自相同总体。 (2)计数资料:将观察单位按某种属性或类别分组, 所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。 其观察值是定性的,表现为互不相容的类别或属性。 如调查某地某时的男、女性人口数;治疗一批患者, 其治疗效果为有效、无效的人数;调查一批少数民 族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性 的不同程度分组,所得各组的观察单位数,称为等 级资料(ordinal data)。等级资料又称有序变量。如 患者的治疗结果可分为治愈、好转、有效、无效或 死亡,各种结果既是分类结果,又有顺序和等级差 别,但这种差别却不能准确测量;一批肾病患者尿 蛋白含量的测定结果分为+、++、+++等。 随机变量(random variable)是指取指不能事先确 定的观察结果。随机变量的具体内容虽然是各式各 样的,但共同的特点是不能用一个常数来表示,而 且,理论上讲,每个变量的取值服从特定的概率分 布。 变异系数(coefficient of variation)用于观察指标单 位不同或均数相差较大时两组资料变异程度的比 较。用CV 表示。计算:标准差/均数*100% 直线回归(linear regression)建立一个描述应变量 依自变量变化而变化的直线方程, 并要求各点与该直线纵向距离的平方和为最小。直 线回归是回归分析中最基本、最简单的一种,故又 称简单回归(simple regression)。 回归系数(regression coefficient )即直线的斜率 (slope),在直线回归方程中用b 表示,b 的统计意 义为X每增(减)一个单位时,Y平均改变b 个单 位。 相关系数r:用以描述两个随机变量之间线性相关 关系的密切程度与相关方向的统计指标。 秩次:变量值按照从小到大顺序所编的秩序号称为 秩次(rank)。 秩和:各组秩次的合计称为秩和(rank sum),是非 参数检验的基本统计量。 方差(variance):方差表示一组数据的平均离散情 况,由离均差的平方和除以样本个数得到。 检验效能:1- β称为检验效能(power of test),它是 指当两总体确有差别,按规定的检验水准a 所能发 现该差异的能力。 百分位数(percentile)是将n 个观察值从小到大依 次排列,再把它们的位次 依次转化为百分位。百分位数的另一个重要用途是 确定医学参考值范围 随机误差(random error)又称偶然误差,是指排 除了系统误差后尚存的误差。它受多种因素的影响, 使观察值不按方向性和系统性而随机的变化。误差 变量一般服从正态分布。随机误差可以通过统计处 理来估计。 一、统计表有哪些要素构成的?制表的注意事项有 哪些? 一般来说,统计表由标题、标目、线条和数字、备 注五部分组成。但备注并不是必需的内容,可以根 据需要出现。 1简明扼要,重点突出:最好一张表突出一个中心, 不易太多中心,如果需要说明多个中心,可分成多 张统计表。 2合理安排主语和谓语的位置:对于表中任意一行, 从左至右,通过简短的连接词,可连成成一句通顺 的句子。 3表中数据要认真核对,保证准确可靠 二、为什么不宜用t 检验对多组均数进行比较? 如果用t检验进行多个样本均数的两两比较,则会 增加犯I 类错误的概率。 经检验得到拒绝H0 ,认为两组之间有差别的结论 可能犯I类错误的概率为α,不犯I类错误的概率为 1- α.每次判断均不犯I类错误的概率为(1- α)k, k为比较的次数,上例α=0.05, k=3,则均不犯错误 的概率为( 1- 0.05)3 =0.86. 至少有一次判断犯I 类错误的概率为1-(1- α)k 三、方差分析的基本思想是什么? 按实验设计的类型,将全部观察值间的变异分解成 两个或多个组成部分,然后将各部分的变异与随机 误差进行比较(每个部分的变异可由某因素的作用 来解释),以判断各部分的变异是否具有统计学意 义,从而推断不同样本所代表的总体均数是否相同。 五、简述直线相关与回归的区别与联系 区别:1.回归说明依存关系,直线回归用于说明两 变量间数量依存变化的关系,描述y如何依赖于x 而变化;相关说明相关关系,直线相关用于说明两 变量间的直线相关关系,此时两变量的关系是平等 的 2.r与b有区别:r说明具有直线关系的两个 变量间相关的密切程度与相关方向; b表示x每改 变一个单位,y平均增(减)多少个单位; 3.资料要求不同:直线回归要求应变量 y是来自正态总体的随机变量,而x可以是来自正 态总体的随机变量,也可以是严密控制、精确测量 的变量,相关分析则要求x,y是来自双变量正态分 布总体的随机变量。 4.取值范围:-∞

统计学名词解释汇总

统计学名词解释汇总 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

1什么是统计学?统计方法可分为哪两大类?统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。方法有描述统计和推断统计两类2统计数据可分为哪几种类型?不同类型数据各有什么特点?按采取计量尺度,分类、顺序、数值型数据;按统计数据收集方法,观测、实验数据;按被描述对象与时间关系,截面、时间序列数据 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分;

截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 3举例说明总体、样本、参数、统计量、变量这几个概念:对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 4什么是有限总体和无限总体?举例说明 有限总体指总体的范围能够明确确定,而且元素的数目是有限可数的,如若干个企业构成的总体,一批待检查的灯泡。无限总体指总体包括的元素是无限不可数的,如科学实验中每个试验数据可看做是一个总体的一个元素,而试验可无限进行下去,因此由试验数据构成的总体是无限总体 5变量可分为哪几类? 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 6举例说明离散型变量和连续型变量

统计学名词解释

一、名词解释 总体:指在同一组条件下所有成员的某种状态变量的集合;或者说是某一变数的全部可能值的集合;或性质相同的个体组成的整个集团. 样本:从总体中取出来用作分析、研究的个体称样本。 随机样本:总体中的每个总体单位都有同等的机会被抽取为样本单位,由这种方法抽得的样本叫随机样本.(用随机抽样的方法,从总体中抽出一个部分;等概率抽取的样本。)随机抽样:保证总体中的每一个体在每一次抽样中都有同等的机会被取为样本。 复置抽样:保证总体中的每个个体在每次抽样中都有同等的概率被取为样本。 样本容量:样本中包含的单位数称为样本容量。(样本中变量的个数.) 观察值:每一个体的某一性状测定值叫做观察值。 变数:若干有变异的观察值叫随机变数,简称变数。 连续性变数:指在任意两个变量之间都有可能存在只有微量差异的第三个变量存在,这样一类变数称为连续性变数. 间断性变数:只能取整数的一类变数。 参数:由总体获得的代表总体的特征数.(描述总体的特征数,如μσ .)统计数:由样本获得的代表样本的特征数。(描述样本的特征数。) 数量资料(数量性状资料):以测量或称重的方式获取的试验资料称为数量资料。 计量资料、质量性状资料 次数资料:凡是试验结果以次数表示的资料称为次数资料。 算术平均数、众数 几何平均数:变量对数的算术平均数的反对数, (lg) lg Y G n = ∑ 调和平均数:变量倒数的算术平均数的反倒数, 1 () n H Y = ∑ 中位数:将变量顺序排列,处在中间的变量称中位数,计作M d。极差:一组资料中最大值与最小值的差值为极差. 方差:变数变异程度的度量,对于总体 ()2 2i Y N μ σ - = ∑ ,对于样本 2 2 () 1 Y y s n - = - ∑ 。 (描述变量平均变异程度的统计量.定义为 2 1 2 () 1 n j j Y y s n = - = - ∑ 。) EMS:期望均方,是对均方MS的期望值。 标准差:变数变异程度的度量,总体标准差: () N Y ∑- = 2 μ σ ,样本标准 差: () 1 2 - - = ∑ n y Y s .(变数的平均变异量.) 标准误:统计数变异度的度量,12 y y y s s - == 。(统计数的标准差。)

医学统计学名词解释复习资料

1. 总体(population):根据研究目的所确定的同质观察单位的全体。只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。假想的,无时间和空间概念的,称为无限总体(infinite population)。 2. (总体)参数(parameter):总体的统计指标或特征值。总体参数是事物本身固有的、不变的。 3. 样本(sample):从总体中随机抽取的部分个体。 4. 样本含量(sample size):样本中所包含的个体数。 5. 变量(variable):观察对象个体的特征或测量的结果。由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。变量的取值称为变量值或观察值(observation)。根据变量的取值特性,分为数值变量和分类变量。 6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。对每个观察单位用定量的方法测定某项指标的数值,组成的资料。 7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。 8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。 9. 抽样误差(sampling error):由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。 10. 误差(error):统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种:系统误差和随机误差 。 11. 可信区间(confidence interval, CI):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间,又称置信区间。 12. 总体均数的可信区间:按一定的概率大小估计总体均数所在的范围(CI)。常用的可信度为95%和99%,故常用95%和99%的可信区间。 13. 变异(variation):同质事物间的差别。由于观察单位通常即为观察个体,故变异亦称为个体变异(individual variation)。 16. 平均数(average):也叫平均值,是一组(群)数据典型或有代表性的值。这个值趋向于落在根据数据大小排列的数据的中心,包括算术平均数(arithmetic mean)、几何平均数(geometric mean)、中位数(median)等。 17. 中位数(median):将一组观察值按升序或降序排列,位次居中的数,常用M 表示。适用于偏态分布资料或不规则分布资料和开口资料。所谓“开口”资料,是指数据的一端或两端有不确定值。当n 为奇数时,M=X (n+1)/2;当n 为偶数时,M=[X n/2+ X n/2+1]/2。 18. 百分位数(percentile):是一种位置指标,以P x 表示,一个百分位数Px 将全部观察值分为两个部分,理论上有x%的观察值小于Px 小,有(1-x%)的观察值大于Px 。 19. 变异系数(coefficient of variance, CV):亦称离散系数(coefficient of dispersion),为标准差与均数之比,常用百分数表示。100%X s/CV ?=, 变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 20. 频率(relative frequency):在n 次随机试验中,事件A 发生了m 次,则比值 22. 概率(probability):在重复试验中,事件A 的频率,随着试验次数的不断增加将愈来愈接近一个常数p ,这个常数p 就称为事件A 出现的概率(probability),记作P(A)或P 。 描述随机事件发生的可能性大小的数值,常用P 来表示。 23. 统计量(statistic):由样本所算出的统计指标或特征值。 24. 相关系数(correlation coefficient):用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标,称为相关系数,又称为积差相关系数(coefficient of product-moment correlation),总体相关系数用希腊字母ρ表示,而样本相关系数用r 表示,取值范围均为[-1, 1]。 25. 回归系数(regression coefficient):直线回归方程Y ?= a+b X 的系数b 称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。 26. 参考值范围(reference range):也称为正常值范围(normal range),医学上常把绝大多数正常人的某指标值范围称为该指标的正常值范围。绝大多数:可以是90%、95%、99%等等,最常用的是95%。正常人:不是指健康人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括95%的人的界值。 28. 统计推断(statistic inference):从总体中随机抽取一定含量的样本进行研究,目的是通过样本的信息判断总体的特征,这一过程称为统计推断。 29. 标准误(standard error, SE):在统计理论上将样本统计量的标准差称为标准误,用来衡量抽样误差的大小。据此,样本均数的标准差X σ称为标准误。 30. 参数估计(parameter estimation):由样本信息估计总体参数。它包括两种:点估计和区间估计。 点估计:直接用样本统计量作为对应的总体参数的估计值。 区间估计:按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间(confidence interval, CI ),又称置信区间。这种估计方法称为区间估计。 33. 95%可信区间含义:如果重复若干次样本含量相同的抽样,每个样本均按同一方法构建95%可信区间,则在这些可信区间中,理论上有95个包含了总体参数,还有5个未估计到总体均数。 34.Ⅰ类错误(type Ⅰerror):统计学上规定,拒绝了实际上成立的H 0,这类“弃真”的错误称为Ⅰ型错误或第一类错误,Ⅰ型错误的概率用α表示。 35.Ⅱ类错误(type Ⅱerror):统计学上规定,不拒绝实际上不成立的H 0,这类“存伪”的错误称为Ⅱ型错误或第二类错误,Ⅱ型错误的概率用β表示。 36. 检验效能(power of a test):又称把握度,即两总体确有差别,按α水准能发现它们有差别的能力。 37. 参数检验:总体分布已知,对其中一些未知参数进行估计或检验。这类统计推断的方法叫参数统计或参数检验。 38. 参数检验:假定比较数据服从某分布,通过参数的估计量(x , s)对比较总体的参数(μ)作检验,统计上称为参数法检验(parametric test)。如t 、u 检验、方差分析。 39. 率(rate):又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。其计算公式为: 40. 构成比(proportion):又称构成指标,它说明一种事物内部各组成部分所占的比重或分布,常以百分数表示。 41. 比(ratio):又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百分之几,它是对比的最简单形式。其计算公式为:比=A/B 。 统计学(Statistics ):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达 的科学。 总体(population ):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本(sample ):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。

统计学名词解释超级大全

统计学名词解释超级大全第一章导论 统计学:一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。 教育统计学:专门研究如何搜集、整理、分析在心理和教育方面对实验或调查所获得的数字资料,如何根据这些资料所传递的信息,进行数学推论,找出客观规律的一门科学。 描述统计:对实验或调查所获得的数据加以整理(如制表、绘图),并计算其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均,如在集中量数中将原始数据进行平均,在差异量数中将离均差进行平均,在相关量数中将积差进行平均等等。 推断统计:又称抽样统计。它是根据对部分个体进行观测所得到的信息,通过概括性的分析、论证,在一定可靠程度上去推测相应团体。换言之,就是根据已知的情况推测未知情况。 实验设计:研究如何更加合理、有效地获得观测资料,如何更正确、更经济、更有效地达到实验目的,以揭示试验中各种变量关系的实验计划。 统计常态法则:从总体中随机抽取一部分个体所组成的样本,差不多可以保持总体的特征。这种样本特性保持着总体特性的现象叫做统计常态法则。 小数永存法则:第一个样本中所表现出的特性,在其他样本中也会存在,这就是小数永存法则。此处“小数”是指小数量的意思。 大量惰性原则:某一事物的某一性质或状态,在反复观察或试验中是保持不变的。

有效数字:指能影响测量准确性的数字。 变量:又称随机变量。具有变异性的数据。三个特性,离散型,变异性,规律性。 数据:某个数值一旦被取定了,则称这个数值为随机变量的一个观察值。即数据。 总体:性质相同的一类事物的全体。 个体:构成总体的每一基本单位或单元。 样本:总体抽出的部分个体。 参数:表示总体特征的量数。 统计量:直接从样本计算出的量数,代表样本的特征。 名称变量:指一事物与其他事物在属性、类别上不同。 顺序变量:事物的某一属性的多少或大小按顺序排列起来的变量。既无相等的单位又无绝对的零点的变量。 等距变量:只具有相等的单位,而没有绝对的零点的变量。 比率变量:既有相等的单位,又有绝对的零点的变量。 连续变量:指取值可以是某区间内任一数值的随机变量,它是指测量单位之间可以划分成无限多个细小单位,其数字形式多取小数。 离散变量:指测量单位之间不能再细分的数字资料,其数字形式常取整数。 计数数据:计算人或物的个数所获得的数据。 度量数据:用一定的测量工具或测量标准测量时所获得的数据。 指标:表明总体数量特征的概念和具体数值,又称统计指标,它是把各个个体的特征加总起来的综合结果。

统计学名词解释及简答题 .

名词解释 一、分类数据(categorical data )是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,使用文字来表述的。 二、顺序数据(ran k data )是只能归于某一有序类别的非数字型数据。 三、数值型数据(metric data )是按数字尺度测量的观察值,其结果表现为具体的数值。 四、系统抽样(systematic sampling )将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机的抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法被称为系统抽样。 五、非概率抽样(non-probability sampling )是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采取某种方式从总体中抽出部分单位对其实施调查。 六、抽样误差(sampling error )是由于抽样的随机性引起的样本结果与总体真值之间的误差。 七、四分位数(quartile)也称四分位点,他是一组数据排序后处于25%和75%位置上的值。四分位数是通过3个点将全部数据等分为4部分,其中每部分包括25%的数据。 八、离散系数也成为变异系数(coefficient of variation ),它是一组数据的标准差与其相应的平均数之比。其计算公式为: s s v x = 离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。 九、泊松分布(Poisson distribution )是用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布。 十、中心极限定理(central limit theorem ):设从均值μ、2σ(有限)的任意一个总体中抽取样本量为n 的样本,当n 充分大时,样本均值X 的抽样分布近似服从均值为μ、方差2σ/n 的正态分布。 十一、置信区间(confidence interval )在区间估计中,有样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信上限。 十二、显著性水平(significant level)是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取0.05α=或0.01α=,这表明,当做出接受原假设的决定时,其正确的概率为95%或99%。 十三、方差分析(analysis of variance, ANOV A )就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。 十四、相关系数(correlation coefficient )是根据样本数据计算的度量两个变量之间线性关系强度的统计量。 十五、回归模型(regression model )对于具有线性关系的两个变量,可以用一个线性方程来表示他们之间的关系。描述因变量y 如何依赖于自变量x 和误差项ε的方程称为回归模型。 十六、点估计 利用估计的回归方程,对于x 的一个特定值0x ,求出y 的一个估计值就是点估计。点估计可分为两种:一是平均值的点估计;二是个别值的点估计。 十七、时间序列(time series )是同一现象在不同时间上的相继观察值排列而成的序列。 十八、指数平滑法(exponential smoothing )是通过对过去的观察值加权平均进行预测的一种方法,该方法使t+1期的预测值等于t 期的实际观察值与t 期的预测值的加权平均值。 十九、指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。指数是测定多项内容数量综合变动的相对数。这个概念中包含两个重点:第一个要点是指数的实质是测定多项内容;指数概念的第二个要点是其表现形式为动态相对数,既然是动态相对

相关主题
文本预览
相关文档 最新文档