当前位置:文档之家› 经管学院统计学名词解释简答题总结

经管学院统计学名词解释简答题总结

经管学院统计学名词解释简答题总结
经管学院统计学名词解释简答题总结

名词解释(每个4分,共20分) 1.统计报表:是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。

2.长期趋势:是指现象在一段相当长的时期内所表现的沿着某一方向的持续发展变化。3.同度量因素:是指在总指数编制中,使原来不能直接相加的现象的量过渡到可以相加的那个因素。

4.统计指数:广义上,指数是用以测定某个变量在时间或空间上变动程度和方向的相对数;狭义上,指数是一种特殊的相对数,用来表明复杂经济现象总体数量的综合变动。

5.统计分组:是数据整理中的一项重要工作,它足根据统计研究的需要,将数据按照某种特征或标准分成不同的组别。

6.抽样调查:是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查方法。

7.区间估计:就是根据样本估计量以一定可靠程度推断总体参数所在的区间范围。

简答题1.统计调查的方式有:普查、抽样调查、统计报表、重点训查和典型调查等;统计调查的方法有:访问调查、邮寄调查、电话调查、座淡法和个别深度访问法等。

2.概率抽样与非概率抽样:

联系:二者都属抽样调查、非全面调查。

区别:概率抽样是按照随机原则抽取样本,能有效避免主观选样带来的倾向性误差,使得样本资料能够用于估计和推断总休的数量特征,可以计算和控制抽样误差,能说明估计结果的可靠程度。非概率抽样是从研究目的出发,根据调查者的经验和判断,从总体中有意识地抽取若干单位构成样本。在及时了解总体大致情况、总结经验教训、进行大规模调查前的试点等方面,非概率抽样具有概率抽样无法取代的优越性。

3.调查方案的内容:(1)调查目的;(2)调查对象和训查单位:(3)调查项目和调查表:(4)其他内容,如调查方法、调查时间及调查的组织与实施工作等。

4.数据分布离散程度的测度:(1)当对一个数列分析时,可采用极差、平均差、标准差等方法;(2)对于两个以上的数列,如果它们的性质相同且均值相等,则可采用平均差或标准差进行测度,否则,应采用离散系数(如平均差系数、标准差系数)进行测度:(3)最常用的测度方法是标准差和标准差系数。

6.什么叫统计分组?简述等距式统计分组的步骤及应注意问题

答:是根据统计研究的需要,将数据按照某种特征或标准分成不同的组别。步骤为:第一步,从小到大排序;第二步:确定组数,组数K=1+lgN/lg2,其中N是数据个数;第三步:确定各组的组距。组距是一个组的上限和下限的差,即组距=(最大值-最小值)/组数;第四步:根据组数整理成频数分布表;第五步:根据频数分布表绘制直方图和折线图。

7.简述测定季节变动的趋势循环剔除法的步骤与原理

答:在具有明显的长期趋势变动的数列中,为了测定季节变动,必须走将趋势变动因素在数列中加以剔除,然后用平均的方法消除不规则变动,而后计算季节比率的,就称为趋势剔除法。数列的长期趋势可用移动平均或趋势方程拟合法测定。假定包含趋势变动的时间序列的各影响因素以乘法模型形式组合,其结构为Y=T.C.s.I,以移动平均法测定趋势值,则确定季节变动的步骤如下:(1)对原序列进行12个月(或4个季度)移动平均数,消除季节变动s和不规则变动I,结果只包含趋势变动T和循环变动C:(2)为剔除原数列中的趋势变动T和循环变动C,将原数列各项除以移动平均数的对应时间数据(3)将消除趋势变动后的数列各年同月(或同季)的数据平均,消除不规则变动,再分别除以总平均数,得季节指数s。

(4)对季节指数再调整。

8.什么叫标准差系数?计算它有何意义?

答: 又称离散系数,是用来对两组数据的差异程度进行相对比较的。因为在比较相关的两组数据的差异程度的,方差和标准差是以均值为中心计算出来的,因而有时直接比较方差是不准确的,需要剔除均值大小不等的影响,计算比较离散系数。

9.什么叫相关分析、回归分析?简述相关分析与回归分析的关系。答:5二者是研究现象相关关系的基本方法。(1)相关分析(狭义)指用一个指标表明现象间相互依存关系的密切程度。(2)回归分析:根据相关关系的具体形态,选择一个合适的数学模型来近似表达变量间的平均变化关系。二者有若密切的联系,它们具有共同的研究对象,在具休运用时需要互相补充。具体:(1)相关分析需要依靠回归分析表明现象数量相关的具体形式;(2)回归分析需要依靠相关分析来表明现象数量变化的相关程度,只有变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。因此,回归分析和相关分析也合并称为相关关系分析或广义的相关分析。在研究目的和具体的研究方法上是有明显区别的,两者的主要区别在于:(1)相关分析研究变量问相关方向、程度,不能指出变量问相互关系的具休形式,也无法从一个变量的变化推测另一个变量的变化情况:而回归分析能确切地指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。(2)在相关分析中,不必确定自变量和因变量:而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。(3)相关分析所涉及的变量一般都是随机变量;而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。

10.什么叫估计量?平均估计量的标准有哪些?答:(1)无偏性,指估计量抽样分布的数学期望等于被估计的总体参数。(2)有效性,指对同一总体参数的两个无偏估计量,标准差越小的越有效。(3)一致性(相合型),指随着样本容量的增大,点估计量的值越接近被估计总体参数的真实值。

11.简述移动平均法的基本思想:

答:是通过移动平均消除消除时间序列中的不规则变动和其他变动,从而揭示出时间序列的长期趋势。它是选择一定的用于平均的序时项数N,采用对序列逐项递移的方式,对原序时平均数,由这些序时平均数形成的新数列,一定程度上消除或削弱了原数列中的由于短期偶然因素引起的不规则变动和其他成分,对原数列中的变动起到一点的修匀作用,从而呈现出现象在较长时间的发展趋势。

12.标志与指标的区别与联系:

答:区别:标志说明总体单位的特征,指标是说明总体的特征;指标都能用数量表示,而标志中的品质标志不能;指标数量是经过一定汇总得来的,而标志中的数量标志不一定经过汇总;标志一般不具备时间,地点等条件,但作为一个完整的指标,一定要受到时间地点范围等条件的限制。

13.水平法计算平均发展速度原因,特点及实质是什么?

答:水平法又称几何平均法,因为各期发展速度之和不是总速度,而是个其发展速度之乘机是总速度,因此用几何平均法计算,其特点是着眼于期末水平,不论中间水平如何,只要期末水平确定,对平均发展速度的计算结果没有影响,隐含假定:从时间序列的最初水平出发,以计算的平均发展速度代替各期的发展速度,计算出的期末水平与实际水平相一致。第九卷14.什么叫做标准差系数?计算它有什么意义?

答:又称离散系数,是用来对两组数据的李善程度进行比较。因为在比较两组数据的离散程度时,方差和标准差是以均值为中心计算出来的,因而有时直接比较方差是不准确的,需要剔除均值大小不等带来的影响,计算并比较离系数。

15.总指数有哪两种基本编制方式?两种方式的联系与区别?

答:有加权综合指数法和加权平均法。前者先综合后对比,后者当编制质量指数时,选择与之有密切关系的数量指标作为同度量因素,为在综合对比过程单纯反映指数化指标的变动或差异程度,需将同度量因素固定在基期或报告期。后者先对比后平均,首先计算个别现象的个体指数,再选择与编制指数密切相关的价值总量pq作为同度量因素,并将其固定,当选择加权算术平均时同度量因素固定在基期,当选择加权调和平均时同度量因素固定在报告期。

16.简述测定季节变动的原始资料平均法的基本步骤和原理。

答:又按月(或季)平均法,这种方法不考虑长期趋势影响,根据原始数据直接计算季节指数,测定季节变动。(1)、计算各年同月(季)的平均数y ̄(i=1~12月或i=1~4季),目的消除各年同一季度(月份)数据的不规则变动;(2)、计算全部数据的总平均数Y ̄,找出整个数列的水平趋势;(3)、计算季节指数Si,即Si=Yi/Y;(i=1~12月或i=1~4季)。

17.数据分布离散程度的测度:(1)当对一个数列分析时,可以采用极差、平均差、标准差等方法;(2)对于两个以上的数列,如果他们的性质相同且均值相等,则可采用平均差进行测度,否则应采用离散系数进行测定;(3)最常用的测度方法是标准差和标准差系数。

18.环比发展速度与定基发展速度的关系是什么?

答:各环比发展速度的连乘积,等于相对应的定期发展速度,相邻的两个定基发展速度之商,等于响应时期的环比发展速度。

19.时期指标与时点指标各自的特点?

答:时期指标,具有可加性、与时间长短有关、通过连续登记加总求得;时点指标,不能累计相加、与时间间隔长短无关、通过间断登记取得。

20.统计指数的作用有哪些?

答:综合反映现象的变动方向和程度,对复杂现象总体中各因素进行分析;研究现象在长时间内变动趋势;反映事物在空间上的变异程度。

21.累计增长量与逐期增长量的关系是什么?

答:累计增长量等于相应时期的各个逐期增长量之和,相邻两个累计增长量之差等于相应时期的逐期增长量。

22.什么叫均值、众数、中位数?三者的关系是什么?

答:均值即算术平均数;众数是一组出现次数最多的变量值;中位数是一组数据按从小到大排列后,处于正中间位置上的变量值。三者的关系是:对同一组数据资料计算众数、中位数、和均值,如果数据具有单一众数,且分布式对称的,则三者相等。若数据为左偏分布,则有xˉMe>Mo.从数值关系上看,三者关系可表述为Mo=3 Me-2 xˉ

23.简述样本容量与置信水平、总体方差、允许误差的关系。

在其他条件不变的情况下,样本容量和置信水平成正比,与总体方差成反比;与允许误差成反比。

24.如何测度数据分布的离散程度?

数据分布离散程度的测度:1)当对一个数列分析时,可采用极差法、平均差、标准差等方法;2)对于两个以上的数列,如果他们的性质相同且均值相等,则可采用平均差或标准差进行测度,否则,应采用离散系数(如平均差系数,标准差系数)进行测度;3)最常用的测度方法是标准差和标准差系数。

1、什么叫统计分组?简述等距式组距分组的步骤及应注意的问题。(或者描述次数分配表的编制过程。)

答:是根据统计研究的需要,将数据按照某种特征或标准分成不同的组别。步骤为:第一步,从小到大排序;第二步:确定组数,组数K=1+log10N/log102,其中N为数据的个数;第三步:确定各组的组距。组距是一个组的上限和下限的差,即组距=(最大值-最小值)/组数;第四步:根据组数整理成频数分布表;第五步,根据频数分布表绘制直方图和折线图。

2、简述测定季节变动的“趋势-循环剔除法”的基本步骤和原理。

答:在具有明显的长期趋势变动的数列中,为了测定季节变动,必须先将趋势变动因素在数列中加以剔除,然后用平均的方法消除不规则变动,而后计算季节比率的,就称为趋势剔除法。数列的长期趋势可用移动平均或趋势方程拟合法测定。假定包含趋势变动的时间序列的各影响因素以乘法模型形式组合,其结构为Y=T·C·S·I,以移动平均法测定趋势值,则确定季节变动的步骤如下:(1)对原序列进行12个月(或4个季度)移动平均数,消除季节变动S和不规则变动I ,结果只包含趋势变动T和循环变动C ;(2)为剔除原数列中的趋势变动T和循环变动C ,将原数列各项除以移动平均数的对应时间数据(3)将消除趋势变动后的数列各年同月(或同季)的数据平均,消除不规则变动I,再分别除以总平均数,得季节指数S 。(4)对季节指数再调整。

3、什么叫标准差系数?计算它有何意义?

答:又称离散系数,是用来对两组数据的差异程度进行相对比较的。因为在比较相关的两组数据的差异程度时,方差和标准差是以均值为中心计算出来的,因而有时直接比较方差是不

准确的,需要剔除均值大小不等的影响,计算并比较离散系数。计算公式为

4、平均指标指数是总指数还是一般相对数?可变构成指数、固定构成指数和结构变动影响指数三者在分析意义上有何区别,在数量上又有何联系?

答:是一般的相对数,可变构成指数=固定构成指数×结构变动影响指数即

5、什么叫相关分析、回归分析?简述相关分析与回归分析的关系。

答:二者是研究现象相关关系的基本方法。(1)相关分析(狭义)指用一个指标表明现象间相互依存关系的密切程度。(2)回归分析:根据相关关系的具体形态,选择一个合适的数学模型来近似表达变量间的平均变化关系。二者有着密切的联系,它们具有共同的研究对象,在具体运用时需要互相补充。具体:(1)相关分析需要依靠回归分析表明现象数量相关的具体形式;(2)回归分析需要依靠相关分析来表明现象数量变化的相关程度,只有变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。因此,回归分析和相关分析也合并称为相关关系分析或广义的相关分析。在研究目的和具体的研究方法上是有明显区别的,两者的主要区别在于:(1)相关分析研究变量间相关方向、程度,不能指出变量间相互关系的具体形式,也无法从一个变量的变化推测另一个变量的变化情况;而回归分析能确切地指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。(2)在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。(3)相关分析所涉及的变量一般都是随机变量;而回归分析中因变量是随机的,

自变量则作为研究时给定的非随机变量。

6、简述测定季节变动的原始资料平均法的基本步骤和原理。

答:答:又按月(或季)平均法,这种方法不考虑长期趋势影响,根据原始数据直接计算季节指数,测定季节变动. (1) ,计算各年同月(季)的平均数y~(i=1~12 月或i=1~4 季) ,目的消除各年同一季度(月份)数据的不规则变动; (2) ,计算全部数据的总平均数Y~,找出整个数列的水平趋势; (3) ,计算季节指数Si,即Si=Yi/Y; (i=1~12 月或i=1~4 季)

7、什么叫估计量?评价估计量的标准有哪些?

答:(1)无偏性,指估计量抽样分布的数学期望等于被估计的总体参数。

(2)有效性,指对同一总体参数的两个无偏估计量,标准差越小的越有效。

(3)一致性(相合型),指随着样本容量的增大,点估计量的值越接近被估计总体参数的真实值。

8、简述移动平均法的基本思想。

答:移动平均法的基本原理,是通过移动平均消除时间序列中的不规则变动和其他变动,从而揭示出时间序列的长期趋势。它是选择一定的用于平均的序时项数N,采用对序列逐项递移的方式,对原数列递移的N项计算一系列序时平均数,由这些序时平均数所形成的新数列,一定程度上消除或削弱了原序列中的由于短期偶然因素引起的不规则变动和其他成分,对原序列的波动起到一定的修匀作用,从而呈现出现象在较长时间的发展趋势。

9、标志与指标的区别与联系?

答:区别:标志说明总体单位的特征,指标是说明总体的特征;指标都能用数值表示,而标志中的品质标志不能;指标数值是经过一定汇总得来的,而标志中的数量标志不一定经过汇总;标志一般不具备时间、地点等条件,但作为一个完整的指标,一定要受到时间、地点、范围等条件的限制。

联系:许多统计指标的数值都是由总体各单位的数量标志汇总得来的;指标与数量标志在一定条件下可以转化。

10、概率抽样与非概率抽样有何关系?

答:联系:二者都属抽样调查、非全面调查。区别:概率抽样是按照随机原则抽取样本,能有效避免主观选样带来的倾向性误差,使得样本资料能够用于估计和推断总体的数量特征,可以计算和控制抽样误差,能说明估计结果的可靠程度。非概率抽样是从研究目的出发,根据调查者的经验和判断,从总体中有意识地抽取若干单位构成样本。在及时了解总体大致情况、总结经验教训、进行大规模调查前的试点等方面,非概率抽样具有概率抽样无法取代的优越性。

11、水平法计算平均发展速度原因、特点及实质是什么?

答:水平法又称几何平均法,因为各期发展速度之和不是总速度,而是各期发展速度之乘积是总速度,因此用几何平均法计算。其特点是着眼于期末水平,不论中间水平如何,只要期末水平确定,对平均发展速度的计算结果没有影响。隐含假定:从时间序列的最初水平出发,以计算的平均发展速度代替各期的发展速度,计算出的期末水平与实际水平相一致。

12、什么是均值、众数、中位数?三者的关系是什么?(或者简述众数、中位数、均值的各自特点及应用场合。)

答:均值即算术平均数;众数是一组数据中出现次数最多的变量值;中位数是一组数据按从小到大排列后,处于正中间位置上的变量值。三者的关系是:对于同一组数据资料计算众数、中位数和均值,如果数据具有单一众数,且分布是对称的,则三者相等。若数据为左偏分布,则有x(平均下同)Me>Mo。从数值关系上看,三者的关系可表述为3Me-2x(平均下同)=Mo。

13、总指数有哪两种基本编制方式?两种方法间的区别与联系?

答:有加权综合指数法和加权平均法。前者先综合后对比,当编制质量指数时,选择与之有密切关系的数量指标作为同度量因素,为在综合对比过程单纯反映指数化指标的变动或差异程度,需将同度量因素固定在基期或报告期。后者先对比后平均,首先计算个别现象的个体指数,再选择与编制指数密切关系的价值总量pq作为同度量因素,并将其固定,当选择加权算术平均时同度量因素固定在基期,当选择加权调和平均时同度量因素固定在报告期。

14、简述样本容量与置信水平、总体方差、允许误差的关系。

答:在其他条件不变的情况下,样本容量与置信水平成正比,与总体方差成正比;与允许误差成反比。

15, 简述编制变量数列的一般步骤。

第一步:对资料进行分析:A、计算全距(R);B、变量的性质;C、变量值变动是否均匀。通过全距的计算以及变量是离散型还是连续型来确定编制单项数列还是组距数列,根据变量值的变动是否均匀确定编制等距还是异距数列。第二步:在编制组距数列时,还需确定组距和组数,其原则是能真正反映总体的分布特征。第三步:确定各组的组限。离散型变量的组限可不重叠,连续型变量的组限必须重叠。第四步:将总体各单位分布到各组、计算次数、颁率、变量数列就编制而成。

16,算术平均数和加权平均数的联系与区别

算术平均数就是简单的把所有数加起来然后除以个数而加权平均数是把所有数乘以权值再相加,最后除以总权值.

统计学名词解释简答

名词解释 统计总体:指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。统计总体的特征:同质性、差异性、大量性。 总体单位:个体,指构成总体的各个单位。 统计指标:简称指标,用来反映社会经济现象总体的数量特征的概念及其数值。任一概念都包含指标名称和指标数值。特征有总体性、数量性、综合性、具体性。 统计标志:在统计中,总体单位所具有的属性或特征的名称。标志是统计研究的起点,总体单位是标志的载体,是标志的承担者,统计研究是从登记标志开始的,并通过对标志的综合来反映总体的数 量特征。可分为品质标志和数量标志,或不变标志和变异标志。 统计调查:就是根据统计研究的预定目的、要求和任务,运用各种科学的调查方法,有计划、有组织地搜集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的原始资料的工作过程。 统计调查是整个统计工作的基础环节。统计调查的好坏,将影响统计资料的正确与否,从而影 响统计质量。统计调查的要求:准确性、及时性、全面性、系统性。 普查:是根据统计任务的特定目的而专门组织的一次性全面调查。调查范围:1.属于一定时点的社会经济现象的总量(如人口普查)。2.反映一定时期现象的总量(如出生人口总数)。优点:所获资料 更详细,有较高的准确性和时效性。缺点:工作量大,花费时间长,耗费大量的人力、物力和 财力。主要作用:在于掌握某些关系国计民生、国情国力的数据,获得比较准确的信息。 抽样调查:指从所要研究的总体中,按照随机原则,抽取部分单位进行调查,并将调查整理得出的数量特征,用以推断总体综合数量特征的一种非全面调查组织形式。特点:随机性、推断性。优点: 经济性、时效性、准确性、灵活性。应用范围:①对总体不可能或不必要进行全面调查,但要 掌握总体某些现象的全面数值②用抽样调查资料修正全面调查资料。作用:①承担全面调查无 法或很难承担的调查任务。如气象调查。②与全面调查结合,可以发挥相互补充、校对的作用。 ③进行生产过程的质量控制。④用来检验总体特征的某些假设,为行动决策提供依据。抽样调 查的组织形式:纯随机抽样、机械抽样、类型抽样、整群抽样、阶段抽样。 典型调查:根据调查目的和要求,在对研究总体作全面分析后,有意识地从中选取少数具有代表性的单位进行深入调查研究的一种非全面调查。优点:节省人力、物力,既可搜集统计资料,又可分析 研究问题。缺点:资料不齐全,缺乏代表性。主要作用:1.弥补全面调查不足(获取其它统计调 查方法不能得到的统计资料;补充完善统计报表;验证全面调查数据的真实性。2.进行估算某些 指标数值。 重点调查:是一种非全面调查,是在调查对象中选择重点单位进行的调查,但这部分重点单位占总体的绝大比重。优点:省事、省力,能用较少的代价及时搜集到总体的基本情况和基本趋势。缺点: 资料受重点单位影响大,资料一般不齐全。 统计整理:就是根据统计研究的预定目的,对所搜集到的资料进行科学加工,使之条理化、系统化,建立统计数据库,以满足多方面、多层次的反复需要的工作过程。作用:统计整理是统计工作过程 的重要阶段,它是实现从个体单位标志值过渡到总体数量特征值的必经阶段,是统计分析的前 提。其质量的好坏会直接影响统计分析的效果。 绝对指标:又称总量指标,有时也称绝对数。是用来说明一定社会经济现象的规模、水平的总量。它包括总体总量和标志总量。 相对指标:又称相对数,是两个相联系指标的比值。作分母的指标为基数,分子为表数。通过相对指标可反映现象间的相互关系和对比关系。一般分为有名数和无名数。种类有:计划完成相对指标、 结构相对指标、比较相对指标、动态相对指标、强度相对数。 平均指标:又称统计平均数,它是度量频率分布集中趋势或中心位置的指标。也是社会经济统计中最常用的综合指标。它是在同质总体内各总体单位某一数量标志的一般水平。一般有两种分类:静态 平均数、动态平均数。

统计学名词解释

统计学名词解释 第一章绪论 1.随机变量:在统计学上,把取值之间不能预料到什么值的变量。 2.总体:又称母全体、全域,指具有某种特征的一类事物的全体。 3.个体:构成总体的每个基本单元称为个体。 4.样本:从总体中抽取的一部分个体,称为总体的一个样本。 5.次数:指某一事件在某一类别中出现的数目,又称为频数。 6.频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。 7.概率:某一事物或某一情在某一总体中出现的比率。 8.观测值:一旦确定了某个值。就称这个值为某一变量的观测值。 9.参数:又称为总体参数,是描述一个总体情况的统计指标。 10.统计量:样本的那些特征值叫做统计量,又称特征值。 第二章统计图表 1.统计表:是由纵横交叉的线条绘制,并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。一般由表号、名称、标目、数字、表注组成。 2.统计图:一般采用直角坐标系,通常横轴表示事物的组别或自变量x,称为分类轴。纵轴表示事物出现的次数或因变量,称为数值轴。一般由图号及图题、图目、图尺、图形、图例、图组成。 3.简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表,适合数据个数和分布范围比较小的时候用。 4.分组次数分布表:数据量很大时,应该把所有的数据先划分在若干区间,然后将数据按其数值大小划归到相应区域的组别内,分别统计各个组别中包括的数据个数,再用列表的形式呈现出来,适合数据个数和分布范围比较大的时候用。 5.分组次数分布表的编制步骤: (1)求全距 (2)定组距和组数 (3)列出分组组距 (4)登记次数 (5)计算次数 6.分组次数分布的意义: (1)优点:A.可将杂乱无章数据排列成序,以发现各数据的出现次数及分布状况。B.可显示一组数据的集中情况和差异情况等。 (2)缺点:原始数据不见了,从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入,出现误差,即归组效应。 7.相对次数分布表:用频数比率或百分数来表示次数 8.累加次数分布表:把各组的次数由下而上,或由上而下加在一起。最后一组的累加次数等于总次数。 9.双列次数分布表:对有联系的两列变量用同一个表表示其次数分布。

卫生统计学简答题汇总

统计学简答汇总 第一章:绪论(无) 第二章:定量变量的统计描述 1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5. 表2-5 均数,几何均数和中位数的相异点 平均数意义应用场合 均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布 几何均数平均增减倍数①等比资料;②对数正态分布资料 中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两 察值水平端出现不确定值 2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系? 答: 1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。 (2)计算:中位数和百分位数均可用同一公式计算,即 Px=L+(i/f x)(n·x%-Σf L) 可根据研究目的选择不同的百分位数代入公式进行计算分析。 (3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中 更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。 3.同一资料的标准差是否一定小于均数? 答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。 4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? (1)样本含量的大小,样本含量越大,标准差越稳定。 (2)分组的多少 (3)分布形状的影响,偏态分布的标准差较近似正态分布大 (4)随机测量误差大小的影响 (5)研究总体中观察值之间变异程度大小 5.标准差与变异系数的异同点有哪些? 答:标准差:是以算数平均数为中心,反映各观测值离散程度的一个绝对指标.当需要对同一总体不同时期或对不同总体进行对比时,缺乏可比性.当总体平均水平不同或计量单位不同时,用标准差是无法实现两组数据离散程度大小对比的. 变异系数:标准差与平均数的比值称为变异系数,记为C·V.变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。 6.如何表达一批计量数据的基本特征? 答:从集中趋势和离散趋势两方面回答。 7. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况? 答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系

统计学名词解释

1、统计学 统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。 2、指标和标志 标志是说明总体单位属性或特征的名称。指标是说明总体综合数量特征和数量关系的数字资料。 3、总体、样本和单位 统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。简称总体。构成总体的个体则称为总体单位,简称单位。样本是从总体中抽取的一部分单位。 4、统计调查 统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。它是取得统计数据的重要手段。 5、统计绝对数和统计相对数 反映总体规模的绝对数量值,在社会经济统计中称为总量指标。统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。 6、时期指标和时点指标 时期指标是反映总体在一段时期内累计总量的数字资料,是流量。时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。 7、抽样估计和假设检验 抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。 8、变量和变异 标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。数量标志和指标在统计中称为变量。 9、参数和统计量 参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。 10、抽样平均误差 样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。重复抽样的抽样平均误差为总体标准差的1/n。 11、抽样极限误差 抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。 12、重复抽样和不重复抽样 重复抽样也称为回置抽样,是从总体中随机抽取一个样本时,每次抽取一个样本单位时都放回的抽样方式。不重复抽样也叫不回置抽样,它是在每次抽取样本单位时都不放回的抽样方式。13、点估计和区间估计 点估计也叫定值估计,就是直接用抽样平均数代替总体平均数,用抽样成数代替总体成数。区间估计是在一定概率保证下,用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。 14、统计指数 广义上来说,它是表明社会经济现象的数量对比关系的相对指标。狭义上来说,它是反映不能直接相加对比的复杂总体综合变动的动态相对数。 15、综合法总指数 凡是一个总量指标可以分解为两个或两个以上的因素指标时,将其中一个或一个以上的因素指

统计学简答题整理

统计学简答题整理 第一章P11 1.获取直接统计数据的渠道主要有哪些?及区别在于? 普查、抽样调查 普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大,间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。 抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差,但统计方法可以估计出误差的大小进一步控制误差;节省人力、财力、物力,又能保证实效性 2.简要说明抽样误差和非抽样误差。 非抽样误差是由于调查过程中各有关环节工作失误造成的。(它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差,还有一种人为干扰造成的误差即有意瞒报或低报数据等)。非抽样误差在普查、抽样调查中都有可能发生,但可以避免。 抽样误差是利用样本推断总体时产生的误差。(由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制)。抽样误差与样本量的平方根成反比关系。 第二章P51

1.统计的计量尺度 ①列名尺度(定类尺度):是按照某一品质标志将总体分组之后,对属性相同的单位进行计量的方法。各组之间的关系是并列的,没有大小、高低、先后之别。 ②顺序尺度(定序尺度):是按照某一品质标志将总体分组,对等级相同的单位进行计量的方法。各组之间的关系是有顺序的,可以进行排序。 ③间隔尺度(也称定距尺度):是按某一数量标志将总体分组,对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序,还可以计算不同数值之间的绝对差距。 ④比例尺度(也称定比尺度):是类似于间隔尺度,又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异,还可以计算数值的相对差异。 2.简述统计分组的概念和作用。 概念:统计分组是根据统计研究目的,选择一定的分组标志,将总体划分为若干组的统计方法。其目的是使组与组有明显差别,同一组中具有相对的同质性。(例:人口按性别、年龄、民族、职业分组;企业按规模分为大型、中型和小型。) 作用:1.划分社会经济现象的类型 2.反映总体的内部结构 3.分析现象之间的依存关系 3.简述众数、中位数和均值的特点与应用场合。 众数是总体中出现次数最多的标志值。反映了标志值分布的集中趋势,是一种由位置决定的平均数。可以没有众数也可有两个。

【缩印整理版】医学统计学名词解释及问答题

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。 总体(population):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。 抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准误描述其大小。 标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数 区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。 参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常 置信区间揭示的是按一定置信度估计总体参数所在的范围。t分布法、正态分布法(标准误)、二项分布法。置信区间估计总体参数所在范围 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。它的确切含义是:可信区间包含总体参数的可 能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。 参数统计(parametric statistics) 非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。 变异(variation):对于同质的各观察单位,其某变量值之间的差异 同质(homogeneity):研究对象具有的相同的状况或属性等共性。 回归系数有单位,而相关系数无单位 β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。 线性相关系数(linear correlation coefficient):又称Pearson积差相关系数(Pearson product moment coefficient),是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。 参数(parameter):描述总体特征的统计指标。 统计量(statistic):描述样本特征的统计指标。实验设计的基本原则 对照 (control) 对受试对象不施加处理因素的状态。在确定接受处理因素的实验组时,要同时设立对照组 重复 (replication)相同实验条件下进行多次实验或多次观察。整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。作用是估计变异大小和降低变异 随机化(randomization) 采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。 I类错误(假阳性错误)真实情况为H0是成立的,但检验结果为H0不成立,这样的错误称为I类错误。其发生的概率用α表示。在假设检验中作为检验水准。一般取0.05或0.01。 II类错误(假阴性错误)真实情况为H1是成立的,但检验结果为H1不成立,这样的错误称为II类错误。其发生的概率用β表示。由于其取值取决于H1 ,因此在假设检验中无法确定。 变异指标是用于描述一组观察值围绕中心位置散布的范围,即描述离散趋势的统计指标。数值越大,说明数据越离散,反之越集中。极差 (range);四分位数间距(quartile range);方差(variance);标准差(standard deviation);变异系数(coefficient of variation 平均数指标用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。算术均数(arithmetic mean);几何均数(geometric mean);中位数(median);众数(mode) 单纯抽样将调查总体的全部观察单位编号,从而形成抽样框架,在抽样框架中随机抽取部分观察单位组成样本。每个观察对象都有相同的机会被抽中系统抽样又称机械抽样。按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。最常用的方法是等距抽样 分层抽样先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。分层特征与研究目的有关。按各层比例抽样。为减少抽样误差,要求层内误差最小,层间误 差最大。 整群抽样先将总体分成若干“群”,从中随机抽取 几个群,抽取群内的所有观察单位组成调查样本。 “群”的确定与研究目的无关。为减少抽样误差, 需多抽几个“群”。 方差分析:又称变异数分析或 F检验,适用于对多 个平均值进行总体的假设检验,以检验实验所得的 多个平均值是否来自相同总体。 析因设计(factorial design)实验:凡同时配置两个 或两个以上处理因素,这些因素的各水平又具有完 全组合的实验,统称为析因设计(factorial design) 实验。 随机区组设计(randomized block design)是事先 将全部受试对象按某种可能与实验因素有关的特征 分为若干个区组(block),使每一区组内的受试对 象例数与处理因素的分组数相等,使每个实验组从 每一区组得到一例受试对象。 单向方差分析(one way analysis of variance)是指 处理因素只有一个。这个处理因素包含有多个离散 的水平,分析在不同处理水平上应变量的平均值是 否来自相同总体。 (2)计数资料:将观察单位按某种属性或类别分组, 所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。 其观察值是定性的,表现为互不相容的类别或属性。 如调查某地某时的男、女性人口数;治疗一批患者, 其治疗效果为有效、无效的人数;调查一批少数民 族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性 的不同程度分组,所得各组的观察单位数,称为等 级资料(ordinal data)。等级资料又称有序变量。如 患者的治疗结果可分为治愈、好转、有效、无效或 死亡,各种结果既是分类结果,又有顺序和等级差 别,但这种差别却不能准确测量;一批肾病患者尿 蛋白含量的测定结果分为+、++、+++等。 随机变量(random variable)是指取指不能事先确 定的观察结果。随机变量的具体内容虽然是各式各 样的,但共同的特点是不能用一个常数来表示,而 且,理论上讲,每个变量的取值服从特定的概率分 布。 变异系数(coefficient of variation)用于观察指标单 位不同或均数相差较大时两组资料变异程度的比 较。用CV 表示。计算:标准差/均数*100% 直线回归(linear regression)建立一个描述应变量 依自变量变化而变化的直线方程, 并要求各点与该直线纵向距离的平方和为最小。直 线回归是回归分析中最基本、最简单的一种,故又 称简单回归(simple regression)。 回归系数(regression coefficient )即直线的斜率 (slope),在直线回归方程中用b 表示,b 的统计意 义为X每增(减)一个单位时,Y平均改变b 个单 位。 相关系数r:用以描述两个随机变量之间线性相关 关系的密切程度与相关方向的统计指标。 秩次:变量值按照从小到大顺序所编的秩序号称为 秩次(rank)。 秩和:各组秩次的合计称为秩和(rank sum),是非 参数检验的基本统计量。 方差(variance):方差表示一组数据的平均离散情 况,由离均差的平方和除以样本个数得到。 检验效能:1- β称为检验效能(power of test),它是 指当两总体确有差别,按规定的检验水准a 所能发 现该差异的能力。 百分位数(percentile)是将n 个观察值从小到大依 次排列,再把它们的位次 依次转化为百分位。百分位数的另一个重要用途是 确定医学参考值范围 随机误差(random error)又称偶然误差,是指排 除了系统误差后尚存的误差。它受多种因素的影响, 使观察值不按方向性和系统性而随机的变化。误差 变量一般服从正态分布。随机误差可以通过统计处 理来估计。 一、统计表有哪些要素构成的?制表的注意事项有 哪些? 一般来说,统计表由标题、标目、线条和数字、备 注五部分组成。但备注并不是必需的内容,可以根 据需要出现。 1简明扼要,重点突出:最好一张表突出一个中心, 不易太多中心,如果需要说明多个中心,可分成多 张统计表。 2合理安排主语和谓语的位置:对于表中任意一行, 从左至右,通过简短的连接词,可连成成一句通顺 的句子。 3表中数据要认真核对,保证准确可靠 二、为什么不宜用t 检验对多组均数进行比较? 如果用t检验进行多个样本均数的两两比较,则会 增加犯I 类错误的概率。 经检验得到拒绝H0 ,认为两组之间有差别的结论 可能犯I类错误的概率为α,不犯I类错误的概率为 1- α.每次判断均不犯I类错误的概率为(1- α)k, k为比较的次数,上例α=0.05, k=3,则均不犯错误 的概率为( 1- 0.05)3 =0.86. 至少有一次判断犯I 类错误的概率为1-(1- α)k 三、方差分析的基本思想是什么? 按实验设计的类型,将全部观察值间的变异分解成 两个或多个组成部分,然后将各部分的变异与随机 误差进行比较(每个部分的变异可由某因素的作用 来解释),以判断各部分的变异是否具有统计学意 义,从而推断不同样本所代表的总体均数是否相同。 五、简述直线相关与回归的区别与联系 区别:1.回归说明依存关系,直线回归用于说明两 变量间数量依存变化的关系,描述y如何依赖于x 而变化;相关说明相关关系,直线相关用于说明两 变量间的直线相关关系,此时两变量的关系是平等 的 2.r与b有区别:r说明具有直线关系的两个 变量间相关的密切程度与相关方向; b表示x每改 变一个单位,y平均增(减)多少个单位; 3.资料要求不同:直线回归要求应变量 y是来自正态总体的随机变量,而x可以是来自正 态总体的随机变量,也可以是严密控制、精确测量 的变量,相关分析则要求x,y是来自双变量正态分 布总体的随机变量。 4.取值范围:-∞

统计学名词解释汇总

统计学名词解释汇总 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

1什么是统计学?统计方法可分为哪两大类?统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。方法有描述统计和推断统计两类2统计数据可分为哪几种类型?不同类型数据各有什么特点?按采取计量尺度,分类、顺序、数值型数据;按统计数据收集方法,观测、实验数据;按被描述对象与时间关系,截面、时间序列数据 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分;

截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 3举例说明总体、样本、参数、统计量、变量这几个概念:对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 4什么是有限总体和无限总体?举例说明 有限总体指总体的范围能够明确确定,而且元素的数目是有限可数的,如若干个企业构成的总体,一批待检查的灯泡。无限总体指总体包括的元素是无限不可数的,如科学实验中每个试验数据可看做是一个总体的一个元素,而试验可无限进行下去,因此由试验数据构成的总体是无限总体 5变量可分为哪几类? 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 6举例说明离散型变量和连续型变量

统计学名词解释

一、名词解释 总体:指在同一组条件下所有成员的某种状态变量的集合;或者说是某一变数的全部可能值的集合;或性质相同的个体组成的整个集团. 样本:从总体中取出来用作分析、研究的个体称样本。 随机样本:总体中的每个总体单位都有同等的机会被抽取为样本单位,由这种方法抽得的样本叫随机样本.(用随机抽样的方法,从总体中抽出一个部分;等概率抽取的样本。)随机抽样:保证总体中的每一个体在每一次抽样中都有同等的机会被取为样本。 复置抽样:保证总体中的每个个体在每次抽样中都有同等的概率被取为样本。 样本容量:样本中包含的单位数称为样本容量。(样本中变量的个数.) 观察值:每一个体的某一性状测定值叫做观察值。 变数:若干有变异的观察值叫随机变数,简称变数。 连续性变数:指在任意两个变量之间都有可能存在只有微量差异的第三个变量存在,这样一类变数称为连续性变数. 间断性变数:只能取整数的一类变数。 参数:由总体获得的代表总体的特征数.(描述总体的特征数,如μσ .)统计数:由样本获得的代表样本的特征数。(描述样本的特征数。) 数量资料(数量性状资料):以测量或称重的方式获取的试验资料称为数量资料。 计量资料、质量性状资料 次数资料:凡是试验结果以次数表示的资料称为次数资料。 算术平均数、众数 几何平均数:变量对数的算术平均数的反对数, (lg) lg Y G n = ∑ 调和平均数:变量倒数的算术平均数的反倒数, 1 () n H Y = ∑ 中位数:将变量顺序排列,处在中间的变量称中位数,计作M d。极差:一组资料中最大值与最小值的差值为极差. 方差:变数变异程度的度量,对于总体 ()2 2i Y N μ σ - = ∑ ,对于样本 2 2 () 1 Y y s n - = - ∑ 。 (描述变量平均变异程度的统计量.定义为 2 1 2 () 1 n j j Y y s n = - = - ∑ 。) EMS:期望均方,是对均方MS的期望值。 标准差:变数变异程度的度量,总体标准差: () N Y ∑- = 2 μ σ ,样本标准 差: () 1 2 - - = ∑ n y Y s .(变数的平均变异量.) 标准误:统计数变异度的度量,12 y y y s s - == 。(统计数的标准差。)

统计学简答题

统计学简答题 1、统计的含义与本质是什么? (1)“统计”一词可以有三种含义:统计活动、统计数据、统计学 统计活动是对各种统计数据进行收集、整理并做出相应的推断、分析的活动,通常被划分为统计调查、统计整理、和统计分析三个阶段; 统计数据是通过统计活动获得的,用以表现研究现象特征的各种形式的数据; 统计学则是指导统计活动的理论和方法,是关于如何收集、整理和分析数据的科学。 (2)统计的本质是关于为何统计,统计什么,和如何统计的思想。 2、统计学的学科性质: 1、统计学就其研究对象而言,具有数量性、总体性和差异性的特点。统计学的研究对象是各种现象的数量方面。 2、统计学就其学科范畴而言,具有方法性、层次性和通用性的特点。 3、统计学就其研究方式而言,具有描述性和推断性的特点。 3、总体、样本、个体三者关系如何?试举例说明。 总体:就是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体,有时也称为母体; 样本:就是从总体中抽区的一部分个体所组成集合,也称为子样;组成总体的每个个别事物就称为个体,也称为总体单位。 (1)总体与个体的关系(可变性) 总体容量随着个体数的增减可变大或变小; 随着研究目的的不同,总体中的个体可发生变化; 随着研究范围的变化,总体与个体的角色可以转换 (2)样本与总体的关系 样本是所要研究的对,而样本则是所要观测的对象,样本是总体的代表和缩影。 样本是用来推断总体的。 总体和样体的角色是可以改变的。 4、理解标志、指标、变量三者的含义?标志与指标的联系与区别? 标志是用以描述或体现个性特征的名称; 统计指标简称指标,是反映现象总体数量特征的概念及其数值; 从狭义上看,变量是指可变的数量标志;从广义上来看,变量不仅指可变的数量标志,也包括可变品质标志,因此,可变标志就是变量。 (1)标志与指标的区别:指标和标志说明的对象不同,指标说明总体的特征,标志则说明个体的特征;指标与标志的表现形式不同,指标是用数值来表现的,而标志则既能用文字来表现品质标志,也能用数字来表现数量标志。 (2)标志与指标的联系:标志是计算统计指标的依据,即统计指标数值是根据个体的标志综合表现而来的;由于总体与个体的确定是相对的,可以换位的,因而指标与标志的确定也是相对的、可以换位的;指标与标志同属于变量的范畴。 5、什么是统计指标体系?有哪些表现形式? 同一总体多个反面数量特征的、一系列相互联系的统计指标所形成的体系称为统计指标体系表现形式: 数学等式关系:若干统计指标之间可以构成一个等式关系 相互补充关系:各个指标相互配合,相互补充,从不同方面开说明现象的数量特征 相关关系:各个指标之间的存在着一定的相关关系 原因、条件和结果关系:若干指标中有的是原因,有的是条件有的则为结果

统计学名词解释超级大全

统计学名词解释超级大全第一章导论 统计学:一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。 教育统计学:专门研究如何搜集、整理、分析在心理和教育方面对实验或调查所获得的数字资料,如何根据这些资料所传递的信息,进行数学推论,找出客观规律的一门科学。 描述统计:对实验或调查所获得的数据加以整理(如制表、绘图),并计算其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均,如在集中量数中将原始数据进行平均,在差异量数中将离均差进行平均,在相关量数中将积差进行平均等等。 推断统计:又称抽样统计。它是根据对部分个体进行观测所得到的信息,通过概括性的分析、论证,在一定可靠程度上去推测相应团体。换言之,就是根据已知的情况推测未知情况。 实验设计:研究如何更加合理、有效地获得观测资料,如何更正确、更经济、更有效地达到实验目的,以揭示试验中各种变量关系的实验计划。 统计常态法则:从总体中随机抽取一部分个体所组成的样本,差不多可以保持总体的特征。这种样本特性保持着总体特性的现象叫做统计常态法则。 小数永存法则:第一个样本中所表现出的特性,在其他样本中也会存在,这就是小数永存法则。此处“小数”是指小数量的意思。 大量惰性原则:某一事物的某一性质或状态,在反复观察或试验中是保持不变的。

有效数字:指能影响测量准确性的数字。 变量:又称随机变量。具有变异性的数据。三个特性,离散型,变异性,规律性。 数据:某个数值一旦被取定了,则称这个数值为随机变量的一个观察值。即数据。 总体:性质相同的一类事物的全体。 个体:构成总体的每一基本单位或单元。 样本:总体抽出的部分个体。 参数:表示总体特征的量数。 统计量:直接从样本计算出的量数,代表样本的特征。 名称变量:指一事物与其他事物在属性、类别上不同。 顺序变量:事物的某一属性的多少或大小按顺序排列起来的变量。既无相等的单位又无绝对的零点的变量。 等距变量:只具有相等的单位,而没有绝对的零点的变量。 比率变量:既有相等的单位,又有绝对的零点的变量。 连续变量:指取值可以是某区间内任一数值的随机变量,它是指测量单位之间可以划分成无限多个细小单位,其数字形式多取小数。 离散变量:指测量单位之间不能再细分的数字资料,其数字形式常取整数。 计数数据:计算人或物的个数所获得的数据。 度量数据:用一定的测量工具或测量标准测量时所获得的数据。 指标:表明总体数量特征的概念和具体数值,又称统计指标,它是把各个个体的特征加总起来的综合结果。

统计学原理简答题汇总

统计学原理简答题汇总 一说到统计学原理简答题,大家都会连声抱怨:好多内容要背啊,好难背啊,不过一切抱怨过后还是要继续努力。我个人觉得,统计学原理简答题还是以理解为主,只要大概意思有了,那就已经是很不错的了。 1.品质标志与数量标志有什么区别? 答:统计标志通常分为品质标志和数量标志两种。品质标志表明总体单位属性方面的特征,其标志表现只能用文字表示,如学生的性别、职工的文化程度等,品质标志不能直接汇总为统计指标,只有对其标志表现所对应的单位进行汇总综合才能形成统计指标即总体单位总量;数量标志则表明总体单位的数量特征,其标志表现用数值来表示,即标志值,如学生的成绩、职工的工资等,它们从不同方面体现出总体单位在具体时间、地点条件下运作的结果。数量标志值可直接汇总综合出数量指标。 2.举例说明统计标志与标志表现有何不同? 答:标志是总体中各单位所共同具有的某特征或属性,即标志是说明总体单位属性和特征的名称。标志表现是标志特征在各单位的具体表现,是标志的实际体现者。例如:工人的“工资”是标志,而工资为“1200”分,则是标志表现。 3.一个完整统计调查方案应包括哪些主要内容? 答:一个完整的统计调查方案包括发下主要内容:(1)确定调查目的;(2)确定调查对象和调查单位;(3)确定调查项目,拟定调查表;(4)确定调查时间和时限;(5)确定调查的组织和实施计划。 4.举例说明如何理解调查单位与填报单位的关系? 答:调查单位是调查项目的承担者,是调查对象所包含的具体单位;填报单位是负责向上提交调查资料的单位。两者在一般情况下是不一致的。例如:对工业企业生产设备进行普查时,调查单位是每一台工业生产设备,而填报单位是每一个工业企业。但调查单位和填报单位有时又是一致的。例如:对工业企业进行普查时,调查单位是每一个工业企业,而填报单位也是每一个工业企业,两者一致。 5.调查对象、调查单位和填报单位有何区别? 答:调查对象是应搜集其资料的许多单位的总体;调查单位是构成调查对象的每一个单位,它是进行登记的标志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,一般是基层企事业组织。 6.简述什么是普查及普查的特点。 答:普查是专门组织的、一般用来调查属于一定时点上社会经济现象数量的全面调查。例如:人口普查、经济普查、基本生产单位普查等。 普查的特点:(1)普查是一种这连续调查。(2)普查是一种全面调查。(3)普查能解决全面统计报表不能解决的问题。(4)普查要耗费较大的人力、物力和时间,因而不能经常进行。 7.简述变量分组的种类及应用条件。 答:变量分组包括单项式分组和组距式分组。离散变量变动幅度小,分组可以选择单项式分组。如果离散变量的变动幅度较大,分组应该选择组距式分组。而对于连续变量只能用组距式分组。 8.某地区对占该地区工业增加值三分之二的10个企业进行调查,你认为这种调查方式是重点调查还是典型调查?为什么? 答:首先,从该题内容可知该地区对工业企业进行的是一种非全面调查;第二,非全面调查包括抽样调查、重点调查和典型调查。这三种非全面调查的主要区别是选择调查单位的方法不同,抽样调查是按随机原则抽选单位,重点调查是根据单位标志总量占总体标志总量的比重来确定调查单位,而典型调查是依据对总体的分析,有意识地选取调查单位。因此,

统计学名词解释及简答题 .

名词解释 一、分类数据(categorical data )是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,使用文字来表述的。 二、顺序数据(ran k data )是只能归于某一有序类别的非数字型数据。 三、数值型数据(metric data )是按数字尺度测量的观察值,其结果表现为具体的数值。 四、系统抽样(systematic sampling )将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机的抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法被称为系统抽样。 五、非概率抽样(non-probability sampling )是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采取某种方式从总体中抽出部分单位对其实施调查。 六、抽样误差(sampling error )是由于抽样的随机性引起的样本结果与总体真值之间的误差。 七、四分位数(quartile)也称四分位点,他是一组数据排序后处于25%和75%位置上的值。四分位数是通过3个点将全部数据等分为4部分,其中每部分包括25%的数据。 八、离散系数也成为变异系数(coefficient of variation ),它是一组数据的标准差与其相应的平均数之比。其计算公式为: s s v x = 离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。 九、泊松分布(Poisson distribution )是用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布。 十、中心极限定理(central limit theorem ):设从均值μ、2σ(有限)的任意一个总体中抽取样本量为n 的样本,当n 充分大时,样本均值X 的抽样分布近似服从均值为μ、方差2σ/n 的正态分布。 十一、置信区间(confidence interval )在区间估计中,有样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信上限。 十二、显著性水平(significant level)是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取0.05α=或0.01α=,这表明,当做出接受原假设的决定时,其正确的概率为95%或99%。 十三、方差分析(analysis of variance, ANOV A )就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。 十四、相关系数(correlation coefficient )是根据样本数据计算的度量两个变量之间线性关系强度的统计量。 十五、回归模型(regression model )对于具有线性关系的两个变量,可以用一个线性方程来表示他们之间的关系。描述因变量y 如何依赖于自变量x 和误差项ε的方程称为回归模型。 十六、点估计 利用估计的回归方程,对于x 的一个特定值0x ,求出y 的一个估计值就是点估计。点估计可分为两种:一是平均值的点估计;二是个别值的点估计。 十七、时间序列(time series )是同一现象在不同时间上的相继观察值排列而成的序列。 十八、指数平滑法(exponential smoothing )是通过对过去的观察值加权平均进行预测的一种方法,该方法使t+1期的预测值等于t 期的实际观察值与t 期的预测值的加权平均值。 十九、指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。指数是测定多项内容数量综合变动的相对数。这个概念中包含两个重点:第一个要点是指数的实质是测定多项内容;指数概念的第二个要点是其表现形式为动态相对数,既然是动态相对

相关主题
文本预览
相关文档 最新文档