当前位置:文档之家› 统计学复习(简答题)

统计学复习(简答题)

统计学复习(简答题)
统计学复习(简答题)

复习题

1.什么是统计学?为什么统计学可以通过对数据的分析达到对事物性质的认识?

答:(1)统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。(2)这是由客观事物本身的特点和统计方法的特性共同决定的。a.从客观事物方面来说,根据辩证法的基本原理,任何客观事物都是必然性与偶然性的对立统一。同样,任何一个数据,也都是必然性与偶然性共同作用的结果,是二者作用的对立统一。b.从统计方法来看,统计学提供了一系列的方法,专门用来收集数据、整理数据、显示数据的特征,进而分析和探索(或推断)出事物总体的数量规律性。

2.解释总体与样本、参数和统计量的含义。

总体是我们所要研究的所有基本单位的总和。

样本是总体的一部分单位。

描述总体或概率分布的数量值称为参数。

统计量是对样本数据特征的数量描述。

3.解释总体分布、样本分布和抽样分布的含义。

答:(1)总体分布:整体取值的概率分布规律,通常称为总体分布。(2)样本分布:从总体中抽取容量为n的样本,得到n个样本观测值的概率分布,则为样本分布。(3)抽样分布:就是由样本n个观察值计算的统计量的概率分布。

4.简述描述统计学和推断统计学的概念及其联系。

描述统计学是研究如何取得、加工整理和显示数据资料,进而通过综合、概括与分析得出反映客观现象的规律性数量特征的科学。

推断统计学是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对总体未知的数量特征做出以概率论为基础的推断和估计。

联系:描述统计学和推断统计学是现代统计学的两个组成部分,相辅相成、缺一不可。描述统计学是现代统计学的基础和前提,推断统计学是现代统计学的核心和关键。

5.简述中心极限定理。

从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。

6.解释置信水平、置信区间、显著性水平的含义,它们有什么联系。

在对参数估计的许多置信区间中包含总体参数真值的次数所占的比例称为置信水平。

在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间。

假设检验中犯第一类错误的概率被称为显著性水平。

它们的联系是:置信水平越高,置信区间越宽,显著性水平越底。

7.样本统计量的分布和总体分布的关系是什么?

答:样本统计量包括样本均值、样本比率、样本方差。(1)样本均值总体分布的关系:a无论是重复还是不重复抽样,样本均值的数学期望始终等于总体均值;b在重复抽样条件下,样本均值的方差为总体方差的1/n;在不重复抽样条件下,样本均值的方差为

(2)样本比率与总体分布的关系:a样本比率p的数学期望等于总体比率π;b在重复条件下,;在不重复条件下,用修正系数加以修正,

(3)样本方差与总体分布的关系:对于来自正态总体的简单随机样本,则比值

的抽样分布服从自由度为(n-1)的x2分布。

8.抽样推断时为什么必须遵循随机原则抽取样本?

抽样推断是按照随机的原则从总体中抽取一部分调查单位进行观察,并依据所获得的部分单位的数量特征对全部研究对象的数量特征做出具有一定可靠性的估计和判断,从而达到对总体现象的认识的一种方法。必须遵循随机原则是因为样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有一个已知的不为零的中选机会。

9.简述假设检验的一般步骤。

答:⑴陈述原假设和备择假设

⑵从所研究的总体中抽出一个随机样本

⑶确定一个适当的检验统计量,并利用样本数据算出其具体数值

⑷确定一个适当的显著性水平,并计算出其临界值,指定拒绝域

⑸将统计量的值与临界值进行比较,作出决策。统计量的值落在拒绝域,拒绝H0,否则不拒绝H0;也可以直接利用P值作出决策,P值小于显著性水平的拒绝H0,否则不拒绝H0。

10.简述第Ⅰ类错误和第Ⅱ类错误的概念,它们发生的概率之间存在怎样的关系?

当原假设为真时拒绝原假设,所犯的错误称为第Ⅰ类错误。犯第Ⅰ类错误的概率记为α。

当原假设为假时没有拒绝原假设,所犯的错误称为第Ⅱ类错误。犯第Ⅱ类错误的概率记为β。关系:和α增大时,β减小;当α减小时,β增大.

11.简述众数、中位数和均值的特点和应用场合。

答:(1)定义:众数是将数据按大小顺序排队形成次数分配后,在统计分布中具有明显集中趋势点的数值,是数据一般水平代表性的一种。中位数是数据排序后,位置在最中间的数值。均值就是算术平均数,是数据集中趋势的最主要测度值.

(2)特点:众数和中位数是从数据分布形状及位置角度来考虑的集中趋势代表值,而均值是经过对所有数据计算后得到的集中趋势值。

(3)应用场合:在对称次数分配和统计分布中,众数、中位数和均值都是同一数值。在有偏的分布中,众数则能更好地描述数据的集中趋势。

12. 为什么要计算离散系数?

当对不同总体或样本数据的离散程度进行比较时,由于平均值不同、计量单位不同,因此直接比较离散指标的绝对数形式,如极差、平均差、标准差等,必须将上述指标与平均值对比,消除平均值不同和计量单位不同的影响,即必须计算离散系数。

13.简述移动平均法的基本原理和特点。

答:⑴基本原理是消除时间序列中的不规则变动和其他变动,揭示出时间序列的长期趋势;

⑵移动平均的方式是选择一定的用于平均的时距项数N,采用对序列逐项递移的方式,对原序列递移的N项计算一系列序时平均数。

⑶移动平均法的特点:①对原序列有修匀或平滑的作用。时距项数N越大,对数列的修匀作用越强;

②移动平均项数N为偶数时,需做二项移动平均以移正其位置

③平均时距项数N与季节变动长度一致才能消除季节变动;时距项数N和周期一致才能消

除周期波动。

④移动平均会使原序列失去部分信息,平均项数越大,失去的信息越多。

14.简述加权平均指数的基本编制原理。

答:1为了对复杂现象总体进行对比分析,首先对构成总体的个别元素计算个体指数,所得到的无量纲化的相对数是编制总指数的基础2为了反映个别元素在总体中的重要性的差异,必须以相应的总值指标作为权数对个体指数进行加权平均,就得到说明总体现象数量对比关系的总指数。

15.简述编制总指数的两种方法的区别与联系。

答:编制总指数的两种基本形式是综合指数和平均指数。区别主要表现在三个方面:(1)解决复杂总体不能直接同度量问题的基本思路不同。综合指数的特点是“先综合,后对比”;而平均数指数的特点是“先对比,后综合”。(2)运用资料的条件不同。综合指数要求全面调查的资料;而平均指数既可以用于全面调查资料的情况,也可以用于非全面调查资料的情况。

(3)在经济分析中的作用不同。平均指数除作为综合指数变形加以应用的情况外,主要是用以反映复杂总体的变动方向和程度,一般不用于因素分析;而综合指数则由于用以对比的问题指标有明确的经济内容,因此,在经济分析中,不仅用以表明复杂总体的变动方向和程度,而且用以进行因素分析,且能表明因素变动对对象变动影响的绝对量。联系的表现:在一定的权数条件下,两类指数之间有变形关系,即平均指数可作为综合指数的变形形式加以应用。

16.简述样本容量与置信水平、总体方差、允许误差的关系。

答:样本容量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本容量也就越大;样本容量与总体方差成正比,总体的差异越大,所要求的样本容量也越大;样本容量与允许误差成反比,可以接受的允许误差越大,所需的样本容量就越小。

17.比较单侧检验和双侧检验的区别。

(1)问题的提法不同,双侧检验研究的是新方法与旧方法是否有差异;单侧检验研究的是新方法明显好于旧方法还是新方法明显不如旧方法。(2) 建立假设的形式不同,双侧检验的假设是H0: u=u0, H1: u ≠u0;单侧检验的假设是H0: u≤u0, H1: u>u0或H0: u>u0, H1: u≤u0 。(3)否定的区域不同,双侧检验的否定区域是IZ I> Z a/2;单侧检验的否定区域是Z<-Za 或Z>Za

18.甲企业近四年产品销售量分别增长了9%、7%、8%、6%;乙企业这四年产品的次品率也正好是9%、7%、8%、6%。这两个企业这四年的平均增长率和平均次品率的计算是否一样?为什么?

答:不一样。因为计算的对象不同,所使用的方法不同。

平均增长率要将增长率变成发展速度后,通过几何平均法求出平均发展速度后减去1得平均增长率,即:

四年的平均增长率=

()()()()%

100

%

6

1

%

8

1

%

7

1

%

9

1

4-

+

?

+

?

+

?

+

平均次品率是以每年的产品量(包括次品)为权数对每年的次品率进行加权平均得到的,设四年的产品量分别为A、B、C、D,则

四年的平均次品率=(9%A+7%B+8%C+6%D)/(A+B+C+D)

19. 在总量指标的两因素分析中,指数体系如下:

)

()(001010110011001010110011∑∑∑∑∑∑∑∑∑∑∑∑-+-=-?=q p q p q p q p q p q p q p q p q p q p q p q p

以下计算出来的是一组与上述指数体系相对应的销售额、销售价格和销售量的数据。请根据以下数据解释该指数体系的含义。

20.

1)联系:具有共同的研究对象,两者互相补充。

只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。 简单说:相关分析是回归分析的基础和前提;回归分析是相关分析的深入和继续。

2)区别:(1)在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。(2)相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。(3)相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。

21.解释因子和处理的含义。

1)在方差分析中,所要检验的对象称为因素或因子。

2)因素的不同表现称为水平或处理。

22..简述假设检验中P 值的含义。

如果原假设H0是正确的,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P 值。P 值是假设检验中的另一个决策工具,对于给定的显著性水平α,若P <α,则拒绝原假设。

二、计算题

1.第四章例题。

2.第五章习题的第2、4、6题

3..第六章一个总体均值的检验相关例题。

4.第七章习题的第1、3、5、7题。

5..第八章:简单线形回归及其方差分析表。

6.第九章习题的第1、3、5、7题。

7.第十章习题的第1、3、6、7题。

注:对于判断题和选择题中的需要计算的内容要从所要掌握的内容去复习。

统计学简答题答案资料讲解

1、什么是统计学,有哪些特点? 统计学是收集、整理、分析、解释数据并从数据中得到结论的学科。 特点:客观性~~相关性~~实用性~~科学性~~严谨性~~逻辑性~~~ 2、何谓标志,按能否用数量表示可以分为哪两种类型,分别举例说明 标志是指说明总体单位属性或特征的名称。可以分为数量标志和质量标志 品质标志:说明总体单位属性特征的名称,用文字描述。Ex:性别,名族,工种,籍贯数量标志:说明总体单位数量特征的名称,用数量表示。数量标志的具体表现称标志值。 Ex:工人的年龄,工资,工龄 3、什么是离散型变量,连续性变量?举例说明 变量:可变的数量标志和指标; 离散型变量:指变量的数值只能以计数的方法取得,(变量值只能取整数); 连续型变量:指变量的取值连续不断,(变量值能取小数)。 4、简述品质标志和数量标志的区别,并举例说明。 区别:数量标志说明的是总体的数量特征,而品质标志说明的是总体的属性特征。 5、什么是数量指标和质量指标?二者有何关系? 统计指标:反映总体数量特征的科学概念和具体数值。 注意:从理论上讲,一个完整的统计指标由两部分构成:指标名称+指标数值 例如:某地区2009年完成利税总额(指标名称)为1500(指标数值)亿元。 数量指标:用来反映现象的总规模、总水平、或工作总量的指标。其数值大小随总体的研究范围的大小而增减。 质量指标:反映客观现象的劳动效果或工作质量等事物内部数量关系的指标,其数值的大小与总体的研究范围大小无直接联系。 6、统计标志和统计指标有和联系与区别? 区别:1、标志是反映总体单位特征;指标反映总体特征。 2、指标都能用数量表示,标志只有数量标志能用数量表示; 3、标志是一个理论概念,实际应用中只有指标。 联系:1、标志与指标可以相互转化,随研究目的的转化而改变; 2、指标值一般是标志值汇总来的; 3、标志的名称常常就是指标名称。 7、制定一份完整的统计调查方案,应包括哪些内容? 1)明确调查的目的和任务 2)确定调查的对象和调查单位、 3)确定带调查项目、设计调查表或问卷 4)确定调查时间、调查地点和调查方式方法 5)制定调查的组织实施计划 8、举例说明重点调查的概念和特点 重点调查:是在调查对象范围内部选择部分重点调查单位进行的调查。 特点:调查单位少、适用于调查对象的标志值比较集中于某些单位的场合、重点调查的调查方式主要采取专门调查的组织形式(一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。);有点在于花费较少的人力物力和时间就可以获得总体的基本情况资料。 9、简述重点调查、典型调查、抽样调查的联系与区别P31 抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。

统计学简答题期末复习题

1. 什么是统计学?为什么统计学可以通过对数据的分析达到对事物性质的认识? 统计学是一门关于统计设计、搜集、整理、分析统计数据的方法科学,其目的是探索数据内在的数量规律性,以达到对客观事物的科学认识。统计学可以通过对数据的分析达到对事务性质的认识是有客观事物本身的特点和统计方法的特性共同决定的。(1)从客观事物方面来说,根据辩证法的基本原理,任何客观事物都是必然性与偶然性的对立统一。同样,任何一个数据也都是必然性与偶然性共同作用的结果,是二者作用的对立统一。(2)从统计方法来看,统计学提供了一系列的方法,专门用来收集数据、整理数据、显示数据的特征,进而分析和探索(或推断)出事物总体的数量规律性。 2.解释总体与样本、参数和统计量的含义。 (1)总体:是我们所要研究的所有基本单位(通常是人、物体、交易或者事件)的总和,是在至少一种共性的基础上由许多独立的个别事物所组成的整体。(2)样本:是总体的一部分单位,是从总体中抽出的一部分被实际调查的子集合体。(3)参数:是对总体特征的数量描述,是研究者想要了解的总体的某种特征值,参数通常是一个未知的常数。(4)统计量:根据样本数据计算出来的一个量,是对样本数据特征值的数量描述。 3.解释总体分布、样本分布和抽样分布的含义。 (1)总体分布:整体取值的概率分布规律,通常称为总体分布。(2)样本分布:从总体中抽取容量为n的样本,得到n个样本观测值的概率分布,则为样本分布。(3)抽样分布:就是由样本n个观察值计算的统计量的概率分布。 4.简述描述统计学和推断统计学的概念及其联系。 (1)描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法;推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。(2)两者间联系:一方面反映了统计发展的前后两个阶段,另一方面也反映了统计方法研究和探索客观事物内在数量规律性的先后两个过程。 5. 简述中心极限定理。 中心极限定理就是对于一个抽自任意总体(均值为μ,方差为σ2),样本容量为n的随机样本。当n 充分大时(通常要求n≥30),样本均值的抽样分布将近似于一个具有μ、方差为σ2/n的正态分布。 6.解释置信水平、置信区间、显著性水平的含义,它们有什么联系。 (1)置信水平:置信区间中包含总体参数真值的次数所占的比率,也称置信系数。(2)置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间。(3)显著性水平:是指当原假设实际上正确时,检验统计量落在拒绝域的概率。联系:置信区间越宽,置信水平越高,显著性水平越低。 7. 几何平均数的适用条件分别是什么? 几何平均数的使用条件:总指标等于各个变量连乘积的值,一般用来计算社会经济问题的平均发展速度。 8. 抽样推断时为什么必须遵循随机原则抽取样本? 只有遵循随机原则从总体中抽取样本,才能排除主观因素等非随机因素对抽样调查的影响,从而使样本单位的分布接近总体单位的分布,样本对总体才具有较大的代表性。这样,根据样本的调查资料来估计和推断总体的数量特征才能较为科学和准确。 9. 简述假设检验的一般步骤。 (1)陈述原假设H0和备择假设H1;(2)从所研究的总体中抽了不起一个随机样本;(3)确定一个适当的检验统计量,并利用样本数据算出来具体数值;(4)确定一个适当的显著性水平a,并计算出其临界值,指定拒绝域;(5)将统计量的值与临界值进行比较,并做出决策:若统计量的值落在拒绝域内,拒绝原假设H0,否则不拒绝原假设H0。也可以直接利用P值作出决策,P值小于显著性水平的拒绝H0,否则不拒绝H0。

统计学简答题及答案

统计学简答题及参考答案 1.简述描述统计学的概念、研究容与目的。 概念:它是研究数据收集、整理和描述的统计学分支。 研究容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。 研究目的:描述数据的特征;找出数据的基本数量规律。 2.简述推断统计学的概念、研究容与目的。 概念:它是研究如何利用样本数据来推断总体特征的统计学分支。 研究容:参数估计和假设检验的理论与方法。 研究目的:对总体特征作出统计推断。 3.什么是总体和样本? 总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。 可分为有限总体和无限总体: ?有限总体的围能够明确确定,且元素的数目是有限的,可数的。 ?无限总体所包括的元素数目是无限的,不可数的。 总体单位数可用N表示。 样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n。 4.什么是普查?它有哪些特点? 普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点: 1)通常是一次性或周期性的 2)一般需要规定统一的标准调查时间 3)数据的规化程度较高 4)应用围比较狭窄。 5.什么是抽样调查?它有哪些特点? 抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。 它具有经济性好、时效性强、适应面广、准确性高等特点。 6.简述统计调查方案的概念及应包括的基本容。 答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。 它应包括的基本容有: 〈1〉明确调查目的; 〈2〉确定调查对象和调查单位; 〈3〉设计调查项目; 〈4〉设计调查表格和问卷; 〈5〉确定调查时间; 〈6〉组织实施调查计划; 〈7〉调查报告的撰写,等等。 7.简述统计分组的概念、原则和具体方法。 答:(1)概念

大学统计学简答题复习及答案

习题一总论 1?简述统计总体和总体单位的含义及其关系。 统计总体(简称总体)是指统计所研究的事物的全体,它是由客观存在的具有某种共同性质的许多个别事物组成的集合体。总体单位是指构成统计总体的个别事物,是组成总体的基本单位,简称个体。统计总体和总体单位所指的具体内容不是固定不变的,而是随着研究的目的不同而变化的。总体可以变为总体单位,总体单位可以变为总体。 2 ?什么是指标和标志?指标与标志的关系如何? 指标即统计指标,指反映统计总体综合数量特征的概念和数值。标志指说明总体单位特征的名称。指标与标志的区别:①指标是说明总体特征的,而标志是说明总体单位特征的;②所有指标都能用数值表示,而标志中的数量标志能用数值表示,品质标志却通常不能用数值表示。指标与标志的联系:①指标是对总体中各单位标志表现进行综合的结果,有许多统计指标其数值是由数量标志值汇总而来的,品质标志本身虽无数值,但许多指标却是按品质标志分组计算出来的。②指标和数量标志之间存在着变换关系,由于研究目的的变化,原来的总体变成总体单位,则相对应的统计指标就变成数量标志;反之,则相对应的数量标志就变成了统计指标。 习题二统计调查 1.完整的统计调查方案应包括哪些主要内容? 应包括:①确定调查目的;②确定调查对象和调查单位;③确定调查内容,拟订调查表;④ 确定调查时间和调查期限;⑤确定调查的组织和实施计划。 2.调查对象、调查单位和填报单位有何区别? 调查对象是指根据调查目的确定的需要进行调查研究的现象总体,它是由性质相同的许多个别单位组成的。调查单位是指调查对象中所要调查的具体单位,它是进行登记的标志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,它与调查单位有时一致,有时不一致。 3?重点调查与典型调查的区别是什么? 主要区别表现在两个方面: ①典型单位和重点单位性质不同。典型调查强调被选单位在同类社会经济现象中所具有的代表性、典型性,是有 意识地选取的;而重点调查则强调被选单位某标志值在总体标志值总和中所占的比重较大,是客观存在的。 ②侧重点不同。典型调查的主要目的是认识事物本质特征及其发展规律,调查深入细致,同时也注重定性调查; 而重点调查的目的主要是掌握总体的数量状况,着眼于普遍情况,注重量的调查。

统计学期末复习-公式汇总

统计报表 专门调查 普查 抽样调查 典型调查 重点调查 按调查的组织方式不同分为 按调查时间是否连续分为 按调查单位的范围大小分为 全面调查 非 全面调查 一次性调查 经 常性调查 统计学复习 第一章 1.“统计”的三个涵义:统计工作、统计资料、统计学 2.三者之间的关系:统计工作和统计资料是工作与工作成果的关系; 统计资料和统计学是实践与理论的关系 3.统计学的特点:数量性,总体性,具体性,社会性(广泛性) 4.统计工作的过程一般分为统计调查、统计整理和统计分析三个阶段 5.总体与总体单位的区分:统计总体是客观存在的,在同一性质基础上结合起来的许多个别单位的整体,构成总体的这些个别单位称为总体单位。(总体或总体单位的区分不是固定的:同一个研究对象,在一种情况下是总体,在另一种情况下可能成了总体单位。) 6.标志:总体单位所具有的属性或特征。 A 品质标志—说明总体单位质的特征,不能用数值来表示。如:性别、职业、血型色彩 B 数量标志—标志总体单位量的特征,可以用数值来表示。如:年龄、工资额、身高 指标:反映社会经济现象总体数量特征的概念及其数值。 指标名称体现事物质的规定性,指标数值体现事物量的规定性 第二章 1.统计调查种类 2.统计调查方案包括六项基本内容: 1)确定调查目的;(为什么调查) 2)确定调查对象与调查单位;(向谁调查) 调查对象——社会现象的总体 调查单位——调查标志的承担者(总体单位) 填报单位——报告调查内容,提交统计资料 3)确定调查项目、拟定调查表格;(调查什么) 4)确定调查时间和调查期限 5)制定调查的组织实施计划; 6)选择调查方法。

统计学简答题整理精编版

统计学简答题整理 GE GROUP system office room 【GEIHUA16H-GEIHUA GEIHUA8Q8-

统计学简答题整理第一章P11 1.获取直接统计数据的渠道主要有哪些及区别在于 普查、抽样调查 普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大,间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。 抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差,但统计方法可以估计出误差的大小进一步控制误差;节省人力、财力、物力,又能保证实效性 2.简要说明抽样误差和非抽样误差。 非抽样误差是由于调查过程中各有关环节工作失误造成的。(它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差,还有一种人为干扰造成的误差即有意瞒报或低报数据等)。非抽样误差在普查、抽样调查中都有可能发生,但可以避免。

抽样误差是利用样本推断总体时产生的误差。(由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制)。抽样误差与样本量的平方根成反比关系。 第二章P51 1.统计的计量尺度 ①列名尺度(定类尺度):是按照某一品质标志将总体分组之后,对属性相同的单位进行计量的方法。各组之间的关系是并列的,没有大小、高低、先后之别。 ②顺序尺度(定序尺度):是按照某一品质标志将总体分组,对等级相同的单位进行计量的方法。各组之间的关系是有顺序的,可以进行排序。 ③间隔尺度(也称定距尺度):是按某一数量标志将总体分组,对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序,还可以计算不同数值之间的绝对差距。 ④比例尺度(也称定比尺度):是类似于间隔尺度,又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异,还可以计算数值的相对差异。 2.简述统计分组的概念和作用。 概念:统计分组是根据统计研究目的,选择一定的分组标志,将总体划分为若干组的统计方法。其目的是使组与组有明显差别,同一组中具有相对的同质性。(例:人口按性别、年龄、民族、职业分组;企业按规模分为大型、中型和小型。)

社会统计学复习题(有答案)复习课程

社会统计学复习题(有 答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产 品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。

统计学简答题参考答案

统计学简答题参考答案 第一章绪论 1.什么是统计学?怎样理解统计学和统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学和统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。2.简要说明统计数据的来源。 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差。 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.解释描述统计和推断统计的概念?(P5) 答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。第二章统计数据的描述 1描述次数分配表的编制过程。 答:分二个步骤: (1)按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组和组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。 统计分组应遵循“不重不漏”原则 (2)将数据分配到各个组,统计各组的次数,编制次数分配表。 2. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 3.怎样理解均值在统计中的地位? 答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。 4. 简述众数、中位数和均值的特点和使用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,使用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。5.为什么要计算离散系数?

《统计学》复习题(专升本)

《统计学》复习题(专升本) 一、单项选择题 1、在进行组距式分组时,凡遇到某单位的标志值正好等于相邻两组的上下限的数值时,一般将此值()。 A. 归于上限组 B. 归于下限组 C.归于上限组或下限组均可 D. 重新分组 2、把两个地区的粮食产量相对比,所得到的相对指标是()。 A. 比例相对指标 B. 结构相对指标 C. 比较相对指标 D. 强度相对指标 3、加权算术平均数的大小()。 A. 只受变量值大小的影响 B. 只受权数大小的影响 C. 受权数和变量值的双重影响 D. 都无影响 4、某企业计划规定产品单位成本降低6%,实际降低10%,则计划完成程度()。 A.97.94% B. 166.67 % C. 100.5% D. 95.74% 5、某企业2010年A产品销售收入比上一年增长8%,其中由于价格上涨增加销售收入为3%。那么,产量比上年增长()。 A. 5% B. 4.85% C. 11.24% D. 24% 6、一个统计总体()。 A. 只能有一个标志 B. 只能有一个指标 C. 可以有多个标志 D. 可以有多个指标 7、下列属于品质标志的是()。 A. 工人年龄 B. 工人性别 C. 工人体重 D. 工人工资 =270-0.5x,8、每吨铸件的成本(元)与每一个工人劳动生产率(吨)之间的回归方程为y c 这意味着劳动生产率每提高一个单位(吨),成本就会()。 A. 提高270元 B. 提高269.5元 C. 降低 0.5元 D. 提高0.5元

9、 判断现象之间相关关系密切程度的主要方法( )。 A. 编制相关表 B. 进行定性分析 C. 绘制相关图 D. 计算相关系数 10、对某地区工业企业职工状况进行了解,统计总体是( )。 A .该地区全部工业企业 B .某个工业企业 C .该地区工业企业的全部职工 D .每个工业企业的全部职工 11、按数量标志分组的关键是确定( )。 A .变量值的大小 B .组数 C .组中值 D .各组界限 12、拉氏的数量指标综合指数编制公式是( )。 A . ∑∑0 001p q p q B . ∑∑0 10 p q p q C . ∑∑0 1 11p q p q D . ∑∑1 11p q p q 13、构成总体的每个单位所有方面的特征是( )。 A .必须完全相同 B .不完全相同但至少有一个方面相同 C .完全不相同 D .既可以相同,也可以不相同 14、从纯理论出发,在直观上最符合随机原则的抽样方式是( )。 A. 简单随机抽样 B. 类型抽样 C. 等距抽样 D. 整群抽样 15、 如果零售物价上涨8%,销售量下降8%,则销售额( )。 A .没有变化 B .有所增长 C .有所下降 D .无法判断 16、连续变量分组,若第一组为200以下,第二组为200-300,第三组为300-400,第四组为400以上,则数据( )。 A. 200在第一组 B. 200在第二组 C. 200在第三组 D. 200在第四组 17、某种产品产量2014年比2013年增长了10%,2015年比2013年增长了12%,则2015年比2014年增长了( )。 A. 12%÷10% B.(112%÷110%)—1

统计学复习题1要点

第一章绪论 一、填空 1、统计数据按测定层次分,可以分为分类数据、顺序数据和数值型数据;如果按时间状况分,可以分为截面数据和时间序列数据。 2、由一组频数2,5,6,7得到的一组频率依次是0.1 、0.25 、0.3 和0.35 ,如果这组频数各增加20%,则所得到的频率不变。 3、已知一个闭口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为640,其组中值为620 。 4、如果各组相应的累积频率依次为0.2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为___20 5 35 15 25___。 5、中位数e M可反映总体的集中趋势,四分位差D Q.可反映总体的离散程度,数据组1,2,5,5,6,7,8,9中位数是 5.5,众数为 5 。 6、假如各组变量值都扩大2 倍,而频数都减少为原来的1/3 ,那么算术平均数扩大为原来的2倍。 四、计算题 1、某班的经济学成绩如下表所示: 43 55 56 56 59 60 67 69 73 75 77 77 78 79 80 81 82 83 83 83 84 86 87 88 88 89 90 90 95 97 (1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数(2)计算该班经济学成绩的众数、四分位差和离散系数。 (3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么? (4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布? (3)上四分位数和下四分位数所在区间? 4、对成年组和青少年组共500人身高资料分组,分组资料列表如下: 成年组青少年组按身高分组(cm) 人数(人) 按身高分组(cm) 人数(人) 150~155 155~160 160~165 165~170 22 108 95 43 70~75 75~80 80~85 85~90 26 83 39 28

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错)

统计学复习题2

《统计学》复习题(二) 一、 判断题 1、在用计算机进行数据汇总时,往往将男性用“1”来表示,女性用“0”来表示,所以可将性别视为定比数据变量。( ) 2、 在进行普查时涉及的调查项目越多越好。( ) 3、 进行普查时,规定标准时间的目的是为了按时完成调查工作。( ) 4、 欲了解我国国民的年龄构成,对人口按年龄分组,适合采用等距式分组。 ( ) 5、 直方图适合用于显示连续型分组数据。( ) 6、 当均值小于中位数,且中位数小于众数时,数据分布具有左偏特征。( ) 7、 标准化是指将原始数据进行线性变换,使其平均数为1,标准差为0,改变了改组数据的分布情况。( ) 8、为了解学生参加英语培训是否能提高考试成绩,对某高校学生培训前后的英语成绩进行检验,这属于配对样本的检验。( ) 二、单项选择题 1、用部分数据推断总体数据的方法,属于( ) A 、理论统计学的内容 B 、应用统计学的内容 C 、推断统计学的内容 D 、描述统计学的内容 2、总体个数为N,用每隔一定数量的方法抽取容量为n 的抽样方式是( ) A 、多步抽样 B 、分层抽样 C 、整群抽样 D 、系统抽样 3、由切比雪夫定理知至少有( )的数据落在算术平均数正负2个标准差内 A 、88% B 、75% C 、93% D 、96% 4、在坐标轴中,横轴刻度表示直方图的( ) A 、频数 B 、组中值 C 、组距 D 、组限 5、两组数据的均值不等,但标准差相等,则( ) A 、均值大的一组数据差异程度大 B 、均值小的一组数据差异程度大 C 、两组数据的差异程度相同 D 、无法对两组数据进行比较 6、时间序列的加法模型中t T 代表( ) A 、季节变动 B 、不规则变动 C 、循环变动 D 、代表长期趋势 7、设总体服从均值为μ,方差为2δ的正态分布,从总体N 中按重复抽样方法抽取容量为n 的简单随机样本,则样本均值的抽样分布服从( ) A 、2(,)μδ B 、2 ( μ C 、2 (,)n δμ D 、2 (,)1 N n n N δμ-?- 8、进行假设检验时,在样本量一定的条件下,犯第一类错误的概率减小,犯第二类错误的概率就会( ) A 、减小 B 、增大 C 、不变 D 、不确定 三、简答题

统计学期末考试试题(含答案)

交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是( C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有( B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意 D盲目 7.总体标准差未知时总体均值的假设检验要用到( A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、 1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括( ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有( BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有( ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中( BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位 D、每台设备是调查单位 E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有( ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对)

统计学简答题答案修订

统计学简答答案 1.一组数据的分布特征可以从哪几个方面进行描述? 数据分布的特征可以从三个方面进行测度和描述: (1)分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度; (2)分布的离散程度,反映各数据远离其中心值的趋势; (3)分布的形状,反映数据分布的偏态和峰态。 2.影响样本量大小的因素有哪些?简述这些因素与样本量的关系。 (1)影响样本量大小的因素有:所要求的置信水平、总体方差和估计时所希望的估计误差。 (2)关系:其他条件不变的情况下: 1)样本量的大小与置信水平成正比。置信水平越大,所需样本量也就越大; 2)样本量与总体方差成正比。总体的差异越大,所要求的样本量也越大; 3)样本量与估计误差的平方成反比,即允许的估计误差的平方越大,所需的样本量就越小。 3.简述统计数据的类型和特点。 类型:(1)按计量尺度:分类数据、顺序数据和数值型数据; (2)按收集方法:观测数据和实验数据; (3)按被描述的现象与时间的关系:截面数据和时间序列数据。 特点:(1)按计量尺度分时:分类数据中各类别间是平等的并列关系,各类别间的顺序是可任意改变的;顺序数据的类别间是可以比较顺序的;数值型数据其结果表现为具体的数值。 (2)按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。 (3)按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。 4.在假设检验中,当不拒绝原假设时,为什么不采取“接受原假设”的表示方式? (1)在假设检验时,当拒绝原假设时,表明样本提供的证据证明它是错误的;当没有拒绝原假设时,也没法证明它是正确的。 (2)采用“接受”原假设的说法,意味着样本提供的证据证明了原假设是正确的。但由于原假设的真实值是什么并不知道,没有足够的证据拒绝原假设并不等于能够证明原假设是真的,它仅仅意味着目前我们还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设。5.什么是判定系数?它在回归分析中的主要作用是什么? (1)判定系数:回归平方和占总平方和的比例。记为R2,公式为:R2,=SSR/SST. (2)在回归分析中,R2,主要是用于测度回归直线对观测数据的拟合程度。取值范围是[0,1]。R2,越接近于1,回归直线的拟合程度就越好;R2,越接近于0,回归直线的拟合程度就越差。若所有观测点都落在直线上,R2,=1,拟合是完全的;如果R2,=0,回归直线对数据完全没有拟合。 6.解释95%的置信区间 如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。 7.说明区间估计的基本原理 区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出一个概率度量。 8.测度两个分类变量相关性的统计量有哪些?他们有什么不同? 测度两个分类变量相关性的统计量有以下几个: Φ相关系数、列联相关系数(c系数)、v相关系数 (1)Φ相关系数:描述2×2列联表数据相关程度最常用的一种相关系数且Φ系数没有上限。 (2)列联相关系数(c系数):主要用于大于2×2列联表的情况且c系数小于1.

统计学简答题完整版

统计学简答题 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

简答题l.获得数据的概率抽样方法有哪些 (1)简单随机抽样 简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。 它最直观地体现了抽样的基本原理,是最基本的概率抽样。 (2)系统抽样 系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法。 (3)分层抽样 分层抽样也叫分类抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,它们的集合即为总体样本。 (4)整群抽样 整群抽样又称聚类抽样或集体抽样,是将总体按照某种标准划分为一些群体,每一个群体为一个抽样单位,再用随机的方法从这些群体中抽取若干群体,并将所抽出群体中的所有个体集合为总体的样本。 (5)多阶段抽样 多阶段抽样又称多级抽样或分段抽样,就是把从总体中抽取样本的过程分成两个或多个 阶段进行的抽样方法。 2.什么是统计学统计学数据分为哪几类数据 统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 3.简述众数、中位数和平均数的特点和应用场合。 表示。它不受极端值影响,具答:众数是一组数据中出现次数最多的变量值,用M 有不唯一性。众数主要用于分类数据的集中趋势,当然也适用顺序数据和数值型数据。数据分布偏斜程度较大时应用。 表示,也不受极端值中位数是一组数据排序后处于中间位置上的变量值,用M e 影响。它将全部数据等分成两部分,一部分数据比中位数大,一部分比中位数小。主要用于测度顺序数据的集中趋势,当然也适用于数值型数据,但不适用于分类数据。数据分布偏斜程度较大时应用。 平均数是一组数据相加后除以数据的个数得到的结果,是集中趋势的最主要测度值。它易受极端值影响,数学性质优良。主要适用于数值型数据,而不适用于分类数据和顺序数据。数据对称分布或接近对称分布时应用。 4.收集数据的基本方法有哪些? 1.自填式 2.面访式 3.电话式 此外收集数据的方法还有观察式,即调查人员通过直接观测的方法获取信息。

统计学简答题复习

1.什么是统计学?为什么统计学可以通过对数据的分析达到对事物性质的认识? 答:统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。这是由客观事物本身的特点和统计方法的特性共同决定的。任何事物都是质与量的对立统一,一定事物的质总是表现为一定的量的特征;一定的量的特征代表事物的某种性质。从客观事物方面来说,根据辩证法的基本原理,任何客观事物都是必然性与偶然性的对立统一。任何一个数据,也都是必然性与偶然性共同作用的结果,必然性反映了事物本质的特征和联系,决定了事物的内在本质是有规律可循的,偶然性反映了事物个别表现的差异性。统计就可以从大量事物的表现中探索到内在的、本质的的数量规律性。 2.解释总体与样本、参数和统计量的含义。 答:总体:所研究的全部个体(元素)的集合。 样本:从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量。参数:研究者想要了解的总体的某种特征值,参数通常是一个未知的常数。统计量:根据样本数据计算出来的一个量。由于样本是我们所已经抽出来的,所以统计量总是知道的。 3.解释总体分布、样本分布和抽样分布的含义。 (1)总体分布:整体取值的概率分布规律,通常称为总体分布。(2)样本分布:从总体中抽取容量为n 的样本,得到n个样本观测值的概率分布,则为样本分布。(3)抽样分布:就是由样本n个观察值计算的统计量的概率分布。 4.简述描述统计学和推断统计学的概念及其联系。 答:描述统计学是研究如何取得、加工整理和显示数据资料,进而通过综合、概括与分析得出反映客观现象的规律性数量特征的科学。推断统计学是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对总体未知的数量特征做出以概率论为基础的推断和估计。 联系:描述统计学和推断统计学是现代统计学的两个组成部分,相辅相成、缺一不可。描述统计学是现代统计学的基础和前提,推断统计学是现代统计学的核心和关键。 5.简述中心极限定理。 答:从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。 6.解释置信水平、置信区间、显著性水平的含义,它们有什么联系。 答:在对参数估计的许多置信区间中包含总体参数真值的次数所占的比例称为置信水平。在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间。 假设检验中犯第一类错误的概率被称为显著性水平。它们的联系是:置信水平越高,置信区间越宽,显著性水平越低。 7. 几何平均数的适用条件分别是什么? 答:几何平均数的使用条件:总指标等于各个变量连乘积的值,一般用来计算社会经济问题的平均发展速度。 8.抽样推断时为什么必须遵循随机原则抽取样本? 答、只有遵循随机原则从总体中抽取样本,才能排除主观因素等非随机因素对抽样调查的影响,从而使样本单位的分布接近总体单位的分布,样本对总体才具有较大的代表性。这样,根据样本的调查资料来估计和推断总体的数量特征才能较为科学和准确 9.简述假设检验的一般步骤。 答:⑴陈述原假设和备择假设 ⑵从所研究的总体中抽出一个随机样本 ⑶确定一个适当的检验统计量,并利用样本数据算出其具体数值 ⑷确定一个适当的显著性水平,并计算出其临界值,指定拒绝域 ⑸将统计量的值与临界值进行比较,作出决策。统计量的值落在拒绝域,拒绝H0,否则不拒绝H0;也可 以直接利用P值作出决策,P值小于显著性水平的拒绝H0,否则不拒绝H0。 10.相关系数(r)绝对值的大小是如何来反映两个变量之间线性关系显著性的? 答:相关系数r是根据从总体中抽取的随机样本的观测值x和y计算出来的,它是对总体相关系数p 的估计。当r=0,表明没有线性相关关系;当0<▏r▏<1时,存在一定的线性相关关系;若r>0,表明x和y为正相关,若r<0,表明y为负相关;当▏r▏=1时,表明x和y完全线性相关,若r=1,表明x 和y完全正相关;若r=-1,表明x和y完全负相关。 11.简述众数、中位数和均值的特点和应用场合。 答:众数是一种位置代表值,它的应用场合比较有限;中位数具有稳健性,数据值与中位数之差的绝对值之和最小;均值就是算术平均数,是数据集中趋势的最主要测度值。众数最容易计算,但不是永远存在,同时作为集中趋势代表值应用的场合很少;中位数很容易理解、很直观,它不受极端值的影响,这既是它有价值的方面,也是它数据信息利用不够充分的地方;均值是对所有数据平均后计算的一般水平代表值,数据信息提取得最充分。

统计学简答题答案

1.“统计”一词有哪些含义?什么就是统计学? (1)统计工作或统计实践活动:对现象的数量进行搜集、整理与分析的活动过程 (2)统计资料:通过统计实践活动取得的说明对象某种数量特征的数据 (3)统计学:就是关于数据的一门科学 统计学就是一门收集、整理、显示与分析统计数据的科学,其目的就是探索数据内在的数量规律性。 2.一组数据的分布特征可以从哪几个方面进行测度? 一组数据的分布特征可以从以下三个方面进行测度: 集中趋势的测度(众数、中位数、分位数、均值、几何平均数、切尾均值) 离散程度测度(极差、内距、方差与标准差、离散系数) 偏态与峰度测度(偏态及其测度、峰度及其测度) 3.分布集中趋势的测度指标有哪些? 众数、中位数、分位数、均值、几何平均数、切尾均值 4.简述众数、中位数与均值的特点与应用场合。 众数最容易计算,但不就是永远存在,它不受极端值影响、具有不惟一性、作为集中趋势代表值应用的场合较少,数据分布偏斜程度较大时应用,在编制物价指数时,农贸市场上某种商品的价格常以很多摊位报价的中数值为代表。 中位数很容易理解、很直观,它不受极端值的影响,这既就是它有价值的方面,也就是它数据信息利用不够充分的地方; 均值就是对所有数据平均后计算的一般水平代表值,数据信息提取的最充分,数据对称分布或接近对称分布时应用,它在整个统计方法中应用最广,对经济管理与工程等实际工作也就是最重要的代表值与统计量。 5.分布离散程度的测度指标有哪些? 极差、内距、方差与标准差、离散系数 6、常用的概率抽样方法有哪些?各自的含义如何? (1)简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,使得每一个总体单位都有相同的机会(概率)被抽中,这样的抽样方式称为简单随机抽样。 (2)分层抽样:在抽样之前先将总体的单位按某种特征或某种规则划分为不同的层,然后从不同的层中抽取一定数量的单位组成一个样本,这样的抽样方式称为分层抽样。 (3)系统抽样:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。 (4)整群抽样:调查时先将总体划分成若干群,然后再以群作为调查单位从中抽取部分群,进而对抽中的各个群中所包含的所有个体单位进行调查或观察。 (5)多阶段抽样:先抽取群,但并不就是调查群内的所有单位,而就是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。 群就是初级抽样单位,第二阶段抽取的就是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样。 7、什么就是抽样分布? 就就是由样本n个观察值计算的统计量的概率分布。 8、什么就是匹配样本? 一个样本中的数据与另一个样本中的数据相对应,这样的样本称为匹配样本。 9、假设检验的思想以及假设检验中的两类错误就是什么? 假设检验的基本思想就是小概率反证法思想。小概率思想就是指小概率事件(P<0、01或P<0、

相关主题
文本预览
相关文档 最新文档