当前位置:文档之家› 统计简答题

统计简答题

统计简答题
统计简答题

简答题:

1、标准差和标准误有何区别与联系?它们各有什么用途?

①区别:标准差,是描述资料离散程度的指标;标准误,是说明均数抽样误差的大小的指标,它反映了样本均数间的离散程度,也反映了样本均数与总体均数间的差异。②联系:均数的标准误与标准差成正比,而与样本例数n的平方根成反比,若标准差固定不变,可通过增加样本含量来减少抽样误差。

③用途:标准差,用于描述一组资料的离散程度,还可用于估计正常参考值范围;标准误,用于描述资料的抽样误差的大小,还可用于估计资料的可信区间。

2、为什么要进行抽样研究?抽样时为什么会产生抽样误差?

抽样研究就是从总体中随机抽取一个样本,用样本的信息推断总体特征。因为个体变异的存在,随机抽样就会引起样本统计量与总体参数间的差异,就产生了抽样误差。在抽样研究中,抽样误差是不可避免的。

3、为什么要作r和b的假设检验?

r和b与其它统计量一样,即使从总体回归系数β和总体相关系数ρ中做随机抽样,由于抽样误差的存在,其样本回归系数b和样本相关系数r也不全为0,故求得一个样本回归系数和相关系数后,仍需进行回归系数β和相关系数ρ为0的假设检验。

4、两个样本率的u检验和四格表的x2检验有何异同?

区别:①两个样本率的u检验主要是通过在两个总体中分别进行抽样所得的样本率P1和P2来推断总体率л

1和л2是否相等。②四格表x 2检验是推断两个总体率或构成比是否有差别,两个分类变量间有无相关关系。

③x2检验可用于2×2列联表资料有无关联的检验。相同点:①两个样本率的u检验和四格表的x2检验关系:u2=x2即凡是能使用u检验进行两个率比较检验的资料,都可使用x2检验,两者是等价的。②二者都存在连续性校正的问题。

四格表的u检验和x2检验有何关系?当样本例数足够大时,x2检验的结论与产检验等效。

5、在进行直线回归分析时,应按哪些步骤进行,才不易犯统计学方向的错误?(直线回归分析中应注意的问题?)

①作回归分析一定要有实际意义;②回归分析之前首先应绘制散点图;③考虑建立线性回归模型的基本假定:理论上讲,按最小二乘估计回归模型应满足:线性、独立、正态和方差齐性(LINE)等条件;④取值范围,避免外延;⑤两变量间的直线关系不一定是因果关系,也可能是伴随关系。

6、什么叫抽样误差?如何度量抽样误差的大小?怎样减少抽样误差?

①由个体变异产生的,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。②抽样误差由标准误来表示,,越大,表明抽样误差越大;越小,抽样误差越小。③由标准误的公式可知,要减少抽样误差,只有增加样本含量。

7、LSD-t检验和Duncan检验和SNK-q检验都可用于均数间的多重比较,它们有何不同?

①q检验:用于多个样本均数间每两个作比较,公式为;②最小有意义差异法(LSD法):用于对照组与各处理组的比较,公式为;③新复极差法(Duncan新法):用于对照组与各处理组比较,公式为。

8、均数的可信区间和参考值范围有何不同?

区别点:均数的可信区间参考值范围

意义:按预先给定的概率确定的未知参数“正常人”的解剖、生理、生化

的可能范围,实际上一次抽样获得某项指标的波动范围。

的可信区间要么包括可信区间,要

么不包括。

计算公式:σ未知:正态分布:

σ已知或σ未知,n﹥50:偏态分布:

用途:估计总体均数。判断观察对象的某项指标正常与否。

9、X2检验的应用条件有哪些?

X2检验用来推断两个及两个以上总体率或构成比是否有差别,两个分类变量间有无相关关系,多个率的趋势检验,以及两个率的等效检验等。

10、参数检验与非参数检验的区别在何处?优缺点?(秩和检验的优缺点是什么?)

区别:①参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。②非参数检验:不依赖总体分布的具体形式和检验分布(如位置)是否相同。

优、缺点:①参数检验:优点是符合条件时,检验效率高;缺点是对资料要求严格,如等效数据、非确定数据(如﹥50mg),不能使用参数检验,而且要求资料的分布型已知和总体方差相等。

②非参数检验:优点是应用范围广、简便、易掌握;缺点是若对符合参数检验条件的资料用非参数检验,则检验效率底于参数检验。如无效假设是正确的,非参数检验与参数检验等同,但如果无效假设是错误的,

则非参数检验效果差,如需检验出同样大小的差异往往需要较多的资料。另一点是非参数检验统计量是近似服从某一分布,检验的界值表也是近似的(如配对秩和检验),因此其结果有一定近似性。

11、秩相关适用条件?

不服从双变量正态分布,不宜从而得知只矩相关分析的资料;总体分布型未知;原始数据用等级表示的资料。

12、均数、几何均数和中位数的适用范围是什么?

①均数:描述一组同质计量资料的平均水平,其分布特征为正态分布或近似正态分布,图形为单峰对称图型;②几何均数:描述原始观察值呈偏态分布,但经对数变换后呈正态分布或近似正态分布的资料或等比资料;③中位数:适用于偏态分布、分布不明的资料。

13、值变量资料频数表的组段是否越细越好?

不是。制作频数表是为了简化资料,显示出数据的分布规律,故组段不宜过多。组段过多,计算较繁,组段太少,则误差较大,会掩盖数据的分布规律,适宜的组段与观察值个数n有关,一般以10-15为宜。14、怎样正确使用单侧检验和双侧检验?

一种检验方法是用单侧还是双侧检验,若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果,拟用单侧检验;在尚不能从专业知识判断两种结果谁高谁低时,则用双侧检验,一般认为双侧检验较保守和稳定。

15、直条图、圆图、普通线图各适用于何种资料?

直条图(条图):适用于比较分析独立的或离散变量的多个组或多个类别的统计指标。圆图和百分比条图:适用于描述分类变量的各类别所占的构成比。普通线图(线图):适合于描述统计量随另一连续性数值变量变化而变化的趋势,常用于描述统计量随时间变化而变化的趋势。直方图:数值变量的频数分布。散点图:相关,双变量。箱式图:偏态分布的资料。统计地图:研究指标的地理分布。

16、对同一资料,又出自同一研究目的,用参数检验和非参数检验所得结果不一致时,宜以何者为准?

既不能一律宣称参数检验的结论可信轻易拒绝非参数检验的结果;也不能依哪个有显著性就选哪个;更不能随研究者主观愿望取舍检验的结果。要根据被处理资料是否满足该种检验方法的应用条件,在符合参数检验条件时,若两法检验结果不一致时,可接受参数检验的结论。以t检验为例,如总体分布为极度偏态或其它非正态形状,或者根本不知总体分布形状,此时若使用t检验,有关总体的基本假定得不到满足,故任何根据这些假定所进行的推断亦难达到准确,再用参数检验的界值判断检验假设就不适宜了。此时参数检验与非参数检验结果不一致,可接受非参数检验的结论。

17、1978年秋,某大学考生录取情况如下表。有人据此批评说:“该大学考生录取百分率男生明显高于女生。”校方不同意此看法,但找不到依据。你能用统计学方法协助解决以上争议吗?(不必计算)

是由于6个专业考生男女构成比不同。应先将6个专业的男女生选定统一标准进行标化,标化之后再求录取率才具有可比性。

18、贝努利试验序列的条件/特点是什么?(服从二项分布的条件是什么?)

①每次试验的结果只能是两种互斥结果中的一种(A或者非A);②各次试验的结果互不影响,即各次试验独立;③在相同试验条件下,各次试验中出现某一结果A具有相同的概率л(非A的概率为1-л)。

二项分布的应用:样本率及其概率分布列;总体率的区间估计;单个总体率的假设检验;两个总体率的假设检验。

19、相关系数和回归系数有什么区别和联系?

区别:①资料要求上:回归要求因变量Y服从正态分布,X是可以精确测量和严密控制的变量,称Ⅰ型回归;相关要求两个变量X、Y服从双变量正态分布,这种资料若进行回归分析称为Ⅱ型回归。②应用上:说明两变量间依存变化的数量关系用回归;说明变量间的相关关系用相关。③意义上: b表示X第增(减)一个单位,Y平均改变b个单位;r说明具有直线关系的两个变量间相关关系的密切程度与相关方向。④计算上:b= ,r= 。⑤取值范围:;。⑥单位:b有单位,r没有单位。

联系:①对一组数据若同时计算b和r,它们的正负号一致。②b和r的假设检验是等价的。③用回归解释相关,回归平方和越接近总平方和,则r2越接近1,说明引入相关的效果越好。

20、多个样本均数间的比较为什么不能用t检验?(有人说,多个样本均数间的比较无非就是做若干次的t检验,您的看法如何?)

多个样本均数间的比较如果用t检验,会增加犯第一类错误的概率,即可能把本来无差别的两个总体均数判为有差别。

21、t检验要求什么基本条件?

σ未知且n较小时,要求样本来自正态分布总体;两样本均数比较时,还要求两样本所属总体的方差相等。u检验的应用条件:σ未知但n足够大(如n﹥100)或σ已知。

22、同一资料的标准差是否一定小于均数?

不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。变异大,标准差就大,有时比均数大;变异小,标准差小。

23、极差、四分位间距、标准差、变异系数的适用范围有何异同?

相同点:四者都是描述资料的离散趋势的指标。

不同点:极差是最简单又较粗略的指标,可以用于各种分布的资料,常用于描述单峰对称分布小样本资料的变异程度或用于初步了解资料的变异程度。四分们间距常用于描述偏态分布资料,两端无确切值或分布不明确资料的离散程度。标准差描述对称分布,特别是正态分布或近似正态分布资料的离散程度。变异系数,为标准差与均数之比,用于比较计量单位不同的几组资料的离散程度或均数相差悬殊的几组资料的离散程度。

24、用什么方法考察回归直线图示是否正确?

①直线必须通过点(,)。②若纵横坐标无折断号时,将直线左端延长与纵轴相交,交点的纵从标必等于截距α。③直线是否在自变量X的实测范围内。

25、r与rs的应用条件有何不同?

积差相关系数r用于描述双变量正态分布资料的相关关系。

等级相关系数rs适用于下列资料:①不服从双变量正态分布而不宜作积差相关分析的资料。②总体分布型未知的资料。③原始数据是用等级表示的资料。

26、直线回归分析时怎样确定因变量和自变量?

Ⅰ型回归中,X为精密测定和严格控制的变量,Y为正态变量;Ⅱ型回归中,X、Y均服从正态分布。何者为X,何者为Y,根据研究目的确定。

27、中位数与百分位数在意义上、计算和应用上有何区别与联系?

①意义:中位数是百分位数中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位数是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。②计算:中位数和百分位数均可用同一公式计算,可根据研究目的选择不同的百分位数代入公式进行计算分析。③应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中更为常用。百分位数还可用来描述变量值的离散趋势(四分位数间距)。

28、测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?

①样本含量的大小,样本含量大,标准差越稳定。②分组的多少。③分布形状的影响,偏态分布的标准差较近似正态分布大。④随机测量误差大小的影响。⑤研究总体中观察值之间变异程度的大小。

29、正态分布、标准正态分布与对数正态分布在概念上和应用上有何异同?

①概念上:相同点:三者都是变量的连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。相异点:表示方向不同,正态分布用N(μ,б2)表示,标准正态分布用N(0,1)表示,对数正态分布用N()表示。②应用上:相同点:正态分布、对数正态分布都可以转换为标准正态分布。相异点:标准正态分布是标准正态变量μ的分布,标准正态曲线下的面积唯一的由μ决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。

30、医学中参考值范围的含义是什么?确定的原则和方法是什么?

①含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解剖、生理、生化等各种数据绝大多数人的波动范围。

②原则:⑴抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结果越可靠。一般认为样本含量最好在100例以上,以能得到一个分布较为稳定的样本为原则。⑵对选定的正常人进行准确而统一的测定,保证测定数据可靠是确定正常值范围的前提。⑶判定是否要分组(如男女、年龄、地区等),确定正常值范围。⑷决定取双侧范围值还是单侧范围值。⑸选择适当的百分范围。⑹确定可疑范围。⑺估计界值。③方法:⑴百分位数法:⑵正态分布法(对数正态分布法):双侧

单侧百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近似正态分布(服从对数正态分布)的资料。

31、对称分布资料在“均数 1.96倍标准差“的范围内,也包括95%的观察值吗?

不一定。均数 1.96倍标准差是正态分布的分布规律,对称分布不一定是正态分布。

32、常用的相对数指标有哪些?它们的意义和计算上有何不同?为什么不能以比代率?请联系实际加以说明。

常用的相对数指标有:率、构成比和相对比。意义和计算公式如下:①率又称频率指标,它说明某现象发

生的频率和强度。常用百分率、千分率、万分率或十万人率等表示,公式为:率=某时间内实际发生某现象的观察单位数/同时期可能发生某现象的观察单位总数×K。例如,某病患病率常用百分率或千分率,婴儿死亡率常用千分率,死因别死亡率常用十万分率等。②构成比说明事物内部各部分所占的比重。常用百分数表示,公式为:构成比=某一组成部分的观察单位数?同一事物各组成部分的观察单位总数×100%。例如脑血管疾病在某地5咱慢性疾病的构成比为(3805/7896)×100%=48.19%,心血管疾病占该5种慢性病总数的比重为(1365/7896)×100%=17.29%。③相对比说明一个指标是另一个指标的几倍或几分之几。两个指标可以是绝对数、相对数或平均数;可以性质相同,例如不同年份某地某病死亡率之比,也可以性质不同,例如某医院医护人员数与病床数之比。公式为:相对比=甲指标/乙指标(或×100%)

构成比与率所说明的问题是不同的,构成比说明事物内部各部分所占的比重,不能说明某再象的发生强度或频率大小。因此,在分析时不能用构成比代替率。

33、应用相对数的注意事项?

①计算相对数尤其是率时应有足够数量的观察单位数或观察次数②分析时不能以构成比代替率③应分别将分子和分母合计求合计率或平均率④相对数的比较应注意其可比性⑤样本率或构成比比较时应作假设检验。⑥两个总体率进行比较时,要注意使用率的标准化法。

34、非参数检验适用哪些情况?

①等级顺序资料。②偏态分布。当观察资料呈偏态或极偏态分布而又未经变量变换,或虽经变量变换但仍未达到正态分布或近似正态分布时,宜用非参数检验。③未知分布型资料。④要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。⑤初步分析,有些医学资料由于统计工作量过大,可采用非参数统计方法时行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容。⑥对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。

35、可信区间和参考值范围有何不同?

参考值范围是指同质总体中个体变量值的分布范围。而可信区间是指在可信度为(1—α)时,估计总体参数可能存在的范围。

36、假设检验和区间估计有何联系?

二者都属于统计推断的内容,假设检验推断总体参数间是否有质的区别,并可获得样本统计量,以得到相对精确的概率值。而可信区间用于推断总体参数的大小,它不仅可用以回答假设检验的问题,尚可比假设检验提供更多的信息。但这并不意味着用可信区间代替假设检验,因为假设检验可得到P值,比较精确地说明结论的概率保证,而可信区间只能告诉我们在某α水准上有无统计意义,却不能像P那样提供精确的概率。因此,只有二者有机结合起来,互相补充,才是完整的分析。

37、假设检验时,一般当P<0.05时,则拒绝H0,理论依据是什么?

其理论依据是:在H0成立的条件下,出于大于、等于现有检验统计量的概率P<0.05,它是小概率事件,即在一次抽样中得到这么小概率的事件是不大可能发生的,因而拒绝它。由此可见,假设检验的结论是具有概率性的,它存在犯错误的可能性小于等于0.05。

38、t检验和方差分析应用条件有何异同?

①相同点:在均数比较中, t检验和方差分析均要求各样本来自正态总体;各处理组总体方差齐且各随机本间相互独立,尤其在小样本时更需注意。②不同点:t检验仅用于两组资料的比较,除双侧检验外,尚可进行单侧检验,亦可计算一定可信度的可信区间,提示差别有无实际意义。而方差分析用于两组及两组以上均数的比较,亦可用于两组资料的方差齐性检验。

39、第一类错误与第二类错误的区别及联系何在?了解两类错误的实际意义?

区别:①Ⅰ型错误:指拒绝了实际上成立的H0,即“弃真”的错误。Ⅰ型错误的概率用а表示。统计推断时,根据研究者的要求来确定。②Ⅱ型错误:指接受了实际上不成立的H0,即“存伪”的错误。Ⅱ型错误的概率用β表示。β值的大小很难确切估计,只有在已知样本含量n、两总体参数差值δ以及所规定的检验水准а的条件下,才能估算出β值的大小。

联系:①当抽样例数一定时а越大,β越小;反之,а越小,β越大。②统计推断中,Ⅰ、Ⅱ型错误均有可能发生,若要使两者都减小,可适当增加样本含量。③根据研究者要求,n一定时,可通过确定а水平来控制β的大小。

意义:①可用于样本含量的估计。②可用来计算可信度(1—а),表明统计推断可靠性的大小。③可用于计算把握度(1—β),来评价检验方法的效能等。④有助于研究者选择适当的检验水准。⑤可以说明统计结论的概率保证。

40、如何合理设置检验水准?

根据研究目的,结合专业知识和研究设计要求,在未获得样本信息之前决定,而不应受到样本结果的影响。一般在差别的假设检验中,若重点减小Ⅰ型错误,可取较小的а值,常用а=0.05,а=0.01;若重点减小Ⅱ型错误,可取较大的а值,常用а=0.10,а=0.20。

41、检验假设中а和P的区别何在?

以t检验为例,а和P都是用t分布尾部面积大小表示,所不同的是:а值,即检验水准,是指在统计推断时,预先设定的一个小概率值,就是说如果H0是真的,允许它错误地被拒绝的概率。P值是由实际样本规定的,它给人的概念是实际资料怎样与H0相矛盾,P值是指在H0成立的前提下,出现等于或大于现有检验统计量的概率。

根据P与а的关系来决定对H0的取舍,做出统计推断的结论。

42、配对比较的t检验与配伍组比较的方差分析之间的关系如何?两样本均数比较的t检验与成组设计多个样本均数比较的方差分析之间的关系如何?

配伍组比较的方差分析是配对比较t检验的推广,它们的基本原理相同。成组设计多个样本均数比较的方差分析是两样本均数比较的t检验的推广,当两组比较时,它们是等价的。不管配伍组还是成组设计,当对比样本为两组,可用t检验或方差分析,当对比样本在两组以上,只能用方差分析,而不能用t检验。

43、要使直线回归方程稳定性好,应当怎样做?

回归方程的稳定程度决定于b的波动大小,即S b的大小,S b的大小不仅取决于表示随机因素对Y影响程度的S Y,X,而且取决于观测数据中X的波动范围及样本含量n的大小,S Y,X越小,建立方程时X的取值范围越大,样本含量n越大,则b越稳定,从而此回归方程也越稳定。

44、相关分析应用中应注意的问题?

①相关分析资料要求x,y都应是来自双变量正态总体的随机变量。②进行相关分析前,应先绘制散点图。只有散点图有线性趋势时,才可进行相关分析。③满足应用条件的同一份双变量资料,回归系数b与相关系数r的正负号一致,假设检验等价。欲解释两变量间依存变化的数量关系,只能采用回归分析。④相关分析时,小样本资料经t检验只能推断两变量间有无直线关系,而不能推断其相关的密切程度。要推断两变量间相关的程度,样本含量必须足够大。尤应注意,若两变量间相关系数r具有统计学意义,但r2较小时,下结论要慎重。

45、直线回归的应用?

①直线回归方程可用来描述两分析变量间依存变化的数量关系②利用回归方程进行预测预报③用容易测量的指标估计不易测量的指标④利用回归方程获得精度更高的医学参考值范围⑤利用回归方程进行统计控制。

46、等效检验应注意的问题?

①等效检验目的在于推断两总体率是否等效,须在试验设计时规定检验水准а②两样本率比较的等效检验,两样本率差值必须小于等效界值Δ,Δ值最大不应超过对照组样本率的20%。

47、Poisson分布的性质?

Poisson分布的方差等于均数,即б2=μ;Poisson分布的可加性。

48、Poisson分布的应用条件?

凡具有同努利试验序列3个特点且л很小,n很大时,其相应的变量一般可认为服从Poisson分布。

49、行×列表X2检验注意事项?

①计算X2值时,必须用绝对数,不能用相对数。②X2检验要求理论频数不宜太小。对于理论频数太小的处理方法:⑴最好增大样本容量,以达到增大理论频数的目的⑵删去理论频数太小的格子所对应的行或列,但这样会损失信息,损害样本的随机性⑶将理论频数太小的行或列与性质相近的邻行或列中的实际频数合并,使重新计算的理论频数增大。(损失的信息比第2种方法小一些)。③关于单向有序行列表,应用秩和检验或Ridit检验。④当多个样本率(或构成比)比较的X2检验,结论为拒绝检验假设,只能认为各总体率之间总的来说有差别,但不能说明它们彼此之间都有差别,或某两者间有差别。

50、应用标准化法的注意事项?

①标准化率是通过选择同一参照标准而计算的,目的是为了消除因年龄构成不同等混杂因素的影响,从而达到可比性。但标准化率不代表真正的死亡(或患病、发病)率水平。②样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,同样需要做假设检验。③一般情况下,在已知被标化组各年龄组死亡率时,宜采且直接法计算标准化率。④当所比较的两组内部各分组率的变化呈现交叉或非平行变化趋势时,不宜采用标准化法。

目的:在于控制混杂因素对研究结果的影响。

51、假设检验的步骤?

①建立检验假设,确定检验水准②计算检验统计量③确定P值,作出统计推断。

统计学简答题及答案

统计学简答题及参考答案 1.简述描述统计学的概念、研究容与目的。 概念:它是研究数据收集、整理和描述的统计学分支。 研究容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。 研究目的:描述数据的特征;找出数据的基本数量规律。 2.简述推断统计学的概念、研究容与目的。 概念:它是研究如何利用样本数据来推断总体特征的统计学分支。 研究容:参数估计和假设检验的理论与方法。 研究目的:对总体特征作出统计推断。 3.什么是总体和样本? 总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。 可分为有限总体和无限总体: ?有限总体的围能够明确确定,且元素的数目是有限的,可数的。 ?无限总体所包括的元素数目是无限的,不可数的。 总体单位数可用N表示。 样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n。 4.什么是普查?它有哪些特点? 普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点: 1)通常是一次性或周期性的 2)一般需要规定统一的标准调查时间 3)数据的规化程度较高 4)应用围比较狭窄。 5.什么是抽样调查?它有哪些特点? 抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。 它具有经济性好、时效性强、适应面广、准确性高等特点。 6.简述统计调查方案的概念及应包括的基本容。 答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。 它应包括的基本容有: 〈1〉明确调查目的; 〈2〉确定调查对象和调查单位; 〈3〉设计调查项目; 〈4〉设计调查表格和问卷; 〈5〉确定调查时间; 〈6〉组织实施调查计划; 〈7〉调查报告的撰写,等等。 7.简述统计分组的概念、原则和具体方法。 答:(1)概念

统计学经典题库与答案

2. 数据筛选的主要目的是( A 、发现数据的错误 C 、找出所需要的某类数据 3. 为了调查某校学生的购书费用支出, B 、对数据进行排序 D 纠正数据中的错误 将全校学生的名单按拼音顺序排列后,每 ) A H 0:二=0.15;二-0.15 B H o :二二 0.15;二=0.15 C H 0: 一 - 0.15;二:: 0.15 D H 0:二乞 0.15;二 0.15 9. 若甲单位的平均数比乙单位的平均数小, 大,则( )。 A 、甲单位的平均数代表性比较大 C 甲单位的平均数代表性比较小 10. 某组的向上累计次数表明( A 、 大于该组上限的次数是多少 B 、 小于该组下限的次数是多少 但甲单位的标准差比乙单位的标准差 B 、两单位的平均数一样大 D 、无法判断 1.当正态总体方差未知时,在大样本条件下,估计总体均值使用的分布是 ( A )。 z 分布 B 、t 分布 F 分布 D 、 2 分布 A 、比平均数高出2个标准差 C 等于2倍的平均数 D 5.峰态通常是与标准正态分布相比较而言的。 则峰态系数的值( )。 B 比平均数低2个标准差 等于2倍的标准差 如果一组数据服从标准正态分布, A =3 C 、v 3 6. 若相关系数r=0,则表明两个变量之间( A 、相关程度很低 C 不存在任何关系 7. 如果所有变量值的频数都减少为原来的 1/3, 均数( )。 A 、不变 B C 减少为原来的1/3 D > 3, =0 )。 不存在线性相关关系 存在非线性相关关系 而变量值仍然不变,那么算术平 扩大到原来的3倍 不能预测其变化 8. 某贫困地区所估计营养不良的人高达 15%然而有人认为这个比例实际上还要 高,要检验该说法是否正确,则假设形式为( )。 隔50名学生抽取一名进行调查,这种调查方式是( A 、简单随机抽样 B 、分层抽样 C 、系统抽样 D 、整群抽样 4. 如果一组数据标准分数是(-2 ),表明该数据( )。

统计学简答题完整版

一、统计的含义和本质是什么P2 含义:“统计”一词可以有三种含义:统计活动、统计数据和统计学。统计活动是对各种统计数据进行搜集、整理并做出相应的推断、分析的活动,通常被划分为统计调查、统计整理和统计分析三个阶段;统计数据是通过统计活动获得的、用以表现研究现象特征的各种形式的数据;统计学则是指导统计活动的理论和方法,是关于如何搜集、整理和分析统计数据的科学。 本质:统计的本质就是关于为何统计,统计什么和如何统计的思想。 二、统计数据有哪些分类不同类型数据有什么不同特点P7 1.统计数据按照所采用的计量尺度不同,可以分为定性数据与定量数据。定性数据是指只能用文字或数字代码来表现事物的品质特征或属性特征的数据,具体又分为定类数据与定序数据两种。定量数据是指用数值来表现事物数量特征的数据,具体又分为定距数据与定比数据两种。 2.统计数据按照其表现形式不同,可以分为绝对数、相对数和平均数。绝对数是用以反映现象或事物绝对数量特征的数据,有明确的计量单位。相对数是用以反映现象或事物相对数量特征的数据,它通过另外两个相关统计数据的对比来体现联系关系。平均数是用以反映现象或事物平均数量特征的数据,体现现象某一方面的一般数量水平。 3.统计数据按照其来源不同,可以分为观测数据与实验数据两类。观测数据是通过统计调查或观测的方式而获取的反映研究现象客观存在的数量特征的数据。实验数据是在人为控制的条件下,通过实验的方式而获得的关于实验对象的数据。 4.统计数据按照其加工程度不同,可以分为原始数据与次级数据两类。原始数据是指直接向调查对象搜集的、尚待加工整理、只反映个体特征的数据。次级数据也称为加工数据或二手数据,是指已经经过加工整理、能反映总体数量特征的各种非原始数据。 5.统计数据按照其时间或空间状态不同,可以分为时序数据与截面数据。时序数据是对同一现象在不同时间上搜集到的数据(即空间状态相同,时间状态不同)。截面数据是对一些同类现象在相同或近似相同的时间上搜集到的数据(即空间状态不同,时间状态相同)。 三、总体和样本概念以及它们之间的关系如何P14 概念:总体,就是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体。样本,就是从总体中抽取的一部分个体所组成的集合。 关系:1.总体是所要研究的对象,而样本则是所要观测的对象,样本是总体的代表和缩影。 2.样本是用来推断总体的。对样本进行观测的目的是要对总体数量特征做出估计或判断,即通常所说的以样本推断总体。 3.总体和样本的角色是可以改变。随着考察角度的改变,一定的研究总体也可成为另一意义上总体的一个样本,这说明总体与样本的角色是可以改变的。 四、标志和指标之间的关系如何P17 区别:1.指标和标志说明的对象不同,指标说明总体的特征,标志则说明个体的特征。 2.指标和标志的表现形式不同,指标是用数值来表现的,而标志则既有只能用文字来表现的品质标志,又有用数值来表现的数量标志。 联系:1.标志是计算统计指标的依据,即统计指标数值是根据个体的标志表现综合而来的。 2.由于总体与个体的确定是相对的、可以换位的,因而指标与标志的确定也是相对的、可以换位的。 五、统计数据收集方案包括哪些内容P25 数据收集目的(why)、数据及其类型(what type)、数据收集对象与观测单位(whom)、观测标

统计学试卷及答案

统计学试卷及答案 一、判断题 1.统计学是一门方法论科学,其目的是探索数据的内在数量规律性,以达到 对客观事物的科学认识。() 2.统计研究的过程包括数据收集、数据整理、分析数据和解释数据四个阶段。 () 3.统计数据误差分为抽样误差和非抽样误差。() 4.按所采用的计量尺度不同,可以将统计数据分为时间序列数据和截面数据() 5.用来描述样本特征的概括性数字度量称为参数。() 6.如果数据呈左偏分布,则众数、中位数和均值的关系为:均值<中位数< 众数。() 7.通过散点图可以判断两个变量之间有无相关关系。() 8.所有可能样本均值的数学期望等于总体均值。() 9.影响时间序列的因素可分为:长期趋势、季节变动、循环波动和不规则变 动四种。() 10.狭义的统计指数是用来说明那些不能直接加总的复杂现象综合变动的一 种特殊相对数。() 二、单项选择题 1.为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中样本是()。 A 100所中学 B 20个城市 C 全国的高中生 D 100所中学的高中生 2.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2005年城镇家庭的人均收入数据。这一数据属于()。 A 分类数据 B 顺序数据 C 截面数据 D 时间序列数据

3.某连续变量数列,其首组为50以下。又知其邻近组的组中值为75,则首组的组中值为() A 24 B 25 C 26 D 27 4.两组数据相比较()。 A 标准差大的离散程度也就大 B 标准差大的离散程度就小 C 离散系数大的离散程度也就大 D 离散系数大的离散程度就小 5.在下列指数中,属于质量指数的是()。 A 产量指数 B 单位产品成本指数 C 生产工时指数 D 销售量指数 6.定基增长速度与环比增长速度的关系为()。 A 定基增长速度等于相应的各个环比增长速度的算术和 B 定基增长速度等于相应的各个环比增长速度的连乘积 C 定基增长速度等于相应的各个环比增长速度加1后的连乘积再减1 D 定基增长速度等于相应的各个环比增长速度的连乘积加1(或100%) 7.某企业报告期产量比基期增长了10%,生产费用增长了8%,则其产品单位成本降低了()。 A 1.8% B 2.5% C 20% D 18% 8.用简单随机重复抽样方法抽取样本单位,如果要使抽样标准差降低50%,在其他条件不变的情况下,则样本容量需要扩大到原来的()。 A 2倍 B 3倍 C 4倍 D 5倍 9.如果变量x和变量y之间的相关系数为﹣1,这说明两个变量之间是()。 A 低度相关关系 B 完全相关关系 C 高度相关关系 D 完全不相关 10.合理施肥量与农作物亩产量之间的关系是()。 A 函数关系 B 相关关系 C 没有关系 D 正比例关系 11.在回归分析中,描述因变量y如何依赖自变量x和误差项 的方程称为()。 A 回归方程 B 回归模型 C 估计的回归方程 D 理论回归方程 12.平均指标是用来反映一组数据分布的()的指标。

统计学简答题整理

统计学简答题整理 第一章P11 1.获取直接统计数据的渠道主要有哪些?及区别在于? 普查、抽样调查 普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大,间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。 抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差,但统计方法可以估计出误差的大小进一步控制误差;节省人力、财力、物力,又能保证实效性 2.简要说明抽样误差和非抽样误差。 非抽样误差是由于调查过程中各有关环节工作失误造成的。(它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差,还有一种人为干扰造成的误差即有意瞒报或低报数据等)。非抽样误差在普查、抽样调查中都有可能发生,但可以避免。 抽样误差是利用样本推断总体时产生的误差。(由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制)。抽样误差与样本量的平方根成反比关系。 第二章P51

1.统计的计量尺度 ①列名尺度(定类尺度):是按照某一品质标志将总体分组之后,对属性相同的单位进行计量的方法。各组之间的关系是并列的,没有大小、高低、先后之别。 ②顺序尺度(定序尺度):是按照某一品质标志将总体分组,对等级相同的单位进行计量的方法。各组之间的关系是有顺序的,可以进行排序。 ③间隔尺度(也称定距尺度):是按某一数量标志将总体分组,对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序,还可以计算不同数值之间的绝对差距。 ④比例尺度(也称定比尺度):是类似于间隔尺度,又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异,还可以计算数值的相对差异。 2.简述统计分组的概念和作用。 概念:统计分组是根据统计研究目的,选择一定的分组标志,将总体划分为若干组的统计方法。其目的是使组与组有明显差别,同一组中具有相对的同质性。(例:人口按性别、年龄、民族、职业分组;企业按规模分为大型、中型和小型。) 作用:1.划分社会经济现象的类型 2.反映总体的内部结构 3.分析现象之间的依存关系 3.简述众数、中位数和均值的特点与应用场合。 众数是总体中出现次数最多的标志值。反映了标志值分布的集中趋势,是一种由位置决定的平均数。可以没有众数也可有两个。

统计学简答题答案资料讲解

1、什么是统计学,有哪些特点? 统计学是收集、整理、分析、解释数据并从数据中得到结论的学科。 特点:客观性~~相关性~~实用性~~科学性~~严谨性~~逻辑性~~~ 2、何谓标志,按能否用数量表示可以分为哪两种类型,分别举例说明 标志是指说明总体单位属性或特征的名称。可以分为数量标志和质量标志 品质标志:说明总体单位属性特征的名称,用文字描述。Ex:性别,名族,工种,籍贯数量标志:说明总体单位数量特征的名称,用数量表示。数量标志的具体表现称标志值。 Ex:工人的年龄,工资,工龄 3、什么是离散型变量,连续性变量?举例说明 变量:可变的数量标志和指标; 离散型变量:指变量的数值只能以计数的方法取得,(变量值只能取整数); 连续型变量:指变量的取值连续不断,(变量值能取小数)。 4、简述品质标志和数量标志的区别,并举例说明。 区别:数量标志说明的是总体的数量特征,而品质标志说明的是总体的属性特征。 5、什么是数量指标和质量指标?二者有何关系? 统计指标:反映总体数量特征的科学概念和具体数值。 注意:从理论上讲,一个完整的统计指标由两部分构成:指标名称+指标数值 例如:某地区2009年完成利税总额(指标名称)为1500(指标数值)亿元。 数量指标:用来反映现象的总规模、总水平、或工作总量的指标。其数值大小随总体的研究范围的大小而增减。 质量指标:反映客观现象的劳动效果或工作质量等事物内部数量关系的指标,其数值的大小与总体的研究范围大小无直接联系。 6、统计标志和统计指标有和联系与区别? 区别:1、标志是反映总体单位特征;指标反映总体特征。 2、指标都能用数量表示,标志只有数量标志能用数量表示; 3、标志是一个理论概念,实际应用中只有指标。 联系:1、标志与指标可以相互转化,随研究目的的转化而改变; 2、指标值一般是标志值汇总来的; 3、标志的名称常常就是指标名称。 7、制定一份完整的统计调查方案,应包括哪些内容? 1)明确调查的目的和任务 2)确定调查的对象和调查单位、 3)确定带调查项目、设计调查表或问卷 4)确定调查时间、调查地点和调查方式方法 5)制定调查的组织实施计划 8、举例说明重点调查的概念和特点 重点调查:是在调查对象范围内部选择部分重点调查单位进行的调查。 特点:调查单位少、适用于调查对象的标志值比较集中于某些单位的场合、重点调查的调查方式主要采取专门调查的组织形式(一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。);有点在于花费较少的人力物力和时间就可以获得总体的基本情况资料。 9、简述重点调查、典型调查、抽样调查的联系与区别P31 抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。

大学统计学简答题复习及答案

习题一总论 1?简述统计总体和总体单位的含义及其关系。 统计总体(简称总体)是指统计所研究的事物的全体,它是由客观存在的具有某种共同性质的许多个别事物组成的集合体。总体单位是指构成统计总体的个别事物,是组成总体的基本单位,简称个体。统计总体和总体单位所指的具体内容不是固定不变的,而是随着研究的目的不同而变化的。总体可以变为总体单位,总体单位可以变为总体。 2 ?什么是指标和标志?指标与标志的关系如何? 指标即统计指标,指反映统计总体综合数量特征的概念和数值。标志指说明总体单位特征的名称。指标与标志的区别:①指标是说明总体特征的,而标志是说明总体单位特征的;②所有指标都能用数值表示,而标志中的数量标志能用数值表示,品质标志却通常不能用数值表示。指标与标志的联系:①指标是对总体中各单位标志表现进行综合的结果,有许多统计指标其数值是由数量标志值汇总而来的,品质标志本身虽无数值,但许多指标却是按品质标志分组计算出来的。②指标和数量标志之间存在着变换关系,由于研究目的的变化,原来的总体变成总体单位,则相对应的统计指标就变成数量标志;反之,则相对应的数量标志就变成了统计指标。 习题二统计调查 1.完整的统计调查方案应包括哪些主要内容? 应包括:①确定调查目的;②确定调查对象和调查单位;③确定调查内容,拟订调查表;④ 确定调查时间和调查期限;⑤确定调查的组织和实施计划。 2.调查对象、调查单位和填报单位有何区别? 调查对象是指根据调查目的确定的需要进行调查研究的现象总体,它是由性质相同的许多个别单位组成的。调查单位是指调查对象中所要调查的具体单位,它是进行登记的标志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,它与调查单位有时一致,有时不一致。 3?重点调查与典型调查的区别是什么? 主要区别表现在两个方面: ①典型单位和重点单位性质不同。典型调查强调被选单位在同类社会经济现象中所具有的代表性、典型性,是有 意识地选取的;而重点调查则强调被选单位某标志值在总体标志值总和中所占的比重较大,是客观存在的。 ②侧重点不同。典型调查的主要目的是认识事物本质特征及其发展规律,调查深入细致,同时也注重定性调查; 而重点调查的目的主要是掌握总体的数量状况,着眼于普遍情况,注重量的调查。

统计学原理简答题汇总

统计学原理简答题汇总 一说到统计学原理简答题,大家都会连声抱怨:好多内容要背啊,好难背啊,不过一切抱怨过后还是要继续努力。我个人觉得,统计学原理简答题还是以理解为主,只要大概意思有了,那就已经是很不错的了。 1.品质标志与数量标志有什么区别? 答:统计标志通常分为品质标志和数量标志两种。品质标志表明总体单位属性方面的特征,其标志表现只能用文字表示,如学生的性别、职工的文化程度等,品质标志不能直接汇总为统计指标,只有对其标志表现所对应的单位进行汇总综合才能形成统计指标即总体单位总量;数量标志则表明总体单位的数量特征,其标志表现用数值来表示,即标志值,如学生的成绩、职工的工资等,它们从不同方面体现出总体单位在具体时间、地点条件下运作的结果。数量标志值可直接汇总综合出数量指标。 2.举例说明统计标志与标志表现有何不同? 答:标志是总体中各单位所共同具有的某特征或属性,即标志是说明总体单位属性和特征的名称。标志表现是标志特征在各单位的具体表现,是标志的实际体现者。例如:工人的“工资”是标志,而工资为“1200”分,则是标志表现。 3.一个完整统计调查方案应包括哪些主要内容? 答:一个完整的统计调查方案包括发下主要内容:(1)确定调查目的;(2)确定调查对象和调查单位;(3)确定调查项目,拟定调查表;(4)确定调查时间和时限;(5)确定调查的组织和实施计划。 4.举例说明如何理解调查单位与填报单位的关系? 答:调查单位是调查项目的承担者,是调查对象所包含的具体单位;填报单位是负责向上提交调查资料的单位。两者在一般情况下是不一致的。例如:对工业企业生产设备进行普查时,调查单位是每一台工业生产设备,而填报单位是每一个工业企业。但调查单位和填报单位有时又是一致的。例如:对工业企业进行普查时,调查单位是每一个工业企业,而填报单位也是每一个工业企业,两者一致。 5.调查对象、调查单位和填报单位有何区别? 答:调查对象是应搜集其资料的许多单位的总体;调查单位是构成调查对象的每一个单位,它是进行登记的标志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,一般是基层企事业组织。 6.简述什么是普查及普查的特点。 答:普查是专门组织的、一般用来调查属于一定时点上社会经济现象数量的全面调查。例如:人口普查、经济普查、基本生产单位普查等。 普查的特点:(1)普查是一种这连续调查。(2)普查是一种全面调查。(3)普查能解决全面统计报表不能解决的问题。(4)普查要耗费较大的人力、物力和时间,因而不能经常进行。 7.简述变量分组的种类及应用条件。 答:变量分组包括单项式分组和组距式分组。离散变量变动幅度小,分组可以选择单项式分组。如果离散变量的变动幅度较大,分组应该选择组距式分组。而对于连续变量只能用组距式分组。 8.某地区对占该地区工业增加值三分之二的10个企业进行调查,你认为这种调查方式是重点调查还是典型调查?为什么? 答:首先,从该题内容可知该地区对工业企业进行的是一种非全面调查;第二,非全面调查包括抽样调查、重点调查和典型调查。这三种非全面调查的主要区别是选择调查单位的方法不同,抽样调查是按随机原则抽选单位,重点调查是根据单位标志总量占总体标志总量的比重来确定调查单位,而典型调查是依据对总体的分析,有意识地选取调查单位。因此,

统计学简答题参考答案

统计学简答题参考答案 第一章绪论 1.什么是统计学?怎样理解统计学和统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学和统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。2.简要说明统计数据的来源。 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差。 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.解释描述统计和推断统计的概念?(P5) 答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。第二章统计数据的描述 1描述次数分配表的编制过程。 答:分二个步骤: (1)按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组和组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。 统计分组应遵循“不重不漏”原则 (2)将数据分配到各个组,统计各组的次数,编制次数分配表。 2. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 3.怎样理解均值在统计中的地位? 答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。 4. 简述众数、中位数和均值的特点和使用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,使用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。5.为什么要计算离散系数?

统计学简答题(完全)

简答题 1.一个完整的统计调查方案包括哪些主要内容 (1)确定调查目的。 (2)确定调查对象和调查单位。 (3)确定调查项目,拟定调查表。 (4)确定调查时间和时限。 (5)确定调查的组织和实施计划。 2.简述品质标志与数量标志的区别。 品质标志表明总体单位属性方面的特征,其标志表现只能用文字来表示。 品质标志本身不能直接汇总为统计指标,只能对其标志表现所对应的单位进行汇总综合才能形成统计指标即总体单位总量。 数量标志表明总体单位数量方面的特征,其标志表现可用数值表示,即标志值。 数量标志值可直接汇总综合出数量指标。 3.时期指标有什么特点 (1)时期指标的数值是连续计数的,表示现象在一段时期内发生的总量; (2)时期指标具有累加性; (3)时期指标数值的大小与时间长短直接相关,时期越长,时期指标数值就越大。 4.影响抽样平均误差的因素有哪些 (1)总体各单位标志的变动程度(总体内部差异程度); (2)抽样单位数的多少; (3)抽样组织方式; (4)取样方法(重复抽样或不重复抽样)。 5.品质标志与质量指标有何区别和联系 区别:品质标志说明总体单位的属性特征,只有名称,没有数值;而质量指标是统计指标中的一种,是说明统计总体特征的综合性数值,由指标名称和指标数值两个部分组成。 联系:品质标志与质量指标之间本身没有直接的关系只是在进行统计分析时,可以利用按某一品质标志分组的资料,计算各组某种质量指标,研究这种质量指标在各组之间的变动规律,这时两者之间便产生了一定的联系。 6、时期指标与时点指标有何区别 (1)时期指标反映现象在一段时期内发展过程的总数量 时点指标表示现象处在某一时刻上的状态 (2)时期指标可以累计相加; 时点指标则不能 (3)时期指标数值的大小与计算时期长短有直接关系; 时点指标数值的大小与时间间隔长短没有直接关系

统计学简答题整理精编版

统计学简答题整理 GE GROUP system office room 【GEIHUA16H-GEIHUA GEIHUA8Q8-

统计学简答题整理第一章P11 1.获取直接统计数据的渠道主要有哪些及区别在于 普查、抽样调查 普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大,间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。 抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差,但统计方法可以估计出误差的大小进一步控制误差;节省人力、财力、物力,又能保证实效性 2.简要说明抽样误差和非抽样误差。 非抽样误差是由于调查过程中各有关环节工作失误造成的。(它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差,还有一种人为干扰造成的误差即有意瞒报或低报数据等)。非抽样误差在普查、抽样调查中都有可能发生,但可以避免。

抽样误差是利用样本推断总体时产生的误差。(由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制)。抽样误差与样本量的平方根成反比关系。 第二章P51 1.统计的计量尺度 ①列名尺度(定类尺度):是按照某一品质标志将总体分组之后,对属性相同的单位进行计量的方法。各组之间的关系是并列的,没有大小、高低、先后之别。 ②顺序尺度(定序尺度):是按照某一品质标志将总体分组,对等级相同的单位进行计量的方法。各组之间的关系是有顺序的,可以进行排序。 ③间隔尺度(也称定距尺度):是按某一数量标志将总体分组,对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序,还可以计算不同数值之间的绝对差距。 ④比例尺度(也称定比尺度):是类似于间隔尺度,又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异,还可以计算数值的相对差异。 2.简述统计分组的概念和作用。 概念:统计分组是根据统计研究目的,选择一定的分组标志,将总体划分为若干组的统计方法。其目的是使组与组有明显差别,同一组中具有相对的同质性。(例:人口按性别、年龄、民族、职业分组;企业按规模分为大型、中型和小型。)

统计学简答题

1常用的统计调查方式主要有哪些? 答:⑴统计报表。是按照国家有关法规的规定,自上而下地统一布置,自下而上地逐级提供基本统计数据的一种调查方式。⑵普查。是为特定目的而专门组织的一次性全面调查。⑶抽样调查。是从研究对象的总体中随机抽取一部分个体作为样本进行调查,并根据调查结果来推断总体数量特征的一种非全面调查方法。 2分类数据、顺序数据的整理及图示方法各有哪些? 答:对于分类数据:(1)数据的整理方法有列出所分的类别,计算每一类别的频数、频率、比例、比率等。(2)图示方法有条形图和圆形图。对于顺序数据:(1)数据的整理方法中包括所有的处理分类数据的方法,同时还可以计算累积频数和累积频率(2)图示方法包括累积分布图和环形图 3数值型数据的整理及图示方法有哪些?试述组距分组的步骤。 ⑴用频数分布表(变量数列)展示数值型数据①单变量值分组②组距分组 ⑵用图示展示数值型数据①直方图②箱线图③线图④茎叶图组距分组的步骤:①确定组数②确定各组的组距③整理成频数分布表 4误差主要包括哪两类?引起误差的原因分别是什么? 答:主要包括抽样误差和非抽样误差抽样误差:是指由样本数据对总体特征进行估计时所引起的代表性误差,原因是由于每次抽取一个样本,而样本中包含的哪些单元是随机的,不同的样本由于包含的单元不同,得到的估计值自然不同,各个估计值与总体特征之间不可避免的出现差距,由此产生了抽样误差。非抽样误差:其来源比较复杂,主要有抽样框未能不重不漏包含所有抽样单元导致的抽样框误差,调查测量不准确引致的测量误差,还有无回答误差和粗大误差。 5什么是抽样平均误差?抽样平均误差、方差和偏差的关系? 抽样平均误差是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差。即它反映了抽样指标与总体指标的平均离差程度。 6影响样本容量的主要因素有哪些? 答:(1)总体各单位标志变异程度;(2)允许误差的大小;(3)概率度的大小;(4)抽样方法不同;(5)抽样方式不同。 7什么是多重共线:多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确 8方差分析的基本原理是什么? 答:方差分析总的思想是通过计算来比较因某一特定因素带来的样本值的差异与随机偶然因素对样本值的差异的大小,从而判断该因素对总体是否有统计意义。 9简述方差分析的基本步骤? (1建立检验假设; H0:多个样本总体均值相等; H1:多个样本总体均值不相等或不全等。 检验水准为0.05。 (2计算检验统计量F值;(3确定P值并作出推断结果。 10简述方差分析和回归分析的异同? 答:方差分析主要用来研究数据分布的离散与集中,稳定与波动的情况,回归分析是通过数据的分布情况拟合出其分布规律.两者不是一回事 11简述回归方程的显著性检验与回归系数的显著性检验的区别和联系。 答:t检验常能用作检验回归方程中各个参数的显著性,而f检验则能用作检验整个回归关系的显著性。各解释变量联合起来对被解释变量有显著的线性关系,并不意味着每一个解释

统计学习题集及答案

统计学原理 习题集学院: 班级: 学号: 姓名:

目录

第1章导论 一、判断题 1. 在对全国工业设备进行普查中,全国工业企业设备是统计总体,每台工业设备是总体单位。() 2. 总体单位是标志的承担者,标志是依附于总体单位的。() 3. 品质标志表明单位属性方面的特征,其标志值只能用文字来表现,所以品质标志不能转化为统计指标。() 4. 数量指标的表现形式是绝对数,质量指标的表现形式是相对数和平均数。 5. 统计的研究对象是客观现象总体的各个方面。() 6. 统计具有信息、咨询和监督的整体功能,在上述三个职能中,以提供咨询为主。() 7. 某生产小组有5名工人,日产零件为68件、69件、70件、71件、72件,因此说这是5个数量标志或5个变量。() 8. 统计指标有的用文字表示,叫质量指标;有的用数字表示,叫数量指标。() 二、单选题 1.要了解某企业职工的文化水平情况,则总体单位是() A、该企业的全部职工 B、该企业每一个职工的文化程度 C、该企业的每一个职工 D、该企业每一个职工的平均文化程度 2.下列总体中,属于无限总体的是() A、全国的人口总数 B、大海里的鱼 C、城市流动人口数 D、某市工业企业设备数 3.统计工作的全过程各阶段的顺序是() A、统计设计、统计分析、统计调查、统计整理 B、统计调查、统计设计、统计分析、统计整理 C、统计设计、统计分析、统计调查、统计整理 D、统计设计、统计调查、统计整理、统计分析 4.由工人组成的总体所计算的工资总额是() A、数量标志 B、数量指标 C、标志值 D、质量指标

5.几位工人的月工资分别是500元、520元、550元、600元,这几个数字是() A、指标 B、变量 C、变量值 D、标志 6.统计标志用以说明() A、总体属性和特征 B、总体某一综合数量特征的社会经济范畴 C、单位具有的属性和特征 D、总体单位在一定时间、地点条件下动作的结果 7.变异性是指() A、在不同单位可以有不同的标志值 B、总体单位有许多不同的标志 C、现象总体可能存在各式各样的指标 D、品质标志的具体数值 8.下列各项中,属于统计指标的是() A、小王英语考试成绩为85分 B、广州至北京的机票价格为1360元 C、光华公司1999年4~6月份的利润为200万元 D、钢材20吨 9.总体和单位不是固定不变的,而是有() A、在某些场合是要互相变换的 B、只存在总体变换为总体单位的情况 C、只存在总体单位变换为总体的情况 D、所有的标志都能变换为单位 10.离散变量可以() A、被无限分割,无法一一列举 B、按一定次序一一列举,通常取整数 C、用相对数表示 D、用平均数表示 11.下列变量中,属于连续变量的是() A、企业个数 B、企业的职工人数 C、用相对数表示的数据 D、企业拥有的设备台数 12.统计指标体系是指() A、各种相互联系的指标所构成的整体

统计学简答题完整版

统计学简答题 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

简答题l.获得数据的概率抽样方法有哪些 (1)简单随机抽样 简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。 它最直观地体现了抽样的基本原理,是最基本的概率抽样。 (2)系统抽样 系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法。 (3)分层抽样 分层抽样也叫分类抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,它们的集合即为总体样本。 (4)整群抽样 整群抽样又称聚类抽样或集体抽样,是将总体按照某种标准划分为一些群体,每一个群体为一个抽样单位,再用随机的方法从这些群体中抽取若干群体,并将所抽出群体中的所有个体集合为总体的样本。 (5)多阶段抽样 多阶段抽样又称多级抽样或分段抽样,就是把从总体中抽取样本的过程分成两个或多个 阶段进行的抽样方法。 2.什么是统计学统计学数据分为哪几类数据 统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 3.简述众数、中位数和平均数的特点和应用场合。 表示。它不受极端值影响,具答:众数是一组数据中出现次数最多的变量值,用M 有不唯一性。众数主要用于分类数据的集中趋势,当然也适用顺序数据和数值型数据。数据分布偏斜程度较大时应用。 表示,也不受极端值中位数是一组数据排序后处于中间位置上的变量值,用M e 影响。它将全部数据等分成两部分,一部分数据比中位数大,一部分比中位数小。主要用于测度顺序数据的集中趋势,当然也适用于数值型数据,但不适用于分类数据。数据分布偏斜程度较大时应用。 平均数是一组数据相加后除以数据的个数得到的结果,是集中趋势的最主要测度值。它易受极端值影响,数学性质优良。主要适用于数值型数据,而不适用于分类数据和顺序数据。数据对称分布或接近对称分布时应用。 4.收集数据的基本方法有哪些? 1.自填式 2.面访式 3.电话式 此外收集数据的方法还有观察式,即调查人员通过直接观测的方法获取信息。

统计学简答题答案修订

统计学简答答案 1.一组数据的分布特征可以从哪几个方面进行描述? 数据分布的特征可以从三个方面进行测度和描述: (1)分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度; (2)分布的离散程度,反映各数据远离其中心值的趋势; (3)分布的形状,反映数据分布的偏态和峰态。 2.影响样本量大小的因素有哪些?简述这些因素与样本量的关系。 (1)影响样本量大小的因素有:所要求的置信水平、总体方差和估计时所希望的估计误差。 (2)关系:其他条件不变的情况下: 1)样本量的大小与置信水平成正比。置信水平越大,所需样本量也就越大; 2)样本量与总体方差成正比。总体的差异越大,所要求的样本量也越大; 3)样本量与估计误差的平方成反比,即允许的估计误差的平方越大,所需的样本量就越小。 3.简述统计数据的类型和特点。 类型:(1)按计量尺度:分类数据、顺序数据和数值型数据; (2)按收集方法:观测数据和实验数据; (3)按被描述的现象与时间的关系:截面数据和时间序列数据。 特点:(1)按计量尺度分时:分类数据中各类别间是平等的并列关系,各类别间的顺序是可任意改变的;顺序数据的类别间是可以比较顺序的;数值型数据其结果表现为具体的数值。 (2)按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。 (3)按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。 4.在假设检验中,当不拒绝原假设时,为什么不采取“接受原假设”的表示方式? (1)在假设检验时,当拒绝原假设时,表明样本提供的证据证明它是错误的;当没有拒绝原假设时,也没法证明它是正确的。 (2)采用“接受”原假设的说法,意味着样本提供的证据证明了原假设是正确的。但由于原假设的真实值是什么并不知道,没有足够的证据拒绝原假设并不等于能够证明原假设是真的,它仅仅意味着目前我们还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设。5.什么是判定系数?它在回归分析中的主要作用是什么? (1)判定系数:回归平方和占总平方和的比例。记为R2,公式为:R2,=SSR/SST. (2)在回归分析中,R2,主要是用于测度回归直线对观测数据的拟合程度。取值范围是[0,1]。R2,越接近于1,回归直线的拟合程度就越好;R2,越接近于0,回归直线的拟合程度就越差。若所有观测点都落在直线上,R2,=1,拟合是完全的;如果R2,=0,回归直线对数据完全没有拟合。 6.解释95%的置信区间 如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。 7.说明区间估计的基本原理 区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出一个概率度量。 8.测度两个分类变量相关性的统计量有哪些?他们有什么不同? 测度两个分类变量相关性的统计量有以下几个: Φ相关系数、列联相关系数(c系数)、v相关系数 (1)Φ相关系数:描述2×2列联表数据相关程度最常用的一种相关系数且Φ系数没有上限。 (2)列联相关系数(c系数):主要用于大于2×2列联表的情况且c系数小于1.

统计学简答题

1.解释描述统计和推断统计的概念?(P5) 答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。 2.描述茎叶图和直方图,箱线图的画法,并说明它们的用途(P41、42) 答:茎叶图将数据分为“茎”和“叶”两部分,绘制茎叶图的关键是设计好树茎,通常是以该组数据的高位数值作为树茎,而且树叶上只保留该数值的最后一个数字。通过茎叶图可以看出数据的分布形状及数据的离散状况。直方图的绘制方法:在平面直角坐标系上,将分组标志作为横轴,并将各组次数作为纵轴,绘出的长方形图即直方图。通过直方图可以看出数据的分配特征。箱线图是由一个箱子和两条线段组成的。其绘制方法是:首先找出一组数据的五个特征值,即数据的最大值、最小值、中位数和两个四分位数;然后连接两个四分位数画出箱子;再将两个极值点与箱子相连接。通过箱线图可以看出数据分布的特征。 3.一组数据的分布特征可以从哪几个方面进行测度?具体有哪些测度值? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 4.设计一张规范的统计表应该注意哪些问题? 答:1、统计表一般为横长方形,上下两端封闭且为粗线,左右两端开口。2、统计表栏目多时要编号,一般主词部分按甲、乙、丙;宾词部分按(1)(2)等次序编号。3、统计表总标题应简明扼要,符合表的内容。4、主词与宾词位置可互换。各栏排列次序应以时间先后、数量大小、空间位置等自然顺序编排。5、计量单位一般写在表的右上方或总栏标题下方。6、表内资料需要说明解释部分,如:注解、资料来源等,写在表的下方。7、填写数字资料不留空格,即在空格处划上斜线。统计表经审核后,制表人和填报单位应签名并盖章,以示负责。 5.简述众数、中位数和均值的特点及应用场合,并说明不同的分布情况下均值、众数和中位数三者之间的关系(P24-31) 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。在对称的次数分配和统计分布中,众数、中位数和均值都是同一数值。在右偏分布中,众数最小,中位数适中,均值最大。在左偏分布中,众数最大,中位数适中,均值最小。 6.简述系统抽样组织方式组织实施的基本步骤(P98) 答:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。 7.简述中心极限定理(P101) 答:在抽样推断中,中心极限定理指出,不论总体服从何种分布,只要其数学期望和方差存在,对总体进行重复抽样时,当样本容量充分大,样本均值趋近于正态分布。中心极限定理为均值的抽样推断奠定了理论基础。 8.为什么平均发展速度要用几何平均法计算,计算平均发展速度的几何平均法的特点是什么? 答:现象发展的平均速度,一般用几何平均法计算。平均速度是总速度的平均,但现象发展的总速度不等于各年发展速度之和,而等于各年环比发展速度的连乘积,所以求平均发展速度要用几何平均法。几何平均法的实质是要求从最初水平出发,按所求的平均发展速度发展,计算出的末期水平应等于实际末期水

相关主题
文本预览
相关文档 最新文档