当前位置:文档之家› 统计学复习资料

统计学复习资料

统计学复习资料
统计学复习资料

医学统计学复习资料

一、名词解释题

1. 总体(population):根据研究目的所确定的同质观察单位的全体。只包括(确定的时间和空间范围内)

有限个观察单位的总体,称为有限总体(finite population)。假想的,无时间和空间概念的,称为无限

总体(infinite population)。

2. (总体)参数(parameter):总体的统计指标或特征值。总体参数是事物本身固有的、不变的。

3. 样本(sample):从总体中随机抽取的部分个体。

4. 样本含量(sample size):样本中所包含的个体数。

5. 变量(variable):观察对象个体的特征或测量的结果。由于个体的特征或指标存在个体差异,观察

结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。变量的取值称

为变量值或观察值(observation)。根据变量的取值特性,分为数值变量和分类变量。

6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现

为数值大小,有单位。对每个观察单位用定量的方法测定某项指标的数值,组成的资料。

7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。

分类变量(categorical variable):或称定性变量,其取值是定性的,表现为互不相容的类别或或属性,

有两种情况:

1)无序分类(unordered categories):包括①二项分类,如上述“性别”变量,表现为互相对立的结果;

②多项分类,如上述“血型”变量,表现为互不相容的多类结果。

2)有序分类(ordered categories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,

亦称等级变量。

等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。

8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。

9. 抽样误差(sampling error):由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用

标准误描述其大小。

10. 误差(error):统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下

二种:系统误差和随机误差 。

11. 可信区间(confidence interval, CI ):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范

围,这个范围称作可信度1-α的可信区间,又称置信区间。

12. 总体均数的可信区间:按一定的概率大小估计总体均数所在的范围(CI)。常用的可信度为95%和

99%,故常用95%和99%的可信区间。

13. 变异(variation):同质事物间的差别。由于观察单位通常即为观察个体,故变异亦称为个体变异

(individual variation)。

14. 组间变异(variation between group):用各组均数与总均数的离均差平方和表示

∑-=i

2i i )x x (n S 组间S ν组间=k -1,k 为实验分组数,组间均方为MS 组间=SS 组间/( k -1)

15. 组内变异(variation within group):用各组均数与总均数的离均差平方和表示

∑∑∑-=-=i

2i i i j 2i ij )s (n )x (x S 1组内S ,各组自由度为n i -1,则组内自由度为ν组内=N -k ,组内均

方为MS 组内=SS 组内/( N -k )

16. 平均数(average):也叫平均值,是一组(群)数据典型或有代表性的值。这个值趋向于落在根据数

据大小排列的数据的中心,包括算术平均数(arithmetic mean)、几何平均数(geometric mean)、中位数

(median)等。

17. 中位数(median):将一组观察值按升序或降序排列,位次居中的数,常用M 表示。适用于偏态分布资料或不规则分布资料和开口资料。所谓“开口”资料,是指数据的一端或两端有不确定值。当n

为奇数时,M=X (n+1)/2;当n 为偶数时,M=[X n/2+ X n/2+1]/2。

18. 百分位数(percentile):是一种位置指标,以P x 表示,一个百分位数Px 将全部观察值分为两个部

分,理论上有x%的观察值小于Px 小,有(1-x%)的观察值大于Px 。

19. 变异系数(coefficient of variance, CV):亦称离散系数(coefficient of dispersion),为标准差与均数之比,常用百分数表示。100%X s/CV ?=, 变异系数没有度量衡单位,常用于比较度量单位不同或

均数相差悬殊的两组或多组资料的离散程度。

20. 统计表(statistical table):统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项

目分组之间的数量关系。

21. 频率(relative frequency):在n 次随机试验中,事件A 发生了m 次,则比值

试验的总次数

发生的试验次数A ==n m f 称为事件A 在n 次试验中出现的频率(relative frequency)。m 称为出现的频数(frequency)。

在实际工作中,当观察单位的例数足够多时,可以用频率来代替概率。频率是概率的估计值。

22. 概率(probability):在重复试验中,事件A 的频率,随着试验次数的不断增加将愈来愈接近一个

常数p ,这个常数p 就称为事件A 出现的概率(probability),记作P(A)或P 。

描述随机事件发生的可能性大小的数值,常用P 来表示。

23. 统计量(statistic):由样本所算出的统计指标或特征值。

24. 相关系数(correlation coefficient):用以说明具有直线关系的两个变量间相关关系的密切程度和相

关方向的指标,称为相关系数,又称为积差相关系数(coefficient of product-moment correlation),总

体相关系数用希腊字母ρ表示,而样本相关系数用r 表示,取值范围均为[-1, 1]。

25. 回归系数(regression coefficient):直线回归方程Y

?= a+b X 的系数b 称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。

26. 参考值范围(reference range):也称为正常值范围(normal range),医学上常把绝大多数正常人的

某指标值范围称为该指标的正常值范围。绝大多数:可以是90%、95%、99%等等,最常用的是95%。

正常人:不是指健康人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。又称参考值

范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括95%的人

的界值。

27. 正偏态和负偏态分布:频数分布可分为对称分布和非对称分布两种类型。非对称分布又称为偏

态分布,是指观察值偏离中央的分布。当尾部偏向数轴正侧(或右侧)时,称正偏态(或右偏态)分布,

如人体中一些重金属元素的分布等。反之,尾部偏向数轴负侧(或左侧)时,则称为负偏态(或左偏态)

分布。

28. 统计推断(statistic inference):从总体中随机抽取一定含量的样本进行研究,目的是通过样本的信

息判断总体的特征,这一过程称为统计推断。

29. 标准误(standard error, SE):在统计理论上将样本统计量的标准差称为标准误,用来衡量抽样误差的大小。据此,样本均数的标准差X σ称为标准误。

30. 参数估计(parameter estimation):由样本信息估计总体参数。它包括两种:点估计(point estimation)

和区间估计(interval estimation)。

31. 点估计(point estimation):直接用样本统计量作为对应的总体参数的估计值。

32. 区间估计(interval estimation):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,

这个范围称作可信度1-α的可信区间(confidence interval, CI ),又称置信区间。这种估计方法称为区间

估计。

33. 95%可信区间含义:如果重复若干次样本含量相同的抽样,每个样本均按同一方法构建95%可信

区间,则在这些可信区间中,理论上有95个包含了总体参数,还有5个未估计到总体均数。

34.Ⅰ类错误(type Ⅰerror):统计学上规定,拒绝了实际上成立的H 0,这类“弃真”的错误称为Ⅰ型错

误或第一类错误,Ⅰ型错误的概率用α表示。

35.Ⅱ类错误(type Ⅱerror):统计学上规定,不拒绝实际上不成立的H 0,这类“存伪”的错误称为Ⅱ型

错误或第二类错误,Ⅱ型错误的概率用β表示。

36. 检验效能(power of a test):又称把握度,即两总体确有差别,按α水准能发现它们有差别的能力。

37. 参数检验:总体分布已知,对其中一些未知参数进行估计或检验。这类统计推断的方法叫参数

统计或参数检验。

参数检验:假定比较数据服从某分布,通过参数的估计量(, s)对比较总体的参数(μ)作检验,统计上

称为参数法检验(parametric test)。如t 、u 检验、方差分析。

38. 非参数检验:适用于任意分布(distribution free)的统计方法,这种方法称为非参数统计。这种假

设检验方法,比较的是分布而不是参数,故称为非参数检验。

非参数检验:是指在统计检验中不需要假定总体分布形式和用参数估计量,直接对比较数据的分布

进行统计检验的方法,称为非参数检验(nonparametric test).

39. 率(rate):又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万

分率(1/万)、十万分率(1/10万)等表示。

其计算公式为:

40. 构成比(proportion):又称构成指标,它说明一种事物内部各组成部分所占的比重或分布,常以

百分数表示,其计算公式为:

100%?=的观察单位总数

同一事物内各组成部分位数某一组成部分的观察单构成比 41. 比(ratio):又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百分之几,它是对

比的最简单形式。其计算公式为:比=A/B 。

二、简答题

1. 常见的三类误差是什么?应采取什么措施和方法加以控制?

答:常见的三类误差是:

(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗

效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原

因,必须克服。

(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各

种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳

定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于

这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指

定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的

目的。

(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统

计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,故这种误差叫做

抽样误差,要用统计方法进行正确分析。

2. 抽样中要求每一个样本应该具有哪三性?

答:从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。

(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。

(2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。

(K)比例基数单位总数

可能发生某现象的观察单位数实际发生某现象的观察率?=

(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较

大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。每个样

本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。

需要作“样本例数估计”。

3. 什么是两个样本之间的可比性?

答:可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影

响实验结果的因素要求基本齐同,也称为齐同对比原则。

4. 标准正态分布(u 分布)与t 分布有何异同?

相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t 分布的特例(自由度是无

限大时)

不同点:t 分布是一簇分布曲线,t 分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲

线的形状不变,是固定不变的,因为它的形状参数为1。

5. 标准差与标准误有何区别和联系?

区别:(1)含义不同: ①s 描述个体变量值(x )之间的变异度大小,s 越大,变量值(x )越分散;反

之变量值越集中,均数的代表性越强。②标准误是描述样本均数之间的变异度大小,标准误 越

大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差

越小。

(2)与n 的关系不同: n 增大时,①s→?(恒定)。②标准误减少并趋于0(不存在抽样误差)。

(3)用途不同: ①s:表示x 的变异度大小,计算cv ,估计正常值范围,计算标准误等②:参数估计和假

设检验。

联系: 二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。

6. 应用相对数时的注意事项有哪些?

①要注意绝对数与相对数结合应用;②要注意观察单位样本数不宜过小;③要注意分子分母正确

选用;④要注意率与比的正确应用;⑤要注意平均率的计算方法;⑥要注意资料的可比性;⑦率

和构成比比较时作假设检验。

7. 简述直线回归与直线相关的区别。

(1)资料要求上不同:直线回归分析适用于应变量是服从正态分布的随机变量,自变量是选定变量;

直线相关分析适用于服从双变量正态分布的资料。

(2) 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存关系,回归系数越大回归直线

越陡峭,表示应变量随自变量变化越快;相关系数是表明两个变量之间相关的方向和紧密程度的,

相关系数越大,两个变量的关联程度越大。

8. 何谓抽样误差?分别写出均数的抽样误差和率的抽样误差的描述指标及计算公式。

答:总体中的个体间存在变异,在进行抽样研究时,样本的统计量不等于总体参数,这种误差称为抽样误差。均数的抽样误差:常用样本均数的标准差X σ (简称标准误)反映均数抽样误差的大小。

n σ/σX = (理论值),n s/S X = (估计值)。率的抽样误差:常用率的标准误p σ反映率的抽样误差的大小。π)/n π(1σp -= (理论值),p)/n p(1s p -= (估计值)。

9. 假设检验的理论依据是什么?请简述假设检验的基本步骤。

答:假设检验的理论依据是小概率事件原理,步骤为:

(1)根据研究目的建立假设,确定检验水准

(2)根据样本统计量的抽样分布规律,选择适当的统计方法,计算检验统计量

(3)确定P 值,做出推断结论

10. 方差分析的基本思想是什么?你所知道的其用途有哪些?

答:方差分析的基本思想就是按研究目的和设计类型,将总变异的离均差平方和SS 和自由度v 分别

分解成若干部分,并求得各相应部分的变异;其中的组内变异或误差主要反映个体差异或抽样误差,

其它部分的变异与之比较得出统计量F 值,由F 值的大小确定P 值,并做出推断。 方差分析应用广泛,可用于:①两个或多个样本均数间的比较;②分析两个或多个因素间的交互作

用;③回归方程的线性假设检验;④多元线性回归分析中偏回归系数的假设检验等。本章主要介绍

完全随机设计资料的方差分析、配伍组设计资料的方差分析及重复测量数据的方差分析。

11. 完全随机设计的两样本率比较时,如何正确选择统计分析方法(写出相应的计算公式)。

(1)当总例数n ≥40且所有格子的T ≥5时,用χ2检验的基本公式或四格表资料χ2检验的专用公式;当P

≈α时,改用四格表资料的Fisher 确切概率法。公式为:

∑-=T T)(A χ22

,v =(行数-1)(列数-1) d)c)(b d)(a b)(c (a n bc)(ad χ22++++-= (2)当n ≥40但有1≤T <5时,用四格表资料χ2检验的校正公式;或改用四格表资料的Fisher 确切概率法的连续性校正法:∑-=T 0.5)-T A (χ22,d)c)(b d)(a b)(c (a n/2)-bc ad n(χ2

2++++-= (3)当n <40,或T <1时,用四格表资料的Fisher 确切概率法。

12. 什么是医学参考值范围?估计医学参考值范围如何正确选用统计方法?

答:医学参考值范围是指所谓“正常人”的解剖、生理、生化等指标的波动范围,亦称正常值范围。

如95%的参考值范围包括了95%的观察值,而有5%的观察值不在这一范围内。

估计医学参考值范围确定方法: (1)正态分布法:适用于正态或近似正态分布的资料

双侧界值X αs u X ±;单侧上界X αs u X +;单侧下界X αs u X -

(2)对数正态分布法:适用于对数正态分布的资料 双侧界值)(lg 1X αs u ±-;单侧上界)(lg 1X αs u +-;单侧下界)(lg 1X αs u --

(3)百分位数法:用于偏态资料

双侧界值(P 2.5, P 97.5);单侧上界P 95;单侧上界P 5

13. 什么是假设检验中的两类错误?什么是检验效能?其大小与哪些因素有关?

答:假设检验中的第一类错误是指“拒绝了实际上成立的H 0假设”时所犯的错误,当H 0成立时犯第一

类错误的概率等于检验水准α。假设检验中的第二类错误是指“不拒绝实际上不成立的H 0假设”时所

犯的错误,其概率通常用β表示,其大小与抽样误差大小及设定的检验水准α有关。 1-β为假设检验的检验效能,也就是两个总体确实有差别时检出该差别的能力;

14. χ2检验的基本思想是什么?其用途主要有哪些?

答:①χ2检验的基本思想:其计算公式为∑-=T T)(A χ2

2

,式中A 代表实际频数;T 代表理论频数;而χ2

值反映了实际频数与理论频数的吻合程度,其中T T)(A 2

-反映了某个格子实际频数与理论频数的吻合程度。若检验假设H 0成立,实际频数与理论频数的差值会小,则χ2值也会小;反之,若

检验假设H 0不成立,实际频数与理论频数的差值会大,则χ2值也会大。

②χ2检验的用途:a 、单样本的拟合优度检验;b 、比较两个独立样本的频率分布是否不同;c 、多

个独立样本的频率分布是否不同;d 、比较配对样本的频率分布;

15. 对两个随机变量进行关联性或相关性分析时,如何正确选择统计分析方法(写出相应的公式)?

答:①两变量为数值变量时:a 、若两变量均为正态随机变量,且其散点图呈直线趋势,则用直线

相关分析,计算样本相关系数: ()()()()∑∑∑-?---=?=22yy xx xy

y y x x y y x x l l l r

然后对其进行假设检验:

H 0:ρ=0

H 1:ρ≠0

α=0.05

2))/(n r (1r

t 2--=,v =n-2

b 、若两变量为非正态分布,则用等级相关分析。将两变量各自按由小到大的顺序排秩,编上秩次,求各对数据的秩次之差,记为d i 。按下式计算Spearman 等级相关系数:

()

1n n d 61r 22i s --=∑ 然后对其进行假设检验:

H 0:ρ=0

H 1:ρ≠0

α=0.05

当n≤50时,查Spearman 等级相关系数界值表;当n>50时,按下式计算检验统计量u :

1n r u s -?=,根据标准正态分布的概率函数确定P 值,作出推断结论。

②两变量为分类变量时:

a 、两变量均为无序多分类变量时:用行×列表的χ2检验:

H 0:两变量无关联

H 1:两变量有关联

α=0.05

()???

? ??-=-=∑∑1n n A n T T A χC R 22

2,()()11--=列数行数ν 若拒绝H 0,接受H 1,可计算Pearson 关联系数:22

χn χP +=

b 、两变量均为有序多分类变量时,可用Spearman 等级相关分析,方法同前。

16. 简述t 检验的具体步骤,如何进行检验结果判断?

步骤:(1)建立假设和确定检验水准α;(2)计算统计量;(3)确定P 值;(4)判断结果。结果的判断:P >α,接受H 0,差异无显著性,可认为差异是由抽样误差所致。P ≤α,拒绝H 0,差异有显著性,可认为样本间存在差异。

18. 抽样研究中如何才能控制或减小抽样误差? 答:合理的抽样设计,增大样本含量。

19. 何谓抽样误差?为什么说抽样误差在抽样研究中是不可避免的?

答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异

因为个体差异是客观存在的,研究对象又是总体的一部分,因此这部分的结果与总体的结果存在差异彩是不可避免的

20. 能否说假设检验的p 值越小,比较的两个总体指标间差异越大?为什么?

答:不能,因为P值的大小与总体指标间差异大小不完全等同。P值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽样误差大小不同,所得的P也会不一样,抽样误差大小实际工作中主要反映在样本量大小上。

21.在秩和检验中,为什么在不同组间出现相同数据要给予“平均秩次”,而在同一组的相同数据不必计算平均秩次?

答:这样编秩不影响两组秩和的计算,或对两组秩和的计算不产生偏性。

22. 某医生用某药治疗10例小儿支气管哮喘,治愈8例,结论为“该药对小儿支气管哮喘的治愈率为80%,值得推广”。

答:一是没有对照组,二是样本例数太少,抽样误差大,可信区间宽。

23. 某地1岁婴儿平均血红蛋白95%可信区间为116.2~130.1(g/L),表示什么意义?该地1岁正常婴儿血红蛋白95%的参考值范围为111.2~135.1(g/L),又说明了什么含义?

答:表示该地1岁婴儿血红蛋白总体平均数在116.2~130.1(g/L),估计正确的概率为95%

表示该地有95%1岁正常婴儿的血红蛋白值在111.2~135.1(g/L)

24. 对同一组资料,如果相关分析算出的r越大,则回归分析算出的b也越大。为什么?

答:没有这个规律。相关分析r值大小仅说明变量间联系紧密,而回归分析b的大小说明两者数量关系。

25. 描述集中趋势的指标有哪些?其适用范围有何异同?

P26~28 修改答案(5分)

①均数:适用于正态或近似正态分布

②几何均数:适用于等比数列或对数正态分布资料

③中位数:适用于资料是偏态分布的;分布不规则;一端或两端有不确定数据(开口资料)时。

26. 何谓假设检验?可以举例说明。(5分)

首先建立检验假设,然后在该假设下进行随机抽样,计算得到该统计量及其极端情形的概率,如果概率较小,则拒绝该假设,如果概率不是小概率,则接受该假设,这个过程称为假设检验。

27. 请你谈谈对假设检验结论的认识。(5分)

由于假设检验的结论是依据小概率事件一次试验实际不可能发生的原理进行的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。

标准差标准误

个体差异大小抽样误差大小

计算公式总体标准差:

N

μ)

(X

σ

2

∑-

=

样本标准差:

1-

n

)

X

(X

s

2

∑-

=或

1-

n

/n

)

X

(

X

s

2

2∑

∑-

=

n

σ/

σ

X

=

与n

的关系n↑,则S→?n↑,则

X

σ→0

用途与均数结合可制定参考值范围

与均数结合可计算总体

均数的可信区间

描述集中位置的指标:①均数:适用于正态或近似正态分布;②几何均数:适用于等比数列或对数正态分布资料;③中位数:适用于资料是偏态分布的;分布不规则;一端或两端有不确定数据(开口资料)时。

描述离散趋势的指标:①极差(Range):记为R,又称全距,指一组数据中最大值和最小值之差。极差大,说明资料的离散程度大。②四分位数(quartile):记为Q,即P25和P75。对P25来说,有25%(1/4)的观察值小于P25,称为下四分位数,记为Q L;对P75来说,有25%(1/4)的观察值大于P75,称为上四分位数,记为Q U。所谓四分位数间距(inter-quartile range):就是上四分位数与下四分位数之差,即。其间包含了全部观察值的一半。四分位数间距大,说明变异度大;反之,说明变异度小。③方差:离均差的平方和除以N得总体方差。离均差:数据集中各个观察值与均数之差。④标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能通过统计方法来控制。全面反映了一组观察值的变异程度。⑤变异系数:标准差与均数之比,用百分数表示。

32. 试述假设检验中I 型错误与II 型错误的意义及关系。

答:拒绝了实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误(typeⅠerror)或第一类错误;不拒绝实际上不成立的H0,这类“存伪”的错误称为Ⅱ型错误(typeⅡerror)或第二类错误。Ⅰ型错误的概率用α表示,是根据研究者的要求在计算检验统计量之前设定的。Ⅱ型错误的概率用β表示,一般地,β的大小和样本例数、α值、两总体的实际差距有关,它只有与特定的H1结合起来才有意义,而通常的检验假设其总是非特定的,所以β值的大小很难确切估计。仅知道样本例数确定时,α越小,β越大,反之,α越大,β越小。所以α和β是相互制约的,可以根据研究要求适当控制。要同时减少α及β,唯一的方法是增加样本例数,当样本例数确定后,可以通过选定α来控制β。若重点减少α,一般取较小的α;若重点减少β,一般取α=0.05,α=0.1或更高,因为虽属未知,但估计比取α=0.01时小些。

33. 试比较完全随机设计和随机区组设计资料的方差分析基本思想。

(1)完全随机设计资料的方差分析

完全随机设计(completely random design):亦称成组设计。该设计仅涉及一个研究因素,k个不同的水平(k个分组)。用单因素方差分析(one-way ANOVA)。三种变异:SS总=SS组间+SS组内

(2)随机区组设计资料的方差分析

随机区组设计(random block design):又称配伍设计,是配对设计的扩展。

四种变异:SS总= SS处理+ SS区组+ SS误差,ν总=kb-1

34. 试比较标准差和标准误的关系与意义。

答:标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能通过统计方法来控制。而标准误则是指样本统计量的标准差,均数的标准误实质是样本均数的标准差,它反映了样本均数的离散程度,也反映了样本均数与总体均数的差异,说明了均数的抽样误差。

35. 简述非参数检验的应用条件和优缺点。

答:应用条件:①有序分类资料、②偏态分布资料、③变异较大或方差不齐的资料、④分布型不明的资料及⑤有特大、特小值或数据的一端或两端有不确定数值的资料。

主要优点是不受总体分布的限制,适用范围广。主要缺点是符合参数检验的资料(两样本均数比较的t检验),如用非参数检验,因没有充分利用资料提供的信息,检验效率降低。

37. 复相关系数与确定系数的定义与意义

答:复相关系数:2R R =称为复相关系数。R 的意义:①Y 与多个自变量间的线性相关程度;②Y

与估计值Y

?间的相关程度。 确定系数:相关系数的平方称为确定系数,它反映回归贡献的程度。相当于在总离均差平方和中回归能解释的百分比。即说明回归贡献占Y 的总变异中的比例。

38. 什么是可信区间,可信区间有哪两个要素?

答:可信区间:按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间(confidence interval, CI),又称置信区间。

可信区间的两个要素:①准确性:又称可靠性,反映为可信度1-α的大小,显然可信度愈接近1愈好。②精确性:常用可信区间的长度C L -C U 来衡量。当然长度愈小愈好。精确性与变量的变异程度大小、样本例数和1-α取值有关。

40. 简述正态分布的应用。

答:(1)估计频数分布,(2)制定参考值范围,(3)质量控制:为了控制实验中的检测误差,常以±2 s 作为上、下警戒值,以±3 s 作为上、下控制值。(4)统计分析方法的基础。

41. 简述医学参考值范围含义并写出95%双侧医学参考值范围的两种计算方法及公式。

答:医学参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括95%的人的界值。

95%双侧医学参考值范围的两种计算方法及公式

(1)正态分布法:1-α参考值范围公式,双侧:S X ,u 2/α±;单侧:>S X ,u α+或

(2)百分位数法:1-α参考值范围公式,双侧:2/1001002/100p ~αα-P ;单侧:>α100P

或<α100100P -。 42. 简述秩相关的适用范围。

答:秩相关的适用范围:(1)不服从双变量正态分布而不宜作积差相关分析;(2)总体分布类型未知;(3)原始数据用等级表示。

43. 简述假设检验的注意事项。

答:假设检验的注意事项:①假设检验时可能犯两类错误;②选择检验方法要注意符合其应用条件;③正确理解假设检验的结论;④当差别无显著性时,有两种可能;⑤统计学的显著性与否和日常生活中的显著性概念不同;⑥单侧检验与双侧检验。

44. 简述正态分布的特征。

答:(1)单峰分布;当X=μ时,f(X)取最大值;总体中位数亦为μ。

(2)以均数μ为中心,左右完全对称。

(3)正态分布取决于两个参数,即均数μ和标准差?。

(4)有些指标不服从正态分布,但通过适当的变换(transformation)后服从正态分布

(5)正态分布曲线下的面积分布是有规律的。

45. 简述频数表的主要用途。

答:(1)通过频数表了解数据的分布特征。①X值分布情况:偏态或正态分布;②取值情况:变量值取值范围;③集中趋势:变量值集中位置。

(2)便于发现资料中的可疑值。

(3)组段的频率作为概率的估计。

46. 简述t分布的特征。

答:(1)一簇单峰分布曲线;(2)以0为中心,左右对称;(3)与自由度有关,①自由度越小,t分布的峰越低,而两侧尾部翘得越高;

②自由度逐渐增大时,t分布逐渐逼近标准正态分布;③当自由度为无穷大时,t分布就是标准正态分布。

47. 简述秩和检验的应用范围。

答:秩和检验的适用范围广,特别适用于组间比较:

(1)数据分布为偏态分布或不满足参数检验方法(组间方差不齐)的计量资料。

(2)有的数据为无确切值,只是>某值或<值的计量资料。

(3)当比较的数据只能用严重程度、优劣等级的半定量(等级)资料组间的比较。

秩和检验用于定量资料

计量资料中,变量值(x):①极度偏态资料,或个别数值偏离过大;

②各组离散度相差悬殊;③资料中含有不确定值, 大于5年、

<0.1;④兼有等级和定量性质的资料。

48. 什么是百分位数?写出计算公式。

答:百分位数(percentile):是一种位置指标,以Px表示,一个百

分位数Px 将全部观察值分为两个部分,理论上有x%的观察值小于Px 小,有(1-x%)的观察值大于Px 。

计算定义:将一组变量值由小到大依次排列,为第x 百分位数的秩次,其对应的变量值(x)为第x 百分位数,记为Px 。

百分位数计算公式:

(1)直接法

将样本值由小到大排队,用nX%确定Px 的位次和Px 。 当nX%为带有小数位时用公式:1)][trunc(nX %X X P +=

当nX%为带有小数位时用公式:[]1)(nX%(nX%)X X X 2

1P ++= 函数trunc(a):表示对数字取其整数。

(2)频数表法(例数较多) 用公式:)f (nX%f i L P L X

X X X ∑-+= L X :第X%位数所在组段的下限值

i X :第X%位数所在组段的组距

f X :第X%位数所在组段的频数

∑f L :第X%位数所在组段上个组段的累计频数

三、教材课后简答题

1.对于一组近似正态分布的资料,除样本含量n 外,还可计算X ,S 和S X 96.1±,问各说明什么? 答:三个指标分别说明: (1) X 为算术平均数,说明正态分布或近似正态分布资料的集中趋势;

(2)S 为标准差,说明正态分布或近似正态分布资料的离散趋势; (3) S X 96.1±可估计正态指标的95%医学参考值范围,即此范围在理论上应包含总体的95%个体值。

2.试述正态分布、标准正态分布及对数正态分布的联系和区别。

答:正态分布、标准正态分布及对数正态分布的联系和区别:

正态分布 标准正态分布 对数正态分布 原始值X

无需转换 作u=(X-μ)/?转换 作Y=log X 转换 分布类型

对称 对称 正偏态 集中趋势指标

μ μ=0 G 均数与中位数的关系 μ=M μ=M μ>M

3.说明频数分布表的用途。

答:频数分布表的用途是:(1)描述频数分布的类型;(2)描述频数分布的特征;(3)便于发现一些特大或特小的可疑值;(4)便于进一步做统计分析和处理。

4.变异系数的用途是什么?

答:变异系数的用途:常用于①观察指标单位不同时,如身高与体重的变异程度的比较;②均数相差较大时,如儿童身高与成人身高变异程度的比较。

5.试述正态分布的面积分布规律。

答:正态分布的面积分布规律是:(1)X 轴与正态曲线所夹面积等于1或100%;(2)区间σμ±的面积

为68.27%,区间 1.96

σμ±的面积为95.00%,区间 2.58σμ±的面积为99.00%。 7. 标准正态分布(u 分布)与t 分布有何不同?

答:t 分布为抽样分布,标准正态分布(u 分布)为理论分布。t 分布比标准正态分布的峰值低,且尾部翘得要高。随着自由度的增大,t 分布逐渐趋近于标准正态分布。即当自由度v →∞时,t 分布→标准正态分布。

8.均数的可信区间与参考值范围有何不同? 答:均数的可信区间与参考值范围的区别主要体现在含义、计算公式和用途三方面的不同,具体如下表所示:

区别点 均数的可信区间 参考值范围

含义

按预先给定的概率,确定的未知参数的可能范围。实际

上一次抽样算得的可信区间要么包含了总体均数,要么不包含。但可以说:该可信区间有多大(如当α=0.05时为95%)的可能性包含了总体均数。

“正常人”的解剖、生理、生

化某项指标的波动范围。

计算公式 ①?未知:*n S/t X να/2,±

②?已知:**n σ/u α/2±

③?未知但n >50:**n S/u X α/2±

①正态分布:**S u X α/2±

②偏态分布:X 100X P P -- 用途 估计总体均数 判断观察对象的某项指标正

常与否 *να/2,t 也可用να,t (对应于单尾概率时);**α/2u 也可用να,u (对应于单尾概率时)。

9. 假设检验时,一般当P <0.05时,则拒绝H 0,理论根据是什么?

答:P 值是指从H 0规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如t 值或u 值)的概率。当P <0.05时,说明在H 0成立的条件下,得到现有检验结果的概率小于通常确定的小概率事件标准0.05。因小概率事件在一次试验中几乎不可能发生,现的确发生了,说明现有样本信息不支持H 0,所以怀疑原假设H 0不成立,故拒绝H 0。在下“有差别”的结论的同时,我们能够知道可能犯Ⅰ型错误的概率不会大于0.05(即通常的检验水准),这在概率上有了保证。

10. 假设检验中α和P 的区别何在?

答:α和P 均为概率,其中α是指拒绝了实际上成立的H 0所犯错误的概率,是进行统计推断时预先设

定的一个小概率事件标准。P值是由实际样本获得的,在H0成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。在假设检验中通常是将P与α对比来得到结论,若P≤α,则拒绝H0,接受H1,有统计学意义,可以认为……不同或不等;若P>α,则不拒绝H0,无统计学意义,还不能认为……不同或不等。

11.怎样正确选用单侧检验和双侧检验?

答:单双侧检验首先应根据专业知识来确定,同时也应考虑所要解决的问题的目的。若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验;在尚不能从专业知识判断两种结果谁高谁低时,用双侧检验。若研究者对低于或高于两种结果都关心,则用双侧检验;若仅关心其中一种可能,则取单侧检验。一般认为双侧检验较保守和稳妥,单侧检验由于充分利用了另一侧的不可能性,故更易得出有差别的结论,但应慎用。

12. t检验的应用条件是什么?

答:对单样本t检验要求资料服从正态分布;对配对t检验要求差值服从正态分布;对两样本t检验则要求两组数据均服从正态分布,且两样本对应的两总体方差相等,对两小样本尤其要求方差齐性。

13.I型错误与II型错误有何区别与联系?了解这两类错误有何实际意义?

答:I型错误指拒绝了实际上成立的H0所犯的“弃真”错误,其概率大小用α表示。则是指“接受”了实际上不成立的H0所犯的“取伪”错误,其概率大小用β表示。当样本含量n确定时,α愈小,β愈大;反之,α愈大,β愈小。了解这两类错误的实际意义在于,若在应用中要重点减少α(如一般的假设检验),则取α=0.05;若在应用中重点减少β(如方差齐性检验、正态性检验或想用一种方法代替另一种方法的检验等),则取α=0.10或0.20甚至更高。

14. 假设检验和区间估计有何联系?

答:假设检验用于推断质的不同即判断两个(或多个)总体参数是否不同,而可信区间用于说明量的大小即推断总体参数的范围。两者既相互联系,又有区别。假设检验与区间估计的联系在于可信区间亦可回答假设检验的问题,若算得的可信区间包含了H0,则按α水准,不拒绝H0;若不包含H0,则按α水准,拒绝H0,接受H1。也就是说在判断两个(或多个)总体参数是否不等时,假设检验和可信区间是完全等价的。

15. 为什么假设检验的结论不能绝对化?

答:因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。拒绝H0时,可能犯Ⅰ型错误;“接受” H0时可能犯Ⅱ型错误。无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字词如“肯定”、“一定”、“必定”就不恰当。

16.方差分析的基本思想和应用条件是什么?

答:方差分析的基本思想就是根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异SS组间可由处理因素的作用加以解释。通过比较不同变异来源的均方,借助F分布作出统计推断,从而推论各种研究因素对试验结果有无影响。

方差分析的应用条件为:①各样本是相互独立的随机样本,均服从正态分布;②相互比较的各样本的总体方差相等,即具有方差齐性。

17.在完全随机设计方差分析中SS组间、SS组内各表示什么含义?

答:SS组间表示组间变异,指各处理组样本均数大小不等,是由处理因素作用(如果有)和随机误差造成的;SS组内表示组内变异,指各处理组内变量值大小不等,是由随机误差造成的。

18.随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同?

答:随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上的不同之处,具体如下表所示:

区别

完全随机设计随机区组设计

设计采用完全随机化的分组方法,将全部试验对

象分配到g个处理组(水平组),各组分别接

随机分配的次数要重复多次,每次随机分配都

对同一个区组内的受试对象进行,且各个处理

受不同的处理

组受试对象数量相同,区组内均衡。 变异分解 三种变异:SS 总=SS 组间+SS 组内 四种变异:SS 总=SS 处理+SS 区组+SS 误差

19.如何确定应用于试验的拉丁方?

答:首先根据水平数g 来选定拉丁方大小;然后对选定的基本拉丁方做行列变换获得随机排列的拉丁方。 20. 为什么在方差分析的结果为拒绝H 0、接受H 1之后,对多个样本均数的两两比较要用多重比较的方法?

答:方差分析的备择假设H 1是g 个总体均数不全相等,拒绝H 0,接受H 1,只说明g 个总体均数总的来说有差别,并不说明两两总体均数都有差别。若想进一步了解哪两两总体均数不等,则需进行多个样本均数间的多重比较。

21.常用的相对数有哪几种?简述各种相对数指标的含义,计算方法及特点。

答:有强度相对数(率)、结构相对数(构成比)、相对比三种。

率的含义:某现象实际发生的例数与可能发生的总例数之比,说明某现象发生的频率或强度。其特点为:说明某现象发生的强度。

计算公式:比例基数观察单位总数

同期可能发生某现象的观察单位数某时期内发生某现象的率?= 构成比的含义:事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布,通常以100为比例基数,又称百分比。其特点为:①一组构成比的总和应等于100%,即各个分子的总和等于分母;②各构成部分之间是相互影响的,某一部分比重的变化受到两方面因素的影响,其一是这个部分自身数值的变化,其二是受其它部分数值变化的影响。

计算公式:%100?=观察单位总数

同一事物各组成部分的位数某一组成部分的观察单构成比 相对比的含义:是两个有关指标之比,说明两指标间的比例关系。其特点为:两个指标可以是性质相同,也可以是性质不同;两个指标可以是绝对数、相对数或平均数。

计算公式:%)100(?=乙指标

甲指标相对比 23.何为标准化法?简述直接标准化法与间接标准化法的区别。

答:采用某影响因素(如年龄、性别、工龄、病情轻重、病程长短等)的统一标准构成,然后计算标准化率的方法称为标准化法,其目的是消除原样本内部某影响因素构成不同对合计率的影响,使通过标准化后的标准化合计率具有可比性。直接标准化法和间接标准化法的主要区别是:如对死亡率的年龄构成标准化,若已知年龄别死亡率,可采用直接法,选择一个标准年龄人口构成直接计算标准化率;若只有总的死亡数和年龄别人口数而缺乏年龄别死亡率时,宜采用间接法,选择一个标准年龄别死亡率,先计算标准化死亡比(SMR),再用SMR 乘以标准总死亡率得标准化死亡率。

24.应用标准化率进行比较时要注意什么问题?

答:(1)标准化法只适用于因两组内部构成不同,并有可能影响两组总率比较的情况。对于因其它条件不同而产生的可比性问题,标准化法不能解决。

(2)由于选择的标准人口不同,算出的标准化率也不同。因此,当比较几个标准化率时,应采用同一标准人口。

(3)标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。

(4)两样本标准化率是样本值,存在抽样误差。比较两样本的标准化率,还应作假设检验。

25.相对数的动态指标有哪几种?各有何用处?

答:相对数的动态指标即其动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。

绝对增长量是说明某相对数在一定时期增长的绝对值;发展速度与增长速度均为相对比,说明某相对数在一定时期的速度变化;平均发展速度是各环比发展速度的几何均数,说明其相对数在一个较长时期中逐期(如逐年)平均发展变化的程度。

26.简述二项分布的应用条件。

答:二项分布的应用条件:①每次试验只会发生两种互斥的可能结果之一,即两种互斥结果的概率之和恒等于1;②每次试验产生某种结果(如“阳性”)的概率固定不变;③重复试验是互相独立的,即任何一次试验结果的出现不会影响其它试验结果出现的概率。

27.简述Poisson 分布的性质特征。

答:Possion 分布的性质特征:①总体均数λ与总体方差?2相等;②当n 很大,而π很小,且nπ=λ为常数时,Possion 分布可看作是二项分布的极限分布;③当λ增大时,Possion 分布渐近正态分布。一般而言,λ≥20时,Possion 分布资料可作为正态分布处理;④Possion 分布具备可加性。即对于服从Possion 分布的m 个互相独立的随机变量X 1,X 2,…,X m ,它们之和也服从Possion 分布,且其均数为这m 个随机变量的均数之和。

28.简述二项分布与Poisson 分布的区别。

答:所谓随机变量X 服从二项分布,是指在n 重Bernoulli 试验中,发生某种结果(如“阳性”)的次数

X=0,1,2,…,n 的一种概率分布,其恰好发生X 个阳性的概率为X X n X n ππ)(1C P(X)--=,其中

[]X)!(n X!/n!C X

n

-=,且总有1P(X)n

X =∑=。式中X=0, 1, 2,…, n ,“!”为阶乘符号,n !=1×2×3×4×…×n ,并约定0!=1。

而所谓随机变量X 服从Possion 分布,是指X 满足:①取值范围为0, 1, 2,…, n ;②相应的概率为

/X !λe P(X)X

-λ=,且总有1P(X)n

0X =∑=。在总体率π很小,而样本含量(试验次数)n 趋向于无穷大时,二项分布近似于Possion 分布。因此,Possion 分布可看作是二项分布的一种极限情况,可用来描述小概率事件发生的规律性。

30.简述二项分布、Poisson 分布和正态分布间的联系。

答:二项分布、Possion 分布和正态分布间的联系为:①在n 很大,而π很小,且nπ=λ为常数时,二项分布的极限分布为Possion 分布;②在n 较大,π不接近0也不接近1时,二项分布B(n, π)近似正态分布N(nπ, )1(ππ-n ),

而相应的样本率p 的分布也近似正态分布N(π, ?p );③当λ增大时,Possion 分布渐近正态分布。一般二言,λ≥20时,Possion 分布资料可作为正态分布处理。

31. 说明χ2检验的用途。

答:χ2检验的用途较广。通常多用于①推断两个总体率或构成比之间有无差别;②推断多个总体率或构成比之间有无差别;③多个样本率的χ2分割;④两个分类变量之间有无关联性;⑤频数分布拟合优度的χ2检验。

32. 两样本率比较的u 检验与χ2检验有何异同?

答:两样本率比较时,若对同一资料同时进行u 检验与χ2检验,在不校正的情况下,χ2=u 2;但u 检验通常用于大样本,而χ2检验可用于大样本或小样本。

33. 对于四格表资料,如何正确选用检验方法?

答:(1)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。

(2)对于两样本率比较的四格表资料,应根据各格的理论值T 和总例数n 的大小选择不同的χ2计算公

式:①当n≥40且所有的T≥5时,用χ2检验的基本公式∑-=T T)(A χ2

2

或四格表资料χ2检验的专用公式d)c)(b d)(a b)(c (a n bc)(ad χ22

++++-=,②n≥40,且任一理论频数T 有1≤T <5,用四格表资料χ2检验的校正公式∑-=T 0.5)-T A (22

c

χ或d)c)(b d)(a b)(c (a n/2)-bc ad n(χ2

2c ++++-=或用四格表资料的Fisher 确切概率法;③当n <40,或T <1时,用四格表资料的Fisher 确切概率法。

若资料满足两样本率u 检验的条件,也可用u 检验。

(3)对于配对设计的四格表资料,若检验两种方法的检测结果有无差别时:①(b+c) ≥40,

c b c)(b χ22+-=;②(b+c) <40, c

b 1)-

c b (χ22c +-=。 34. 说明行?列表资料χ2检验应注意的事项。

答:(1)行×列表中的理论频数不应小于1,或1≤T <5的格子数不宜超过格子总数的1/5。

(2)多个样本率比较,若所得统计推断为拒绝H 0,接受H 1时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率之间皆有差别。要进一步推断哪两个总体率之间有差别,需进一步做多个样本率的χ2分割或多重比较。

(3)对于有序的R×C 表资料不宜用χ2检验。对于R×C 表的资料要根据其分类类型和研究目的选用恰当的检验方法。

35. 说明R×C 表的分类及其检验方法的选择。

答:(1)分类:R×C 表可以分为双向无序、单向有序、双向有序属性相同和双向有序属性不同4类。

(2)检验方法的选择:①双向无序R×C 表:若研究目的为多个样本率(或构成比)的比较,可用行×列表资料的χ2检验;若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可用行×列表资料的χ2检验以及Pearson 列联系数进行分析。②单向有序R×C 表:若R×C 表中的分组变量是有序的,而指标变量是无序的,此种单向有序R×C 表资料可进行行×列表资料的χ2检验分析其构成情况;若R×C 表中的分组变量为无序的,而指标变量是有序的,此种单向有序R×C 表资料宜用秩和检验分析。③双向有序属性相同的R×C 表:宜用一致性检验分析两种检测方法的一致性。④双向有序属性不同的R×C 表:若研究目的如为分析不同年龄组患者疗效之间有无差别时,可把它视为单向有序R×C 表资料,选用秩和检验;若研究目的为分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验。

36.什么叫做非参数检验?它和参数检验有什么区别?

答:非参数检验对总体分布不作严格假定,不受总体分布的限制,又称任意分布检验,它直接对总体分布(或分布位置)作假设检验。如果总体分布为已知的数学形式,对其总体参数作假设检验则为参数检验。

37.什么叫做秩转换的非参数检验?它适用于哪些情况?

答:秩转换的非参数检验是先将数值变量从小到大或等级从弱到强转换成秩后,再计算检验统计量,其特点是假设检验的结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。它适用于:不满足正态或(和)方差齐性的小样本计量资料;分布不知是否正态的小样本资料;一端或两端是不确切数值的资料;等级资料。

38.两组或多组等级资料的比较,为什么不能用χ2检验,而用秩转换的非参数检验?

答:若选行×列表资料的χ2检验,只能推断两个或多个总体的等级构成比差别,这一般不是推断目的;而选秩转换的非参数检验,可推断两个或多个总体的等级强度差别,这是推断目的。

39.总体有n 个秩:1,2,…, n 。若n 个秩中有相同秩(如1,2,4,4,4,6,7,…n ),其均数和方差是否会改变?

变大还是变小?

答:均数不改变,方差改变,方差变小。

40.两独立样本比较的Wilcoxon 秩和检验,当n 1>10或n 2-n 1>10时用u 检验,这时检验是属于参数检验还是非参数检验,为什么?

答:属于非参数检验。因为这时的u 检验是比较例数较小组秩和(T)与其总体均数(n 1(N+1)/2)的差别,而秩和(T)不是参数。

42.试总结从样本数据判断总体回归关系是否成立的统计方法有哪些?

答:用t b 、t r 作t 检验;用F 对b 和R 2作方差分析;直接查τ界值表。

43.现有根据10对数据算出的直线回归方程:?Y

=2.1+0.8X ,只有X 和Y 的均数、标准差,而原始数据丢失时如何判定回归方程是否成立?

答:例如可以利用r=b×S X /S Y ,求得相关系数,然后查相关系数界值表对回归方程作假设检验。

44.请计算直线回归中残差和自变量之间的积差相关系数。

答:可以证明,残差Y

Y E ?-=与自变量X 之间的相关系数为0。 证:只需证明二者的离均差积和∑=--=0)X )(X E (E l EX

因为bX a Y

+=?的均数为X b a +,所以0X b a Y E =--=,故有: ∑∑∑---=---=--=)bX)(X a (Y )(X 0)Y

(Y ))(X (E l EX ? 0bl l )X (X b )X )(X Y (Y )X )](X X b(X )Y [(Y )X (X bX)X b Y (Y XX

XY 2

=-=-+--=--+-=--+-∑∑∑∑ 45.直线回归分析中应注意哪些问题?

答:(1)两个变量的选择一定要结合专业背景,不能把毫无关联的两种现象勉强作回归分析,其中哪一个作为应变量主要是根据专业上的要求而定,同时直线回归要求至少对于每个X 相应的Y 要服从正态分布,X 可以是服从正态分布的随机变量也可以是能精确测量和严格控制的非随机变量。

(2)进行直线回归分析前应绘制散点图,以检查数据是否满足模型基本假设,发现异常点并进行进一步处理。

(3)对结果应有正确解释。反映两变量间数量上影响大小的统计量应该是回归系数的绝对值,而不是假设检验的P 值。P 值越小只能说越有理由认为变量间的直线关系存在,而不能说关系越密切或越 “显著”。直线回归用于预测时应尽量避免不合理的外延。结果中的决定系数可表示两变量关系的实际效果。

46.简述直线回归与直线相关的区别与联系。

答:两者的联系:①对于既可以作相关又可作回归分析的同一组数据,计算出的b 与r 正负号一致。②相关系数与回归系数的假设检验等价,即对于同一样本,t b =t r 。③同一组数据的相关系数和回归系数可以相互换算:r=b Y·X ×S X /S Y 。④用回归解释相关:由于决定系数r 2=SS 回/SS 总,当总平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则r 2越接近1,说明相关的效果越好。

两者的区别:①资料要求上:相关要求X 、Y 服从双变量正态分布,这种资料进行回归分析称为Ⅱ型回归;回归要求Y 在给定某个X 值时服从正态分布,X 是可以精确测量和严格控制的变量,称为Ⅰ型回归。②应用上:说明两变量间相互关系用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,用以说明Y 如何依赖于X 而变化。③意义上:r 说明具有直线关系的两变量间相互关系的方向和密切程度;b 表示X 每变化一个单位所导致Y 的平均变化量。④计算

上:YY XX XY l l l r /=,XX XY l l b /=。⑤取值范围:-1≤r ≤1,- ∞<b <∞。⑥单位:r 没有单位,b 有单位。

47.简述直线相关与秩相关的区别与联系。

答:二者的联系:①两者所解决的应用问题相同,都可用来表示两个数值变量之间关系的方向和密切程度。②两个相关系数都没有单位,取值范围都在(-1,1)之间。③计算上,用秩次作积差相关,得到的就是秩相关系数。

二者的区别:①资料要求不同:积差相关要求X 、Y 服从双变量正态分布,秩相关可以是任意分布。②由于资料要求不同,二者属于参数统计与非参数统计方法,所以符合分布条件时,积差相关的效率高于秩相关。③二者假设检验方法不同。

48.简述曲线拟合时的注意事项。

答:①首先应绘制散点图,根据图形选用恰当的回归模型形式;②求解回归方程时注意,模型中对Y 进行非线性变换后,应采用非线性最小二乘估计,如果仅对X 进行变换,普通最小二乘估计与非

线性最小二乘估计结果相同;③并非R 2越大所选择的模型就越好;④R 2的计算上等于Y 与Y

?的相关系数平方,而不是总等于Y 与X 的相关系数平方。

49. 在统计描述中,统计表和统计图分别起着什么作用?

答:在统计描述过程中,统计表展示统计数据的结构、分布和主要特征,便于在进一步分析中选择和计算统计量。在学术报告和论文中常用统计表代替冗长的文字叙述,表达主要的研究结果、数据、指标和统计量,方便读者作比较和掌握主要研究结果。统计图将统计数据形象化,让读者更易于领会统计资料的核心内容,易于做分析比较,并且可以给读者留下深刻的印象。

50. 统计表的制作原则和要求有哪些?

答:统计表的制表原则:首先是重点突出,一张表一般只表达一个中心内容,不要把过多的内容放在一个庞杂的大表里,宁愿用多个表格表达不同指标和内容。其次,统计表就如完整的一句话,有其描述的对象(主语)和内容(宾语)。通常主语放在表达左边,作为横标目;宾语放在右边,作为纵标目。由左向右读,构成完整的一句话。最好,统计表应简单明了,一切文字、数字和线条都尽量从简。

制表的基本要求:①标题:概括表的主要内容,包括研究的时间、地点和研究内容,放在表的上方。②标目:分别用横标目和纵标目说明表格每行和每列数字的意义,注意标明指标的单位。③线条:至少用三条线,表格的顶线和底线将表格与文章的其它部分分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。部分表格可再用横线将合计分隔开,或用横线将两纵标目分割开。其它竖线和斜线一概省去。④数字:用阿拉伯数字表示。无数字用“—”表示,缺失数字用 “…”表示,数值为0者记为“0”,不要留空项。数字按小数位对齐。⑤表中数字区不要插入文字,也不列备注项。必须说明者标“*”号,在表下方说明。

51. 统计图的制作原则和要求有哪些?

答:统计图的绘制原则和要求有:①根据资料性质和分析目的正确选用适当的统计图。例如分析比较独立的、不连续的、无数量关系的多个组或多个类别的统计量(如例数、相对数和均数等)宜选用直条图,分析某指标随时间或其它连续变量变化而变化的趋势宜选用线图,描述某变量的频数分布宜选用直方图,描述或比较不同事物内部构成比时用圆图或百分比条图等。②与统计表相似,统计图必须有标题,概括统计图资料的时间、地点和主要内容。统计图的标题放在图的下方。③统计图一般有横轴和纵轴,并分别用横标目和纵标目说明横轴和纵轴代表的指标和单位。一般将两轴的相交点即原点处定为0。纵横轴的比例一般以5:7或7:5为宜。④统计图用不同线条和颜色表达不同事物和对象的统计量,需要附图例加以说明。图例可放在图的右上角空隙处或下方中间位置。

52. 常用的统计图有哪几种,各适用于什么类型资料?

答:常用的统计图有直条图、直方图、圆图或构成比直条图、线图和统计地图。直条图适用于比较独立分类组的统计指标,直方图适用于描述频数分布,圆图和构成比直条图适用于描述构成比,线

图适用于描述某统计量随时间或另一统计量变化而变化的趋势,统计地图适用于描述统计指标的地理分布。

53. 统计表与统计图有何联系和区别?

答:统计表和统计图都是清晰地、有条理地展示数据,让读者易于领会统计资料的核心内容,易于做比较分析。统计图将统计数据形象化,可以给读者留下深刻的印象。但统计图只能提供概略的情况,而不能获得确切数值,因此不能完全代替统计表,常需要同时列出统计表作为统计图的数值依据。

教育统计学考试复习资料

第一章:1、何谓心理与教育统计学?学习它有何意义? 教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析教育科学研究中获得的随机性数据资料,并根据这些数据资料所传递的信息,进行科学推论找出教育活动规律的一门科学。具体讲,就是在教育研究中,通过调查、实验、测量等手段有意获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 意义:(1)统计学为科学研究提供了一种科学方法。(2)教育统计学是教育科学研究定量分析的重要重要工具。 (3)广大教育工作者学习教育统计学既可以顺利地阅读国内外先进的研究成果,又可以提高工作的科学性和效率,同时也为学习教育测量打下基础。 2、教育科学研究数据的特点 (1)教育科学研究数据与结果多用数字形式呈现;(2)教育科学研究数据具有随机性和变异性;(3)教育科学研究数据具有规律性;(4)教育科学研究的目的是通过部分数据来推测总体特征。总之,在教育科学实验或调查中,所获得的数据都具有变异性与规律性的特点。 3、思考题:选用统计方法有哪几个步骤? ①要分析一下实验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方 法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。②要分析实验数据的类型。不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。③要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。 4、教育统计学的分类 (1)依研究的问题实质来划分,教育统计学的研究内容可划分为描述一件事物的性质、比较两件事物之间的差异、分析影响事物变化的因素、一件事物两种不同属性之间的相互关系、取样方法等等。(2)依统计方法的功能进行分类,教育统计学的研究内容可分为描述统计、推论统计和实验设计。 5、描述统计:主要研究如何整理科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性 质。 具体内容包括:(1)数据如何分组,如何使用各种统计图表描述一组数据的分布情况;(2)怎样计算一组数据的特征值,简缩数据,进一步描述一组数据的全貌;(3)表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件,描述数据分布特征的峰度及偏度系数计算方法等。 6、推论统计:主要研究如何通过局部数据所提供的信息,推论总体(或称全局)的情形。 具体内容包括:(1)如何对假设进行检验,即各种各样的假设检验,包括大样本检验方法(z检验),小样本检验方法(t检验),各种计数资料的假设检验的方法(百分数检验、χ2检验等),变异数分析的方法(F检验),回归分析方法等等。(2)总体参数的估计方法。(3)各种非参数的统计方法等。 7、思考题:描述统计、推论统计和实验设计这三部分统计内容有何关系? 教育统计学的三个组成部分的内容不是截然分开的,而是相互联系的。描述统计是推论统计的基础,推论统计离不开描述统计计算所获得的特征值;描述统计只是对数据进行一般的分析归纳,如果不进一步应用推论统计作进一步的分析,描述统计的结果就不会产生更大的价值和意义,达不到统计分析的最终目的要求。同样,只有良好的实验设计才能使所获得的数据具有意义,进一步的统计处理才能说明问题。当然一个好的实验设计,也必须符合基本的统计方法的要求,否则,再好的设计,如果事先没有确定适当的统计方法处理,在处理研究结果时可能会遇到许多麻烦问题。 8、教育统计与心理统计的异同 相同之处:二者的研究对象都是人,教育现象在很多情况下要通过人的心理现象去观察和分析,统计方法基本相同。不同之处:①在统计方法上:在教育方面的研究中,大样本的统计方法应用较多;而在心理学上小样本的方法较多。②在实验设计的水平上:教育实验中控制因素较难,采用自然实验、准实验设计方式较多,对统计结果的解释需要特别谨慎;而心理学实验则在实验室条件下进行较多,对各种实验变量的控制相对容易,统计处理结果的解释也较易进行。 9、数据的类型 (一)从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。 计数数据是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数的形式。测量数据是借助于一定的测量工具或一定的测量标准而获得的数据。 (二)根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。

厦门大学统计学原理期末试题与答案完整版

厦门大学网络教育 2013-2014学年第一学期 《统计学原理》复习题 、单选题 1、统计调查方法体系中,作为“主体”的是( A ) A .经常性抽样调查 B.必要的统计报表 2、考虑全国的工业企业的情况时,以下标志中属于不变标志的有( A .产业分类 B.职工人数 C.劳动生产率 3、某地区抽取3个大型钢铁企业对钢铁行业的经营状况进行调查,这种调查是 4、下列这组数列15,17,17,18,22,24,50,62的中位数是(C )。 现象之间的相关程度越低,贝刑关系数越( 接近+1 B 接近-1 接近0 8、假定其他变量不改变,研究一个变量和另一个变量间的相关关系的是( 9、已知两个同类型企业职工平均工资的标准差分别为 8元,12元,则两个企业职 工平均工资的代表性是(A ) 10、( C 。是标志的承担者。 C.重点调查及估计推算 D.周期性普查 D.所有制 A .普查 B .典型调查 C.重点调查 D .抽样调查 A.17 B.18 C.20 5、标志变异指标中最容易受极端值影响的是( A.极差 B.平均差 &简单分组与复合分组的区别在于( 总体的复杂程度不同 选择分组标志的性质不同 A. C. D.22 C. B. D. 标准差 D.标准差系数 ) 组数多少不同 选择的分组标志的数量不同 7、 A.偏相关 B.正相关 C.完全相关 D.复相关 A.甲大于乙 B.乙大于甲 C. 一样的 D.无法判断

11、 下列各项中属于数量标志的是(A ) A.年龄 B.学历 C.民族 D.性别 12、 某商品价格上涨了 5%,销售额增加了 10%,则销售量增加了( C ) A. 15% B. 5.2 % C. 4.8 % D. 2 % 13、某变量数列末组为开口组,下限是 500;又知其邻组的组中值是 480,则该组 的组 中值应为(D )0 B.时间和指标数值 C.时间和次数 20、现象总体中最普遍出现的标志值是( A ) A.变量 B.总体 C.总体单位 D.指标 A. 490 B. 500 C. 510 D. 520 14、根据最小二乘法原理所配合的一元线性回归方程,是使( B )0 无 (Y -Y?)2 为最小 送(Y -Y?) = 0 A S (Y -Y ) = 0 C 送(Y -Y )为最小 15、 以下不是统计量特点的是( A.不确定 B.已知 16、 不属于专门调查的有(A A.统计年报 B.抽样调查 C.未知 C 普查 17、 今有N 辆汽车在同一距离的公路上行驶的速度资料, Z xf B. ----- Z f C 旦 C 7 x D.不唯一 D.典型调查 m 表示路程,x 表示速度, ) D. 18、 抽样推断的特点有(B )0 A.事先人为确定好样本 C.缺乏一定的科学性和可靠性 19、 时间数列的构成要素是( B.按随机原则抽取样本 D.事先无法计算和控制抽样误差 A.变量和次数 D.主词和宾词 A.众数 B.中位数 C.平均数 D.频数 21、定基发展速度等于相应的各环比发展速度(C A.之和 B.之差 C.之积 D.之商 22、平均指标不包括(A ) 0 A.标准差 B.调和平均数

大学统计学期末考试试题

河南科技学院2016-2017学年第一学期期终考试 统计学试卷(A 卷) 适用班级:人力141-人力145。 注意事项:1.在试卷的标封处填写院(系)、专业、班级、姓名和准考证号。 2. 考试时间共100分钟。 一、名词解释 参数 分层抽样 离散系数 中心极限定理 参数估计 号证考准

、选择题. 1、统计学的研究对象是( ) A 、各种现象的内在规律 B C 、统计活动过程 D 、各种现象的数量方面 、总体与样本的关系 2、以产品的等级来衡量某种产品的质量好坏,则该产品等级是( A 、数量指标 B 、质量指标 C 、数量标志 3、一个统计总体( )。 A 、只能有一个标志 B C 、可以有多个标志 D D 品质标志 、只能有一个指标 、可以有多个指标 4、对某企业500名职工的工资收入状况进行调查, 则总体单位是( ) A 、每一名职工 B C 、500名职工 D 5、在全国人口普查中,( )。 A 、女性是品质标志 B C 、人口的平均寿命是数量指标 D 6重点调查的重点单位是( )。 A 、收集数据资料的重点单位 、每一名职工的工资水平 、500名职工的工资总额 、某人的年龄30岁是变量 、全国人口总数是统计指标 B 、在全局工作中处于重要地位的单位 C 这些单位的标志值在总体标志总量中占有很大比重 D 这些单位数量占总体单位数的很大比重 7、 要了解我国煤炭生产的基本情况,最适合的调查方式是( ) A 、抽样调查 B 、重点调查 C 、典型调查 D 普查 8、 对一批商品进行质量检验,最适宜采用的方法( )。 A 、全面调查 B 、抽样调查 C 、典型调查 D 重点调查 9、 目前我国城镇职工家庭收支情况调查是采用( )。 A 、普查 B 抽样调查 C 、典型调查 D 重点调查 10、 下列分组中属于按品质标志分组的是( ) A 、学生按考试分数分组 E 、产品按品种分组

2017统计学考试复习资料

统计学考试复习资料 简答题(12题选5个) 1、统计数据的类型有哪些? (1)、按计量层次分类: a.分类数据:只能归于某一类别的非数字型数据;对事物进行分类的结果,数据表现为类别,用文字来表述,例如:人口按性别分为男、女两类。 b.顺序数据:只能归于某一有序类别的非数字型数据;对事物类别顺序的测度,数据表现为类别,用文字来表述,例如:产品分为一等品、二等品、三等品、次品等。 c.数值型数据:按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度,例如:身高为175cm、168cm、183cm。 (2).按收集方法分类: a.观测的数据:通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据。 b.试验的数据:在试验中控制试验对象而收集到的数据,比如,对一种新药疗效的试验,对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数据。 (3).按时间状况分类: a.截面数据:在相同或近似相同的时间点上收集的数据 描述现象在某一时刻的变化情况,比如,2005年我国各地区的国内生产总值数据。 b.时间序列数据:在不同时间上收集到的数据描述现象随时间变化的情况比如,2000年至2005年国内生产总值数据。 2、简述数据误差的来源? (1)抽样误差:由于抽样的随机性带来的误差,所有样本可能的结果与总体真值

之间的平均性差异,影响抽样误差的大小的因素为样本量的大小和总体的变异性。 (2)非抽样误差:相对抽样误差而言,除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异。存在与所有的调查之中:概率抽样、非概率抽样、全面性调查。有抽样框误差、回答误差、无回答误差、调查员误差、测量误差。 3、衡量数据离散程度的指标有哪些? 衡量数据离散程度的指标有:(1).异众比率,用于测度分类数据的离散程度,衡量众数对一组数据的代表程度;(2).四分位差,用于测量顺序数据的离散程度,衡量中位数对一组数据的代表程度;(3).方差和标准差,用于测度数据离散程度的最常用测度值,衡量均值对一组数据的代表程度。 4、为什么说正态分布是客观现象中最主要的分布? 正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。 5、请你说明小概率原理的含义? 在概率论中,我们将发生概率很小一般来说不超过百分之五的事件称为小概率事件,小概率原理指的是在假设检验中,我们提出一个假设,用小概率事件去检验,如果小概率事件发生了,证明我们的假设有问题。 6、评价估计量的标准有哪些?并解释他们的含义。 在实际工作中,总体参数往往是未知的,需要使用样本统计量来估计总体参数。衡量估计量优劣的标准一般有以下三个: (1)无偏性:无偏性不是要求估计量与总体参数不得有偏差,因为这是不可能的,既然是抽样,必然存在抽样误差,不可能与总体完全相同。无偏性指的是如果对这同一个总体反复多次抽样,则要求各个样本所得出的估计量(统计量)的平均值等于总体参数。符合这种要求的估计量被称为无偏估计量。(2)有效性:估计量与总体之间必然存在着一定的误差,衡量这个误差大小的一个指标就是方差,

《统计学原理》期末复习资料(1)

2015秋季学期《统计学原理》复习资料 一、单选题 1. 某厂4月份产量与1月份产量相比增长了10%,若已知4月份产量为1000,那么1月份的产量为(A )。 A.909.09 B.976.45 C.968.73 D.1032.28 2.以下各项属于品质标志的有(B )。 A.工龄 B.健康状况 C.工资水平 D.劳动时间利用率 3.连续变量( C)。 A.表现形式为整数 B.取值可一一列举 C.取值连续不断,不能一一列举 D.一般都四舍五入取整数 4.了解某公司职工文化程度情况,总体单位是( B)。 A.该公司全体职工 B.该公司每一位职工 C.该公司全体职工文化程度 D.该公司每一位职工文化程度 5.在某市工业设备普查中,调查单位是(D )。 A. 该市每一家工业企业 B. 该市全部工业设备 C. 该市全部工业企业 D. 某公司新推出了一种饮料产品,欲了解该产品在市场上的受欢迎程度,公司派人到各商 场、超市随机调查了200 名顾客。该公司采用的调查方法是(C )。 A. 直接观察法 B. 报告法 C. 访问调查法 D.很难判断 7.企业要对流水生产线上的产品质量实行严格把关,那么,在质量检验时最合适采用的调 查组织方式是( D)。 A. 普查 B. 重点调查 C.典型调查 D. 抽样调查 8. 统计资料按数量标志分组后,处于每组两端的数值叫(C )。 A. 组距

C. 组限 D. 组中值 9.统计分组的核心问题是(A )。 A.选择分组的标志 B.划分各组界限 C.区分事物的性质 D.对分组资料再分组 10. 在分组的情况下,总体平均指标数值的大小(C )。 A. 只受各组变量值水平的影响,与各组单位数无关 B. 只受各组单位数的影响,与各组变量值水平无关 C. 既受各组变量值水平的影响,又与各组次数有关 D. 既不受各组变量值水平的影响,也部受各组次数的影响 11. 在组距数列中,用组中值作为计算算术平均数直接依据的假定条件是(D )。 A. 各组次数必须相等 B. 各组必须是闭口组 C. 总体各单位变量值水平相等 D. 总体各单位变量值水平在各组内呈均匀分布 12. 标志变异指标反映了总体各单位变量值分布的(B )。 A. 集中趋势 B. 离散趋势 C. 变动趋势 D. 长期趋势 13. 抽样误差( D)。 A.既可以避免,也可以控制 B. 既不可以避免,也不可以控制 C. 可以避免, 但不可以控制 D. 不能避免, 但可以控制 14. 抽样平均误差反映了样本估计量与总体参数之间的(C )。 A. 实际误差 B. 可能误差范围 C. 平均差异程度 D. 实际误差的绝对值 15.凡是用来反映现象数量对比关系的相对数被称为( C)。 A. 增(减)量 B. 增加速度 C. 广义指数 D. 狭义指数 16.用来反映个别事物数量对比的相对数称为( C)。 A. 总指数 B. 类指数 C. 个体指数 D. 平均指数 17.在综合指数的变形中,加权算术平均指数所用权数是(D )。

大学统计学简答题复习及答案

习题一总论 1?简述统计总体和总体单位的含义及其关系。 统计总体(简称总体)是指统计所研究的事物的全体,它是由客观存在的具有某种共同性质的许多个别事物组成的集合体。总体单位是指构成统计总体的个别事物,是组成总体的基本单位,简称个体。统计总体和总体单位所指的具体内容不是固定不变的,而是随着研究的目的不同而变化的。总体可以变为总体单位,总体单位可以变为总体。 2 ?什么是指标和标志?指标与标志的关系如何? 指标即统计指标,指反映统计总体综合数量特征的概念和数值。标志指说明总体单位特征的名称。指标与标志的区别:①指标是说明总体特征的,而标志是说明总体单位特征的;②所有指标都能用数值表示,而标志中的数量标志能用数值表示,品质标志却通常不能用数值表示。指标与标志的联系:①指标是对总体中各单位标志表现进行综合的结果,有许多统计指标其数值是由数量标志值汇总而来的,品质标志本身虽无数值,但许多指标却是按品质标志分组计算出来的。②指标和数量标志之间存在着变换关系,由于研究目的的变化,原来的总体变成总体单位,则相对应的统计指标就变成数量标志;反之,则相对应的数量标志就变成了统计指标。 习题二统计调查 1.完整的统计调查方案应包括哪些主要内容? 应包括:①确定调查目的;②确定调查对象和调查单位;③确定调查内容,拟订调查表;④ 确定调查时间和调查期限;⑤确定调查的组织和实施计划。 2.调查对象、调查单位和填报单位有何区别? 调查对象是指根据调查目的确定的需要进行调查研究的现象总体,它是由性质相同的许多个别单位组成的。调查单位是指调查对象中所要调查的具体单位,它是进行登记的标志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,它与调查单位有时一致,有时不一致。 3?重点调查与典型调查的区别是什么? 主要区别表现在两个方面: ①典型单位和重点单位性质不同。典型调查强调被选单位在同类社会经济现象中所具有的代表性、典型性,是有 意识地选取的;而重点调查则强调被选单位某标志值在总体标志值总和中所占的比重较大,是客观存在的。 ②侧重点不同。典型调查的主要目的是认识事物本质特征及其发展规律,调查深入细致,同时也注重定性调查; 而重点调查的目的主要是掌握总体的数量状况,着眼于普遍情况,注重量的调查。

统计学期末考试题库及答案

第一章绪论 一、填空题 1.标志是说明特征的,指标是说明数量特征的。 2.标志可以分为标志和标志。 3.变量按变量值的表现形式不同可分为变量和变量。4.统计学是研究如何、、显示、统计资料的方法论性质的科学。 5.配第在他的代表作《》中,用数字来描述,用数字、重量和尺度来计量,为统计学的创立奠定了方法论基础。 二、判断题 1.企业拥有的设备台数是连续型变量。() 2.学生年龄是离散型变量。() 3.学习成绩是数量标志。() 4.政治算术学派的创始人是比利时的科学家凯特勒,他把概率论正式引进统计学。() 5.指标是说明总体的数量特征的。() 6.对有限总体只能进行全面调查。() 7.总体随着研究目的的改变而变化。() 8.要了解某企业职工的文化水平情况,总体单位是该企业的每一位职工。() 9.数量指标数值大小与总体的范围大小有直接关系。() 10.某班平均成绩是质量指标。() 三、单项选择题 1.考察全国的工业企业的情况时,以下标志中属于数量标志的是( )。 A.产业分类 B.劳动生产率 C.所有制形式 D.企业名称 2.要考察全国居民的人均住房面积,其统计总体是( )。 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户 3.若要了解全国石油企业采油设备情况,则总体单位是( )。 A.全国所有油田 B.每一个油田 C.每一台采油设备 D.所有采油设备

4.关于指标下列说法正确的是( )。 A.指标是说明总体单位数量特征的 B.指标都是用数字表示的 C.数量指标用数字表示,质量指标用文字表示 D.指标都是用文字表示的 5.政治算术学派的代表人物是 ( )。 A.英国人威廉·配第 B.德国人康令 C.德国人阿亨瓦尔 D.比利时人凯特勒 6.关于总体下列说法正确的是( )。 A.总体中的单位数都是有限的 B.对于无限总体只能进行全面调查 C.对于有限总体只能进行全面调查 D.对于无限总体只能进行非全面调查 7.关于总体和总体单位下列说法不正确的是( )。 A.总体和总体单位在一定条件下可以相互转换 B.总体和总体单位是固定不变的 C.构成总体的个别单位是总体单位 D.构成总体的各个单位至少具有某种相同的性质 8.关于标志下列说法不正确的是( )。 A.标志是说明总体单位特征的 B.品质标志是用文字表示的 C.数量标志是用数字表示的 D.数量标志说明总体量的特征 9.关于变量下列说法不正确的是( )。 A.只能取整数的变量是离散变量 B.可以用小数表示的是连续变量 C.只能用小数表示的是连续变量 D.数量标志的具体表现称为变量值 10.关于指标下列说法不正确的是( )。 A.数量指标说明总体规模和水平 B.数量指标用绝对数表示 C.质量指标只能用相对数表示 D.质量指标用相对数或平均数表示 四、多项选择题 1.属于连续型变量的有( )。 A.国内生产总值 B.企业数 C.身高 D.体重 E.人数2.属于离散型变量的有( )。 A.增加值 B.学校数 C.机器台数 D.销售额 E.粮食产量3.下列属于品质标志的有( )。

关于生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). 12 2--∑∑n n x x )(

高校统计学期末考试试题及答案

1、一个统计总体( ) A 、只能有一个标志 B 、只能有一个指标 C 、可以有多个标志 D 、可以有多个指标 2、调查某大学2000名学生学习情况,则总体单位是( ) A 、2000名学生 B 、 2000名学生的学习成绩 C 、每一名学生 D 、 每一名学生的学习成绩 3、某地进行国有商业企业经营情况调查,则调查对象是( )。 A 、该地所有商业企业 B 、该地所有国有商业企业 C 、该地每一国有商业企业 D 、该地每一商业企业 4、以下哪种调查的报告单位与调查单位是一致的( )。 A 、工业普查 B 、工业设备调查 C 、职工调查 D 、未安装设备调查 5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是( )。 A 、调查时间 B 、调查期限 C 、标准时间 D 、登记期限 6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组为60——70,第四组为70——80,第五组为80以上,则( ) A 、50在第一组,70在第四组 B 、60在第三组,80在第五组 C 、70在第四组,80在第五组 D 、80在第四组,50在第二组 7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( ) A 、简单算术平均法 B 、加权算术平均法 C 、加权调和平均法 D 、几何平均法 8、用水平法检查长期计划完成程度,应规定( ) A 、计划期初应达到的水平 B 、计划期末应达到的水平 C 、计划期中应达到的水平 D 、整个计划期应达到的水平 9、某地区有10万人,共有80个医院。平均每个医院要服务1250人,这个指标是( )。 A 、平均指标 B 、强度相对指标 C 、总量指标 D 、发展水平指标 10、时间序列中,每个指标数值可以相加的是( )。 A 、相对数时间序列 B 、时期数列 C 、间断时点数列 D 、平均数时间序列 11、根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是( )。 A 、时间序列中各期的逐期增长量大体相等 B 、各期的二级增长量大体相等 C 、各期的环比发展速度大体相等 D 、各期同比增长量的大体相 12、红星机械厂计划规定,今年甲产品的单位产品成本比去年降低4%,实际执行的结果降低了5%,则该产品单位成本降低计划完成程度的算式为( )。 A 、%4%5 B 、%104%105

统计学考试题库

一、判断题(4个) 1.统计学的研究对象是社会经济总体现象的质量方面。(×) 2.重点调查中的重点单位是根据当前工作的重点来确定的。(×) 3.对于连续型变量,其组限是按照“上限不包括在内”的原则进行汇总的。(√)4.平均数是测定总体各单位的离散程度。(×) 5.在时间序列的乘法合成模型中,季节变动成分S通常是季节的个数(F) 6.用最小二乘法拟合时间序列的直线趋势方程Y=a+bt时,若0≤b≤1则该时间序列的趋势为逐步上升的趋(T) 7.从计算方式看,综合评价指数是一种算术平均指数(F) 8.特殊原因偏差表示过程中固有的偏差,这些偏差随机或偶然出现。(F) 9.当样本量给定时,置信区间的宽度随着置信系数的增大而增大;而当置信水平固定时,置信区间的宽度随着样本量的增大而减小。(√) 10.置信区间是一个随机区间,它因样本量的不同而不同,而且所有的区间都包含总体参数的真值。(×) 11通常是在控制犯取伪错误概率的条件下,尽可能使弃真错误的概率小一点。(×) 12抽样单位既可以是一个简单的个体,也可以是一组个体。(√) 13. 第一类错误是假设检验中出现的第一种错误,是将不真实的现象检验为真实的现象(错误) 14. 正态分布总体有两个参数,即均值与方差,当这两个参数确定以后,一个正态分布也就确定了。(正确) 15. 在一元线性回归模型中,回归模型的标准差等于随机干扰项的标准差。(正确) 16. 根据最小二乘估计,可以得到总体回归方程。(错误) 17.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。 答:对,因果关系的判断还有赖于实质性科学的理论分析。 18.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。 答:错。两者是精确的函数关系。 19.X2检验不适用于定类变量和定序变量的相关统计。(错) 20.多样本计量资料的比较,当分布类型不清时选择H检验。(对) 21在多元回归分析中,多重共线性是指模型中因变量与一个自变量相关。(×) 22对回归模型y=β0 +β1X1 +β2X2+…+βpXP+ε的假定有自变量X1 ,X2,…,XP 相互之间不存在较强的线性关系。(√) 23如果经检验所有回归系数都是显著的,则可以判定不存在多重共线性问题。(√) 24.DW 值越接近2, t 序列的自相关性就越小。(√) 二、选择题(4个) 1. “统计”一词的三种涵义是(B )。 A、统计调查、统计资料、统计分析 B、统计工作、统计资料、统计学 C、统计设计、统计调查、统计整理 D、大量观察法、分组法、综合指标法 2. 下列属于品质标志的是(D )。

2020年统计学考试复习资料

《统计学》复习资料 一、单项选择题: 1. 调查项目通常以表的形式表示,称作调查表,一般可分为( B )。 A.单一表和复合表 B.单一表和一览表 C.简单表和复合表 D.简单表和一览表 2. 要准确地反映异距数列的实际分布情况,必须采用( D ) A.次数 B.累计频率 C.频率 D.次数密度 3. 政治算术派产生于17世纪资本主义的英国,代表人物是( B )。 A.亚当·斯密 B.威廉·配第 C.康令 D.凯特勒 4. 进行相关分析,要求相关的两个变量( A )。 A.都是随机的 B.都不是随机的 C.一个是随机的,一个不是随机的 D.随机或不随机都可以 5. 调查某市工业企业职工的工种、工龄、文化程度等情况( D )。 A.填报单位是每个职工 B.调查单位是每个企业 C.调查单位和填报单位都是企业 D.调查单位是每个职工,填报单位是每个企业 6. 下面的函数关系是( B )。

A.销售人员测验成绩与销售额大小的关系 B.圆周的长度决定于它的半径 C.家庭的收入和消费的关系 D.数学成绩与统计学成绩的关系 7.统计总体的同质性是指( B )。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志属性或数量标志值D.总体各单位具有若干互不相同的品质标志或数量标志 8.反映抽样指标与总体指标之间抽样误差可能范围的指标是( C )。 A.抽样平均误差;B.抽样极限误差; C.抽样误差系数;D.概率度 9.某工人月工资90元,则工资是( C )。 A、质量指标 B、数量指标 C、数量标志 D、变量值 10.某厂工业总产值逐年有所增加,1999年、2001年、2002年分别增长5%、8%、10%,三年工业总产值总共增长( D )。A.23% B.22% C.11.2% D.24.74% 11.某电器厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应选择( C ). A.统计报表B.重点调查C.全面调查D.抽样调查

2018统计学-18总复习资料

《统计学》综合复习资料 一、单项选择题 1.统计一词的三种涵义是()。 A.统计工作.统计资料.统计学B.统计调查.统计整理.统计分析 C.统计设计.统计分组.统计预测D.统计方法.统计分析.统计预测 2.要研究某地区570家工业企业的产品生产情况,总体是()。 A.每个工业企业 B.570家工业企业 C.570家工业企业每一件产品 D.570家工业企业全部工业产品 3.为了解全国钢铁生产的基本情况,对鞍钢、武钢、宝钢等特大型钢铁企业的产量进行调查,属于 ()。 A.重点调查 B.典型调查 C.简单随机抽样调查 D.整群抽样调查 4.某商品销售量的前三个季度的季节指数分别为:112%,88%,90%,则第四个季度的季节指数为()。 A.102% B.110% C.98% D.100% 5.某厂2009年完成产值2千万,2010年计划增长10%,实际完成2310万元,则计划完成程度为()。 A.105% B.5% C.115.5% D.15.5% 6.统计调查按其组织形式分类,可分为()。 A.普查和典型调查 B.重点调查和抽样调查 C.统计报表和专门调查 D.经常性调查和一次性调查 7.现有一数列:3,9,27,81,243,729,2187,反映其平均水平最好用()。 A.算术平均数 B.调和平均数 C.几何平均数 D.众数 8.第一组工人的平均工龄为6年,第二组为8年,第三组为10年,第一组工人数占总数的30%,第二组占50%,则三组工人的平均工龄为()。 A.8年 B.7.55年 C.32.5年 D.7.8年 9.直接反映总体规模大小的指标是()。 A.总量指标 B.相对指标 C.平均指标 D.变异指标 10.某商品价格比原先降低5%,销售量增长了5%,则销售额()。 A.上升 B.下降 C.不变 D.无法确定

大学统计学期末复习计算题(有答案)

1对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果 如下 第1页共4页 成年组 166 169仃2仃7 180 仃0 仃2仃4 168 173 幼儿组 68 69 68 70 71 73 72 73 74 75 (1)要比较成年组和幼儿组的身高差异, 你会采用什么样的指标 测度值?为什么? (2)比较分析哪一组的身高差异大? 解:(1)采用标准差系数比较合适,因为各标志变动值的数值大 小,不仅受离散程度的影响,而且还受到平均水平高低的影响。 标准 差系数适合于比较不同组数据的相对波动程度。 10 (2)成年组的均值:乂 =7 =172.1 cm ,标准差为:S = 4. 202cm 离散系数:V 1 二基二 4^202 : 0. 024 X 172. 1 10 X i 幼儿组的均值:X = V 71.3 cm ,标准差为:= 2. 497 cm 离散系数:v 2 = X = 71 3 : 0. 035 v1

(2)相对数分析 ' P i q i ' p°q 、 pq ' P o q 。 ' P o q 。 ' p°q 125550 117100 绝对数分析 ' pg 八 p °q ° =、 p °q 1 - p °q ° ' pg 八 p °q 1 94500-12500二 117100-125550 94500-117100 31050二 8450 -22600 由于产量q 下降6.73%,使总成本下降8450元; 由于单位成本p 下降 19.30%,使总成本下降22600元。 3、从一个标准差为5的总体中抽出一个容量为40的样本,样本均值 为25。 (1) 样本均值的抽样标准差C X 等于多少? (2) 在95%的置信水平下,允许误差是多少? (3) 试确定该总体均值95%的置信区间。(血25 = 1.96) 解:(1)样本均值的抽样标准差: (2) 在95%的置信水平下,允许误差是: z 0.025▽犬=0. 79 X 1. 96 1. 55 (3) 该总体均值95%的置信区间: 65 340 1000 35 400 150 94500 125550 65 65 340 1000 35 400 150

统计学考试重点题目

1、某车间30 要求:累计 要求:按考试成绩分组编制组距式变量数列,并计算出各组频率和组中值。 比上期增长多少;又该企业产品单位成本计划在上期699元水平上降低12元,实际上本期单位成本为672元,试计算单位成本计划完成百分数。 (2)某企业2001年产品销售计划为上年的108%,实际为上年的114%,

试计算该企业2001年度产品销售计划完成百分数。 (3)某企业2001年劳动生产率增长计划完成102%,这一年劳动生产率为2000年的107%,试计算该企业2001年劳动生产率计划比2000年增长百分数。 (1)(1+5%)÷103%-1=1.94% 672÷(699-12)=97.82% (2)114%÷108%=105.56% (3)107%÷102%-1=14.90% 3、已知甲、乙两农贸市场某种农产品分等级的销售资料如下表: 要求:通过计算比较甲、乙两农贸市场哪一个的平均价格高,并说明两市场平均价格不一致的理由。 ∑∑===(元)甲38.14/5.5/f Xf X (元) 乙33.14/3.5/===∑∑f Xf X 4、某厂生产的某种零件,要经过三道工序,已知各工序的合格率分别为95%、93%和98%。要求:计算该零件在各道工序的总合格率和平均合格率。 总合格率=%583.86%98%93%95=?? 平均合格率=%31.95%98%93%953=?? 5、某商业局系统所属20个商店2000年的商品销售额与流通费用率资料如下表: 要求:计算该系统所属商店的平均流通费用率和销售额计划平均完成百分数。

M/m/x ym/m 6、(1)某数列的平均数为1000,标准差系数为0.256,求标准差; (2)某数列的平均数为12,各变量值平方的平均数为169,求标准差系数; (3)某数列的标准差为3,各变量值平方的平均数为25,求平均数; (4)某数列的标准差为30,平均数为50,求变量值对90的方差; (5)设y = x ± a ,若y σ=28,求x σ; (6)设y = 0,若y σ=12,求x σ。 (1)2561000256.0=?=?=X V σ(2)5)12(169222=-=-=X X σ 4167.012/5/===X V σ (3)4325222=-=-=σX X (4)2500)5090(30)90(2222 2 90=-+=-+=X X σσ (5)28==y x σσ (6)158.0/12||/===a y x σσ 9、设甲县农民人均收入为5880元,标准差为680元,农业人口为88.2万人;乙县农民人均收入6240元,标准差860元,农业人口89.50万人。要求:计算甲、乙两县农民人均纯收入的平均数、方差和标准差系数。

期末考试复习--统计学

习题课 1、有两个班同学参加统计学考试,甲班的平均分数81分,标准差9.9分,乙班的考试成绩如下: 要求:(1)计算乙班的平均分数和标准差。 (2)比较哪个班的平均分数更有代表性。 解题过程参考教材和作业。 2、某钢铁厂2002年—2007年钢铁产量如下表。 (1)计算出表中各动态分析指标的数值,并填入表内的相应格中,

(2)计算2002年—2007年的平均增长量。 需要掌握的时间序列的动态分析指标有: 1. 增长量: (1) 逐期增长量:12312;;;----n n a a a a a a (2) 累积增长量:00201;;;a a a a a a n --- (3) 平均增长量 = 逐期增长量之和/逐期增长量个数 = 累积增长量/(时间序列项数-1) 2. 发展速度与增长速度: (1) 环比发展速度:123 12,,,-n n a a a a a a (2) 定基发展速度: 02 01,,a a a a a a n (3) 增长速度 = 发展速度-1 (4) 平均发展速度 = n n a a 0 (5) 平均增长速度 = 平均发展速度-1 3、某厂生产的三种产品的有关资料如下:

要求: (1)计算三种产品的价格总指数以及由于价格变动使销售总额变动的绝对额 (2)计算三种产品的销售量总指数以及由于销售量变动而使销售总额变动的绝对额 (3)利用指数体系分析说明销售总额(相对程度和绝对额)变动的情况 解:列表计算如下:

(1)三种产品的价格指数: %11515.126100 30100 11 1或== = ∑∑z q z q k z 由于价格变动影响的销售总额绝对额: ∑∑0111-z q z q =30100-26100=4000元 (2)三种产品的销售量总指数: %10303.125350 26100 001或== = ∑∑z q z q k q 由于销售量变动影响的销售总额绝对额: ∑∑0001-z q z q =26100-25350=750元 (3) 销售总额指数: %7.118187.125350 30100 01 1或== = ∑∑z q z q k qz 销售总额的绝对额: ∑∑0011-z q z q =30100-25350=4750元 指数体系:118.7%=115%*103% 4750万元=4000万元+750万元 分析说明:………….….。 4、宁波新四方快餐厅连续3个星期抽查49位顾客,以调查顾客的平 均消费额,得样本平均消费额为25元,并假设总体的标准差为10.5元,要求:

统计学原理期末复习资料(题目及答案)

统计学原理期末复习资料汇总 一、考试题型 单选:12%,每小题2分,共12分,见平时作业手册; 多选:8%,每小题2分,共8分,见平时作业手册; 判断:10%,每小题2分,共10分,见平时作业手册; 简答题:20%,每小题10分,共20分; 计算题:50% 考试时间:90分钟,闭卷,可以带计算器 二、简答题 1、举例说明统计标志与标志表现有何不同? 答:标志是总体中各单位所共同具有的某特征或属性,即标志是说明总体单位属性和特征的名称。标志表现是标志特征在各单位的具体表现,是标志的实际体现者。例如:工人的“工资”是标志,而工资为“1200”分,则是标志表现。 2、一个完整的统计调查方案包括哪些内容? 答:一个完整的统计调查方案包括发下主要内容:(1)确定调查目的;(2)确定调查对象和调查单位;(3)确定调查项目,拟定调查表;(4)确定调查时间和时限;(5)确定调查的组织和实施计划。 3、简述调查对象、调查单位与填报单位的关系并举例说明。 答:调查对象即统计总体,是根据调查目的所确定的研究事物的全体。统计总体这一概念在统计调查阶段称调查对象。调查单位也就是总体单位,它是调查对象的组成要素,即调查对象所包含的具体单位。报告单位也成填报单位,也是调查对象的组成要素,它是提交调查资料的单位,一般是基层企事业组织。调查单位是调查资料的直接承担者,报告单位是调查资料的提交者,二者有时一致,有时不一致。例如对工业企业进行全部设备调查时,工业企业的全部设备是调查对象,每台设备是调查单位,而每个工业企业则是填报单位。 4、某地区对占该地区工业增加值三分之二的10个企业进行调查,你认为这种调查方式是重点调查还是典型调查?为什么? 答:首先,从该题内容可知该地区对工业企业进行的是一种非全面调查;第二,非全面调查包括抽样调查、重点调查额典型调查。这三种非全面调查的主要区别是选择调查单位的方法不同,抽样调查是按随机原则抽选单位,重点调查是根据单位标志总量占总体标志总量的比重来确定调查单位,而典型调查时依据对总体的分析,有意识地选取调查单位。因此,根据本题选择调查单位的方法可判断出该地区对工业企业进行调查,采用的是典型调查方式。 5、简述变量分组的种类及应用条件。 答:变量分组包括单项式分组和组距式分组。离散变量变动幅度小,分组可以选择单项式分组。如果离散变量的变动幅度较大,分组应该选择组距式分组。而对于连续变量只能用组距式分组。 6、单项式分组与组距式分组分别在什么情况下运用? 答:离散型变量如果变量值变动幅度较小,可依次将每个变量值作为一组。采用单项式分组。离散型变量如果变量值变动很大,次数又很多,或是连续性变量,采用组距式分组。 7、简述结构相对指标和比例相对指标有什么不同,并举例说明。 答:结构相对指标是以总体总量为比较标准,计算各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。如:各工种的工人占全部工人的比重。比例相对指标是总体不同部分数量对比的相对数,用以分析总体范围内各个局部之间比例关系和协调平衡状况,如:轻重工业比例。 8、强度相对指标与平均指标的区别?

相关主题
文本预览
相关文档 最新文档