当前位置:文档之家› 统计学考试重点上海交大医学院

统计学考试重点上海交大医学院

统计学考试重点上海交大医学院
统计学考试重点上海交大医学院

统计学

第一章、绪论

1、统计学(statistics)是研究如何有效地搜集、整理和分析带有随机性的数据,以对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议的科学。

2、统计工作的主要步骤:

1.研究设计:调查研究设计(观察不干预)、实验研究设计(随机分配)

2.搜集资料

3.整理资料

4.分析资料(统计描述、统计推断——参数估计,假设检验)

3、统计研究设计应当遵循3个基本原则:对照原则、重复原则、随机化原则。

4、研究设计基本要素:

1.处理因素:标准化;处理因素外,还有一些非处理因素又称“混杂因素”。

2.实验对象:应对处理因素敏感、稳定,且具有同质性

3.实验效应:客观性、有效性、准确性——效度(准确度:概率大小),信度(精确度:区间长度)

5、统计资料分类:

1.计量资料:又称定量资料,有计量单位,分为连续型资料和离散型资料两类。

2.计数资料:又称定性资料,按某种属性或类别用计数方式得到的资料。

3.等级资料:又称半定量资料,按某种属性的不同程度分组计数的资料。

6、统计描述(statistical discription)统计描述是指将研究数据加工提取,用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行测定和描述。

7、统计推断(statistical inference)统计推断指用样本所提供的信息对总体数量规律性作出推断。

8、总体(population):一个统计问题所涉及的对象的全体。(有限总体,无限总体)

9、个体(individual):总体中每一个研究对象称为个体。

10、样本(sample):按随机的方式从总体中抽取若干个体构成一个样本。

11、样本量:样本包含的观察单位数称为样本含量。

12、参数(parameter):由总体计算所得的特征量,用希腊字母表示。

13、统计量(statistic):由样本资料计算所得的特征量,用拉丁字母表示。

14、参数估计:由样本统计量估计总体分布中的未知参数。分为点估计和区间估计。

15、点估计(point estimation):选择一个适当的样本统计量作为总体参数的估计值。

抽样误差:(sampling error):由于个体间存在变异性造成样本统计量和相应的总体参数间的差异。

16、区间估计(interval estimation):根据一定的精确度要求,确定一个概率水平,由样本统计量计算出一个适当的区间作为未知总体参数真值所在的范围,称为区间估计。

置信度:此概率水平为可信度,也可称为可信水平。

置信区间(CI):所估计的区间称为可信区间,区间的端点称为“可信限,CL”。

(可信度大,可信区间长;样本含量大,可信区间短)

17、可信区间的准确度:表现为可信度的大小,即区间包含总体参数的概率大小。

可信区间的精确度:表现为区间的长度。

18、假设检验(Hypothesis Testing):又称显著性检验,先对总体的参数或分布作出某种假设,然后用适当的方法,根据样本对总体提供的信息推断是否拒绝该假设。

19、假设检验的基本步骤:

1.建立H0(无效假设:假设相同,无差异)、H1(备择假设)

2.选择适当的样本统计量,在H0成立的情况下计算P值(P值理解为H0成立时得到目前研究结果甚至更极端情况下的可能性)

3.根据P值与α的大小关系进行判断:

如果P>0.05,则在α=0.05水平上,不拒绝H0;

如果0.01<P≤0.05,则在α=0.05水平上,拒绝H0,差异有统计学意义;(P小拒)如果P≤0.01,则在α=0.01水平上,拒绝H0;

20、检验水准α:又称显著性水平,是假设检验预先规定的一个“较小”的值。符号为α。一般取α=0.05。

21、检验效能(1-β):两总体确有差异,按α水准能发现差异的能力。

22、影响效能的四要素:

(1)客观上两组效应差异越大,效能越大。

(2)个体间标准差越小,效能越大。

(3)样本量越大,效能越大。

(4)第Ⅰ类误差的概率越大,效能越大。

同时降低两类误差的唯一办法是加大样本量。

23、I型错误:拒绝了实际上成立的H0,即“弃真”,这叫第一类错误,记为α,医学中常称为假阳性错误。(例如某人血压180是健康的,却被认为得病了,得病阳性率增加是假的)

24、II型错误:未拒绝了实际上不成立的H0,即“存伪”,这叫第二类错误,记为β,医学中常称为假阴性错误。

25、正态分布(normal distribution)记为N(μ,σ2),标准正态分布:N(0,1)

均数μ:位置参数,μ增大,曲线向右移动

标准差σ:形状参数,σ增大,数据分散,曲线低平

(μ-1.96σ,μ+1.96σ)面积为95%,(μ-2.58σ,μ+2.58σ)面积为99%

第三章、计量资料的统计描述

1、计量资料的统计描述:

统计图、表:频数分布图、表;

统计指标:集中趋势指标(3、4、5、6、7)、离散趋势指标(8、9)

2、频数:不同组别内观测值个数,表示在各组别内观测值出现的频繁程度。

3、算术平均数:简称为均数(Mean),总体均数用μ表示,样本均数用X(拔)表示。

适用于:对称分布资料,特别是正态分布或近似正态分布。

特性:1.各观察值与均数之差(离均差)的总和为零 2.离均差平方和最小

4、几何均数(连乘开方):用G表示。

适用于:等比级资料,对数正态分布

特性:1.观察值中不能有零 2.观察值不能同时有正数和负数

5、中位数:即P50,用M表示,是将一组观察值按由小到大顺序排列后,位次居中的那个观察值。

适用于:各种分布,正态分布时=算数均数;对数正态分布时=几何均数

特性:1.偏态分布资料 2.端点无确切值的资料 3.分布不明确的资料

6、百分位数:指将观察值从小到大排列后处于第x百分位置上的数值,以Px表示。

P25称为第1四分位数或下四分位数;记为QL。

P50称为第2四分位数;就是中位数M

P75称为第3四分位数或上四分位数;记为QU。

7、众数:总体中出现机会最高的数值。

8、极差(Range),也称为全距,记为R 是最大与最小观察值之差,反映个体变异的范围。

9、四分位数间距:四分位数间距是第3四分位数与第1四分位数之差,即(P75-P25)。

中位数和四分位数间距相结合常用于表示非正态分布资料的平均水平和离散程度。

10、方差(variance):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。1/(2

2--=∑n X X S 11、标准差S(standard deviation):是方差的正平方根,使用的量纲与原量

纲相同,适用于近似正态分布的资料。加权法:1

/)/)((22--=∑∑n n fX fX S 标准差(或方差)越大,表示观察值分布越分散;反之,越小,观察值的分布越集中,均

数代表性越好。

12、变异系数:简记为CV,它是标准差与均数之比,用百分数表达,用于比较度量衡单位不同的几组资料的变异度。

13、实际应用时常以(均数±标准差)的写法,综合观察值的集中和离散特征。

第四章、总体均数的估计和假设检验1、标准误X S :通常将样本统计量的标准差称为标准误。许多样本均数的标准差称为均数的标准误(standard error of mean,SEM ),它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。n

/S S X =通过增加样本例数来减少标准误,降低抽样误差。

2、t 分布:用于根据小样本来估计呈正态分布且方差未知的总体的均值。//()(n S X t μ-=,1-=n ν。

t 分布是一簇曲线,自由度ν越小越分散,ν无限大时,t 分布即为标准正态分布。

3、总体均数的100(1-α)%置信区间的通式:)

(X X S X S X νανα/2,/2,t ,t -+4、参考值范围:表示95%个体变量值在总体的分布范围,用标准差计算,S X 96.1±;

置信区间:按95%置信度估计总体参数(如总体参数)的所在范围,用标准误计算,

(X X S X S X νανα/2,/2,t ,t -+。5、t 检验:以t 分布为基础,常用于两均数比较的假设检验。一般情况下,探索性研究如预实验多用双侧检验,证实性研究多用单侧检验。

6、样本均数与总体均数比较的t 检验:又称为“单样本的t 检验”,目的:推断样本所代表的未知总体均数μ与已知总体均数0μ是否相等。(例如山区男子脉搏是否高于一般人)

(1)建立假设检验,确定检验水准。

0H :μ=0μ,样本均数与总体均数相等;

1H :μ>0μ,样本均数大于总体均数;(或者小于);

单侧α=0.05

(2)计算检验统计量。

已知n:样本量,X :样本均数,S:样本标准差,0μ:总体均数;求)//()(t 0n S X μ-=,1

-=n ν(3)确定P 值,作统计推断结论。

查t 界值表,单侧ν,05.0t ;

如果t <ν,05.0t ,P>0.05,则在α=0.05水平上,不拒绝H0,差异无统计学意义;如果t >ν,05.0t ,0.01<P≤0.05,则在α=0.05水平上,拒绝H0,差异有统计学意义;

7、配对设计样本的t 检验:配对的两个个体随机分配到实验组和对照组,控制可能存在的主要非处理因素,推断处理有无差别(①②)或者有无作用(③)。

配对资料的三中类型:

①性质相近配对:配对的两个受试对象分别给予两种处理;

②同源配对:同一受试对象或同一样品的两个部分分别给予两种处理,推断两种处理的效果有无差别;

③自身配对:同一受试对象治疗前后某些生理、生化指标的比较,推断该处理有无作用。d :各对结果差值d 的均数;

d μ:各对结果差值D 的总体均数,如果处理无差别的话d μ=0。

)//(/0/n S d S d S d t d d d d =-=-=μ,1-=n ν。

(1)建立假设检验,确定检验水准。

0H :d μ=0,两组处理无差别;

1H :d μ≠0,两组处理有差别;

单侧α=0.05

(2)计算检验统计量。

已知n:样本量(成对),d =

∑n d /,1/)/)((22--=∑∑n n d d S d :差值标准差;求)//(n S d t d =,1

-=n ν(3)确定P 值,作统计推断结论。

查t 界值表,单侧ν,05.0t ;

如果t <ν,05.0t ,P>0.05,则在α=0.05水平上,不拒绝H0,差异无统计学意义;如果t >ν,05.0t ,0.01<P≤0.05,则在α=0.05水平上,拒绝H0,差异有统计学意义;

8、完全随机化设计的两个样本均数比较的t 检验:比较的目的是它们各自所代表的总体是否具有相同的均数。(要求:两样本来自方差相等的正态分布)

(1)建立假设检验,确定检验水准。

0H :21μμ=,两组处理均数相等;

1H :1μ≠2μ,两组处理均数不等;

双侧α=0.05

(2)计算检验统计量。

已知1n ,2n :两样本量,21X X ,:两样本均数;

求,

(3)确定P 值,作统计推断结论。

查t 界值表,ν,2/05.0t ;如果t <ν,2/05.0t ,P>0.05,则在α=0.05水平上,不拒绝H0,差异无统计学意义;如果t >ν,2/05.0t ,0.01<P≤0.05,则在α=0.05水平上,拒绝H0,差异有统计学意义;

9、正态性检验(univariate 过程):

(1)检验法:W 检验(3

(2)统计图:P-P 图、Q-Q 图、直方图等

10、方差齐性检验(F 检验)适用于两样本均来自正态分布的总体(levene 检验)。

(1)建立假设检验,确定检验水准。

H0:2221σσ=,即两总体的方差相等;

H1:2221σσ≠,即两总体的方差不等;

α=0.05

(2)计算检验统计量F 值。

(较小)(较大)2

221/S S F =,1

,12211-=-=n n νν(3)查F 界值表,确定P 值,作统计推断结论。

如果F<)

,(2105.0ννF ,则P>0.05,不拒绝H0,具有齐性;如果F≥)

,(2105.0ννF ,则P≤0.05,在α=0.05水平上,拒绝H0,不具有齐性。11、t '检验:两样本方差不齐时,两小样本均数的比较采用。常用:Satterthwaite 法

12、等比级数资料和对数正态分布资料可以采用对数变换的方法。gX

X l →第五章、方差分析

1、两组以上均数的比较不能用两两t 检验,而必须用方差分析。原因:

①检验过程烦琐,需要两两t 检验;

②无统一的试验误差,误差估计的精确性和检验的灵敏性低;

③推断的可靠性低,会增加第一类误差的概率。

2、方差分析法:是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术。

3、进行方差分析必须满足以下4个条件:

①可加性:总变异可分解成部分变异②方差齐性③正态性④独立性:样本独立

4、反应变量:也被称为因变量、结果变量,它是欲分析的主要观测指标。

自变量:是自由取值的变量。自变量影响因变量的取值。

5、因素(factor):对反应变量有影响的分类变量称为因素。(如施加药物)

水平(level):分类变量的不同取值称为水平。(如三种不同的药物)

6、处理(treatment):各因素的各种水平组合为处理。

7、交互作用(interaction):当一个因素的作用随另外一个因素水平的改变而改变,则这两个因素之间存在交互作用。

8、均衡(balance):在一个实验设计中如果每个单元格中的出现的试验次数相等,则称这个设计是均衡的。

9、总变异(total variation ):全部的观测个体值之间不同,这种变异称为总变异。(组间差异+组内差异→处理因素变异:药物效应+总随机误差)

10、组间变异(variation among groups ):各组样本均数之间也不同,这种变异反映了组与组之间的变异,称为组间变异。(处理因素变异:药物效应+随机误差)

11、组内变异(variation within groups ):在同一处理组中,个体观测值之间各不相同,这种变异称为组内变异。(随机误差)

方差分析思想:处理因素是否有作用,就是与随机变异进行比较,大于随机变异,就说明处理因素有作用;不大于随机变异,处理因素就无作用。

12、均方(MS ):离均差平方和(SS )除以相应的自由度(ν),得到平均变异指标—均方。ν

/SS MS =13、F 统计量:组间均方与组内均方之比,组内组间MS MS F /=。

(1)如不同药物的作用相同(H0:均值相等成立),即处理因素不起作用,组间变异只受个体误差的影响,此时,组间变异与组内变异相差不会太大。F ≈1

(2)如不同药物的作用不相同(H0:均值相等不成立),即处理因素产生了作用,则F>>1

14、第一步:正态性检验;

第二步:方差齐性检验;

第三步:方差分析:

(1)建立假设检验,确定检验水准。

H0:各组总体均数相等;

H1:各组总体均数不相同或不完全相同;α=0.05

(2)计算检验统计量。

(3)确定P值,作统计推断结论。

15、均数间的多重比较

(1)SNK检验:又称为q检验,在SAS的输出结果中给出在设定的的水平上两组之间是否有差异,而不给出检验统计量和P值。

(2)LSD检验:即最小显著差异法,是最敏感的两两比较的方法。

(3)Bonferroni是最保守的检验方法。

(4)Dunnett检验:在SAS程序中需要指定对照组的水平。

(5)Scheffe’s检验:它的检验结果是和F检验一致的。

(6)多项式比较

16、变量变换

(1)对数变换y=ln(x)或y=log10(x):①服从对数正态分布的资料②方差不齐,标准差与均数之比的比值接近;

(2)平方根变换

x

y :①服从泊松分布:发生率很小,而样本例数甚多②方差不齐,

尤其是方差与均数之间呈正比关系;

(3)平方根反正弦变换y=arcsin

x:①偏离正态较为明显。如白细胞分类的百分数,淋巴细胞转换率,畸变细胞的出现率等。②各组百分数的极差相差悬殊。

17、随机区组设计:又称随机单位组设计、随机配伍组设计,它是两样本配对试验的扩大。如果将区组看成是一个因素,则可看做两因素的方差分析。

优点:将区组内非处理因素相同或相近,保证了较好的同质性,从而控制了混杂因素对试验结果的影响。

缺点:每个处理只有一个测量值,没有重复数,因而不能考虑交互作用。

应用条件:残差满足正态分布(Shapiro-Wilk检验)。

18、拉丁方设计:随机区组设计控制的混杂因素只能有一个,如果要控制的混杂因素有两个,且混杂因素和处理因素的水平数相等。

拉丁方:用K个拉丁字母排列成K行K列的方阵,使每行,每列中每个字母仅出现1次。

三因素的实验设计:三个因素分别放置于拉丁方的行,列及字母上面,主要考察因素放置于字母上。

总变异包括:字母间(处理间:压力)、行间(各受试者)、列间(各压力)、误差

第六章、相关与回归

1、相关分析:用于分析两变量间相互联系的密切程度及相关方向。

2、回归分析:适用于分析变量间的因果关系;用一个自变量的值来估计另一个应变量的值。

3、函数关系:完全确定性的关系,如:圆的周长与半径。

4、相关关系:不存在完全确定性关系,不能用精确数学公式来表示,如:父母与子女身高。

5、相关系数:线性相关系数或简称相关系数。它一般用字母r 表示(总体相关系数为ρ)。|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切:非线性相关或不相关。

r 的计算公式:

6、样本相关系数不等于零,并不表示总体相关系数不等于零,还要作统计学显著性检验。

(1)建立假设检验,确定检验水准。

0H :0

=ρ1H :0

≠ρα=0.05

(2)计算检验统计量。样本相关系数的标准误:)

2/()1(2--=n r S r 检验统计量:r r S r t /=,2

-=n ν(3)确定P 值,作统计推断结论。

查t 界值表,ν,05.0t ;

如果t <ν,05.0t ,P>0.05,则在α=0.05水平上,不拒绝H0,差异无统计学意义;如果t >ν,05.0t ,0.01<P≤0.05,则在α=0.05水平上,拒绝H0,差异有统计学意义;

7、相关分析的应用的注意事项:

(1)有效范围

(2)合并问题:可能使两个有相关性的样本合并后无相关性。

(3)正确解释:描述两个变量间线性相关的程度和方向,并不阐明事物间存在联系的本质。

8、直线回归方程:,a 为y 轴截距,b 为斜率:称为回归系数。

通常用最小二乘法:各点与该直线的纵向距离的平方和为最小。

9、回归系数的估计:

10、回归系数的t 检验法

(1)建立假设检验,确定检验水准。总体回归系数用β表示。

0H :0

=β1H :0

≠βα=0.05

(2)计算检验统计量。

残差标准差:

样本回归系数的标准误:

检验统计量:b S b t /=,2

-=n ν(3)确定P 值,作统计推断结论。

查t 界值表,ν

,2/05.0t 如果t <ν,2/05.0t ,P>0.05,则在α=0.05水平上,不拒绝H0,差异无统计学意义;如果t >ν,2/05.0t ,0.01<P≤0.05,则在α=0.05水平上,拒绝H0,差异有统计学意义;11、回归系数的方差分析法

12、直线回归与相关的关系:

(1)对同一组资料作回归和相关分析,相关系数r 与回归系数b 的正负号一致,而且r 与b 的假设检验完全等价。

(2)回归解释相关:决定系数2R =(相关系数r)2

决定系数2R :

1.回归平方和占总离差平方和的比例。

2.意义:应变量y 变异被自变量x 所能解释的部分的比例。

3.反映回归直线的拟合程度,即回归方程估测可靠程度的高低。

4.取值范围在[0,1]之间。

5.R2趋近于1,说明回归方程拟合的越好;R2趋近于0,说明回归方程拟合的越差。

13、回归分析应用条件:

(1)线性(linear):X-Y

(2)独立(independent):固定x 值,对应的y 相互独立,即观察个体相互独立

(3)给定X 时,Y 服从正态分布

(4)方差齐性

第八章、计数资料的统计分析

1、相对数是两个有联系的指标之比,按用途与性质可分为率、构成比、相对比等。

2、率(rate)是一个具有时期概念的比,用于说明某一时期内某种现象发生的频率或强度。

3、构成比(proportion)表示事物或现象内部各构成部分的比重。通常以100作为比例基数,故常称为百分比。

4、相对比(relative ratio)简称比,可以是两个有关的同类指标之比,也可以是不同性质的指标之比,常以倍数或百分数表示。

5、标准化率:对于内部构成不同的两个率,应先作标准化处理,才能进行比较,这称为率的标准化,经标准化后的率称为标准化率。

(1)直接法:①期望死亡人数=标准组人口数×实际病死率,②各标准病死率=总期望死亡人数/总人口

(2)间接法:①期望死亡人数=各县实际人数×标准组病死率,②标准化死亡比(SMR)=实际死亡人数/期望死亡人数③各标准化率=SMR ×标准病死率

6、点估计:是用样本率P 估计总体率π。

7、区间估计:样本含量n 较大时,且样本率P 和(1-P)均不太小,如nP 和n(1-P)>5时,P 的抽样分布接近正态,可用正态分布计算可信区间的上下限。

95%可信区间为:P=1.96±Sp,n

P P S p /)1(-=8、率的假设检验(U 检验和卡方检验等价:22χ=U ):①样本率和总体率的比较②两样

本率的比较③多个样本率的比较

9、样本率P=阳性数x/样本含量n

10、U 检验统计量计算:

,自由度为1,0π为实际总体率。11、2χ检验统计量计算:或者2χ=,自由度为1。

(1)当总例数大于等于40,各理论频数大于等于5,不须校正。

(2)当总例数大于等于40,有一格理论频数小于5,但大于等于1,用卡方校正公式。

(3)当总例数小于40,或有一格理论频数小于1,不能用卡方检验,必须用确切概率计算。常用Fisher’s 确切概率计算。

12、二维列联表中有R 行,C 列时,就称为R×C 列联表。CMH-χ2来处理。

13、方表资料可有两种统计检验方法,即McNemar 检验与Kappa 检验。

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论 名词解释 统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。 总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。 抽样:从研究总体中抽取少量有代表性得个体,称为抽样。 概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。 频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性得任何特征或属性。 随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。 系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。 抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。 分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。 第二章定量资料得统计描述 名词解释 算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

《统计学原理》期末复习资料(1)

2015秋季学期《统计学原理》复习资料 一、单选题 1. 某厂4月份产量与1月份产量相比增长了10%,若已知4月份产量为1000,那么1月份的产量为(A )。 A.909.09 B.976.45 C.968.73 D.1032.28 2.以下各项属于品质标志的有(B )。 A.工龄 B.健康状况 C.工资水平 D.劳动时间利用率 3.连续变量( C)。 A.表现形式为整数 B.取值可一一列举 C.取值连续不断,不能一一列举 D.一般都四舍五入取整数 4.了解某公司职工文化程度情况,总体单位是( B)。 A.该公司全体职工 B.该公司每一位职工 C.该公司全体职工文化程度 D.该公司每一位职工文化程度 5.在某市工业设备普查中,调查单位是(D )。 A. 该市每一家工业企业 B. 该市全部工业设备 C. 该市全部工业企业 D. 某公司新推出了一种饮料产品,欲了解该产品在市场上的受欢迎程度,公司派人到各商 场、超市随机调查了200 名顾客。该公司采用的调查方法是(C )。 A. 直接观察法 B. 报告法 C. 访问调查法 D.很难判断 7.企业要对流水生产线上的产品质量实行严格把关,那么,在质量检验时最合适采用的调 查组织方式是( D)。 A. 普查 B. 重点调查 C.典型调查 D. 抽样调查 8. 统计资料按数量标志分组后,处于每组两端的数值叫(C )。 A. 组距

C. 组限 D. 组中值 9.统计分组的核心问题是(A )。 A.选择分组的标志 B.划分各组界限 C.区分事物的性质 D.对分组资料再分组 10. 在分组的情况下,总体平均指标数值的大小(C )。 A. 只受各组变量值水平的影响,与各组单位数无关 B. 只受各组单位数的影响,与各组变量值水平无关 C. 既受各组变量值水平的影响,又与各组次数有关 D. 既不受各组变量值水平的影响,也部受各组次数的影响 11. 在组距数列中,用组中值作为计算算术平均数直接依据的假定条件是(D )。 A. 各组次数必须相等 B. 各组必须是闭口组 C. 总体各单位变量值水平相等 D. 总体各单位变量值水平在各组内呈均匀分布 12. 标志变异指标反映了总体各单位变量值分布的(B )。 A. 集中趋势 B. 离散趋势 C. 变动趋势 D. 长期趋势 13. 抽样误差( D)。 A.既可以避免,也可以控制 B. 既不可以避免,也不可以控制 C. 可以避免, 但不可以控制 D. 不能避免, 但可以控制 14. 抽样平均误差反映了样本估计量与总体参数之间的(C )。 A. 实际误差 B. 可能误差范围 C. 平均差异程度 D. 实际误差的绝对值 15.凡是用来反映现象数量对比关系的相对数被称为( C)。 A. 增(减)量 B. 增加速度 C. 广义指数 D. 狭义指数 16.用来反映个别事物数量对比的相对数称为( C)。 A. 总指数 B. 类指数 C. 个体指数 D. 平均指数 17.在综合指数的变形中,加权算术平均指数所用权数是(D )。

大学统计学期末考试试题

河南科技学院2016-2017学年第一学期期终考试 统计学试卷(A 卷) 适用班级:人力141-人力145。 注意事项:1.在试卷的标封处填写院(系)、专业、班级、姓名和准考证号。 2. 考试时间共100分钟。 一、名词解释 参数 分层抽样 离散系数 中心极限定理 参数估计 号证考准

、选择题. 1、统计学的研究对象是( ) A 、各种现象的内在规律 B C 、统计活动过程 D 、各种现象的数量方面 、总体与样本的关系 2、以产品的等级来衡量某种产品的质量好坏,则该产品等级是( A 、数量指标 B 、质量指标 C 、数量标志 3、一个统计总体( )。 A 、只能有一个标志 B C 、可以有多个标志 D D 品质标志 、只能有一个指标 、可以有多个指标 4、对某企业500名职工的工资收入状况进行调查, 则总体单位是( ) A 、每一名职工 B C 、500名职工 D 5、在全国人口普查中,( )。 A 、女性是品质标志 B C 、人口的平均寿命是数量指标 D 6重点调查的重点单位是( )。 A 、收集数据资料的重点单位 、每一名职工的工资水平 、500名职工的工资总额 、某人的年龄30岁是变量 、全国人口总数是统计指标 B 、在全局工作中处于重要地位的单位 C 这些单位的标志值在总体标志总量中占有很大比重 D 这些单位数量占总体单位数的很大比重 7、 要了解我国煤炭生产的基本情况,最适合的调查方式是( ) A 、抽样调查 B 、重点调查 C 、典型调查 D 普查 8、 对一批商品进行质量检验,最适宜采用的方法( )。 A 、全面调查 B 、抽样调查 C 、典型调查 D 重点调查 9、 目前我国城镇职工家庭收支情况调查是采用( )。 A 、普查 B 抽样调查 C 、典型调查 D 重点调查 10、 下列分组中属于按品质标志分组的是( ) A 、学生按考试分数分组 E 、产品按品种分组

(完整word版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量:a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量:a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

统计学原理试题库(全解答)

统计学原理试题库(全) 第一章 一、单项选择题 1、统计有三种涵义,其基础是(A)。 A、统计活动 B、统计方法 C、统计学 D、统计资料 2、一个统计总体( C )。 A、只能有一个指标 B、只能有一个标志 C、可以有多个指标 D、可以有多个标志 3、下列变量中,(D )属于离散变量。 A、一个笔筒的直径 B、一袋米的重量 C、一个同学的身高 D、一个县的人数 4、全班同学统计学考试成绩分别为66分、76分和86分,这三个数字是(B )。 A、标志 B、标志值 C、指标 D、变量 5、下列属于品质标志的是(D )。 A、工人工资 B、工人身高 C、工人体重 D、工人性别 6、要了解某汽车公司的情况,该公司的产量和利润是(C )。 A、连续变量 B、离散变量 C、前者是离散变量,后者是连续变量 D、后者是离散变量,前者是连续变量 7、劳动生产率是(C )。 A、流量指标 B、动态指标 C、质量指标 D、强度指标 8、数理统计学的奠基人是( C )。 A、马克思 B、威廉·配第 C、凯特勒 D、恩格尔 9、指标是说明总体特征的,标志是说明单位特征的,所以(C )。 A、指标和标志都是可以用数值表示的 B、指标和标志之间没关系 C、指标和标志之间在一定条件下可以相互变换 D、指标和标志之间的关系是固定不变的 10、统计研究的数量必须是(B )。 A、抽象的量 B、具体的量 C、连续不断的量 D、可直接相加的量 11、构成统计总体的必要条件是( D )。 A、差异性 B、综合性 C、社会性 D、同质性 二、多项选择题 1、对某市工业企业进行调查,则( BCE )。 A、该市工业企业总数是总体 B、该市工业企业是总体 C、该市工业企业总产值是指标 D、该市工业企业总产值是数量标志 E、每个工业企业总产值是数量标志 2、某企业是总体单位,则下列属于数量标志的有( BCDE )。 A、所有制 B、职工人数 C、职工月平均工资 D、年工资总额 E、产品合格率 3、下列指标哪些是质量指标(CDE)。 A、新产品数量 B、高级职称人数 C、考试及格率 D、工人劳动生产率 E、平均亩产量 4、下列属于连续变量的有(ACE)。 A、厂房面积 B、企业个数 C、原材料消耗量 D、人口数 E、利润率 5、以下属于有限总体的是(ABC)。 A、全国人口 B、某县企业 C、某市学校

统计学期末考试题库及答案

第一章绪论 一、填空题 1.标志是说明特征的,指标是说明数量特征的。 2.标志可以分为标志和标志。 3.变量按变量值的表现形式不同可分为变量和变量。4.统计学是研究如何、、显示、统计资料的方法论性质的科学。 5.配第在他的代表作《》中,用数字来描述,用数字、重量和尺度来计量,为统计学的创立奠定了方法论基础。 二、判断题 1.企业拥有的设备台数是连续型变量。() 2.学生年龄是离散型变量。() 3.学习成绩是数量标志。() 4.政治算术学派的创始人是比利时的科学家凯特勒,他把概率论正式引进统计学。() 5.指标是说明总体的数量特征的。() 6.对有限总体只能进行全面调查。() 7.总体随着研究目的的改变而变化。() 8.要了解某企业职工的文化水平情况,总体单位是该企业的每一位职工。() 9.数量指标数值大小与总体的范围大小有直接关系。() 10.某班平均成绩是质量指标。() 三、单项选择题 1.考察全国的工业企业的情况时,以下标志中属于数量标志的是( )。 A.产业分类 B.劳动生产率 C.所有制形式 D.企业名称 2.要考察全国居民的人均住房面积,其统计总体是( )。 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户 3.若要了解全国石油企业采油设备情况,则总体单位是( )。 A.全国所有油田 B.每一个油田 C.每一台采油设备 D.所有采油设备

4.关于指标下列说法正确的是( )。 A.指标是说明总体单位数量特征的 B.指标都是用数字表示的 C.数量指标用数字表示,质量指标用文字表示 D.指标都是用文字表示的 5.政治算术学派的代表人物是 ( )。 A.英国人威廉·配第 B.德国人康令 C.德国人阿亨瓦尔 D.比利时人凯特勒 6.关于总体下列说法正确的是( )。 A.总体中的单位数都是有限的 B.对于无限总体只能进行全面调查 C.对于有限总体只能进行全面调查 D.对于无限总体只能进行非全面调查 7.关于总体和总体单位下列说法不正确的是( )。 A.总体和总体单位在一定条件下可以相互转换 B.总体和总体单位是固定不变的 C.构成总体的个别单位是总体单位 D.构成总体的各个单位至少具有某种相同的性质 8.关于标志下列说法不正确的是( )。 A.标志是说明总体单位特征的 B.品质标志是用文字表示的 C.数量标志是用数字表示的 D.数量标志说明总体量的特征 9.关于变量下列说法不正确的是( )。 A.只能取整数的变量是离散变量 B.可以用小数表示的是连续变量 C.只能用小数表示的是连续变量 D.数量标志的具体表现称为变量值 10.关于指标下列说法不正确的是( )。 A.数量指标说明总体规模和水平 B.数量指标用绝对数表示 C.质量指标只能用相对数表示 D.质量指标用相对数或平均数表示 四、多项选择题 1.属于连续型变量的有( )。 A.国内生产总值 B.企业数 C.身高 D.体重 E.人数2.属于离散型变量的有( )。 A.增加值 B.学校数 C.机器台数 D.销售额 E.粮食产量3.下列属于品质标志的有( )。

医学统计学考试重点

考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

统计学原理考试知识点整理

第1章 绪论 1、统计的含义统计一词最基本的含义是对客观事物的数量方面进行核算和分析,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。 2、统计的特点P3 数量性 具体性 综合性 3、统计学的若干基本概念 总体与总体单位P10: 总体是指在某种共性的基础上由许多个别事物结合起来的整体,构成总体的个别事物叫总体单位; 总体的特征:同质性,大量性,差异性;总体的分类:有限总体与无限总体;标志、变异与变量P10: 标志,是指说明总体单位特征的名称。变异:总体单位之间品质和数量上的差异,即可变标志在总体各单位之间所表现出的差异。变量:可变的数量标志。 连续型变量与离散型变量联系和区别:连续型:变量值可作无限分割的变量离散型:变量值只能以整数出现的变量指标与标志P11 (指标,说明总体数量特征的概念)区别:第一,指标说明总体的特征,而标志则说明总体单位的特征。第二,指标只反映总体的数量特征,所有指标都要用数字来回答问题,没有用文字回答问题的指标。而标志既有反映数量也有反映品质。 第2 章统计调查 1、统计调查的含义及其在统计工作中的地位P13 含义:根据统计研究的目的,有组织、有计划地搜集统计资料的过程地位:是统计工作的第一阶段,是整个统计工作的基础一环 2、统计调查的基本原则P13-14 一、要实事求是,如实反映情况 二、要及时反映,及时预报 三、要数字与情况相结合 3、统计调查的组织形式:普查P14:含义:为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查、优缺点:,适用场合:主要用于一些重要项目呢的调查,如人口普查、耕地普查、基本单位普查、工业普查和库存普查等; 随机抽样调查P14:含义(按随机原则(机会均等原则)从总体中抽取部分单位进行调查,并借以推断和认识总体的一种统计方法)以及具体的抽样方法【第七章】系统抽样、多阶 简单随机、分层抽样、整群抽样、 段抽样)及适用场合;非随机抽样:含义(调查者有意识地或随意而 非随机地从总体中抽取部分单位进行调查的统计方法)以及具体的抽样方法P15 (重点抽样:只对总体中为数不多但影响颇大的重点单位进行研究的一种非

统计学考试题库

一、判断题(4个) 1.统计学的研究对象是社会经济总体现象的质量方面。(×) 2.重点调查中的重点单位是根据当前工作的重点来确定的。(×) 3.对于连续型变量,其组限是按照“上限不包括在内”的原则进行汇总的。(√)4.平均数是测定总体各单位的离散程度。(×) 5.在时间序列的乘法合成模型中,季节变动成分S通常是季节的个数(F) 6.用最小二乘法拟合时间序列的直线趋势方程Y=a+bt时,若0≤b≤1则该时间序列的趋势为逐步上升的趋(T) 7.从计算方式看,综合评价指数是一种算术平均指数(F) 8.特殊原因偏差表示过程中固有的偏差,这些偏差随机或偶然出现。(F) 9.当样本量给定时,置信区间的宽度随着置信系数的增大而增大;而当置信水平固定时,置信区间的宽度随着样本量的增大而减小。(√) 10.置信区间是一个随机区间,它因样本量的不同而不同,而且所有的区间都包含总体参数的真值。(×) 11通常是在控制犯取伪错误概率的条件下,尽可能使弃真错误的概率小一点。(×) 12抽样单位既可以是一个简单的个体,也可以是一组个体。(√) 13. 第一类错误是假设检验中出现的第一种错误,是将不真实的现象检验为真实的现象(错误) 14. 正态分布总体有两个参数,即均值与方差,当这两个参数确定以后,一个正态分布也就确定了。(正确) 15. 在一元线性回归模型中,回归模型的标准差等于随机干扰项的标准差。(正确) 16. 根据最小二乘估计,可以得到总体回归方程。(错误) 17.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。 答:对,因果关系的判断还有赖于实质性科学的理论分析。 18.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。 答:错。两者是精确的函数关系。 19.X2检验不适用于定类变量和定序变量的相关统计。(错) 20.多样本计量资料的比较,当分布类型不清时选择H检验。(对) 21在多元回归分析中,多重共线性是指模型中因变量与一个自变量相关。(×) 22对回归模型y=β0 +β1X1 +β2X2+…+βpXP+ε的假定有自变量X1 ,X2,…,XP 相互之间不存在较强的线性关系。(√) 23如果经检验所有回归系数都是显著的,则可以判定不存在多重共线性问题。(√) 24.DW 值越接近2, t 序列的自相关性就越小。(√) 二、选择题(4个) 1. “统计”一词的三种涵义是(B )。 A、统计调查、统计资料、统计分析 B、统计工作、统计资料、统计学 C、统计设计、统计调查、统计整理 D、大量观察法、分组法、综合指标法 2. 下列属于品质标志的是(D )。

9住院医师规培考试 卫生统计学方法与应用(下)

1、某地进行甲型病毒性肝炎的调查中,共发现病人231例。其中男性158例占68.40%,女性73例占31.60%,提示()* ? A.男性因在外就餐机会多发病机会就高 ? B.男性病人比例高于女性病人 ? C.男性发病率高 ? D.男性患病率高 ? E.不能说明任何问题 2、甲乙两地某病的死亡率进行标准化计算时,其标准选择()* ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 3、若已知该省成年男性血红蛋白平均水平,欲了解某县正常成年男性的血红蛋白含量是否高于该省正常水平,应采用()* ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验 4、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数r=0.9,对该资料拟合回归直线,则其回归系数b值()*

? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 5、对原始统计资料的要求是()* ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时,组内均方就是误差均方 ? E.完全随机设计的方差分析时,F=MS组间/MS组内 6、实验设计应遵循的基本原则是()* ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 7、作符号秩和检验时,统计量T为较小的秩和,则正确的是()* ? A.T值越大越有理由拒绝HO ? B.T值越大越有理由拒绝HO ? C.P值与T值毫无关系

统计学考试重点题目

1、某车间30 要求:累计 要求:按考试成绩分组编制组距式变量数列,并计算出各组频率和组中值。 比上期增长多少;又该企业产品单位成本计划在上期699元水平上降低12元,实际上本期单位成本为672元,试计算单位成本计划完成百分数。 (2)某企业2001年产品销售计划为上年的108%,实际为上年的114%,

试计算该企业2001年度产品销售计划完成百分数。 (3)某企业2001年劳动生产率增长计划完成102%,这一年劳动生产率为2000年的107%,试计算该企业2001年劳动生产率计划比2000年增长百分数。 (1)(1+5%)÷103%-1=1.94% 672÷(699-12)=97.82% (2)114%÷108%=105.56% (3)107%÷102%-1=14.90% 3、已知甲、乙两农贸市场某种农产品分等级的销售资料如下表: 要求:通过计算比较甲、乙两农贸市场哪一个的平均价格高,并说明两市场平均价格不一致的理由。 ∑∑===(元)甲38.14/5.5/f Xf X (元) 乙33.14/3.5/===∑∑f Xf X 4、某厂生产的某种零件,要经过三道工序,已知各工序的合格率分别为95%、93%和98%。要求:计算该零件在各道工序的总合格率和平均合格率。 总合格率=%583.86%98%93%95=?? 平均合格率=%31.95%98%93%953=?? 5、某商业局系统所属20个商店2000年的商品销售额与流通费用率资料如下表: 要求:计算该系统所属商店的平均流通费用率和销售额计划平均完成百分数。

M/m/x ym/m 6、(1)某数列的平均数为1000,标准差系数为0.256,求标准差; (2)某数列的平均数为12,各变量值平方的平均数为169,求标准差系数; (3)某数列的标准差为3,各变量值平方的平均数为25,求平均数; (4)某数列的标准差为30,平均数为50,求变量值对90的方差; (5)设y = x ± a ,若y σ=28,求x σ; (6)设y = 0,若y σ=12,求x σ。 (1)2561000256.0=?=?=X V σ(2)5)12(169222=-=-=X X σ 4167.012/5/===X V σ (3)4325222=-=-=σX X (4)2500)5090(30)90(2222 2 90=-+=-+=X X σσ (5)28==y x σσ (6)158.0/12||/===a y x σσ 9、设甲县农民人均收入为5880元,标准差为680元,农业人口为88.2万人;乙县农民人均收入6240元,标准差860元,农业人口89.50万人。要求:计算甲、乙两县农民人均纯收入的平均数、方差和标准差系数。

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

自考统计学原理复习重点

00974统计学原理 章节基础知识 第一章:总论 1、统计的三基本方法:大量观察法,综合分析法,归纳推断法((可扩展未简答) 2、凯特乐将统计学的三个主要源泉:英国的政治学派,德国的国势学,法国的概率统计 3、“统计”一词的含义:统计包括三个含义:统计工作、统计资料和统计科学。统计工作、统计资料、统计科学三者之间的关系是:统计工作的成果是统计资料,统计资料和统计科学的基础是统计工作,统计科学既是统计工作经验的理论概括,又是指导统计工作的原理、原则和方法。(简答) 4、统计信息的两大特征:数量性和总体性(多选、简答) 5、统计的三大职能:信息,咨询,监督(多选) 6、四大计量尺度:定类尺度,定序尺度,定距尺度,定比尺度(重点前两个) 7、按度量层次低到高:定类尺度>定序尺度>定距尺度>定比尺度 8、区别总体和总体单位(选择,判断) 9、统计指标的的三大特性:总体性,数量性,综合性(多选) 10、区分变异和变量,变量又可以分为:连续变量和离散变量(多选) 第二章:统计资料的收集和整理 1.统计资料的三大特性:数量性,总体性,客观性(选择,填空) 2.总体性的定义是指统计是从整体上反映和分析事物数量特征,而不是着眼于个别事物,因为事物的本质和发展规律只有从整体上观察,才能作出正确的判断。(判断) 3.原始资料的搜集方法访问方法观察方法实验方法(多选) 4.统计调查的方式: 1)普查:专门组织进行一次性的全面调查(填空、多选)2)抽样调查:最常用的方法3)统计报表 4)重点调查:了解定义(选择)(多年都有考到)5)典型调查 6.结论:统计方式是以普查为基础,抽样调查为主体(选择、判断) 7.统计调查方案的内容:(1) 调查目的:调查目的要符合客观实际,是任何一套方案首先要明确的问题,是行动的指南。 (2) 调查对象和调查单位:调查对象即总体,调查单位即总体中的个体。 (3) 调查项目:即指对调查单位所要登记的内容。 (4) 调查表:就是将调查项目按一定的顺序所排列的一种表格形式。调查表一般有两种形式:单一表和一览表。一览表是把许多单位的项目放在一个 表格中,它适用于调查项目不多时;单一表是在一个表格中只登记一个单位 的内容。 (5) 调查方式和方法:调查的方式有普查、重点调查、典型调查、抽样调查、统计报表制度等。具体收集统计资料的调查方法有:访问法、观察法、报告法等。 (6) 调查地点和调查时间:调查地点是指确定登记资料的地点;调查时间:涉及调查标准时间和调查期限。 (7) 组织计划:是指确保实施调查的具体工作计划。(P32-33)(简答) 8.区分调查内容的时间和调查工作的 时间(P33-34)(判断) 9.统计调查误差的种类登记性统计误 差和代表性误差两大类(P34)(简答) 10.产生误差的客观原因1)统计总体中 的个体可能会基于各种考虑或顾虑不 愿提供真实、准确的个体信息资料2) 被调查的个体缺少必要的数据记录,或 没有相关数据,或个人信息资料记忆有 误也可能无法提供真实、准确的个人信 息资料3)调查者数据记录不熟练、责 任心不强造成记录错误,或者发生数据 丢失以及分析、整理个体信息资料有误 (简答) 11.怎么看待误差:误差是比较难避免 的,但抽样误差是有一定规律的。随 机误差中还包括重复误差。它是由于对 同一受试对象或检样采用同一方法重 复测定时所出现的误差。控制重复误差 的手段主要是改进测定方法,提高操作 者的熟练程度。重复是摸清实验误差大 小的手段,以便分析和减少实验误差。 (历年考过,很有可能考) 12.分组的关键:选择恰当的分组标志 和准确划分分组的界限(判断) 13.统计分组的类型以及内容:统计分 组是指根据事物内在的特点和统计研 究的需要,将统计总体按照一定 的标志区分为若干组成部分的一种 统计方法。其目的是把同质总体中的具 有不同 性质的单位分开,把性质相同的单位 合在一起,保持各组内统计资料的一致 性和组 间资料的差异性,以便进一步运用各 种统计方法研究现象的数量表现和数 量关系, 从而正确地认识事物的本质及其规 律。 统计分组时应遵循的原则 科学的统计分组应遵循一下几项原 则:1.必须坚持组内统计资料的同质性 和组间资料的差别性,这是统计分组的 一个基本原则:2.必须符合完备性原 则,即所谓“穷举”性。3.必须遵守“互 斥性”原则,即总体任一单位都只能归 属于一组,而不能同时属于两个或两个 以上的组。(简答) 14.组距和组数基本成反比关系:组距 越大组数越小,反之相反(判断) 15.判断开口组的组中值的计算(判断) 16分组变量的类型及其应用:变量分组 有单项式分组和组距式分组之分,在组 距式分组中又有等距式分组和不等距 式分组两种形式。对于离散型变量来 说,如果变量值的变动范围较小,可采 用单项式分组;如果变量值的变动范围 很大,变量值的项数又很多,就要采用 组距式分组。对于连续型变量来说,只 能采用组距式分组。在进行组距式分组 的时候,如果标志值的变动比较均匀的 话,可采用等距式分组;如果标志值的 变动很不均匀的话,则要采用不等距式 分组。(简答) 17了解洛伦茨曲线的横轴和纵轴表示 的内容:整个的洛伦兹曲线是一个正方 形,正方形的底边即横轴代表收入获得 者在总人口中的百分比,正方形的左边 即纵轴显示的是各个百分比人口所获 得的收入的百分比。(填空) 18.次数分布的类型和特点钟型分布、 U型分布、J型分布和洛伦兹分布,特 征有1、集中趋势大部分观察值向 某一数值集中的趋势称为集中趋势,常 用平均数指标来表示,各观察值之间大 小参差不齐.2、离散趋势频 数由中央位置向两侧逐渐减少,称离散 趋势,是个体差异所致,可用一系列的变 异指标来反映.(历年考过的简答、选 择) 第三章:统计数据的描述和显示 (核心内容:平均数代表性指标) 1、统计指标按照数量特征不同分为: 绝对指标,相对指标,平均指标(单选) 2、区分时点指标和时期指标(选择) 3、强度相对指标:常用为:人口密度 指标,人均GDP指标,利率,人口增 长率(多选) 4、重点计算三大指标:平均数,标准 差,离散系数(必考) 5、中位数的定义当变量值的项数N为 奇数时,处于中间位置的变量值即为中 位数;当N为偶数时,中位数则为处于 中间位置的2个变量值的平均数。(填 空) 6、各变量值与均值的离差之和为0(判 断) 7、什么时候使用离散系数:数据表现 为离散分布,不具有连续性(填空) 8、统计表的三大基本要素:表头,表 体,表尾(多选) 9、统计图的四大种类:条形图,线图, 圆形图,统计地图(历年考过的简答, 多选) 第四章:抽样调查 1、抽样调查的主要特点(1)它的调查 对象只是作为样本的一部分单位,而不 是全部单位,也不是个别 或少数单位; (2)调查样本一般按照随机原则抽取, 而不由调查者主观确定; (3)调查目的不是说明样本本身,而 是从数量上推断总体、说明总体;(4) 随机抽样的误差是可以计算的,误差范 围是可以控制的。(简答) 2、抽样推断的理论基础:大数定律, 中心极限定理(简答,选择) 3、理解系统误差:系统误差是在同一 量的多次测量过程中,保持恒定或以可 预知方式变化的测量误差。 4、影响抽样误差的因素主要有1.总体 各单位标志值的差异程度。差异程度愈 大则抽样误差愈大,差异程度愈小则则 抽样误差愈小。 2.样本单位数。在其他条件相同的情 况下,样本的单位数愈多,则抽样误差 愈小。 3.抽样方法。抽样方法不同, 抽样误差也不同。一般情况下重复抽样 误差比不重复抽样误差要大一些。 4.抽样调查的组织形式。不同的抽样 组织形式就有不同的抽样误差。(解答) 5、点估计的优良标准:1)无偏性:样 本统计量的平均值=总体的被估计参 数;2)一致性;3)有效 性 6、总体平均数的区间估计典型例子(计 算题) 7、影响样本容量的因素(1)总体的 变异程度2)允许误差的大小3)概率 保证度的大小4)抽样方法的不同 (P114)(简答)前两点定义考判断 8、抽样调查的组织形式:1)简单随机 抽样:最基本的抽样方法2)等距抽样 (机械抽样)3)类型抽样(分层抽样) 4)整群抽样:(要保证群间差异小、群 内单位的差异大) 第五章:相关分析与回归分析 1、相关关系的种类(1)按照相关的方 向不同分为:正相关和负相关。(2)按 照相关形式不同分为:线性相关和非线 性相关。(3)按相关程度分为:完全相 关、不完全相关和不相关。(4)按研究 的变量(或因素)的多少分为:单相关、 复相关和偏相关。(P123)(选择、简答) 2、相关系数r的作用:表示现象之间 相关关系的密切程度(单选)3、必须 懂得运用相关系数R的计算公式(P130 的5.4公式) 4、相关系数的绝对值|r|在0.3以下, 微弱线性相关:0.3-0.5,低度线性相关 0.5-0.8,显著线 性相关(重点掌握)0.8以 上,高度线性相关(重点掌握)5、回 归直线的b含义:表示当X增加一个单 位的时候Y平均增加的数量 6、相关分析与回归分析的特点:前两 点着重掌握(简答,选择)第六章:时 间数列分析(重点为平均发展水平和平 均发展速度的计算) 1、时间数列分析分为:绝对数时间数 列分析,相对数时间数列分析,平均数 时间数列分析 2、时间数列的作用1. 可以反 映社会经济现象的发展变化过程,描述 现象的发展状态和结果。 2. 可以研究社会经济现象的发 展趋势和发展速度。 3. 可以探索现象发展变化的规 律,对某些社会经济现象进行预测。 4. 利用时间序列可以在不同地 区或国家之间进行对比分析,这也是统 计分析的重要方法之一。(简答) 3、编制时间数列应遵循的原则1.前提 条件:保证同一时间数列中各项指标值 的可比性。 2.时间长短应该可比。 3.总体范围大小应该一致。 4.指标的内容和计算方法应该统一 (简答) 4、平均发展水平的典型例子 5、环比发展数度的连乘积=定基发展速 度 6、定基发展速度、环比发展速度、定 基增长速度、环比增长速度。(填空, 判断) 7、时间数列的因数分解模型:加法模 型、乘法模型和混合模型其形式:Y=T ? C ?S ?I 8、利用移动平均法分析趋势变动时候, 应注意那些问题:①移动间隔的长度应 长短适中。②在利用移动平均法分析趋 势变动时,要注意应把移动平均后的趋 势值放在各移动项的中间位置。(简答) 第七章:统计指标数 1、广义指数的含义:广义指数指所有 的相对数,即反映简单现 象总体或复杂现象总体数量变动的相 对数(单选、简答) 2、狭义指数就是总指数,是一种反映 复杂总体数量变动的相对数(判断题) 3、拉氏公式和派氏公式(判断题、多 选题) 4、编制数量综合指数时,采用基期的 质量指标作为同度量因数;而在编制质 量指标综合指数时,则采用报告期的数 量指标作为用质量因素。(多选题) 5、平均数指数分为:加权算术平均数 指数和加权调和平均指数(多选题)6、 平均指标指数的含义P195 7、<必考选择题类型>:已知商品销售 额指数是120%,销售量指数时98%, 则根据指数之间的关系可以推出其销 售价格指数为122.4%(120%/98%)。 补充 1、统计研究的基本方法是大量观察法、 统计分组法、综合指标法、统计模型法 和归纳推断法 2、当我们研究某市居民户的生活水平 时,该市全部居民户便构成统计总体, 每一居民是总体单位 3、标志是说明总体单位的名称,它有 品质标志和数量标志两种。 4、要了解一个企业的产品生产情况, 总体是全部产品,总体单位是每一件产 品。

相关主题
文本预览
相关文档 最新文档