当前位置:文档之家› 卫生统计学

卫生统计学

卫生统计学
卫生统计学

《卫生统计学》习题

一、一、单项选择题

1、随机抽样的目的是()

A、消除系统误差

B、消除测量误差

C、减少随机误差

D、减少样本的偏性

2、为了解某校锡克试验的阳性率,研究者从全校80个班中随机抽取8个班,然后调查这些班中的所有学生。问此种抽样方法属于()

A、单纯随机抽样

B、系统抽样

C、分层抽样

D、整群抽样

3、变异系数的数值()

A、一定大于1

B、一定小于1

C、可大于1,也可小于1

D、一定比标准差小

4、对于同一组资料,哪个指标没有考虑到每个观察值的变异()

A、方差

B、总体标准差

C、变异系数

D、四分位数间数

5、描述一组数值变量资料的分布特征时()

A、A、应同时选用算术平均数和标准差

B、B、应同时选用中位数和四分位数间距

C、C、根据分布类型选用相应的集中、离散趋势指标

D、D、以上都不正确

6、某医院的资料,计算了各种疾病所占的比例,该指标为()

A、发病率

B、构成比

C、相对比

D、标化发病率

7、对两个变量进行直线相关分析,r=0.39,P>0.05,说明两个变量之间()

A、有相关关系

B、有数量关系

C、有伴随关系

D、无相关关系

8、观察某地90年至2000年意外伤害发生率和摩托车数量的关系,宜选择的图形为()

A、直方图

B、直条图

C、散点图

D、线图

9、x 表示()

A、总体均数标准误

B、总体均数离散程度

C、总体标准差

D 、反映以固定n从正态总体中随机抽样获得的样本均数的离散程度

10、t分布比标准正态分布()

A、A、中心位置左移,但分布曲线相同

B 、B 、中心位置右移,但分布曲线相同

C 、中心位置不变,但分布曲线峰高

C 、C 、中心位置不变,但分布曲线峰低,两侧较伸展

11、在同一正态总体中以固定n 随机抽样,有95%的样本均数在下述范围内( )

A 、x S 58.2x ±

B 、x S 96.1x ±

C 、x 58.2σ±μ

D 、x 96.1σ±μ

12.在下列研究中,研究者不能人为设置各种处理因素的是( )

A 、调查研究

B 、社区干预试验

C 、临床试验

D 、实验研究

13、配伍组设计中,同一配伍组中的各个观察个体要求( )

A 、是同一个个体

B 、给予相同的处理

C 、相互间差别越大越大越好

D 、D 、除处理因素外,其它已知或可能影响观察指标的因素和条件都相同或相近

14、观察儿童智力与家庭收入的关系,宜选择的图形为( )

A 、直方图

B 、直条图

C 、团图

D 、散点图

15、 可看作服从二项分布。

A 、A 、简单随机抽样检查n 人中甲型肝炎患者数

B 、B 、整群随机抽样调查每一人群中甲型肝炎患者数

C 、C 、按户随机抽样调查每户中甲型肝炎患者数

D 、D 、按学生班级抽查一个班级学生中的肺结核患者数

16、甲乙两地同一年的婴儿死亡率的比较( )

A 、A 、不必考虑人口年龄构成的影响

B 、应作卡方检验

C 、C 、应作年龄标准化

D 、以上都不对

17、简单随机抽样研究2000年年底肺结核患病率时( )

A 、A 、不能用二项分布理论来计算总体肺结核患病率的可信区间

B 、B 、可以用二项分布理论分析样本率与总体率的差别

C 、C 、尽管是随机抽样,因为肺结核会传染,样本中患者数X 也不会是二项分布

D 、D 、患病率是一种率,不是比例,所以不能用二项分布理论来作分析

18、某地某年的总和生育率反映该地 ( )

A 、A 、平均每千现有妇女的生育总数

B 、B 、育龄妇女实际的生育率水平

C 、C 、平均每千育龄妇女的已生育数

D 、D 、育龄妇女标化了的生育水平

19、用人口金字塔可以描述人口性别年龄分布状况,但不可仅用 作图。( )

A 、A 、各性别年龄组人口数对总人口数的比例

B、B、分性别分年龄组的人口数

C、各年龄组分性别的人口数

D、分性别计算的各年龄组人口构成比

20、分别以1964年男女标准化人口对上海市2000年男女性肺癌死亡率作直接法标准化,结果是()

A、A、不能判断标准化率比粗率高还是低

B、B、女性标准化率比粗率高

C、C、男女肺癌标准化死亡率都比粗率高

D、D、男女肺癌标准化死亡率都比粗率低

21、婴儿死亡率作为一个地区居民健康状况重要指标的主要理由之一是()

A、A、反映居民的健康水平和死亡率高低比较敏感

B、B、通过一次调查就可算得,比较方便

C、C、所获得的数据比较正确

D、D、抽样误差比较小

22、一个地区某病死因顺位提前则说明()

A、该病死亡数增多

B、该病死亡率增高

C、该病死因构成比增大

D、以上都不对

23、寿命表中5岁尚存人数与人口死亡率有关。

A、5岁组

B、5岁以前各组

C、6岁以后各组

D、5岁以后各组

24、下面4个指标中最能反映某年、某病预防工作水平的是()

A、发病率

B、患病率

C、死亡率

D、病死率

25、下面4个指标中最能反映某年某病对居民生命危害程度指标的是()

A、死亡率

B、病死率

C、1年生存率

D、死亡年龄构成比

26、随机事件一般是指()

A、A、发生概率为0的事件

B、B、发生概率为1的事件

C、发生的概率很小(如P<0.05)

D、在一次试验中可能发生也可能不发生的事件,其发生的概率 0< P < 1

27、关于随机抽样,下列说法哪一项是正确的()

A、A、随机抽样即随意抽取个体

B、B、研究者在随机抽样时应精心挑选个体,以使样本更能代表总体

C、C、遵循随机化的原则从总体中抽取观察单位,使样本能较好地代表总体特征

D、D、为确保样本具有更好的代表性,样本量应越大越好

28、参数是指()

A、A、参与个体数

B、总体的统计指标

C、C、样本的统计指标式 C、样本的总和

29、测量体重、转氨酶等指标所得的资料叫做:()

A、计数资料

B、计量资料

C、等级资料

D、间断性资料

30、用某种新疗法治疗某病患者41人,治疗结果如下:

治疗结果治愈显效好转恶化死亡

治疗人数 8 23 6 3 1

该资料的类型是:

A、计数资料

B、计量资料

C、等级资料

D、个体资料

31、某地正常成年男子红细胞均数为480万/mm3,标准差为41万/mm3,产生此标准差的原因主要是:

A、个体差异

B、抽样误差

C、测量误差

D、以上都不对

32、比较同一组儿童身高和体重两项指标的变异程度的大小,可选用的变异指标为()

A、全距

B、标准差

C、变异系数

D、四分位数间距

33、变异系数的数值()

A、一定大于1

B、一定小于1

C、可大于1,也可小于1

D、以上都不对

34、最小组段无下限或最大组段无上限的频数分布资料,可用何指标描述其集中趋势()

A、算术平均数

B、标准差

C、中位数

D、几何平均数

35、有人根据某种沙门氏菌食物中毒患者164例的潜伏期资料,用百分位数法求得潜伏期的单侧95%上限为57.8小时,其含义是()

A、A、大约有95人的潜伏期小于57.8小时

B、B、大约69人的潜伏期大于57.8小时

C、C、大约有5人的潜伏期小于57.8小时

D、D、大约有8人的潜伏期大于57.8小时

36、下列哪项指标的计算没有考虑到每一个观察值()

A、样本标准差

B、变异系数

C、总体方差

D、四分位数间距

37、血清学滴度资料最常用来表示其平均水平的指标是()

A、算术平均数

B、中位数

C、几何平均数

D、百分位数

38、偏态分布资料宜用下列哪个指标描述其分布的集中趋势()

A、算术平均数

B、中位数

C、几何平均数

D、百分位数

39、关于标准差,哪项说法是错误的()

A、A、反映全部观察值的离散程度

B、B、度量了一组数据偏离均数的大小

C、C、反映了均数代表性的好坏

D、D、不会小于算术平均数

40、一组变量的标准差将()

A、A、随变量值的个数n的增大而增大

B、B、随变量值之间的变异增大而增大

C、C、随变量值的个数n的增加而减少

D、D、随系统误差的减小而减小

41、对于一组呈正态分布的计量资料,若对每一个个体同减去一个不为零的数,则()

A、均数、标准差均不变B、均数变、标准差不变

C、均数、标准差均变D、均数不变、标准差变

42、描述一组数值变量资料的分布特征时()

A、应选用XB、应选用SC、同时选用M,Q

D、根据分布类型选用相应的集中、离散趋势指标

43、关于四分位数间距,下列哪一项是错误的()

A、适用条件同中位数B、反映数值变量资料的离散趋势

C、考虑了每个变量值的变异情况D、较极差稳定

44、下列哪一项描述不是正态分布的特征()

A、曲线位于横轴上方均数处最高B、以零为中心,左右对称

C、均数为其位置参数D、标准差为其变异度参数

45、成年男性吸烟率是女性的10倍,该指标为()

A、相对比B、构成比C、流行率D、都不对

46、收集某医院的资料,计算各种疾病所占的比例,该指标为()

A、发病率B、构成比C、相对比D、患病率

26、观察意外死亡在不同年份的变化趋势,宜选择的图形为()

A、直条图B、普通线图C、圆图D、半对数线图

47、观察甲型肝炎患者的年龄分布,宜选择的图形为()

A、直方图B、直条图C、团图D、普通线图

48、观察各种死因造成死亡的比重,宜选择的图形为()

A、直方图B、直条图C、团图D、普通线图

49、观察儿童智力与家庭收入的关系,宜选择的图形为()

A、直方图B、直条图C、圆图D、散点图

50、比较不同性别高血压患病率,宜选择的图形为()

A、直方图B、直条图C、圆图D、普通线图

51、某疗养院测得1096名飞行人员红细胞数(万/mm2),经检验该资料服从正态分布,其均值为414.1,标准差为42.8,求得的区间(414.1-1.96×

42.8,414.1+1.96×42.8),称为红细胞数的()。

A、99%正常值范围

B、95%正常值范围

C、99%置信区间

D、95%置信区间

52、为了直观地比较化疗后相同时间点上一组乳癌患者血清肌酐和血液尿素氮两项指标观测值的变异度的大小,可选用的变异指标是()

A、标准差

B、标准误

C、相关系数

D、变异系数

53、某地5人接种某疫苗后抗体滴定度为1:20、1:40、1:80、1:160 、1:320。为求平均滴定度,最好选用:()

A、中位数

B、几何均数

C、算术平均数

D、众数

54、为了使显著性检验的两类错误同时减少,可采取措施:()

A、提高显著性水平

B、增加样本含量

C、降低实验误差

D、增加人员和设备

55、某年甲、乙两地儿童麻疹流行,甲地发病300人,乙地发病250人。问该年甲、乙两地儿童麻疹发病率P谁大谁小。()

A、P

甲>P

B、P

<P

C、P

=P

D、大小关系不明

56、某县调查10岁男童身高:X1=125.62cm,S1=5.01cm;

体重 X2= 23.92Kg,S2=2.82Kg。直观判断两组资料的离散程度何者为大,其结论应当是:()

A、A、身高的离散程度大于体重的;

B、与A相反

C、C、两者离散度相等

D、无法判定

57、对于t分布来说,固定显著性水平的值,随着自由度的增大,t的临界值将会怎样变化?()

A、增大

B、减小

C、不变

D、可能变大,也可能变小

58、有两个独立随机的样本,样本含量分别为n

1和n

2

,在进行成组设计资料的t

检验时,自由度应该是:()

A、A、n

1+n

2

B、n

1

+n

2

-1 C、n

1

+n

2

+1 D、n

1

+n

2

-2

59、不同地区水中平均碘含量与地方性甲状腺肿患病率的资料如下:

地区编号: 1 2 3 4 . . . . . . 17

碘含量: 10.0 2.0 2.5 3.5 . . . . . . 24.5

患病率: 40.5 37.7 39.0 20.0 . . . . . . 0.0

60、为了通过测定碘含量来预测地方性甲状腺肿的患病率,应选用:()

A、相关分析

B、回归分析

C、正常值范围

D、均不对

61、已知甲药的疗效不会低于乙药,检验的目的是为了得出甲药的疗效是否明显地优于乙药,此时应选用:()

A、t检验

B、单侧检验

C、卡方检验

D、双侧检验

62、寿命表中死亡概率

5q

10

是指()

A、5岁者今后10年内死亡的概率

B、10岁者今后5年内死亡的概率

C、5~10岁者今后1年内死亡的概率

D、10~15岁者今后1年内死亡的概率

63、寿命表中的生存人数l

( )

A、可以是任何一个假定的人数

B、必须是10万

C、应该是今年的出生数

D、是指0岁组实际人口数

64、衡量一个地区防治结核病总成绩,用该病的()更好。

A、病死率

B、发病率

C、患病率

D、死亡率

65、某地算出2001年期望寿命为75岁,意思是()

A、A、2001年的实际人群平均可活75岁

B、B、2001年出生的人平均可以活75岁

C、C、刚出生者按2001年的死亡水平期望可活75岁

D、D、2001年死亡者平均活了75岁

66、用寿命表法计算某肿瘤患者的5年生存率,失访率较高时,()。

A、A、也不影响所算得的生存率

B、B、算得的生存率一定偏高

C、C、5年生存率会高于4年生存率

D、D、算得的生存率可能有偏

67、下面4点中不属于直接法计算生存率缺点的是()

A、A、没有充分利用随访资料所提供的信息

B、B、不能用于在大样本资料的生存率计算

C、C、n+1年的生存率会大于n年的生存率

D、D、随访不满n年的病例不能参加计算n年生存率

68、(),可以用死亡率估计发病率。

A、A、发病率较高的疾病

B、B、死亡率较高的疾病

C、C、病死率较高的疾病

D、D、病死率接近1的疾病

69、一批病人在1990年1月1日至2000年12月31日期间做手术,在2001年初获得随亡资料,()。

A、A、用直接法不能计算10年生存率

B、B、用寿命表法算犁5年生存率不反映近2年手术质量及治疗效果

C、C、用直接法和用寿命表法算得的5年生存率相等

D、D、此时用寿命表法计算生存率优于用直接法

70、直接法算得的5年生存率()。

A、A、可以等于1

B、B、不会高于4年生存率

C、C、能反映近5年内的治疗水平

D、D、不会高于6年生存率

71、总生育率是指()。

A、A、活产数对总人口数之比

B、B、活产数对总妇女数之比

C、C、活产数对育龄妇女数之比

D、D、活产数对已婚育龄妇女数之比

72、终生生育率说明()。

A、A、一批妇女实际生育水平

B、B、目前各年龄妇女的生育水平

C、C、各年龄妇女的平均生育水平

D、D、全人口平均每人生育水平

73、总和生育率是指()。

A、A、每岁一组的生育率之和

B、B、各年龄组生育率之和

C、C、一批妇女一生的实际生育率

D、D、各年份生育率之和

74、粗再生育率是指()。

A、A、已婚育龄妇女的生育率

B、B、以女婴为分子的生育率

C、C、只计算女婴的总和生育率

D、D、以总人口为分母的生育率

75、净再生育率是指()。

A、A、能替代母亲一代执行生育职能的女婴数

B、B、去除婴儿死亡后的生育率

C、C、只考虑常住户口的生育率

D、D、只考虑合法夫妻的生育率

76、对于标准正态分布变量,()范围内有90%变量值。

A、0~1.96

B、-1.96~1.96

C、-1.64~∞

D、-1.64~1.64

77、利用一次横断面调查资料,描述职业和肝炎患病率关系应该用()。

A、散点图

B、直方图

C、直条图

D、圆图

78、在同一总体中随机抽样,样本含量n越大,则理论上()越小。

A、A、样本标准差

B、B、中位数

C、C、标准差的抽样误差

D、D、第95百分位数

79、在某个连续分布总体中随机抽样,变量是X,(),理论上样本均数的分布很快趋向正态分布。

A、A、X服从正态分布,随样本大小n增大

B、B、X不服从正态分布,随样本大小n增大

C、C、n不变,随样本个数k增多

D、D、X不服从正态分布,随样本个数k增多

80、血清滴度(X)资料常用几何均数表示平均水平是由于()。

A、A、按等比级数分组

B、B、X近似正态分布

C、C、lgX近似于对数正态分布

D、D、X近似于对数正态分布

81、计算几何均数G时,用常用对数lgX与用自然对数lnX所得计算结果()。

A、一样

B、不一样

C、有时一样,有时不一样

D、可能相差较大,只能用lgX

82、算术均数与中位数相比,()。

A、A、抽样误差更大

B、B、不易受极端值的影响

C、C、更充分利用数据信息

D、D、更适用于分布不明及偏态分布资料

83、比较连续分布数据的离散度,()

A、A、单位相同时根本不能用CV

B、B、单位相同均数据相差较大时根本不能用

C、C、s表示绝对离散度,CV表示相对离散度

D、D、只要单位相同,用s和用CV都是一样的

84、标准正态分布是指()。

A、N(μ,σ)

B、N(0,0)

C、N(1,1)

D、N(0,1)

85、以中位数表示集中趋势,()资料。

A、A、不能用于正态分布的

B、B、不能用于严重偏态的连续分布的

C、C、可用于任何分布的计量

D、D、可用于任何一种属性(分类)

86、描述年龄(分10组)与疗效(有效、无效)的关系,应画()。

A、线图

B、圆图

C、直方图

D、百分条图

87、直方图可用于()。

A、A、2001年5种疾病发病率比较

B、B、10个年龄组患病率比较

C、C、身高和患病率的关系分析

D、D、描述O型血者血红蛋白含量分布

88、下列表示离散趋势的指标中,()没有单位(量纲)。

A、A、标准差

B、B、极差

C、C、变异系数

D、D、四分位数间距

89、实际工作中,两均数作差别的统计检验,要求数据近似正态分布及()。

A、A、两样本均数相差不太大

B、B、两组例数不能相差太多

C、C、两样本方差相近

D、D、两组数据标准误相近

90、减小均数的抽样误差的可行的方法之一是()。

A、A、严格执行随机抽样

B、B、增大样本含量

C、C、设立对照

D、D、选一些处于中间状态的个体

91、增大样本含量,理论上可使()更小。

A、A、均数的抽样误差

B、B、样本中位数

C、C、样本极差

D、D、样本标准差

92、在同一总体随机抽样,其他条件不变,样本含量越大,则()。

A、A、样本标准差越大

B、B、样本标准差越小

C、C、总体均数的95%可信区间越窄

D、D、总体均数的95%可信区间越宽

93、两组数据中的每个变量值减去同一常数后作两样本均数差别的t检验,t值()。

A、A、变小

B、B、变大

C、C、不变

D、D、变小或变大

94、下列有关配对设计的差值的样本均数与总体均数比较的t检验(简称配对t 检验)与成组设计的两样本均数比较的t检验(简称成组t检验的描述中,哪一项是错误的()。

A、A、对于配对设计的资料,如果作成组t检验,不但不合理,而且平均起来统

计效率降低

B、B、成组设计的资料用配对t检验起来可以提高统计效率

C、C、成组设计的资料,无法用配对t检验

D、D、作配对或成组t检验,应根据原始资料的统计设计类型而定

95、作两样本均数差别的t检验中,P值与α值中,()。

A、A、α值是研究者指定的

B、B、P值是研究者指定的

C、C、两者意义相同,数值不同

D、D、两者意义相同,数值相同

96、抽样研究男女性的下列指标差别,若(),应作双侧假设检验。

A、A、已知女性的平均肺活量比男性小

B、B、已知女性的平均白细胞数与男性相同

C、C、不知男女性血小板平均数是否相同

D、D、已知女性的血红蛋白量不比男性高

97、由于两个独立样本计算得两个总体均数的可信区间,()。

A、A、如果两个可信区间有重叠,可认为两样本均数差别无统计意义

B、B、如果两个可信区间有重叠,可认为两样本均数差别有统计意义

C、C、如果两样本均数差别无统计意义,两个总体均数之差的可信区间包含0

D、D、如果两样本均数差别无统计意义,两个总体均数之差的可信区间不包含0

98、在两样本均数差别的统计检验中,事先估计并确定合适的样本含量的一个重要作用是()。

A、A、控制第一类错误概率的大小

B、B、可以消除第一类错误

C、C、控制第二类错误概率的大小

D、D、可以消除第二类错误

99、在两变量X

1和X

2

的配对t检验中,差数的()。

A、A、总体均数就是总体均数之差

B、B、方差就是两样本均数之差的方差

C、C、总体均数的可信区间一定包含0

D、D、均数的方差是0

100、在研究两种药物治疗高血压的效果的配对t检验中,要求()。

A、A、两组的样本方差相等

B、B、数据呈双变量正态分布

C、C、差数d服从正态分布

D、D、差数d的方差等于0

二、名词解释:

1、1、总和生育率

2、2、检验效能

3、3、变量

4、4、总体

5、5、医学正常值范围

6、6、统计描述

7、7、假设检验

8、8、相关分析

9、9、非参数检验

10、患病率

11、相关系数

12、回归系数

13、发病率

14、人口金字塔

15、平均寿命

16、第一类错误

17、第二类错误

18、假设检验

19、抽样研究

20、死因顺位

21、疾病谱

22、人口自然增长率

23、婴儿死亡率

24、新生儿死亡率

25、概率

26、等级资料

27、计量资料

28、变量

29、计数资料

30、检验水准

31、参数

32、统计量

33、观察单位

34、抽样

35、抽样研究

36、P值

37、寿命表

38、育龄妇女生育率

39、粗再生育率

40、净再生育率

41、更替水平

42、终身生育率

43、统计推断

44、标准化法

45、二项分布

46、泊松分布

47、正态分布

48、可信区间

49、误差

50、抽样误差

51、系统误差

52、标准误

53、标准差

54、中位数

55、直线相关分析

56、直线回归分析

57、生存率

58、变异

59、单纯随机抽样

60、分层抽样

61、系统抽样

62、整群抽样

63、统计表

64、统计图

65、动态数列

66、期望寿命

67、围产期死亡率

68、婴儿死亡率

69、孕产妇死亡率

70、人口自然增长率

71、平均世代数

72、根本死亡原因

73、特异度

74、敏感度

75、阳性预测值

76、阴性预测值

77、变异系数

78、偏相关系数

79、决定系数

80、生存人年数

三、简答题

1、1、正态分布有什么基本特征?有哪几个参数?

2、2、什么叫标准正态分布?

3、3、什么是正常值范围?制定正常范围的基本步骤是什么?

4、4、标准差与变异系数的异同点有哪些?

5、5、正态分布法与百分位数法制定正常值范围各有什么特点?

6、6、样本均数的分布有哪些基本特征?

7、7、总体均数的可信区间中的可信度和区间的宽度各说明什么?

8、8、正态分布、标准正态分布和t分布有什么联系和区别?

9、9、总体标准误和样本标准误的意义和应用有什么区别?

10、10、两样本均数比较时为什么要作统计检验?

11、11、我们班级全体男女同学的平均血压作比较,要不要作统

计检验?

12、12、在t检验中,如果无效假设成立,中间的95%的t值的

范围是什么?

13、13、T检验中第一类错误的概率是怎么决定的?为什么一般

t检验中不显示第二类错误的概率?

14、14、两样本均数的差别作统计检验,P>0.05,你对此结果如

何解释?若P<0.05,又有哪些具体解释?

15、15、两样本均数差别的t检验中,什么情况下作单侧检验?

什么情况下作双侧检验?

16、16、对样本均数与总体均数或对两样本均数的差别作统计检

验,可信区间和t检验有什么关系?

17、17、t检验要求什么基本条件?

18、18、t检验基本步骤是什么?

19、19、线性回归和线性相关分析的目的是什么?

20、20、线性回归和线性相关分析对数据有什么要求?

21、21、建立回归方程用的是什么方法?

22、22、相关系数有什么性质?

23、23、为什么要对样本回归系数及样本相关系数作统计检验?

24、24、同一批样品用两种方法测定结果的相关系数是0.95,

能否说两方法测定结果相同?

25、25、回归和相关分析中的t检验是双侧的还是单侧的?其意

义是什么?

26、26、r和b的意义是否相同?它们的假设检验的意义是否相

同?

27、27、行×列表资料作χ2检验的目的是什么?

28、28、四格表的χ2检验对数据有什么要求?

29、29、χ2值的校正是什么意思?怎么进行校正?

30、30、配对χ2检验适用于什么情况?为什么要作四格表的配

对设计?

31、31、四格表确切概率法检验的基本原理是什么?

32、32、四格表确切概率法检验与χ2检验在应用上有哪些相同

点和不同点?

33、33、在四格表确切概率法检验中为什么要计算更极端情况的

概率?什么情况下需要计算更极端情况的概率?

34、34、四格表确切概率法检验中怎么判断有哪些更极端的情

况?

35、35、哪些情况下要用四格表确切概率法检验?

36、36、二项分布的定义是什么?二项分布有哪些基本性质?

37、37、二项分布原理可用于哪些方面的统计分析?

38、38、二项分布与正态分布有什么联系?

39、39、二项分布的拟合优度检验有什么实际意义?

40、40、Possion分布的定义是什么?列举几possion分布变量

的实例?

41、41、Possion分布有哪些基本性质?

42、42、应用Possion分布理论可进行哪些统计分析?

43、43、什么叫非参数统计方法?非参数统计方法有哪些特点?

44、44、对于正态分布资料,用非参数统计方法作分析是否可

以?有何影响?

45、45、如何判断一组数据是否服从正态分布?

46、46、为什么某年死亡者平均年龄不等于期望寿命?

47、47、死亡概率和死亡率的区别是什么?

48、48、发病率、患病率、病死率和死亡率存在什么联系和区别?

49、49、同一地区不同年份居民初婚者平均年龄降低,是不是可

以认为该地居民初婚年龄提前了?

50、50、不同时间、不同地点的期望寿命可以直接比较,不必考

虑人口年龄构成,对不对?为什么?

51、51、疾病统计有几类指标,各有什么意义?

52、52、反映疾病的预防效果和治疗效果的指标有哪些?各有什

么特点?

53、53、寿命表法和直接法计算生存率的优缺点是什么?

54、54、作生存分析应惧哪些资料?作生存率比较应该用什么方

法?

55、55、如何提高生存率指标的质量?

56、56、平均世代年数怎么计算?该指标是什么意思?

57、57、测量生育水平有几个指标?各指标有什么不同?

58、58、测量人口再生产有几个指标?各指标有什么不同?

59、59、人口统计应包括哪几个方面?

60、60、人口金字塔有几种典型的形状?各说明什么?

61、61、如何表达一批计量数据的基本特征?

62、62、表达中心位置(集中趋势)的指标有几个,各适用于什

么情况,有什么优缺点?

63、63、标准差有何用途?

64、64、表示离散度的指标有哪几个,各适用于什么情况,有什

么优缺点?

65、65、为什么要根据数据的性质和分布来选择不同的描述集中

趋势和离散趋势的指标?

66、66、半对数线图的图形如何作分析?

67、67、如何判断一批资料是否正态分布或对数正态分布?

68、68、如何选择统计图?

69、69、对数正态分布数据如何制定正常值范围?

70、70、直方图和圆图在应用中有何区别?

71、71、如何选择正态分布法或用百分位数法制定正常值范围?

72、72、原始数据单位变换后,对均数和方差有什么影响?

73、73、如何把正态分布数据转换成标准正态分布数据?请列举

几个统计学中经常出现的标准正态分布变量。

74、74、什么是中心极限定理,中心极限定理在统计方法的应用

中有什么意义?

75、75、均数抽样误差的意义是什么,有哪些实际应用?抽样误

差的大小受哪些因素的影响?

76、76、请列举几标准正态分布变量,并说明在实际应用中的意

义。

77、77、正态分布、t分布与u分布有何联系与区别?

78、78、在作假设检验中,P值含义是什么?α的意义是什么?

P小于等于α或P大于等于α的意义是什么?

79、79、可信区间的含义是什么?可信区间的准确度和精密度指

的是什么?

80、80、医学正常值范围与可信区间有何区别?

81、81、在假设检验中,无效假设与备择假设的含义是什么?两

种假设之间有何联系?

82、82、假设检验的基本思想是什么?检验水准的高低(如α取

0.05和0.01)是根据什么确定的?采用单侧或双侧检验的依据是什

么?

83、83、t检验的应用条件是什么?在样本均数与某个书籍总体

均数比较的假设检验中,在什么情况下用t检验,又在什么情况下可以有u检验?

84、84、什么是配对设计(数值变量)?如何使配对研究设计得

更好?

85、85、何谓假设检验中的第一类错误?何谓第二类错误?如何

控制两类错误概率的大小?

86、86、成组设计的两样本均数比较的t检验,对期相应的总体

方差有何要求?怎么判断是否符合该要求?

87、87、方差不齐时,两样本均数比较应采取什么方法作假设检

验?

88、88、以两样本均数差别的假设检验为例,说明假设检验中有

几种可能的统计学结论及其意义。

89、 89、 在假设检验中,如何使所得结论更可靠?

90、 90、 什么叫方差分析?方差分析的主要用途是什么?

91、 91、 方差分析的基本原理是什么?方差分析的基本步骤是什

么?

92、 92、 何为单因素方关分析和两因素方差分析?各适用于什么

情况?

93、 93、 直线回归和直线相关分析的联系与区别是什么?应用时

应注意哪些问题?

94、 94、 对回归系数作假设检验有几种方法,相互间有什么关

系?

95、 95、 有人说,多个样本均数间的两两比较无非就是做若干次

的t 检验。您的看法如何?

96、 96、 方差不齐时,两小样本均数间的比较,可以通过哪些统

计方法来实现?

97、 97、 如果已知回归直线一定经过(0,0)点,该回归方程是

什么形式?

98、 98、 请解释回归分析中要求Y 服从等方差的正态分布的意义

是什么?

99、 99、 对相关系数作假设检验有几种情况?各用什么统计量?

100、 100、 为什么相关回归关系不一定是因果关系?

四、是非题

1、对数正态分布资料最好计算几何均数以表示其平均水平。( )

2、不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。( )

3、理论上只有服从正态分布条件的变量的算术均数等于中位数。( )

4、少数几个数据比大部分数据大几百倍,一般不宜用算术均数表示平均水平。

( )

5、数据按等比级数分组时,不管分布如何,都应该计算几何均数表示平均水平。

( )

6、理论上,对于正态分布资料,总体百分位数的P 5~P 95和μ±1.96σ范围内都

包含95%的变量值。( )

7、随机抽样就是指在抽样研究中不要主观挑选研究个体。( )

8、同一总体中随机抽样,样本含量越大,则样本标准差越小。( )

9、只要单位相同,用s 和用CV 来比较两套变量值的离散度,结论是完全一样的。

( )

10、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。( )

11、x σ表示总体均数的标准误,x S 表示样本均数的标准误。( )

12、同一批计量数据的标准差不会比标准误大。( )

13、正态分布资料样本均数的95%可信区间用x S 96.1x ±表示。( )

14、即使变量X 偏离正态分布,只要样本含量相当大,均数x 也近似正态分布。

( )

15、用S x 96.1 制定出正常值范围后,不在这个范围内的人一定是病人。( )

16、t 检验是对两样本均数的差别作统计检验的方法之一。( )

17、t 检验结果t=1.5,可认为两总体均数差别无统计意义。( )

18、两次t 检验都是对两样本均数的差别作统计检验,一次P<0.01,另一次

P<0.05,就表明前者两样本均数差别大,后者两样本均数相差小。( )

19、当总体方差已知时,检验样本均数和某个已知总体均数差别有无统计意义只

能用t 检验。( )

20、在配对t 检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,

作t 检验后的结论是相同的。( )

21、对两样本均数的差别作统计检验,两组数据具有方差齐性,但与正态分布相

比略有偏离,样本含量都较大,因此仍可作t 检验。( )

22、两组对数正态分布数据,每个数据都除以一个不等于0的常数后,再取对数

据作t 检验,与不除以该常数时取对数作t 检验的结论是一样的。( )

23、方差的数值可以比标准差小。( )

24、方差齐性检验中的F 值是两个标准差之比。( )

25、t 检验可用于同一批对象的身高与体重均数差别的统计检验。( )

26、两样本均数的差别作统计检验,若可作方差分析,则也可作t 检验。( )

27、方差分析法是研究两个或多个总体无数的差别有无统计意义的统计方法。

( )

28、方差分析时要求各组的样本方差相左不大。( )

29、完全随机设计资料方差分析中要求各组均数相差不大。( )

30、均方就是方差。( )

31、随机区组设计和完全随机设计方差分析的统计效能总是一样的。( )

32、随机区组设计方差分析法也可用于完全随机设计资料,这样可提高统计效能。

( )

33、4个均数作差别的统计检验,可以分别作两两比较的6次t 检验以作详细分

析。( )

34、如果把随机区组设计资料用完全随机设计方差分析法作分析,前者的区组

SS+误差SS 等于后者的组内SS 。( )

35、随机区组方差分析中,只有当区组间差别的F 检验结果P>0.05时,处理组

部差别的F 检验才是真正有意义的。( )

36、回归系数越大,两变量的数量关系越密切。( )

37、双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。( )

38、对于双变量正态分布资料,同一样本的相关系数及回归系数与零的差别的统

计检验结论一致。( )

39、样本相关系数r=0.8,就可认为两变量相关非常密切。( )

40、建立了回归方程,且b 有统计意义,就可认为两变量间存在因果关系。( )

41、某事物内部某一部分所占的比重就是比例,患病率也是一种比例。( )

42、比例是时点指标,率是时期指标。( )

43、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以

计算标准化死亡率后再作比较。( )

44、同一地方30年来肺癌死亡率比较,要研究是否肺癌致病因子在增强,应该

用同一标准人口对10年来的肺癌死亡率分别作标化。()

45、3个医院的门诊疾病构成作比较不可作χ2检验。()

46、用甲乙两药治疗某病,甲组400人,乙组4人,治愈数分别为40人和0人,要研究两药疗效差别,不可作χ2检验。()

47、四格表资料作χ2检验,四个格子里都不可以是百分比。()

48、有理论数小于1时,3行4列的表也不能直接作χ2检验。()

49、5个比例的差别作χ2检验,P<0.05可认为总体比例各不相等。()

50、总例数等于60,理论数都大于5的四格表,对两个比例的差别作统计检验,不可用确切概率法。()

51、对智能发育迟缓与智能发育正常的儿童年配对调查,都查阅出生记录以确定分娩过程中婴儿有无缺氧和窒息,作配对χ2检验,若P<0.05,可认为儿童智能发育迟缓与出生时缺氧窒息有关。()

52、四格表资料作确切概率法检验,有理论数较小时,近似得不很好,也要作校正。()

53、对3个地区居民的血型构成作抽样调查后研究其差别,若有一个理论数小于5大于1,其余都大于5,可用校正χ2检验。()

54、在某特征比例为π的总体里随机抽样,样本含量n固定时,样本中该特征阳性个体数就服从二项分布。()

55、总体比例越接近100%,在该总体随机抽样所得样本比例越接近正态分布。()

总体比例的95%可信区间都应该用公式P±1.96Sp计算。()

56、两样本比例的差别的确切概率法检验是用二项分布原理计算概率的精确方法。()

57、没有传染性的疾病在某个社区内各户的分布都呈二项分布。()

58、Possion分布的拟合优度检验结果p>0.05,就证明该事物的分布是随机的。()

59、把某肿瘤新发病例的居住点画在一张地图上,把地图划分成许多面积相等的小方格后作Possion分布的拟合优度检验,结果P<0.01,可认为此病在人群中的分布不随机,可能有传染性。()

60、发病率很低的某肿瘤两样本发病率的比较,可考虑用possion分布的正态近似法。()

61、没有传染性的罕见病在人群中呈Possion分布。()

62、计算Possion分布的概率可用于某罕见事件样本数和一个已知总体无数差别的统计检验。()

63、非参数统计方法不对特定分布的参数作统计推断,但仍要求数据服从正态分布。()

64、正态分布资料也可用非参数统计方法作分析,但平均统计效能偏低。()

65、两组资料比较时,秩和检验与t检验的无效假设是一样的。()

66、研究两种治疗方法疗效(优、良、中、差)的差别,可用秩和检验。()

67、对等级相关系数作假设检验,查表时自由度为n-2。()

68、在配对符号秩和检验中,对差值相等且符号一致的两个或多个差值编秩时,可以不算平均秩次。()

69、等级相关系数的假设检验是一种非参数检验方法。()

70、等级相关系数的大小不可以反映两个现象间关系的密切程度。()

71、老龄化人口是指65岁及以上老人占总人口数的10%以上。()

72、扶养比是指0~14岁和65岁及以上人数占总人口数的比例。()

73、生育率与人口性别构成无关,与年龄构成也无关。()

74、寿命表中0岁期望寿命一定比1岁期望寿命高。()

75、死因顺位下降的疾病,死亡率也可以是升高的。()

76、同一地区的不同年份的某病发病率比较时,不必标准化。()

77、用寿命表法计算生存率,中途失访者的信息不能利用。()

78、因素和疾病间的因果关系可用相关分析来确定。()

79、用直接法算得的生存率比较可用Logrank检验。()

80、用寿命表法计算的生存率没有误差。()

81、同一群人同一年的生育率一定高于出生率。()

82、人口总数变化要考虑自然变动和机械变动两方面。()

83、如果一对夫妻生两个孩子,人口总数就保持不变。()

84、出生数就是活产数。()

85、育龄妇女是指15~49岁的妇女总数。()

86、在同一连续分布总体中作随机抽样,理论上样本均数越大,则样本标准差越大。()

87、在同一连续分布总体中作随机抽样,理论上样本含量越大,样本标准差越小。()

88、对称分布就是正态分布。()

89、从同一连续分布总体中随机抽样,政府上样本含量越大,则样本极差越大。()

90、样本中位数不受样本中的极端值影响。()

91、正态分布资料也可用中位数描述其集中趋势(中心位置)。()

92、分组的连续分布资料,计算百分位数要求组距相等。()

93、对于连续分布资料,单位相同时,也可用变异系数比较两个变量的相对离散度。()

94、从同一连续分布总体中随机抽样,样本含量越大,理论上从样本算得的变异系数越小。()

95、对于计量数据,不应按分组方式决定是否计算几何均数。()

96、若男女儿童平均身高接近,可用标准差来比较其绝对离散度。()

97、四分位数间距也是描述连续分布数据离散度的指标。()

98、自由度等于无穷大时的t分布就是标准正态分布。()

99、标准正态分布常用N(0,1)表示。()

100、严格地说,正态分布一定以0为中心,左右对称。()

五、计算分析题

1、1、某卫生防疫站对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝

抑制抗体滴度资料如下:求其平均滴度。

抗体滴度 1:8 1:16 1:32 1:64 1:128 1:256 1:512

卫生统计学公式

相对数 公式(3.1) 公式(3.2) 公式(3.3) χ2检验 公式(3.4)理论频数 公式(3.5)χ2基本公式 公式(3.6)χ2自由度ν=(R-1)(C-1)公式(3.7)χ2校正的基本公式 公式(3.8)四格表专用公式 公式(3.9)四格表校正公式 公式(3.10)2×k表专用公式 公式(3.11)

公式(3.12)R×C表通用公式 中位数 公式(4.1)当n为奇数时 公式(4.2)当n为偶数时 公式(4.3)频数表上计算 公式(4.4) 百分位数 公式(4.5)频数表上计算 算术均数 公式(4.6)χ=(1/n)∑X 公式(4.7)χ=C+(1/n)(Xi-C) 公式(4.8)χa=Xa-1+(1/n)(Xa-Xa-1) 公式(4.9)χ=(1/n)∑fX 几何均数 公式(4.10)

公式(4.11) 四分位数间距 公式(4.12)Q=P75-P25 均差 公式(4.13) 标准差 公式(4.14)样本标准差 公式(4.15)递推计算 公式(4.16)直接计算 公式(4.17) 变异系数 公式(4.18)CV=S/X×100%, X>0 正态曲线 公式(5.1)正态曲线方程

(5.2)正态离差 (5.3)标准正态曲线 (5.4)正常值围X±uαs 标准误 (6.1)理论标准误 (6.2)样本均数的标准误 (6.3)率的标准误 (6.4) t分布 (6.5) 总体均数的估计 (6.6) 95%可信区间X-t0.05,νSχ<μ (6.9) 99%可信区间P-2.58Sp<π

卫生统计学整理笔记

如何绘制频数表? 求组距 确定各组段的两个端点 归组计数 频数分布表与分布图作用 1.揭示变量分布形态 2.揭示变量分布趋势 3.便于发现特大的或特小的极端值 4.便于进一步计算统计指标和分析 5.作为一种数据陈述的形式 算数应用条件: 对称分布,尤其正态分布 几何应用条件: 1.对数对称分布、等比资料 2.变量值中不能有0;不能同时有正值和负值;若全是负值,计算时可先把负号去掉,得出结果后再加上负号。 中位数条件: 所有分布、尤其偏态分布: 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清 极差应用条件:所有分布、尤其偏态分布 不足: 不能全面的反映所有值的偏离程度 不稳定、小样本小于大样本、样本小于总体 四分位数间距应用条件 所有分布、尤其偏态分布: 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清 方差应用条件: 对称分布,尤其正态分布 变异系数应用 1.量纲不一致

散点图作用 观察两组数据的总体趋势和明显偏离趋势的观察点 判断两组数据的关联形式、方向和密切程度 相关分类 线性相关 秩相关 分类变量相关 线性相关意义 r>0表示正相关,r=1表示完全正相关;r<0表示负相关,r=-1表示完全负相关。 |r|→0表示相关性越弱,|r|→1表示相关性越强。 r=0表示没有线性相关,不代表没有相关。 如何判断线性相关 画散点图 计算线性相关系数 假设检验 如何进行秩相关 编秩次 计算秩相关系数 假设检验 回归分析:利用样本信息,找到变量间数量依存关系。 线性回归分析:利用样本信息,找到变量间线性数量依存关系。 决定系数:反映回归贡献的相对程度,即Y的变异被X解释的比例。 如何进行分类变量的相关分析 交叉表的制作,计算各种概率 计算列联系数 假设检验 相关分析的条件 线性相关系数:二元正态分布的定量变量 秩相关系数:非二元正态分布的定量变量、有序分类变量 列联系数:无序分类变量 轶闻数据:由坊间流传或各种媒体报道的一些个案数据,由于其特殊性往往给公众留下突出和深刻的印象。 特点:缺乏代表性,常诱导人们进行简单的推论,得到一些具有倾向性的结论。 可得数据:为了某些特定目的已收集或积累的数据。如:各类监测数据、统计年鉴等。

卫生统计学第7版

卫生统计学(本科预防)(第7版) 目录 第一章绪论 第一节医学中统计思维的进化 第二节统计学与公共卫生互相推动 第三节统计学的若干概念 第四节目标与方法 第二章定量变量的统计描述 第一节频率分布表与频率分布图 第二节描述平均水平的统计指标 第三节描述变异程度的统计指标 第四节描述分布形态的统计指标 第五节统计表和统计图 第六节统计内容的报告与中英文表达 第七节案例讨论 第八节计算机实验 第九节小结 第三章定性变量的统计描述 第一节定性变量的频率分布 第二节常用相对数指标 第三节医学人口统计常用指标 第四节疾病统计常用指标 第五节粗率的标准化法 第六节动态数列及其指标 第七节定性变量统计图 第八节中英文结果报告 第九节案例讨论 第十节计算机实验 第十一节小结 第四章常用概率分布 第一节二项分布 第二节Poisson分布 第三节正态分布 第四节中英文结果报告 第五节案例讨论 第六节计算机实验 第七节小结 第五章参数估计基础 第一节抽样分布与抽样误差

第二节t分布 第三节总体均数及总体概率的估计 第四节中英文结果报告 第五节案例讨论 第六节计算机实验 第七节小结 第六章假设检验基础 第一节假设检验的概念与原理 第二节t检验 第三节二项分布与Poisson分布资料的z检验第四节假设检验与区间估计的关系 第五节假设检验的功效 第六节正态性检验 第七节中英文结果报告 第八节案例讨论 第九节计算机实验 第十节小结 第七章方差分析基础 第一节方差分析的基本思想 第二节方差分析的步骤 第三节多个样本均数的两两比较 第四节方差分析的前提条件和数据变换 第五节中英文结果报告 第六节案例讨论 第七节计算机实验 第八节小结 第八章χ2检验 第一节独立样本四格表资料的χ2检验 第二节多个独立样本R×c列联表资料的χ2检验第三节配对设计资料的χ2检验 第四节列联表资料的确切概率法 第五节χ2检验用于拟合优度检验 第六节中英文结果报告 第七节案例讨论 第八节计算机实验 第九节小结 第九章基于秩次的非参数检验 第一节配对设计资料的符号秩和检验 第二节两组独立样本比较的秩和检验 第三节多组独立样本比较的秩和检验

卫生统计学名词解释

1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 5.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 2.概率是描述随机事件发生可能性大小的数值,常用P表示。随机事件概率的大小在0与1之间,P越接近1,表示某事件发生的可能性越大;P越接近0,表示某事件发生的可能性越小。习惯上将P≤0.05的事件,称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可视为不发生。 6. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 7.系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 8.随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。随机量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。 9.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。 10.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 11.频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。 12.算术均数(arithmetic mean)描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示。 13.几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 14.中位数(median)Md将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。 15.极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。 16.百分位数(percentile)是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。

卫生统计学简答题汇总

统计学简答汇总 第一章:绪论(无) 第二章:定量变量的统计描述 1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5. 表2-5 均数,几何均数和中位数的相异点 平均数意义应用场合 均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布 几何均数平均增减倍数①等比资料;②对数正态分布资料 中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两 察值水平端出现不确定值 2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系? 答: 1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。 (2)计算:中位数和百分位数均可用同一公式计算,即 Px=L+(i/f x)(n·x%-Σf L) 可根据研究目的选择不同的百分位数代入公式进行计算分析。 (3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中 更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。 3.同一资料的标准差是否一定小于均数? 答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。 4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? (1)样本含量的大小,样本含量越大,标准差越稳定。 (2)分组的多少 (3)分布形状的影响,偏态分布的标准差较近似正态分布大 (4)随机测量误差大小的影响 (5)研究总体中观察值之间变异程度大小 5.标准差与变异系数的异同点有哪些? 答:标准差:是以算数平均数为中心,反映各观测值离散程度的一个绝对指标.当需要对同一总体不同时期或对不同总体进行对比时,缺乏可比性.当总体平均水平不同或计量单位不同时,用标准差是无法实现两组数据离散程度大小对比的. 变异系数:标准差与平均数的比值称为变异系数,记为C·V.变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。 6.如何表达一批计量数据的基本特征? 答:从集中趋势和离散趋势两方面回答。 7. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况? 答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系

最新卫生统计学试题及答案(附解释)资料

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E ? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______. A.当样本含量增大时,均数也增大 B.均数总大于中位数 C.均数总大于标准差

卫生统计学重点笔记之令狐文艳创作

医师资格考试蓝宝书-预防医学 令狐文艳 医学统计学方法 第一节基本概念和基本步骤(非常重要) 一、统计工作的基本步骤 设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。 实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。样本的指标为统计量。 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。 某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件。

二、变量的分类 变量:观察单位的特征,分数值变量和分类变量。 第二节数值变量数据的统计描述(重要考点) 一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称,适用于正态或近似正态分布。 2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。 二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越 小,观察值的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变

卫生统计学-第六版

一、名词解释:' ]6 H0 p3 ?' n- |3 a. { p0 l1 U4 ? 1、总体是根据研究目的确定的同质观察单位的全体。- I7 k$ _, J" @: Y, B" u 2、样本是从总体中随机抽取的部分观察单位。 3、总体参数是根据总体个体值统计算出来的描述总体的特征量。 4、样本统计量是根据样本个体值统计计算出来的描述样本的特征量。% v, |* O: j/ D0 ?2 C 5、变量:对某项变异特征进行测量和观察,得到的指标。 6、计量资料:对某个观察单位用定量的方法测定某项指标量的大小,所得的资料。 7、计数资料:将观察单位按某种属性或类别分组,所得的观察单位数。 8、等级资料:将观察单位按测量结果的某种属性的不同分组,所得的观察单位数。 9、概率:是描述随机事件发生的可能性大小的数值,用P表示。 10、小概率事件:习惯上将≤0.05(1分),称为小概率事件,表示在一次实验或观察中该事件发生的可能性很少,可视为不发生。 11、抽样误差:由抽样造成的样本统计量和总体参数的差别。& b n. D4 Q8 G& h7 q6 r' f 12、频数表:当变量值个数较多时,可将各变量值及其相应的频数列表。- h( F6 D: ^5 ~7 @; _ 13、中位数:一组按大小顺序排列的变量值,位次居中的观察值。 14、极差:又称全距,指所有观察值最大值与最小值的差值。 15、百分位数:是一种按大小顺序排列的变量值分为100份,理论上有x%的变量值比它小,有(100-x)%变量值比它大,对应x%位次的数值。 16、四分位数间距:变量值中上四分位数p75与下四分位数p25的差值。' H6 s7 r; o- n) f$ A2 D m 17、方差:各个变量值的离均差平方和样本例数之比,描述资料的离散趋势。 ?0 y5 c% r2 o y {8 ^7 w' A8 P 18、标准差:方差开方,是描述数据分布离散程度(或变量变化的变异程度)的指标。 19、变异系数:样本标准差与均数之比的百分数,描述资料的离散趋势。 20、标准正态分布:均数为0,标准差为1的正态分布。即N(0,1)6 K. w' E& { c4 R( L7 F* T4 C8 } 21、集中趋势:所有观察值向均数集中靠拢的趋势。 22、卫生统计学:以医学为指导,用统计学的原理和方法研究医学的一门应用科学。它包括三个方面的内容:①卫生统计学的基本原理和方法。②健康统计。③卫生服务统计。9 Y/ [. X1 P' H! o5 B 23、离散趋势:是指观察值的参差不齐或者分散性。- t, R& v; x+ e& P 24、医学参考值范围:也称正常值范围,医学上常把绝大多数正常人(排除了有关疾病和因素对所研究指标有影响的所谓正常人)某项结构、功能、代谢产物指标范围,称为指标的正常值范围。0 u3 r6 E: F& J6 R; U 25、自由度:随机变量能自由取值的个数。7 E; h+ X# k# ?. G5 N0 Y% N" _! r 二、是非题:6 I7 v e# K' d6 } 1、变量值之间呈倍数或等比关系的数据,宜用几何均数表示其平均水平。 2、百分位数应用中提到,分布中间的百分位数相当稳定具有较好的代表性,但靠近两端的的百分位数只有在样本例数足够多时才能比较稳定。 3、为了解数值变量分布规律,可将观察值编制频数表,绘制频数分布图,用于描述资料的分布特征以及分布类型。 4、如果少数几个数据比大部分数据大几百倍一般就不宜计算均数。; I5 z. F) |3 p J5 o 5、原始数据有零,就不能直接计算几何均数。7 s# L) J5 j- I, Z% ~( N9 n; y 6、制定正常值范围应选足够数量正常人作为调查对象,所谓正常人就是排除影响被研究指

卫生统计学公式解析(doc 11页)

卫生统计学公式解析(doc 11页) 部门: xxx 时间: xxx 整理范文,仅供参考,可下载自行编辑

相对数 公式(3.1) 公式(3.2) 公式(3.3) χ2检验 公式(3.4)理论频数 公式(3.5)χ2基本公式 公式(3.6)χ2自由度ν=(R-1)(C-1)

公式(3.7)χ2校正的基本公式公式(3.8)四格表专用公式 公式(3.9)四格表校正公式 公式(3.10)2×k表专用公式公式(3.11) 公式(3.12)R×C表通用公式中位数 公式(4.1)当n为奇数时 公式(4.2)当n为偶数时 公式(4.3)频数表上计算 公式(4.4) 百分位数

公式(4.5)频数表上计算 算术均数 公式(4.6)χ=(1/n)∑X 公式(4.7)χ=C+(1/n)(Xi-C) 公式(4.8)χa=Xa-1+(1/n)(Xa-Xa-1) 公式(4.9)χ=(1/n)∑fX 几何均数 公式(4.10) 公式(4.11) 四分位数间距 公式(4.12)Q=P75-P25 均差 公式(4.13) 标准差 公式(4.14)样本标准差 公式(4.15)递推计算

公式(4.16)直接计算 公式(4.17) 变异系数 公式(4.18)CV=S/X×100%, X>0 正态曲线 公式(5.1)正态曲线方程 (5.2)正态离差 (5.3)标准正态曲线 (5.4)正常值范围X±uαs 标准误 (6.1)理论标准误 (6.2)样本均数的标准误 (6.3)率的标准误

(6.4) t分布 (6.5) 总体均数的估计 (6.6) 95%可信区间X-t0.05,νSχ<μ (6.9) 99%可信区间P-2.58Sp<π t检验 公式(6.5)样本均数与总体均数比较 公式(7.1) 两样本均数比较的自由度ν=n1+n2-2 公式(7.2) 合并方差 公式(7.3) 两均数相差的标准误 公式(7.4) t检验 u检验

卫生统计学知识点(笔记)

第一章绪论 1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。可分为目标总体和研究总体。若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。需要谨慎的是,就研究总体所下的结论未必适用于目标总体。 3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。获取样本的过程称为抽样(sampling)。抽样研究的目的是用样本数据推断总体的特征。需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。 4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。 5.▲变异(variation)是指同质的个体之间存在的差异。 6.▲变量的类型 二分类变量 分类变量或名义变量 定性变量多分类变量 变量有序变量或等级变量 定量变量离散型变量 连续型变量 变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值 7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总

体均数μ,总体标准差σ。 8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。 统计学的任务就是依据样本统计量来推断总体参数。 9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。 10.▲误差:表示统计量与参数之间的差别或测量值与真值之间的差别。可分为系统误差和随机误差,其中系统误差呈现倾向性偏大或偏小现象,是可以避免的;而随机误差,是非人为偶然因素所致,不可避免,但可通过增大样本量等措施使其减小。 11.因果与联系:存在联系未必有因果关系,需排除虚假关联、间接关联。大多数观察性研究,单靠统计学分析只能考察变量之间的联系,难以证明因果关系。

卫生统计学试题库

《卫生统计学》考试题库 目录 第一章绪论 第二章定量资料的统计描述 第三章正态分布 第四章总体均数的估计和假设检验 第五章方差分析 第六章分类资料的统计描述 第七章二项分布与Poisson分布及其应用 第八章χ2检验 第九章秩和检验 第十章回归与相关 第十一章常用统计图表 第十二章实验设计 第十三章调查设计 第十四章医学人口统计与疾病统计常用指标 第十五章寿命表 第十六章随访资料的生存分析

附录:单项选择题参考答案

第一章绪论 一、名词解释 1. 参数(parameter) 2. 统计量(statistic) 3. 总体(population) 4. 样本(sample) 5. 同质(homogeneity) 6. 变异(variation) 7. 概率(probability) 8. 抽样误差(sampling error) 二、单选题 1.在实际工作中,同质是指: A.被研究指标的影响因素相同 B.研究对象的有关情况一样 C.被研究指标的主要影响因素相同 D.研究对象的个体差异很小 E.以上都对 2. 变异是指: A.各观察单位之间的差异 B.同质基础上,各观察单位之间的差异 C.各观察单位某测定值差异较大 D.各观察单位有关情况不同 E.以上都对3.统计中所说的总体是指: A.根据研究目的而确定的同质的个体之全部 B.根据地区划分的研究对象的全体 C.根据时间划分的研究对象的全体 D.随意想象的研究对象的全体 E.根据人群划分的研究对象的全体 4. 统计中所说的样本是指: A.从总体中随意抽取一部分 B.有意识地选择总体中的典型部分 C.依照研究者的要求选取有意义的一部分 D.从总体中随机抽取有代表性的一部分 E.以上都不是 5.按随机方法抽取的样本特点是: A.能消除系统误差 B.能消除随机测量误差 C.能消除抽样误差 D.能减少样本偏性 E.以上都对 6.统计学上的系统误差、测量误差、抽样误差在实际工作中: A.均不可避免 B.系统误差和测量误差不可避免 C.测量误差和抽样误差不可避免 D.系统误差和抽样误差不可避免 E.只有抽样误差不可避免 7.统计工作的基本步骤是: A.设计、调查、审核、整理资料 B.收集、审核、整理、分析资料 C.设计、搜集、整理、分析资料 D.调查、审核、整理、分析资料 E.以上都不对 8.统计工作的关键步骤是: A.调查或实验设计 B.整理分组 C.收集资料 D.审核资料 E.分析资料

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

山东大学2019考研:353卫生综合参考书目及真题笔记资料汇总

山东大学2019考研:353卫生综合参考书目及真题笔记资料汇总由于山东大学部分专业课官方没有公布参考书目由此给很多考生带来了很大的不便,对此精都考研网整理了山东大学本专业研究生初试用书及配套资料供大家参考 一、353卫生综合参考书目: ①《环境卫生学》 ②《流行病学》 ③《卫生统计学》 ④《营养与食品卫生学》 ⑤《职业卫生与职业医学》 二、配套精编复习资料 山东大学353卫生综合《复习全程通》精都考研组编 三、复习全程通内容简介 《复习全程通》由精都考研工作室依托多年为各大机构编写考研专业课资料以及学员辅导的经验,由本团队组织目标院校本专业的高分研究生共同合作编写而成,全书考点知识面覆盖全面,权威细致,编排结构科学合理,是专门为本届考研的考生量身定制的必备专业课资料。 通过本精编资料四大模块内容,结合考生每个阶段的复习,有助于考生深入了解目标院校以及专业考点重点,提高复习效率,拓展解题思路。 NO.1历年真题汇编 通过目标院校原版真题,了解命题老师的出题思路,且分析考点重点,快速了解目标院校出题风格及命题思路,提高复习效率,拓展解题思路 NO.2教辅一本通 本部分内容主要是由目标院校本专业研究生对应其初试参考书目整理汇编章节重点考点以及对应章节历年典型考题及答案解析,通过本书的配套复习,分析专业考点侧重,通过大量典型考题让充分掌握本门科目重点,确保考场应对自如。 NO.3冲刺模拟套卷 书在遵循专业课最新参考书目,结合历年考研真题规律,制定的模拟卷,并有详细的配套答案讲解,适用于考生在冲刺模拟阶段的专业课复习。 NO.4电子版赠送内容 本部分内容为购买全套资料的同学附赠的内容,主要是初试参考书目主编老师的教学讲义以及相关的扩充习题,此部分内容对于跨考的考生相对比较重要,通过讲义了解专业课基础复习侧重,达到专业知识点不缺不漏。 四、解析备考辅导班: 专业课一对一无忧全程班 专业课一对一标准全程班 山东大学在读研究生授课 以上内容是【精都考研网】整理发布,每天及时发布最新考研资讯、考研经验、考研真题。目前很多同学已加入2019山东大学考研总群640030269,抓紧时间加入了解你所不知道的考研信息。

卫生统计学复习笔记

卫生统计学复习笔记 一、概述 1、卫生统计学的概念(熟练掌握) 统计学是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。 卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。 由此看出:统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。这里强调了“过程”,但在实际工作中,许多人往往是忽略了设计、收集和归类(整理),到了分析数据时才想到统计学,此时难免发生“悔之晚矣”的憾事。作为统计学的应用者应充分认识到这一点。 卫生统计学的内容(了解): 1)健康统计:医学人口统计、疾病统计和生长发育统计等; 2)卫生服务统计:包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。 2、卫生统计学的工作步骤(熟练掌握) 统计学对统计工作的全过程起指导作用,任何统计工作和统计研究的全过程都可分为以下四个步骤: 1)、设计:在进行统计工作和研究工作之前必须有一个周密的设计。设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上,对将要进行的研究工作所做的全面设想。其内容包括:明确研究目的和研究假说,确定观察对象、观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用等。设计是整个研究工作中最关键的一环,也是指导以后工作的依据 2)、收集资料:遵循统计学原理采取必要措施得到准确可靠的原始资料。及时、准确、完整是收集统计资料的基本原则。卫生工作中的统计资料主要来自以下三个方面:①统计报表:是由国家统一设计,有关医疗卫生机构定期逐级上报,提供居民健康状况和医疗卫生机构工作的主要数据,是制定卫生工作计划与措施、检查与总结工作的依据。如法定传染病报表,职业病报表,医院工作报表等。②经常性工作记录:如卫生监测记录、健康检查记录等。③专题调查或实验。 3)、整理资料:收集来的资料在整理之前称为原始资料,原始资料通常是一堆杂乱无章的数据。整理资料的目的就是通过科学的分组和归纳,使原始资料系统化、条理化,便于进一步计算统计指标和分析。其过程是:首先对原始资料进行准确性审查(逻辑审查与技术审查)和完整性审查;再拟定整理表,按照“同质者合并,非同质者分开”的原则对资料进行质量分组,并在同质基础上根据数值大小进行数量分组;最后汇总归纳。 4)、分析资料:其目的是计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。统计分析包括统计描述和统计推断。前者是用统计指标与统计图(表)等方法对样本资料的数量特征及其分布规律进行

(完整版)卫生统计学知识点总结

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 指标频率型指标强度型指标相对比型指标 两个有关联的指标A和B之比概念近似反映某一时间出现概率单位时间内某现象的发 频率 计算 A/B 公式 无有可有、可无 有无 量纲 取值 【0,1】可大于1 无限制 范围 表示相对于B的一个单位,A有多少本质大样本时作为概率近似值频率强度,即概率强度的

卫生统计学 名词解释

1.变量:研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量 2.定量变量:是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位。例如:体重与身高 3.定性变量:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数 4.二分类变量:称为0-1变量。例如,性别(男、女)、疾病(有、无)和结局(生、死)等。二分类变量常用0和1来编码,0-1 变量常称为假变量(dummy variable)或哑变量,可以和真变量一样参与计算 5.等级资料:是先将观察单位按某种属性或类别的不同等级分成若干组,再清点各组观察单位个数所得到的资料 6.同质:在调查和实验研究中,除了实验因素外,影响被研究指标的非实验因素相同被称为同质 7.变异:同质事物个体间的差异 8.总体:根据研究目的确定的同质研究对象所有观察单位某变量值的集合。简言之,研究对象的全体。 9.样本:从总体中抽取的部分观察单位,某变量值的实测值构成样本。简言之,总体中有代表性的一部分。 10.参数(parameter):是统计模型的特征指标,是对总体而言,其大小是客观存在的,然而往往是未知的,如总体均数(mean)和总体方差(variance) 11.统计量(statistic):由观察资料计算出来的量,如计算观察样本中的个体得到的样本均数,样本方差。 12.因果关系(causality):在排除了人为联系、虚假联系后仍然存在的、无法用其他联系解释的两个变量之间的关系。但也需要时间顺序等标准进行因果判断 13.误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种:系统误差和随机误差(随机测量误差,抽样误差)。 14.系统误差:指数据搜集和测量过程中由于仪器不准确、标准试剂未经校正,操作人员掌握的标准不准等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。特点:具有累加性;有倾向性;可以消除 15.随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。特点:随测量次数增加而减小。 16.随机测量误差:在消除了系统误差的前提下,由于非人为的偶然因素,对于同一测量对象多次测定结果不完全一致。特点:没有倾向性;不可消除,但多次测量计算平均值可以减小随机测量误差。

卫生统计学重点笔记之欧阳家百创编

医师资格考试蓝宝书预防医学 欧阳家百(2021.03.07) 医学统计学方法 第一节基本概念和基本步骤(非常重要) 一、统计工作的基本步骤 设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。 实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。样本的指标为统计量。 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。 某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件, <0.05或0.01为小概率事件。 二、变量的分类

变量:观察单位的特征,分数值变量和分类变量。 第二节数值变量数据的统计描述(重要考点) 一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称,适用于正态或近似正态分布。 2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。 二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越小,观察值 的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变异系数计算公式为:CV=s/×100%,公式中s为样本标准差,为样本均数。 三、标准差的应用

相关主题
文本预览
相关文档 最新文档