当前位置:文档之家› 医学统计学课件:2统计描述

医学统计学课件:2统计描述

医学统计学课件:2统计描述
医学统计学课件:2统计描述

1、这150名正常成年男子红细胞数的平均水

平是多少,变异度有多大?

2、这150名正常成年男子红细胞数与当地成

年男子红细胞数总体相比是否有差别?

一、频数分布表

表4-3 某地150名正常成年男子红细胞数(10

3.98 5.39

4.54 4.74

5.13 4.43 4.81 4.98 3.79 5.49 4.66 5.26

4.90 4.90 4.17 4.28 4.63 4.94 4.33 4.84 4.75 4.01 4.49 4.57

5.16 5.69 4.84 5.03 5.32 4.54 4.68 4.60 4.39 4.80 4.97 4.80

4.85

5.21 4.45 4.62 5.05 4.13 5.07 4.40 5.08 4.73 5.10 4.73

4.42 4.81 4.98 3.89

5.46 4.53 4.74 4.10 4.90 4.91 4.27 4.29

4.66

5.23 5.31 4.86 4.67 4.43 4.57 5.00 5.16 5.69 4.83 5.04

4.46 4.61

5.00 4.36 4.75 4.96 5.04 5.37 4.95 4.70 4.83 4.42

4.13 4.78 4.86 4.78

5.23 4.78 5.20 4.80 4.55 4.82 4.98 3.94

4.54 4.74

5.10 4.43 4.58 4.99 4.31 4.64 4.66 5.26 5.28 4.83

4.15 4.35 4.93

5.17 5.61 4.87 5.04 3.98 4.48 4.57 4.77 4.11

4.95

5.00 5.36 5.06 4.68 4.63 4.40 5.30 4.97 5.29 4.85 5.88

4.49 4.62 4.53 4.10 4.53 4.70 4.80

5.23 5.67 4.67 4.67 5.40

5.29 4.77 5.38 5.15 4.64 5.19

表4-4 某地150名正常成年男子红细胞数(10计量资料的频数表:

等级资料的频数表:治疗结果二、计量资料频数表的应用:1)

2)

3)

4)

三、频数分布图:

数分布大体对称——对称分布(近似正态分布)。

图4-2 某地150名正常成年男子红细胞数

(1012/L)频数分布图

to the right)。

to the left)。

计数资料的频数分布图

等级资料的频数分布图

平均数(average ):用于说明一组观察值的平均水平或集中趋势。一、描述集中趋势的统计指标

1、算术均数,简称均数?直接法

例18.025.5X =?频数表法:也称为加权法

组段(2、?

?

?

)

3、中位数(

?

例4-6

5,8,20天,求其中位数。

解:

=5,本例中数据已经排好。

?

数所在组段组段(

表2 某地150名正常成年男子红细胞数(10注意:

) )

)

例4-9

A组:26 28 30 32 34

B组:24 27 30 33 36

?

面刻画一批数据的全部特征

?

间距、方差和标准差

二、描述离散趋势的统计指标:

1

)) ) ) ) 2

3、离均差:离均差平方和:(方差:

标准差:

样本标准差:)应用,适用于正态分布或近似正态分布资料,大小样本均可

4、变异系数()时,资料变异程度的比较器测量的精度和稳定性,例身高体重

)))

一、常用相对数?

)??

?比率

且分子必须是分母的一部分。没有量纲,且0

?强度相对数:

常称作

?结构相对数:

所占的比重,各组分所占比重之和必为

100%,常称作?例某医院1998年在某城区随机调查了8589例60岁及以上老人,体检发现高血压患者为2823例,则该地60岁及以上老人高血压患病率为:

2823

100%32.87%

8589

×=

表4-3 老年人白内障的年龄分布及患病率

?例1979年昌都5县14个农牧区40岁以上的1468人进行了老年性白内障普查,各年龄组的构成比和患病率见下表。

年龄组受检人数白内障例数构成比(%)患病率(%)

40~5606815.1812.14

50~44112928.7929.25

60~29613530.1345.61

70~1499721.6565.10

≥802219 4.2486.36

合计146844810030.52

?

二、应用相对数应注意的问题

一、统计表(一)、统计表的结构1.

2.

3.

4. 5.) 1. 2.

(二)、统计表的种类??

来进行分组,如

检测

指标

血压

心率

TTT

GPT

?

二、统计图

(一)、统计图的结构:?用点的位置、线段的升降、直条的长

短以及面积的大小等几何图形表达统

计指标的大小、对比关系以及变化趋

?统计图可以表达和统计表同样的内

容,且以更加直观、形象化的形式展

现出来,便于理解。但从数据的表达

准确度上说没有统计表的高

(二)、常用统计图形的绘制

2、圆图

用扇形面积表示全体中各部分的比重,适用于百分比(构成比)资料。

3、

4

年龄组/岁男女

表4-12 某地某年食管癌年龄性别发病率(1/10万)

5

?

?

在图4-10中将横轴取为算术尺度,

纵轴取为对数尺度得到

6、直方图

?

?

图4-2 某地150名正常成年男子红细胞数

(1012/L)频数分布图

7

受试者号

凝血酶浓

凝血时间

8、箱式图(?

?

(完整版)医学统计学第六版课后答案

第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(B ) A 条图 B 百分条图或圆图 C 线图 D 直方图 2、均数和标准差可全面描述D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5 岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95% 或99% 正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99% 的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是(A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为(D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A 和B 均不是 D. A 和B 均是 8、两样本均数比较用t 检验,其目的是检验(C ) A 两样本均数是否不同 B 两总体均数是否不同 C 两个总体均数是否相同 D 两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B 总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t 值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A 各总体率不同或不全相同 B 各总体率均不相同 C 各样本率均不相同 D 各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8 人。该资料宜选用的统计方法为(A ) A.四格表检验B. 四格表校正检验C t 检验D U 检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

医学统计学题库完整

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计

医学统计学绪论完整课件

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学绪论完整课件 医学统计学(( Medical Statistics))绪论(( Instruction )) 3 工作和生活中常见的统计学问题明天是否下雨?体育彩票能否中奖?( 概率论子女为什么象父母,其强度有多大?( 相关与回归归人口普查、疾病调查是如何进行的?( 调查设计,抽样如何判断药物的疗效?( 假设检验统计学是对令人困惑费解的数字问题做出设想的艺术。 4 统计是一种对客观现象数量方面进行的调查研究和分析; 是收集、整理、分析、推断、判断等认识活动的总称。 统计学(Statistics )的定义 A science dealing with the collection, analysis, interpretation, and presentation of masses of numerical data ( Webster International Dictionary ) The science and art of dealing with variation in data through collection, classification, and analysis in such a way as to obtain reliable results (A Dictionary of Epidemiology) 统计学:是关于数据收集、整理、表达、分析与推断的普遍原理和方法,是一门处理数据变异性的科学与艺术,其目的是求得可靠的结果。 统计学是工具学科,指导专业学科的学习和应用。 7 医学统计学是应用统计学基本原理 1 / 12

医学统计学各种资料比较_选择方法小结

医学统计学各种资料比较选择方法小结 一、两组或多组计量资料的比较 1.两组资料: 1)大样本资料或服从正态分布的小样本资料 (1)若方差齐性,则作成组t检验 (2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料: 1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。 2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。 二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料: (1)小样本时:用二项分布进行确切概率法检验; (2)大样本时:用U检验。

2)多分类资料:用Pearson c2检验(又称拟合优度检验)。 2. 四格表资料 1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验 3)n£40或存在理论数<1,则用Fisher’s 检验 3. 2×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量 (1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2 (2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验 4. R×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析

医学统计学重点图表总结

定量资料统计描述常用的统计指标及其适用场合 描述内容指标意义适用场合 平均水平均数个体的平均值对称分布 几何均数平均倍数取对数后对称分布 中位数位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料; ④分布不明 众数频数最多的观察值不拘分布形式,概略分析 调和均数基于倒数变换的平 均值 正偏峰分布资料 变异度全距观察值取值范围不拘分布形式,概略分析 标准差(方差)观察值平均离开均 数的程度 对称分布,特别是正态分布资料 四分位数间距居中半数观察值的 全距 ①非对称分布;②半定量资料;③末端开口资料; ④分布不明 变异系数标准差与均数的相 对比 ①不同量纲的变量间比较;②量纲相同但数量级相 差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 条图组间数量对比用直条高度表示数量大小 直方图定量资料的分布用直条的面积表示各组段的频数或频率 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 1

1 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97 .5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99 .5 P 1 P 99 1.标准差与标准误的区别与联系?

硕士医学统计学知识点总结汇总

第2章统计描述 1.对定量资料进行统计描述时,如何选择适宜的指标? 定量资料统计描述常用的统计指标及其适用场合描述内容指 标 意义适用场合 平均水平均 数 个体的平均值对称分布 几何均数平均倍数取对数后对称分布 中位数位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众 数 频数最多的观察值不拘分布形式,概略分析 调和均数基于倒数变换的平均值正偏峰分布资料 变异度全 距 观察值取值范围不拘分布形式,概略分析 标准 差 (方差) 观察值平均离开均数的 程度对称分布,特别是正态分布资料 四分位数 间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口 资料;④分布不明 变异系数标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 定性资料:阳性事件的概率,概率分布,强度和相对比。 2. 应用相对数时应注意哪些问题? 答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 3. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图形适用资料实施方法 条图组间数量对比用直条高度表示数量大小 直方图定量资料的分布用直条的面积表示各组段的频数或频率 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系 箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数

医学统计学相关公式汇总

医学统计学相关公式汇总 Chapter 基本概念 显著性检验(test of significance ):计算P 值 医学统计工作的内容: 1、实验设计:最关键最重要 2、收集资料:最基础 原始资料:实验数据 现场调查资料 医疗卫生工作记录 报表 报告卡 质量控制——精度和偏倚 3、整理资料 (1) 资料的逻辑检查(坏数) (2) 一致性检查 (3) 原始数据加工:频数分布表 4、分析资料:统计描述(表、图、离散趋势、集中趋势)和统计推断 统计描述类型的选择: 集中趋势 离散趋势 对称、正态 μ,x S SS ,, 对数正态 G S lgX 偏态及其他 M Q ,R 单位不同或均数差别大 CV 医学统计的资料类型:计量资料、计数资料、等级分组资料 医学统计学的对象:有变异的事物 总体和样本: 总体(population )的特性:同质性、大量性、差异性。

抽样的要求:代表性、随机性、可靠性、可比性。 样本的三性:代表性、随机性、可靠性。 可靠性(reliability ):实验的结果要具有可重复性。即由科研课题的样本得出的结论所推测总体的结论有较大的可信度。 两样本间具有:可比性。 误差的类别: 1、系统误差(system error ):在资料的收集过程中,由于仪器初始状态没有调零、标准试剂未经矫正、标准指定偏高或偏低等原因,造成的观察结果的倾向性的偏大或偏小。必须克服。 2、随机测量误差(random measurement error ):在避免系统误差的情况下,由于各种偶然因素的影响造成对同一对象多次测量值的不一致。 3、抽样误差(sampling error ):由于抽样造成的的样本统计量与总体参数之间的差别。不可避免。样本含量越大,抽样误差越小。如均数的抽样误差:|-X | 。 概率(probability ):P (A ) 小概率事件:P ≤0.05(有统计学意义)或P ≥0.01(有高度统计学意义)。 Chapter 集中趋势的统计描述 手工整理资料频数表(frequency table )的步骤: 1、求极差(全距) 2、确定组数、组距 参考组距=全距 / 组数 3、确定组段 4、手工编制划记表 直方图(histogram ): 高度:各组的频数 纵轴 宽度:组距 横轴表示组限 均数(average ): 适用:对称分布或偏度不大的资料,尤其适合正态分布。 抽样 总体 样本 推断

医学统计学定性资料统计描述思考与练习带答案

第五章定性资料的统计描述 【思考与练习】 一、思考题 1.应用相对数时需要注意哪些问题? 2. 为什么不能以构成比代替率? 3. 标准化率计算的直接法和间接法的应用有何区别? 4. 常用动态数列分析指标有哪几种?各有何用途? 5. 率的标准化需要注意哪些问题? 二、案例辨析题 某医生对98例女性生殖器溃疡患者的血清进行检测,发现杜克雷氏链杆菌、梅毒螺旋体和人类单纯疱疹病毒2型病原体感染患者分别是30、51、17例,于是该医生得出结论:女性生殖器溃疡患者3种病原体的感染率分别为30.6%(30/98)、52.0%(51/98)和17.4%(17/98)。该结论是否正确?为什么? 三、最佳选择题 1. 某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为B A. 率 B. 构成比 C. 发病率 D. 相对比 E. 时点患病率 2. 标准化死亡比SMR是指A A. 实际死亡数/预期死亡数 B. 预期死亡数/实际死亡数 C. 实际发病数/预期发病数 D. 预期发病数/实际发病数 E. 预期发病数/预期死亡数 3. 某地人口数:男性13,697,600人,女性13,194,142人;五种心血管疾病的死

亡人数:男性16774人,女性23334人;其中肺心病死亡人数:男性13952人,女性19369人。可计算出这样一些相对数: 11395283.18%16774 p ==, 21395219369 83.08%1677423334p +==+, 313952 101.86/1013697600 p = =万, 416774122.46/1013697600p = =万,523334 176.85/1013194142 p = =万, 645p p p =+ 71395219369 123.91/101369760013194142 p += =+万 81677423334 149.15/101369760013194142 p += =+万 该地男性居民五种心血管疾病的死亡率为D A. 1p B. 2p C. 3p D. 4p E. 5p 4. 根据第3题资料,该地居民五种心血管病的总死亡率为E A. 1p B. 2p C. 5p D. 6p E. 8p 5. 根据第3题资料,该地男、女性居民肺心病的合计死亡率为D A. 2p B. 5p

医学统计学选择题大全

医学统计学常见考题 1. 要反映某市连续5年甲肝发病率的变化情况,宜选用C A.直条图B.直方图C.线图D.百分直条图 2. 下列哪种统计图纵坐标必须从0开始,D A. 普通线图 B.散点图 C.百分分直条图 D.直条图 3. 关于统计表的列表要求,下列哪项是错误的?A A.横标目是研究对象,列在表的右侧;纵标目是分析指标,列在表的左侧 B.线条主要有顶线、底线及纵标目下面的横线,不宜有斜线和竖线 C.数字右对齐,同一指标小数位数一致,表内不宜有空格 D.备注用“*”标出,写在表的下面 4. 医学统计工作的基本步骤是C A.统计资料收集、整理资料、统计描述、统计推断 B.调查、搜集资料、整理资料、分折资料 C.设计、搜集资料、整理资料、分析资料 D.设计、统计描述、统计推断、统计图表 5. 统计分析的主要内容有B A. 描述性统计和统计学检验 B.统计描述和统计推断 C.统计图表和统计报告 D.描述性统计和分析性统计 6 制作统计图时要求D A.纵横两轴应有标目。一般不注明单位 B. 纵轴尺度必须从0开始 C.标题应注明图的主要内容,一般应写在图的上方 D. 在制作直条图和线图时,纵横两轴长度的比例一般取5:7 7. 痊愈、显效、好转、无效属于C A. 计数资料 B. 计量资料 C. 等级资料 D.以上均不是 8. 均数和标准差的关系是D A.愈大,s愈大B.愈大,s愈小 C.s愈大,对各变量值的代表性愈好D.s愈小,对各变量值的代表性愈好 9. 对于均数为,标准差为的正态分布,95%的变量值分布范围为B A. - ~ + B. -1.96~ +1.96 C. -2.58 ~ +2.58 D. 0 ~ +1.96 10. 从一个数值变量资料的总体中抽样,产生抽样误差的原因是A A.总体中的个体值存在差别B.样本中的个体值存在差别 C.总体均数不等于0 D.样本均数不等于0 11 从偏态总体抽样,当n足够大时(比如n > 60),样本均数的分布C 。 A. 仍为偏态分布 B. 近似对称分布 C. 近似正态分布 D. 近似对数正态分布 12 某市250名8岁男孩体重有95%的人在18~30kg范围内,由此可推知此250名男孩体重的标准差大约为C A.2.0kg B.2.3kg C.3.1kg D.6.0kg 13. 单因素方差分析中,造成各组均数不等的原因是D

医学统计学第七版课后解析

医学统计学第七版课后解析 1、同质:是指观察单位或观察指标受共同因素制约的部分 2、观察单位:亦称个体,是统计研究中最基本的单位 3、变异:在同质的基础上个体间的差距 4、总体:根据研究目的所确定的同质观察单位的全体,既是同质的所有观察单位某项观察值的集合 5、有限总体:总体若受一定的时间和空间控制,其观察单位数是有限的,称为有限总体 无限总体:理论上其观察单位数是无法穷尽的 6、样本:是指从总体中随机抽取部分观察单位其某项指标实测值的集合 7、抽样:从总体中抽取部分个体的过程称为抽样 8、抽样必须遵循随机化原则,即总体中每一个体都有同等的机会被

抽取到 9、抽样研究的方法,利用样本的信息推论总体的特征来达到研究目的 10、参数:描述总体特征的量 11、统计量:根据样本个体值计算得到的描述样本特征的量 12、总体参数是常数,而样本统计量可随样本不同而不同 13、随机误差:指一类不恒定、随机变化的误差,有多种尚无法控制的因素所引起 14、抽样误差:指抽样引起的样本统计量与总体参数之间的差异 15、系统误差:在实际观测过程中,由于仪器未校正、观测者感官的某种倾向、研究者掌握的标准偏高或偏低等原因,使观察值不是随机分散在真值两侧,而是具有方向性、系统性或周期性的偏离真值,这类误差称为系统误差

16、过失误差:指各种失误所导致的误差 17、随机事件:在一定条件下某一现象可能发生也可能不发生的事件 18、概率:反映某一随机事件发生可能性大小的量,用符号P表示 19、小概率事件:统计学上一般把P≤0.05的事件称为小概率事件,表示某事件发生的可能性很小 20、变量:观察单位的某个特征 21、变量值:变量的观察结果或测定值 22、按变量值是定性的还是定量的,可将变量分为数值变量和分类变量 23、数值变量又称定量变量,其变量值是用定量方法测得的,所的资料是计量资料 24、分类变量又称定性变量,其变量值是用定性方法测得的

医学统计学知识点讲课讲稿

医学统计学知识点

第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。

(完整word版)医学统计学公式整理

集中趋势的描述 算术均数: 频数表资料(X0为各组段组中值) n fX f fX x O O ∑∑∑== 几何均数: n n X X X G ...21= 或 ) log ( log 1n X G ∑-= 频数表资料: ? ?????=????????=∑∑∑--n X f f X f G log lg log log 11 中位数:(1)* 2 1 +=n X M (2) ) (21* 12*2++= n n X X M 百分位数 ?? ? ??-?+ =L X X f n X f i L P 100其中:L 为欲求的百分位 数所在组段的下限 , i 为该组段的组距 , n 为总频数 , X f 为 该组段的的频数 , L f 为该组段之前的累计频数 方差: 总体方差为:式(1); 样本方差为 式(2) (1) N X 2 2 )(μσ-∑= (2) 1)(2 2--∑= n X X S 标准差: 1 )(2 --∑= n X X S 或 1/)(22-∑-∑= n n X X S 频数表资料计算标准差的公式为 1/)(22-∑∑∑-∑= f f fx fx S 变异系数:当两组资料单位不同或均数相差较大时,对变异 大小进行比较,应计算变异系数 % 100?=X S CV 常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化 N p N p i i ∑= ' ∑=i i p N N p )( ' 2.间接法标准化 预期人数实际人数= SMR ∑=i i P n r SMR S M R P P ?=' 正态分布:密度函数: )2/()(2221)(σμπ σ--= X e X f 分布函数: 小于X 值的概率,即该点正态曲线下左侧面积 )()(x X P x F <= 特征:(1)关于x=μ对称。(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。(3)曲线下面积为1。(4)μ决定曲线在横轴上的位置,σ决定曲线的形状 。(5)曲线下面积分布有一定规律 标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换 σ μ-= X u ,u 服从总体均数为0、总体标准 差为1的正态分布。 u 值左侧标准正态曲线下面积为标准正态分布函数,记作 )(u Φ 医学参考值的确定方法:(1)百分位法:双侧(P 25,P 975),单侧P 95以下或P 5以上,该法适用于任何分布型的资料。(2)正态分布法:若X 服从正态分布,双侧医学参考值范围为 S X 96.1± 样本均数标准误的估计值为 X s = t 分布的概念:小样本总体标准差未知时,服从自由度为n-1 的t 分布 X X X t s μ-= 总体均数可信区间的计算: 大样本或总体标准差已知:式(1); 小样本:式(2) (1) n S X ?±96.1 (2)n S n t t ?±-)1(,05.0 单样本t 检验:检验统计量:式(1);样本例数估计:式(2) (1) n S X t /0μ-= 自由度为 n-1;(2)2 2/] )([δσβαZ Z N += 配对样本t 检验: 检验统计量: n S d t d /0-= 样本量计算同前 两样本t 检验:检验统计量: ) 11(2 12 1n n S X X t c +-= (错) 2 )()(2)1()1(21222211212222112-+-+-= -+-+-=∑∑n n X X X X n n S n S n S c 随机分组方法: 样本例数估计) (])([ 1 21122/--++=Q Q Z Z N δ σ βα 方差不齐的近似t 检验 检验统计量:式(1) ;校正自由度为:式(2) (1) 2 2 2 1212 1' n S n S X X t +-= (2) 11)(24142222 1 21-+-+= n s n s s s x x x x ν 方差齐性检验:H 0:两总体方差齐,H 1:两总体方差不齐,α=0.1 检验统计量:(较小)(较大)2 2 2 1 S S F =分子自由度为n1-1,分母自由度为n2-1 方差分析的基本思想: 1、总变异:总离均差平方和: 2() 1 T ij i j SS SS X X N νν=-==-∑∑总总= ∑∑-=n X X /)(2 2 2. 组间变异:组间变异反映了处理因素的影响(如处理确实有作用),同时也包括了随机误差(含个体差异和测量误差)。 21() 1 B i i i SS SS n X X k νν-==-∑组间组间== = C n X i i ij -∑ ∑2 )( 3. 组内变异:组内变异仅反映随机误差(含个体差异和测量误差),故又称误差变异。 222()(1) W E ij i i i i j i SS SS SS X X n S N k νν===-=-==-∑∑∑ 组内组内 2()(1) W E ij i i i i j i SS SS SS X X n S N k νν===-=-==-∑∑∑组内组内 1(1)()N k N k ννν=-=-+-=+总组间组内 组间均方与组内均方比值一般地服从分子自由度为ν1,分母 自由度为ν2的F 分布 12 1 MS F k N k MS νννν= ==-==-组间 组间组内组内 , 多个样本间的多重比较 Dunnett 检验:用于各实验组与对照组比 i X X i S X X t --= )(误差i x x n n MS S i 11+= - 查dunnett 界值表,确定P ,自由度等于方差分析中ν误差 SNK-q 检验:用于各组间全面的两两比较 Q= )11(2/ )(B A B A X X B A n n MS X X S X X B A +-=--误差 查q 界值表确定相应的概率P ,自由度等于方差分析中ν 误差,表中a 为按均值大小排序,两对比组所包含的组数。 二项分布的概率函数P (X ): X n X X n C X P --=)1()(ππ; )! (!!X n X n C X n -= 二项分布的均数和标准差 :进行n 次独立重复试验,出现X 次阳性结果 X 的总体均数为πμn = 总体方差为)1(2ππσ-=n 总体标准差为)1(ππσ -=n 如果将阳性结果用频率表示n X p = 率的总体均数 π μ=p 标准差 n p ) 1(ππσ-= n p p n p p S p )1(1 ) 1(-≈--= 又称率的标准误它反映率的抽样误差的大小。 单侧累积概率计算:出现阳性的次数至多为k 次的概率为 ∑∑ ==---==≤k X k X X n X X n X n X P k X P 0 0)1()! (!! )()(ππ 出现阳性的次数至少为k 次的概率 ∑∑ ==---==≥n k X n k X X n X X n X n X P k X P )1()! (!! )()(ππ 率的可信区间的估计 正态近似法:当)1(,p n np -均大于等于5时 n p p p n p p P )1(96.1,)1(96.1-+-? - 样本率与总体率的比较: 检验假设H 0:π=π0,H 1:π≠π0 1 . 满足正态近似时,计算检验统计量 ) 1(000 πππ--= n n X Z 或 n p Z ) 1(000 πππ--= 2. 不满足正态近似时用直接概率计算法 两样本率的比较:H0:π1=π2,H1:π1≠π2, 检验统计量: ) 1 1)(1(| |2 121n n p p p p Z c c +--= 2 121n n X X p c ++= Poisson 分布的概率函数为 ! )(X e X P X λλ -= POISSON 分布的应用: 单侧累计概率计算:稀有事件发生次数至多为k 次的概率

医学统计学试题及答案

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(B) A 条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述D资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评 价某市一名 5 岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A用该市五岁男孩的身高的 95%或 99%正常值范围来评价 B用身高差别的假设检验来评价 C用身高均数的 95%或 99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用(A) A变异系数B方差C标准差D四分位间距 5、产生均数有抽样误差的根本原因是(A) A. 个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的 10 倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为(D) A. 用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A 和 B均不是 D. A和 B均是 8、两样本均数比较用 t检验,其目的是检验( C ) A 两样本均数是否不同B两总体均数是否不同 C 两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1 和 n2,在进行成组设计资料的 t检验时,自由度是( D) (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映( A) A 抽样误差的大小B总体参数的波动大小 C 重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料, 既作直线回归分析 , 又作直线相关分析。令对相关系数检验的 t 值为 tr ,对回归系数检验的 t 值为 tb ,二者之间具有什么关系?( C) A tr>tb B tr

相关主题
文本预览
相关文档 最新文档