医学统计学(期末总复习)教程文件
- 格式:ppt
- 大小:3.16 MB
- 文档页数:101
医学统计学第一章绪论第一节医学统计学的定义和内容1.医学统计学的主要内容 :统计推断、统计描述第二节统计工作的基本步骤1.医学统计工作可分为四个步骤:统计设计搜集资料整理资料分析资料第三节统计资料的类型医学统计资料按研究指标的性质一般分为:定量资料、定性资料、等级资料一、定量资料(计量资料)定量资料(quantitative data)是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量资料。
如身高(㎝)、体重(㎏)、脉搏(次/分)、血压(kPa,mmHg)等为数值变量,其组成的资料为定量资料。
二、定性资料(计数资料)定性资料(qualitative data)是将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料。
亦称无序分类资料。
如:男-女分组;中医的虚、实,阴、阳等分组;按生存-死亡分组;A、B、O、AB分组。
三、等级资料等级资料(ranked data)是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。
亦称有序分类资料。
如治疗结果分为治愈、显效、好转、无效四个等级。
:疾病的严重程度可以分为,轻、中、重;中医辨证中舌象的颜色有,淡、红、暗、紫。
♦根据需要,各类变量可以互相转化。
♦若按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。
有时亦可将定性资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用0、1、2…等表示,则可按定量资料处理。
第四节统计学中的几个基本概念一、同质与变异同质(homogeneity)是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。
如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。
变异(variation)由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。
如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。
医学统计学复习大纲(一)绪论1)总体与样本总体:根据研究目的确定的同质研究对象的全体。
分为有限总体与无限总体。
样本:从总体中随机抽取的部分观察单位。
2)参数与统计量参数:总体的统计指标,用希腊字母表示。
如总体均数、标准差,分别记为μ、σ。
固定的常数。
统计量:样本的统计指标,用拉丁字母表示。
如样本均数、标准差,为X(拔)、S。
在参数附近波动的随机变量。
3)抽样误差误差:实际观察值与客观真实值之差a.系统误差在实际观测过程中,由研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。
特点:观察值有方向性、周期性。
可以通过严格的实验设计和技术措施消除b.非系统误差由研究者的偶然失误而造成。
c.随机误差排除上述误差后尚存的误差,受多种无法控制的因素的影响。
特点:大小和方向不固定。
随机测量误差——提高操作者熟练程度可以减少这种误差。
随机抽样误差(由抽样造成的样本统计量和总体参数间的差异。
)——不可避免,但有一定的分布规律,可估计。
4)四种随机抽样方法a.单纯随机抽样——将观察单位逐一编号,然后用随机数字表、抽签或电脑等方法随机抽取部分观察单位组成样本。
为最基本的抽样方法。
b.系统抽样——按一定顺序机械地每隔若干个观察单位抽取一个观察单位以组成样本。
又称间隔抽样、机械抽样、等距抽样。
c.整群抽样——从总体中随机抽取若干个“群体”以组成样本。
这个群体可以是班级、街道社区等。
d.分层抽样——先按影响观察值变异较大的某种特征,将总体分为若干类型或组别(统计上叫“层”),再从每一层内随机抽取一定数量的观察单位,以组成样本。
也即分类抽样。
误差大小排序:整群抽样>单纯随机抽样>系统抽样>分层抽样5)P ≤ 0.05(5%)或P ≤ 0.01(1%)称为:小概率事件,即某事件发生的可能性很小。
6)变量的分类a.数值变量——其变量值是定量的,表现为数值的大小,一般有度量衡单位。
——计量(定量)资料b.分类变量——其变量值是定性的,表现为互不相容的类别或属性。
第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。
统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。
二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。
变异是同质基础上的观察单位(亦称为个体)之间的差异。
(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。
样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。
(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。
变量值:变量的测得值。
如身高150cm,体重50Kg等。
(四)参数与统计量参数是指总体特征的统计指标。
如某地健康成年男性的平均血红蛋白值。
统计量是指样本特征的统计指标。
如从某地健康成年男性中抽取一部分人的平均血红蛋白值。
(五)误差误差泛指测量值与真实值之差。
根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。
1.系统误差:测量结果有倾向性。
查明原因,可以避免。
特点:①测量结果有倾向性。
如仪器、试剂、判定标准等。
②查明原因,可以避免。
2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。
特点:①随机误差没有大小和方向。
②不可避免。
3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。
特点:变异是绝对的,抽样误差不可避免。
原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。
(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。
随机事件的概率在0~1之间,即0≤P≤1。
小概率事件:P≤0.05或P≤0.01的事件。
《卫生统计学》期末复习指导一、期末考试有关问题的说明(一)出题的指导思想全面考核学生对本课程的基本概念、基木方法、基木技能的掌握情况,考核学生运用所学的知识和方法综合分析与解决实际问题的能力。
出题难度适中但覆盖面较广,基木知识占85%左右。
(二)题目类型及答题要求名词解释:15分。
要求按统计术语准确叙述概念。
是非题:10分。
要求对题目的叙述判断正确与否,不说明理由。
填空题:25分。
要求按划线的根数准确填写内容,不得似是而非。
选择题:2()分。
要求选择无误,每题只选择一个最佳答案。
简答题:10-15分。
根据问题的不同提问方式回答问题。
一种是直接根据问题进行叙述;另一种是根据问题说明正确与否,若否,需说明错误所在及正确的解决方法。
注意答出要点及答题的逻辑性。
问答题:15・20分。
包括对资料的计算和进行分析。
计算要求写出完整的步骤(包括计算公式),对计算所得结果做出和应的分析结论。
二、期末复习范围和重点第一章绪论一、重点复习的内容名词:总体、样本、数值变量资料、分类变量资料、变异、抽样误差、概率问题:1. 正确识别统计资料的类型。
2. 统计工作的步骤。
3. 抽样研究的原因及目的,产生抽样误差的原因。
二、一般复习的内容名词:变量、抽样硏究、同质、频率、小概率事件问题:1. 学习卫生统计学的童义。
2. 卫生统计学包括的基本内容。
3. 卫生统计工作各个步骤的基本内容和关系。
三、习题(-)判断题1. 统计工作的步骤中,设计是最关键的一步,搜集资料是基础。
2. 抽样研究的目的是为了描述样本的分布特征。
3. 某医师用国产异搏定治疗心率失常的临床疗效观察,共治疗8例病人,其中4例冇效,故冇效率为50% o(二)选择题1. 对某地200名16岁中学生口腔检查,发现54人患有踊齿,该资料属于。
A.数值变量资料B.分类变量资料C.分类变量资料频数表D.数值变量资料频数表2. 欲研究某药治疗高血压病的疗效,临床观察了80名高血压病人的血压值,其研究的总体是OA.这80名高血压病患者B.所冇高血压病患者C.所有高血压病患者的血压值D.用该药治疗的所有高血压病患者的血压值(三)填空题1. 统计工作的基本步骤包括___________ 、_____________ 、____________ 、___________ 。
医学统计复习资料一、名词解释[1].总体:根据研究目得确定得同质观察单位得全体。
就是同质所有观察单位得某种变量值得集合。
总体可分为有限总体与无限总体。
总体中得所有单位都能够标识者为有限总体,反之为无限总体。
[2].样本:从总体中随机抽取部分观察单位,其实测值得集合。
[3].计量资料:又称定量资料或数值变量资料。
为观测每个观察单位得某项指标得大小,而获得得资料。
其变量值就是定量得,表现为数值大小,一般有度量衡单位。
根据其观测值取值就是否连续,又可分为连续型或离散型两类。
[4].计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,就是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到得资料。
其变量值就是定性得,表现为互不相容得性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
[5].等级资料:又称半定量资料或有序分类变量资料,就是将观察单位按某种属性得不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到得资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
[6].随机误差(偶然误差):就是一类不恒定得、随机变化得误差,由多种尚无法控制得因素引起,观察值不按方向性与系统性变化,在大量重复测量中,它可呈现或大或小,或正或负得规律性变化。
[7].概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。
0﹤P(A)﹤1。
频率:在相同得条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现得频率(freqency)。
当试验重复很多次时P(A)= m/n。
[8].平均数:描述一组变量值得集中位置或水平。
常用得平均数有算术平均数、几何平均数与中位数。
[9].算术均数(arithmetic mean)描述一组数据在数量上得平均水平。
医学统计学考试复习资料一、统计学(statistics) ---是搜集资料、整理资料、分析资料,并且据此作出决策的一门学科。
医学统计学(medical statistics) --- 是以医学理论为指导,运用数理统计学的原理和方法研究医学资料的搜集、整理、分析,并且作出决策。
从而掌握事物内在客观规律的一门学科。
二、医学统计工作可分为四个步骤:1、统计设计(第一步也是关键一步);2、搜集资料(资料来源:统计报表,医疗卫生工作记录,专题调查或实验研究);3、整理资料(审核,分组,汇总);4、分析资料(统计描述,统计推断)。
三、频数分布图的步骤,用途:步骤:1、计算全距;2、确定组距;3、划分组段;4、统计频数;5、频率与累计频率。
用途:①反映频数分布的类型。
②描述频数分布的特征。
③便于发现极端值:如极大值、或极小值。
④便于进一步进行统计分析。
四、集中趋势与离散趋势的概念、特点及应用条件:集中趋势:反映一组数据的平均水平的指标。
(1)算术均数:应用条件:①正态分布的数据;②对称分布的数据。
(2)几何均数:适用条件:对于变量值呈倍数关系或呈对数正态分布。
(3)中位数:应用条件:①偏态分布②分布不明③有极端值④有开口的资料。
特点:不受极端值影响。
(4)百分位数:应用条件:①描述一组资料在某百分位置上的水平;②用于确定正常值范围;③计算四分位数间距。
(5)众数:一组观察值中出现次数最多的那个数值,可以没有也可以不止一个。
离散趋势:反映一组数据离散或分散的水平的指标。
(1)极差:全距=最大值-最小值。
优点:计算简单方便,应用广范,容易理解。
缺点:只反映两端数据最大最小值的差别,易受极端值的影响,不能反映组内其他变量离散情况。
(2)四分位数间距:Q=P75-P25。
优点:不受极端值影响,比极差R 稳定。
缺点:计算繁琐、不易理解、只反映中间50%的数据的两端的差值(3)方差的特点:①充分反映了每一个数据与平均数的差别;② S2指标很稳定;③S2应用广泛;④S2计算比较麻烦;⑤S2单位是原单位的平方,在实际应用时不太方便。
医学统计学复习资料1、卫生统计工作的步骤为统计研究设计、搜集资料、整理资料、分析资料。
2、反应一组数据的平均离散水平是方差。
3、适合任意分布资料,不依赖于总体分布形式的检验方法是Levene检验。
4、临床疗效属于等级资料。
5、有7名高血压患者的收缩压(mmHg)分别是135、130、142、147、150、139、180,计算中位数142。
6、正态分布曲线下横轴上,从μ-1.96σ到μ+1.96σ的面积为95%。
7、SNK-q检验适用于多个样本均数间任意两组的比较方法。
8、比较身高和体重两组数据变异度大小宜采用方差。
9、均数是表示变量值水平的指标是平均。
10、构成比用来反映某事物内部各部分占全部的比重。
11、在配对t检验的双侧检验一般可表示为μd=0。
12、某医院的资料计算各种疾病所占的比例,该指标为构成比。
13、四格表中当a=20,b=60,c=15,d=5时,最小的理论频数等于T2114、比较某地10年间结核与白喉两病死亡率的下降速度,宜绘制半对数线图。
15、直线回归系数的假设检验,其自由度n-1 。
16、就收入而言,高收入所占比例很少,中低收入比例偏高,属于右偏态分布。
17、关于个体变异说法不正确的是增加样本含量,可以减小个体变异。
18、比较身高和体重两组数据变异度大小宜采用变异系数。
19、从一个数值变量资料的总体中抽样,产生抽样误差的原因是总体中个体值存在差别。
20、均数与标准差计算的数值均数可以是负数,标准差不可以。
21、医学统计学研究的对象是有变异的医学事件。
22、随机测量误差指的是由不可预知的偶然因素引起的误差。
23、系统误差指的足由某些固定的因素引起的误差。
24、抽样误差指的是样本统计量与总体参数间的误差。
25、收集数据不可避免的误差是随机误差。
26、统计学中所谓的总体通常指的是同质观察单位的全体。
27、统计学中所谓的样本通常指的是总体中有代表性的部分观察单位。
28、医学研究中抽样误差的主要来源是生物个体的变异。