预防医学之分类变量的统计推断
- 格式:ppt
- 大小:1.73 MB
- 文档页数:20
《预防医学》(统计学部分)复习第十四章医学统计学概述一、几个基本概念1. 总体与样本、2.抽样误差3. 概率和小概率事件、4.参数和统计量二、统计资料类型1. 计量资料、2. 计数资料、3. 等级资料三、统计工作步骤:设计(关键的步骤)、搜集资料(统计分析的前提)、整理资料、分析资料。
第十五章数值变量的统计分析一、频数表的用途、频数分布特征、频数分布类型;频数分布特征:集中趋势特征、离散趋势特征。
频数分布类型:对称分布、偏态分布(正偏态、负偏态)二、常用平均数指标及其使用的资料;算数均数、几何均数、中位数三、变异指标及其应用;全距、四分位数间距、方差、标准差、变异系数四、集中趋势指标的选择判断步骤:资料是 抗体滴度 G 否 是偏态、开口 M否X五、正态分布1、正态分布的概念2. 正态分布的特征3. 正态曲线下分布面积的规律正态分布曲线下三个特殊区间面积分布的情况,对应的界值。
4.标准化变换及标准正态分布σμ-=X u六、医学参考值范围医学参考值范围的定义,制定医学常考值范围的方法。
正态分布法、百分位数法(应用的资料)七、抽样误差1. 抽样误差的概念2. 抽样误差的特点:⑴客观存在,可控制但不能消除;⑵它是反映抽样误差大小的指标:用Sx来说明均数的抽样误差大小;用Sp 来说明率的抽样误差大小;⑶均数抽样误差的大小与标准差成正比,与√n成反比;⑷减少抽样误差最切实可行的办法为:增加样本含量。
3. 总体均数的估计方法⑴点(值)估计:⑵区间估计:①95%可信区间:X±1.96Sx②99%可信区间:X±2.58Sx附:①正常参考值范围估计:①95%正常值范围:X±1.96S②99%正常值范围:X±2.58S②可信区间与正常值范围的区别4. u变换与t变换:X-μ X-μu变换: u=──── u=────σσxt变换: X-μt=────Sx八、假设检验:1、假设检验的原理(为什么进行建设检验?)2、假设检验的一般步骤⑴建立假设①H0:无效假设;H1:备择假设②单双侧检验:根据专业知识来定。
分类变量资料的统计描述 相对比较简单,一定要理解掌握概念相对数常用指标及其意义相对数是两个有关联的数值之比。
常用的指标有率、构成比和相对比A.A.表示某病发生严重程度表示某病发生严重程度表示某病发生严重程度B.B.B.反映两个指标的相对关系反映两个指标的相对关系C.C.反映某病在各疾病中所占的位次反映某病在各疾病中所占的位次D.D.反映同种病不同时间动态变化情况反映同种病不同时间动态变化情况E.E.反映同种病不同地区的严重情况反映同种病不同地区的严重情况(1)发病率)发病率 A A A ((2)构成比)构成比C (3)相对比)相对比 BB分类资料的统计推断考点总结1、率的抽样误差用抽样方法进行研究时,必然存在抽样误差。
率的抽样误差大小可用率的标准误来表示。
2、X2检验可用于两个及两个以上率或构成比的比较;两分类变量相关关系分析。
其数据构成,一定是相互对立的两组数据,四格表资料自由度v永远=1。
3、直线回归和相关相关分析是相关分析是研究事物或现象之间有无关系、关系的 方向和密切程度。
方向和密切程度。
如血压和血糖的之间的线性关系。
4、Logistic Logistic回归分析多变量统计方法中的重要内容,回归分析多变量统计方法中的重要内容, 它是研究它是研究变量变量Y Y 和多个自变量和多个自变量XX 的关系。
将原本非线性的 关系转化为线性关系。
关系转化为线性关系。
Logistic Logistic回归适用条件:校正混杂因素、帅选危险因素、回归适用条件:校正混杂因素、帅选危险因素、 预测与判别。
预测与判别。
5、生存分析:将终点事件出现的与否和到达终点所经历的 时间结合起来分析的一种统计学分析方法。
时间结合起来分析的一种统计学分析方法。
6、统计表和统计图何为统计图?统计图是用点、线、面或立体图形将事物的数量大小、分布情况、发展变化趋势等特征表达出来。
医学上常见的统计图有线图、直方图、直条图、圆形图、散点图、统计地图等。
预防医学彩色笔记【分章节】第一章绪论一、预防医学的概述1.以环境-人群-健康为模式,以个体和确定的群体为主要对象。
2.三级预防策略:第一级预防:疾病的因子---病因预防、根本性预防第二级预防:三早---早发现,早诊断,早治疗第三级预防:已患病者,促康复3、任何疾病都应强调第一级预防。
第二章医学统计学方法一、基本概念和基本步骤(一)统计学中的几个基本概念1.同质:除实验因素外,影响被研究指标的非实验因素相同。
变异:同质基础上被研究个体之间的差异。
总体:同质的个体所构成的全体。
样体:从总体中抽取部分个体所组成。
误差:观测值和真实值之间的差别。
主要有①系统误差:仪器或标准不符等造成,可影响原始资料准确性,必须克服。
②随机测量误差:各种偶然因素造成同一对象多次结果不一致,应采取措施尽量控制在一定范围。
③抽样误差:总体抽样得到某变量值的统计量和总体参数之间的差别。
概率:描述随机事件(如发病)发生可能性大小的度量,常用P表示。
P值0-1,P≤0.05或P<0.01---小概率事件。
P≤0.05为事物差别有统计学意义;P<0.01为事物差别有高度统计学意义。
变量:观察对象的特征或指标;测量的结果为变量值。
(二)统计工作的基本步骤:设计--基础、最关键;收集、整理、分析资料。
二、数值变量数据的统计描述频数表:组数通常选择8-15之间;组距=(最大值-最小值)/组数;必须包含全部数据,一个数据只能归属某一组,实际组段在每组中只包含下限。
(一)集中趋势指标1.算术均数:μ---总体均数。
样本均数--χ,正态或近似正态分布。
2.几何均数:G表示。
同一组观察值的几何均数总是小于它的算数均数。
3.中位数:M;奇数---中间;偶数---中间两个数的平均值。
4.百分位数:P x;从小到大分成100等分,分割界限上的数值就是百分位数。
(二)离散趋势指标离散二距方标差,正态标准差最佳,偏态四分数最佳1.极差/全距:R---最大值和最小值之差。
预防医学名词解释总结一、统计学部分1.抽样误差(sampling error)(11):由于个体存在差异,因此通过样本推论总体时会存在一定的误差,如样本均数往往不等于总体均数,这种由抽样造成的样本均数与总体均数的差异称为抽样误差。
2.样本(sample)(4):从总体中随机抽取部分观察单位的过程称为抽样,所抽得的部分称为样本。
3.总体(population)(2):根据研究目的确定的同质研究对象的全体4.变量(variable):收集资料时,对每个观察对象的某项特征进行测量的观察,这种被观察单位的特征称为变量。
5.概率(probability)对某一随机现象进行大量观察后得到的一个统计百分数f/N抽样研究(sampling study)(2):从总体中随机抽取有代表性的部分个体进行研究的过程称为抽样研究。
6.计量资料(Quantitative data)(6)对每个观察对象的观察指标用定量方法测定其数值大小所得的资料称为计量资料,通常带有度量衡单位。
7.计数资料(count data)(3):先将观察对象的观察指标按性质或类别进行分组,然后计数各组数目所得的资料称为计数资料,也叫定性数据(Qualitative data)。
8.等级资料(Rank data):同时具有半定性或半定量特征的资料,有大小顺序,所以也叫有序资料。
×100%,主要用于对均数相差较大或9.变异系数(Coefficient of Variation )(1):CV=SX̅单位不同的几组观察值的变异程度进行比较。
10. I类错误(3):当Ho为真时,假设检验结论拒绝H0接受H1,这类错误称为I类错误。
11. II类错误:当真实情况为H0不成立时,假设检验结果不拒绝H0,这类错误称为II类错误。
12.标准正态分布(Standard Normal Distribution) (2):对任何参数的正态分布,都可以化成μ=0和σ=1的标准正态分布。
1.卫生统计学:是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学。
2.同质(homogeneity):在统计学中,若某些观察对象具有相同的特征或属性称为同质的。
否则称为异质(heterogeneity)的或者间杂的。
3.变异(variation):同质事物之间的差别称为变异。
[没有个体变异,就没有统计学!]4.总体(population):根据研究目的所确定的同质观察单位的全体。
5.样本(sample):是从总体中随机抽取的具有代表性的部分观察单位的集合。
6.样本含量(sample size):样本中包含的观察单位个数。
7.参数(parameter):反映总体特征的指标。
特点:未知、唯一,希腊字母表示,如总体均数、总体率等。
8.统计量(statistic):根据样本观察值计算出来的指标。
特点:已知、不唯一,拉丁字母表示,如样本均数、样本率等。
9.变量(variable):研究者需要对每个观察单位的某项特征或属性进行观察或测量,这种特征或属性称为变量。
10.变量值(value of variable):变量的观察值或测量值称为变量值或观察值(observed value).11.资料(data):变量值的集合称之为资料.12.定量资料(quantitative data):变量值是定量的,表现为数值大小。
特点:一般有度、量、衡单位,一般属连续性资料。
13.定性资料(qualitative data):观察值是定性的,表现为互不相容的类别或属性。
特点:一般无度、量、衡单位,一般属于离散型资料。
可进一步分为计数资料和等级资料。
14.计数资料(count data):将观察单位按某种类别或属性进行分组,清点各组观察单位数所得的资料。
可进一步分为二项分类资料和无序多项分类资料.15.等级资料(ordinal data):将观察单位按照某种特质或属性的程度或等级顺序分组,清点各组观察单位所得的资料。
第二单元医学统计学方法一、基本概念和基本步骤(一)统计学中的几个基本概念1.总体的类型总体:是根据研究目的而确定的同质的研究对象的集合。
分为有限总体和无限总体。
样本:是指从总体中随机抽取的有代表性的一部分观察单位的集合。
2.同质和变异同质:指被研究指标的影响因素完全相同。
是科学研究的基础,是相对的。
变异:是同质基础上的个体差异。
是绝对的。
统计的任务就是在同质分组的基础上,通过对个体变异的研究,透过偶然现象,反映同质事物的本质特征和规律。
统计数据具有变异的特征。
3.变量和变量值变量:观察对象的特征。
变量分为定量变量、定性变量、有序数据。
变量值:对变量观察或测量的结果。
4.参数和统计量参数:总体的统计指标。
μ,π,σ统计量:样本的统计指标。
,p,s【例如】研究北京2012年正常成年男性的血压值。
研究对象观察单位变量变量值同质变异有限总体总体参数样本统计量5.误差误差:观察值与实际值的差别称为误差。
误差包括抽样误差和非抽样误差。
抽样误差:由于个体变异的存在,在抽样研究中产生的样本统计量与相应的总体参数间的差异。
非抽样误差包括过失误差和系统误差。
6.概率概率:随机事件发生可能性大小的度量。
常用P表示,P值范围在0~1之间。
小概率事件:P<0.05为小概率。
统计学认为小概率事件在一次试验中不大可能发生。
(二)统计学工作基本步骤1.统计设计。
2.数据整理。
3.统计描述。
4.统计推断。
二、定量资料的统计描述描述统计是通过图表或统计指标,对数据资料进行整理、分析,并对数据的分布状态、数字特征进行估计和描述的方法。
(一)集中趋势指标1.算数均数μ,适用于正态分布或近似正态分布资料。
2.几何均数(G)适用于对数正态分布或等比资料。
3.中位数(M)与百分位数(P)中位数:是一组由小到大按顺序排列的观察值中位次居中的数值,用M表示。
百分位数(P X):是把一组数据从小到大排列,分成100等份,各等份含1%的观察值,分割界限上的数值就是百分位数。