医学统计学重点总结

  • 格式:pdf
  • 大小:200.68 KB
  • 文档页数:8

下载文档原格式

  / 8
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章

统计学的基本概念:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。

统计学的研究对象:有变化的事物或现象。

总体:是根据研究目的的确定的同质研究对象的全体,统计学家用总体这个术语来表示大同小异的对象全体。

样本:是指从研究总体中抽取少量有代表性的个体。

同质:一些个体处于同一总体,就是指它们大同小异,具有同质性。

变异:同一总体内的个体间存在差异又是绝对的,这种现象就是Fisher强调的变异。

没有同质性就构不成一个总体供人们研究,总体内没有变异性就无需统计学。

变量:可分为定性变量、定量变量。

定性变量:常见的是分类变量或名义变量,还有一种是有序变量。

定量变量(quantitative variable):也称为数值变量,其变量值是定量的,所获资料为计量资料。即对每一个观察对象用定量的方法测定某项指标量的大小。有度量衡单位。分为离散型变量(只能取整数值)和连续型变量(任何数值)。

统计量:由观察资料计算出来的量称为统计量。

参数(固定常数):也叫参变量,是一个变量,是总体的统计指标。

频率:样本的实际发生率。

误差分类(泛指测量值与真值之差):

(1)系统误差(特点:一边倒,偏大偏小,人为原因造成)

(2)随机测量误差,偶然因素造成(特点:不可避免,有规律的)

(3)抽样误差:从某一总体中随机抽取一个样本,所的样本统计量与相应的总体参数往往是不同的。其中包括改变抽样方法、增加样本量n、选择变异程度小的研究指标(特点:有规律性)

概率:描述随机事件发生可能大小的量。

小概率原理:小概率事件在一次试验中几乎不可能发生,利用该原理对科研资料进行假设检验。P≤0.05或P≤0.01称为小概率事件。

统计步骤:统计设计、收集资料、整理资料、分析资料。

常用的抽样方法:单纯随机抽样、系统抽样、分层抽样、整群抽样。

第二章

频数分布表的编制方法:

(1)求全距:(极差)

(2)定组段数与组距:8~15个组段,组距i=全距/组段数

(3)划组段:以一个稍小于或等于最小值的整数作为第一个组段的起点数据。

下限:每个组段的起点(最小值)。

上限:每个组段的终点(近似最大值)。

注:最后一个组段应同时写出上限和下限来。

(4)绘制整理表“下限≤x<上限”

注:各组段的频数之和应等于总的观察例数。

平均数:描述一组同质计量资料的集中趋势;反映一组观察值的平均水平。常用的有:算数平均数、几何均数、中位数

算术均数:简称均数,用希腊字母µ表示。适用于服从对称分布的变量,尤其是服从正态分布或近似正态分布的变量。

几何均数:用G表示,常用来反映一组含多个数量级数据的集中位置。适用于原始观察值分布不对称,但经对数转换后呈对称分布的变量,常用于等比级数资料或对数正态分布资料。

几何均数应用的注意事项:

(1)几何均数常用于等比级数资料或对数正态分布资料

(2)观察值中不能有0

(3)观察值中不能同时有正值和负值。

中位数:将一组变量值从小到大按顺序排列,位次居中的那个变量值就是中位数。适用于服从各种分布的变量,特别是偏锋分布的变量、分布末端无确定值的变量等,常用于偏态分布资料。

变异:同一总体中不同个体间存在的差异称为变异。

变异系数:适用于量纲不同或均数差别较大的变量间变异程度的比较。

极差(R):也称全距。样本量接近的同类资料比较时,极差越大意味着数据间变异越大。适用的变量分布类型不限

四位数间距:适用于各种类型的连续型变量,特别对服从偏锋分布的变量。

方差:方差只取正值。同类资料比较时,方差越大意味着数据间变异越大。适用于服从对称分布的变量,特别对正态分布或近似正态分布的变量。

标准差:方差的平方根称为标准差。同类变量比较时,标准差越大意味着观察值间变异程度越大。适用于服从对称分布的变量,特别对正态分布或近似正态分布的变量。

标准差的应用:

(1)表示变量分布的离散程度。

(2)结合均数计算变异系数。

(3)结合样本含量计算标准误。

(4)结合均数描述正态分布特征。

变异系数(CV):适用于量纲不同或均数差别较大的变量间变异程度的比较。

统计表的组成:标题、标目、线条、数字、备注。

(1)标题:概括说明表的主要内容,注明时间、地点,位于表的上方中央。

(2)标目:分横标目和纵标目,横标目说明表中每横行数字的含义,放表右侧,纵标目说明表中每列数字的含义,一般指统计指标,放表右上方。

(3)线条:3~4条横线即顶线、底线、标目线、合计线,其余线条均可省去。

(4)数字:用阿拉伯数字表示,无数字用“—”表示,为“0”者记作“0”。

(5)备注:表中可以有备注。

相对数:是由两个有联系的指标之比构成。大致有三种类型:频率、强度和相对比。频率型指标:近似的反映某一事件出现的机会大小,如发病概率、死亡概率。第三章

应用相对数时的注意事项:

(1)防止概念混淆,正确区分率和比

(2)计算相对数时分母应有足够数量

(3)正确估计合并率

(4)资料的对比应注意可比性

①观察对象同质,研究方法相同,观察时间相等,以及地区民族等客观条件一致

②其他影响因素在各组的内部构成是否相同

(5)对相对数的统计推断

死亡率(death rate)表示某地每1000人中的死亡人数,计算公式如下:

‰1000同年年平均人囗数

某年死亡总人数死亡率⨯=年龄别死亡率(age -specific death rate)表示某地某年龄(组)每1000人囗中的死