医学统计学重点总结
- 格式:pdf
- 大小:200.68 KB
- 文档页数:8
第一章
统计学的基本概念:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。
统计学的研究对象:有变化的事物或现象。
总体:是根据研究目的的确定的同质研究对象的全体,统计学家用总体这个术语来表示大同小异的对象全体。
样本:是指从研究总体中抽取少量有代表性的个体。
同质:一些个体处于同一总体,就是指它们大同小异,具有同质性。
变异:同一总体内的个体间存在差异又是绝对的,这种现象就是Fisher强调的变异。
没有同质性就构不成一个总体供人们研究,总体内没有变异性就无需统计学。
变量:可分为定性变量、定量变量。
定性变量:常见的是分类变量或名义变量,还有一种是有序变量。
定量变量(quantitative variable):也称为数值变量,其变量值是定量的,所获资料为计量资料。即对每一个观察对象用定量的方法测定某项指标量的大小。有度量衡单位。分为离散型变量(只能取整数值)和连续型变量(任何数值)。
统计量:由观察资料计算出来的量称为统计量。
参数(固定常数):也叫参变量,是一个变量,是总体的统计指标。
频率:样本的实际发生率。
误差分类(泛指测量值与真值之差):
(1)系统误差(特点:一边倒,偏大偏小,人为原因造成)
(2)随机测量误差,偶然因素造成(特点:不可避免,有规律的)
(3)抽样误差:从某一总体中随机抽取一个样本,所的样本统计量与相应的总体参数往往是不同的。其中包括改变抽样方法、增加样本量n、选择变异程度小的研究指标(特点:有规律性)
概率:描述随机事件发生可能大小的量。
小概率原理:小概率事件在一次试验中几乎不可能发生,利用该原理对科研资料进行假设检验。P≤0.05或P≤0.01称为小概率事件。
统计步骤:统计设计、收集资料、整理资料、分析资料。
常用的抽样方法:单纯随机抽样、系统抽样、分层抽样、整群抽样。
第二章
频数分布表的编制方法:
(1)求全距:(极差)
(2)定组段数与组距:8~15个组段,组距i=全距/组段数
(3)划组段:以一个稍小于或等于最小值的整数作为第一个组段的起点数据。
下限:每个组段的起点(最小值)。
上限:每个组段的终点(近似最大值)。
注:最后一个组段应同时写出上限和下限来。
(4)绘制整理表“下限≤x<上限”
注:各组段的频数之和应等于总的观察例数。
平均数:描述一组同质计量资料的集中趋势;反映一组观察值的平均水平。常用的有:算数平均数、几何均数、中位数
算术均数:简称均数,用希腊字母µ表示。适用于服从对称分布的变量,尤其是服从正态分布或近似正态分布的变量。
几何均数:用G表示,常用来反映一组含多个数量级数据的集中位置。适用于原始观察值分布不对称,但经对数转换后呈对称分布的变量,常用于等比级数资料或对数正态分布资料。
几何均数应用的注意事项:
(1)几何均数常用于等比级数资料或对数正态分布资料
(2)观察值中不能有0
(3)观察值中不能同时有正值和负值。
中位数:将一组变量值从小到大按顺序排列,位次居中的那个变量值就是中位数。适用于服从各种分布的变量,特别是偏锋分布的变量、分布末端无确定值的变量等,常用于偏态分布资料。
变异:同一总体中不同个体间存在的差异称为变异。
变异系数:适用于量纲不同或均数差别较大的变量间变异程度的比较。
极差(R):也称全距。样本量接近的同类资料比较时,极差越大意味着数据间变异越大。适用的变量分布类型不限
四位数间距:适用于各种类型的连续型变量,特别对服从偏锋分布的变量。
方差:方差只取正值。同类资料比较时,方差越大意味着数据间变异越大。适用于服从对称分布的变量,特别对正态分布或近似正态分布的变量。
标准差:方差的平方根称为标准差。同类变量比较时,标准差越大意味着观察值间变异程度越大。适用于服从对称分布的变量,特别对正态分布或近似正态分布的变量。
标准差的应用:
(1)表示变量分布的离散程度。
(2)结合均数计算变异系数。
(3)结合样本含量计算标准误。
(4)结合均数描述正态分布特征。
变异系数(CV):适用于量纲不同或均数差别较大的变量间变异程度的比较。
统计表的组成:标题、标目、线条、数字、备注。
(1)标题:概括说明表的主要内容,注明时间、地点,位于表的上方中央。
(2)标目:分横标目和纵标目,横标目说明表中每横行数字的含义,放表右侧,纵标目说明表中每列数字的含义,一般指统计指标,放表右上方。
(3)线条:3~4条横线即顶线、底线、标目线、合计线,其余线条均可省去。
(4)数字:用阿拉伯数字表示,无数字用“—”表示,为“0”者记作“0”。
(5)备注:表中可以有备注。
相对数:是由两个有联系的指标之比构成。大致有三种类型:频率、强度和相对比。频率型指标:近似的反映某一事件出现的机会大小,如发病概率、死亡概率。第三章
应用相对数时的注意事项:
(1)防止概念混淆,正确区分率和比
(2)计算相对数时分母应有足够数量
(3)正确估计合并率
(4)资料的对比应注意可比性
①观察对象同质,研究方法相同,观察时间相等,以及地区民族等客观条件一致
②其他影响因素在各组的内部构成是否相同
(5)对相对数的统计推断
死亡率(death rate)表示某地每1000人中的死亡人数,计算公式如下:
‰1000同年年平均人囗数
某年死亡总人数死亡率⨯=年龄别死亡率(age -specific death rate)表示某地某年龄(组)每1000人囗中的死