医学统计学符号公式重点
- 格式:doc
- 大小:430.00 KB
- 文档页数:17
第一章
医学统计中的基本概念
1、医学统计学是研究医学数据的收集、整理、分析、解释和呈现其结果的一门学科。
2、个体:研究的基本观察单位。
3、变量:用于观察研究对象的指标。
4、观察值:个体变量的数值。
5、资料:又称为数据,由变量的观察值构成。 变异:个体观察值之间具有的差异。
变异和同质是对统计学数据的要求!
变异是统计学研究的真正对象!
统计学是研究变异规律的科学!
同质:个体观察值之间的变异在允许范围内。
异质:个体观察值之间的变异超出允许范围。
一、总体、抽样、样本、参数、统计量
总体:同质的个体所构成的全体研究对象。总体同时具有同质和变异两个特点。
有限总体:总体中的个体数量是有限的。
无限总体:总体中的个体数量是无限的。
样本:从总体中随机抽取的部分个体。
样本量:样本所包含的个体数目。
参数:刻画总体特征的指标。
统计量:刻画样本特征的指标。
抽样:从总体中随机抽取部分个体的过程。抽样具有代表性、随机性、可靠性、可比性;
原则:代表性:样本能充分反映总体特征。
随机性:保证总体中每个个体都有相同的几率被抽样。
随机性是代表性的保证;
生活中随机性的例子(思考题);
计量资料:由连续变量的观察值构成的资料。对每个观察对象的观察指标用定量方
法测定其数值大小所得的资料,一般有度
量衡单位,例如年龄、身高、血糖。
计数资料:由离散变量的观察值构成的资料。先将观察对象的观测指标按性质或类
别进行分组,然后计数各组的数目所得的
资料,例如性别、患病、血型。
等级分组资料:由等级变量的观测值构成的资料。具有计数资料的特征,同时又具
有半定量性质的资料,例如细菌培养阳性
结果。二、3种设计类型:完全随机设计;配对设计;配伍组设计。
三、抽样误差、概率和小概率事件
抽样误差:由抽样引起的样本统计量与总体参数之间的差异。
抽样误差的原因;抽样误差是不可避
免的。
概率P:表示某事件发生的可能性大小的度量。
❖小概率事件:统计学上习惯将P≤0.05或P≤0.01的事件称为小概率事件,表示该
事件发生的可能性很小。
“小概率事件”统计意义(两面性)
小概率事件几乎不会发生,或者说可以认为在一次试验中不会发生→
统计推断基础(正面:应用);
小概率事件偶然会发生,如果发生了→统计推断发生错误(反面:警
惕);
第二章
集中趋势的统计描述
一、统计描述
总体和样本具有同质和变异两个特征。
集中趋势—同质的统计描述;
变异程度—变异的统计描述;
统计描述主要通过统计量和统计图表来刻画
的
频数表和直方图
频数表:同时列出观察指标的可能取值区间及其在各区间内出现频数的统计表。
直方图:以垂直条段代表频数分布的一种图形,条段的高度代表各组的频数,由纵轴标度;各组的组限由横轴标度,条段的宽度表示组距。
频数表和直方图的用途
1. 作为陈述资料的形式;
2. 便于观察数据的分布类型;
3. 便于发现资料中含有的异常值;
4. 可用各组段的频率作为概率的估计值;
二、平均数
平均数:描述一组观察值集中趋势或平均水平的统计指标。
平均数类型
算数均数(均数):线性尺度上的平均水平; 几何均数:对数尺度上的平均水平;
中位数:顺序尺度上的平均水平;
百分位数:顺序尺度上的平均水平。
均数的意义和应用
均数代表每组观察值的平衡点,也就是重心。
常用在对称分布,尤其是正态分布;
在偏态分布时,易受极值影响;
算术均数
算数均数(均数):线性尺度上的平均水平
几何均数及应用
几何均数:对数尺度上的平均水平;
1. 几何均数的对数等于各观察值对数的算术均数;
2.几何均数主要应用在免疫学(抗体滴度、血清凝聚效价)、微生物学(细菌计数)等领域。观察值一般呈等比或对数正态分布。
中位数
中位数:将一组观察值从小到大按顺序排列,居中心位置的数值,记为M。
中位数的精确计算
1. 当观察例数n为奇数时,中位数是按顺序排列在
第(n+1)/2项的观察值;
2.当观察例数n为偶数时,中位数是按顺序排列
在第n/2和(n/2)+1项观察值的平均值;
百分位数
百分位数P x:指在一组数据中找到这样一个数值,
全部观察值的x%小于P x ,其余(100-x)%大于P x。
统计图类
型
适用条件
条图适用于比较相互独立的统计指标的数值大小圆图、百
分比条图
描述分类变量各类别所占构成比,后者特别
适合多个构成比的比较
线图描述某统计量随另一连续性数值变量变化而变化的趋势
直方图描述数值变量的频数分布
箱式图描述数据的分布特征
统计地图描述某指标在地理区域的分布
第三章 变异程度的统计描述 自由度的理解
样本方差S 2是总体方差σ2的无偏估计。 E(S 2)=
σ2
自由度:已知 ,固定X 1,X 2,...,X n-1后,X n 必然确定;所以只有n-1个独立(自由变化)个体。 不同类型变异程度指标的比较 正态分布及应用
正态分布有两个参数μ 和σ , 分别表示均数和标准差 主要特征:
1.以μ为中心的对称分布
2.钟型曲线
3.曲线下面积分布有规律
4.两个参数决定位置和变异 当μ=0,σ=1时,称为标准正态分布 正态分布曲线下面积
单侧95%=双侧90%=1.645 μ±σ:68% μ±1.96σ:95%
μ±2.58σ:99%
二、医学参考值范围的制定方法 (一)选择一定数量的参照样本;
(二)对选定的参照样本进行准确的测定; (三)决定取单侧范围还是双侧范围值; (四)选择适当的百分范围; (五)估计参考值范围的界限; (三)决定取单侧范围还是双侧范围值
有些指标过高或过低均属异常(A) ,故其参考值范围需要分别确定下限和上限,称作双侧参考值范围。有些指标仅在过高(B)或过低时为异常(C),只需确定其上限或下限,称作单侧参考值范围。 (四)选择适当的百分范围
参考值的百分范围应根据资料的性质和研究目的选择,它与诊断阈值有确定的关系。百分范围的不同将导致不同的假阳性率和假阴性率。 (五)估计参考值范围的界限
参考值范围估计主要有百分位数法和正态分布法。 总结
衡量变异程度的指标
极差、四分位数间距、方差和标准差、变异系数
正态分布的特征和曲线下面积分布规律 医学参考值范围的制定方法
1
)
X -(X 1
-n SS 2
2
-=
=∑n S 方差n-1 是自由度df
X