医学统计学——简答题一览
- 格式:doc
- 大小:189.50 KB
- 文档页数:3
简答题(规则是:知道多少,写多少,不要空白,尽量多写)
1. 频数表和频数图的用途
答:1.描述频数分布的类型
(1)对称分布 :若各组段频数的分布以频数最多的组段为中心左右两侧大体对称(总体则完全对称),就认为该资料是对称分布
(2)偏态分布 :
右偏态分布(正偏态分布):频数最多组段右侧的组段数多于左侧的组段数,高峰向左偏移,频数向右侧拖尾。 左偏态分布(负偏态分布):左侧的组段数多于右侧的组段数,频数向左侧拖尾。
2. 描述计量资料分布的集中趋势和离散趋势
①集中趋势(central tendency):变量值集中位置。——平均水平指标
②离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况。离“中心”位置越远,频数越小;且围绕“中心”左右对称。——变异水平指标
3.便于发现一些特大或特小的可疑值;
4.便于进一步做统计分析和处理。
2.计量资料集中趋势和离散趋势的描述
答:集中趋势常用指标位算数均数、几何均数和中位数。
1.算数均数简称均数,适合描述对称分布或近似对称分布资料的集中趋势。可以分为总体均数和样本均数。(总体均数:是指根据研究目的所确定的全体研究对象的某项指标观察值的平均水平;样本均数:是指研究所收集到的研究对象的某项观察值的算数均数。)
注意计算方法:原始数据的样本均数计算方法 频数表资料的样本均数计算方法 2.几何均数适用于对数对称分布(原始变量分布不对称,但是经过对数变换后近似呈对称分布)的资料,并且要求所有数据均大于0.典型代表——滴度。
原始资料的几何均数计算方法
频数表资料的几何均数计算方法
3.中位数 意义:中位数是将一批数据从小至大排列后位次居中的数据值,反映一批观察值在位次上的平均水平。 符号:Md
适用条件:适合各种类型的资料。尤其适合于①大样本偏态分布的资料; ②资料有不确定数值;③资料分布不明等。 离散趋势的常用描述指标是:方差标准差、全距、四分位数间距、变异系数。
1.极差(Range ) (全距) 符号:R 意义:反映全部变量值的变动范围。
优点:简便,如说明传染病、食物中毒的最长、最短潜伏期等。
缺点:1. 只利用了两个 极端值2.n 大,R 也会大3.不稳定
适用范围:任何计量资料;是参考变异指标。
2.百分位数与四分位数间距百分位数 :数据从小到大 排列;在百分尺度下,所占百分比对应的值。记为Px 。 四分位间距: Q =P 75- P 25 四分位半间距quartile deviation :QD =QR/2
确定医学参考值范围 (reference range ):
如95%参考值范围=P97.5-P2.5;表示有95%正常个体的测量值在此范围。
n
X n X X X X n ∑=+++= 21112233123k k i k i f X f X f X f X fX X f f f f f ++++∑==++++∑ n
X X n
X X X X n X X X X X G n G n n
G ∑∑-==+++==lg lg lg )lg lg (lg 1lg 1
2121 ⎪⎪⎭⎫ ⎝⎛+++=⎪⎪⎭⎫ ⎝⎛=∑∑∑--i n n i i i f X f X f X f f X f G lg lg lg lg lg lg 221111 ()⎩⎨⎧+=++为偶数为奇数n x x n x Md n n n 2
2/12/2
/)1(min
max X X R -=
中位数Md 与四分位半间距QD 一起使用,描述偏态分布资料的特征 3.方差 (variance )也称均方差(mean square deviation ),样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。 标准差 (
X 的单位相同。 4.变异系数(coefficient of variation)
适用条件:①观察指标单位不同,如身高、体重②同单位资料,但均数相差悬殊
5.分类资料统计描述的常用量
比:又称相对比,是两个有关指标A 、B 之比。
比例:又称百分比,说明在某个时点事物内部个组成部分所占的比重。
率:是一个具有时期概念的指标,用于说明在某一时段内某现象发生的频率或强度。 6.统计表的结构:统计表由标题、标目、线条和数字等元素组成。
7.假设检验的基本思想是什么?
假设检验的基本思想(反证法) N X X l SS X xx ∑∑∑222)-()-()square of sum (0)-(μσμμ====总体方差离均差平方和离均差和()11)(2222∑----=∑∑n n X X n X X S =样本方差σ=总体标准差S =样本标准差()122--=∑∑∑∑f f fX fX S 频数表样本标准差 含 义 按预先给定的概率,确定的未知参数μ 的可能范围。实际上一次抽样算得的可信区间要么包含了总体均数,要么不包含。但可以说:当α=0.05时,95%CI 估计正确的概率为0.95,估计错误的概率小于或等于0.05,即有95%的可能性包含了总体均数。 “正常人”的解剖,生理,生化某项指标的波动范围。 总体均数的波动范围 个体值的波动范围 计算 公式 σ未知: ,X X t S αν±* σ已知或σ未知但n >60: X X u ασ±或X X u S α±** 正态分布:X u S α± ** 偏态分布:P X ~P 100-X 用途 总体均数的区间估计 绝大多数(如95%)观察对象某项指标的分布范围 * ,t αν也可用/2,t αν(对应于双尾概率时) **,u αν也可用/2,u αν(对应于双尾概率时)