实验室常用统计方法

  • 格式:pdf
  • 大小:1.90 MB
  • 文档页数:71

下载文档原格式

  / 71
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
*****配对t检验 配二对、设计配是对研设究计者资为料了的控制t 可检能验存在的主要非处理因素
而采用的一种试验设计方法。
形式:
(1)同一样品分成两份,用2种方法测定,比较两种方 法测定结果是否存在差异。
(2)同一受试对象处理前后,数据作对比。
(3)其他
例.ALBK法和高铁硫酸比色法测得血清总胆固醇含量如 表,问两法测定结果是否有差别。
1. 极差(range ,R)
2. 标准差(standard deviation ,S)
总体标准差 X 2 / N
X ,n N
X X2 /n
X X2 < X a2
X
样本标准差 S XX 2 /n1
式中n-1是自由度,为随机变量能自由取值的个数。它描
G lg1
lg n
X


lg1
lg16

lg 32

lg 32 7

...lg 512

lg11.8062 64
7份HBsAg的平均滴度为1:64
几何均数应用的注意事项: 1)几何均数常用于等比级数资料或资料
呈倍数关系或对数正态分布资料。 2)观察值中不能有0。 3)观察值中不能同时有正值和负值。
n 1
5 1
(2) 加权法:适用于n较大的资料
S fX 02 fX 0 2 / f
f 1
*** 标准差的应用:
XS
1)
表示变量分布的离散程度。CV

S X
100%
2) 结合均数计算变异系数。
SX
S n
3) 结合样本含量计算标准误。 X 1.96S
4)结合均数描述正态分布特征。
v估计医学参考值范围的方法:
1. 正态近似法:适用于正态分布或近似正态分布的资料。 2. 百分位数法:适用于偏态分布资料。
例 某地调查120名健康女性血红蛋白,其分布近似 于正态分布,得均数为117.4 g/L,标准差为10.2 g/L , 试估计该地正常女性血红蛋白的95%医学参考值范围。
分析:正常人的血红蛋白过高过低均为异常,要制 定双侧正常值范围。
t 475.66 0 19.552(mg / dl), 12 1 11
84.2747 / 12
*****两组独立样本资料的t 检验
将受试对象随机分配成两个处理组,每一组随机 接受一种处理。 1、一般把这样获得的两组资料视为代表两个不同总 体的两份样本,据此推断其对应的总体均数是否相等。 2、从两个人群分别随机抽取一定数量的观察对象, 测量某项指标进行比较,在实际工作中这类资料也按 完全随机设计的两样本比较来对待。
例 某口腔科测得长春市13—16岁居民男性20人的恒 牙腭弓深度均值为17.15mm,标准差为1.59mm;女 性34人的均值为16.92mm,标准差为1.42mm。根据 这份数据可否认为该市13—16岁居民腭弓深度有性 别差异?
检验步骤:
H0:1 2 H1 : 1 2 0.05
n1 20, X1 17.15, S1 1.59, n1 34, X 2 16.92, S2 1.42
S
2 c

n1

1S12

n2

1S
2 2
n1 n2 2

20 11.592 34 11.422
20 34 2

2.20
t X1 X 2 17.15 16.92 0.550
X 1.96S 117.4 1.96 10.2 97.41 ~ 137.39
该指标的95%医学参考值范围为 97.41 ~ 137.39g / L
二、质量控制 为了控制实验中的检测误差,常用 ±2S作上
下警戒线,以 X ±3S作为上下控制线。这里的2S和 3S可视为1.96S 和2.58S的约数。其依据是正常情况下 检测误差是服从正态分布的。
28~30
1
29
7
49
27
243
66
726
104
1352
180
2700
340
5780
513
9747
378
7938
276
6348
200
5000
108
2916
29
841
合计
120(∑f)
2228(∑fX0) 43640( fX 02)
( 二)几何均数(geometric mean): (几何均数也称为倍数均数,用G表示)
假设检验步骤:
H0:d 0 H1 : d 0 0.05
n 12, d 5707.95,d d n 5707.95 / 12 475.66
2793182.166 5707.952
d 2 2793182.166, Sd
12 12 1
84.2747
X
7条线分别表示的意义
t分布的概念
在统计应用中,可以把任何一个均数为µ,标准
差为σ的正态分布N(µ,σ2)转变为µ=0,σ=1的标准正态分
布,即将正态变量值X用
Z

X

来代替。
X 也服从正态分布, X
X
z X X
服从标准正态分布N(0,1)
SX
X
t X
SX
服从ν=n-1的t分布
2)百分位数可用于确定医学参考值范围(详后)。
3)分布在中部的百分位数相当稳定,具有较好的代表性,但 靠近两端的百分位数,只有在样本例数足够多时才比较稳定。
二、描述离散趋势的特征数
例: 试观察3组数据的离散情况。 A组 26 28 30 32 34 B组 24 27 30 33 36 C组 20 23 30 37 40
X X1 X2 ... Xn / n X / n 4.2 6.43 2.08 ... 3.38/ 8 3.9075U / L
例 :已知正常人血清白蛋白水平呈对称分布, 某检验师测得10人白蛋白含量(单位g/L) 如下:35、35、44、52、44、40、40、38、 41、42,求10人血清白蛋白平均数。
某地不同年龄段男子身高的变异度
年龄组 人数 均数 标准差 变异系数(%)
3-3.5岁 100
96.1 3.1
3.23
30-35岁 100
170.2
4.0
2.35
运用变异系数的注意事项: 1.有关的事物才能比较 。 2.均数小于标准差时要考虑其实际运用价值 。
一、正态分布的概念
正态分布是自然界最常见的一种分布,若指标 X的频率分布曲线对应于数学上的正态分布曲线, 则称该指标服从正态分布。
Sc2
1 n1

1 n2

2.20

1 20

1 34

n1 n2 2 20 34 2 52
查t 临界值表:t0.5/2,50=0.679
t < t0.5/2,50,得P>0.5
按α=0.05水准不拒绝H0,故还不能认为该市13— 16岁居民腭弓深度有t性0.4,别50=差0.异849。, t0.4,60=0.848
1. 几何均数的计算方法 1) 直接法:适用于样本例数n较少的资料。 将n 个观察值X1,X2,X3…Xn的乘积开n次方
G n X 1 X 2 ...X n 对数形式:G=lg-1{(lgX1+lgX2+lgX3+…lgXn)/n} =lg-1(∑lgX/n)
例: 7名慢性迁延性肝炎患者的HBsAg滴度资料 为1:16,1:32,1:32,1:64,1:64,1:128,1: 512。求其平均效价。
正态分布的特征
1. 即正态分布以均数为中心,左右对称。 2. 表现为 钟形曲线。即正态曲线在横轴上方均
数处最高。x
正态分布的应用
(一)制定医学参考值范围
v参考值范围:指特定的“正常”人群的解剖、生理、生化、
免疫等各种数据的波动范围。
v制定参考值范围的步骤:
1. 选择足够数量的正常人作为调查对象。 2. 样本含量足够大。 3. 确定取单侧还是取双侧正常值范围。 4. 选择适当的百分界限。 5. 选择适当的方法。
t 分布的图形和t 分布表 t分布曲线特点:
1) t分布曲线是单峰分布,它以0为中心,左 右对称。
2)t分布的形状与样本例数n有关。自由度越
小翘,的则越高SX。越大,t 值越分散,曲线的峰部越矮,尾部 3) 当 n→∞时,则S逼近σ,t分布逼近标准
正态分布。
t分布不是一条曲线,而是一簇曲线。
t 检验
述了当X 选定时n个变量值中能自由变动的变量值的个数。
SS=lxx= X X 2 =∑X2-(∑X)2/n
(1) 直接法:适用于n较小的资料
S X 2 X 2 / n
n 1
求例题中A组数据的标准差。
S X 2 X 2 / n (262 282 ... 342 ) 26 28 ... 342 / 5 3.16
(三)中位数和百分位数
中位数(median,M):将一组变量值从小到大按顺序排列, 位次居中的那个变量值就是中位数。
例:11名交通警察血铅值(单位μg/L)如下:32、45、46、 50、57、59、61、65、71、71、100。已知交警的血铅值呈偏态 分布,求平均血铅浓度。
M=59
百分位数(percentile, Px):指把数据从小到大排 列后位于第X%位置的数值。有n个观察值X1,X2…Xn, 把他们由小到大按顺序排列成X1≤X2≤X3…≤Xn,将这n 个观察值平均的分为100等份,对应于每一等份的数值 就是一个百分位数,对应于前面X%个位置的数值称为 第X百分位数,用Px表示。
CV S 100% X
例2-16 1985年通过10省调查得知,农村刚满周岁的女童 体重均数为8.42kg ,标准差为0.98kg ;身高均数为72.4cm,标 准差为3.0cm,试比较二者变异度。
体重 CV=0.98/8.42×100%=11.64% 身高 CV=3.0/72.4×100%=4.14%
3. 四分位数间距(quartile range ,Q) 简记为Q,可看为特定的百分位数。
P25表示全部观察值中有25%(1/4)的观察值比它小, 记为下四分位数QL ,
P75表示全部观察值中有25%(1/4)的观察值比它大, 记为上四分位数QU。
Q适用于各种类型的连续型变量,特别是偏态分布的 资料。 Q QU QL
实验室安全常用统计学 方法
定量资料平均数计算
平均数:反映一组百度文库察值的平均水平。 常用的平均数有算术均数,几何均数和中位数。 (一)算术均数(mean):简称均数,总体均数用希腊字母µ表 示,样本均数用拉丁字母 X 表示。
1. 计算方法 1) 直接法:
X X1 X2 ... Xn X
120名成年男子血清铁含量均数、标准差计算表(加权法)
组段
(1)
频数(f) 组中值(X0) fX 0
(2)
(3)
(4)=(2)(3)
fX 02
(5)=(3)(4)
6~
1
7
8~
3
9
10~
6
11
12~
8
13
14~
12
15
16~
20
17
18~
27
19
20~
12
21
22~
10
23
24~
8
25
26~
4
27
四分位间距:P25,P50,P75 例:计算1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11-----------,99, 100的P25,
P50,P75 。 P25=25 P50=50.5 P75=75
2. 中位数和百分位数的应用
1)中位数常用于描述偏态分布资料的集中趋势,反映位次居 中的观察值的平均水平。在对称分布的资料中,中位数和均数在 理论上是相同的,(但在使用过程中不能混用)。
n
n
其中X1,X2…Xn为各变量值,n为样本例数。
2) 加权法:
X fx0 fx0
f
n
f1,f2…fn分别为各组段的频数,X1,X2…X0 为各组段 的组中值, 组中值=(本组段下限+下组段下限)/2。
即频数多,权数大,作用也大,频数小,权数小,作 用也小。
例: 测得8只正常大白鼠总酸性磷酸酶(TACP) 活性(U/L)为4.20,6.43,2.08, 3.45,2.26,4.04,5.42,3.38。试求其算术均数。
采用内插法得: t0.4,52的值
x0.849 5250 0.8480.849 6050 t0.4,52 0.8478