医学统计学公式使用总结(流程图)
- 格式:doc
- 大小:29.00 KB
- 文档页数:1
描述内容 指 标 意 义 适 用 场 合平均水平均 数 个体的平均值 对称分布几何均数 平均倍数 取对数后对称分布中 位 数 位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料;④分布不明众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值正偏峰分布资料 变 异 度全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数的程度对称分布,特别是正态分布资料四分位数间距 居中半数观察值的全距①非对称分布;②半定量资料;③末端开口资料;④分布不明变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法条 图 组间数量对比 用直条高度表示数量大小直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率百分条图 构成比 用直条分段的长度表示全体中各部分的构成比 饼 图 构成比用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数定性资料统计描述常用的统计指标及其适用场合指标 计算公式适用场合频率 n/N估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比A/B估计两个指标的相对大小4.常用参考值范围的制定?参考值范围(%)正态分布法百分位数法双侧单侧双侧单侧下限上限下限上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97.5 P 5 P 95 99S X 58.2±S X 2.33-S X 2.33+P 0.5~P 99.5P 1P 993. 简述置信区间与医学参考值范围的区别。
集中趋势的描述算术均数: 频数表资料(X0为各组段组中值)n fXffX x OO∑∑∑==几何均数:n nX X X G ...21= 或)log (log 1nX G ∑-=频数表资料:⎥⎦⎤⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡=∑∑∑--n X f f X f G log lg log log 11 中位数:(1)*21+=n X M (2))(21*12*2++=n n X X M百分位数⎪⎭⎫⎝⎛-⋅+=L X X f n X f i L P 100其中:L 为欲求的百分位数所在组段的下限 , i 为该组段的组距 , n 为总频数 , X f 为该组段的的频数 ,L f 为该组段之前的累计频数方差: 总体方差为:式(1); 样本方差为 式(2)(1)N X 22)(μσ-∑=(2)1)(22--∑=n X X S标准差:1)(2--∑=n X X S或 1/)(22-∑-∑=n nX X S频数表资料计算标准差的公式为1/)(22-∑∑∑-∑=f ffx fx S变异系数:当两组资料单位不同或均数相差较大时,对变异大小进行比较,应计算变异系数 %100⨯=X SCV常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化NpN p ii∑='∑=i i p N N p )(' 2.间接法标准化预期人数实际人数=SMR ∑=ii P n rSMR SMR P P ⨯='正态分布:密度函数:)2/()(2221)(σμπσ--=X e X f分布函数: 小于X 值的概率,即该点正态曲线下左侧面积)()(x X P x F <=特征:(1)关于x=μ对称。
(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。
(3)曲线下面积为1。
(4)μ决定曲线在横轴上的位置,σ决定曲线的形状 。
(5)曲线下面积分布有一定规律标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换σμ-=X u ,u 服从总体均数为0、总体标准差为1的正态分布。
1.nX nXnX X X ∑=+++=21(直接法)∑=+++=fX X f X f X f X k k 2211(加权法)1)(2--=∑n X X s ,1-=n ν;nS S X =2.n 为奇数时,)21(+=n XM ;n 为偶数时,2)12()2(++=n n X XML U Q Q Q -=,)%(∑-+=L xx f x f iL P (频率表:组段1,组中值X i 2,频数3,频率f i /%4,累计频率/%5) 3.变异系数:%100⨯=XSCV4.正态分布:S X 64.1±(90%);S X 96.1±(95%);S X 58.2±(99%)5.二项分布:k n kk n C k XP --==)1()(ππ,πμn =,)1(ππσ-=n6.Poisson 分布:k n k kn nn C k XP --==)1()()(μμ,2σμ=∞→μ,μμ-→=e k k X P k!)(7.两个样本均数间差值:22212121n S n S S X X+=-(2221σσ≠);2122121121n n S n S n S S c c c X X+=+=-,)1()1()1()1(21222211-+--+-=n n S n S n S c (22221c σσσ==)8.二项分类变量:np p S p)1(-=,5)1(n >-p np 、时接近正态分布两个样本频率间差值:21222111,)1()1(21ππ≠-+-=-n p p n p p S p p)11)(1(2221n n p p S c c p p +-=-,2121n n X X p c ++=(c πππ==21)9.nX /σμ-~Z 分布,其置信区间:(X X Z X Z X σσαα2/2/,--)或简写为X Z X σα2/±(σ已知) (X X S t X S t X νανα,2/,2/,+-)或简写为X S t X να,2/±(σ未知)10.两总体均数间差值的置信区间:21,2/21)(X X S t X X -±-να,1)/(1)/()//(22222121212222121-+-+=n n S n n S n S n S ν(2221σσ≠)21,2/21)(XX S t X X -±-να,2)1()1(2121-+=-+-=n n n n ν(2221σσ=)11.二项分类变量总体概率的(1-α)置信区间:),(2/2/p p S Z p S Z p αα+-,5)1(n >-p np 、12.两总体概率间差值的置信区间:])(,)[(21212/212/21p p p p S Z p p S Z p p --+---αα13.总体方差的置信区间:))1(,)1((2)1(),2/1(22)1(,2/2-----n n S n S n ααχχ14.nX Z /0σμ-=(Z 检验),nS X Z /0μ-=(t 检验)np p Z p/)1(000πππσπ--=-=(二项分布Z 检验)15.,)11(21221n n S X X t c +-=2)1()1(212221212-+-+-=n n n S n S S c (两独立样本)22212121//n S n S X X t +-=',1)/(1)/()//(22222121212222121-+-+=n n S n n S n S n S ν(方差不齐时)16.1,1)()(22112221-=-==n n S S F νν,较小较大(方差齐性检验)17.12/)1(5.02/)1(211+-+-=N n n N n T Z,21n n N+=(独立样本秩和检验的正态近似法))()(1,/33N N t t c c Z Z j j c ---==∑(相持较多时)18.1,/-==n nS dt d υ(配对资料的t 检验)(配对号、对照组、配对组、d )配对资料符号秩和检验的正态近似法(配对号1、对照组2、配对组3、差值d4,d的秩次5,带符号的秩次6):2/)1(+=+-+n n T T25,24/)12)(1(,4/)1(,>++=+=-=n n n n n n T Z T T TTσμσμ50,24/)12)(1(5.04/)1(5.0<++-+-=--=n n n n n n T T Z TT σμ48)(24)12)(1(5.04/)1(3∑--++-+-=j jc t t n n n n n T Z ,相持较多(不包括差值为0者)19.Poisson 分布:2121X X X X Z +-=(观察单位相等时),近似服从正态分布N (0,1)221121n X n X X X Z +-=(观察单位不等)20.∑∑==-=-=gi n j ij iN X X SS 1121,)(ν总1,)(21-=-=∑=g X X n SS i gi i ν组间∑∑∑===-=-=-=gi n j gi i i ij ig N S n X X 11122i ,)1()(SS ν组内组内组间总组内组间组内,ννν+=+=SS SS SS组内组间组内组内组内组间组间组间,,MS MS F SS SS ===ννMS MSiij ij g i n j i ij gi i X X Z g N g X z g z z g N F i-=-=-=----=∑∑∑===,,1,)()1()()(211112νν(方差齐性检验)残差i ij ij X X e -=21.n m n T T T A j i ij ki i i i =-=∑=,)(122χ(基本公式)))()()(()(22d b c a d c b a nbc ad ++++⋅-=χ(专用公式,40≥n ,5>ij T )))()()(()5.0(,)5.0(2222d b c a d c b a n n bc ad TT A ++++⋅--=--=∑χχ(40≥n ,51<≤ijT )!!!!!)!()!()!()!(n d c b a d b c a d c b a P ++++=(独立两组二分类)22.40,1,)()(22≥+=+-=c b c b c b νχ;40,1,)()1(22<+=+--=c b c b c b νχ(配对两组二分类)23.)1(12122∑∑==-=R i j ji ijm n A n χ,)(列数行数1-)1-(=ν(独立多组二分类) 24.Pearson 积距相关系数:∑∑∑----=22)()())((Y Y X X Y Y X X r)2/()1(02--=-=n r rS r t r ,2-=n υ(两连续型随机变量)25.相关系数n r+=22χχ(交叉分类22⨯列联表/22⨯配对资料))1(112∑∑==-=Ri Cj cjri ij n n A n χ,)1)(1(--=C R ν(多关联资料)26.XX Y βαμ+=/(总体线性方程的一般表达式)bX a Y+=ˆ(样本的线性回归方程,a 、b 为α、β的估计值) Y=α+βY+ε,X Y Y /με-=~N (0,σ2),YY ˆ-为残差 27.∑∑---=2)())((X X Y Y X X b ,X b Y a -=ˆ(普通最小二乘回归,OLS 回归)28.总变异分解:任一点Y 的离均差)ˆ()ˆ(ˆY Y Y Y YY -+-=- 得∑∑∑-+-=-222)ˆ()ˆ()(Y Y Y YY Y ,即残差回归总SS SS SS +=1-=n 总ν,1=回归ν,2-n =残差ν,残差回归总ννν+=残差回归残差残差回归回归MS MS //==ννSS SS F (回归模型的假设检验)29.2,0-=-=n S b t bν,∑-=2,)(X X S S XY b ,2-n ,残差SS S XY =(回归系数的假设检验) 30.死亡概率某年年初人口数某年内死亡人数=q生存概率某年年初人口数某年活满一年人数=p生存率观察总例数时刻仍存活的例数k k kt t T P t S =>=)()(ˆ若含有删失数据kk k k kp t S p p p t T P t S ⋅=⋅⋅⋅=>=-)(ˆ)()(ˆ121 风险函数t t T t t T t P t ∆≥∆+<≤=→∆)/(limh(t)031.含有因变量时:y 是定量资料,多元线性回归分析; y 是0及1定性资料,Logistic 回归分析; y=t 是生存资料,作COX 回归分析;。
一资料的描述性统计(一)算术均数(mean )(1)简单算术平均值定义公式为(直接法):X i X 2 X 3 ........ X n(2)利用频数表计算均数(加权法):f i X i f 2X 2 f 3X 3 f k X kfl + f2 + f3 + …+ fk方差(即标准差的平方)'(X _ X ) 2 ' X 2 X )2/ns n - 1 n-1(三)变异系数CV =■! 100%X二参数估计与参考值范围(三)T 分布(四)总体均数的区间估计X-匕能爪乂 £卩£ X +切2A A计算95%或 99%勺可信区间)(五) 总体率的区间估计 p — u :./2s p = :::p u /2s p(六) 参考值范围估计 双侧1-a 参考值范围:X-U a/2S单侧1-a 参考值范围:X脣或"X U a S(可信区间计算是用标准误,参考值范围计算用标准差,百分位数法大家自己看书)三T 检验与方差分析(一)T 检验(一) 均数的标准误(二) 样本率的标准sS X :J nS p 「P (1nP )(p 为样本率)(u 为总体均数)(一般要求(1)单样本T检验检验假设:(假设样本来自均数为H 0- 严0统计量t值的计算:t _ x一%_ x一%t = h二亦,(2)配对T检验检验假设:H 0:丄1 _」2 =」=0d —» d —卜统计量t值的计算:t :S d S d Nn的差值,Sd为差值的标准差)(3)两样本T检验检验假设:H : . | - . I统计量t值的计算:t =(Xl _ X2)_ (」1 _」2)SXi _X2' (捲一XJ2亠二(x2- x2)2n〔- 2s1两样本方差齐性检验 F 才 r 的比值)S2 m - 12= n2- 1 (即为两样本方差(二)单因素方差分析(1 )完全随机设计资料的方差分析MS合计S S T =' x2- c T = N 一1u 0的正态总体)n -1=n -1 (d为两组数据SS B '、B MS BMS Wsw总二ss组间ss组内―总组间组内SS组间T 2SS B八i-cn组内SSv 二ss■- SS B=k -1 SS B B= N-k SS M'g 2这里C =(瓦X)2/N T =瓦X jj (T即为该组数据之和)j (2)随机单位组设计资料的方差分析SS 总=SS处理+SS区组+SS误差V 总=V处理+V区组+V误差来源 SSVMS F处理组间 SSB^l-Ti^C B1 = k -■ 1 SR 仁■- B1MS B1 MS E 单位组间 SS B2 十 B 2-C • B2 二n -1SS32「B2MS B 2, MS E误差 SS E SS T 「SS B 〔「SS B 2 E="■ T ~ '■- B1 - '■- B2SS E E合计SSr 八 x 2C、、T = kn-1四列联表分析卡方检验(四)多个样本率间的多重比较每一个两两比较的检验水准::-比较的次数注意:1、有1/5以上格子的理论频数小于5;2、 一个理论频数小于 1;3、 总样本例数小于 40当有以上三种情况或之一存在时,均不适宜进行卡方检验基本公式nR*n Cv= (R-1)(C-1)(不太常用,理解)(—)四格表资料的卡方检验(1 )两样本率的比较 四格表专用公式(ad-b 。
医学统计学相关公式汇总Chapter 基本概念显著性检验(test of significance ):计算P 值 医学统计工作的内容: 1、实验设计:最关键最重要2、收集资料:最基础 原始资料:实验数据现场调查资料 医疗卫生工作记录 报表 报告卡 质量控制——精度和偏倚 3、整理资料(1) 资料的逻辑检查(坏数) (2) 一致性检查(3) 原始数据加工:频数分布表4、分析资料:统计描述(表、图、离散趋势、集中趋势)和统计推断 统计描述类型的选择:集中趋势 离散趋势 对称、正态 μ,x S SS ,, 对数正态 G S lgX 偏态及其他 M Q ,R 单位不同或均数差别大 CV医学统计的资料类型:计量资料、计数资料、等级分组资料 医学统计学的对象:有变异的事物 总体和样本:总体(population )的特性:同质性、大量性、差异性。
抽样的要求:代表性、随机性、可靠性、可比性。
样本的三性:代表性、随机性、可靠性。
可靠性(reliability ):实验的结果要具有可重复性。
即由科研课题的样本得出的结论所推测总体的结论有较大的可信度。
两样本间具有:可比性。
误差的类别:1、系统误差(system error ):在资料的收集过程中,由于仪器初始状态没有调零、标准试剂未经矫正、标准指定偏高或偏低等原因,造成的观察结果的倾向性的偏大或偏小。
必须克服。
2、随机测量误差(random measurement error ):在避免系统误差的情况下,由于各种偶然因素的影响造成对同一对象多次测量值的不一致。
3、抽样误差(sampling error ):由于抽样造成的的样本统计量与总体参数之间的差别。
不可避免。
样本含量越大,抽样误差越小。
如均数的抽样误差:|-X | 。
概率(probability ):P (A )小概率事件:P ≤0.05(有统计学意义)或P ≥0.01(有高度统计学意义)。
Chapter 集中趋势的统计描述手工整理资料频数表(frequency table )的步骤: 1、求极差(全距) 2、确定组数、组距 参考组距=全距 / 组数 3、确定组段4、手工编制划记表 直方图(histogram ): 高度:各组的频数 纵轴 宽度:组距 横轴表示组限 均数(average ):适用:对称分布或偏度不大的资料,尤其适合正态分布。
医学统计学x2检验公式1. 首先,让我们来了解什么是医学统计学中的x2检验。
x2检验是一种用于比较两个或多个类别变量之间差异的统计方法。
它的目的是确定观察到的频数与期望的频数之间的差异是否显著。
2. 在x2检验中,我们需要计算一个统计值x2(chi-square),它表示观察到的频数与期望的频数之间的偏离程度。
x2值越大,说明观察到的频数与期望的频数之间的差异越大。
3. x2检验的公式如下:x2 = Σ((观察值-期望值)^2 / 期望值)其中,Σ表示对所有类别进行求和,观察值是指实际观察到的频数,期望值是指根据某种假设或模型计算得到的频数。
4. 为了更好地理解x2检验的公式,让我们通过一个简单的例子来说明。
假设我们研究了两种不同的治疗方法对某种疾病的疗效,观察了200名患者的治疗结果,得到以下数据:治疗方法疾病痊愈未痊愈方法A 120 30方法B 50 05. 在这个例子中,我们对两种治疗方法的疗效进行比较。
我们假设两种方法的疗效相同,即期望的频数是根据总样本数和各个类别的比例计算得到的。
6. 首先,我们需要计算每个类别的期望频数。
对于方法A的疾病痊愈类别,期望频数计算公式为:(方法A总样本数/总样本数)* 总痊愈人数= (150/200)* 170 = 127.5。
7. 同样地,对于未痊愈类别,期望频数计算公式为:(方法A总样本数/总样本数)* 总未痊愈人数= (150/200)* 30 = 22.5。
8. 对于方法B的疾病痊愈类别,期望频数计算公式为:(方法B总样本数/总样本数)* 总痊愈人数= (50/200)* 170 = 42.5。
9. 同样地,对于未痊愈类别,期望频数计算公式为:(方法B总样本数/总样本数)* 总未痊愈人数= (50/200)* 30 = 7.5。
10. 现在,我们可以使用x2检验的公式来计算统计值x2了。
根据上述公式,我们将计算每个类别的(观察值-期望值)^2 / 期望值,并对所有类别求和。
作为一名临床医师,有时为了完成一些小科研,或晋升职称,都必须撰写医学论文。
大多数人会碰到一个难题,医学论文的数据都必须进行统计学处理,上大学时学过的《医学统计学》早已忘得差不多了,重新翻开统计学书本,花上十天半个月的时间,还是看得不知所云。
《医学统计学傻瓜教程》有别于其他任何的统计学教程,其特点是略去一些高深难懂的统计学原理及计算公式,直奔解决实际问题的方法。
本教程的学习时间约需要2~3小时,但你必须曾经学过《医学统计学》,不管学得好或学得差,或是否已忘记,只要有一点印象即可,同时还需要下载一个简明统计学处理软件《临床医师统计学助手V3.0》,因为作数据统计学处理时最令人头痛的问题是烦琐的计算,则由预存在本软件内的计算公式来完成。
这是一个全“傻瓜化”的教程,由4个实例组成,只要认真看完这4个实例,将实际中碰到的问题对号入座,就足以解决绝大多数问题了。
接下来我们开始轻松愉快的学习过程。
一、均数与标准差【例1】本组105 例,男55例,女50例;平均年龄:62.3±6.1岁,所有入选病例均符合1999年WHO高血压诊断标准。
举这个例子是为了说明“均数”与“标准差”的概念。
我实在不愿意多花时间阐述一些概念性的东西,但是由于“标准差”实在太重要了。
【例1】中的数据“62.3±6.1”,“62.3”就是年龄的均数,均数的概念大家都懂,那么后面的“6.1”是什么呢?它就是标准差。
有人可能会问,表达一组人的平均年龄,用均数就够了,为什么还要加一个标准差呢?先看下面的一个例子:有两组人,第1组身高(cm):98、99、100、101、102;第2组身高(cm):80、90、100、110、120,这两组人虽然身高的均数都是100cm,但是,仔细观察,第1组的身高很接近,第2组的身高差别很大,故仅仅用一个平均数表达一组数据的特征是不完整的,还需要用另一个指标来表达其参差不齐的程度,这就是标准差。
医学统计学计算公式
This model paper was revised by the Standardization Office on December 10, 2020
验后概率计算
验后概率=验前概率×似然比/(1-验前概率+验前概率×似然比)
已知灵敏度、特异度及验前概率时:
似然比(LR)计算
阳性似然比=灵敏度/(1-特异度)
阴性似然比=(1-灵敏度)/特异度
贝叶斯定理灵敏度、特异度及概率
已知患病率、灵敏度和特异度计算:
阳性预测值=灵敏度×患病率/[灵敏度×患病率+(1-患病率)×(1-特异度)]
阴性预测值=特异度×(1-患病率)/[特异度×(1-患病率)+(1-灵敏度)×患病率]阳性似然比=灵敏度/(1-特异度)
阴性似然比=(1-灵敏度)/特异度比值(Odds)-概率(P)计算
概率=比值/(1+比值)。
---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学公式使用总结(流程图)
D 计数或者等级分组能否转正资料计量资料正态资料配对资料配对秩和配对资料配对 t 检验 3 组方差齐性两独立样本t 检验校正独立 t 检验 A 有统计学意义 3 组独立样本秩和多组秩和下结论两两比较,校正 a 执行框判断框处理组有意义配伍组两两比较分别对配伍、处理两两比较单因素 ANOV 单因素ANOV 配伍组 ANOV 析因 ANOV 析因 ANOV配伍组有意义统计量有意义下结论用 N-K、 LSD 两两比较不要求 1.增加样本含量 2.根据医学知识合并相邻的行或列行列分割,校正 a 行列卡方T<5 格>20%行列分割下结论四格表四格表卡方检验 T>5 T>1 校正四格表卡方N>40 确切概率法校正配对卡方配对 b+c>40 配对卡方合并后可能成为四格表资料
1 / 1。