医学统计学定性资料的统计分析-χ2检验
- 格式:ppt
- 大小:304.50 KB
- 文档页数:30
检验(chi-square test)检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。
可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。
一、四格表资料的检验例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?表20-11 两种疗法治疗卵巢癌的疗效比较组别有效无效合计有效率(%)化疗组19244344.2化疗加放疗组34104477.3合计53348760.9表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。
这里可通过检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。
T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。
这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。
兹以表20-11资料为例检验如下。
检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:公式(20.13)式中TRC是表示第R行C列格子的理论数,n R为理论数同行的合计数,n C为与理论数同列的合计数,n为总例数。
第1行1列:43×53/87=26.2第1行2列:43×34/87=16.8第2行1列:44×53/87=26.8第2行2列:4×34/87=17.2以推算结果,可与原四项实际数并列成表20-12:表20-12 两种疗法治疗卵巢癌的疗效比较组别有效无效合计化疗组19(26.2)24(16.8)43化疗加放疗组34(26.8)10(17.2)44合计533487因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算值按公式20.12代入4.查值表求P值在查表之前应知本题自由度。
医学论文中常用统计分析方法的合理选择目前,不少医学论文中的统计分析存在较多的问题。
有报道,经两位专家审稿认为可以发表的稿件中,其统计学误用率为90%-95%[1]。
为帮助广大医务工作者提高统计分析水平,本文将介绍医学论文中常用统计分析方法的选择原则及应用过程中的注意事项。
1.t 检验t检验是英国统计学家W.S.Gosset 1908年根据t分布原理建立起来的一种假设检验方法,常用于计量资料中两个小样本均数的比较。
理论上,t检验的应用条件是要求样本来自正态分布的总体,两样本均数比较时,还要求两总体方差相等。
但在实际工作中,与上述条件略有偏离,只要其分布为单峰且近似正态分布,也可应用[2]。
常用的t检验有如下三类:①单个样本t检验:用于推断样本均数代表的总体均数和已知总体均数有无显著性差别。
当样本例数较少(n<60)且总体标准差未知时,选用t检验;反之当样本例数较多或样本例数较少、总体标准差已知时,则可选用u检验[3]。
②配对样本t检验:适用于配对设计的两样本均数的比较,在选用时应注意两样本是否为配对设计资料。
常用的配对设计资料主要有如下三种情况:两种同质受试对象分别接受两种不同的处理;同一受试对象或同一样本的两个部分,分别接受不同的处理;同一受试对象处理前后的结果比较。
③两独立样本t检验:又称成组t检验,适用于完全随机设计的两样本均数的比较。
与配对t检验不同的是,在进行两独立样本t检验之前,还必须对两组资料进行方差齐性检验。
若为小样本且方差齐,则选用t检验;反之若方差不齐,则选用校正t检验(t’检验),或采用数据变换的方法(如取对数、开方、倒数等)使两组资料具有方差齐性后再进行t检验,或采用非参数检验[4]。
此外,当两组样本例数较多(n1、n2均>50)时,这时应用t检验的计算比较繁琐,可选用u检验[5]。
2.方差分析方差分析适用于两组以上计量资料均数的比较,其应用条件是各组资料取自正态分布的总体且各组资料具有方差齐性。
上海交通⼤学⽹络《医学统计学》习题册答案上海交通⼤学⽹络教育学院医学院分院医学统计学课程练习册第⼀章绪论⼀、单选题1. ⼩概率事件是指P ( B )A.P>0.05 B.P<0.05 C. P >0.01 D. P <0.12. 从⼀个数值变量资料的总体中抽样,产⽣抽样误差的原因是( A )A总体中个体值存在差别B样本中个体值存在差别C样本只含总体的⼀部分D总体均数不等于03. 调查中国放射科医⽣接触射线情况,全国放射科医⽣的全部组成为( A )A.研究总体B.⽬标总体C.研究样本D.⽬标样本4. 若以舒张压90mmHg、收缩压130 mmHg为⾼⾎压阳性临界点,调查3000⼈中有300名⾎压超过临界值,这份资料属于:( B )A. 定量资料B. 分类资料C. 等级资料D. 离散型变量5. 下列属于统计量的指标是( C )A 总体均数B 总体标准差C 样本标准差D 总体率6. 调查某地区⾼⾎压的患病情况,抽样调查了2000名居民,得到了2000对舒张压与收缩压的数据,请问此资料是:( C )A 分类资料B等级资料 C 定量资料D分析后才知7. 下列属于参数的指标是( D )A 样本均数B 样本率C 样本标准差D总体标准差8. ⽤样本做统计推断,样本应是( B )A. 总体中典型⼀部分B. 总体中有代表性⼀部分C. 总体中任意⼀部分D. 总体中信息明确⼀部分9. 统计推断的内容为( D )A. ⽤样本指标估计相应的总体指标B. 检验统计上的“检验假设”C. A和B均不是D. A和B均是10. 随机调查社区2000⼈,得到平均体重为60公⽄,则该资料属于( A )A. 计量资料B. 总体资料C. 计数资料D. 等级资料⼆、名词解释1.抽样误差:由于总体中各观察单位间存在个体变异,抽样研究中抽取的样本,只包含总体的⼀部分观察单位,因⽽样本指标不⼀定恰好等于相应的总体指标。
样本指标与总体指标的差异称为抽样误差。