统计学 两样本均数比较的t检验
- 格式:ppt
- 大小:1.32 MB
- 文档页数:19
《医学统计学》期末模拟考试题(二)学号______________ 姓名______________ 班级______________ 成绩____________一.填空题(每空0.5分,共15分)1. 假设检验的基本思想是_________________和____________________。
2. 医学原始资料的类型有_______________、______________、_____________。
3. 统计工作步骤为_______________、______________、_____________、_____________。
4. 两组正态分布资料的比较,当方差不齐时,可采用的方法是,_______________________,。
,_______________________,。
5. 抽样误差的意思是_____________________________________________。
6.Ⅰ类错误的意思是________________________________________________。
7. 作两样本率的比较时,如P>0.05,则应_________无效假设,结论为__________________。
8. 直线回归分析的前提是(1)______________;(2)________________;(3)_______________;(4)___________________。
9. 实验设计的基本原则是,,,。
,,,。
10. 重复原则是指_________________________________________________。
11. 常用相对数有__________________、___________________、________________。
12. 常见病是指_____________________________高的疾病。
专题八 t 检验⒈t 检验基础t 检验是一种以t 分布为基础,以t 值为检验统计量资料的假设检验方法。
⑴t 检验的基本思想:假设在H 0成立的条件下做随机抽样,按照t 分布的规律得现有样本统计量t 值的概率为P ,将P 值与事先设定的检验水准进行比较,判断是否拒绝H 0。
⑵t 检验的应用条件:①样本含量较少(n <50);②样本来自正态总体(两样本均数比较时还要求两样本的总体方差相等,即方差齐性)。
【注】实际应用时,与上述条件略有偏离,只要其分布为单峰近似对称分布,对结果影响不大。
⑶t 检验的主要应用:①单个样本均数与总体均数的比较;②配对设计资料的差值均数与总体均数0的比较;③成组设计的两样本均数差异的比较。
⑷单样本t 检验基本公式:t=x0s x μ-=nsx 0μ- υ=n-1⒉z 检验z 分布(标准正态分布)是t 分布的特例,当样本n ≥50或者总体σ已知时用z 检验。
⑴单样本z 检验基本公式:z=nsx 0μ- 或 z=nx 0σμ-⑵单样本z 检验的步骤与单样本t 检验的基本相似。
⒊配对设计均数的比较 配对设计是为了控制某些非处理因素对实验结果的影响而采用的设计方式,应用配对设计可以减少实验误差和个体差异对结果的影响,提高统计处理的效率。
⑴配对设计的主要四种情况:①配对的两受试对象分别接受两种处理,如在动物实验中,常先将动物按照窝别、体重等配对成若干对,同一对的两受试对象随机分配到实验组和对照组,然后观察比较两组的实验结果。
②同一样品用两种不同方法测量同一指标或接受不同处理。
③自身对比,即将同一受试对象(实验或治疗)前后的结果进行比较。
④同一对象的两个部位给予不同处理。
⑵对配对资料的分析:一般用配对t 检验,其检验假设为:差值的总体均数为0即μd =0。
计算统计量的公式为:t=ns 0d d-,υ=n-1式中d 为差值的均数;s d 为差值的标准差;n 为对子数。
⑶关于自身对照(同体比较)的t 检验:①在医学研究中,我们常常对同一批患者治疗前后的某些生理、生化指标进行测量以观察疗效,对于这些资料可以按照配对t 检验。
1,T检验和F检验的由来一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。
通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。
倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝虚无假设null hypothesis,Ho)。
相反,若比较后发现,出现的机率很高,并不罕见;那我们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。
F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。
统计显著性(sig)就是出现目前样本这结果的机率。
2,统计学意义(P值或sig值)结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。
专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。
p值是将观察结果认为有效即具有总体代表性的犯错概率。
如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。
即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。
(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。
)在许多研究领域,0.05的p值通常被认为是可接受错误的边界水平。
3,T检验和F检验至於具体要检定的内容,须看你是在做哪一个统计程序。
举一个例子,比如,你要检验两独立样本均数差异是否能推论至总体,而行的t 检验。
两样本(如某班男生和女生)某变量(如身高)的均数并不相同,但这差别是否能推论至总体,代表总体的情况也是存在著差异呢?会不会总体中男女生根本没有差别,只不过是你那麼巧抽到这2样本的数值不同?为此,我们进行t检定,算出一个t检定值。
(一)最佳选择题1.两样本均数比较的t 检验,差别有统计学意义时,P 越小,说明( )。
A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同2. 甲乙两人分别从同一随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得1X 和21S ;2X 和22S ,则理论上( )。
A.12XX =B.2212S S =C.作两样本均数比较的t 检验,必然得出无统计学意义的结论D.作两样本方差比较的F 检验,必然方差齐E.由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括0 3. 在参数未知的正态总体中随机抽样,Xμ-≥( )的概率为5%。
A. 1.96σB. 1.96C. 2.58D.0.05/2, tSνE.0.05/2, XtS ν4. 某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L ,标准差为4g/L ,则其95%的参考值范围为( )。
A.74±4⨯4B.74±1.96⨯4C.74±2.58⨯4D.74±2.58⨯4÷10E. 74±1.96⨯4÷10 5. 关于以0为中心的t 分布,错误的是( )。
A. t 分布图是一簇曲线B. t 分布图是单峰分布C.当ν→∝时,t →zD. t 分布图以0为中心,左右对称E.相同ν时,|t|越大,P越大6. 在两样本均数比较的t检验中,无效假设是()。
A.两样本均数不等B.两样本均数相等C.两总体均数不等D.两总体均数相等E.样本均数等于总体均数7. 两样本均数比较作t检验时,分别取以下检验水准,以()所取第二类错误最小。
A.α=0.01B.α=0.05C.α=0.10D.α=0.20E.α=0.308. 正态性检验,按α=0.10水准,认为总体服从正态分布,此时若推断有错,其错误的概率()。
统计学两样本均数比较的t检验统计学中,两样本均数比较是一种常见的数据分析方法。
这种方法又称为t检验,主要用于比较两组数据的均值是否有显著差异。
t检验分为独立样本t检验和配对样本t检验两种。
独立样本t检验用于比较两组独立样本的均值;配对样本t检验则用于比较同一组样本在不同时间或者不同条件下均值的变化。
本文将重点介绍独立样本t检验的原理、假设检验及其应用。
独立样本t检验的原理独立样本t检验的原理基于中心极限定理,即当样本大小足够大时,样本均数的分布近似正态分布。
在均值比较问题中,我们对两个总体做出如下假设:- 零假设:两个总体的均值相等。
- 备择假设:两个总体的均值不相等。
考虑两个独立的样本,样本容量分别为n1和n2。
我们可以计算出两个样本的样本均数和样本标准差,分别记作x1、s1和x2、s2。
接下来,我们根据两个样本均数和方差的差异,计算t值。
t值可以用以下公式表示:t= (x1 - x2) / (√(s1²/n1 + s2²/n2))如果t值比较大,则说明两个样本的均值差异比较显著,从而我们可以拒绝零假设。
在独立样本t检验中,我们需要进行假设检验,以确定两个总体均值是否相等。
在进行假设检验时,我们通常会采用0.05的显著性水平,即拒绝零假设的概率为5%。
具体做法如下:1. 建立假设在进行独立样本t检验时,我们需要建立零假设和备择假设。
零假设指两个总体的均值相等,备择假设指两个总体的均值不相等。
通常,我们会先假设两个总体的均值相等,即零假设为H0: μ1 = μ2,备择假设为H1: μ1 ≠μ2。
2. 计算t值计算t值时,我们需要用到样本数据的均数、标准差和样本量。
根据公式计算出t 值。
3. 确定自由度自由度是指在样本数据中自由变动的部分,通常计算方法为自由度=(样本量1-1)+(样本量2-1)。
4. 查找t分布表在t分布表中查找对应的临界值,以确定t值是否显著。
查找时需要指定显著性水平和自由度。
u检验和t检验u检验和t检验u检验和t检验可⽤于样本均数与总体均数的⽐较以及两样本均数的⽐较。
理论上要求样本来⾃正态分布总体。
但在实⽤时,只要样本例数n 较⼤,或n⼩但总体标准差σ已知时,就可应⽤u检验;n⼩且总体标准差σ未知时,可应⽤t检验,但要求样本来⾃正态分布总体。
两样本均数⽐较时还要求两总体⽅差相等。
⼀、样本均数与总体均数⽐较⽐较的⽬的是推断样本所代表的未知总体均数µ与已知总体均数µ0有⽆差别。
通常把理论值、标准值或经⼤量调查所得的稳定值作为µ0.根据样本例数n⼤⼩和总体标准差σ是否已知选⽤u检验或t 检验。
(⼀)u检验⽤于σ已知或σ未知但n⾜够⼤[⽤样本标准差s作为σ的估计值,代⼊式(19.6)]时。
以算得的统计量u,按表19-3所⽰关系作判断。
表19-3 u值、P值与统计结论α |t|值 P值 统计结论 0.05双侧单侧 <1.96<1.645 >0.05 不拒绝H0,差别⽆统计学意义 0.05双侧单侧 ≥1.96≥1.645 ≤0.05 拒绝H0,接受H1,差别有统计学意义 0.01双侧单侧 ≥2.58≥2.33 ≤0.01 拒绝H0,接受H1,差别有⾼度统计学意义 例19.3根据⼤量调查,已知健康成年男⼦脉搏均数为72次/分,标准差为6.0次/分。
某医⽣在⼭区随机抽查25名健康成年男⼦,求得其脉搏均数为74.2次/分,能否据此认为⼭区成年男⼦的脉搏⾼于⼀般?据题意,可把⼤量调查所得的均数72次/分与标准差6.0次/分看作为总体均数µ0和总体标准差σ,样本均数x为74.2次/分,样本例数n为25. H0: µ=µ0H1: µ>µ0α=0.05(单侧检验)算得的统计量u=1.833>1.645,P<0.05,按α=0.05检验⽔准拒绝H0,可认为该⼭区健康成年男⼦的脉搏⾼于⼀般。
(⼆)t检验⽤于σ未知且n较⼩时。
医学统计学-研究生课程习题及答案2021医学统计学第一章:绪论1.总体是指研究对象的某个变量在全部同质群体中的取值。
2.统计学中所说的样本是指依照随机原则抽取总体中有代表性的一部分。
3.病人的病情分级属于等级资料。
4.华北地区家庭年医疗费用的平均支出是指华北地区所有家庭的年医疗费用。
5.想要了解研究人群中原发性高血压病(EH)的患病情况,需要考虑文化程度、高血压家族史和打鼾等因素。
第二章:1.描述一组偏态分布资料的变异度,四分位数间距是较好的指标。
2.均数和标准差可以全面描述正态分布资料的特征。
3.各观察值同加或减同一数后,标准差不变。
4.比较某地1~2岁和5~5.5岁儿童身高的变异程度,宜用变异系数。
5.偏态分布宜用中位数描述其分布的集中趋势。
6.各观察值同乘以一个不等于的常数后,变异系数不变。
7.正态分布的资料,均数等于中位数。
8.对数正态分布是一种右偏态分布。
9.标准正态分布曲线下从0到2.58的面积为49.5%。
10.当各观察值呈倍数变化时,平均数宜用几何均数。
第三章:1.均数的标准误反映了样本均数与总体均数的差异。
2.两样本均数比较的t检验,P越小,说明越有理由认为两总体均数不同。
3.甲乙两人分别从同一随机数字作为两个样本,求得其样本均数之差的总体均数95%可信区间,很可能包括。
4.某地1992年随机抽取100名健康女性,算得其血清总蛋白参考值为74±1.96×4.5.关于以0为中心的t分布,叙述错误的是相同v时,|t|越大,P越大。
6.在两样本均数比较的t检验中,无效假设为两总体均数相等。
7.两样本均数比较作t检验时,分别取一下检验水准,犯第二类错误概率最小的是α=0.30.8.正态性检验,按α=0.10水准,认为总体服从正态分布,此时若推断有错,其错误的概率等于β,而β未知。
9.采用配对t检验还是两样t检验是由试验设计方案决定。
第四章:1.完全随机设计资料的方差分析中,必然有SS总=SS组间+SS组内。
1. 用样本均数推论总体均数95%可信区间的公式是(总体标准差未知且样本量较小) A x v s t x ,05.0±2. 两个样本均数比较t 检验(α=0.05),当|t|>t 0.05,(ν)时: E 接受备择假设3. 两个样本均数比较t 检验(α=0.05),当|t|>t 0.05,(ν)时,统计结论为 CC 两总体均数不同 4. 两个样本均数比较t 检验,分别取以下检验水准,其中第二类错误最小的是 BA α=0.05B α=0.2C α=0.1D α=0.035.两个样本均数比较t 检验,无效假设是 DD 两总体均数相等6. 两个样本均数比较t 检验(α=0.05),当“拒绝H0,接受H1”时,P 值越小 EE 越有理由认为两总体均数不同7. 两个样本均数比较t 检验时,每个变量同时加上一个不为“0”的常后,其t 值 AA 变大 8. 检验效能是指A αB 1- αC βD 1-βE 以上都不对9. 第一类错误是指 A 拒绝实际上成立的H010. 第二类错误是指 D 接受实际不成立的H111. 要使两类错误同时减少的方法是 AA 增加样本量 12. 以下何种情况进行单侧检验 AA 已知A 药肯定优于B 药 13. 以下何种情况进行单侧检验 AA 已知21χχ> 14. 在进行t 检验时,P 值和α值的关系 EE α值是研究者事先确定的15. 在配对t 检验中 EE 当不拒绝H0时,差值的总体均数可信区间一定包含016.统计中所说的总体是指: AA 根据研究目的确定的同质的研究对象的全体17.概率P=0,则表示 BB 某事件必然不发生 18.抽签的方法属于 DD 单纯随机抽样 19.测量身高、体重等指标的原始资料叫:BB 计量资料 20.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果 治愈 显效 好转 恶化 死亡治疗人数 8 23 6 3 1该资料的类型是: D 有序分类资料21.样本是总体的 C 有代表性的部分 22.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤: C 整理资料23.统计工作的步骤正确的是 C 设计、收集资料、整理资料、分析资料24.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BB 系统误差25.以下何者不是实验设计应遵循的原则 D 交叉的原则26.表示血清学滴度资料平均水平最常计算 B 几何均数27.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C M28.各观察值均加(或减)同一数后: B 均数改变,标准差不变29.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24+(小时), 问该食物中毒的平均潜伏期为多少小时? C 630.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是: D 变异系数31.下列哪个公式可用于估计医学95%正常值范围 A X±1.96S32.标准差越大的意义,下列认识中错误的是 B 观察个体之间变异越小33.正态分布是以 E 均数为中心的频数分布34.确定正常人的某项指标的正常范围时,调查对象是B排除影响研究指标的疾病和因素的人35.均数与标准差之间的关系是E标准差越小,均数代表性越大36.从一个总体中抽取样本,产生抽样误差的原因是A总体中个体之间存在变异37.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
样本均数间的差别原因均数差别比较的 t检验z 总体均数不同 z 总体均数相同,差别仅仅由抽样误差引起z 一般做法是计算某个统计量(如t值),然后根据相应的概率作出推 断t检验(student’s t test)t检验常用于样本含量较小,并且总 体标准差σ未知时三种t检验 z 样本均数 X 与已知某总体均数μ0 的比较; z 两组样本均数 X 1 与 X 2 的比较; z 配对设计资料均数的比较。
t检验的应用条件z 1.当样本含量较小时(n<60),理论上要求样本为来自正态分布总体的随机 样本; z 2.当做两样本均数比较时,还要求两 总体方差相等(方差齐性,即 σ12=σ22)。
在实际工作中,若上述条件略有偏 离,仍可进行t检验分析。
一、样本均数和总体均数比较的t检验 (one sample t test)z 目的是推断样本所代表的未知总体假设检验的独特逻辑例 : 某病患者20人,其血沉 (mm/h)均数为 9.15,标准差为2.13,问是否该病患者血 沉与以往文献报道的均数10.50有差别?均数μ与已知总体均数μ0有无差 别。
z 已知的总体均数μ0一般为理论值、 标准值或经过大量观察所得的稳定 值等。
z 条件:当n较小时,要求样本来自于 正态分布总体x ± t0.05 / 2,19 s / n = 9.15 ± 2.093 × 2.13 / 20 = (8.15,10.15)11.两个假设,决策者在其中作出抉择 该病患者血沉总体均数与10.50无差别, 该病患者血沉总体均数与10.50有差别。
简写 H0:μ=10.50 H1:μ≠10.50 单凭一份样本不可能证明哪一个正确, 一般利用小概率反证法思想,从问题的对 立面出发(H0)间接判断要解决的问题(H1) 是否成立。
H0:μ=10.50H1:μ≠10.50μ = 10.50X10.50μX2. H0成立时会怎样? 所得t值因样本而 异,但其绝对值多数情况下落在0附近。
两样本均数比较的t检验在统计学中,两样本均数比较的t检验是一种常用的假设检验方法,用于比较两个样本的均值是否有显著差异。
该方法适用于两个独立样本,可以检验各种类型的数据,如定量数据和分类数据。
t检验的基本思想是通过比较两个样本的均值和方差来判断它们是否来自于同一总体。
首先,我们需要提出原假设(H0)和备择假设(H1),这两个假设相互对立。
通常情况下,原假设是两样本均值相等,备择假设是两样本均值不相等。
执行t检验的关键步骤包括计算样本均值、样本方差和t值。
首先,我们需要计算每个样本的均值和方差。
然后,根据公式计算t值,该公式将考虑样本均值之差和标准误差(用于描述均值的不确定性)。
标准误差越大,t值越小,表示差异越不显著。
最后,我们可以使用t分布表或统计软件来确定t值对应的p值。
如果p值小于预先设定的显著性水平(通常为0.05),则我们可以拒绝原假设,认为两个样本的均值有显著差异。
如果p值大于显著性水平,我们则无法拒绝原假设,即不能确定两个样本的均值是否有差异。
虽然t检验是一种常见的统计方法,但在使用过程中需要注意一些限制和前提条件。
首先,样本数据应该来自正态分布的总体。
其次,两个样本应该是独立的,没有关联。
如果样本不满足这些条件,可能会导致假设检验的结果不准确。
此外,t检验还有两种变体:配对样本t检验和独立样本t检验。
配对样本t检验是用于比较同一组体系下两个相关变量的均值是否有显著差异。
而独立样本t检验是用于比较两个不同组体系下的均值是否有显著差异。
最后,我们需要注意解读t检验的结果。
如果我们拒绝了原假设,应该认为两个样本的均值存在显著差异。
然而,这并不意味着差异的实际意义和重要性。
此外,t检验只能告诉我们两个样本均值是否有显著差异,而不能提供关于差异的具体原因和解释。
总之,两样本均数比较的t检验是一种有效的统计方法,用于比较两个独立样本的均值是否有显著差异。
通过计算t值和p值,我们可以得出结论并进行统计推断。