统计学教案习题04总体均数的估计和假设检验
- 格式:doc
- 大小:355.50 KB
- 文档页数:8
《卫生统计学》习题集上海医药高等专科学校《营养与卫生》教研组一、最佳选择题(一)基本概念与步骤1、将计量资料制作成频数表的过程,属于统计工作基本步骤。
A、统计设计B、收集资料 D、分析资料2、某地区抽查1000名成年人的血压并制作成频数表,这属于资料。
B、计数资料C、等级资料D、半定量资料3、上述调查按血压正常与否整理资料,其中高血压患者200名,血压正常者800名,这属于资料。
A、定量资料 C、等级资料 D、半定量资料4、对变异的事物可采用抽样观察,其主要目的是A、反映某个体情况B、反映某样本情况D、上述都是5、要使样本对总体具有代表性,下列是错误的措施。
A、样本与总体应同质B、样本含量应适宜C、应采用随机抽样7、与抽样误差大小无关的是A、个体变异大小B、样本含量大小C、随机抽样方法不同8、从一个总体中抽取样本,产生抽样误差的原因是B、抽样未遵循随机化原则C、被抽取的个体不同质D、组成样本的个体较少9、从4个市级医院外科病史中随机抽样,反映全市外科医护质量,你认为A、可以,抽样面广B、不可以,可能样本太小C、可以,是随机抽样10、搞好统计工作,达到预期目标,最重要的是A 、原始资料要正确B 、整理资料要全面C 、分析资料要合理11、某地区1000名儿童粪检蛔虫卵,按阳性和阴性整理汇总,这属于 资料。
A 、定量资料 C 、等级资料 D 、半定量资料12、统计学上通常认为P < 的事件,在一次观察中不会发生。
、0.1 C 、0.5 D 、1.014、由变异所导致的现象中,下列 除外。
A 、X 1≠X 2B 、1X ≠2XC 、μ≠X 1≠μ215、概率P=0,则表示B 、某事件必然发生C 、某事件发生的可能性很小D 、某事件发生的可能性很小16、要减少抽样误差,最切实可行的方法是B 、控制个体变异C 、遵循随机化原则抽样D 、严格挑选研究对象(二)计量资料统计描述(频数分析)1、X 是表示变量值 的统计指标。
第四章 总体均数的估计和假设检验一、教学大纲要求(一) 掌握内容1. 抽样误差、可信区间的概念及计算; 2. 总体均数估计的方法;3. 两组资料均数比较的方法,理解并记忆应用这些方法的前提条件; 4. 假设检验的基本原理、有关概念(如I 、II 类错误)及注意事项。
(二) 熟悉内容 两样本方差齐性检验。
(三) 了解内容1. t 分布的图形与特征;2. 总体方差不等时的两样本均数的比较; 3. 等效检验。
二、教学内容精要(一) 基本概念 1. 抽样误差抽样研究中,样本统计量与总体参数间的差别称为抽样误差(sampling error )。
统计上用标准误(standard error ,SE )来衡量抽样误差的大小。
不同的统计量,标准误的表示方法不同,如均数的标准误用X S 表示,率的标准误用S P 表示,回归系数的标准误用S b 表示等等。
均数的标准误与标准差的区别见表4-1。
表4-1 均数的标准误与标准差的区别均数的标准误标准差意义 反映的抽样误差大小 反映一组数据的离散情况 记法X σ(样本估计值X S )σ(样本估计值S )计算X σ=nσ X S =nSσ =nX 2)(∑-μS=1)(2--∑n X X控制方法增大样本含量可减小标准误。
个体差异或自然变异,不能通过统计方法来控制。
2.可信区间(1)定义、涵义:即按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(confidence interval ,CI )。
它的确切含义是:CI 是随机的,总体参数是固定的,所以,CI 包含总体参数的可能性是1-α。
不能理解为CI 是固定随机的,总体参数是随机固定的,总体参数落在CI 范围内可能性为1-α。
当0.05α=时,称为95%可信区间,记作95%CI 。
当0.01α=时,称为99%可信区间,记作99%CI 。
(2)可信区间估计的优劣:一定要同时从可信度(即1-α的大小)与区间的宽度两方面来衡量。
医学统计学最佳选择题一、绪论1.下面的变量中,属于分类变量的是A.脉搏B.血型C.肺活量D.红细胞计数E.血压2.下面的变量中,属于数值变量的是A.性别B.体重C.血型D.职业E.民族3.下列有关个人基本信息的指标,其中属于有序分类变量的是A.学历B.民族C.职业D.血型E.身高4.若要通过样本作统计推断,样本应是A.总体中典型的一部分B.总体中任意部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分5. 统计量是指A.是统计总体数据得到的量B.反映总体统计特征的量C.是根据总体中的全部数据计算出的统计指标D.是用参数估计出来的量E.是由样本数据计算出来的统计指标6.下列关于概率的说法,错误的是A.通常用P表示B.大小在0~1之间C.某事件发生的频率即概率D.在实际工作中,概率是难以获得的E.某事件发生的概率P≤时,称为小概率事件。
7.减少抽样误差的有效途径是A.避免系统误差B.控制随机测量误差C.增大样本含量D.减少样本含量E.以上都不对二、定量资料的统计描述1.用均数和标准差能用于全面描述下列哪种资料的特征A.正偏态分布B.负偏态分布C.正态分布D.对数正态分布E.任意分布2.当各观察值呈倍数变化(等比关系)时,平均数宜用A.均数B.几何均数C.中位数D.相对数E.四分位数间距3.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A. MB. GC. XD. P95E. CV4. 对于正态分布的资料,理论上A. 均数比中位数大B. 均数比中位数小C. 均数等于中位数D. 均数与中位数无法确定孰大孰小E. 以上说法均不准确5.当资料两端含有不确定值时,描述其变异度宜采用A. RB. CVC. S2D. SE. Q6.关于标准差,哪项是错误的A.反映全部观察值的离散程度B.度量了一组数据偏离均数的大小C.反映了均数代表性的好坏D.一定大于或等于零E.不会小于算术均数7.各观察值均加(或减)同一非0常数后A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变E.以上都不对8.比较身高和体重两组数据变异度大小宜采用A.方差B.标准差C.极差D.变异系数E.四分位数间距9. 横轴上,正态曲线下从σμ6-到μ的面积为.91三、定性资料的统计描述1.某病患者200人,其中男性180人,女性20人,分别占90%与10%,则结论为A 男性易患该病B 女性易患该病C 男、女性患该病概率相等D根据该资料可以计算出男、女性的患病率E 尚不能得出结论2.一种新的治疗方法不能治愈病人,但能使病人寿命延长,则会发生的情况是A该病患病率增加B该病患病率减少C该病发病率增加D该病发病率减少E该病患病率和发病率均不变。
第四章抽样误差与假设检验练习题一、单项选择题1. 样本均数的标准误越小说明A. 观察个体的变异越小B. 观察个体的变异越大C. 抽样误差越大D. 由样本均数估计总体均数的可靠性越小E. 由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是A. 样本不是随机抽取B. 测量不准确C. 资料不是正态分布D. 个体差异E. 统计指标选择不当3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为A. 正偏态分布B. 负偏态分布C. 正态分布D. t分布E. 标准正态分布4. 假设检验的目的是A. 检验参数估计的准确度B. 检验样本统计量是否不同C. 检验样本统计量与总体参数是否不同D. 检验总体参数是否不同E. 检验样本的P值是否为小概率5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是A. 估计总体中有95%的观察值在此范围内B. 总体均数在该区间的概率为95%C. 样本中有95%的观察值在此范围内D. 该区间包含样本均数的可能性为95%E. 该区间包含总体均数的可能性为95%答案:E D C D E二、计算与分析1.为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。
[参考答案]样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。
101.4X=, 1.5S=,450n=,0.07XS===95%可信区间为下限:/2.101.4 1.960.07101.26 XX u Sα=-⨯=-(g/L)上限:/2.101.4 1.960.07101.54 XX u Sα+=+⨯=(g/L)即该地成年男子红细胞总体均数的95%可信区间为101.26g/L~101.54g/L。
一、名词解释抽样误差、均数的抽样误差、标准误、可信区间二、填空题1.参数估计可分为_____点估计____ 和__区间估计______ 。
2. 在抽样研究中,当样本含量趋向无穷大时,X 趋向等于__μ___,S 趋向等于__0__,t(0.05,v) 趋向等于________ 。
3、定量资料常用的假设检验方法有 t 检验 、 u 检验 、 方差分析 。
4、方差分析可用于两个或两个以上样本均数的比较,其应用时要求,(1)正态分布;(2)方差齐。
5、标准误是 均数 的标准差,与标准差的关系可用公式 n s表示。
6、假设检验时根据检验结果作出的判断, 可能发生两种错误, 第一类错误的概率为 α,第二类错误的概率为 β , 同时减少两类错误的唯一方法是 增加样本含量 。
7、t 检验的应用条件是 正态分布 和 方差齐 。
8. 配对设计差值的t 检验无效假设是 d =0 。
9、两样本比较t 检验要求资料(1) 正态分布 ;(2) 方差齐 。
10、样本量较小的二组数值变量资料进行t 检验时,要求二组资料呈 正态分布; 方差齐。
11、数值变量数据常用的参数统计方法有 t 检验、u 检验和方差分析。
三、是非题1.在假设检验中,无论是否拒绝H 0,都有可能犯错误。
( V )2.同类研究的两组资料,n 1=n 2,则标准差大的那一组 ,μ的95%可信区间范围也一定小。
( X )3.两个同类资料的t 检验,其中P 1<0.01, 0.01﹤P 2<0.05,说明前者两样本均数之差大于后者。
( X )4.均数比较的u 检验的应用条件是n 较大或n 虽小但σ已知。
(V )5.标准误越小,表示用样本均数估计总体均数的可靠性越大。
( V )6.统计的假设是对总体特征的假设,其结论是概率性的,不是绝对的肯定或否定。
( V )7.成组设计的两样本几何均数的比较;当n 足够大时,也可以用u 检验。
(V )8.在配对T 检验中,用药前数据减去用药后的数据和用药后的数据减去用药前的数据,作T 检验后的结论是相同的。
练 习 题一、最佳选择题1.( C )小,表示用该样本均数估计总体均数的可靠性大。
A. CV B. S C. σXD. RE.四分位数间距2.两样本均数比较的t 检验,差别有统计意义时,P 越小,说明( C )。
A.两样本均数差别越大 B.两总体均数差别越大 C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同3.甲乙两人分别从随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得1X 和21S ;2X 和22S ,则理论上( E )。
A.12X X =B.2212S S =C.作两样本均数的t 检验,必然得出无差别的结论D.作两方差齐性的F 检验,必然方差齐E.由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括0 4.在参数未知的正态总体中随机抽样,X μ-≥( A )的概率为5%。
A. 1.96σ B. 1.96 C. 2.58 D.0.05, t S ν E.0.05, X t S ν 5.某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的平均数为74g/L ,标准差为4g/L ,则其95%的参考值范围(B )。
A.74±4⨯4B.74±1.96×4C.74±2.58⨯4D.74±2.58⨯4÷10E. 74±1.96⨯4÷10 6.关于以0为中心的t 分布,错误的是( E )。
A. t 分布是一簇曲线B. t 分布是单峰分布C.当ν→∝时,t →uD. t 分布以0为中心,左右对称E.相同ν时,|t|越大,P 越大7.在两样本均数比较的t 检验中,无效假设是( D )。
A.两样本均数不等 B.两样本均数相等 C.两总体均数不等D.两总体均数相等E.样本均数等于总体均数8.两样本均数比较时,分别取以下检验水准,以( E )所取第二类错误最小。
统计学习题和答案解析[完整]第一部分计量资料的统计描述一、最佳选择题1、描述一组偏态分布资料的变异度,以()指标较好。
A、全距B、标准差C、变异系数D、四分位数间距E、方差2.用均数和标准差可以全面描述()资料的特征。
A.正偏态分布 B.负偏态分布 C.正态分布D.对称分布 E.对数正态分布3.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变 B.均数改变,标准差不变C.两者均不变 D.两者均改变 E.以上都不对4.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距5.偏态分布宜用()描述其分布的集中趋势。
A.算术均数 B.标准差 C.中位数 D.四分位数间距 E.方差6.各观察值同乘以一个不等于0的常数后,()不变。
A.算术均数 B.标准差 C.几何均数 D.中位数 E.变异系数7.()分布的资料,均数等于中位数。
A.对数正态 B.正偏态 C.负偏态 D.偏态 E.正态8.对数正态分布是一种()分布。
(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)A.正态 B.近似正态 C.左偏态 D.右偏态 E.对称9.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。
A.均数 B.标准差 C.中位数 D.四分位数间距 E.几何均数10.血清学滴度资料最常用来表示其平均水平的指标是()。
A.算术平均数 B.中位数 C.几何均数 D.变异系数 E.标准差二、简答题1、对于一组近似正态分布的资料,除样本含量n外,还可计算,S和,问各说明什么?2、试述正态分布、标准正态分布及对数正态分布的某单位1999年正常成年女子血清联系和区别。
甘油三酯(mmol/L)测量结果3、说明频数分布表的用途。
4、变异系数的用途是什么?组段频数5、试述正态分布的面积分布规律。
0.6~ 10.7~ 3三、计算分析题0.8~ 91、根据1999年某地某单位的体检资料,116名正常 0.9~ 13成年女子的血清甘油三酯(mmol/L)测量结果如右表, 1.0~ 19 请据此资料: 1.1~ 25(1)描述集中趋势应选择何指标?并计算之。
(一) 单项选择题1. 标准误的英文缩写为:A .SB .SEC .X SD .SD2. 通常可采用以下那种方法来减小抽样误差:A .减小样本标准差B .减小样本含量C .扩大样本含量D .以上都不对 3. 配对设计的目的:A .提高测量精度B .操作方便C .为了可以使用t 检验D .提高组间可比性 4. 以下关于参数估计的说法不正确的是:A . 区间估计优于点估计B . 样本含量越大,参数估计准确的可能性越大C . 样本含量越大,参数估计越精确D .对于一个参数只能有一个估计值5. 关于假设检验,下列那一项说法是正确的A .单侧检验优于双侧检验B .采用配对t 检验还是成组t 检验是由实验设计方法决定的C .检验结果若P 值大于0.05,则接受H 0犯错误的可能性很小D .用u 检验进行两样本总体均数比较时,要求方差齐性6. 两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小A .α=0.05B .α=0.01C .α=0.10D .α=0.20 7. 统计推断的内容是A .用样本指标推断总体指标B .检验统计上的“假设”C .A 、B 均不是D .A 、B 均是8.当两总体方差不齐时,以下哪种方法不适用于两样本总体均数比较 A .t 检验 B .t ’ 检验 C .u 检验(假设是大样本时) D .F 检验9.甲、乙两人分别从随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得1X ,21S ,2X ,22S ,则理论上A .1X =2X ,21S =22SB .作两样本t 检验,必然得出无差别的结论C .作两方差齐性的F 检验,必然方差齐D .分别由甲、乙两样本求出的总体均数的95%可信区间,很可能有重叠(二) 名词解释1. 统计推断 2. 抽样误差3. 标准误及X σ 4. 可信区间 5. 参数估计6. 假设检验中P 的含义7.I型和II型错误8.检验效能9.检验水准(三)是非题1.若两样本均数比较的假设检验结果P值远远小于0.01,则说明差异非常大。
统计学中的参数估计与假设检验统计学是一门研究如何收集、整理、分析和解释数据的学科。
参数估计和假设检验是统计学中两个重要的概念和方法,用于推断总体参数和判断假设是否成立。
本文将详细介绍参数估计与假设检验的基本原理和应用。
一、参数估计参数估计是通过样本数据推断总体的未知参数。
在统计学中,总体是指研究对象的全体,而样本是从总体中抽取的一部分。
参数是总体的特征指标,例如均值、方差、比例等。
参数估计旨在通过样本数据对总体参数进行估计,并给出估计的精度。
参数估计分为点估计和区间估计两种方法。
点估计是通过样本数据计算得到的单个数字,用来估计总体参数的具体数值。
常见的点估计方法有最大似然估计、矩估计和贝叶斯估计等。
区间估计是通过样本数据计算得到的一个范围,该范围包含总体参数真值的概率较高。
置信区间是区间估计的一种形式,它可以用来描述估计值的不确定性。
二、假设检验假设检验是用于检验研究问题的特定假设是否成立的一种统计推断方法。
在假设检验中,我们提出一个原假设和一个备择假设,并根据样本数据对两个假设进行比较,进而判断原假设是否应该被拒绝。
原假设通常表示一种无关,即不发生预期效应或差异。
备择假设则表示研究者所期望的效应或差异。
在进行假设检验时,我们首先选择一个适当的统计检验方法,例如t检验、F检验或卡方检验等。
然后,计算出样本数据的检验统计量,并根据相关的分布理论和显著性水平进行推论。
最后,比较检验统计量与临界值,以决定是否拒绝原假设。
三、参数估计与假设检验的应用参数估计和假设检验在实际问题中有广泛的应用。
以医学研究为例,研究人员可能希望通过抽样来估计某种药物的有效剂量,并对药效进行假设检验。
在市场调研中,我们可以使用参数估计和假设检验来推断总体的需求曲线和做出市场预测。
在质量控制中,我们可以利用参数估计和假设检验来判断产品是否符合标准。
四、总结参数估计和假设检验是统计学中重要的方法,可以通过样本数据来推断总体参数和判断假设是否成立。
统计学习题区间估计与假设检验第五章一、单项选择题抽样与参数估计1、某品牌袋装糖果重量的标准是(500±5)克。
为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。
下列说法中错误的是(B)A、样本容量为10B、抽样误差为2C、样本平均每袋重量是估计量D、498是估计值2、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都服从或近似服从趋近于(D)A、N(100,25)B、N(100,5/n)C、N(100/n,25)D、N(100,25/n)3、在其他条件不变的情况下,要使置信区间的宽度缩小一半,样本量应增加(C)A、一半B、一倍C、三倍D、四倍4、在其他条件不变时,置信度(1–α)越大,则区间估计的(A)A、误差范围越大B、精确度越高C、置信区间越小D、可靠程度越低5、其他条件相同时,要使抽样误差减少1/4,样本量必须增加(C)A、1/4B、4倍C、7/9D、3倍6、在整群抽样中,影响抽样平均误差的一个重要因素是(C)A、总方差B、群内方差C、群间方差D、各群方差平均数7、在等比例分层抽样中,为了缩小抽样误差,在对总体进行分层时,应使(B)尽可能小A、总体层数B、层内方差C、层间方差D、总体方差8、一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是(D)A、简单随机抽样B、分层抽样C、等距抽样D、整群抽样9、为了了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的劳动强度和收入情况进行对比分析,有关部门需要进行一次抽样调查,应该采用(A)A、分层抽样B、简单随机抽样C、等距(系统)抽样D、整群抽样10、某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,P应选(A)A、85%B、87.7%C、88%D、90%二、多项选择题1、影响抽样误差大小的因素有(ADE)A、总体各单位标志值的差异程度B、调查人员的素质C、样本各单位标志值的差异程度D、抽样组织方式E、样本容量2、某批产品共计有4000件,为了了解这批产品的质量,从中随机抽取200件进行质量检验,发现其中有30件不合格。
第四章 总体均数的估计和假设检验一、教学大纲要求(一) 掌握内容1. 抽样误差、可信区间的概念及计算; 2. 总体均数估计的方法;3. 两组资料均数比较的方法,理解并记忆应用这些方法的前提条件; 4. 假设检验的基本原理、有关概念(如I 、II 类错误)及注意事项。
(二) 熟悉内容 两样本方差齐性检验。
(三) 了解内容1. t 分布的图形与特征;2. 总体方差不等时的两样本均数的比较; 3. 等效检验。
二、教学内容精要(一) 基本概念 1. 抽样误差抽样研究中,样本统计量与总体参数间的差别称为抽样误差(sampling error )。
统计上用标准误(standard error ,SE )来衡量抽样误差的大小。
不同的统计量,标准误的表示方法不同,如均数的标准误用X S 表示,率的标准误用S P 表示,回归系数的标准误用S b 表示等等。
均数的标准误与标准差的区别见表4-1。
表4-1 均数的标准误与标准差的区别均数的标准误标准差意义 反映的抽样误差大小 反映一组数据的离散情况 记法X σ(样本估计值X S )σ(样本估计值S )计算X σ=nσ X S =nSσ =nX 2)(∑-μS=1)(2--∑n X X控制方法增大样本含量可减小标准误。
个体差异或自然变异,不能通过统计方法来控制。
2.可信区间(1)定义、涵义:即按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(confidence interval ,CI )。
它的确切含义是:CI 是随机的,总体参数是固定的,所以,CI 包含总体参数的可能性是1-α。
不能理解为CI 是固定随机的,总体参数是随机固定的,总体参数落在CI 范围内可能性为1-α。
当0.05α=时,称为95%可信区间,记作95%CI 。
当0.01α=时,称为99%可信区间,记作99%CI 。
(2)可信区间估计的优劣:一定要同时从可信度(即1-α的大小)与区间的宽度两方面来衡量。
(二) t 分布与正态分布t 分布与标准正态分布相比有以下特点:①都是单峰、对称分布;②t 分布峰值较低,而尾部较高;③随自由度增大,t 分布趋近与标准正态分布;当ν→∞时,t 分布的极限分布是标准正态分布。
(三)总体均数的估计参数估计有点估计和区间估计两种方式。
总体均数的估计,见表4-2。
表4-2 总体均数的估计点估计区间估计意义直接用样本统计量代替总体参数。
用统计量和x 确定一个有概率意义的区间,以该区间具有较大的可信度包含总体均数。
估计 方法以X 作为估计值①小样本(x S t X να,2/-,x S t X να,2/+)②大样本(x S u X 2/α-,x S u X 2/α+) ③两总体均数差值的可信区间(21,2/21x x S t X X ---να,21,2/21x x S t X X -+-να)(四)两均数差别的比较1. 样本均数和总体均数比较的t 检验 前提:服从正态分布0H :0μμ=;1H :0μμ≠XS X t 0μ-=,1-=n ν (4-1)2. 配对设计的t 检验 前提:差值服从正态分布0H :0=d μ;1H :0≠d μddS d t μ-=, 1-=n ν (4-2)3. 成组设计的两样本均数比较的t 检验前提:两组数据均服从正态分布;两组总体方差相等 0H :21μμ=;1H :21μμ≠2121XX S X X t --=,221-+=n n ν (4-3)其中,21X X S -=⎪⎪⎭⎫⎝⎛+21211n n S c , ()()211212222112-+-+-=n n S n S n S c (4-4) 21X X S -表示两样本均数差值的标准误。
4. 单样本u 检验前提:当样本较大(如n >50)或总体0σ已知时n S X u /0μ-=(n 较大时) (4-5)nX u /00σμ-=(0σ已知时) (4-6)5. 大样本均数比较的u 检验 前提:样本足够大成组设计的两样本均数比较可用:222121x x S S X X u +-=(4-7) 6. 要推断组间没有差别或差别很小,应采用等效检验(squivalence test )。
(五)假设检验的步骤及有关概念1. 基本思想:把握“小概率事件在一次抽样试验中是几乎不可能发生”的原理。
2. 步骤:①建立假设、选用单侧或双侧检验、确定检验水准;②选用适当检验方法,计算统计量;③确定P 值并作出推断结论。
3. I 类错误:0H 为真(实际无差别),假设检验结果拒绝0H ,接受1H (推论有差别)所犯的错误称为I 类错误(type I error ),I 类错误的概率记作α。
II 类错误:1H 为真(实际有差别),假设检验结果拒绝1H ,接受0H (推论无差别)所犯的错误称为II 类错误(type II error ),II 类错误的概率记作β。
4. 1-β称为检验效能,过去称把握度(power of test ),即两总体确有差别,按α水准能发现该差别的能力。
三、典型试题分析(一) 单项选择题1.当样本含量增大时,以下说法正确的是( ) A. 标准差会变小 B. 样均数标准误会变小 C. 均数标准误会变大 D .标准差会变大答案:B[评析] 本题考点:这道题是考察均数标准误的概念。
从均数标准误的定义讲,它反映的是均数抽样误差的大小,那么样本含量越大,抽样误差应该越小。
从均数标准误的计算公式n S S x /=来看,也应是n 越大,x S 越小。
2.区间X ±2.58x S 的含义是( )A .99%的总体均数在此范围内B .样本均数的99%可信区间C .99%的样本均数在此范围内D .总体均数的99%可信区间 答案:D[评析] 本题考点:可信区间的含义。
可信区间的确切含义指的是:总体参数是固定的,可信区间包含了总体参数的可能性是α-1,而不是总体参数落在CI 范围的可能性为α-1。
本题B 、D 均指样本均数,首先排除。
A 说总体均数在此范围内,显然与可信区间的含义相悖。
因此答案为D 。
(二) 是非题1.进行两均数差别的假设检验时,当P ≤0.05时,则拒绝0H ;当P >0.05时,则接受0H ,认为两总体均数无差别。
[评析] 答案:错误。
当P ≤0.05,拒绝0H 时,我们是依据α这一小概率来下结论的。
而当P >0.05时,我们对两总体均数无差别这一结论无任何概率保证,因此不能贸然下无差别的结论。
正确的说法是,按所取检验水准α,接受1H 的统计证据不足。
2.通常单侧检验较双侧检验更为灵敏,更易检验出差别,应此宜广泛使用。
[评析] 答案:错误。
根据专业知识推断两个总体是否有差别时,是甲高于乙,还是乙高于甲,当两种可能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或者研究者仅关心其中一种可能时,可选用单侧。
一般来讲,双侧检验较为稳妥。
单侧检验,应以专业知识为依据,它充分利用了另一侧的不可能性,故检出率高,但应慎用。
3.只要增加样本含量到足够大,就可以避免I 和II 型错误。
[评析] 答案:错误。
因为通过假设检验推断出的结论具有概率性,因此出现错误判断的可能性就一定存在,无论用任何方法也不能消除这一可能。
但是,我们可以使错误判断的可能性尽量地小,比如样本含量越大,犯I 和II 类错误的可能性越小。
(三) 简答题1. 简述可信区间在假设检验问题中的作用。
[评析]可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。
可信区间只能在预先规定的概率即检验水准α的前提下进行计算,而假设检验能够获得一较为确切的概率P 值。
故将二者结合起来,才是对假设检验问题的完整分析。
2.某医生就4-3资料,对比用胎盘浸液钩端螺旋体菌苗对328名农民接种前、后血清抗体的变化。
表4-3 328名农民血清抗体滴度及统计量X S x s0 20 40 80 160 320 640 1280免疫前人数 211 27 19 24 25 19 3 0 76.1 111.7 6.17 免疫后人数21657 76 75 5425 23 411.9 470.5 25.90t =(411.91-76.10)/2217.690.25+=12.6,按14ν=查t 界值表P <0.01,说明接种后血清抗体有增长。
问该医生在整理资料和分析资料过程中有何不妥?答: ①资料整理不当,未整理成配对资料;②统计描述指标使用不当,对于滴度的倒数不宜用算术均数、标准差,有“0”出现,也不宜算几何均数。
比较免疫前后抗体滴度的倒数,应计算中位数和四分位数间距;③不宜用t 检验。
可将抗体滴度的倒数经对数或平方根转换后,做配对t 检验(ν=327)。
(四) 计算题1. 某医院用新药与常规药物治疗婴幼儿贫血,将20名贫血患儿随机等分两组,分别接受两种药物治疗,测得血红蛋白增加量(g/L )见表4-4。
问新药与常规药的疗效有无差别?表4-4 两种药物治疗婴幼儿贫血结果治疗药物血红蛋白增加量(g/L ) 新药组 2436 25 14 26 34 23 20 15 19 解:本题属成组设计资料。
210:μμ=H 211:μμ≠H 05.0=α2121x x S X X t --=,221-+=n n νt =019.16485.27.2=,18=νP >0.05因此,根据现有资料尚不能认为新药与常规药的疗效有差别。
2.将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前后的血沉(mm/h )见表4-5。
问:(1)甲、乙两药是否均有效?(2)甲、乙两药疗效是否有别?表4-5 甲、乙两药治疗某病情况序号 1 2 3 4 5 6 7 8 9 10 甲药 治疗前 30 33 26 31 30 27 28 28 25 29 治疗后 26 29 23 30 30 24 22 25 23 23 序号 11 12 13 14 15 16 17 18 19 20 乙药治疗前 29 30 29 33 28 26 30 31 30 30 治疗后26232523232528222724(1)解:对甲、乙两药治疗数据分别采用配对t 检验,得甲药:t ==d S d / 3.2/0.611=5.237 乙药:t ==d S d / 5.0/0.9428=5.303v =9,P <0.001,按α=0.05水准,拒绝H 0,接受H 1,故可认为甲乙两药治疗前后均有差别。
(2)解:由表中资料分别求得治疗前后差值,再做两组比较。
t =2121dd S d d --=-1.602,v =18,得0.2>P >0.1,按α=0.05水准,不拒绝H 0,尚不能认为甲、乙两药疗效有差别。