医药数理统计第六章习题(检验假设和t检验)
- 格式:doc
- 大小:201.37 KB
- 文档页数:9
(完整word版)医药数理统计习题和答案第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A )A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用(A )A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是( A )A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为(A )(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验( C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )(A)n1+ n2(B)n1+ n2–1(C)n1+ n2 +1(D)n1+ n2 -210、标准误反映(A )A 抽样误差的大小 B总体参数的波动大小C 重复实验准确度的高低D 数据的离散程度11、最小二乘法是指各实测点到回归直线的 (C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为tr ,对回归系数检验的t值为tb,二者之间具有什么关系?(C)A tr >tbB tr<t< bdsfid="116" p=""></t<>bC tr= tbD二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D )A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为( A )A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
第一章数据的描述和整理一、学习目的和要求1. 掌握数据的类型及特性;2.掌握定性和定量数据的整理步骤、显示方法;3.掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量;4.能理解并熟练掌握样本均值、样本方差的计算;5.了解统计图形和统计表的表示及意义;6. 了解用Excel软件进行统计作图、频数分布表与直方图生成、统计量的计算。
二、内容提要(一)数据的分类(二)常用统计量1、描述集中趋势的统计量2、描述离散程度的统计量3、描述分布形状的统计量* 在分组数据公式中,m i , f i 分别为各组的组中值和观察值出现的频数。
三、综合例题解析例1.证明:各数据观察值与其均值之差的平方和(称为离差平方和)最小,即对任意常数C ,有2211()()n ni ii i x x x C ==-≤-∑∑ 证一:设 21()()ni i f C x C ==-∑由函数极值的求法,对上式求导数,得11()2()22, ()2 n ni i i i f C x C x nC f C n =='''=--=-+=∑∑令 f '(C )=0,得唯一驻点11= ni i C x x n ==∑由于()20f x n ''=>,故当C x =时f (C )y 有最小值,其最小值为21()()ni i f x x x ==-∑。
证二:因为对任意常数C 有22222211111222212()()(2)2(2)()0nn n n nii iii i i i i i ni i xx x C x nx x C x nC nx C x nC n x Cx C n x C ======---=---+=-+-=--+=--≤∑∑∑∑∑∑故有2211()()nni ii i x x x C ==-≤-∑∑。
四、习题一解答1.在某药合成过程中,测得的转化率(%)如下:94.3 92.8 92.7 92.6 93.3 92.9 91.8 92.4 93.4 92.6 92.2 93.0 92.9 92.2 92.4 92.2 92.8 92.4 93.9 92.0 93.5 93.6 93.0 93.0 93.4 94.2 92.8 93.2 92.2 91.8 92.5 93.6 93.9 92.4 91.8 93.8 93.6 92.1 92.0 90.8 (1)取组距为0.5,最低组下限为90.5,试作出频数分布表; (2)作频数直方图和频率折线图;(3)根据频数分布表的分组数据,计算样本均值和样本标准差。
第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A )A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用(A )A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是( A )A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为(A )(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验( C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D )(A)n1+ n2(B)n1+ n2–1(C)n1+ n2 +1(D)n1+ n2 -210、标准误反映(A )A 抽样误差的大小 B总体参数的波动大小C 重复实验准确度的高低D 数据的离散程度11、最小二乘法是指各实测点到回归直线的 (C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为tr ,对回归系数检验的t值为tb,二者之间具有什么关系?(C)A tr >tbB tr<tbC tr= tbD二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D )A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为( A )A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
医药数理统计课后练习题含答案本篇文档包含了医药数理统计的课后练习题,旨在帮助学生提高对医药数理统计知识的理解和应用,加深对统计学概念的掌握。
答案也一并提供,供读者参考和核对。
注:下文中,标“*”的题目为答案题目。
第一章随机变量及分布1.1 题目1.已知$\\mathrm{P}(X=2)=0.5$,$\\mathrm{P}(X=3)=0.3$,$\\mathrm{P}(X=5)=0.2$,求E(X)和$\\mathrm{Var}(X)$。
2.某电子厂生产的某型号电子管寿命服从参数为$\\lambda$的指数分布,现有样本容量为n,样本均值为$\\bar{X}$,试推断$\\lambda$的值。
3.设事件A发生的概率为p,B发生的概率为q,A与B互不相容,试证:$P(A\\cup B)=p+q$。
4.设X与Y独立,X服从正态分布$N(\\mu_{1},\\sigma_{1}^{2})$,Y服从正态分布$N(\\mu_{2},\\sigma_{2}^{2})$,定义$Z=\\alpha X+\\beta Y$,其中$\\alpha$和$\\beta$为已知常数,试求Z的分布特征。
1.2 答案1.解:$$E(X)=2\\times0.5+3\\times0.3+5\\times0.2=3.1$$$$\\mathrm{Var}(X)=( 2-3.1)^2\\times0.5+(3-3.1)^2\\times0.3+(5-3.1)^2\\times0.2=1.69$$2.解:样本均值为$\\bar{X}=\\frac{1}{n}\\sum_{i=1}^{n}X_{i}$,则$\\lambda=\\frac{1}{\\bar{X}}$,$\\bar{X}$的方差为$\\mathrm{Var}(\\bar{X})=\\frac{\\lambda^2}{n}$,因此有$$E(\\frac{1}{\\bar{X}})=\\lambda+\\frac{\\lambda^3}{n}\\mathrm{Var} (\\bar{X})=$$$$\\frac{n+1}{n}\\lambda$$3.证明:$$\\because A\\mathrm{\\ and\\ }B\\mathrm{\\ are\\disjoint,}$$$$\\therefore A\\mathrm{\\ and\\ }B\\mathrm{\\ are\\ independent.}$$$$\\mathrm{So,}P(A\\cup B)=P(A)+P(B)=p+q$$4.解:由于X和Y独立,则$$E(Z)=\\alpha E(X)+\\betaE(Y)$$$$\\mathrm{Var}(Z)=\\alpha^{2}\\mathrm{Var}(X)+\\beta^{2}\\mathrm{ Var}(Y)$$因为X和Y均服从正态分布,所以Z服从正态分布。
《医学统计学》习题集(一)单项选择题1.观察单位为研究中的( )。
A.样本 B. 全部对象C.影响因素 D. 个体2.总体是由()。
A.个体组成 B. 研究对象组成C.同质个体组成 D. 研究指标组成3.抽样的目的是()。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例研究误差 D. 研究总体统计量4.参数是指()。
A.参与个体数 B. 总体的统计指标C.样本的统计指标 D. 样本的总和5.关于随机抽样,下列那一项说法是正确的()。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.方差C.极差D.标准差8.以下指标中()可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差9.偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距10.各观察值同乘以一个不等于0的常数后,()不变。
A.算术均数 B.标准差C.几何均数D.中位数11.()分布的资料,均数等于中位数。
A.对称B.左偏态C.右偏态D.偏态12.对数正态分布是一种()分布。
A.正态B.近似正态C.左偏态D.右偏态13.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距14.()小,表示用该样本均数估计总体均数的可靠性大。
A. 变异系数B.标准差C. 标准误D.极差15.血清学滴度资料最常用来表示其平均水平的指标是()。
A. 算术平均数B.中位数C.几何均数D. 平均数16.变异系数CV的数值()。
A. 一定大于1B.一定小于1C. 可大于1,也可小于1D.一定比标准差小17.数列8、-3、5、0、1、4、-1的中位数是()。
《医学统计学》习题及答案22.假设检验中的第二类错误是指A.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.方差分析中,组内变异反映的是A. 测量误差B. 个体差异C. 随机误差,包括个体差异及测量误差D. 抽样误差E. 系统误差24.方差分析中,组间变异主要反映A. 随机误差B. 处理因素的作用C. 抽样误差D. 测量误差E. 个体差异25.多组均数的两两比较中,若不用q 检验而用t 检验,则A. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对26.说明某现象发生强度的指标为A.构成比B.相对比C.定基比D.环比E. 率27.对计数资料进行统计描述的主要指标是A.平均数B.相对数C.标准差D.变异系数E.中位数28.构成比用来反映A.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对29. 样本含量分别为1n 和2n 的两样本率分别为1p 和2p ,则其合并平均率c p 为A. 1p +2pB. (1p +2p )/2C. 21p p ⨯D.212211n n p n p n ++ E.2)1()1(212211-+-+-n n p n p n 30.下列哪一指标为相对比A. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数31.发展速度和增长速度的关系为A. 发展速度=增长速度一1B. 增长速度=发展速度一1C.发展速度=增长速度一100D.增长速度=发展速度一100E.增长速度=(发展速度一1)/10032.SMR 表示A.标化组实际死亡数与预期死亡数之比B.标化组预期死亡数与实际死亡数之比C.被标化组实际死亡数与预期死亡数之比D.被标化组预期死亡数与实际死亡数之比E.标准组与被标化组预期死亡数之比33.两个样本率差别的假设检验,其目的是A.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同34.用正态近似法进行总体率的区间估计时,应满足A. n 足够大B. p 或(1-p )不太小C. np 或n(1-p)均大于5D. 以上均要求E. 以上均不要求35.由两样本率的差别推断两总体率的差别,若P 〈0.05,则A. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义36.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为A. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u37.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为A. A ≥5B. T ≥5C. A ≥5 且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4038.三个样本率比较得到2χ>2)2(01.0χ,可以为A.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同39.四格表2χ检验的校正公式应用条件为A. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<140.下述哪项不是非参数统计的优点A.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料41.秩和检验和t 检验相比,其优点是A. 计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小42.等级资料比较宜用A. t 检验B. u 检验C.秩和检验D. 2χ检验E. F 检验43.作两均数比较,已知1n 、2n 均小于30,总体方差不齐且分布呈极度偏态,宜用A. t 检验B. u 检验C.秩和检验D. F 检验E.2χ检验44.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为A.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大45.欲比较某地区1980年以来三种疾病的发病率在各年度的发展速度,宜绘制A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图46.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图47.调查某地高血压患者情况,以舒张压≥90mmHg 为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:A.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料48. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。
医药数理统计方法第六版习题答案
第六版医药数理统计方法习题试题及答案:
1.在哪种研究中,我们可以用t检验来确定两组的时间和数量的组合?
A.单因素分析
B.双因素分析
C.重复测量分析
D.相关分析
答案:C.重复测量分析。
2.下面哪种情况可以用t检验来考察?
A.两个样本的平均数
B.一组数据的中值
C.一组数据的总和
D.两组数据的比例
答案:A.两个样本的平均数。
3.假设检验是用来:
A.检查两组样本是否相等
B.检查一组样本是否具有特定的统计特性
C.确定一组样本的平均数
D.比较一组样本的总和
答案:B.检查一组样本是否具有特定的统计特性。
4.假定检验的目的之一是检查双重限制假设,下列哪种假设是错误的:
A.样本的平均数是不变的
B.样本之间的方差是不变的
C.样本的数量是不变的
D.样本的总和是不变的
答案:D.样本的总和是不变的。
5.下列哪种类型的试验可以用卡方分析来检验?
A.实验室实验
B.研究对照组
C.双因素研究
D.观察法
答案:D.观察法。
6.下列哪种研究不能用卡方分析来检验?
A.对照研究
B.双因素实验
C.回归分析
D.实验室实验
答案:C.回归分析。
7.如何使用非参数统计?。
第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。
2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。
统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。
4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。
5答系统误差、随机测量误差、抽样误差。
系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。
6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。
第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E二、计算与分析2第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A二、计算与分析12[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。
又因血铅含量仅过大为异常,故应计算只有上限的单侧范围,即95P 。
t检验的试题及答案1. 单样本t检验的目的是:A. 比较两个独立样本的均值B. 比较两个相关样本的均值C. 比较一个样本的均值与总体均值D. 比较两个独立样本的方差答案:C2. 在进行t检验时,如果样本量较小,通常需要满足的假设是:A. 总体分布是正态的B. 总体分布是均匀的C. 总体分布是二项的D. 总体分布是泊松的答案:A3. 以下哪个选项不是t检验的前提条件?A. 独立性B. 正态性C. 方差齐性D. 样本容量答案:D4. 配对样本t检验用于检验:A. 两个独立样本的均值差异B. 两个相关样本的均值差异C. 一个样本的均值与总体均值的差异D. 两个样本的方差差异答案:B5. 独立样本t检验的计算公式为:A. t = (X̄1 - X̄2) / sqrt((S1^2 / n1) + (S2^2 / n2))B. t = (X̄1 - X̄2) / sqrt((S1^2 / n1) - (S2^2 / n2))C. t = (X̄1 - X̄2) / sqrt((S1^2 / n1) * (S2^2 / n2))D. t = (X̄1 - X̄2) / sqrt((S1^2 / n1) + (S2^2 / n2)) * sqrt((n1 - 1) * (n2 - 1))答案:A6. 如果t检验的p值小于0.05,我们通常认为:A. 有足够证据拒绝零假设B. 没有足够证据拒绝零假设C. 有足够证据支持零假设D. 没有足够证据支持零假设答案:A7. 在进行t检验时,如果样本数据不满足正态分布,可以采用以下哪种方法进行校正?A. 转换数据B. 使用非参数检验C. 增加样本量D. 重新收集数据答案:B8. 以下哪个选项是t检验的零假设?A. 两组样本的均值存在显著差异B. 两组样本的均值不存在显著差异C. 两个样本的方差存在显著差异D. 两个样本的方差不存在显著差异答案:B9. 配对样本t检验的计算公式为:A. t = (X̄1 - X̄2) / sqrt((S1^2 / n) + (S2^2 / n))B. t = (X̄1 - X̄2) / sqrt((S1^2 / n) - (S2^2 / n))C. t = (X̄1 - X̄2) / sqrt((S1^2 / n) * (S2^2 / n))D. t = (X̄1 - X̄2) / sqrt((S1^2 / n) + (S2^2 / n)) * sqrt((n - 1))答案:D10. 单样本t检验的自由度是:A. n - 1B. nC. n + 1D. n - 2答案:A。
假设检验1、答:(1)建立假设、确定检验水准α。
H 0:µ1=µ2(两组成年男性的尿2,5-己二酮含量均数相等,吸烟对成年男性尿2,5-己二酮含量无影响)H 1:µ1≠µ2(两组成年男性的尿2,5-己二酮含量均数不相等,吸烟对成年男性尿2,5-己二酮含量有影响)检验水准α=0.05(2)计算检验统计量Z 值计算两均数之差标准误的估计值:067.050/54.1125/56.1//2222212121=+=+=∧-n S n S X X σ 计算Z 值:224.35067.058.2522.232121-=-≈-=-X X X X z σ (3)确定P 值,下结论。
Z<-Z 0.05/2=-1.96,P<0.05,按α=0.05水准,拒绝H0,接受H1,统计结论为差别有统计学意义,可认为吸烟对成年男性尿2,5-己二酮含量有影响。
2、答:根据调查结果,n=1257,p=0.084,有np=105.588,n(1-p)=1151.412,均大于5,已知总体率π0=0.204。
(1)建立假设、确定检验水准α。
H 0:π=0.204(该地6岁以下儿童血清维生素A 缺乏的总体患病率与其它西部边远省份相同)H 1:π≠0.204(该地6岁以下儿童血清维生素A 缺乏的总体患病率与其它西部边远省份不同)检验水准α=0.05(2)计算检验统计量Z 值()()56.101257204.01204.0204.0084.010000-≈--=--=-=n p p z p πππσπ (3)确定P 值,下结论。
Z<-Z 0.05/2=-1.96,P<0.05,按α=0.05水准,拒绝H0,接受H1,统计结论为差别有统计学意义,可认为该地6岁以下儿童血清维生素A 缺乏的总体患病率与其它西部边远省份不同。
3、答:(1)建立假设、确定检验水准α。
H 0:π1=π2(中药和西药的药效无差别)H 1:π1≠π2(中药和西药药效有差别)检验水准α=0.05(2)计算检验统计量Z 值已知n 1=131,p 1=0.962,有效例数(n 1p 1)126例;n 2=124,p 2=0.726,有效例数(n 2p 2)90例。
第四章抽样误差与假设检验练习题一、单项选择题1. 样本均数的标准误越小说明A. 观察个体的变异越小B. 观察个体的变异越大C. 抽样误差越大D. 由样本均数估计总体均数的可靠性越小E. 由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是A. 样本不是随机抽取B. 测量不准确C. 资料不是正态分布D. 个体差异E. 统计指标选择不当3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为A. 正偏态分布B. 负偏态分布C. 正态分布D. t分布E. 标准正态分布4. 假设检验的目的是A. 检验参数估计的准确度B. 检验样本统计量是否不同C. 检验样本统计量与总体参数是否不同D. 检验总体参数是否不同E. 检验样本的P值是否为小概率5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是A. 估计总体中有95%的观察值在此范围内B. 总体均数在该区间的概率为95%C. 样本中有95%的观察值在此范围内D. 该区间包含样本均数的可能性为95%E. 该区间包含总体均数的可能性为95%答案:E D C D E二、计算与分析1.为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。
[参考答案]样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。
101.4X=, 1.5S=,450n=,0.07XS===95%可信区间为下限:/2.101.4 1.960.07101.26 XX u Sα=-⨯=-(g/L)上限:/2.101.4 1.960.07101.54 XX u Sα+=+⨯=(g/L)即该地成年男子红细胞总体均数的95%可信区间为101.26g/L~101.54g/L。
2.研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是175mg/dl,现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为207.5mg/dl,标准差为30mg/dl。
问题:①如何衡量这100名儿童总胆固醇样本平均数的抽样误差?②估计100名儿童的胆固醇平均水平的95%可信区间;③根据可信区间判断高胆固醇是否有家庭聚集性,并说明理由。
[参考答案]①均数的标准误可以用来衡量样本均数的抽样误差大小,即30S=mg/dl,100n=3.0XS===②样本含量为100,属于大样本,可采用正态近似的方法计算可信区间。
207.5X=,30S=,100n=,3XS=,则95%可信区间为下限:/2.207.5 1.963201.62 XX u Sα=-⨯=-(mg/dl)上限:/2.207.5 1.963213.38 XX u Sα+=+⨯=(mg/dl)故该地100名儿童的胆固醇平均水平的95%可信区间为201.62mg/dl~213.38mg/dl。
③因为100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平的95%可信区间的下限高于正常儿童的总胆固醇平均水平175mg/dl,提示患心脏病且胆固醇高的父辈,其子代胆固醇水平较高,即高胆固醇具有一定的家庭聚集性。
(李康)第五章t检验练习题一、单项选择题1. 两样本均数比较,检验结果05.0>P说明A. 两总体均数的差别较小B. 两总体均数的差别较大C. 支持两总体无差别的结论D. 不支持两总体有差别的结论E. 可以确认两总体无差别2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指A. 两样本均数的差别具有实际意义B. 两总体均数的差别具有实际意义C. 两样本和两总体均数的差别都具有实际意义D. 有理由认为两样本均数有差别E. 有理由认为两总体均数有差别3. 两样本均数比较,差别具有统计学意义时,P值越小说明A. 两样本均数差别越大B. 两总体均数差别越大C. 越有理由认为两样本均数不同D. 越有理由认为两总体均数不同E. 越有理由认为两样本均数相同4. 减少假设检验的Ⅱ类误差,应该使用的方法是A. 减少Ⅰ类错误B. 减少测量的系统误差C. 减少测量的随机误差D. 提高检验界值E. 增加样本含量5.两样本均数比较的t 检验和u 检验的主要差别是A. t 检验只能用于小样本资料B. u 检验要求方差已知或大样本资料C. t 检验要求数据方差相同D. t 检验的检验效能更高E. u 检验能用于两大样本均数比较 答案:D E D E B 二、计算与分析1. 已知正常成年男子血红蛋白均值为140g/L ,今随机调查某厂成年男子60人,测其血红蛋白均值为125g/L ,标准差15g/L 。
问该厂成年男子血红蛋白均值与一般成年男子是否不同? [参考答案]因样本含量n >50(n =60),故采用样本均数与总体均数比较的u 检验。
(1)建立检验假设, 确定检验水平00:μμ=H ,该厂成年男子血红蛋白均值与一般成年男子相同11μμ≠:H ,该厂成年男子血红蛋白均值与一般成年男子不同α=0.05(2) 计算检验统计量XX u μσ-===6015125140-=7.75 (3) 确定P 值,做出推断结论7.75>1.96,故P <0.05,按α=0.05水准,拒绝0H ,接受1H ,可以认为该厂成年男子血红蛋白均值与一般成年男子不同,该厂成年男子血红蛋白均值低于一般成年男子。
2. 某研究者为比较耳垂血和手指血的白细胞数,调查12名成年人,同时采取耳垂血和手指血见下表,试比较两者的白细胞数有无不同。
表 成人耳垂血和手指血白细胞数(10g/L)编号 耳垂血 手指血 1 9.7 6.7 2 6.2 5.4 3 7.0 5.7 4 5.3 5.0 5 8.1 7.5 6 9.9 8.3 7 4.7 4.6 8 5.8 4.2 9 7.8 7.5 10 8.6 7.0 116.15.3129.910.3[参考答案]本题为配对设计资料,采用配对t 检验进行分析 (1)建立检验假设, 确定检验水平H 0:μd =0,成人耳垂血和手指血白细胞数差异为零 H 1:μd ≠0,成人耳垂血和手指血白细胞数差异不为零α=0.05(2) 计算检验统计量==∑∑2,6.11dd 20.36967.0126.11===∑n d d()()912.0112126.1136.201222=--=--=∑∑n n d dS d0d d d d d d t S S μ--====672.312912.0967.0===n S d t d t =3.672>0.05/2,11t ,P < 0.05,拒绝H 0,接受H 1,差别有统计学意义,可以认为两者的白细胞数不同。
3. 分别测得15名健康人和13名Ⅲ度肺气肿病人痰中1α抗胰蛋白酶含量(g/L)如下表,问健康人与Ⅲ度肺气肿病人1α抗胰蛋白酶含量是否不同?表 健康人与Ⅲ度肺气肿患者α1抗胰蛋白酶含量(g/L)健康人Ⅲ度肺气肿患者2.73.6 2.2 3.44.1 3.7 4.35.4 2.6 3.6 1.96.8 1.7 4.7 0.6 2.9 1.9 4.8 1.3 5.6 1.5 4.1 1.7 3.3 1.3 4.3 1.3 1.9[参考答案]由题意得,107.1,323.4015.1,067.22211====S X S X ;本题是两个小样本均数比较,可用成组设计t 检验,首先检验两总体方差是否相等。
H 0:σ12=σ22,即两总体方差相等 H 1:σ12≠σ22,即两总体方差不等 α=0.05F =2122S S =22015.1107.1=1.19 ()14,1205.0F =2.53>1.19,F <()14,1205.0F ,故P >0.05,按α=0.05水准,不拒绝H 0,差别无统计学意义。
故认为健康人与Ⅲ度肺气肿病人α1抗胰蛋白酶含量总体方差相等,可直接用两独立样本均数比较的t 检验。
(1)建立检验假设, 确定检验水平210:μμ=H ,健康人与Ⅲ度肺气肿病人1α抗胰蛋白酶含量相同211μμ≠:H ,健康人与Ⅲ度肺气肿病人1α抗胰蛋白酶含量不同α=0.05(2) 计算检验统计量2)1()1(212222112-+-+-=n n S n S n S c=1.12 12121212()0||X X X X X X X X t S S -----===5.63(3) 确定P 值,做出推断结论t =5.63> 0.001/2,26t ,P < 0.001,拒绝H 0,接受H 1,差别有统计学意义,可认为健康人与Ⅲ度肺气肿病人α1抗胰蛋白酶含量不同。
4.某地对241例正常成年男性面部上颌间隙进行了测定,得其结果如下表,问不同身高正常男性其上颌间隙是否不同?表 某地241名正常男性上颌间隙(cm )身高 (cm) 例数 均数 标准差 161~ 116 0.2189 0.2351 172~1250.22800.2561[参考答案]本题属于大样本均数比较,采用两独立样本均数比较的u 检验。
由上表可知,1n =116 , 1X =0.2189 , 1S =0.2351 2n =125 , 2X =0.2280 , 2S =0.2561(1)建立检验假设, 确定检验水平210:μμ=H ,不同身高正常男性其上颌间隙均值相同211μμ≠:H ,不同身高正常男性其上颌间隙均值不同α=0.05(2) 计算检验统计量1212X X X X X X u S --==0.91 (3) 确定P 值,做出推断结论u =0.91<1.96,故P >0.05,按α=0.05水准,不拒绝H 0, 差别无统计学意义,尚不能认为不同身高正常男性其上颌间隙不同。
5.将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如下表,问两组的平均效价有无差别?表 钩端螺旋体病患者凝溶试验的稀释倍数标准株 100 200 400 400 400 400 800 1600 1600 1600 3200 3200 3200 水生株 100 100 100 200 200 200 200 400 400 800 1600[参考答案]本题采用两独立样本几何均数比较的t 检验。
t =2.689>t 0.05/2,22,P <0.05,拒绝H 0,接受H 1,差别有统计学意义,可认为两组的平均效价有差别。
6.为比较男、女大学生的血清谷胱甘肽过氧化物酶(GSH-Px)的活力是否相同,某医生对某大学18~22岁大学生随机抽查男生48名,女生46名,测定其血清谷胱甘肽过氧化酶含量(活力单位),男、女性的均数分别为96.53和93.73,男、女性标准差分别为7.66和14.97。