南医大医学统计学期末题目
- 格式:pdf
- 大小:208.26 KB
- 文档页数:5
医学统计学试题及答案医学统计学》课程考试试题(A卷)评卷总分:100分,考试时间:120分钟,考核方式:闭卷一、选择题(每题1分,共62分,只选一个正确答案)1、医学科研设计包括哪些方面?(D)A.物力和财力设计B.数据与方法设计C.理论和资料设计D.专业与统计设计2、医学统计资料的分析包括哪些方面?(D)A.数据分析与结果分析B.资料分析与统计分析C.变量分析与变量值分析D.统计描述与统计推断3、医学资料的同质性指的是什么?(D)A.个体之间没有差异B.对比组间没有差异C.变量值之间没有差异D.研究事物存在的共性4、离散型定量变量的测量值指的是什么?(D)A.可取某区间内的任何值B、可取某区间内的个别值C.测量值只取小数的情况D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是什么?(A)A.无序二分类变量B、定量变量C.等级变量D.无序多分类变量6、计量资料编制频数表时,组距的选择与什么有关?(D)A.越大越好B.越小越好C.与变量值的个数无关D.与变量值的个数有关7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选什么?(D)A.极差B.方差C.标准差D.变异系数8、若要用方差描述一组资料的离散趋势,对资料的要求是什么?(D)A.未知分布类型的资料B.等级资料C.呈倍数关系的资料D.正态分布资料9、频数分布两端没有超限值时,描述其集中趋势的指标也可用什么?(D)A.标准差B.几何均数C.相关系数D.中位数10、医学统计工作的步骤是什么?(A)A、研究设计、收集资料、整理资料和分析资料B、计量资料、计数资料、等级资料和统计推断C、研究设计、统计分析,统计描述和统计推断D、选择对象、计算均数、参数估计和假设检验11、下列关于变异系数的说法,哪个是正确的?(A)A.没有度量衡单位的系数B.描述多组资料的离散趋势C.其度量衡单位与变量值的度量衡单位一致D、其度量衡单位与方差的度量衡单位一致12、10名食物中毒的病人潜伏时间(小时)分别为3.4,5,3,2,5.5,2.5,6,6.5.7,其中位数是多少?(B)A.4B.4.5C.3D.213、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描述这组资料离散趋势的指标最好为什么?(C)A.全距B.四分位数间距C.标准差D.方差14、当在正态分布曲线下,均值不变,而标准差变大时,曲线的形态会变得更加矮胖,但中心位置不会改变。
《医学统计学》期末考试试卷一.单选题(每小题1.5分,共60分)1.卫生统计工作的步骤为() [单选题] *A.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料(正确答案)D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有() [单选题] *A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断(正确答案)E.统计描述和统计图表3.统计资料的类型包括() [单选题] *A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料(正确答案)4.抽样误差是指() [单选题] *A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别(正确答案)C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指() [单选题] *A.任意想象的研究对象的全体(正确答案)B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用() [单选题] *A.全距B.标准差C.变异系数D.四分位数间距(正确答案)E.方差7.用均数与标准差可全面描述其资料分布特点的是() [单选题] *A.正偏态分布B.负偏态分布C.正态分布和近似正态分布(正确答案)D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用() [单选题] *A.变异系数(正确答案)B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是() [单选题] *A.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势(正确答案)D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有() [单选题] *A.算术均数=几何均数B.算术均数=中位数(正确答案)C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为() [单选题] *A.μ+σB.μσC.μ+σD.μ+σ(正确答案)E.μσ12.下列哪个变量为标准正态变量() [单选题] *A.B.C.D.(正确答案)E.13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指() [单选题] *A.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围(正确答案)D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t分布() [单选题] *A.B.C.D.E. (正确答案)15.统计推断的主要内容为() [单选题] *A.统计描述与统计图表B.参数估计和假设检验(正确答案)C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指() [单选题] *A.B. (正确答案)C.D.E.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大() [单选题] *A.变异系数B.标准差C.标准误(正确答案)D.极差E.四分位数间距18.两样本比较作t检验,差别有显著性时,P值越小说明() [单选题] *A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同(正确答案)D.越有理由认为两样本均数不同E. I型错误越大19.在假设检验中,P值和的关系为() [单选题] *A.P值越大,值就越大B.P值越大,值就越小C. P值和值均可由研究者事先设定D. P值和值都不可以由研究者事先设定E. P值的大小与值的大小无关(正确答案)20.假设检验中的第二类错误是指() [单选题] *A.拒绝了实际上成立的B.不拒绝实际上成立的C.拒绝了实际上成立的D.不拒绝实际上不成立的(正确答案)E.拒绝时所犯的错误21.多组均数的两两比较中,若不用q检验而用t检验,则() [单选题] *A. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大(正确答案)D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对22.说明某现象发生强度的指标为() [单选题] *A.构成比B.相对比C.定基比D.环比E. 率(正确答案)23.对计数资料进行统计描述的主要指标是() [单选题] *A.平均数B.相对数(正确答案)C.标准差D.变异系数E.中位数24.构成比用来反映() [单选题] *A.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重(正确答案)D.表示某一现象在时间顺序的排列E.上述A与C都对25.下列哪一指标为相对比() [单选题] *A. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数(正确答案)26.两个样本率差别的假设检验,其目的是() [单选题] *A.推断两个样本率有无差别B.推断两个总体率有无差别(正确答案)C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同27.用正态近似法进行总体率的区间估计时,应满足() [单选题] *A. n足够大B. p或(1-p)不太小C. np或n(1-p)均大于5D. 以上均要求(正确答案)E. 以上均不要求28.由两样本率的差别推断两总体率的差别,若P〈,则() [单选题] *A.两样本率相差很大B.两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义(正确答案)E. 其中一个样本率和总体率的差别有统计意义29.假设对两个率差别的显著性检验同时用u检验和检验,则所得到的统计量u 与的关系为()u值较值准确 [单选题] *A.u值较值准确B. 值较u值准确C.u=D. u=(正确答案)E. =30.四格表资料中的实际数与理论数分别用A与T表示,其基本公式与专用公式求的条件为() [单选题] *A. A≥5B. T≥5C. A≥5 且T≥5D. A≥5 且n≥40E. T≥5 且n≥40(正确答案)31.三个样本率比较得到>,可以为() [单选题] *A.三个总体率不同或不全相同(正确答案)B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同32.四格表检验的校正公式应用条件为() [单选题] *A. n>40 且T>5B. n<40 且T>5C. n>40 且 1(正确答案)D. n<40 且1E. n>40 且T<133.下述哪项不是非参数统计的优点() [单选题] *A.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验(正确答案)E.适用于未知分布型资料34.秩和检验和t检验相比,其优点是() [单选题] *A. 计算简便,不受分布限制(正确答案)B.公式更为合理C.检验效能高D.抽样误差小35.等级资料比较宜用() [单选题] *A. t检验B. u检验C.秩和检验(正确答案)D. 检验E. F检验36.从文献中得到同类研究的两个率比较的四格表资料,其检验结果为:甲文,乙文,可认为() [单选题] *A.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信(正确答案)D.乙文结果更可信E.甲文说明总体间的差别更大37.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用() [单选题] *A.普通线图(正确答案)B.直方图C.统计地图D.半对数线图E.圆形图38.调查某地高血压患者情况,以舒张压≥90mmHg为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:() [单选题] *A.计量资料B.计数资料(正确答案)C.多项分类资料D.等级资料E.既是计量资料又是分类资料39. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。
一、名词解释1总体与样本总体:指根据研究目的确定的同质的所有研究对象的某项或某几项指标测量值的集合。
根据总体集合所包括的元素分为有限总体和无限总体。
样本:指以某种方式按预先规定的概率从总体中随机抽取的、足够数量的、能代表总体分布特征的一部分观察单位某指标数据的集合。
联系:根据研究目的,从总体中抽取的部分有代表性的样本,可用样本统计量推断总体参数。
2标准差与标准误标准差(S ):描述一个变量的所有观察值与均数的平均离散程度的指标。
表示单个观测值对某均数的离散程度,用于描述观测值的变异范围。
标准差越大表明数据的离散程度越大。
变量值的标准差()21x xS n -∑=-,阳性结果标准差()1S np p =-标准误:描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度,相当于多个样本均数的标准差,反映的是样本均数之间的变异。
表示样本统计量对总体参数的离散程度,用于推断估计总体参数的可信区间和假设检验。
标准误越大表明样本的统计值越差,样本对总体的代表性越差。
样本均数的标准误S X S n=,样本阳性率的标准误S p ()1p p n-= 3.X ±1.96S 与X ±t 0.05/2,v S XX 即算术平均数,描述一个变量的所有观察值的平均水平,适用于频数分布对称数据。
S 即标准差,描述一个变量的所有观察值与均数的平均离散程度。
S X 即标准误,反映样本均数间的离散程度和样本均数与相应总体均数间的差异,是说明均数抽样误差大小的指标。
t0.05/2,v 表示双侧尾部面积为0.05,自由度为v 的t 界值。
X ±1.96S :表示从正态总体中抽大样本,观测值95%的波动范围,常用来制定参考值范围,判断某人的某一指标是否正常。
X ±t 0.05/2,v S X :表示从正态总体中抽大样本或小样本,总体均数95%的可信区间(置信区间),表示该区间有95%的可能性包含总体均数。
《医学统计学》期末考试试卷附答案一、单项选择题(每小题3分,共20小题,共60分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制()A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述( )资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是()A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用()A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是()A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6.男性吸烟率是女性的10倍,该指标为()A.相对比B.构成比C.定基比D.率7.统计推断的内容为()A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验()A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是()A.n1+ n2B. n1+ n2 –1C. n1+ n2 +1D. n1+ n2 -210、标准误反映()A 抽样误差的大小B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的( )A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?()A.tr>tbB. tr<tbC. tr= tbD. 二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验()A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为()A各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
(一)单项选择题3.抽样的目的是(b )。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例研究误差 D. 研究总体统计量4.参数是指(b )。
A.参与个体数 B. 总体的统计指标C.样本的统计指标 D. 样本的总和5.关于随机抽样,下列那一项说法是正确的( a )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后( b )。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用( a )。
A.变异系数B.差C.极差D.标准差8.以下指标中(d)可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差9.偏态分布宜用(c)描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距10.各观察值同乘以一个不等于0的常数后,(b)不变。
A.算术均数 B.标准差C.几何均数D.中位数11.( a )分布的资料,均数等于中位数。
A.对称B.左偏态C.右偏态D.偏态12.对数正态分布是一种( c )分布。
A.正态B.近似正态C.左偏态D.右偏态13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距14.( c )小,表示用该样本均数估计总体均数的可靠性大。
A. 变异系数B.标准差C. 标准误D.极差15.血清学滴度资料最常用来表示其平均水平的指标是( c )。
A. 算术平均数B.中位数C.几何均数D. 平均数16.变异系数CV的数值( c )。
A. 一定大于1B.一定小于1C. 可大于1,也可小于1D.一定比标准差小17.数列8、-3、5、0、1、4、-1的中位数是( b )。
《医学统计学》期末考试试卷附答案一、单项选择题(每小题3分,共20小题,共60分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制()A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述( )资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是()A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用()A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是()A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6.男性吸烟率是女性的10倍,该指标为()A.相对比B.构成比C.定基比D.率7.统计推断的内容为()A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验()A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是()A.n1+ n2B. n1+ n2 –1C. n1+ n2 +1D. n1+ n2 -210、标准误反映()A 抽样误差的大小B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的( )A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?()A.tr>tbB. tr<tbC. tr= tbD. 二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验()A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为()A各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
《医学统计学》期末模拟考试题(四)学号______________ 姓名______________ 班级______________ 成绩____________一、是非题(每题1分,共20分)1. 预试验的样本标准差s越小,所需样本含量越大。
()2. 等级相关系数的大小不可以反映两个现象间关系的密切程度。
()3. 在配对资料秩和检验中,两组数据统一从小到大编秩次。
()4. 对3个地区居民的血型构成作抽样调查后研究其差别,若有一个理论数小于5大于1,其余都大于5,可直接作χ2检验。
()5. 总例数等于60,理论数都大于5的四格表,对两个比例的差别作统计检验,不可用确切概率法。
()6. 双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。
()7. 随机区组方差分析中,只有当区组间差别的F检验结果P>0.05时,处理组间差别的F检验才是真正有意义的。
()8. 完全随机设计资料方差分析中要求各组均数相差不大。
()9. 两次t检验都是对两样本均数的差别作统计检验,一次P<0.01,另一次P<0.05,就表明前者两样本均数差别大,后者两样本均数相差小。
()10. 如果把随机区组设计资料用完全随机设计方差分析法作分析,前者的区组SS+误差SS等于后者的组内SS。
()11. 两分类Logistic回归模型的一般定义中,因变量(Y)是0~1变量。
()12. 作两样本均数差别的比较,当P<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。
()<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。
()13. 方差分析的目的是分析各组总体方差是否不同。
()14. 在两组资料比较的秩和检验中,T值在界值范围内则P值小于相应的概率。
()值在界值范围内则P值小于相应的概率。
()15. 无论什么资料,秩和检验的检验效率均低于t检验。
()检验。
()16. 分类资料的相关分析中,检验的P值越小,说明两变量的关联性越强。
硕士研究生《卫生统计学》期末考试模拟题一、是非题(每题1 分,共20 分)1. 用配对t 检验检验两总体均数是否相等时, 也可用配伍组的方差分析来分析, 两者是等价的。
( )2. 对多个总体率有无差别做假设检验时,如果P< 0.05,则拒绝H),差别有统计学意义,可认为各样本率总的来说有差别, 但不能认为两两之间都有差别。
( )3. 偏倚是指在试验中由于某些非实验因素的干扰所形成的系统误差,歪曲了处理因素的真实效应。
( )4. 成组设计两样本比较的秩和检验, 当样本含量不等时, 选择样本含量较小组的秩和作为统计量。
( )5•做t检验时,如果t > t0.05,v ,则P< 0.05,差别无统计学意义,可认为两总体均数不相等。
2的检验,当n A 40,T> 5时,只能用四格表x2检验的专用公式,不能用确切概率法。
()6. 四格表x的检验,当n A 40, T A 5时,只能用四格表x 2检验的专用公式,不能用确切概率法。
()7. Logistic 回归中, 因变量可为二分类, 多分类或等级资料。
( )8. 期望寿命也是经过标准化得到的数值, 由于标准选取不同, 得到的标化数据也不同, 所以不同国家的期望寿命不可进行比较。
( )9. 平均死亡年龄和用寿命表法计算的预期寿命是一样的。
( )10. 机械抽样和立意抽样属于非概率抽样。
( )11. 样本含量的估计需要事先确定的是12. 多个样本比较的秩和检验,用K-WH 检验,当样本含量足够大时,可用z 检验近似。
()13. 同一资料,有 。
()14. 发病率高的疾病称为多见病。
( )15. Logistic 回归可用于筛选疾病的危险因素。
()20. 如果要控制其他变量的影响,看某两个变量的相关性,可用偏相关进行分析。
()、选择题(每题 1分,共20 分)1. 用两种药物治疗冠心病病人,结果见下表。
问两种药物治疗冠心病的疗效是否不同,较 好的统计方法是 _______a. R x C 表x 2检验b. Wilcox on 秩和检验c. Pearson 直线相16. 对于单向有序行列表,如果要做优劣检验,2检验中,x 2值越大,P 值越小, 17四格表的x大,P 值越小,说明两总体率的差别越大。
考点记忆1、定量资料、定性资料、等级资料分析(t检验、秩和检验、χ2检验);2、相关与回归的分析,r 与b 的联系、区别、公式计算及表达意义;3、stata软件分析结果的理解(特别重要,英文要看得懂,分值也大!)题型:选择、名解、计算题(包括stata结果分析)、问答题。
计算题涉及stata结果分析t检验(假设检验过程,t检验的应用条件和不成立时如何分析数据)秩和检验(编秩,实际秩和与理论秩和计算)χ2检验回归分析直线方程和b值及意义。
名解1、检验统计量:用于假设检验计算的统计量。
2、检验效能:通常把1-β称为检验效能(也称把握度),它的意义是:当两总体确有差别时,按规定的检验水准.α能够发现该差别的能力.3、假设检验中P值:就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。
也可以在假设为真时的前提下,检验统计量大于或等于实际观测值的概率。
4、抽样误差:抽样方法本身所引起的误差。
5、剩余标准差:扣除X的影响后,Y方面的变异;或在引入回归方程后,Y方面的变异。
问答题1、直线回归与相关的区别和联系1.区别:①资料要求不同:直线回归分析中,若为可精确测量和严格控制的变量,则对应于每个的值要求服从正态分布;若、都是随机变量,则要求、服从双变量正态分布。
直线相关分析要求服从双变量正态分布;②应用目的不同:说明两变量间相关关系用相关,此时两变量的关系是平等的;说明两变量间的数量变化关系用回归,用以说明如何依赖于的变化而变化;③指标意义不同:说明具有直线关系的两变量间相互关系的方向与密切程度;表示变化一个单位时的平均变化量;④计算不同:,;⑤取值范围不同:−1≤≤1,;⑥单位不同:没有单位,有单位。
2.联系:①二者理论基础一致,皆依据于最小二乘法原理获得参数估计值;②对同一双变量资料,回归系数与相关系数的正负号一致。
>0与>0,均表示两变量、呈同向变化;同理,<0与<0,表示变化的趋势相反;③回归系数与相关系数的假设检验等价。
医学统计学试题(含部分答案)⼀、最佳选择题(每题1分,共40分)1.直⽅图可⽤于表⽰ D 。
A.某现象内部构成B.某现象地理分布C.各现象的⽐较D.某现象的频数分布E.某现象的发展速度2.求正常⼈某个指标的正常值范围在理论上要求。
A.正态分布不能⽤均数标准差法B.正态分布不能⽤百分位数法C.偏态分布不能⽤均数标准差法D.偏态分布不能⽤百分位数法E.对称分布不能⽤百分位数法3.统计推断的主要内容为 B 。
A.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测4.t分布与正态分布存在如下哪⼀种关系。
A.⼆者均以0为中⼼,左右对称B.曲线下中间95%⾯积对应的分位点均为±1.96C.当样本含量⽆限⼤时,⼆都分布⼀致D.当样本含量⽆限⼤时,t分布与标准正态分布⼀致E.当总体均数增⼤时,分布曲线的中⼼位置均向右移5.三个样本率⽐较得到χ2>χ2(0.01,2),可以为 A 。
A.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同A.发⽣概率为0的事件B.发⽣概率为1的事件C.发⽣概率未知的事件D.发⽣概率为0E.发⽣概率为0.01或0.05的事件7.下列哪⼀指标为相对⽐ E 。
A.中位数B.⼏何均数C.均数D.标准差E.变异系数8.正态分布的特点有 B 。
A.算术均数=⼏何均数B.算术均数=中位数C.⼏何均数=中位数D.算术均数=⼏何均数=中位数E.以上都没有9.下列有关四分位数间距描述中不正确的是 D 。
A.四分位数间距=P75-P25B.四分位数间距⽐极差稳定C.四分位数间距即中间50%观察值的极差D.可⽤于描述正态分布资料的变异度E.四分位数间距越⼤,表⽰变异度越⼤10.某市2008年⿇疹疫情暴发,为期1个⽉,在1600名易感者中共查出患者160⼈,则该病在该时期的为10%。
A.发病率B.患病率C.罹患率D.续发率E.感染率11.调查1000名湖北民院在校⼥⽣的⾝⾼与体重,有0<r<1,则b A 。
1.下列变量中,不属于数值变量的是____
A .坐高
B .胸围
C .血型
D .身高 2.正态分布曲线下,横轴上从均数到(μ + 1.96σ)的面积为:_____ A .95% B .45% C .47.5% D .90%
3.5人的血清滴度为:1:2,1:4,1:8,1:16,1:32,平均滴度为_____ A .1:8 B .1:lg8 C .lg (1/8) D .1:12.4
4.为了比较一组乳腺癌患者化疗后血清肌酐和血清尿素氮两指标的变异程度,可选用____
A. 标准差
B. 标准误
C. 变异系数
D. 极差 5.在同一总体随机抽样,其他条件不变,样本含量越大,则_____ A. 样本标准差越大 B. 样本标准差越小
C. 总体均数的95%可性区间越窄
D. 总体均数的95%可性区间越宽
6.连续性变量x 呈偏态分布,从该总体中反复随机抽样,随样本含量n 增大,下列哪个选项将趋向正态分布_____ A.
x
x μ
σ- B. C.
x
x x
s - D. x s μ-
7.下面关于标准误的四种说法中,哪一种最不正确?________ A. 标准误是样本统计量的标准差 B. 标准误反映重复试验准确度的高低 C. 标准误反映总体参数的波动大小 D. 标准误反映抽样误差的大小 8.统计推断的主要内容为_____
A. 统计描述与统计图表
B. 参数估计和假设检验
C. 区间估计和点估计
D. 统计预测与统计控制
9. 有两个独立随机样本,样本含量分别为n 1和n 2,在进行成组设计资料的t
σ
μ
-x
检验时,自由度是_______
A .n 1+ n 2
B .(n 1+ n 2)-1
C .(n 1-1)+( n 2-1)-1
D .(n 1-1)+( n 2-1) 10.样本均数比较的t 检验,差别有统计学意义时,P 值越小说明______ A .两样本均数差别越大 B .越有理由认为两总体均数不同
C .两总体均数差别越大
D .越有理由认为两样本均数不同
11.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小_______ A. α=0.05 B. α=0.01 C. α=0.10 D. α=0.20 12. 各观察值均加(或减)同一数后,_____ A.均数不变,标准差改变 B.均数改变,标准差不变
C.两者均改变
D.两者均不变
13. 在假设检验中,P 值和α的关系为 _______
A. P 值越大,α值就越大
B. P 值越大,α值就越小
C. P 值和α值由研究者事先设定
D. P 值与α值的大小无关
14 . 作两均数比较,已知n 1、n 2均小于30,总体方差不齐且分布呈极度偏态,宜用______
A. t 检验
B. 秩和检验
C. F 检验
D. 2χ检验
15. 三个率的比较的卡方检验,P 值小于0.01,则结论为_____
A.三个总体率均不相等;
B.三个样本率均不相等;
C.三个总体率之间肯定不等或不全相等;
D.三个总体率之间不等或不全相等。
16.配对设计的目的是_____
A.提高测量精度
B.操作方便
C.为使用t 检验
D.提高组间可比性
17 . 从文献中得到同类研究的两个率比较的四格表资料,其2
χ检验结果为:甲
文
)
1(01.02χχ>,乙文
2
)
1(05.02χχ>,可认为______
A. 两文结果有矛盾
B.两文结果基本一致
C.甲文结果更可信
D.乙文结果更可信
18. 总体
19. 参数和统计量
20. 中位数
21. 抽样误差
22. 检验效能
23. 描述数值变量资料(计量资料)的集中程度有哪些指标,有何适用条件
24.假设检验基本步骤
25. 某地1岁婴儿平均血红蛋白的95%可信区间为116.2~130.1(g/L),表示什么意义?该地1岁正常婴儿的血红蛋白95%的参考值范围为111.2~135.1(g/L),又说明了什么含义?
26. 方差分析的应用条件
27. 某医院用A、B两种仪器检测了16名健康男青年的血红蛋白含量(g/L),检测结果见下表。
问两种血红蛋白测定仪器的检测结果是否有差别。
仪器A 113 125 126 130 150 145 135 105 128 135 100 130 110 115 120 155 仪器B 140 150 138 120 140 145 135 115 135 130 120 133 147 125 114 165 (1)该资料属于什么研究设计类型?(2分)
(2)写出该假设检验的的假设?(4分)
(3)若计算得到t=2.3662,查表知双侧t0.05,15=2.131 双侧t0.05,30=2.042,
请问如何下统计结论?(4分)
28. 某医师用两种疗法治疗脑血管梗塞,结果如下表,比较两种疗法的疗效有无差别?
疗法有效无效合计有效率(%)
甲疗法 1 14 15
乙疗法10 18 28
合计11 32 43
(1)请计算有效率(填入上表中)。
(2分)
(2)请计算最小的理论数。
(2分)
(3)写出该假设检验的的假设?(2分)
(4)若计算得到2χ=4.33,校正以后的2χ=2.94,查表知
2
0.05,1
χ
=3.84,请问如何
下统计结论?(4分)
29. 某实验室观察局部温热治疗小鼠移植肿瘤的疗效,以生存日数作为观察指标,结果见表。
问两组局部温热的疗效有无差别?
实验组秩次对照组秩次
15 2
12 3
10 5
16 4
20 6
20 7
23 10
90以上8
11
12
(1)该资料属于什么试验设计?(2分)
(2)对该资料进行编秩,以便进行统计分析。
(填入上表中)(3分)
(3)请写出对两组局部温热的疗效有无差异之假设检验的假设。
(5分)。