医学统计学题库
- 格式:doc
- 大小:319.50 KB
- 文档页数:32
《医学统计学》习题集第一章绪论1.下面的变量中,属于分类变量的是(B )。
A.脉搏B.血型C.肺活量D.红细胞计数E.血压2.某人记录了50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg 间的20人,大于70kg的17人,此种资料本属于(A )。
A.定量资料B.分类资料C.有序资料D.二分类资料E.名义变量资料第二章定量资料的统计描述1.欲比较身高(cm)和体重(kg)哪个指标变异程度大,应采用(D )。
A.标准差B.极差C.四分位数间距D.变异系数2.已知某疾病患者10人的潜伏期(天)分别为:6,13,5,9,12,10,8,11,8,>20,其潜伏期的平均水平约为(B )天。
A.9B.9.5C.10D.10.2E.113.调查测定某地107名正常人尿铅含量(mg/L)如下:尿铅0~ 4~ 8~ 12~ 16~ 20~ 24~ 28~ 合计含量例数14 22 29 18 15 6 1 2 107 (1)描述该资料的集中趋势,宜用(B )。
A.均数B.中位数C.几何均数D.极差(2)描述该资料的离散趋势,宜用(C )。
A.极差B.变异系数C.四分位间距D.标准差第三章定性资料的统计描述1.某医院某年住院病人中胃癌患者占5%,则( B )。
A.5%是强度指标B. 5%是频率指标C. 5%是相对比指标D. 5%是绝对数2.某病患者120人,其中男性114人,女性6人,分别占95%与5%,则结论为(D )。
A.该病男性易得B.该病女性易得C.该病男性、女性易患程度相等D.尚不能得出结论3.一项新的治疗方法可延长病人的生命,但不能治愈该病,则最有可能发生的情况是(A )。
A.该病的患病率增加B.该病的患病率减少C.该病的发病率增加D.该病的发病率减少4.某市有30万人口,2002年共发现2500名肺结核患者,全年总死亡人数为3000,其中肺结核死亡98人,要说明肺结核死亡的严重程度,最好应用()。
第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A )A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用(A )A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是( A )A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为(A )(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验( C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )(A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -210、标准误反映(A )A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的(C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C)A t r>t bB t r<t bC t r= t b D二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D )A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为( A )A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
《医学统计学》习题及答案一、最佳选择题(每题共有A、B、C、D,请选出最适答案,每题1分,共50分。
)1.理论上,正态分布总体N(μ,σ)中有95%变量值X在______范围内。
A.x±1.96σB.μ±1.96σC.μ±1.96xD.x±1.96x s2.在同一总体中随机抽样,样本含量n越大,则理论上____越小。
A.样本标准差B.中位数C.标准差的抽样误差D.第95百分位数3.血清滴度(X )资料常用几何均数表示平均水平是由于_____。
A.按等比级数分组B.X近似正态分布C.lg X近似于对数正态分布D.X近似于对数正态分布4.算术均数与中位数相比,。
A.抽样误差更大B.不易受极端值的影响C.更充分利用数据信息D.更适用于分布不明及偏态分布资料5.标准正态分布是指。
A.N(μ,σ)B.N(0,0)C.N(1,1)D.N(0,1)6.以中位数表示集中趋势,资料。
A.不能用于正态分布的B.不能用于严重偏态的连续分布的C.可用于任何分布的计量D.可用于任何一种属性(分类)7.直方图可用于。
A.2001年5种疾病发病率比较B.10个年龄组患病率比较C.身高和患病率的关系分析D.描述O型血者血红蛋白含量分布8.标准正态分布中,单侧u0.05值为。
A.1.96B.0.05C.1.64D.0.0259.随机抽查某地成年女子身高,算得均数x=160cm,标准差s=5cm,则可计算变异系数CV= 。
A.160/5B.5/160C.(160/5)cmD.(5/160)cm10.标准正态分布曲线下,横轴上从-1到1.96的面积为__%。
A.>95.0B.81.64C.84.14D.68.2711.如果一批数据全是负数,则。
A.x>0,s≥0B.s<xC.x<0,s<0D.s>x12.表示。
xA.总体均数标准误B.总体均数标准误的估计值C.样本均数标准误D.样本均数标准误的估计值13.实际工作中,两均数作差别的统计检验,要求数据近似正态分布及。
医学统计学题库及答案1. 描述统计1.1 以下哪个是描述统计的目的?A. 通过样本数据估计总体参数B. 通过总体数据估计样本参数C. 掌握总体数据的整体情况D. 掌握样本数据的整体情况答案:C1.2 描述统计法可以通过以下哪种途径进行?A. 经验法B. 理论法C. 实证法D. 推理法答案:C1.3 描述统计研究的内容主要包括以下哪些方面?A. 数据的整理和分类B. 数据的测量和统计描述C. 数据的分析和解释D. 数据的比较和推断答案:A、B、C、D1.4 描述统计法分为以下哪两类?A. 单变量描述统计B. 双变量描述统计C. 多变量描述统计D. 多重描述统计答案:A、B、C、D2. 分布统计2.1 以下哪种回答正确描述了正态分布?A. 均值等于0,标准差等于1B. 均值等于1,标准差等于0C. 均值等于0,标准差大于1D. 均值等于1,标准差大于0答案:A2.2 正态分布的特点包括以下哪些?A. 对称分布B. 峰态分布C. 均匀分布D. 尖峰分布答案:A、D2.3 正态分布的标准差决定了以下哪个特征?A. 数据的离散程度B. 数据的集中程度C. 数据的偏斜程度D. 数据的峰态程度答案:A2.4 正态分布的特征值z是根据以下哪个公式计算得出的?A. z = (x - μ) / σB. z = (x - σ) / μC. z = (μ - x) / σD. z = (σ - x) / μ答案:A3. 推断统计3.1 推断统计的目的是什么?A. 通过样本数据推断总体参数B. 通过总体数据推断样本参数C. 掌握总体数据的整体情况D. 掌握样本数据的整体情况答案:A3.2 推断统计的方法主要包括以下哪些?A. 参数估计B. 假设检验C. 方差分析D. 相关分析答案:A、B、C3.3 参数估计的目的是什么?A. 估计总体参数B. 估计样本参数C. 估计总体样本参数D. 估计样本总体参数答案:A3.4 假设检验的步骤包括以下哪些?A. 对原假设提出对立假设B. 利用样本数据计算统计量的值C. 比较统计量的值与临界值D. 根据比较结果得出结论答案:A、B、C、D4. 相关分析4.1 以下哪个参数可以反映两个变量之间的关系强度?A. 相关系数B. 偏度C. 标准差D. 峰度答案:A4.2 相关系数的取值范围是什么?A. [-1, 0]B. [0, 1]C. [-∞, +∞]D. [0, +∞]答案:A、B4.3 相关系数绝对值越大表示什么?A. 两个变量之间的关系越强B. 两个变量之间的关系越弱C. 两个变量之间没有关系D. 无法确定两个变量之间的关系强弱答案:A4.4 相关分析需要满足以下哪些前提?A. 两个变量之间存在线性关系B. 两个变量之间呈正态分布C. 样本容量充足D. 数据来自独立样本答案:A、B、D这是一个医学统计学题库及答案的文档,包含了描述统计、分布统计、推断统计和相关分析等方面的问题和答案。
医学统计学试题及答案一、选择题1. 医学统计学中的描述性统计主要用来描述()。
A. 总体参数B. 样本数据C. 个体差异D. 随机误差答案:B2. 在医学研究中,双盲法的主要目的是()。
A. 增加样本量B. 控制偏倚C. 减少随机误差D. 提高治疗效果答案:B3. 下列哪种情况下,使用卡方检验是合适的?()A. 比较两个连续变量的均值B. 比较两个分类变量的分布C. 检验一个连续变量的方差D. 检验两个样本的一致性答案:B4. 在医学统计分析中,多元线性回归可以用来评估()。
A. 一个变量对另一个变量的影响B. 两个或多个变量对一个变量的影响C. 一个变量对另一个变量的影响是否显著D. 两个或多个变量之间的相关性答案:B5. 以下哪项是医学统计学中的基本概念?()A. 疾病发生率B. 疾病死亡率C. 疾病预后D. 疾病流行趋势答案:A二、填空题1. 在医学统计中,用于描述数据分布离散程度的指标是________。
答案:方差2. 为了减少样本误差,提高统计效能,医学研究中常用的抽样方法是________。
答案:分层随机抽样3. 在医学研究中,用于比较两个独立样本均值差异的统计方法是________。
答案:独立样本t检验4. 用于评估医学治疗效果的统计指标是________。
答案:治疗效果差异5. 用于描述个体在群体中的分布情况的统计图表是________。
答案:直方图三、简答题1. 请简述医学统计学在临床研究中的应用及其重要性。
医学统计学在临床研究中的应用极为广泛,它通过科学的方法对临床数据进行收集、整理、分析和解释,从而为临床决策提供依据。
其重要性体现在以下几个方面:首先,统计学可以帮助研究者正确设计研究方案,确保研究的有效性和可靠性;其次,通过统计分析,可以评估治疗效果、疾病风险和预后情况,为临床治疗提供指导;再次,统计学还能够识别和控制研究中的偏倚和误差,提高研究结果的准确性;最后,统计学方法在临床试验中尤为重要,它能够确保试验结果的客观性和科学性,为新药物或治疗方法的开发和应用提供支持。
医学统计学题库医学统计学是一门运用概率论和数理统计的原理和方法,研究医学领域中数据的收集、整理、分析和解释的学科。
它对于医学研究、临床实践、公共卫生决策等都具有重要的意义。
以下是为您精心准备的一份医学统计学题库,希望能够帮助您加深对这门学科的理解和掌握。
一、选择题1、下列关于总体和样本的说法,错误的是()A 总体是根据研究目的确定的同质观察单位的全体B 样本是从总体中随机抽取的部分观察单位C 样本量越大,对总体的代表性越好D 总体中的个体一定都在样本中2、描述一组偏态分布资料的变异程度,宜用()A 全距B 标准差C 变异系数D 四分位数间距3、正态分布曲线下,横轴上从均数μ到μ +196σ的面积为()A 475%B 45%C 95%D 975%4、两样本均数比较的 t 检验,差别有统计学意义时,P 值越小,说明()A 两样本均数差别越大B 两总体均数差别越大C 越有理由认为两总体均数不同D 越有理由认为两样本均数不同5、完全随机设计方差分析中,若处理因素无作用,则 F 值为()A 1B <1C >1D 接近于 16、对于四格表资料,当n ≥ 40 且有一个理论频数1 ≤ T < 5 时,应采用的检验方法是()A 连续性校正的χ² 检验B 直接计算概率法C 四格表确切概率法D 不能进行χ² 检验7、相关系数 r 的取值范围是()A -1 < r < 1B ∞ < r <+∞C -1 ≤ r ≤ 1D 0 ≤ r ≤ 18、在直线回归分析中,如果自变量 X 的值增加,因变量 Y 的值也随之增加,则直线的斜率()A 大于 0B 小于 0C 等于 0D 等于 19、以下关于生存分析的说法,错误的是()A 生存分析可以同时分析多个因素对生存时间的影响B 生存时间通常定义为从某种起始事件到终点事件所经历的时间C 生存分析中的终点事件只能是死亡D 生存曲线可以直观地展示不同组的生存情况10、进行多个样本均数间的多重比较时,若采用 LSD t 检验,则会()A 增大犯Ⅰ型错误的概率B 增大犯Ⅱ型错误的概率C 减小犯Ⅰ型错误的概率D 减小犯Ⅱ型错误的概率二、填空题1、统计工作的基本步骤包括________、________、________和________。
For personal use only in study and research; not for commercial use第一章 绪论习题一、选择题1.统计工作和统计研究的全过程可分为以下步骤:(D )A . 调查、录入数据、分析资料、撰写论文B . 实验、录入数据、分析资料、撰写论文C . 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料2.在统计学中,习惯上把(B )的事件称为小概率事件。
A.10.0≤PB. 05.0≤P 或01.0≤PC. 005.0≤PD.05.0≤PE. 01.0≤P 3~8A.计数资料B.等级资料C.计量资料D.名义资料E.角度资料3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。
该资料的类型是( A )。
4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。
该资料的类型是(C )。
5.空腹血糖测量值,属于( C )资料。
6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。
该资料的类型是(B )。
7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。
该资料的类型是(D )。
8. 100名18岁男生的身高数据属于(C )。
二、问答题1.举例说明总体与样本的概念.答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。
实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。
例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。
医学统计学试题及答案一、选择题(每题2分,共20分)1. 医学统计学中的“总体”是指:A. 所有可能的样本B. 所有可能的个体C. 研究中所关注的全部个体D. 研究中实际测量到的个体答案:C2. 以下哪个是参数估计的常用方法?A. 描述性统计B. 假设检验C. 点估计D. 方差分析答案:C3. 以下哪个是描述数据离散程度的统计量?A. 平均数B. 中位数C. 标准差D. 众数答案:C4. 医学统计学中的“样本”是指:A. 研究中实际测量到的个体B. 所有可能的个体C. 研究中所关注的全部个体D. 所有可能的样本答案:A5. 以下哪个是医学统计学中的“误差”?A. 抽样误差B. 系统误差C. 随机误差D. 所有选项都是答案:D6. 以下哪个是正态分布的特点?A. 均数、中位数、众数相等B. 均数大于中位数C. 中位数大于众数D. 众数大于均数答案:A7. 以下哪个是相关系数的取值范围?A. -1到1B. 0到1C. -∞到∞D. 1到∞答案:A8. 以下哪个是医学统计学中常用的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 秩和检验答案:D9. 以下哪个是医学统计学中的“效应量”?A. 样本量B. 效应大小C. 标准差D. 信度答案:B10. 以下哪个是医学统计学中的“混杂因素”?A. 研究设计中的变量B. 研究中的误差来源C. 影响研究结果的外部因素D. 研究中的随机误差答案:C二、简答题(每题5分,共20分)1. 简述医学统计学中的“假设检验”。
答案:假设检验是统计学中用于检验研究假设是否成立的一个过程。
它通常包括零假设(H0)和备择假设(H1)。
通过收集数据并进行统计分析,我们可以决定是接受零假设还是拒绝零假设,从而支持或反对研究假设。
2. 解释什么是“置信区间”。
答案:置信区间是参数估计中用来表示估计值的可信程度的一个范围。
它给出了一个区间,在这个区间内,我们相信参数的真实值有一定概率(如95%)会落在这个范围内。
医学统计学试题及答案一、选择题1. 下列哪项是医学研究中最常用的推论统计方法?A. 描述统计学B. 推论统计学C. 非参数统计学D. 相关统计学答案:B. 推论统计学2. 在医学研究中,随机分组的目的是什么?A. 减少选择偏倚B. 增加样本数量C. 提高研究效率D. 保证研究结果的可靠性答案:A. 减少选择偏倚3. 下列哪个指标可以用来描述一个连续变量的集中趋势?A. 标准差B. 方差C. 中位数D. 百分位数答案:C. 中位数4. 当两个变量之间呈强相关关系时,它们的相关系数应该接近于多少?A. 0B. 1C. -1D. 无法确定答案:B. 15. 下列哪个统计检验适用于比较两个分类变量之间的关联性?A. Pearson相关系数B. 二项分布检验C. 卡方检验D. t检验答案:C. 卡方检验二、填空题1. 在医学统计中,P值小于0.05通常被认为是_____________。
答案:统计显著2. 如果一个研究中包含了100位受试者,其中60位接受了新药物治疗,40位接受了安慰剂治疗,那么该研究的总样本容量是____________。
答案:1003. 如果一个连续变量的标准差增加,表示该变量的____________变异性。
答案:增加4. 在医学研究中,被检验的原假设通常是_____________。
答案:无效的、无差异的或无关的5. 在双盲试验中,既不知道哪个组接受了治疗,也不知道哪个组接受了安慰剂的是_____________。
答案:受试者和研究者三、简答题1. 请解释什么是置信区间。
答:置信区间是用来描述统计结果的一个区间范围,该区间给出了研究结果的不确定性程度。
通常以一定的置信水平表示,例如95%的置信区间。
在医学研究中,研究者根据样本数据计算得出一个点估计,然后通过置信区间来估计这一点估计的可靠性范围。
2. 请解释相关系数的含义和作用。
答:相关系数用于描述两个变量之间的关联程度。
相关系数的取值范围在-1到1之间。
医学统计学试题及答案试题一1.下列哪个指标可以用来描述一个集团的离散程度?A. 平均数B. 标准差C. 方差D. 中位数正确答案:B. 标准差2.下列哪个检验方法可以用来比较两组样本均数是否有显著差异?A. T检验B. 方差分析C. 卡方检验D. 相关分析正确答案:A. T检验3.在一项研究中,两组患者的年龄分别是25岁和45岁,求这两组患者的平均年龄。
正确答案:(25 + 45) / 2 = 35岁4.下列哪个指标可以表示两个变量之间的相关性?A. 相关系数B. t值C. p值D. 标准差正确答案:A. 相关系数5.下列哪个概念用于解释样本误差和总体误差之间的关系?A. 抽样误差B. 总体误差C. 推论统计学D. 样本误差正确答案:D. 样本误差试题二1.下列哪个指标可以用来度量一个诊所每周门诊量的离散程度?A. 四分位数B. 中位数C. 标准差D. 方差正确答案:C. 标准差2.如果两组样本均数的差异非常小,是否可以得出它们没有显著差异的结论?正确答案:不能。
只有在进行统计检验之后,才能得出显著差异的结论。
3.在一项抗癌药物的临床试验中,病人被随机分配到药物组和安慰剂组。
下列哪个检验方法可以用来比较两组病人的生存率?A. T检验B. 方差分析C. Log-rank检验D. 卡方检验正确答案:C. Log-rank检验4.下列哪个指标可以用来描述数据的离散程度?A. 标准差B. 相关系数C. 中位数D. 平均数正确答案:A. 标准差5.一个样本调查得出的结论是否可以推广到整个总体?正确答案:是。
通过抽样方法,对样本进行分析可以得出关于总体的推论。
试题三1.下列哪个指标可以用来度量数据的离散程度?A. 标准差B. 平均数C. Z值D. T值正确答案:A. 标准差2.在一项医学研究中,两组患者的性别比例分别是男性60%和女性40%,请问这两组患者的性别比例是否有显著差异?正确答案:可以使用卡方检验来比较两组患者的性别比例是否有显著差异。
(一)单项选择题3.抽样的目的是( b )。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例研究误差 D. 研究总体统计量4.参数是指(b )。
A.参与个体数 B. 总体的统计指标C.样本的统计指标 D. 样本的总和5.关于随机抽样,下列那一项说法是正确的( a )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后( b )。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用( a )。
A.变异系数B.差C.极差D.标准差8.以下指标中(d)可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差9.偏态分布宜用(c)描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距10.各观察值同乘以一个不等于0的常数后,(b)不变。
A.算术均数 B.标准差C.几何均数D.中位数11.( a )分布的资料,均数等于中位数。
A.对称B.左偏态C.右偏态D.偏态12.对数正态分布是一种( c )分布。
A.正态B.近似正态C.左偏态D.右偏态13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距14.( c )小,表示用该样本均数估计总体均数的可靠性大。
A. 变异系数B.标准差C. 标准误D.极差15.血清学滴度资料最常用来表示其平均水平的指标是( c )。
A. 算术平均数B.中位数C.几何均数D. 平均数16.变异系数CV的数值( c )。
A. 一定大于 1B.一定小于 1C. 可大于1,也可小于 1D.一定比标准差小17.数列8、-3、5、0、1、4、-1的中位数是( b )。
练习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
医学统计学题库及答案
一、医学统计学概念:
Q1:什么是医学统计学?
A:医学统计学是一门应用统计原理来研究和揭示医学科学中的问题的
学科。
它是发现、描述、探讨和预测医学现象的工具,也是衡量医学
的有力试剂。
Q2:医学统计学的主要目的是什么?
A:医学统计学的主要目的是确定和验证医学临床数据及其结果的可靠性。
它可以帮助我们识别潜在影响治疗结果的因素,以设计出有效的
治疗方案,并能更好地了解患者所处的状态和预后。
Q3:医学统计学的主要功能有哪些?
A:医学统计学的主要功能包括:1)收集,组织和统计医学相关数据;2)确定有效和可靠的统计检验方法;3)探究潜在的危险因素和保护
因素;4)评估治疗的有效性;5)检验不同治疗的可比性;6)比较不
同的实验结果;7)确定有效的统计方法。
二、医学统计学技术:
Q1:什么是统计推断?
A:统计推断是根据样本的数据来推断总体特征或数据的过程。
通过使
用统计推断,可以对样本数据进行分析,从而得出关于总体情况的推断、概率和决策结果。
Q2:什么是分类分析?
A:分类分析是一种用来确定个体隶属于不同分类的统计分析方法。
它
主要用于识别某些属性的变量引起的结果的影响,以及不同分类之间
的关系,其中包括单变量分类、双重分类和多重分类。
Q3:什么是多元统计分析?
A:多元统计分析是用来确定多个变量之间的关系的统计分析方法。
它
是多元回归和多元分析的总称,包括多元线性回归、多元逐步回归、
多元逻辑回归、多元非线性回归和多元ANOVA等方法。
医学统计1、医学统计学研究的对象是——[单选题]A 医学中的小概率事件B 各种类型的数据C 动物和人的本质D 有变异的医学现象E 疾病的预防与治疗正确答案:D2、用样本推论总体,具有代表性的样本通常指的是——[单选题]A 总体中最容易获得的部分个体的观测值B 在总体中随意抽取的部分个体的观测值C 挑选总体中有代表性的部分个体的观测值D 依照有利原则抽取的部分个体的观测值E 依照随机原则抽取的总体中部分个体的观测值正确答案:E3、下列观测结果属于有序数据的是——[单选题]A 收缩压测量值B 脉搏数C 住院天数D 病情程度E 四种血型正确答案:D4、随机测量误差指的是——[单选题]A 由某些固定的因素引起的误差B 由不可预知的偶然因素引起的误差C 选择样本不当引起的误差D 选择总体不当引起的误差E 由操作失误引起的误差正确答案:B5、系统误差指的是——[单选题]A 由某些固定的因素引起的误差B 由操作失误引起的误差C 样本量不够引起的误差D 样本统计量与总体参数间的误差E 由不可预知的偶然因素引起的误差正确答案:A6、抽样误差指的是——[单选题]A 由某些固定的因素引起的误差B 由操作失误引起的误差C 样本量不够引起的误差D 样本统计量与总体参数间的误差E 由不可预知的偶然因素引起的误差正确答案:D7、收集数据不可避免的误差是——[单选题]A 随机误差B 系统误差C 过失误差D 记录误差E仪器故障误差正确答案:A8、统计学中所谓的总体通常指的是——[单选题]A 自然界中的所有研究对象B 概括性的研究结果C 同质观察单位的全体D 所有的观察数据E 具有代表性意义的数据正确答案:C9、统计学中所谓的样本通常指的是——[单选题]A 可测量的生物性样品B 统计量C 某一变量的测量值D 数据中的一部分观测值E 总体中有代表性的一部分观察单位正确答案:E10、医学研究中抽样误差的主要来源是——[单选题]A 测量仪器不够准确B 检测出现错误C 统计设计不合理D 生物个体的变异E 样本选择不合适正确答案:D11、统计学的主要作用是——[单选题]A 使分析更为简单B 避免计算出现错误C 改善数据质量D 克服个体变异的影响E 探测随机现象的规律正确答案:E12、概率描述的是( C )——[单选题]A 总体具有的特征B 数据具有的特征C 随机事件发生的可能性D 数据的准确性E 随机现象的规律性正确答案:C13、概率分布表示(E )——[单选题]A 总体具有的特征B 数据具有的特征C 偶然现象发生的可能性D 某事件发生可能性大小E 随机变量的可能取值和出现的概率正确答案:E14、统计描述结果的主要表达方式是(——[单选题]A 统计指标、统计表和统计图B 描述数据特征C P值D 概率分布E 抽样误差正确答案:A15、研究尿激酶原治疗心肌梗死的疗效,以瑞替普酶作为对照,该项研究包含总体的数目是——[单选题]A 1B 2C 3D 4E 5正确答案:C16、某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是——[单选题]A 中位数B 几何均数C 均数D P百分位数E 频数分布正确答案:A17、算术均数与中位数相比,其特点是——[单选题]A 不易受极端值的影响B 能充分利用数据的信息C 抽样误差较大D 更适用于偏态分布资料E 更适用于分布不明确资料正确答案:B18、将一组定量资料整理成频数表的主要目的是——[单选题]A 化为计数资料B 便于计算C 提供原始数据D 能够更精确地检验E 描述数据的分布特征正确答案:E19、 6人接种流感疫苗一个月后测定抗体滴度为 1:20,1:40,1:80,1:80,1:160,1 :320,求平均滴度应选用的指标是——[单选题]A 均数B 几何均数C 中位数D 百分位数E 倒数的均数正确答案:B20、变异系数主要用于——[单选题]A 比较不同计量指标的变异程度B 衡量正态分布的变异程度C 衡量测量的准确度D 衡量偏态分布的变异程度E 衡量样本抽样误差的大小正确答案:A21、对于正态或近似正态分布的资料,描述其变异程度应选用的指标是——[单选题]A 变异系数B 离均差平方和C 极差D 四分位数间距E 标准差正确答案:E22、已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用——[单选题]A 全距B 标准差C 变异系数D 方差E 四分位数间距正确答案:E23、一组原始数据的分布呈正偏态分布,其数据的特点是——[单选题]A 数值离散度大B 数值离散度小C 数值偏向较大的方向D 数值偏向较小的方向E 数值分布不均匀正确答案:D24、对于正偏态分布总体,其均数与中位数的关系是——[单选题]A 均数与中位数相同B 均数大于中位数C 均数小于中位数D 两者有一-定的数量关系E 两者的数量关系不定正确答案:B25、在衡量数据的变异度时,标准差与方差相比,其主要特点是——[单选题]A 标准差小于方差B 标准差大于方差C 标准差更容易计算D 标准差更为准确E 标准差的计量单位与原始数据相同正确答案:E26、组数据改变计量单位后,其相应的标准差——[单选题]A 变大B 变小C 不改变D 变大或变小E 等于之前的标准差加上一个常数正确答案:D27、欲比较某地成年男子的舒张压和收缩压的变异程度大小,应采用的指标是——[单选题]A 标准差B 方差C 极差D 四分数间距E 变异系数正确答案:E28、比较健康人群血肌酐和尿素氮的变异水平,应采用的指标是——[单选题]A 标准差B 百分位数C 极差D 四分数间距E 变异系数正确答案:E29、中位数与算数均数相比,其特点是——[单选题]A 容易计算B 计算出的结果更为可靠C 不易受异常值影响D 更适合对称分布的数据E 由样本数据计算出的结果稳定正确答案:C30、应用百分位数P95,需要的条件是——[单选题]A 数据服从正态分布B 数据的变异较小C 不能有异常值D 样本含量比较大E 随机样本正确答案:E31、两数值变量的相关关系越强,对应的是——[单选题]A 相关系数越大B 相关系数的绝对值越大C 回归系数越大D 回归系数的绝对值越大E 相关系数检验统计量的t值越大正确答案:B32、回归分析的决定系数R越接近于1,说明——[单选题]A 相关系数越大B 回归方程的显著程度越高C 因变量的变异越大D 因变量的变异越小E 自变量对因变量的影响越大正确答案:E33、对两变量X和Y作线性相关分析,要求的条件是——[单选题]A X和Y服从双变量正态分布B X服从正态分布C Y服从正态分布D X和Y有回归关系E X和Y至少有一个服从正态分布正确答案:A34、两组资料对相同的自变量X和因变量Y作回归分析,直线回归系数b较大的一组,表示——[单选题]A 相关系数r也较大B 假设检验的P值较小C 决定系数R2较大D 决定系数R2较小E Y随X变化其数量有更大的变化正确答案:E35、1~7岁儿童可以用年龄(岁)估计体重(市斤),回归方程为Y=14+4X,若将体重换成国际单位kg,则此方程( ( )——[单选题]A 常数项改变B 回归系数改变C 常数项和回归系数都改变D 常数项和回归系数都不改变E 决定系数改变正确答案:C36、对同一资料进行线性回归与相关分析时,下列正确的情形是——[单选题]A ρ=0时,r=0B ρ>0时,b>0C r>0 时,b<0D r<0时,b<0E ρ<0时,r<0正确答案:D37、下列双变量中,适用于进行线性相关分析的是——[单选题]A 年龄与体重B 民族与血型C 体重与体表面积D 母亲文化水平与子女的智商E 工龄与患病率正确答案:C38、若直线回归系数的假设检验结果P<0.05,则可认为两变量间——[单选题]A 有密切的关系B 有一定的因果关系C 相关关系密切D 存在数量依存关系E 有较强的回归关系正确答案:D39、作线性相关分析时,当n=12,r=0.767,查r界值表r0.001/2,10=0. 823,r0.002/2,10=0.795 ,r0.005/2,10=0.750,则P值范围为——[单选题]A 0.001<P<0. 002B P<0.001C P<0. 002D P>0. 005E 0.002<P<0.005正确答案:E40、通过线性回归分析,得决定系数R2=0.49,P<0.05,这一结果说明的是——[单选题]A 两个变量具有回归关系B 一定有相关系数r=0.70C MS回归>MS残差D SS回归>SS残差E Y的总变异有49%可以由X的变化解释正确答案:E41、用最小二乘法建立线性回归方程的原则是保证各实调点到回归直线的——[单选题]A 纵向距离的离均差最小B 纵向距离的平方和最小C 垂直距离相等D 垂直距离的平方和最小E 纵向距离等于零正确答案:B42、进行线性回归分析,合理的直观分析方法是——[单选题]A 计算回归系数B 判定回归系数的性质C 计算截距或常数项D 绘制散点图E 作回归直线正确答案:D43、对同一资料进行直线回归与相关分析,回归方程为Y=a+bX,相关系数为r,则在相同的检验水准α下,两者假设检验结果的关系是——[单选题]A b显著r一定显著B a显著r一定显著C b显著r不一定显著D r显著b不一定显著E b和r检验结果近似相同正确答案:A44、对同一资料进行直线回归与相关分析,回归方程为Y=a+bX,相关系数为r,SX和SY分别为自变量和因变量的标准差,则得到的b和r关系是——[单选题]A b=rSX/SYB b=rSY/SXC b=rSYSXD r=bSXSYE r=bSY/SX正确答案:B45、利用回归方程Y=a+bX进行预测时,在一定的x取值上得到的估计值Y的含义是——[单选题]A Y的实测值B Y的最可能取值C Y的可信区间D 均值E 中位数正确答案:D46、在疾病发生危险因素的研究中,采用多变量回归分析的主要目的是——[单选题]A 节省样本B 提高分析效率C 克服共线影响D 减少异常值的影响E 减少混杂的影响正确答案:E47、多元线性回归分析中,反映回归平方和在因变量Y的总离均差平方和中所占比重的统计量是——[单选题]A 简单相关系数B 复相关系数C 偏回归系数D 回归均方E 决定系数R2正确答案:E48、对同一资料作多变量线性回归分析,若对两个具有不同个数自变量的回归方程进行比较,应选用的指标是——[单选题]A 决定系数B 相关系数C 偏回归平方和D 校正决定系数E 复相关系数正确答案:D49、多元线性回归分析中,反映自变量对因变量的作用大小的是(——[单选题]A 决定系数B 标准化偏回归系数C 偏回归平方和D 校正决定系数E 复相关系数正确答案:B50、逐步回归分析中,若增加引人的自变量,则——[单选题]A 回归平方和与残差平方和均增大B 回归平方和与残差平方和均减少C 总平方和与回归平方和均增大D 回归平方和增大,残差平方和减少E 总平方和与回归平方和均减少正确答案:D51、多元线性回归分析,对回归方程作方差分析,检验统计量F值反映了——[单选题]A 所有自变量与因变量间是否存在线性回归关系B 部分自变量与因变量间是否存在线性回归关系C 自变量与因变量间存在的线性回归关系是否较强D 自变量之间是否存在共线E 回归方程的拟合优度正确答案:A52、在多元回归分析中,若对某个自变量的值都乘以一个不为零的常数,则——[单选题]A 偏回归系数不变、标准回归系数改变B 偏回归系数改变、标准回归系数不变C 偏回归系数与标准回归系数均不改变D 偏回归系数与标准回归系数均改变E 偏回归系数和决定系数均改变正确答案:B53、在多元回归分析中,若对某个自变量的值都加上一个不为零的常数k,则——[单选题]A 截距和该偏回归系数值均不变B 该偏回归系数值为原有偏回归系数值的k倍C 该偏回归系数值会改变,但无规律D 截距改变,但所有偏回归系数值均不改变E 所有偏回归系数值均不会改变正确答案:D54、以下不是多元线性回归模型应用必须满足的条件是——[单选题]A 因变量与自变量存在线性关系B 因变量值相互独立C 残差服从正态分布D 自变量服从正态分布E 对任意一组自变量因变量具有相同方差正确答案:D55、多元线性回归中的多重共线性指的是——[单选题]A 因变量与自变量存在线性关系B 因变量与多个自变量相关C 自变量之间存在线性相关D 因变量之间存在线性相关E 因变量与部分自变量存在线性关系正确答案:C56、在数据分析阶段,控制混杂因素的方法是——[单选题]A 删除混杂因素变量B 与研究因素同时引入模型C 将数据标准化后D 对各单变量分别进行分析E 计算标准回归系数正确答案:B57、多元回归Xj的偏回归平方和Uj指的是( )——[单选题]A 混杂因素Xj的回归平方和B 单变量Xj分析得到回归平方和C 模型中包含Xj的回归平方和D 总平方和减去Xj的回归平方和E 有无Xj回归平方和的改变量正确答案:E58、标准化回归系数bj'可用于衡量自变量xj对因变量Y的作用,Sj和SY分别是两个变量的标准差,其计算公式为( )——[单选题]A bj'=bjSj/SYB bj'=bjSY/SjC bj'=bjD bj'=b(Sj/SY)^0.5E bj'=b(SY/SX)^0.5正确答案:A59、多元分析中具有k个分类的变量化作哑变量的方法是——[单选题]A 给各分类赋予k个分值B 根据分类编码进行定量C 化作k-1个0-1变量D 化作k个0-1变量E 化作k+1个0-1变量正确答案:C60、现测量了102名患有动脉硬化惠者的血脂,因变量为低密度脂蛋白与高街度脂蛋白含量比值(Y),建立的回归方程为Y=8.837+0, 014TC-0.001TG-0. 033ApoA1+0.011ApoB,假如其他指标不变,ApoB由100mg/dl增加到120m/dl,Y的平均改变量是——[单选题]A 0.110B 1.248C 20.000D 3.644E 0.220正确答案:E61、 logistic回归分析适用于因变量为()——[单选题]A 二分类变量资料B 连续型的计量资料C 正态分布资料D 正偏态分布资料E 负偏态分布资料正确答案:A62、 logistic回归模型中自变量不可以直接使用的是()——[单选题]A 二分类变量B 连续型的计量资料C 无序多分类变量D 有序分类变量E 两端无确定数值的变量正确答案:E63、条件logistic回归与非条件logistic回归的主要差别是——[单选题]A 非条件logistic 回归没有任何假定条件B 回归系数的意义不同C 参数估计的似然函数不同D 假设检验使用的统计量不同E 条件logistic 回归要求因变量服从正态分布正确答案:C64、欲研究糖尿病与年龄、高血压和肥胖之间的关系,不可以采用的检验统计量是(——[单选题]A Wald 检验统计量B 似然比检验统计量C z检验统计量D F检验统计量E 卡方检验统计量正确答案:D65、 logistic回归分析不适合应用的是(——[单选题]A 是否发生疾病的预测B 慢性病的危险因素分析C 估计近似相对危险度D 多种药物的联合作用E 传染病的危险因素分析正确答案:E66、 logistic回归系数β的流行病学意义是()——[单选题]A 比数比OR值B 相对危险度RR值C OR值的自然对数值D RR 值的自然对数E 发病率P的改变量正确答案:C67、下列资料适合作logistic 回归分析的是()——[单选题]A 身高与体重的关系B 冠心病危险因素的筛选C 传染病发病概率的估计D 男性与女性肺癌发病率的比较E 不同剂量高血压药物的作用正确答案:B68、在500名病例与500名对照的匹配别例-对照研究中,有400名病例与100名对照有暴露史。
医学统计学试题及答案一、单选题1. 医学统计学的目的是:A. 统计医学信息B. 分析医学数据C. 研究医学现象D. 应用数学方法答案:B2. 在医学研究中,常用的数据类型包括:A. 定量数据B. 定性数据C. 随机数据D. 假设数据答案:A、B3. 下列哪项属于描述性统计学的内容:A. 假设检验B. 变异系数计算C. 抽样分布D. 数据整理和展示答案:D4. 以下哪个指标可以反映一组数据的离散程度:A. 均值B. 中位数C. 标准差D. 百分位数答案:C5. 进行医学实验时,其随机分组的目的是:A. 防止数据泄露B. 确保实验结果的准确性C. 消除实验对象间的差异D. 提高实验效率答案:C二、填空题1. 样本容量越大,抽样误差越________。
答案:小2. 法定代表人同意书中要注明_________。
答案:被代表人的姓名3. 在统计学中,p值代表的是__________。
答案:假设检验的显著性水平4. 方差分析是用来比较__________。
答案:多个样本组间的均值差异5. 临床试验中的“安慰剂”是指__________。
答案:没有治疗作用的物质三、计算题1. 某药物在两组患者中的治疗效果进行比较,结果显示组A的治愈率为70%,组B的治愈率为60%。
请计算治愈率之间的风险差异,并求出其相对风险和绝对风险减少率。
答案:风险差异 = 组A治愈率 - 组B治愈率 = 70% - 60% = 10%相对风险 = 组A治愈率 / 组B治愈率= 70% / 60% ≈ 1.167绝对风险减少率 = 组B治愈率 - 组A治愈率 = 60% - 70% = -10%2. 某研究人员对100名患者的收入进行调查,得到以下数据:平均收入为5000元,标准差为1000元。
请计算收入在(5000 - 1000,5000 + 1000)这一区间内的概率。
答案:根据正态分布的性质,收入在(5000 - 1000,5000 + 1000)区间内的概率为68%。
For personal use only in study and research; not for commercial use第一章 绪论习题一、选择题1.统计工作和统计研究的全过程可分为以下步骤:(D )A . 调查、录入数据、分析资料、撰写论文B . 实验、录入数据、分析资料、撰写论文C . 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料2.在统计学中,习惯上把(B )的事件称为小概率事件。
A.10.0≤PB. 05.0≤P 或01.0≤PC. 005.0≤PD.05.0≤PE. 01.0≤P 3~8A.计数资料B.等级资料C.计量资料D.名义资料E.角度资料3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。
该资料的类型是( A )。
4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。
该资料的类型是(C )。
5.空腹血糖测量值,属于( C )资料。
6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。
该资料的类型是(B )。
7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。
该资料的类型是(D )。
8. 100名18岁男生的身高数据属于(C )。
二、问答题1.举例说明总体与样本的概念.答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。
实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。
例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。
一、名词解释正态分布、正常值范围二、填空题1.常用的离散程度的指标有极差_、四分位间距_、方差、标准差、变异系数和标准误。
2.正态曲线下从μ到μ+1.96σ范围内的面积占总面积__47.5%___。
3. 频数分布有两个重要特征:__集中趋势___ 和___离散趋势__。
4、当均数相差较大或度量衡单位不同时,不能用标准差比较两组资料变异程度的大小,应作变异系数的比较。
5、正常值指绝大多数正常人某项生理指标的波动范围。
若资料为正态分布,常用公式x±s 估计。
6.制定正常值范围的方法根据指标的分布特征而判断,可有正态分布法法和百分位数法。
7. 正态分布的两个重要参数是均数μ和标准差σ。
三、是非题1.任何正态分布资料,都可以变换成均数为0,标准差为1的标准正态分布资料。
(V )2.百分位数法确定医学参考值范围适用于任何分布型的资料。
(V )3.标准差越小,表示均数的代表性越好。
(V)4.正态分布资料或对称分布资料,理论上 x=M。
(V )5.变异系数只能比较不同计量单位资料的变异度。
(X )6.没有传染性的疾病的病人数在人群中的分布一定呈偏态分布。
(X)7.百分位数可用于描述偏态分布资料的医学参考值范围。
(V )8.正态分布中μ是位置参数,σ是变异参数(形态参数)。
(V )9、几组数据中,平均数大的组标准差也一定大。
(X)10、用x±1.96S制订出正常值范围后,不在这个范围的人一定是病人。
(X)11、正态分布的特点有算术均数等于中位数。
(V )12.确定正常人某项指标的正常参考值范围时,调查对象是指未患任何疾病的人。
(X)13、理论上,对于正态分布资料P5-P95和μ±1.96σ范围内都包含95%的变量值。
(X)四、单项选择题1..在列频数表时,分的组段数一般为:(B )A.5~10个B.10~15个C.10~30个D.15~20个E.>20个2.数值变量资料的标准差这个指标:(D)A.不会比均数大B.不会比均数小C.要比标准误小D.不决定于均数E.随着均数的变化而变化3.比较两组观察值单位不同时的变异程度大小要用:( D )A.离均差B.标准差C.标准误D.变异系数E.方差4.标准正态分布曲线下±2.58范围内的面积占总面积的:(E )A.50%B.68.27%C.90%D.95%E.99%5.下列不属于正态曲线的特点是:(E )A.有一个高峰位于中央(即均数所在处)B.两侧逐渐下降并完全对称C.成两端不与横轴相交的钟型曲线D.曲线图形由μ.、σ两个参数决定E.曲线下的面积没有什么分布规律6.某医师要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A)A.用该市5岁男孩身高的95%或99%正常值范围来评价B.作身高差别的显著性检测来评价C.用身高均数的95%或99%可信区间来评价D.不能做出评价E.以上都不对6.做频数表时,以组距为5,下列哪项组段划分正确(A)A.0一,5一,10一,… B.0—5,5一10,10一15,…C.一5,一10,一15,… D.0—4,5—9,10一,…E.5一,7一,9一,…7.用变异系数比较变异程度适用于( C )A.相同指标,均数相差较大B.不同指标,均数相差较小C.不同指标,均数相差较大D.相同指标,标准差相差较大E.以上均不是8.中位数与四分位数间距适用于( B )A.正态分布资料B.偏态分布资料C.正偏态资料D.负偏态资料E.对称分布资料9.均数与标准差之间的关系是(A)A.标准差越小,均数代表性越大B.标准差越小,均数代表性越小C.均数越大,标准差越小D.均数越大,标准差越大E.标准差越大,均数代表性越大10.正态分布有两个参数μ与σ,曲线的形状越扁平( C )A、μ越大B、μ越小C、σ越大D、σ越小E、μ和σ越接近0 11.x±2.58s包括变量值的(E )A.68.3%B.80.0%C.90.0%D.95.0%E.99.0%12.标准正态分布曲线下,中间90%的面积所对应的横轴尺度u的范围是(A)A.(一1.645,十1.645) B.(一X,十1.282) C.(一1.282,十1.282) D.(一X,十1.645) E.(一2.326,十2.326)13、可用于比较身高与体重的变异度( E )A、方差B、标准差c、四分位数间距D、全距E、变异系数14、各观察值均加(或减)同一个不等于零的数后( B )A、均数不变,标准差改变B、均数改变,标准差不变C、两者均不变D、两者均改变E、均数不变,标准差不一定改变15、标准差表示( B )A 正态分布B 个体变异C 均数变异D 相对水平E 变化速度16、频数分布的类型有( A )A.对称分布和偏态分布B.对称分布和正偏态分布C.对称分布和负偏态分布D.正偏态分布和负偏态分布E.正态分布和偏态分布17、某疗养院测得1096名飞行员红细胞数(万/mm2),经检验该资料服从正态分布,其均数值为414.1,标准差为42.8,求得的区间(414.1-1.96×42.8,414.1+1.96×42.8),称为红细胞数的:( B )A、99%正常值范围B、95%正常值范围C、99%可信区间D、95%可信区间E、90%可信区间18.常用离散趋势指标不包括( D )A.方差B.极差C.标准差D.P50E.四分位数间距19.标准正态分布曲线下,0到1.96的面积为:( C )A、90%B、95%C、47.5%D、50%E、99%20.医学中确定参考值范围时应注意(B )A.正态分布资料不能用均数标准差法B. 偏态分布资料不能用均数标准差法C.正态分布资料不能用百分位数法D. 偏态分布资料不能用百分位数法E、以上都不对14、描述一组偏态分布资料的变异度,以下列哪个指标为好?( D )A.全距B. 方差C. 标准差D.四分位数间距E. 变异系数15.设同一组7岁男童身高的均数是110cm,标准差是5cm,体重的均数是25kg,标准差是3kg,则比较二者变异程度的结论为( C )A. 身高的变异程度大于体重的变异程度B. 身高的变异程度等于体重的变异程度C. 身高的变异程度小于体重的变异程度D. 单位不同,无法比较E、身高的变异程度与体重的变异程度之比为5:316.正态分布N(μ,σ),当μ恒定时,σ越大,则(B )A. 观察值变异程度越小,曲线越“瘦”B. 观察值变异程度越大,曲线越“胖”C. 曲线沿横轴越向左移动D.曲线沿横轴越向右移动E、曲线形状和位置都不变17.估计医学参考值范围时,下列哪种说法是错误的( E )A、需要考虑样本的同质性B、对于某些指标,组间差别明显且有实际意义的,应先确定分组,再分别确定参考值范围C、需要足够数量,最好在100例以上D.“正常人”是指排除了影响被研究指标的疾病或因素的人E.“正常”是指健康,无疾病18.标准正态分布的均数与标准差分别为( E )A. -∞与+∞B. 0与0C. 1与1D. 1与0E. 0与119.以下指标中可用来描述计量资料的离散程度。
绪论知识点1. 只要增加例数就可以避免抽样误差。
A. +B. –2. 等级资料也可认为是一种计数资料。
A. +B. -3. 概率的取值一定在0~1范围内,频率的取值则不一定。
A. +B. -4. 客观事物中同质是相对的,变异是绝对的。
A. +B. -5. 观察单位数不确定的总体称为有限总体。
A. +B. -6. 统计量针对于样本,参数针对于总体。
A. +B. -7. 统计描述就是用样本推断总体的统计过程。
A. +B. -8. 有序分类资料就是等级资料。
A. +B. -9. 统计分析一般包括统计描述和统计推断。
A. +B. -10. 如果对全部研究对象都进行了调查或测定就没有抽样误差。
A. +B. -11. 对于统计资料的描述可用统计指标和统计图表两种手段。
A. +B. -12. 有序变量也称连续型变量,变量值可取连续不断的实数。
A. +B. -13. 分类资料中的各类别必须互相排斥,不能相互包含。
A. +B. -14. 离散变量在数值很大时可以取小数值,可近似地看成连续型变量。
A. +B. -15. 统计指标是用来综合说明总体某一特征的,而标志是说明个体某一特征的。
A. +B. -16. 若以舒张压>90mmHg为高血压,调查某地1000人中有多少个高血压患者, 这是________。
a.计量资料 b.还不能决定是计量资料还是计数资料c.计数资料d.既可作计量也可作计数资料e.等级资料17. 某医院用一种中草药治疗9名高血压病人,治疗前后的舒张压见下表。
病人号1234567治疗前1151112911116109109治疗后11690108929011087欲比较治疗前后有无差异, 这是_________。
a.计量资料 b.还不能决定是计量资料还是计数资料c.计数资料 d.既可作计量也可作计数资料e.等级资料18. 一批病人的血球沉降率(%)是________。
a.计量资料 b.还不能决定是计量资料还是计数资料c.计数资料 d.既可作计量也可作计数资料e.等级资料19. 统计一批肝炎病人的住院天数是________。
a.计量资料 b.还不能决定是计量资料还是计数资料c.计数资料 d.既可作计量也可作计数资料e.等级资料20. 某项新手术方法的成功与失败例数是________。
a.计量资料 b.还不能决定是计量资料还是计数资料c.计数资料 d.既可作计量也可作计数资料e.等级资料21. 一批按贫血儿童轻度、中度、重度、极重度的检查记录分类的资料是_____。
a.计量资料 b.还不能决定是计量资料还是计数资料c.计数资料 d.既可作计量也可作计数资料e.等级资料22. 对某地区食品零售店的卫生情况进行一次全面调查,其个体是_____。
a.该地区所有经营零售食品的商店 b.全部零售食品的卫生情况c.某种零售食品的卫生情况 d.该地区每个经营零售食品的商店e.该地区的部分零售食品店23. 要了解某班40名学生的卫生统计学成绩,则统计指标为________。
a.每个学生的成绩 b.部分学生的成绩c.学生成绩的平均分 d.某一学生的成绩为85分e.以上都24. 调查某医院医生的工作状况,医生一天内上班的时间是________。
a.变量 b.总体 c.个体 d.变量值e.统计指标25. 研究某厂职工的月收入(元)时得到如下资料:700、600、900等,这是指___ 。
a.变量 b.数量标志 c.变量值 d.指标e.指标值26. 下面的变量中哪个是离散变量________。
a.在校学生人数 b.粮食产量c.身高d.年龄e.体重27. 下面的变量中哪个是连续变量________。
a.在校学生人数 b.职工人数c.身高 d.企业生产设备数e.患病人数28. 下面的变量中哪个是分类变量________。
a.在校学生人数 b.学生性别c.学生年龄 d.学生学习成绩e.学生视力29. 治疗结果分为有效和无效的资料,严格说来属于________。
a.等级或计数均可 b.计数资料c.计量资料 d.等级或计量均可e.计数或计量均可30. 概率等于1的事件称为________。
a.小概率事件 b.必然事件c.不可能事件d.或然事件e.互斥事件31. 某医院发生的医疗事故属于小概率事件。
A. +B. -32. 科研结果的好坏取决于研究设计的好坏,研究设计是统计工作的基础和关键,决定着整个统计工作的成败。
A. +B. -33. 没有较好的统计学知识,就不可能进行较好的科学研究,更不可能写出一篇高质量的科研论文。
A. +B. -34. 分类资料中的各类别可以相互包含。
A. +B. -35. 医学领域中的三类资料不能互相转换。
A. +B. -36. 定量变量按取值的不同可分为离散型变量和连续型变量两种。
A. +B. -37. 用SAS和SPSS统计分析的结果,在国际学术交流中可以不必说明算法。
A. +B. -38. 一批病人的淋巴细胞转换率(%)是________。
a.计量资料 b.还不能决定是计量资料还是计数资料c.计数资料 d.既可作计量也可作计数资料e.等级资料39. 测量某病病人的抗体滴度(1:2,1:4,1:8,…),是________。
a.计量资料 b.还不能决定是计量资料还是计数资料c.计数资料 d.既可作计量也可作计数资料e.等级资料40. 城市噪音(-、+、++、+++、++++、+++++)资料属于_______。
a.计量资料 b.还不能决定是计量资料还是计数资料c.计数资料 d.既可作计量也可作计数资料e.等级资料41. 空腹血糖(mmol/L)资料属于_______。
a.计量资料 b.还不能决定是计量资料还是计数资料c.计数资料 d.既可作计量也可作计数资料e.等级资料42. 患者的病情程度(轻、中、重)资料属于__________。
a.计量资料 b.还不能决定是计量资料还是计数资料c.计数资料 d.既可作计量也可作计数资料e.等级资料43. 患者的性别资料可以转换为___________。
a.计量资料 b.还不能决定是计量资料还是计数资料c.计数资料 d.既可作计量也可作计数资料e.等级资料计量资料统计描述知识点1. 所谓对称分布是指集中位置在正中,左右两侧频数相等。
A. +B. -2. 频数表的组距必须取等距。
A. +B. -3. 集中趋势与离散趋势都是客观存在的,因此对一个资料描述必须同时考虑这两方面。
A. +B. -4. 不论资料呈什么分布,用算术均数和中位数表示它们的平均水平都一样合理。
A. +B. -5. 一组变量值,位于正中间的那一个数的数值,称为中位数。
A. +B. -6. 不论资料呈什么分布,用算术均数和中位数表示它们的平均水平都一样合理。
A. +B. -7. 百分位数适用于任何分布类型的资料,因此在选用描述资料集中趋势的指标时,应首选百分位数。
A. +B. -8. 分布末端无确定数据的资料,宜选用中位数来描述其平均水平。
A. +B. -9. 标准差不会是负数。
A. +B. -10. 比较同组人群的身高和体重变异度大小宜采用变异系数。
A. +B. -11. 一组观察值,按从大到小的顺序排列后,位次居中的观察值,称为中位数。
A. +B. -12. 因标准差能综合反映各观察值的变异程度,故在描述资料的变异度大小时,应首选标准差。
A. +B. -13. 变异系数就是均数与方差的比值。
A. +B. -14. 正态分布的标准差总是比均数小。
A. +B. -15. 对于正态分布的资料,若同时计算算术均数和中位数,二者的值相等。
A. +B. -16. 正态曲线的位置由标准差决定。
A. +B. -17. 在制定参考值范围的研究中,正常人是指任何一点小病都没有的人。
A. +B. -18. 正态分布资料中用均数加减倍标准差制定出正常值范围后,不在这个范围内的人一定是病人。
A. +B. -19. 偏态分布的资料也可以用均数加减倍标准差的方法来估计正常值范围。
A. +B. -20. 若正常人与病人的某项指标重叠,制定正常值范围时,确定任何界值,其漏诊率和误诊率都是不可避免的。
A. +B. -21. 平均数是表示一群性质相同变量值的________指标。
a.离散趋势 b.变化范围c.集中趋势 d.频数分布 e.平均变化水平22. 标准差是表示一组性质相同的变量值的________指标。
a.离散趋势 b.变化范围c.集中趋势 d.频数分布 e.观察值间相差的大小23. 为描述对称(或正态)分布资料的频数分布,应知道的指标是________。
a.算术均数和中位数 b.算术均数和几何均数 c.算术均数、中位数和变异系数 d.算术均数和标准差e.以上都不是24. 两组资料的标准差相等,则________。
a.它们的均数也相等 b.它们的均数必不等c.它们的均数可能相等也可能不等 d.它们的均数互为倒数e.它们的均数呈倍数关系25. 分布末端无确定数据的资料应计算________以表示其平均水平。
a.算术均数 b.中位数c.几何均数 d.众数 e.调和均数26. 用频数表计算中位数时________。
a.要求组距相等 b.要求组距不等c.组距相等或不相等都可以 d.组距呈倍数增加 e.组距呈倍数减少27. 一组观察值,如果每个值都增加或减少一个不为0的常数,则________。
a.均数改变,几何均数不变 b.均数改变,中位数不变 c.均数,几何均数和中位数都改变 d.均数不变,几何均数和中位数改变e.均数,几何均数和中位数都不变28. 编制频数表,在确定组距时________。
a.常取最大值的1/10取整作组距 b.常取最小值的1/10取整作组距c.常取极差的1/10取整作组距 d.极差除以组数取整作组距e.以上都不对29. 对样本含量为7的某资料,计算中位数时,其值为________。
a.位次为(n+1)/2的观察值 b.位次为n/2的观察值 c.位次为(n+1)/2与位次为n/2的观察值之和的一半d.将观察值从小到大排列后,位次为(n+1)/2的观察值 e.以上都不对30. 某人算得资料的s=-,可认为________。
a.变量值都是负数 b.变量值负的比正的多c.计算有错 d.变量值一个比一个小 e.变量值多数为031. 关于变异系数,下面哪个说法是正确的________。
a.变异系数的单位与原始数据的单位相同b.变异系数的单位与原始数据的单位不同c.变异系数没有单位d.变异系数是均数与标准差的相对比e.变异系数是标准差与中位数的相对比32. 标准正态分布是指 _________ 正态分布。
a.μ=0 σ=1 b.μ=1 σ=0c.μ=0 σ任意 d.μ任意σ=1 e.以上都不对34. 在正态分布资料中, 95%的双侧正常值范围常用_______表示。