医学统计学第3版,02计量资料的统计描述试题
- 格式:doc
- 大小:183.50 KB
- 文档页数:10
《医学统计学》计算分析题参考答案孙振球主编. 医学统计学.第3版. 北京:人民卫生出版社,2010第二章计量资料的统计描述计算分析题(P26)1. 根据某单位的体检资料,116名正常成年女子的血清甘油三酯测量结果如下,请据此资料:(1)描述集中趋势应选择何指标?并计算之。
(2)描述离散趋势应选择何指标?并计算之。
(3)求该地正常成年女子血清甘油三酯的95%参考值范围。
(4)试估计该地正常成年女子血清甘油三脂在0.8mmol/L以下者及1.5mmol/L者各占正常成年女子总人数的百分比?表2-1某单位116名正常成年女子的血清甘油三酯(mmol/L)测量结果组段频数0.6~ 10.7~ 30.8~ 90.9~ 131.0~ 191.1~ 251.2~ 181.3~ 131.4~ 91.5~ 51.6~1.7 1合计116(1)数据文件数值变量名:组段,频数;用Compute产生新变量“组中值”(也可直接输入组中值)。
(2)操作步骤Analyze èData èWeight Cases ;Weight Cases by 频数。
Analyze èDescriptives èDescriptives ;将“组中值”选入V ariable 框中;单击OK 。
(3)结果解释表2-1显示某单位116名正常成年女子的血清甘油三酯测量结果呈正态分布,故选择均数描述集中趋势,选择标准差描述离散趋势。
某单位116名正常成年女子的血清甘油三酯测量结果的均数为1.16(mmol/L ),标准差为0.20(mmol/L );该地正常成年女子血清甘油三酯的95%参考值范围是(0.77,1.55)mmol/L 。
计算过程根据公式s x 96.1±,即1.16±1.96×0.20。
该单位正常成年女子血清甘油三酯在0.8 mmol/L 以下者估计占总人数的3.59%,1.5 mmol/L 以下者估计占总人数的95.54%。
考试题医学统计学第三版1,统计设计的基本原则有哪些?(1)对照:以排除偶然的非处理因素的干扰,如成组对照、配对对照。
(2)随机:总体中每一个体都有同等的机会被抽中,其目的是使样品有代表性,如抽签、随机数字表等。
(3)均衡:处理组与对照组的内部构成一致,如性别一致、年龄一致等。
(4)重复(样本含量):样本一般要求≧30例。
2. 怎样的数据资料属分类资料?数据不代表数值大小,只是一种编码,每个编码代表一种属性,这种资料叫分类资料,又称分类变量或定性资料。
其观察值是定性的,表现为互不相容的类别或属性。
有无序分类、有序分类两种情况。
3. 简述什么叫总体和样本,医学研究中的样本有什么要求?总体:是指根据研究目的确定的同质观察单位的全体,是同质的所有观察单位某中观察值(变量值)的集合。
样本:用随机方法从总体中抽出的、有代表性的部分观察单位的某变量值的集合。
医学研究中的样本应按随机化原则获取,即总体中每一个观察单位都有同等的机会被选入到样本中来,以避免误差和偏倚对研究结果有所影响。
4. 统计描述的基本方法有哪些,各自有何特点?(1)频数表与频数图:由组段和频数两栏组成的整理表即频数表,将频数表数据在直角坐标系上绘制成图即频数图。
特点:①.较具体、直观的描述一组数据的特征;②便于发现可疑的异常值;③有助于正确选用统计指标和便于计算。
(2)描述性统计量可以用来定量的刻画统计分布的特征,常用的有三类:描述集中趋势的有算术均数,几何均数,中位数。
描述离散趋势的有极差,四分位数间距,方差,标准差,变异系数,描述分布类型的偏度系数峰度系数。
(3)百分位数是一种位置参数既可用干描述离散趋势又可描述集中趋势可用于各种连续型分布。
5. 统计描述的意义是什么?试举例说明。
统计描述,是指用适当的统计指标、统计表、统计图等方法对资料的数量特征及其分布规律进行测定和描述,其目的是用直观、简单的形式揭示大量数据所蕴涵的内在信息。
例如随机抽取某市六十名十二岁男孩测身高面对这六十个不同的数据,无论多认真审视也无法说清这些男孩的身高情况,这就要用统计描述来解决这些问题,对数据进行整理归纳总结分析制作频数表图这样就能具体直观的描述这些数据的特征如有三组同龄男孩体重如下,其平均体重是30千克,由表面看这三组资料的均数相等,即集中趋势相同,但各组的数据参差不齐,也就是离散趋势不同,描述这组同质数值变量数据离散程度就用全距、四分位数间距、方差、标准差等6. 描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况?描述计量资料集中趋势的指标有:算术平均数、几何平均数、中位数。
《卫生统计学》考试题库目录第一章绪论第二章定量资料的统计描述第三章正态分布第四章总体均数的估计和假设检验第五章方差分析第六章分类资料的统计描述第七章二项分布与Poisson分布及其应用第八章χ2检验第九章秩和检验第十章回归与相关第十一章常用统计图表第十二章实验设计第十三章调查设计第十四章医学人口统计与疾病统计常用指标第十五章寿命表第十六章随访资料的生存分析附录:单项选择题参考答案第一章绪论一、名词解释1. 参数 (parameter)2. 统计量 (statistic)3. 总体 (population)4. 样本 (sample)5. 同质 (homogeneity)6. 变异 (variation)7. 概率 (probability) 8. 抽样误差 (sampling error)二、单选题1.在实际工作中,同质是指:A.被研究指标的影响因素相同B.研究对象的有关情况一样C.被研究指标的主要影响因素相同D.研究对象的个体差异很小E.以上都对2. 变异是指:A.各观察单位之间的差异B.同质基础上,各观察单位之间的差异C.各观察单位某测定值差异较大D.各观察单位有关情况不同E.以上都对3.统计中所说的总体是指:A.根据研究目的而确定的同质的个体之全部B.根据地区划分的研究对象的全体C.根据时间划分的研究对象的全体D.随意想象的研究对象的全体E.根据人群划分的研究对象的全体4. 统计中所说的样本是指:A.从总体中随意抽取一部分B.有意识地选择总体中的典型部分C.依照研究者的要求选取有意义的一部分D.从总体中随机抽取有代表性的一部分E.以上都不是5.按随机方法抽取的样本特点是:A.能消除系统误差B.能消除随机测量误差C.能消除抽样误差D.能减少样本偏性E.以上都对6.统计学上的系统误差、测量误差、抽样误差在实际工作中:A.均不可避免B.系统误差和测量误差不可避免C.测量误差和抽样误差不可避免D.系统误差和抽样误差不可避免E.只有抽样误差不可避免7.统计工作的基本步骤是:A.设计、调查、审核、整理资料B.收集、审核、整理、分析资料C.设计、搜集、整理、分析资料D.调查、审核、整理、分析资料E.以上都不对8.统计工作的关键步骤是:A.调查或实验设计B.整理分组C.收集资料D.审核资料E.分析资料9.欲研究某种药物对高血压病的疗效,临床观察300名病人的血压情况,确切地说,研究总体是: A.这300名高血压患者 B.这300名高血压患者的血压值C.所有的高血压患者D.所有的高血压患者的血压值E.这种药物10.抽样误差是由:A.计算引起B.测量引起C.抽样引起D.采样结果不准引起E.试剂、仪器未经校正引起11.抽样误差指的是:A.个体值和总体参数值之差B.个体值和样本统计量值之差C.样本统计量值和总体参数值之差D.不同的总体参数之差E.以上都不是12.习惯上,下列属于小概率事件的为:A. P=0.09B. P=0. 10C. P=0.15D. P=0.03E.以上都不是13.治疗效果判定资料属于A. 计量资料B. 计数资料C. 等级资料D. 无序分类资料E. 以上都不是14.概率P的范围:A. -1≤P≤1B. 0C. P≥1D. -1≤P≤0E. 0≤P≤1三、简答题1、统计学的基本步骤有哪些?2、总体与样本的区别与关系?3、抽样误差产生的原因有哪些?可以避免抽样误差吗?4、何为概率及小概率事件?第二章定量资料的统计描述第三章正态分布一、名词解释1. 正态分布 (normal distribution)2. 中位数 (median)3. 四分位数间距 (quartile interval)4. 方差 (variance)5. 正偏态分布 (positively skewed distribution)6. 负偏态分布 (negatively skewed distribution)7. 对数正态分布 (logarithmic normal distribution )8. 医学参考值范围 (medical reference range)二、单选题1.μ确定后,δ越大, 则正态曲线:A.越陡峭B. 形状不变C. 越平缓D.向左移动E.向右移动2. 平均数可用于分析下列哪种资料:A.统计资料B.等级资料C.计数资料D.计量资料E.调查资料3. 常用的平均数指标有:A.样本均数、总体均数、中位数B.算术均数、总体均数、几何均数C.算术均数、几何均数、中位数D.中位数、样本均数、几何均数E.以上都不对4. 描述一组正态或近似正态分布资料的平均水平用:A.算术均数B.几何均数C.中位数D.平均数E.以上均是5. 用/n公式计算均数的方法称为:A.加权法B.简捷法C.目测法D.平均法E.直接法6. 用频数表计算均数时, 若以各组段下限值作为组中值计算均数, 要使所得值等于原均数, 则应:A.减一个组距B.加一个组距C.减半个组距D.加半个组距E.以上均不对7. 对于一组呈负偏态分布的资料,反映其平均水平应用哪个指标:A.几何均数B.中位数C.平均数D.均数E.算术均数8. 用频数表法计算均数时,组中值应为:A.(本组段下限值+本组段上限值)/2B.(本组下限值+下组下限值)/2C.(本组下限值+下组上限值)/2D.本组段的上限值E.本组段的下限值9. 原始数据加上一个不为0的常数后:A. 不变、CV变B. 变或CV变C. 不变、CV不变D. 变、CV不变E. 、CV均改变10. 对于对称分布的资料来说:A.均数比中位数大B.均数比中位数小C.均数等于中位数D.均数与中位数无法确定孰大孰小E.以上说法均不准确11. 血清学滴度资料最常计算_______以表示其平均水平。
卫生统计学题库《卫生统计学》考试题库目录第一章绪论第二章定量资料的统计描述第三章正态分布第四章总体均数的估计和假设检验第五章方差分析第六章分类资料的统计描述第七章二项分布与Poisson分布及其应用第八章χ2检验第九章秩和检验第十章回归与相关第十一章常用统计图表第十二章实验设计第十三章调查设计第十四章医学人口统计与疾病统计常用指标第十五章寿命表第十六章随访资料的生存分析附录:单项选择题参考答案第一章绪论一、名词解释1. 参数(parameter)2. 统计量(statistic) 3. 总体 (population)4. 样本(sample)5. 同质(homogeneity) 6. 变异 (variation)7. 概率 (probability) 8. 抽样误差(sampling error)二、单选题1.在实际工作中,同质是指:A.被研究指标的影响因素相同B.研究对象的有关情况一样C.被研究指标的主要影响因素相同D.研究对象的个体差异很小E.以上都对2. 变异是指:A.各观察单位之间的差异B.同质基础上,各观察单位之间的差异C.各观察单位某测定值差异较大D.各观察单位有关情况不同E.以上都对3.统计中所说的总体是指:A.根据研究目的而确定的同质的个体之全部B.根据地区划分的研究对象的全体C.根据时间划分的研究对象的全体D.随意想象的研究对象的全体E.根据人群划分的研究对象的全体4. 统计中所说的样本是指:A.从总体中随意抽取一部分B.有意识地选择总体中的典型部分C.依照研究者的要求选取有意义的一部分D.从总体中随机抽取有代表性的一部分E.以上都不是5.按随机方法抽取的样本特点是:A.能消除系统误差B.能消除随机测量误差C.能消除抽样误差D.能减少样本偏性E.以上都对6.统计学上的系统误差、测量误差、抽样误差在实际工作中:A.均不可避免B.系统误差和测量误差不可避免C.测量误差和抽样误差不可避免D.系统误差和抽样误差不可避免E.只有抽样误差不可避免7.统计工作的基本步骤是:A.设计、调查、审核、整理资料B.收集、审核、整理、分析资料C.设计、搜集、整理、分析资料D.调查、审核、整理、分析资料E.以上都不对8.统计工作的关键步骤是:A.调查或实验设计B.整理分组C.收集资料D.审核资料E.分析资料9.欲研究某种药物对高血压病的疗效,临床观察300名病人的血压情况,确切地说,研究总体是: A.这300名高血压患者 B.这300名高血压患者的血压值C.所有的高血压患者D.所有的高血压患者的血压值E.这种药物10.抽样误差是由:A.计算引起B.测量引起C.抽样引起D.采样结果不准引起E.试剂、仪器未经校正引起11.抽样误差指的是:A.个体值和总体参数值之差B.个体值和样本统计量值之差C.样本统计量值和总体参数值之差D.不同的总体参数之差E.以上都不是12.习惯上,下列属于小概率事件的为:A. P=0.09B. P=0. 10C. P=0.15D.P=0.03 E.以上都不是13.治疗效果判定资料属于A. 计量资料B. 计数资料C. 等级资料D. 无序分类资料E. 以上都不是14.概率P的范围:A. -1≤P≤1B. 0C. P≥1D. -1≤P≤0E. 0≤P≤1三、简答题1、统计学的基本步骤有哪些?2、总体与样本的区别与关系?3、抽样误差产生的原因有哪些?可以避免抽样误差吗?4、何为概率及小概率事件?第二章定量资料的统计描述第三章正态分布一、名词解释1. 正态分布(normal distribution)2. 中位数 (median)3. 四分位数间距(quartile interval)4. 方差 (variance)5. 正偏态分布(positively skewed distribution)6. 负偏态分布(negatively skewed distribution)7. 对数正态分布(logarithmic normal distribution )8. 医学参考值范围 (medical reference range)二、单选题1.μ确定后,δ越大, 则正态曲线:A.越陡峭B. 形状不变C. 越平缓D.向左移动E.向右移动2. 平均数可用于分析下列哪种资料:A.统计资料B.等级资料C.计数资料 D.计量资料 E.调查资料3. 常用的平均数指标有:A.样本均数、总体均数、中位数B.算术均数、总体均数、几何均数C.算术均数、几何均数、中位数D.中位数、样本均数、几何均数E.以上都不对4. 描述一组正态或近似正态分布资料的平均水平用:A.算术均数B.几何均数C.中位数D.平均数E.以上均是5. 用/n公式计算均数的方法称为:A.加权法B.简捷法C.目测法D.平均法E.直接法6. 用频数表计算均数时, 若以各组段下限值作为组中值计算均数, 要使所得值等于原均数,则应:A.减一个组距B.加一个组距C.减半个组距D.加半个组距E.以上均不对7. 对于一组呈负偏态分布的资料,反映其平均水平应用哪个指标:A.几何均数B.中位数C.平均数 D.均数 E.算术均数8. 用频数表法计算均数时,组中值应为:A.(本组段下限值+本组段上限值)/2B.(本组下限值+下组下限值)/2C.(本组下限值+下组上限值)/2D.本组段的上限值E.本组段的下限值9. 原始数据加上一个不为0的常数后:A. 不变、CV变B. 变或CV变C.不变、CV不变D. 变、CV不变E. 、CV均改变10. 对于对称分布的资料来说:A.均数比中位数大B.均数比中位数小C.均数等于中位数D.均数与中位数无法确定孰大孰小E.以上说法均不准确11. 血清学滴度资料最常计算_______以表示其平均水平。
一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、@计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I型错误概率的最大值。
I型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。
卫生统计学第三版习题答案卫生统计学第三版习题答案卫生统计学是一门研究卫生领域相关数据的学科,它通过收集、整理、分析和解释数据,为卫生决策和实践提供科学依据。
在学习卫生统计学的过程中,习题是一个重要的练习和巩固知识的方式。
下面将为大家提供《卫生统计学第三版》的习题答案,希望对大家的学习有所帮助。
第一章:卫生统计学概述1. 什么是卫生统计学?卫生统计学是一门研究卫生领域相关数据的学科,它通过收集、整理、分析和解释数据,为卫生决策和实践提供科学依据。
2. 卫生统计学的主要任务是什么?卫生统计学的主要任务是收集和整理卫生数据,进行数据分析和解释,为卫生决策和实践提供科学依据。
3. 卫生统计学的应用范围有哪些?卫生统计学的应用范围包括疾病监测、卫生政策评估、卫生资源分配、卫生服务质量评估等。
第二章:卫生统计学的数据来源1. 卫生统计学的数据来源有哪些?卫生统计学的数据来源包括卫生部门、医疗机构、卫生调查和监测等。
2. 卫生部门提供的数据主要包括哪些内容?卫生部门提供的数据主要包括卫生机构的基本情况、疾病报告、卫生人力资源等。
3. 医疗机构提供的数据主要包括哪些内容?医疗机构提供的数据主要包括病案数据、门诊数据、住院数据等。
第三章:卫生统计学的数据质量1. 什么是数据质量?数据质量是指数据的准确性、完整性、一致性和及时性等方面的特征。
2. 数据质量的评价指标有哪些?数据质量的评价指标包括数据的准确性、完整性、一致性、时效性、可比性等。
3. 如何提高数据质量?提高数据质量可以通过规范数据收集和录入流程、加强培训和质量控制、建立数据质量管理体系等措施。
第四章:卫生统计学的数据描述1. 什么是数据描述?数据描述是对数据进行统计和图表分析,以便更好地理解数据的特征和变化趋势。
2. 数据描述的方法有哪些?数据描述的方法包括频数分布、百分比、均值、中位数、标准差等。
3. 如何选择合适的数据描述方法?选择合适的数据描述方法需要根据数据的类型、分布情况和研究目的来确定。
第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A )A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用(A )A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是( A )A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为(A )(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验( C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )(A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -210、标准误反映(A )A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的(C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C)A t r>t bB t r<t bC t r= t b D二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D )A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为( A )A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
卫生统计学III卷A一、简答题。
1、某年级甲班、乙班各有男生50人。
从两个班各随机抽取10人测量身高,并求其平均身高。
如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?2、描述集中趋势的指标有哪些?它们的适用条件有何不同?3、有人认为“成组设计的两样本比较时,t检验总比秩和检验好”,试述该结论是否正确,并说明理由。
4、某地区某疾病连续3年患病率分别为6.0%、9.0%、12.0%,则该病3年总的患病率为: (6.0+9.0+12.0) /3二9.00%。
此算法是否正确?为什么?5、若正常人的血铅含量X近似服从对数正太分布,现需制定某地区正常人血铅含量95%的参考值范围,甲同学认为应采用公式:X±1.96S來计算,你认为这样做法正确?为什么?6、通常单侧检验较双侧检验更为灵敏,更容易检验出差别,因此宜广泛使用。
这种说法正确吗?为什么?7、某研究者对两个样本数据进行了t检验,得出P值<0.05,下结论为:拒绝H(),接受H|, 可以认为两样木均数差异有统计学意义,有人对此结论提出异议,认为可能是验效能检不够, 你对此有何看法?8、随机区组设计的方差分析变异分解为MS *MS处理+MS区组+MS舷,此说法是否正确,请说明原因。
9、某庚生临床研究为探讨甲状腺功能与血清半胱氨酸蛋白酶抑制剂C的相关性,测定30 名正常人血清FT3浓度与血清半胱氨酸蛋白酶抑制剂C浓度,进行相关分析,此医生认为如果相关分析算出的1•越大,则回归分析算出的b也越大,他的说法是否正确?为什么?10、当做两变量相关分析,计算得出其相关系数r=0吋,是否表明两变量间不存在任何关系?为什么?11、下表资料是甲乙两市恶性肿瘤的患病情况,某研究人员根据此资料认为,甲县人群肺癌患病率高于乙县,该结论是否正确,并说明理由。
甲乙两县恶性肿瘤患病情况(/20万)肿瘤部位甲县乙县肺45.0020.00胃10.0016.70乳腺15.00 6.70其它30.0056.6012、经调查得甲、乙两城市男性的肺癌粗死亡率都为40.0/万,按年龄构成标化后,甲城市男性肺癌标化死亡率为31.5/万,乙城市为48.0/万,请解释此差异的原因。
医学统计方法选择题一:医学统计方法概述l.统计中所说的总体是指:AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.概率P=0,则表示BA某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 DA分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样4.测量身高、体重等指标的原始资料叫:BA计数资料B计量资料C等级资料D分类资料E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1该资料的类型是:DA计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6.样本是总体的CA有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:CA统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BA抽样误差B系统误差C随机误差D责任事故E以上都不对10.以下何者不是实验设计应遵循的原则DA对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 BA算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择CA XB GC MD SE CV13.各观察值均加(或减)同一数后:BA均数不变,标准差改变B均数改变,标准差不变C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时?CA 5B 5.5C 6D lOE 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:DA全距B标准差C方差D变异系数E极差16.下列哪个公式可用于估计医学95%正常值范围 AA X±1.96SB X±1.96SXC μ±1.96SXD μ±t0.05,υSXE X±2.58S 17.标准差越大的意义,下列认识中错误的是BA观察个体之间变异越大B观察个体之间变异越小C样本的抽样误差可能越大D样本对总体的代表性可能越差E以上均不对18.正态分布是以 EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布E均数为中心的频数分布19.确定正常人的某项指标的正常范围时,调查对象是BA从未患过病的人B排除影响研究指标的疾病和因素的人C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人E以上都不是20.均数与标准差之间的关系是EA标准差越大,均数代表性越大B标准差越小,均数代表性越小C均数越大,标准差越小D均数越大,标准差越大E标准差越小,均数代表性越大第九章数值变量资料的统计推断21.从一个总体中抽取样本,产生抽样误差的原因是AA总体中个体之间存在变异B抽样未遵循随机化原则C被抽取的个体不同质D组成样本的个体较少E分组不合理22.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
※:算术均数:正态分布或近似正态分布;例:大多数正常生物的生理、生化指标(血红蛋白、白细胞数等)几何均数:非对称分布,按从小到大排列,数据呈倍数关系或近似倍数关系;如:抗体的平均滴度、药物的平均效价中位数:资料呈明显偏态分布、一端或两端无确定数值、资料的分布情况不清楚;如:某些传染病或食物中毒的潜伏期、人体的某些特殊测定指标(如发汞、尿铅等)全距:表示一组资料的离散程度※:X:正态分布或近似正态分布G:非正态分布、按大小排列后,各观察值呈倍数关系M:明显的偏态分布、资料一端或两端无确定值、资料情况分布不清楚S与CV均为离散趋势指标25、某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时:CA、5B、5.5C、6D、lOE、12※:按大小排列后为:30 24+ 16 10 6 3 2 2 2,取第5位的值,即为 6※:1.计算相对数的分母不宜过小;2.分析时不能以构成比代替率;3.正确计算平均率;4.相互比较时应注意可比性;5.样本率或构成比的比较应进行假设检验23.反映某一事件发生强度的指标应选用 DA 构成比B 相对比C 绝对数D 率E变异系数※:构成比:各组成部分构成比的总和为100%或1;相对比:方便两个指标的比较率:说明某现象发生的频率或强度24.反映事物内部组成部分的比重大小应选用 AA构成比 B 相对比C绝对数D率E变异系数25.计算标化率的目的是 DA使大的率变小, B使小的率变大 C使率能更好的代表实际水平D消除资料内部构成不同的影响,使率具有可比性 E起加权平均的作用26.在两样本率比较的X2检验中,无效假设(H0)的正确表达应为 CA μ1≠μ2B μ1=μ2 c π1=π2 D π1≠π2 E B=C※:卡方检验的H0假设应用π,u t q等检验均用μ率的比较用π,均数的比较用μ27.四格表中四个格子基本数字是 DA两个样本率的分子和分母B两个构成比的分子和分母C两对实测数和理论数D两对实测阳性绝对数和阴性绝对数 E两对理论数28、相对数使用时应注意以下各点,除了:EA、分母不宜过小B、不要把构成比当率分析C、可比性D、比较时应作假设检验E、平均水平与变异程度29、某种职业病检出率为:DA、100/100 ρ100/100B、检出病人数/在册人数ρ实有病人数/受检人数100/100 ρC、实存病人数/在册人数 100/100D、检出人数/受检人数E、以上全不对ρ30、说明一个地区死亡水平的指标主要是:DA.病死率B.死因构成比C.死因顺位D.死亡率E.上述都不对31、相对数中的构成指标是说明: BA.反映事物发生的严重程度B.事物内部构成比重C.两个有关指标的比 D.动态变化 E.以上都不是32、X2四格表中四个格子基本数字是:CA.两个样本率的分子与分母 B.两个构成比的分子与分母C.两对实测阳性绝对数和阴性绝对数 D.两对实测数和理论数 E.以上都不对33、四格表X2 检验的自由度是___。
第二章 计量资料的统计描述一、教学大纲要求(一)掌握内容1. 频数分布表与频数分布图 (1)频数表的编制。
(2)频数分布的类型。
(3)频数分布表的用途。
2. 描述数据分布集中趋势的指标掌握其意义、用途及计算方法。
算术均数、几何均数、中位数。
3. 描述数据分布离散程度的指标掌握其意义、用途及计算方法。
极差、四分位数间距、方差、标准差、变异系数。
(二)熟悉内容连续型变量的频数分布图:等距分组、不等距分组。
二、 教学内容精要计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。
常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。
(一)频数分布表的编制频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数。
如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。
对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。
制作连续型数据频数表一般步骤如下:1.求数据的极差(range )。
min max X X R -= (2-1) 2.根据极差选定适当“组段”数(通常8—10个)。
确定组段和组距。
每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ<U 。
3.写出组段,逐一划记。
频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。
(二)描述频数分布中心位置的平均指标描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。
1.算术均数(对称分布)算术均数(arithmetic mean )简称均数,描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X 表示,其计算方法如下:(1)直接法:直接用原始观测值计算。
nX X ∑= (2-2)(2)加权法:在频数表基础上计算,其中X 为组中值,f 为频数。
∑∑=ffX X (2-3) 2.几何均数(常用于免疫学的指标))几何均数(geometric mean )用以描述对数正态分布或数据呈倍数变化资料的水平。
记为G 。
其计算公式为:(1)直接法⎪⎭⎫ ⎝⎛∑=-n X G lg lg 1 (2-4)(2)加权法⎪⎪⎭⎫ ⎝⎛∑∑=-f X f G lg lg 1 (2-5)3.中位数(尤其适合偏态分布资料和一端或两端无确切数值的资料)中位数(median )将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。
为奇数时 ⎪⎭⎫ ⎝⎛+=21n X M (2-6)为偶数时 ()(1)2212n nM X X +⎛⎫=+ ⎪⎝⎭(2-7)2-1 常用平均数的意义及其应用场合平均数 意义 应用场合均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布几何均数 平均增(减)倍数 等比资料;对数正态分布中位数 位次居中的观察值水平 偏态分布;分布不明;分布末端无确定值(一)反映数据变异程度大小的变异指标变异指标的应用亦根据资料的不同而选取不同指标进行描述。
常用的变异指标有极差、四分位数间距、方差、标准差和变异系数,尤其是方差和标准差更为常用。
1.极差极差(range )亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
min max X X R -=(2-1)2.百分位数与四分位数间距(1)百分位数(percentile )是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。
百分位数的另一个重要用途是确定医学正常参考值范围。
百分位数用P x 表示,0< x <100,如25%位数表示为P 25。
在频数表上,百分位数的计算公式为:()∑-⋅+=L xxx x f x n f i L P % (2-8)(2)四分位数间距(inter-quartile range )是由第3四分位数(Q 3= P 75)和第1四分位数(Q 1= P 25)相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,比极差稳定。
其计算公式:31QR Q Q =- (2-9)3.方差方差(variance )表示一组数据的平均离散情况,其计算公式为:()122-∑-=n X S μ (2-10)4.标准差标准差(standard deviation )是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用,其计算公式为:S ==(2-11)5.变异系数变异系数(coefficient of variation )用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。
用CV 表示,计算公式为:%100⨯=XS CV(2-12)平均指标和变异指标分别反映资料的不同特征,作为资料的总结性统计量,两类指标要求一起使用。
如常用S X ±或M (QR )。
三、典型试题分析1.名词解释:平均数答案:平均数(average )是描述数据分布集中趋势的指标,在卫生领域中最常用的平均数指标:算术均数、几何均数和中位数。
[评析]本题考察平均数的概念。
平均数是一类统计指标,并不单纯指算术均数。
2.描述一组偏态分布资料的变异度,以( )指标较好。
A.全距 B.标准差 C.变异系数 D.四分位数间距 答案:D[评析]标准差和变异系数均用于描述正态分布资料的变异度,全距和四分位数间距可用于任何资料,而四分位数间距更为稳定,故选D 。
3.用均数和标准差可以全面描述( )资料的特征。
A.正偏态分布 B.负偏态分布C.正态分布和近似正态分布D.对称分布答案:C[评析]本题考察均数和标准差的应用条件。
4.同一资料的标准差是否一定小于均数答案:均数和标准差是两类不同性质的统计指标。
标准差用于描述数据的变异程度,变异程度大,则该值大,变异程度小,则该值小。
标准差可大于均数,也可小于均数。
5.试述极差、四分位数间距、标准差及变异系数的适用范围。
答案:这三个指标均反映计量资料的离散程度。
极差与四分位数间距可用于任何分布,后者较前者稳定,但均不能综合反映各观察值的变异程度;标准差最为常用,要求资料近似服从正态分布;变异系数可用于多组资料间度量衡单位不同或均数相差悬殊时的变异程度比较。
四、习题(一)名词解释1.频数表2.算术均数3.几何均数4.中位数5.极差6.百分位数7.四分位数间距8.方差9.标准差10.变异系数(二)单项选择题1.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变2.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.差C.极差D.标准差3.以下指标中()可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差4.偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距(描述其变异程度)5.各观察值同乘以一个不等于0的常数后,()不变。
A.算术均数 B.标准差C.几何均数D.中位数6.()分布的资料,均数等于中位数。
A.对称B.左偏态C.右偏态D.偏态7.对数正态分布是一种()分布。
A.正态B.近似正态C.左偏态D.右偏态8.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距9.()小,表示用该样本均数估计总体均数的可靠性大。
A. 变异系数B.标准差C. 标准误D.极差10.血清学滴度资料最常用来表示其平均水平的指标是()。
A. 算术平均数B.中位数C.几何均数D. 平均数11.变异系数CV的数值()。
A. 一定大于1B.一定小于1C. 可大于1,也可小于1D.一定比标准差小12.数列8、-3、5、0、1、4、-1的中位数是()。
A. 2B. 0C. D.13.关于标准差,那项是错误的()。
A.反映全部观察值的离散程度B.度量了一组数据偏离平均数的大小C.反映了均数代表性的好坏D.不会小于算术均数14.中位数描述集中位置时,下面那项是错误的()。
A. 适合于偏态分布资料B.适合于分布不明的资料C.不适合等比资料D.分布末端无确定值时,只能用中位数15. 5人的血清滴度为<1:20、1:40、1:80、1:160、1:320描述平均滴度,用那种指标较好()。
A.平均数 B.几何均数C.算术均数D. 中位数16.数列0、48、49、50、52、100的标准差为()。
A.50 B.C. D.17.一组变量的标准差将()。
A.随变量值的个数n的增大而增大B.随变量值的个数n的增加而减小C.随变量值之间的变异增大而增大D.随系统误差的减小而减小18.频数表计算中位数要求()。
A.组距相等B.原始数据分布对称C.原始数据为正态分布或近似正态分布D.没有条件限制19.一组数据中20%为3,60%为2,10%为1,10%为0,则平均数为()。
A. B.C. D. 不知道数据的总个数,不能计算平均数20.某病患者8人的潜伏期如下:2、3、3、3、4、5、6、30则平均潜伏期为()。
A.均数为7天,很好的代表了大多数的潜伏期B.中位数为3天C.中位数为4天D.中位数为天,不受个别人潜伏期长的影响21.某地调查20岁男大学生100名,身高标准差为,体重标准差为,比较两者的变异程度,结果()。
A. 体重变异度大B.身高变异度较大C.两者变异度相同D.由单位不同,两者标准差不能直接比较(三)判断正误并简述理由1.均数总是大于中位数。
( x )2.均数总是比标准差大。
( x)3.变异系数的量纲和原量纲相同。
( x )4.样本均数大时,标准差也一定会大。
( x )5.样本量增大时,极差会增大。
( )(四)计算题1.某卫生防疫站测得大气中的二氧化硫的浓度,用两种计量单位表示:mg/m3: 1 2 3 4 5ug/m3:1000 2000 3000 4000 5000分别计算几何均数及标准差,会发现两种不同单位得标准差相等,试解释其原因。
2.尸检中测得北方成年女子80人的肾上腺重量(g)如下,试(1)编制频数表,(2)求中位数、均数和标准差。
3.测得某地300名正常人尿汞值,其频数表如下。
试计算均数、中位数、何者代表性较好。
表2-2 300例正常人尿汞值(μg/L)频数表尿汞值例数尿汞值例数尿汞值例数0-4924-1648-34-2728-952--8-5832-956-212-5036-460--16-4540-564--20-2244--68-14.有5个变量值7,9,10,14,15,试计算X 及()X X -∑。