卫生统计学试题演示文稿共105页
- 格式:ppt
- 大小:575.50 KB
- 文档页数:105
卫生统计学考试试题卫生统计学是一门运用统计学原理和方法,研究卫生领域中数据的收集、整理、分析和解释的学科。
它对于医学研究、公共卫生决策、医疗质量评估等方面都具有重要的意义。
以下是一套卫生统计学考试试题,旨在考查您对这门学科的理解和应用能力。
一、选择题(每题 3 分,共 30 分)1、以下哪种数据类型通常用于表示性别?()A 定量数据B 定性数据C 等级数据D 连续数据2、均数和标准差的关系是()A 标准差越大,均数代表性越好B 标准差越小,均数代表性越差C 均数越大,标准差越小D 标准差越大,均数代表性越差3、用于描述正态分布资料集中趋势的指标是()A 中位数B 几何均数C 算术均数D 众数4、两样本均数比较,t 检验的前提条件是()A 两样本来自正态总体且方差齐B 两样本来自正态总体C 两样本方差齐D 以上都不对5、完全随机设计方差分析中,组间变异主要反映()A 随机误差B 处理因素的作用C 抽样误差D 测量误差6、进行直线相关分析时,若 r>0,则()A 两变量呈正相关B 两变量呈负相关C 两变量无线性相关D 以上都不对7、对于四格表资料,当n≥40 且有一个理论频数1≤T<5 时,宜采用()A 四格表确切概率法B 校正卡方检验C 配对卡方检验D 直接计算概率法8、标准化法的目的是()A 消除内部构成不同对总率的影响B 消除混杂因素对结果的影响C 使率能够直接进行比较D 以上都对9、生存分析中的生存时间指的是()A 从观察起点到终点事件发生所经历的时间B 从观察起点到终点事件未发生所经历的时间C 从起点事件发生到终点事件发生所经历的时间D 从起点事件发生到终点事件未发生所经历的时间10、以下哪种统计图适用于描述构成比资料?()A 直方图B 折线图C 圆图D 箱式图二、简答题(每题 10 分,共 30 分)1、简述标准差和标准误的区别与联系。
2、简述假设检验的基本步骤。
3、请说明生存分析中生存率和生存曲线的概念及意义。
卫生统计学试题及答案(一)1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B.半对数线图C.直方图D.直条图E.复式直条图【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布)直方图(适用于数值变量,连续性资料的频数表变量)直条图(适用于彼此独立的资料)2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图(一个检测指标,两个分组变量)【答案】E? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______.A.直方图B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)D.直条图E.复式直条图【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则______.A.该研究的样本是1000名易感儿童B.该研究的样本是228名阳性儿童C.该研究的总体是300名易感儿童D.该研究的总体是1000名易感儿童E.该研究的总体是228名阳性儿童【答案】D5.若要通过样本作统计推断,样本应是__________.A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分【答案】C6.下面关于均数的正确的说法是______.A.当样本含量增大时,均数也增大B.均数总大于中位数C.均数总大于标准差D.均数是所有观察值的平均值E.均数是最大和最小值的平均值【答案】D7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.A.均数B.几何均数C.中位数D.方差E.四分位数间距【答案】B几何均数(geometric mean)是用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学研究中常适用于免疫学的指标。
《卫生统计学》考试题库第一章绪论第一章疋量资料的统计扌田述第三章止态分布第四章总体均数的估计和假设检验第五章方差分析第六章分类资料的统计描述第七章二项分布与Poisson分布及其应用第八章X检验第九章秩和检验第十章回归与相关第十章常用统计图表第十二章实验设计第十三章调查设计第十四章医学人口统计与疾病统计常用指标第十五章寿命表第十八早随访资料的生存分析附录:单项选择题参考答案第一章绪论一、 名词解释1.参数(parameter) 4.样本(sample) 7.概率(probability) 二、 单选题 1 •在实际工作中,同质是指: A.被研究指标的影响因素相同2. 5. 8. 统计量(statistic)3. 同质(homogeneity) 6.抽样误差 总体(populati on) 变异(variatio n)B. (sampli ngerror)研究对象的有关情况一样 C.被研究指标的主要影响因素相同 D.研究对象的个体差异很小E. 以上都对2.变异是指: A.各观察单位之间的差异 B.C.各观察单位某测定值差异较大D. 同质基础上,各观察单位之间的差异 各观察单位有关情况不同E.以上都对3•统计中所说的总体是指 A. C. 根据研究目的而确定的同质的个体之全部 根据时间划分的研究对象的全体D. E. 根据人群划分的研究对象的全体 4.统计中所说的样本是指 A.从总体中随意抽取一部分B. C.依照研究者的要求选取有意义的一部分D. B. 根据地区划分的研究对象的全体 随意想象的研究对象的全体有意识地选择总体中的典型部分 从总体中随机抽取有代表性的一部分E.以上都不是 5.按随机方法抽取的样本特点是 A.能消除系统误差 B. 能消除随机测量误差C. 能消除抽样误差D.能减少样本偏性E. 以上都对 6•统计学上的系统误差、测量误差、抽样误差在实际工作中 A.均不可避免 B. 系统误差和测量误差不可避免 C.测量误差和抽样误差不可避免D. 系统误差和抽样误差不可避免E.只有抽样误差不可避免 7 •统计工作的基本步骤是: A.设计、调查、审核、整理资料 B.收集、 C.设计、搜集、整理、分析资料 D.调查、 E.以上都不对审核、整理、分析资料 审核、整理、分析资料&统计工作的关键步骤是A.调查或实验设计B.整理分组C.收集资料D.审核资料E.分析资料,临床观察300名病人的血压情况,确切地说,研究总体是:A. 这300名高血压患者B. 这300名高血压患者的血压值 9 •欲研究某种药物对高血压病的疗效C.所有的高血压患者D. 所有的高血压患者的血压值E.这种药物10•抽样误差是由:A.计算引起B. 测量引起C. 抽样引起D.米样结果不准引起E. 试剂、仪器未经校正引起11 •抽样误差指的是:A.个体值和总体参数值之差 B. 个体值和样本统计量值之差C.样本统计量值和总体参数值之差D. 不同的总体参数之差E.以上都不是12.习惯上,下列属于小概率事件的为A. P=0.09B. P=0. 10C. P=0.15D. P=0.03E. 以上都不是13•治疗效果判定资料属于A.计量资料B. 计数资料C.等级资料D. 无序分类资料E. 以上都不是14.概率P的范围:A. - 1w P w 1B. 0C. P > 1D. -1 w P< 0E. 0 w P< 1三、简答题统计学的基本步骤有哪些?1、2、总体与样本的区别与关系?3、抽样误差产生的原因有哪些?可以避免抽样误差吗?4、何为概率及小概率事件?第二章定量资料的统计描述第三章正态分布1.3. 、名词解释正态分布(normal distribution) 四分位数间距(quartile in terval)2.4.中位数(median)方差(varia nee)5.6.7.8. 正偏态分布(positively skewed distribution) 负偏态分布(negatively skewed distribution) 对数正态分布(logarithmic no rmal distributi on ) 医学参考值范围(medical refere nee ran ge)一、单选题1.卩确定后,S越大,则正态曲线:A. 越陡峭B. 形状不变C. 越平缓D. 向左移动E. 向右移动2.平均数可用于分析下列哪种资料A. 统计资料B.等级资料C. 计数资料D. 计量资料E. 调查资料3.常用的平均数指标有A. 样本均数、总体均数、中位数总体均数、几何均数C. 算术均数、几何均数、中位数B. 算术均数、D. 中位数、样本均数、几何均数E. 以上都不对4.描述一组正态或近似正态分布资料的平均水平用: A.算术均数B.几何均数C. 中位数D. 平均数E.以上均是5.用工二刀A /n 公式计算均数的方法称为 :则应:8.用频数表法计算均数时,组中值应为: A.( 本组段下限值+本组段上限值)/2 B.( C.( 本组下限值+下组上限值)/2 D.E. 本组段的下限值A. 忑不变、CV 变D. 亍变、CV 不变E. -、CV 均改变 10.对于对称分布的资料来说 A. 均数比中位数大 B. 均数比中位数小C. 均数等于中位数13. 对于同一份正偏态的资料A. 几何均数大于算术均数 ,求得的几何均数与算术均数B.几何均数小于算术均数E. 以上说法都不对15.表示变量值变异情况的指标最常用的是: A.四分位数间距B. 全距C. 标准差D. 变异系数E. 方差16. 一组计量资料中,每个变量值与均数之差的平方和、除以变量值的个数7. A.减一个组距 D.加半个组距B. E.对于一组呈负偏态分布的资料A.几何均数B. 中位数加一个组距 以上均不对C.减半个组距,反映其平均水平应用哪个指标 :C. 平均数D. 均数E.算术均数D. 均数与中位数无法确定孰大孰小E.以上说法均不准确11.血清学滴度资料最常计算 以表示其平均水平。
卫生统计学试卷(附答案)-CAL-FENGHAI.-(YICAI)-Company One12004~2005学年第(1)学期预防医学专业本科期末考试试卷(卫生统计学课程)姓名____________________班级____________________学号____________________考试时间:200 年月日午—(北京时间)一、选择题(每题1分,共60分)1、A1、A2型题1. 某7人体重(Kg)资料分别为66 ,48,53,49,55,52,48,则该组数据的中位数为:A. 48.0B. 49.0C. 52.0 D .53.0 E.55.02. 比较7岁男童与17岁青年身高的变异程度,宜用:A. 极差B. 四分位数间距C. 方差D. 标准差E. 变异系数3. 根据观测结果,已建立y关于x的回归方程ˆ 2.0 3.0y x=+,该回归方程表示x 每增加1个单位,y平均增加几个单位?A. 1B. 2C. 3D. 4E.5μ的总体中作五次随机抽样(n=5),问哪一个样本的数据既精4. 设从5.=11确又准确?A. 8,9,10,11,12B. 6,8,10,12,14C. 6,10,12,14,18D. 8,10,12,14,16E. 10,11,12,13,145. 为表示某地近20年来婴儿死亡率的变化情况,宜绘制A.散点图B. 直条图C. 百分条图D. 普通线图E. 直方图6. 临床上用针灸治疗某型头痛,有效的概率为60%现用该法治疗5例,问其中至少2例有效的概率约为A. 0.913B. 0.087C. 0.230D.0.317E. 以上都不对7.二项分布、Poisson分布、正态分布各有几个参数?A. 1,1,2B. 2,1,2C. 1,2,2D. 2,2,2E. 1,2,18. 假定某细菌的菌落数服从Poisson分布,经观察得平均菌落数为9,问菌落数的标准差为:A. 18B. 9C. 3D. 81E. 279. 对于同一资料的直线相关系数与回归系数,下列论断有几句是正确的?相关系数越大,回归系数也越大。
医学统计方法概述l.统计中所说的总体是指:AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.概率P=0,则表示BA某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 DA分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样4.测量身高、体重等指标的原始资料叫:BA计数资料B计量资料C等级资料D分类资料E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1该资料的类型是:DA计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6.样本是总体的CA有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:CA统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BA抽样误差B系统误差C随机误差D责任事故E以上都不对10.以下何者不是实验设计应遵循的原则DA对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 BA算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择CA XB GC MD SE CV13.各观察值均加(或减)同一数后:BA均数不变,标准差改变B均数改变,标准差不变C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时?CA 5B 5.5C 6D lOE 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:DA全距B标准差C方差D变异系数E极差16.下列哪个公式可用于估计医学95%正常值范围 AA X±1.96SB X±1.96SXC μ±1.96SXD μ±t0.05,υSXE X±2.58S 17.标准差越大的意义,下列认识中错误的是BA观察个体之间变异越大B观察个体之间变异越小C样本的抽样误差可能越大D样本对总体的代表性可能越差E以上均不对18.正态分布是以 EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布E均数为中心的频数分布19.确定正常人的某项指标的正常范围时,调查对象是BA从未患过病的人B排除影响研究指标的疾病和因素的人C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人E以上都不是20.均数与标准差之间的关系是EA标准差越大,均数代表性越大B标准差越小,均数代表性越小C均数越大,标准差越小D均数越大,标准差越大E标准差越小,均数代表性越大第九章数值变量资料的统计推断21.从一个总体中抽取样本,产生抽样误差的原因是AA总体中个体之间存在变异B抽样未遵循随机化原则C被抽取的个体不同质D组成样本的个体较少E分组不合理22.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
卫生统计学试题及答案一、选择题1. 卫生统计学的定义是什么?A. 研究人口与卫生的关系B. 收集、整理和分析与卫生有关的数据和信息的科学C. 填写卫生报告的技巧和方法D. 分析和评估卫生政策的效果答案:B2. 卫生统计学的主要任务是什么?A. 收集卫生数据B. 整理卫生数据C. 分析卫生数据D. 以上都是答案:D3. 在卫生统计学中,下列哪项不属于一般健康指标?A. 发病率B. 寿命C. 死亡率D. 科研成果答案:D4. 在卫生统计学中,下列哪项可以用来衡量人群健康状况?A. 平均寿命B. 疾病发生率C. 存活率D. 全部都可以答案:D5. 下列哪个不是访谈法的形式?A. 个别访谈B. 群体访谈C. 网络访谈D. 邮件访谈答案:C二、问答题1. 请简要介绍卫生统计学的研究内容。
卫生统计学是研究与人体健康及卫生相关的数据和信息的科学。
其主要研究内容包括数据的收集、整理和分析,健康指标的评估和监测,以及卫生政策的制定和效果评估等。
2. 什么是发病率?如何计算?发病率是指在特定时间内,某一特定疾病的新患者数与相应人群总数的比例。
计算方法为:发病率 = 特定疾病的新患者数 / 相应人群总数× 1000‰3. 请简述卫生统计学中常用的数据收集方法。
卫生统计学中常用的数据收集方法有以下几种:- 问卷调查:通过发放问卷或进行电话访谈的方式收集信息。
- 查体:通过对人体状况进行检查获得相关数据。
- 记录法:对已有的医疗记录或档案资料进行整理和分析。
- 实验法:通过实验设计和实施来收集相关数据。
4. 请解释以下概念:死亡率、出生率、流行病学三要素。
- 死亡率:在特定时间和特定人群中,死亡人数与总人口数的比例。
常用于衡量人群的健康状况。
- 出生率:在特定时间和特定人群中,出生人数与总人口数的比例。
常用于衡量人口的生育水平。
- 流行病学三要素:流行病学研究的基本方法,包括宿主、病原体和环境三个要素。
宿主指的是患病或潜在患病的个体;病原体指的是引起疾病的病原微生物或其他因素;环境指的是宿主和病原体之间的相互作用和影响。
医学统计方法选择题一:医学统计方法概述l.统计中所说的总体是指:AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.概率P=0,则表示BA某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 DA分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样4.测量身高、体重等指标的原始资料叫:BA计数资料B计量资料C等级资料D分类资料E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1该资料的类型是:DA计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6.样本是总体的CA有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于&not;&not;统计工作哪个基本步骤:CA统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BA抽样误差B系统误差C随机误差D责任事故E以上都不对10.以下何者不是实验设计应遵循的原则DA对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 BA算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择CA XB GC MD SE CV13.各观察值均加(或减)同一数后:BA均数不变,标准差改变B均数改变,标准差不变C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时), 问该食物中毒的平均潜伏期为多少小时?CA 5B 5.5C 6D lOE 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:DA全距B标准差C方差D变异系数E极差16.下列哪个公式可用于估计医学95%正常值范围 AA X±1。
卫生统计学试卷(附答案)2021~2021学年第(1)学期预防医学专业本科期末考试试卷(卫生统计学课程)姓名_ _学生号____________________考试时间:200年月日午―(北京时间)一、多项选择题(每题1分,共60分)类型1、A1和A2问题答题说明:每题均有a、b、c、d、e五个备选答案,其中只有一个正确答案,将其选出,并在答题卡上将相应的字母涂黑。
..1.某7人体重(kg)资料分别为66,48,53,49,55,52,48,则该组数据的中位数为:a.48.0b.49.0c.52.0d.53.0e.55.02.比较7岁男童与17岁青年身高的变异程度,宜用:a.极差b.四分位数间距c.方差d.标准差e.变异系数?? 2.0? 3.0x,回归方程表明X的每增加13.0x根据观察结果,Y关于X的回归方程已经建立,Y单位,Y平均增加多少单位?a.1b.2c.3d.4e.54.设置从机??在11.5人的群体中随机抽取五个样本(n=5),询问哪个样本的数据准确无误?a、 8,9,10,11,12b。
6,8,10,12,14c。
6,10,12,14,18d。
8,10,12,14,16e。
10,11,12,13,145.为表示某地近20年来婴儿死亡率的变化情况,宜绘制a.散点图b.直条图c.百分条图d.普通线图e.直方图6.临床上,针灸用于治疗某种类型的头痛,有效概率为60%。
目前用这种方法治疗5例,至少2例的有效概率约为a.0.913b.0.087c.0.230d.0.317e.以上都不对7.二项分布、poisson分布、正态分布各有几个参数?a.1,1,2b.2,1,2c.1,2,2d.2,2,2e.1,2,18.假设某一细菌的菌落数服从泊松分布,观察到平均菌落数为9,菌落数的标准差为:a.18b 9c。
3d。
81e。
279.对于同一资料的直线相关系数与回归系数,下列论断有几句是正确的?相关系数越大,回归系数也越大。
统计学习题二、简答1 .简述描述一组资料的集中趋势和离散趋势的指标.集中趋势和离散趋势是定量资料中总体分布的两个重要指标.〔1〕描述集中趋势的统计指标:平均数〔算术均数、几何均数和中位数〕、百分位数〔是一种位置参数,用于确定医学参考值范围,P50就是中位数〕、众数.算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料〔频率图一般呈正偏峰分布〕、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料.〔2〕描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数.四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势. 方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料, 常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比拟.2 .举例说明变异系数适用于哪两种形式的资料,作变异程度的比拟度量衡单位不同的多组资料的变异度的比拟. 例如,欲比拟身高和体重何者变异度大,由于度量衡单位不同,不能直接用标准差来比拟,而应用变异系数比拟.3 .试比拟标准差和标准误的关系与区别.区别:⑴标准差S:①意义:描述个体观察值变异程度的大小.标准差小,均数对一组观察值得代表性好;②应用:与均数结合,用以描述个体观察值的分布范围,常用于医学参考值范围的估计;③与n的关系:n越大,S越趋于稳定;⑵ 标准误①意义:描述样本均数变异程度及抽样误差的大小.标准误小,用样本均数推断总体均数的可靠性大;②应用于均数结合,用以估计总体均数可能出现的范围以及对总体均数作假设检验;③与n的关系:n越大,3越小.联系:①都是描述变异程度的指标;②由S=s/n-1可知,&与S成正比.n一定时,s越大,S<越大.4 .简述应用相对数时的考前须知.应用相对数应该注意:①预防概念混淆,预防以比代率的错误现象;②计算相对数时分母应有足够数量,如果例数较少会使相对数波动较大,应该使用绝对数;③正确的计算频率〔或强度〕指标的合计值.当分组的资料需要合并起来估计频率〔或强度〕时,应将各组频率的分子相加作为合并估计的分子,各组的分母相加作为合并估计的分母;④频率型指标的解释要紧扣总体和属性;⑤相对数间比较要具备可比性:要注意观察对象是否同质、研究方法是否相同、观察时间是否一致、观察对象内部结构是否一致、比照不同时期资料应注意客观条件是否相同;⑥正确进行相对数的统计推断:在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此要进行参数估计和假设检验.5 .说明率的标准化的根本思想及考前须知.⑴标准化:两个率或多个率之间进行比拟时, 为消除内部构成不同的影响,采用 统一的标准,对两组或多组资料进行校正〔调整〕,计算得到标准化率后再做比 较的方法,称为〜.其目的是统一内部构成,消除混杂因素,是资料具有可比性. ⑵应用标准化法的考前须知:①标准化法的应用范围很广.当某个分类变量在 两组中分布不同时,这两个分类变量就成为两组频率比拟的混杂因素,标准化的目的是消除混杂因素.②标准化后的标准化率,已经不再反映当时当地的实际水平,只表示相互比拟的资料间的相对水平. ③标准化法实质是找一个标准, 使两组得意在一个共同的平台上进行比拟.选择不同的标准,算出的标准 化率 也会不同,比拟的结果也未必相同,因此报告比拟结果时必须说明所选用的标准 和理由.④两样本标准化率是样本值,存在抽样误差.比拟两样本标准化率, 当样本含量较小时,还应作假设检验.6 .简述二项分布、Poisson 分布、正态分布三者的关系.①二项分布与Poisson 分布的关系:当n 很大,发生概率冗〔或1-冗〕很小, 二项分布B 〔n,兀〕近似于Poisson 分布P 〔口冗〕;②二项分布与正态分布的关系:当 n 较大,冗不接近0或1 〔特别是当n 九和n 〔1-九〕均大于5时〕,二项分布B 〔n,冗〕近似于正态分布 N ⑴兀,nt 〔1- 兀〕〕; ④Poisson 分布与正态分布的关系:当 人学20时,Poisson 分布渐进正态分布 N 〔入,入〕.关系:①a + B 不一■定等于1.②在样本容量确定的情况下,a 与B 不能同时增加或减少③统计检验力〔1- B 〕.9、参考值范围与总体均数置信区间的区别 〔1身胃值越憎①宣义:姬大多敢人某项指板的数位箱阐;__②计算:正态分•.'电X ±20 .. v S ;单值I I X - 4工8 〕或1-9. X + 19 £〕植端分布获㈣pjR —J 牵似〔Pi. g1或:-g, p-.M 〕任应用;判断某项指后正常与否二总体均数的置售区间tJ 克义;技一定的罟信度佶计总体功数:i 在/用:2 lift ;正态分布□ L ; 口:娟侧了二士「h S-,鼠伸]I. 产二,g 〕或?,,,一%.5『?:0 己如:双巾X ±Z_ n a _ * 单例〔X ~Z… 0一…।支S•, X + Z n a _ :0 工1 *6'• X口J X正态分布江侑峰分布1 o米勒但n是5大】JKWX ±Z tt1.Si 单恻f5-4〞S-P a 或C-U .1 XU.i J L③应用:估计总体均数所在棺围.10 .医院拟研究某新药治疗高血压的疗效,试确定该研究设计中的三要素.实验设计的根本要素:受试对象、处理因素、实验效应;受试对象即为高血压患者,且应分实验组与对照组;处理因素至少应包括旧药治疗、新药治疗,最好设有抚慰剂治疗;实验效应即疗程开始及结束时患者血压变化状况.11 .简述非参数检验的应用条件和优缺点.非参数检验适用于:①有序变量资料;②总体分布类型不明的资料;③分布不对称且无法转化为正态分布资料;④比照组间方差不齐,有无适当变换方法到达方差齐性的资料;⑤一端或两端观察值不确切的资料;⑥等级资料.优缺点:不以特定的总体分布为前提,也不针对决定总体分布的几个参数做推断, 进行的是分布之间的检验.一般不直接用样本观察值做分析,统计量的计算基于原数据在整个样本中按大小所占位次. 由于丢弃了观察值的具体数据,只保存了大小次序的信息,凡适合参数检验的资料,应首选参数检验.12 .举例简要说明随机区组设计资料秩和检验的编秩方法.随机区组设计资料秩和检验的编秩方法为将每个区组的数据由小到大分别编秩, 遇相同数据取平均秩次,按处理因素求秩和;T++T=n 〔n+1〕 /2.13 .简述相关分析的步骤.①进行相关分析前,应先绘制散点图.只有散点有线性趋势时,才能进行直线相关分析.②线性相关分析要求两个变量都是随机变量,而且仅适用于二元正态分布资料;③出现离群值慎用相关;④相关关系不一定是因果关系;⑤分层资料盲目合并易出现假象;⑥样本的相关系数接近零并不意味着两变量间一定无相关性, 有可能是非线性的曲线关系.14 .简述回归模型的适用条件.线性回归模型的适用条件:①线性:因变量Y与自变量X称线性关系;②独立:每个个体观察值之间互相独立;③正态性:任意给定X值,对应的随机变量Y都服从正态分布;④等方差性:在一定范围内不同的X值所对应的随机变量Y 的方差相等.简记为LINE.15 .试述直线相关与直线回归的区别与联系.⑴区别:① 单位:相关系数r没有单位,回归系数b有单位;所以,相关系数与单位无关,回归系数与单位有关;②应用目的:说明两变量间的关联性用相关分析, 说明两者依存变化的数量关系那么用回归分析;③对资料的要求不同:线性回归要求应变量Y是服从正态分布的随机变量;线性相关要求两个变量X和Y为服从双变量正态分布的随机变量.④取值范围:-oo<b<+oo, -1 < r< 1 ;⑤意义:回归系数b表示X每增〔减〕一个单位,Y平均改变b个单位;相关系数r说明具有线性关联的两个变量间关系的密切程度与相关方向;⑤计⑵联系:①方向一致:r与b的正负号一致;②假设检验等价:tr=tb ;; ④用回归解释相关决定系数〔coefficient of determination〕:回归平方和越接近总平方和,那么r2越接近1,相关性越好.三、分析题〔不需要具体计算,给出大概计算步骤即可〕1 .某研究调查了山区、丘陵、平原和沿海地区居民饮用水中氟含量与氟骨症患病率如下表,试问:1〕饮用水中氟含量与氟骨症患病率有无关系2〕有人说,如相关系数的检验结果为P<0.05,可认为,饮水中氟含量高是导致氟骨症高发的原因之一,对吗氟含量〔mg/l〕0.480.644.001.481.602.863.214.71患病率〔%〕22.3723.31 25.32 22.29 28.59 35.00 46.07 46.081〕通过相关分析确定是否有关系:由于两个变量中患病率不能确定其正态性, 本研究宜采用秩相关分析;首先对资料依次进行编秩,根据公式计算秩相关系数r s,然后进行秩相关系数的假设检验,H0: ps=0相关系数为0, H I: ps为相关系数不为0; a =0.05;通过查表或t检验的方法求得统计量与P值,按检验水准作出统计推断.2 〕 P<0.05只能说明他们有统计学上的关联,不能推断因果关系,同时,这个结果是从局域水平上说明两个指标之间的关系,可能存在生态学谬误.2.某医生欲比拟三种镇咳药的疗效,分析三种镇咳药延迟咳嗽的时间.结果经方差分析得下表.(1)请补充并完成方差分析;(2)解释结果.方差分析步骤:(1)建立检验假设,确定检验水准出三种镇咳药疗效相同(误)H:三种镇咳药疗效不同(误)三种镇咳药延迟咳嗽的时间总体均数相同H:三种镇咳药延迟咳嗽的时间总体均数不全相同民=0.05(2)计算检验统计量根据公式F=MS且间/MS组内,求得F=3.445(3)确定P值,作出推断根据V 1= V组间=2, V 2=v组内=37,查F界值表,可知P< 0.05 ,按a =0.05水准, 差异具有统计学意义,可认为三种镇咳药延迟咳嗽的时间总体均数不全相同.3.测得老年性慢性支气管炎病人与健康人的尿中17酮类固醇排出量见下表,比拟两组均数差异是否有统计学意义并解释结果.表X2老年慢支病人与健康人尿中17酮类固醇排出量(mg/24h)病人组2.90 5.41 5.48 4.60 4.03 5.10 5.92 4.97 4.24 4.36 2.72 2.372.09 7.10健康组5.18 8.493.14 6.46 3.726.64 4.01 5.60 4.57 7.71 4.99答:该资料宜采用两独立样本t检验进行分析:(1)建立检验假设,确定检验水准^1=^2,即慢性支气管炎病人组与健康人组的尿中17酮类固醇排出量总体均数相同.H: gw仙2,慢性支气管炎病人组与健康人组的尿中17酮类固醇排出量总体均数不同.a =0.05(2)计算检验统计量根据两组资料方差齐性检验确定用t检验或L检验,根据公式求得统计量t (t ')(3)确定P值,作出推断根据V =n1+n2-2,查t界值表,判断P值大小①假设P> 0.05,接受Hb,可认为两组17酮类固醇排出量总体均数无差异②假设P< 0.05,拒绝H0,接受H 认为两组类固醇排出量总体均数有差异.4.在某地卫生效劳调查中随机抽样调查了400户家庭,他们的平均年医疗费用支出是947元,标准差是291元.设家庭医疗费用近似正态分布,请估计这些 家庭的95麻医疗费用支出范围,并估计当地家庭年医疗费用平均支出.答:假设该地平均年医疗费用支出服从t 分布,由于n=400,可认为t 分布近似 服从标准正态分布.1〕这些家庭的95■医疗费用支出范围即根据95%勺标准计算这些家庭年医疗费 用支出的置信区间,根据公式:均数 班准差*Z 0.05/n -1求得95%S 信区间为:947^291*1.96/400 -1得出这些家庭的95■医疗费用支出范围为〔918, 976〕.2〕估计当地家庭年医疗费用平均支出即提供当地家庭大多数家庭年医疗费用支 出,即提供一个参考值范围,根据公式:均数项准差*Z 0.05求得参考值范围为:947磔1*1.96, 〔377-1517〕.5、某牧区观察慢性布鲁氏病患者植物血凝素 〔PHA 〕皮肤试验反响,问活动型与 稳定型布鲁氏病患者PHAffl 性反响率有无差异〔写出详细步骤〕. 11活动型 1 14 15稳定型 3 7 10提示:四格表周边合计不变的情况下,不同组合确实切概率如下〔1〕建立检验假设,确定检验水准出 冗尸冗2,活动型与稳定型布鲁氏病患者 PHN 日性反响率无差异H:九1手冗2,活动型与稳定型布鲁氏病患者 PH 郊日性反响率有差异a =0.05〔2〕计算检验统计量由于有格子出现1&T&5,因此用确切概率法计算 P 值.⑶确定P 值,作出推断由提示中表〔2〕可知P=0.14>0.05,不拒绝H0,认为活动型与稳定型布鲁氏 病患者PHAffl 性反响率无差异.⑴ 0.0166 ⑵0.14236、观察局部温热治疗移植肿瘤小鼠的疗效,以小鼠的生存天数作为观察指标,结果如下.问: 局部温热治疗对移植肿瘤小鼠的生存天数是否有影响(g=i)(g=2)生存日数秩次生存日数秩次1021231541551661771882092310>90111213(1)对该资料进行编秩,以便进行统计分析(2)两组的理论秩和分别为多少(3)作出统计推断.5 (6分)观察局部温热治疗移植胆寤小鼠的疗效,以小鼠的生存天数作为观察指标,结果如下.问:局部温热治疗对移椎肿相小鼠的生存天数是否有影哨?实粒组但=】)对照组但=2)生存日数秩次生存日薪铁次109.52J1212…*3151*,541515 J5416176P1S719S20一口g232110咖22111L1212.*14(1)对该管料进行编程•葭便逐行统计分折(2)两组的理论铁和分别为多少实验组的理论秩和为115,对照组的理论佚和为138(3)(1)建立检验假设,确定检验水准H0:两组温热治疗时小鼠的生存天数总体分布位置相同;H1:两组温热治疗时小鼠的生存天数总体分布位置不相同;a =0.05 ;(2)计算检验统计量根据公式计算统计量T值(3)确定P值,作出推断通过查T界值表,确定P值① 假设P> 0.05,接受H,可认为两组温热治疗时小鼠的生存天数总体分布位置相同.②假设P<0.05,拒绝H),接受H两组温热治疗时小鼠的生存天数总体分布位置不相同四、论述题1.估计样本例数的意义何在需要确定哪些前提条件答:样本含量估计充分反映了 "重复〞的根本原那么,过小过大都有其弊端.样本含量过小,所得指标不稳定,用以推断总体的精密度和准确度差;检验的功效低,应有的差异不能显示出来,难以获得正确的研究结果,结论也缺乏充分的依据.样本含量过大,会增加实际工作的困难,浪费人力、物力和时间.可能引入更多的混杂因素,从而影响数据的质量.实验所需的样本含量取决于4个因素:(1)假设检验的第I类错误的概率a (2) 假设检验的第II类错误的概率 B (3)容许误差6 (4)总体标准差6或总体概率九o单纯的课本内容,并不能满足学生的需要,通过补充,到达内容的完善教育之通病是教用脑的人不用手,不教用手的人用脑,所以一无所能.教育革命的对策是手脑联盟,结果是手与脑的力量都可以大到不可思议.。