3.均数的抽样误差和总体均数估计
- 格式:ppt
- 大小:1.24 MB
- 文档页数:47
《卫生统计学》习题集上海医药高等专科学校《营养与卫生》教研组一、最佳选择题(一)基本概念与步骤1、将计量资料制作成频数表的过程,属于统计工作基本步骤。
A、统计设计B、收集资料 D、分析资料2、某地区抽查1000名成年人的血压并制作成频数表,这属于资料。
B、计数资料C、等级资料D、半定量资料3、上述调查按血压正常与否整理资料,其中高血压患者200名,血压正常者800名,这属于资料。
A、定量资料 C、等级资料 D、半定量资料4、对变异的事物可采用抽样观察,其主要目的是A、反映某个体情况B、反映某样本情况D、上述都是5、要使样本对总体具有代表性,下列是错误的措施。
A、样本与总体应同质B、样本含量应适宜C、应采用随机抽样7、与抽样误差大小无关的是A、个体变异大小B、样本含量大小C、随机抽样方法不同8、从一个总体中抽取样本,产生抽样误差的原因是B、抽样未遵循随机化原则C、被抽取的个体不同质D、组成样本的个体较少9、从4个市级医院外科病史中随机抽样,反映全市外科医护质量,你认为A、可以,抽样面广B、不可以,可能样本太小C、可以,是随机抽样10、搞好统计工作,达到预期目标,最重要的是A 、原始资料要正确B 、整理资料要全面C 、分析资料要合理11、某地区1000名儿童粪检蛔虫卵,按阳性和阴性整理汇总,这属于 资料。
A 、定量资料 C 、等级资料 D 、半定量资料12、统计学上通常认为P < 的事件,在一次观察中不会发生。
、0.1 C 、0.5 D 、1.014、由变异所导致的现象中,下列 除外。
A 、X 1≠X 2B 、1X ≠2XC 、μ≠X 1≠μ215、概率P=0,则表示B 、某事件必然发生C 、某事件发生的可能性很小D 、某事件发生的可能性很小16、要减少抽样误差,最切实可行的方法是B 、控制个体变异C 、遵循随机化原则抽样D 、严格挑选研究对象(二)计量资料统计描述(频数分析)1、X 是表示变量值 的统计指标。
第一章医学统计中的基本概念 (1)第二章集中趋势的统计描述 (3)第三章离散程度的统计描述 (7)第四章抽样误差与假设检验 (12)第五章t检验 (14)第六章方差分析 (20)第七章相对数及其应用 (26)第八章2 检验 (29)第九章非参数检验 (35)第十章线性相关与回归 (44)第十一章多元线性回归与多元逐步回归 (50)第十二章统计表与统计图 (56)第十三章医学实验设计与诊断试验的评价 (60)练习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
公卫执业医师-综合笔试-卫生统计学-第三单元总体均数的估计和假设检验[单选题]1.两个样本均数比较作t检验,其他条件不变,犯第Ⅱ类错误的概率最小的是A.α=0.05B.α=0.(江南博哥)01C.α=0.1D.α=0.2E.该问题提法不对正确答案:D参考解析:一类错误α和二类错误β有一定的关系,α越大,β越小。
所以本题答案选择D。
掌握“Ⅰ型错误与Ⅱ型错误”知识点。
[单选题]5.下列关于均数的标准误的叙述,错误的是A.是样本均数的标准差B.反映样本均数抽样误差大小C.与总体标准差成正比,与根号n成反比D.增加样本含量可以减少标准误E.其值越大,用样本均数估计总体均数的可靠性越好正确答案:E参考解析:样本均数的标准差称为均数的标准误,是描述样本均数抽样误差大小的指标,其大小与总体标准差成正比,与根号n成反比。
标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越好。
故选项E叙述错误,本题选E。
掌握“标准误及可信区间★”知识点。
[单选题]6.关于可信区间,正确的说法是A.可信区间是总体中大多数个体值的估计范围B.95%可信区间比99%可信区间更好C.不管资料呈什么分布,总体均数的95%的可信区间计算公式是一致的D.可信区间也可用于回答假设检验的问题E.可信区间仅有双侧估计正确答案:D参考解析:按一定的概率估计总体参数的可能范围,该范围称为可信区间,可以用来估计总体均数的可能所在范围,常按95%可信度估计总体参数的可能范围。
掌握“标准误及可信区间★”知识点。
[单选题]7.同类定量资料下列指标,反映样本均数对总体均数代表性的是A.四分位数间距B.标准误C.变异系数D.百分位数E.中位数正确答案:B参考解析:样本均数的标准差即均数的标准误,简称标准误。
可用来描述样本均数的抽样误差,标准误越小,则说明样本均数的抽样误差越小,样本均数对总体均数的代表性越好。
掌握“标准误及可信区间★”知识点。
[单选题]8.比较两药疗效时,下列可作单侧检验的是A.己知A药与B药均有效B.不知A药好还是B药好C.己知A药与B药差不多好D.己知A药不会优于B药E.不知A药与B药是否有效正确答案:D参考解析:已知A药不会优于B药,只有低于B药的一种可能,所以可作单侧检验。
一章绪论同质:是指被研究指标的影响因素相同。
实际工作中,影响被研究指标的主要的可控制的因素达到相同或基本相同就可认为是同质。
变异:同质观察单位之间的差异,是生物界的重要特征,是产生随机现象的根本原因。
总体:根据研究目的所确定的研究对象的全体称总体。
更确切的讲,是指根据研究目的所确定的全部同质观察单位某项变量值的集合。
总体分类:有限总体:在确定的时间和空间范围内包括有限个观察单位。
如:无限总体:没有时间和空间的范围限制,观察单位数不确定。
女口样本:研究对象的一部分称样本。
(要求从总体中随机抽取的有代表性的一部分)根据研究范围,总体与样本是一个相对的概念。
误差(error)实测值与真值之差,或样本指标与总体指标之差。
误差分类:随机误差:(又分抽样误差、重复误差)系统误差(可避免)过失误差抽样误差(sampling error):由于抽样所致样本指标与总体指标的差异(主要由变异引起),是客观存在的。
特点:①无倾向性②不可避免③可估计大小,主要受样本含量大小的影响随机误差呈正态分布,可用医学统计学方法进行分析。
参数:总体指标,多用希腊字母表示。
如:丄、;「、二统计量:样本指标,多用拉丁字母表示。
如:X、S、P变量:指观察单位的某种特征。
能够反应观察单位的变异性。
如:性别、身高、体重、红细胞计数等变量值(或观察值):对变量的测量的具体数值大小。
变量分类:1、定量变量:{1离散型变量2、连续型变量}2、定性变量:{1、分类变量名义变量(最常见)、2、有序变量等级变量}二分类变量是最简单最常用的分类变量、九章卡方检验X2检验的基本思想:用统计量度量实际频数和理论频数之间的偏离程度(X 2反映了实际频数与理论频数的吻合程度)X 2检验的应用条件(1)当n A40且T> 5时,用X 2检验的基本公式或四格表的专用公式;当P~ a时,改用四格表的确切概率法。
⑵当n A 40时但有1 < T V 5时,用四格表X 2的校正公式或用四格表的确切概率法⑶当n v40时,或T V 1时,用四格表的确切概率法X 2检验的步骤:2、四分位数间距:包括中间资料的离散程度。
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。
总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利用样本信息可以对总体特征进行推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。
参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间揭示的是按一定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、二项分布法。
置信区间估计总体参数所在范围参数统计(parametric statistics)非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。
回归系数有单位,而相关系数无单位β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。