卫生统计学简答题
- 格式:doc
- 大小:42.00 KB
- 文档页数:4
样本:从研究总体中随机抽得的有代表性的一部分个体的实测值的集合参数:是统计模型的特征指标,其大小是客观存在的,然而往往是未知的抽样:从研究总体中抽取一部分有代表性的个体的方法正态分布:指中间频数多两边频数渐少的连续型对称分布抽样误差:由于生物固有的个体变异的存在,从某一总体中随机抽取一个样本,所得样本统计量与相应的总体参数往往是不同的,这种差异称。
表现为样本统计量之间、样本统计量与总体参数间的差异标准误:样本均数的标准差,反映抽样误差的大小,即样本均数与样本均数之间差异的大小假设检验:指对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设统计推断的方法第1类错误:指拒绝正确的零假设时所犯的错误:“实际无差别,但下了有差别的结论(假阳性错误)”犯这种错误的概率是α第2类错误:不拒绝原本不正确的零假设时所犯的错误:“实际有差别,但下了无差别的结论”(假阴性错误)犯这种错误的概率是β方差分析;是通过对数据变异的分解来判断不同样本所代表的总体均值是否相同,用于比较两个或两个以上均数的差别随机区组设计:又称配伍组设计,将受试对象按性质相同或相近者组成b个区组,每个区组中的受试对象分别随机分配到k个处理组中去参数检验:指以特定的总体分布为前提,对未知的总体参数做推断的假设检验方法非参数检验:指不以特定的总体分布为前提,也不针对决定总体分布的几个参数做推断的假设检验方法线性相关:又称简单相关,是指两个随机变量X、Y之间呈线性趋势的关系线性相关系数:又称pearson积矩相关系数,是定量描述两个变量间线性关系密切程度和相关方向的统计指标回归:表示变量之间某种数量依存关系的统计学术语回归分析:研究一个变量如何随另一些变量变化的常用方法线性回归:又称简单回归,研究两个连续型变量之间线性依存关系的统计方法标准化残差:将每个残差值减去所有残差值的均数,再除以所有残差值的标准差后所得的值异常值:又称离群值,指大于1.5倍四分位数间距的数值,在箱式图中常用圆圈’o”表示统计表的组成:标题、标目、线条、数字、备注统计图的组成:标题、标目、图域、尺度、比例三类相对数:频率强度相对比实验设计的三个基本要素:受试对象处理因素实验效应实验设计的基本原则:对照随机重复描述集中趋势的统计指标:均数几何均数中位数众数描述离散趋势的统计指标:极差四分位数间距方差标准差变异系数简述二项分布、Poisson分布、正态分布的区别与联系二项分布、Poisson分布是离散型分布,用概率函数描述其分布状况,而正态分布是连续性概率分布,用密度函数和分布函数描述其分布状况。
统计学简答汇总第一章:绪论(无)第二章:定量变量的统计描述1.均数﹑几何均数与中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
不同点:表2-5、表2-5 均数,几何均数与中位数的相异点平均数意义应用场合均数平均数量水平应用甚广,最适用于对称分布,特别就是正态分布几何均数平均增减倍数①等比资料;②对数正态分布资料中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两察值水平端出现不确定值2.中位数与百分位数在意义上﹑计算与应用上有何区别与联系?答:1)意义:中位数就是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。
百分位数就是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位就是P50即中位数。
多个百分位数结合使用,可更全面地描述总体或样本的分布特征。
(2)计算:中位数与百分位数均可用同一公式计算,即Px=L+(i/f x)(n·x%-Σf L)可根据研究目的选择不同的百分位数代入公式进行计算分析。
(3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。
中位数常与其它分位数结合起来描述分布的特征,在实际工作中更为常用。
百分位数还可以用来描述变量值的离散趋势(四分位数间距)。
3.同一资料的标准差就是否一定小于均数?答:不一定。
同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。
变异大,标准差就大,有时比均数大;变异小,标准差小。
4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?(1)样本含量的大小,样本含量越大,标准差越稳定。
(2)分组的多少(3)分布形状的影响,偏态分布的标准差较近似正态分布大(4)随机测量误差大小的影响(5)研究总体中观察值之间变异程度大小5.标准差与变异系数的异同点有哪些?答:标准差:就是以算数平均数为中心,反映各观测值离散程度的一个绝对指标、当需要对同一总体不同时期或对不同总体进行对比时,缺乏可比性、当总体平均水平不同或计量单位不同时,用标准差就是无法实现两组数据离散程度大小对比的、变异系数:标准差与平均数的比值称为变异系数,记为C·V、变异系数可以消除单位与(或)平均数不同对两个或多个资料变异程度比较的影响。
自考卫生统计学试题及答案一、单项选择题(每题2分,共20分)1. 卫生统计学是一门应用______的学科。
A. 社会学B. 数学C. 医学D. 经济学答案:B2. 下列哪项不是卫生统计学的研究内容?A. 疾病流行情况B. 健康服务需求C. 医疗资源分配D. 文学创作答案:D3. 总体是指研究中所要考察研究对象的______。
A. 个体B. 群体C. 样本D. 全部答案:B4. 卫生统计中的样本容量是指______。
A. 样本中的个体数B. 总体中的个体数C. 样本的体积或重量D. 总体的体积或重量答案:A5. 描述集中趋势的统计量不包括以下哪项?A. 平均数B. 中位数C. 众数D. 极差答案:D二、多项选择题(每题3分,共15分)6. 卫生统计学中常用的数据类型包括()。
A. 分类数据B. 顺序数据C. 计数数据D. 连续数据E. 时间数据答案:A B C D7. 下列哪些是描述离散趋势的统计量?()A. 方差B. 标准差C. 极差D. 均数E. 四分位数间距答案:A B C E8. 在卫生统计学中,以下哪些因素会影响统计推断的可靠性?()A. 样本容量B. 抽样方法C. 数据质量D. 统计方法E. 研究目的答案:A B C D三、简答题(每题10分,共20分)9. 简述卫生统计学在医学研究中的应用。
答案:卫生统计学在医学研究中的应用主要包括:疾病流行病学的调查与分析、临床试验设计与评估、医疗质量的监控与改进、健康服务研究、医疗资源的规划与分配等。
10. 描述卫生统计学中标准正态分布的特点。
答案:标准正态分布是一种特殊的正态分布,其均数为0,标准差为1。
它具有以下特点:对称性,以均数为中心左右对称;连续性,连续分布在整个实数轴上;正态性,数据分布呈现钟形曲线;无偏性,均数、中位数和众数相等;稳定性,样本均数的分布接近正态分布。
四、计算题(每题15分,共30分)11. 某地区进行健康体检,随机抽取了100名成年人,测量了他们的血压。
卫生统计学自考试题及答案一、单项选择题(每题1分,共10分)1. 下列哪项不是卫生统计学的主要研究内容?A. 疾病的流行规律B. 疾病的预防措施C. 卫生服务的需求与供给D. 统计图表的绘制答案:D2. 以下哪个指标用于衡量一个地区居民的健康状况?A. 发病率B. 死亡率C. 期望寿命D. 患病率答案:C3. 在卫生统计中,以下哪个概念是指一定时间内某病新发生的病例数与暴露人口数之比?A. 死亡率B. 患病率C. 发病率D. 感染率答案:C4. 以下哪个统计量可以用来描述一组数据的离散程度?A. 平均数B. 中位数C. 标准差D. 众数答案:C5. 在卫生统计中,相对危险度(RR)是指:A. 病例组与对照组的发病率之比B. 病例组与对照组的患病率之比C. 病例组与对照组的疾病特异性死亡率之比D. 病例组与对照组的疾病风险之比答案:D6. 以下哪种抽样方法属于非概率抽样?A. 系统抽样B. 分层抽样C. 整群抽样D. 便利抽样答案:D7. 在卫生统计中,以下哪个指标用于衡量疾病对个体健康影响的严重程度?A. 疾病负担B. 疾病频率C. 疾病严重度D. 疾病持续期答案:A8. 下列哪项是卫生统计学中常用的描述性统计分析方法?A. 回归分析B. 卡方检验C. 描述性统计D. 生存分析答案:C9. 在卫生统计中,以下哪个指标用于衡量医疗服务的覆盖面?A. 服务利用率B. 服务满意度C. 服务可及性D. 服务公平性答案:A10. 以下哪个统计图适合展示不同地区或不同时间的连续数据变化趋势?A. 柱状图B. 饼图C. 线图D. 散点图答案:C二、多项选择题(每题2分,共10分)11. 以下哪些因素可以影响疾病的流行?A. 环境因素B. 遗传因素C. 社会经济因素D. 行为因素E. 医疗条件答案:ABCDE12. 在卫生统计学中,以下哪些指标属于描述性统计指标?A. 平均数B. 标准差C. 患病率D. 发病率E. 相关系数答案:ABD13. 下列哪些方法可以用来计算疾病的相对危险度?A. 队列研究B. 病例对照研究C. 交叉设计研究D. 生态学研究E. 实验研究答案:ABD14. 在卫生统计学中,以下哪些因素可能影响样本的代表性?A. 抽样方法B. 样本大小C. 抽样误差D. 非抽样误差E. 抽样比例答案:ABCD15. 以下哪些因素需要在进行卫生统计分析时进行调整?A. 年龄B. 性别C. 种族D. 经济状况E. 教育水平答案:ABCDE三、简答题(每题5分,共20分)16. 简述卫生统计学的定义及其在公共卫生领域的作用。
卫生统计学试题及答案一、选择题(每题1分,共10分)1. 卫生统计学是研究什么的科学?A. 疾病的预防和治疗B. 疾病的流行规律C. 卫生服务的管理和评价D. 卫生数据的收集、处理和分析2. 以下哪个不是卫生统计学中常用的数据类型?A. 计量资料B. 计数资料C. 排名资料D. 等级资料3. 卫生统计学中的描述性统计主要解决什么问题?A. 数据的收集B. 数据的描述C. 数据的推断D. 数据的预测4. 卫生统计学中的参数估计和假设检验的目的是什么?A. 描述数据分布B. 推断总体参数C. 预测未来趋势D. 判断数据的可靠性5. 以下哪个是卫生统计学中常用的分布?A. 正态分布B. 均匀分布C. 泊松分布D. 所有选项都是6. 卫生统计学中的相关分析和回归分析的区别是什么?A. 相关分析可以判断因果关系B. 回归分析可以判断因果关系C. 相关分析是描述性分析D. 回归分析是推断性分析7. 卫生统计学中的样本量计算的目的是?A. 减少数据收集的成本B. 确保研究结果的可靠性C. 提高数据收集的效率D. 减少数据收集的时间8. 在卫生统计学中,生存分析主要研究的是?A. 生存时间的分布B. 生存时间的预测C. 生存时间的比较D. 所有选项都是9. 卫生统计学中的多变量分析通常用于?A. 单因素分析B. 双因素分析C. 多个因素的分析D. 非线性因素的分析10. 卫生统计学中,哪个指标用于衡量疾病在人群中的分布?A. 发病率B. 死亡率C. 患病率D. 流行率答案:1-5 DCBDA 6-10 CDCCA二、简答题(每题5分,共20分)1. 简述卫生统计学在公共卫生领域中的应用。
答:卫生统计学在公共卫生领域中的应用主要包括疾病流行病学的调查研究、健康服务的评估、健康政策的制定与评价、健康数据的收集与分析等。
通过统计方法,可以对人群健康状况进行描述和分析,为预防控制疾病提供科学依据。
2. 解释什么是标准差,并说明其在卫生统计学中的意义。
习题《卫生统计学》第五版(五年制预防医学用)(一)名词解释与简答题1.名词解释(1)负担系数(2)总和生育率(3)生存率(4)潜在减寿年数(5)试比较发病率与患病率, 死亡率与病死率。
2、简述二项分布、Poisson分布、正态分布的区别与联系。
3、简述控制图的基本原理。
4、简述双侧正态分布资料的医学参考值范围为什么是均数±1.96倍标准差。
5、样本均数的抽样分布有何特点?7、与标准正态分布比较,t分布的特点是什么?6、样本均数的标准误的意义是什么?与标准差有何区别和联系?8、用同一份样本指标去估计总体参数的95%置信区间与99%置信区间,两者比较,哪一个估计的精度好?为什么?9、假设检验的理论依据是什么?10、假设检验的两类错误之间的区别与联系是什么?11、t检验的应用条件是什么?12、假设检验中P值的意义是什么?13、如何确定检验水准?14、如何恰当地应用单侧与双侧检验?15、什么情况下可以借用正态近似法估计总体概率的置信区间?16、简述2χ检验的用途。
17、比较两个独立样本频数分布的χ2检验,和比较配对样本两个频数分布的χ2检验在设计方法、资料整理、假设检验等方面的差别是什么?18、举例说明如果实验效应用等级资料表示,比较两组总体效应间差别是否有统计学意义为什么不能用2χ检验?19、为什么有些四格表(或R×C表)必须要计算确切概率?20、实验研究和调查研究的根本区别是什么?21、实验设计的三个基本原则是什么? 22、在临床试验中使用安慰剂的目的是什么?23、随机化的目的是什么?24、试验设计的基本要素包括哪些?25、估计样本含量时,所定容许误差与样本量有何关系?26、配对设计的目的是什么?27、避免医生和病人对实验效应观察的偏性,设计时应注意什么?28、为明确某新化妆品对皮肤有无损害作用,将12只大白兔的左背部涂抹该化妆品,右侧涂生理盐水作为对照,72小时后观察皮肤反应。
卫生统计学试题及答案一、选择题(每题2分,共20分)1. 卫生统计学是研究什么的学科?A. 研究疾病发生的原因B. 研究疾病的治疗手段C. 研究数据收集、处理、分析和解释D. 研究疾病的预防措施2. 下列哪项不是卫生统计学中的常用统计指标?A. 均数B. 标准差C. 患病率D. 治愈率3. 抽样调查与普查的主要区别是什么?A. 抽样调查可以减少工作量B. 普查可以得到更准确的结果C. 抽样调查可以减少成本D. 普查可以提供更全面的数据4. 相对数指标通常用来反映什么?A. 总体的总量B. 总体的结构C. 总体的平均水平D. 总体的相对关系5. 以下哪个是描述数据分布集中趋势的指标?A. 方差B. 标准差C. 均数D. 极差6. 卫生统计学中,以下哪个概念与风险评估无关?A. 危险度B. 相对危险度C. 归因危险度D. 治愈率7. 以下哪个是卫生统计学中用于描述数据离散程度的指标?A. 众数B. 均数C. 方差D. 标准差8. 卫生统计学中,以下哪个指标用于描述两个变量之间的线性关系?A. 相关系数B. 回归系数C. 回归方程D. 相关指数9. 以下哪个统计图适合用来展示时间序列数据?A. 条形图B. 散点图C. 折线图D. 饼图10. 卫生统计学中,以下哪个概念用于衡量样本统计量与总体参数的接近程度?A. 标准误差B. 置信区间C. 抽样误差D. 抽样分布答案:1. C2. D3. A4. D5. C6. D7. C8. A9. C 10. A二、简答题(每题5分,共30分)1. 简述卫生统计学在公共卫生领域中的应用。
2. 解释什么是标准正态分布,并说明其在卫生统计学中的重要性。
3. 描述卫生统计学中常用的几种数据收集方法。
4. 阐述卫生统计学中抽样误差和非抽样误差的区别。
三、计算题(每题10分,共40分)1. 给出一组数据:23, 25, 27, 29, 31。
计算其均数、标准差和方差。
2. 如果一个研究的样本均数为45,样本标准差为10,样本量为100,求95%置信区间。
卫生统计学试题及答案一、选择题1. 卫生统计学的定义是什么?A. 研究人口与卫生的关系B. 收集、整理和分析与卫生有关的数据和信息的科学C. 填写卫生报告的技巧和方法D. 分析和评估卫生政策的效果答案:B2. 卫生统计学的主要任务是什么?A. 收集卫生数据B. 整理卫生数据C. 分析卫生数据D. 以上都是答案:D3. 在卫生统计学中,下列哪项不属于一般健康指标?A. 发病率B. 寿命C. 死亡率D. 科研成果答案:D4. 在卫生统计学中,下列哪项可以用来衡量人群健康状况?A. 平均寿命B. 疾病发生率C. 存活率D. 全部都可以答案:D5. 下列哪个不是访谈法的形式?A. 个别访谈B. 群体访谈C. 网络访谈D. 邮件访谈答案:C二、问答题1. 请简要介绍卫生统计学的研究内容。
卫生统计学是研究与人体健康及卫生相关的数据和信息的科学。
其主要研究内容包括数据的收集、整理和分析,健康指标的评估和监测,以及卫生政策的制定和效果评估等。
2. 什么是发病率?如何计算?发病率是指在特定时间内,某一特定疾病的新患者数与相应人群总数的比例。
计算方法为:发病率 = 特定疾病的新患者数 / 相应人群总数× 1000‰3. 请简述卫生统计学中常用的数据收集方法。
卫生统计学中常用的数据收集方法有以下几种:- 问卷调查:通过发放问卷或进行电话访谈的方式收集信息。
- 查体:通过对人体状况进行检查获得相关数据。
- 记录法:对已有的医疗记录或档案资料进行整理和分析。
- 实验法:通过实验设计和实施来收集相关数据。
4. 请解释以下概念:死亡率、出生率、流行病学三要素。
- 死亡率:在特定时间和特定人群中,死亡人数与总人口数的比例。
常用于衡量人群的健康状况。
- 出生率:在特定时间和特定人群中,出生人数与总人口数的比例。
常用于衡量人口的生育水平。
- 流行病学三要素:流行病学研究的基本方法,包括宿主、病原体和环境三个要素。
宿主指的是患病或潜在患病的个体;病原体指的是引起疾病的病原微生物或其他因素;环境指的是宿主和病原体之间的相互作用和影响。
卫生统计学试题库及答案卫生统计学是一门应用统计学方法来研究卫生领域数据的科学。
以下是一套卫生统计学的试题库及答案,供参考:一、选择题1. 卫生统计学的主要研究对象是什么?A. 人口数量B. 卫生服务C. 疾病流行情况D. 以上都是答案:D2. 描述性统计与推断性统计的区别是什么?A. 描述性统计只关注数据的收集B. 推断性统计只关注数据的分析C. 描述性统计用于描述数据特征,推断性统计用于从样本推断总体D. 描述性统计用于推断总体,推断性统计用于描述数据特征答案:C3. 以下哪个是卫生统计学中常用的数据类型?A. 定性数据B. 定量数据C. 计数数据D. 以上都是答案:D二、简答题1. 简述卫生统计学在公共卫生领域中的应用。
答案:卫生统计学在公共卫生领域的应用包括疾病流行病学研究、健康服务评价、健康政策制定、医疗资源分配、疾病预防控制等方面。
通过统计方法分析数据,可以揭示疾病流行规律,评估预防措施的效果,指导健康服务的优化。
2. 解释什么是置信区间,并说明其在统计分析中的作用。
答案:置信区间是估计总体参数的一个范围,它表示在多次抽样的情况下,该区间内包含总体参数的概率。
置信区间的作用是提供对总体参数估计的不确定性的量化,帮助研究者判断估计的可靠性。
三、计算题1. 某地区进行一项健康调查,随机抽取了100名居民,测量了他们的血压值。
平均血压为130mmHg,标准差为15mmHg。
计算95%置信区间。
答案:首先计算标准误差(SE):SE = 标准差/ √样本量 = 15 /√100 = 1.5。
然后计算95%置信区间的边际误差(ME):ME = Z值 * SE = 1.96* 1.5 = 2.94。
最后计算置信区间:平均值± ME = 130 ± 2.94,即置信区间为127.06mmHg到133.94mmHg。
结束语:本试题库涵盖了卫生统计学的基本概念、方法和应用,旨在帮助学习者掌握卫生统计学的基础知识和技能。
第四章 常用概率分布一、二项分布的特征①二项分布图的高峰在μ=n π处或附近;②π为0.5时,图形是对称的;当π不等于0.5时,分布不对称③当对同一n,π离0.5愈远,对称性愈差④对同一π,随着n 的增大,分布趋于对称⑤当n →∞时,只要π不太靠近0或1,特别是当n π与n(1-π)均大于5时,二项分布趋于对称。
⑥当n →∞时,且π→0时,二项分布近似Poisson 分布二、二项分布的应用条件是什么?①实验总次数n 一定②每次试验只有两个可能结果且相互独立,不予考虑“可疑”等模糊结果,属于二分类资料 ③每次试验只出现一个结果并且是两个可能结果中的一个结果④已知发生某结果与概率为π且不变,则其对立结果的概率为(1-π)⑤n 次试验在相同条件下进行且各次试验结果相互独立三、Possion 分布的特征?①Possion 分布的总体均数与总体方差相等,均为λ②当λ较小时,图形呈偏态分布;当λ较大时,图形呈正态分布③Poisson 分布的观察结果具有可加性四、正态分布的定义若连续性随机变量X 的概率密度函数为:222)(21)(σμσπ--=x e x f其中μ为均值,σ为标准差,则随机变量X 服从正态分布,记为X~N(μ,σ2 )相应的分布函数(概率密度的累积函数)为: ⎰∞---=x x dx e x F 222)(21)(σμσπ五、正态曲线的性质①曲线在x 轴的上方,与x 轴的上方,与x 轴不相交②曲线是单峰的,它关于直线x=μ对称③曲线在x=μ处达到峰值(最高点),在x=μ±σ处有拐点④曲线与横轴x 所夹面积为1⑤均值μ反应随机变量的平均水平(位置参数),向右平移表示逐渐增大,向左平移表示逐渐减少。
⑥标准差σ反映随机变量的集中趋势(形状参数),σ越大曲线越“矮胖”,表示分布越分散;σ越小曲线越“瘦高”,表示分布越集中。
当n很大,π很小时,nπ=λ为一常数时,二项分布近似于Poisson分布P(nπ)当n较大时,π不接近0也不接近m时,二项分布近似于正态分布,N(nπ,nπ(1-π))当λ≥20时,Poisson分布渐近正态分布N(λ,λ)六、简述二项分布、Possion分布、正态分布的区别与联系区别:二项分布、Possion分布是离散型概率分布,用概率函数描述其分布状况,而正态分布是连续型概率分布,用密度函数和分布函数描述其分布状况。
卫生统计学简答题汇总(30%)1、统计与数学的区别与联系联系:①统计学运用到大量的数学知识;②数学为统计理论和统计方法的发展提供基础;③不能将统计学等同于数学;区别:①数学研究的是抽象的数量规律,统计学则是研究具体的、实际现象的数量规律;②数学研究的是没有量纲或单位的抽象的数,统计学研究的是有具体实物或计量单位的数据;③统计学与数学研究中所使用的逻辑方法不同;④数学研究所使用的主要是的演绎;⑤统计学则是演绎与归纳相结合,占主导地位的是归纳。
2、频率与概率的关系①样本频率总是围绕概率上下波动;②样本含量n越大,波动幅度越小,频率越接近概率;③随着实验次数增至足够大,频率逐渐稳定于某一常数附近,则该常数为概率。
3、算数均数、几何均数、中位数的适用范围有何异同同:均是用于描述定量资料集中趋势的常用指标;异:①均数是用于描述单峰对称分布,特别是正态分布或者近似正态分布的资料;②几何均数适用于变量值成倍数关系的偏态分布资料,特别是经对数转换后成正态分布或近似对称分布的资料,医学研究中常见于城等比例变化的数据;③中位数应用于不对称分布资料、分布不明确资料以及两端无确切值的资料。
*极差、四分位数间距、标准差、变异系数的适用范围有何异同同:均为用于描述资料离散程度的常用指标;异:①极差可用于描述单峰对称分布的小样本资料的离散程度,用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确的资料的离散程度,不受两端极大或极小数据的影响,比极差更稳定,和中位数一起使用反映数据平均水平和变异程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几组计量单位不同或者均数相差悬殊的正态分布资料的离散程度。
*二项分布、Poisson分布和正态分布的区别与联系联系:Poisson分布是二项分布的特殊情况,服从Poisson分布的资料肯定也服从二项分布;不论是二项分布还是Poisson分布,只有满足正态分布近似条件时才能使用正态分布。
统计学简答汇总第一章:绪论(无)第二章:定量变量的统计描述1.均数﹑几何均数和中位数的适用范围有何异同?答 : 相同点 , 均表示计量资料集中趋势的指标。
不同点 : 表 2-5.表 2-5 均数 , 几何均数和中位数的相异点平均数意义应用场合均数几何均数中位数平均数量水平平均增减倍数位次居中的观察值水平应用甚广 , 最适用于对称分布, 特别是正态分布①等比资料;②对数正态分布资料①偏态资料;②分布不明资料;③分布一端或两端出现不确定值2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系?答:1)意义:中位数是百分位中的第50 分位数,常用于描述偏态分布资料的集中位置,映位次居中的观察值水平。
百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。
多个百分位数结合使用,可更全面地描述总体或样本的分布特征。
反( 2)计算:中位数和百分位数均可用同一公式计算,即Px=L+( i/f x)(n·x%-Σf L)可根据研究目的选择不同的百分位数代入公式进行计算分析。
(3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。
中位数常和其它分位数结合起来描述分布的特征,在实际工作中更为常用。
百分位数还可以用来描述变量值的离散趋势(四分位数间距)。
3.同一资料的标准差是否一定小于均数?答:不一定。
同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。
变异大,标准差就大,有时比均数大;变异小,标准差小。
4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?( 1)样本含量的大小,样本含量越大,标准差越稳定。
(2)分组的多少(3)分布形状的影响,偏态分布的标准差较近似正态分布大(4)随机测量误差大小的影响(5)研究总体中观察值之间变异程度大小5.标准差与变异系数的异同点有哪些?答:标准差:是以算数平均数为中心, 反映各观测值离散程度的一个绝对指标. 当需要对同一总体不同时期或对不同总体进行对比时, 缺乏可比性 . 当总体平均水平不同或计量单位不同时 , 用标准差是无法实现两组数据离散程度大小对比的.变异系数:标准差与平均数的比值称为变异系数, 记为 C·V. 变异系数可以消除单位和(或)6.如何表达一批计量数据的基本特征?答:从集中趋势和离散趋势两方面回答。
统计学简答汇总第一章:绪论(无)第二章:定量变量的统计描写1.均数﹑几何均数和中位数的实用规模有何异同?答:雷同点,均暗示计量材料分散趋势的指标.不合点:表25.表25 均数,几何均数和中位数的相异点平均数意义运用处合均数平均数量程度运用甚广,最实用于对称散布,特别是正态散布几何均数平均增减倍数①等比材料;②对数正态散布材料中位数位次居中的不雅①偏态材料;②散布不明材料;③散布一端或两察值程度端消失不肯定值2.中位数与百分位数在意义上﹑盘算和运用上有何差别与接洽?答:1)意义:中位数是百分位中的第50分位数,经常运用于描写偏态散布材料的分散地位,反应位次居中的不雅察值程度.百分位数是用于描写样本或总体不雅察值序列在某百分地位的程度,最经常运用的百分位是P50即中位数.多个百分位数联合运用,可更周全地描写总体或样本的散布特点.(2)盘算:中位数和百分位数均可用同一公式盘算,即Px=L+(i/fx)(n·x%ΣfL)可根据研讨目标选择不合的百分位数代入公式进行盘算剖析.(3)运用:中位数经常运用于描写偏态散布材料的分散趋势;百分位数经常运用于医学参考值规模的肯定.中位数常和其它分位数联合起来描写散布的特点,在现实工作中更为经常运用.百分位数还可以用来描写变量值的离散趋势(四分位数间距).3.同一材料的尺度差是否必定小于均数?答:不必定.同一材料的尺度差的大小与均数无关,重要与本材料的变异度有关.变异大,尺度差就大,有时比均数大;变异小,尺度差小.4.测得一组材料,如身高或体重等,从统计上讲,影响其尺度差大小的身分有哪些?(1)样本含量的大小,样本含量越大,尺度差越稳固.(2)分组的若干(3)散布外形的影响,偏态散布的尺度差较近似正态散布大(4)随机测量误差大小的影响(5)研讨总体中不雅察值之间变异程度大小5.尺度差与变异系数的异同点有哪些?答:尺度差:是以算数平均数为中间,反应各不雅测值离散程度的一个绝对指标.当须要对同一总体不合时代或对不合总体进行比较时,缺少可比性.当总体平均程度不合或计量单位不合时,用尺度差是无法实现两组数据离散程度大小比较的.变异系数:尺度差与平均数的比值称为变异系数,记为C·V.变异系数可以清除单位和(或)平均数不合对两个或多个材料变异程度比较的影响.6.若何表达一批计量数据的根本特点?答:从分散趋势和离散趋势两方面答复.7. 描写计量材料离散程度(不同大小)的指标有哪些,各实用于什么情况?答:罕有的几种描写离散程度的指标:极差或全距,四分位数差距,方差与尺度差,变异系数.极差合适:数据散布非对称的情况.四分位数差距合适:数据散布非对称的情况.方差与尺度差合适:对称散布或近似正态散布材料,能充分运用全部个别的信息.变异系数实用:当比较两材料的变异程度大小时,假如变量单位不合或均数不同较大时,直接比较无可比性,实用变异系数比较. 8.尺度差有何用处?答:①描写正态散布的变异程度;②正态散布时,均数与尺度差同时写出:X+S;③盘算变异系数;④用尺度差估量变量值的频数散布;⑤用尺度差盘算尺度误.9. 统计描写的根本办法有哪些,各自有何特色?答:统计描写的根本办法:用表.图和数字的情势归纳分解原始材料的重要信息.表:具体.精确.图:直不雅.指标:分解性好.10.简述变异系数的实用机会.答:变异系数实用于变量单位不合或均数不同较大时,直接比较无可比性,实用变异系数比较.11. 如何精确描写一组计量材料?答:(1).根据散布类型选择指标.(2).正态散布材料选用均数与尺度差,对数正态散布材料选用几何均数,一般偏态散布材料选用中位数与四分位数间距.12.原始数据单位变换后,对均数和方差有何影响?答:均数和方差均转变.用实例解释.13.列表的原则和根本请求是什么?答:(1)列表的原则:重点凸起,简单清晰明了;主谓分明,层次清晰.(2)列表的根本请求:①应有简明简要解释统计表内容的标题.既不克不及过与简单,也不呢能过于繁琐或不确实.②标目文字要简明,有单位的标目要注明,标目不宜过多,层次应清晰.③线条不宜过多.除顶线.底线.纵标面前目今与合计行上面的线条外,其他线条一般均应省去.表的左上角不宜有斜线.④表内数字小数位数保存应一致,位次应对齐,不宜留空格.暂缺或未记载用“…”暗示,很多字用“—”暗示,数字是“0”则应填写“0”.⑤备注一般不列入表内,运用“*”号引出,写在表的下面.14.经常运用的统计图有哪几种?他们的实用前提是什么?答:经常运用的统计图有条图.百分条图.圆图.线图.半对数线图.直方图.散点图和统计地图等.(1)直条图:用等宽直条的长短来暗示互相自力的各项指标的数值大小,如发病率等.(2)百分条图.圆图:用长条各段的面积.圆的扇形面积来暗示事物内部各构成部分的散布情况,即各构成比重的大小,如构成比.(3)通俗线图:用线段的起落来暗示持续性材料随时光的变迁.某事物现象的动态及变更趋势.(4)半对数线图:用线段的起落来暗示持续性材料随时光的变迁和某事物现象成长变更的速度.(5)直方图:用直方面积的大小暗示数值变量材料频数散布的情况.(6)散点图:用点的密集程度和趋势暗示两变量间的相干关系.(7)统计地图:用不合的纹线或色彩解释指标高下,描写某事物现象在行政区域上的散布情况.15.半对数线图的图形若何做剖析?答:用于暗示事物的成长速度(比拟较).其横轴为算数尺度,纵轴为对数尺度,在比较几组数据的变更速度(比拟较)时,特别是两组数据相差悬殊时,宜用半对数线图.第三章:定性变量的描写1.为什么不克不及以构成比代率?答:二者解释的问题不合.构成比只能解释某事物内部各构成部分在全部中所占的比重或散布,不克不及解释某现象产生的频率或强度.2.简述相对数尺度化的根本思惟.答:根本思惟: 采取同一的尺度生齿年纪构成,以清除不合生齿构成对两地逝世亡率的影响,使得到的尺度化逝世亡率具有可比性.3.解释在何种情况下应选用率的直接标化法,何种情况选用间接标化法?答: 率的直接标化法:已知各组的年纪别逝世亡率pi.间接标化法:已知各组的逝世亡总数和各年纪组生齿数.4.率的直接标化法,与间接标化法有何不合?答: (1)实用前提不合(见第上题);(2)“尺度”不合:前者选定一个“尺度生齿”或“尺度生齿构成” . 后者选定一套“尺度年纪别逝世亡率” .5.运用相对数时应留意哪些问题?答:运用相对数指标的时刻要留意:分母不宜过小;不要以比代率;材料的可比性;样本指标比较时应做假设磨练.6.经常运用相对数指标有哪些? 它们的意义上有何不合?答:经常运用相对数指标:率.构成比.比.率又称频率指标或强度相对数.解释某现象产生的频率或强度.经常运用来暗示某一事物成长的趋势或程度及特点.构成比又称构成指标或构造相对数.部分与全部之比,解释某事物内部各构成部分在全部中所占的比重或散布.经常运用来暗示疾病或逝世亡的顺位.位次或所占比重.比(又称比拟较)暗示同类的或有接洽的两个现象间的比较关系,经常运用倍数或百分数暗示.7.统计学上材料是否“具有可比性”指的是什么? 你能举出一些不成比的例子吗?答:除研讨身分外,其余重要影响身分应雷同或邻近.一般不雅察单位同质,研讨办法雷同,不雅察时间相等,以及地区.平易近族等客不雅前提一致.例如内科和外科的治愈率就无可比性.8.何谓生齿老龄化?请简述其影响身分.答 1:生齿老龄化是指老年生齿(65 岁及以上)在生齿中所占的比重升高的现象.在没有迁徙的情况下,生齿老龄化的过程重要受生育率和逝世亡率两种身分的影响.生育率降低,使低年纪生齿的比重降低,高年纪生齿的比重响应增长;逝世亡率(主如果中老年生齿的逝世亡率)降低,使寿命延长,老年生齿比重增长.一般来说,生齿老龄化的速度和程度重要取决于生育率的降低速度.当生育率程度降低达到很低的程度且很难再有较大程度的降低时,中老年生齿逝世亡率的降低对生齿老龄化的影响才比较明显.9.发病率.时点患病率.时代患病率的差别.答:(1)发病率是指不雅察期内,可能产生某病的人群中新发病例的频率,其不雅察期多为年.月.日等,急性罕有病多盘算发病率.(2)时点患病率反应在检讨或查询拜访时点必定人群中某病的现患情况(包含该病的新旧病例数).不雅察时点在理论上是无长度的,但现实上不雅察时光不宜过长,一般不超出个月.(3)时代患病率反应在不雅察时代必定人群中消失或风行某病的频度,包含不雅察时代的新发病例和现患病例数,为慢性病的统计指标.10.疾病统计的不雅察单位“病人”和“病例”的差别.答:(1)一小我每次患病都可作为一个病例.以病例为单位的疾病统计,可研讨居平易近各类疾病的频度.疾病的种类及疾病的变动,以获得居平易近患病的根本纪律.(2)病人是指一个有病的人.在不雅察时代内,不雅察对象患有疾病即算作一个病人,不管其患病的种类及患病次数的若干.以病工资单位的疾病统计,在必定程度上反应居平易近的患病频度,可找出具体的患病人群,便于开展对病人小我的防治工作.11.病逝世率和逝世亡率的差别.答:(1)某病病逝世率暗示在划定的不雅察期内,某病患者中因该病而逝世亡的频率.它是反应疾病的轻微程度的指标.在用病逝世率进行比较时应留意病情轻重等内部构成不合的影响.盘算公式为:不雅察期内因某病逝世亡的人数某病病逝世率= 同期该病患者数×1000‰(2)某病逝世亡率暗示在划定的不雅察期内,人群中因某病而逝世亡的频率.它可以反应不合地区或年月某种疾病的逝世亡程度.盘算公式为:不雅察期内因某病逝世亡的人数某病逝世亡率= 同期平均生齿数×1000‰12.简述婴儿逝世亡率指标的现实意义.答:婴儿逝世亡率指某地某年不满一周岁婴儿的逝世亡数与同期活产总数的比值.婴儿逝世亡率= 某年不满周岁婴儿逝世亡数×1000‰ /同期活产数婴儿逝世亡率的高下对平均寿命有重要的影响,它是反应社会卫生状态和婴儿保健工作的重要指标,也是逝世亡统计指标中较为迟钝的指标.婴儿逝世亡率不受年纪的影响,不合国度或地区之间可以互相比较.13.请解释频率型指标与强度型指标的重要差别?答:重要差别:指标的解释不合,频率型指标是暗示事物内部某个构成部分所占的比重或散布,或指某现象产生的频率.强度型指标是指单位时光内某现象产生的频率.14.尺度化法的根本思惟?答:采取同一尺度构成以清除某身分的内部构成不合对总率的影响,使经由过程尺度化后的尺度化率具有可比性.15.请比较发病率和患病率的不合.答:发病率暗示一准时代内,在可能产生某病的必定人群活过的总人年中,新产生的某病病历数,其分子是新病历数,分母是总人年数;患病率,又称现患率,指某时点上受检人数中先患某种病的人数,通经常运用于描写病程较长或发病时光不轻易明白的疾病的患病情况,其分子包含新旧病例数,分母是受检总人数.在必定的人群和时光内,发病率和患病率有亲密关系,两者与病程(D)的关系是:PR=IR×D.16.请比较逝世亡率与病逝世率的不合.答:逝世亡率与病逝世率的分子是一样的,均暗示因某病逝世亡的人数,但逝世亡率的分母是总人年数,着重反应产生的强度,或单位时光内逝世亡的概率;病逝世率的分母是患某病的人数,反应疾病逝世亡的概率.17.运用相对数应留意的事项.答:1.懂得相对数的寄义不成望文生义;2.频率型指标的解释要紧扣总体和属性;3.盘算相对数时分母应有足够数量;4.精确地归并频率(强度)型指标;5.相对数间的比较要具备可比性;6.对相对数的统计揣摸.18.运用尺度化的留意事项.答:1.尺度化的运用规模很广,实用于“某事宜的产生率”可所以治愈率,也可所以患病率,还可所以发病率.病逝世率等.当某个分类变量在两组中散布不合时,这个分类变量就成为两组频率比较的混淆身分,尺度化法的目标就是清除这个混淆身分的影响.19.疾病统计有几类指标,各有什么意义?答:发病率.时点患病率.时代患病率.治愈率.生计率.残疾患病率.前3种详见上述简答题.治愈率:暗示受治病人中治愈的频率.有用力暗示受治病人中治疗有用的频率.两个率重要用于对急性病伤害或防治后果的评价.但治愈和有用的尺度要有明白而具体的划定,只有在尺度雷同的情况下才可以互相比较.生计率:病人能活到某一时点的概率.经常运用于对慢性病及血汗管病等的治疗后果评价和预后评估.20.反应疾病的预防后果和治疗后果的指标有哪些?各有什么特色?答:①发病率:疾病防治后果;②患病率:慢性病预防后果;③治愈率:急性病防治后果;④生计率:慢性病的治疗后果.各指标寄义详见上述简答题.21.测量生育程度有几个指标?各指标有什么不合?答:①粗生育率;②总生育率;③年纪别生育率;④总和生育率.各指标寄义详赐教材P41.22.测量生齿再生育程度有几个指标?各指标有什么不合?答:①天然增长率;②粗再生育率;③净再生育率.各指标寄义详赐教材P42.23.生齿统计应包含哪几个方面?答:医学生齿统计是从卫生保健的角度研讨和描写生齿数量.散布.构造.变动及其纪律,研讨生齿与卫闹事业成长的互相关系,是卫生统计学的重要构成部分.包含描写生齿学特点的指标,生育和生齿逝世亡的指标.详见书本P4044.24.生齿金字塔有几种典范的外形?各解释什么?答:生齿金字塔直不雅地暗示了生齿的年纪.性别构造.每一层代表一个年纪组的生齿,上部代表老年人,下部代表少年儿童,左半部代表男性,右半部代表女性,程度偏向的长度暗示男性和女性生齿的数量各在总生齿中所占的百分比.生齿金字塔一共分3种类型:①年青型:下宽上窄,呈真正的金字塔形,标明少年儿童生齿占总生齿的比重大,预示着将来生齿的成长趋势是增长的.其生齿增长模式一般为“高下高”模式,重要消失有成长中国度;②成年型:底部与中部的宽窄基底细近,出生率.逝世亡率差不久不多,预示着将来生齿的成长趋势是稳固的.其生齿增长模式一般为“低低低”模式;③老年型:上宽下窄,标明少年儿童生齿的比重缩小,老年生齿比重增大,是出生率长期降低的成果.这种类型的生齿问题主如果育龄生齿比重低,假如生育程度不变,预示着将来生齿的成长趋势是负增长的.其生齿增长模式一般为“低低低”模式,一般消失于蓬勃国度.第四章:经常运用概率散布1.正态散布﹑尺度正态散布与对数正态散布在概念上和运用上有何异同?答:概念上:①雷同点:正态散布.尺度正态散布与对数正态散布都是变量的持续型散布.其特点是:散布曲线在横轴上方,略呈钟型,以均数为中间,双方对称,均数处最高,双方逐渐减小,向外延长,不与横轴订交.②相异点:暗示办法不合,正态散布用N (µ,σ2)暗示,尺度正态散布用N(0,1)暗示,对数正态散布N (μlgX,σ2lgX)暗示.(1)运用上:①雷同点:正态散布.对数正态散布都可以转换为尺度正态散布.②相异点:尺度正态散布是尺度正态变量u的散布,尺度正态曲线下的面积独一的由u决议,给运用带来极大便利.对医学材料呈偏态散布的数据,有的经对数变换后屈服正态散布.正态散布.对数正态散布可描写变量值的散布特点,可用于正常值规模估量和质量控制等.正态散布是许多统计办法的理论基本.2.医学中参考值规模的寄义是什么?肯定的原则和办法是什么?寄义:参考值规模亦称正常值规模,它是指特定健康状态人群(清除了有关疾病和身分对所研讨指标有影响的所谓“正常人”不合于“健康人”概念)的剖解.心理.生化等数据绝大多半人的摇动规模.(2)原则:① 抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得成果越靠得住.一般以为样本含量最好在100例以上,以能得到一个散布较为稳固的样本为原则.② 对选定的正常人进行精确而同一的测定,包管测定命据靠得住是肯定正常值规模的前提.③ 剖断是否要分组(如男女.年纪.地区等)肯定正常值规模.④ 决议取双侧规模值照样单侧规模值.⑤ 选择恰当的百分规模⑥ 肯定可疑规模⑦ 估量界值(3)办法:① 百分位数法:Px=L+(i/fx)(n·x%ΣfL)② 正态散布法(对数正态散布):百分位数法用于各类散布型(或散布不明)材料;正态散布法用于屈服或近似正态散布(屈服对数正态散布)的材料.3.对称散布材料在“均数±1.96倍尺度差”的规模内,也包含95%的不雅察值吗?答:不必定.均数±1.96倍尺度差是正态散布的散布纪律,对称散布不必定是正态散布.4.正态散布的重要特点有哪些?答:(1)正态曲线在横轴上方均数处最高.(2)正态散布以均数为中间,阁下对称.(3)正态散布有两个参数,即均数(地位参数)和尺度差(变异度参数).(4)正态曲线下的面积散布有必定例律.5.参考值规模是指什么?答:参考值规模又称正常值规模,即大多半正常人某指标值的规模.“正常人”是指清除了影响研讨指标的疾病和有关身分的同质人群.6.简述估量参考值规模的步调与要点.答:设计:①样本:“正常人” ,大样本n≥100.②单侧或双侧.③指标散布类型.盘算:①若直方图看来像正态散布,用正态散布法.②若直方图看来不像正态散布,用百分位数法.7.简述正态散布的用处.答:(1)估量频数散布.(2)制订参考值规模.(3)质量控制.(4)统计磨练的理论基本.8.简述可托区间在假设磨练问题中的感化.答:可托区间不但能答复不同有无统计学意义,并且还能提醒不同有无现实意义.可托区间只能在预先划定的概率即磨练水准的前提下进行盘算,而假设磨练可以或许获得一个较为确实的概率 P 值.故将二者联合起来,才是对假设磨练问题的完全剖析.9. 二项散布.Poisson散布各有哪些特点?答:二项散布和 Poisson 散布都是离散型散布.二项散布的外形取决于π与 n 的大小:π=0.5 时,不管 n 大小,散布对称.π≠0.5时,图形呈偏态,随n 的增大,逐渐对称.当 n足够大,π或 1π不太小,二项散布 B(n,π)近似于正态散布 N( nπ, nπ(1π) ).Poisson 散布:λ值愈小散布愈偏,λ愈大散布趋于对称,当λ足够大时,散布接近正态散布 N(λ,λ ).10.简述二项散布.Poisson散布.正态散布的关系.答:当 n 足够大,π或 1π不太小时,二项散布近似于正态散布.当n 足够大,π或 1π很小时,二项散布近似于 Poisson散布.λ较大时,Poisson 散布近似于正态散布.11.二项散布的运用前提是什么?答:⑴每次实验有且仅有两个互相排挤的成果(A或非 A).⑵每次实验中,产生 A的概率雷同,均为π.⑶各次实验自力,即 n 次不雅察成果互相自力.12.医学参考值规模肯定的办法是什么?答:百分位数法和正态散布法.13.简述二项散布.Poisson散布.正态散布的差别与接洽.答:差别:二项散布.Poisson散布是离散型概率散布,用概率函数描写其散布状态,而正态散布是持续型概率散布,用密度函数和散布函数描写其散布状态.接洽:Poisson散布可以视为n 很大而π很小的二项散布.当n很大而π和1—π都不是很小的时刻二项散布渐近正态散布,当λ》=20的时刻Poisson 散布渐近正态散布.14.控制图的基起源基本理.答:当影响某一数值指标的随机身分许多,而每个身分所起的感化均不太大时,这个指标的随机摇动属于随机误差,则往往屈服正态散布.相反,假如除随机误差外,还消失某些影响较大的身分导致的误差,称为体系误差,这时指标的摇动就不再屈服正态散布.15.二项散布的特点?答:二项散布图的岑岭在μ=nπ处或邻近;π为0.5时,图形是对称的;当π不等于0.5时,散布不合错误称,且对同一n,π离0.5愈远,对称性愈差.对同一π,跟着n的增大,散布趋于对称.当n→∞时,只要π不太接近0或1,二项散布趋于对称. 16.Poisson散布的特点?答:(1)Poisson散布的总体均数与总体方差相等,均为λ.(2)当λ较小时,图形呈偏态散布;当λ较大时,图形呈正态散布.(3)Poisson散布的不雅察成果具有可加性.17.正态散布曲线的地位与外形的特色?答:(1)关于χ=μ对称.(2)在χ=μ处取得该概率密度函数最大值,在χ=μ±σ处有拐点.(3)曲线下面积为 1.(4)μ决议曲线在横轴上的地位,μ增大,曲线沿横轴向右移;反之,μ减小,曲线沿横轴向左移.(5)σ决议曲线的外形,当μ恒准时,σ越大,数据越疏散,曲线越“矮胖”; σ越小,数据越分散,曲线越“瘦高”.18.什么叫尺度正态散布?答:尺度正态散布又称为u散布,是以0为均数.以1为尺度差的正态散布,记为N(0,1).尺度正态散布曲线下面积散布纪律是:在1.96~+1.96规模内曲线下的面积等于0.9500,在2.58~+2.58规模内曲线下面积为0.9900.统计学家还制订了一张统计用表(自由度为∞时),借助该表就可以估量出某些特别u1和u2值规模内的曲线下面积.19.肯定医学参考值规模的办法及特色?答:①百分位数法:双侧95%医学参考值规模是(P2.5,P97.5),单侧规模是P95以下(人体有害物资如血铅.发汞等),或P5以上(如肺活量).该法实用于任何散布类型的材料.②正态散布法:若X屈服正态散布,医学参考值规模还可以依正态散布的纪律盘算.20.二项散布的界说是什么?二项散布有哪些基赋性质?答:界说:二项散布是n个自力的是/非实验中成功次数的离散概率散布,个中每次实验成功的概率均为p.基赋性质:①图形特点:具体见15题简答题;②二项散布的均数和尺度差:详赐教材P66页公式.21.二项散布道理可进行哪些统计剖析?答:材料需起首知足以下前提:①每次实验只能产生两种对峙的可能成果之一,分别产生两种成果的概率之和恒等于1;②每次实验产生某种成果的概率π固定不变;③反复实验是互相自力的,。
标准差与标准误有何区别和联系?标准差和标准误都是变异指标,但它们之间有区别,也有联系。
区别:①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。
标准误用于估计参数的可信区间,进行假设检验等。
③它们与样本含量的关系不同: 当样本含量n 足够大时,标准差趋向稳定;而标准误随n 的增大而减小,甚至趋于0 。
联系: 标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。
参考值范围与可信区间有何区别?(1)意义不同: 参考值范围是指同质总体中包括一定数量(如95%或99%) 个体值的估计范围。
可信区间是指按一定的可信度来估计总体参数所在范围。
(2)计算方法不同: 参考值范围用计算。
可信区间用或计算,前者用标准差,后者用标准误。
直线相关与回归有何联系与区别?联系:(1)对符合相关回归条件的资料,其相关系数与回归系数的正负号相同。
(2)回归系数与相关系数的假设检验是等价的,对同一样本的资料,回归系数的t检验与相关系数的t检验其数值相等,即tr=tb。
(3)可以用回归解释相关。
r的平方称为决定系数(coefficient of determination)区别:回归要求因变量Y是正态分布的随机变量;X可以是精确测量或严格控制的变量,也可以是呈正态分布的随机变量,当X是精确测量或严格控制的变量时,此时的回归称Ⅰ型回归。
当X是呈正态分布的随机变量时,此时的回归称为Ⅱ型回归。
相关要求变量X、Y都是呈正态分布的随机变量。
当说明两变量间依存变化的数量关系时用回归,当说明两变量间的相关关系时用相关。
参数检验与非参数检验有何区别,各有何优缺点?(1)区别:参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。
非参数检验:不依赖总体分布的具体形式,检验分布位置是否相同。
(2)优缺点:参数检验:优点是符合条件时,检验效能高。
卫生统计学一、名词解释1、总体:根据研究目的确定的同质观察单位的观察值全体所构成的集合。
2、样本:从研究总体中抽取的一部分满足代表性的个体观察值所构成的集合。
3、抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本与总体指标的差异,称为抽样误差。
4、计量资料定量资料(quantitative data ):亦称计量资料,其变量值是定量的,表现为数值大小,一般有度量衡单位,如上例中的身高(cm)、体重(kg)资料等均为定量资料。
5、定性资料:定性资料(qualitative data ):亦称分类资料(categorical data ),其观察值是定性的,表现为互不相容的类别或属性,一般无度量衡单位。
可进一步细分为以下两种资料。
6、变异系数:变异系数是一种相对变异指标,常用于比较度量单位不同或单位相同但均数相差悬殊的两组或多组对称分布特别是正态分布资料的变异程度。
7、回归系数:b称为回归系数(coefficient of regression),含义为当x每变化1个单位,因变量γ平均变化b个单位。
8、决定系数:也称判定系数或者拟合优度。
它是表征回归方程在多大程度上解释了因变量的变化,或者说方程对观测值的拟合程度如何。
9、率:说明某现象发生的频率或强度的指标。
10、构成比:说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。
11、粗出生率:指某年某地平均每千人口的活产数,是反映一个国家或地区的人口自然变动的基本指标。
12、粗死亡率:指某地某年平均每千人口中的死亡数,反映当地居民总的死亡水平。
二、简答题1.简述方差分析的基本思想和应用条件。
方差分析的基本思想:将全部观察值之间的变异按照设计的要求和分析的需要分解成两个或多个部分,然后再作分析。
方差分析的应用条件为:1、各样本是相互独立的随机样本;2、各样本均来自正态分布总体;3、各样本的总体方差相等,即方差齐。
1. 为实验"736"对肉瘤S180的抑制作用,将长出黄豆大肉瘤的小白鼠16只随机地分为两组。
实验组注射"736",对照组注射等量的生理盐水。
10天后取瘤称重,结果如下表所示。
欲比较"736"对肉瘤S180是否有抑制作用,用何种假设检验方法?对照组 2.1 4.9 2.7 4.3 2.5 1.7 4.5 3.4给药组 1.6 2.2 2.0 2.0 2.5 1.0 3.7 1.52. 甲院收治肝癌238例,观察期间死亡88例;乙医院同期收治54例,死亡18例。
欲比较两院肝癌病死率有无差别,可用何种假设检验方法?3.某作者根据以下资料认为乌鲁木齐缺铁性贫血患病率比贵阳低,是否正确?说明理由。
住院病人缺铁性贫血的患病率地区住院人数贫血例数患病率(%)乌鲁木齐 20611 53 0.26贵阳 31860 137 0.434.下表中的资料计算方法是否正确?某医院各科病死率科别患者数死亡数病死率(%)外科 1500 180 12.0内科 500 20 4.0传染科 400 24 6.0合计 2400 224 7.35.检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。
现用甲、乙两法检测相同的血液样品,所得结果如下表。
检验甲乙两法检出血磷是否相同,用何统计方法?样本号 1 2 3 4 5 6 7乙法 2.74 0.54 1.20 5.00 3.85 1.82 6.51甲法 4.49 1.21 2.13 7.52 5.81 3.35 9.616.某地1968年与1971年几种主要急性传染病情况如下表。
某医师根据此资料中痢疾与乙脑由1968年的44.2%与3.4%分别增加到1971年的51.9%和5.2%,认为该地1971年痢疾与乙脑的发病率升高了,值得注意!你的看法如何?为什么?1968年 1971年病种病例数%病例数%痢疾 4206 44.2 3079 51.9麻疹 2813 29.6 1465 24.7流脑 1650 17.3 824 13.9乙脑 327 3.4 310 5.2白喉 524 5.5 256 4.3合计 9520 100.0 5934 100.07.对某地200名20岁男子进行身高,体重测量。
卫生统计学简答题方差分析的基本思想和应用条件是什么?答:方差分析的基本思想是,对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。
不同之处在于变异分解的项目因设计不同而异。
具体来讲,根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,从而推论各种研究因素对试验结果有无影响。
其应用条件是,①各样本是相互独立的随机样本,均服从正态分布;②各样本的总体方差相等,即方差齐性。
多组定量资料比较时,统计处理的基本流程是什么?答:多组定量资料比较时首先应考虑用方差分析,对其应用条件进行检验,即方差齐性及各样本的正态性检验。
若方差齐性,且各样本均服从正态分布,选单因素方差分析。
若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis秩和检验,或通过某种形式的数据变换使其满足方差分析的条件。
若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如Bonferonni、LSD法等)进行两两比较。
简述秩和检验的优缺点秩和检验的优点是(1)不受总体分布限制,适用面广;(2)适用于等级资料及两端无确定值的资料;(3)易于理解,易于计算。
缺点是符合参数检验的资料,用秩和检验,则不能充分利用信息,检验效能低。
试述假设检验与置信区间的联系与区别。
答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。
置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等。
试述两类错误的意义及其关系。
答:Ⅰ类错误(typeⅠerror):如果检验假设0H实际是正确的,由样本数据计算获得的检验统计量得出拒绝0H的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设0H(弃真)的错误称为Ⅰ类错误。
Ⅱ类错误(type Ⅱerror):假设检验的另一类错误称为Ⅱ类错误(type Ⅱerror),即检验假设0H原本不正确(1H正确),由样本数据计算获得的检验统计量得出不拒绝0H(纳伪)的结论,此时就犯了Ⅱ类错误。
Ⅱ类错误的概率用β表示。
在假设检验时,应兼顾犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)。
犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)成反比。
如果把Ⅰ类错误的概率定得很小,势必增加犯Ⅱ类错误的概率,从而降低检验效能;反之,如果把Ⅱ类错误的概率定得很小,势必增加犯Ⅰ类错误的概率,从而降低了置信度。
为了同时减小α和β,只有通过增加样本含量,减少抽样误差大小来实现。
什么资料适合用秩和检验进行检验?简述秩和检验步骤。
答:提示:进行有序资料的比较时宜采用秩和检验。
(1)等级资料;(2)偏态资料;(3)分布不明的资料;(4)资料中各组方差不齐,且转换后不能达到方差齐性;(5)一端或两端无界。
秩和检验步骤为:①建立假设H0和H1,并确定检验水准α;②根据不同的设计类型对资料进行编秩并计算秩和;③根据计算的秩和直接查表或计算相应的统计量再查表,确定P值下结论。
进行有序资料的比较时宜采用秩和检验。
服从二项分布及Poisson分布的条件分别是什么?答:二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。
Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率π很小。
2. 二项分布、Poisson分布分别在何种条件下近似正态分布?简答:二项分布的正态近似:当n较大,π不接近0也不接近1时,二项分布B(n,π)近似正态分布N(πn, )1(ππ−n)。
Poisson分布的正态近似:Poisson分布)(λΠ,当λ相当大时(≥20),其分布近似于正态分布简述简单线性回归分析的基本步骤。
答:①绘制散点图,考察是否有线性趋势及可疑的异常点;②估计回归系数;③对总体回归系数或回归方程进行假设检验;④列出回归方程,绘制回归直线;⑤统计应用。
简述线性回归分析与线性相关的区别与联系。
答:区别:(1)资料要求上,进行直线回归分析的两变量,若X为可精确测量和严格控制的变量,则对应于每个X的Y值要求服从正态分布;若X、Y都是随机变量,则要求X、Y服从双变量正态分布。
直线相关分析只适用于双变量正态分布资料。
(2)应用上,说明两变量线性依存的数量关系用回归(定量分析),说明两变量的相关关系用相关(定性分析)。
(3)两个系数的意义不同。
r说明具有直线关系的两变量间相互关系的方向与密切程度,b 表示X每变化一个单位所导致Y的平均变化量。
(4)两个系数的取值范围不同:-1≤r≤1,∞<<∞−b。
(5)两个系数的单位不同:r没有单位,b有单位。
联系:(1)对同一双变量资料,回归系数b与相关系数r的正负号一致。
b>0时,r>0,均表示两变量X、Y 同向变化;b<0时,r<0,均表示两变量X、Y反向变化。
(2)回归系数b与相关系数r 的假设检验等价,即对同一双变量资料,rbtt=。
由于相关系数r的假设检验较回归系数b的假设检验简单,故在实际应用中常以r的假设检验代替b的假设检验。
(3)用回归解释相关:由于决定系数2R=SS回/SS总,当总平方和固定时,回归平方和的大小决定了相关的密切程度。
回归平方和越接近总平方和,则2R越接近1,说明引入相关的效果越好。
例如当r=0.20,n=100时,可按检验水准0.05拒绝H0,接受H1,认为两变量有相关关系。
但2R=(0.20)2=0.04,表示回归平方和在总平方和中仅占4%,说明两变量间的相关关系实际意义不大直线相关与回归有何联系与区别?联系:(1)对符合相关回归条件的资料,其相关系数与回归系数的正负号相同。
(2)回归系数与相关系数的假设检验是等价的,对同一样本的资料,回归系数的t检验与相关系数的t检验其数值相等,即tr=tb。
(3)可以用回归解释相关。
r的平方称为决定系数(coefficient of determination)。
区别:回归要求因变量Y是正态分布的随机变量;X可以是精确测量或严格控制的变量,也可以是呈正态分布的随机变量,当X是精确测量或严格控制的变量时,此时的回归称Ⅰ型回归。
当X是呈正态分布的随机变量时,此时的回归称为Ⅱ型回归。
相关要求变量X、Y 都是呈正态分布的随机变量。
当说明两变量间依存变化的数量关系时用回归,当说明两变量间的相关关系时用相关标准差与标准误有何区别和联系?标准差和标准误都是变异指标,但它们之间有区别,也有联系。
区别: ①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。
标准误用于估计参数的可信区间,进行假设检验等。
③它们与样本含量的关系不同: 当样本含量n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。
联系: 标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。
(联系:1、二者都是表示变异度大小的统计指标2、标准误与标准差大小成正比,与抽样例数n的平方根成反比)何谓假设检验?其一般步骤是什么?所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后根据样本所提供的信息,借助一定的分布,观察实测样本情况是否属于小概率事件,从而对所提出的假设作出拒绝或不拒绝的结论的过程。
假设检验一般分为以下步骤: ①建立假设:包括: H0,称无效假设;H1: 称备择假设;②确定检验水准:检验水准用α表示,α一般取0.05;③计算检验统计量:根据不同的检验方法,使用特定的公式计算;④确定P值:通过统计量及相应的界值表来确定P值;⑤推断结论:如P>α,则接受H0,差别无统计学意义;如P ≤α,则拒绝H0,差别有统计学意义。
常用统计图的适用范围是什么?常用的统计图及适用条件是: ①条图,适用于相互独立的资料,以表示其指标大小;②百分条图及远圆图,适用于构成比资料,反映各组成部分的大小;③普通线图: 适用于连续性资料,反映事物在时间上的发展变化的趋势,或某现象随另一现象变迁的情况。
④半对数线图,适用于连续性资料,反映事物发展速度(相对比)。
⑤直方图: 适用于连续性变量资料,反映连续变量的频数分布。
⑥散点图: 适用于成对数据,反映散点分布的趋势。
简述率的标准化法的基本思想当比较两个总率时,如果两组内部某种重要特征在构成上有差别,则直接比较这两个总率是不合理的;因为这些特征构成上的不同,往往造成总率的升高或下降,从而影响两个总率的对比。
率标准化法的基本思想就是采用统一的内部构成计算标准化率,以消除内部构成不同对指标的影响,使算得的标准化率具有可比性。
例如比较两人群的死亡率、出生率、患病率时,常要考虑人群性别、年龄的构成是否相同;试验组和对照组治愈率的比较时,常要考虑两组病情轻重、年龄、免疫状态等因素的构成是否相同。
如其构成不同,需采用统一的标准进行校正,然后计算校正后的标准化率进行比较,这种方法称为标准化法。
简述χ2检验的的基本思想χ2检验是检验理论频数与实际频数的吻合程度,从基本公式(TTA22)(−∑=χ)可以看出,在检验假设成立的情况下,T(理论频数)与A(实际频数)之差一般不会很大,此时χ2值也较小;反之,χ2值较大。
当χ2值较大,且大于一定的界值时,就拒绝H0,接受H1,认为两样本率有统计学差异。
当χ2值较小,且小于特定的界值时,就不拒绝H0,认为两样本率差异无统计学意义简述当不满足行×列的2χ检验的条件时的处理办法。
当不满足行×列的2χ检验的条件(R×C表中不宜有1/5的格子数小于5,或有一个格子的理论频数小于1时,可采用下述方法处理:(1)增大样本例数,(2)删除理论数较小的行和列,(3)将理论数较小的行或列与性质相近的行或列合并,但在合并时应注意合并的合理性。
(2)和(3)两种处理方法会丢失部分信息。
请简述正态分布的特征1、曲线在横轴上方均数处最高;2、以均数为中心,左右对称;3、正态分布有两个参数:(1)μ: 位置参数,确定曲线位置当σ一定时,μ越大,曲线越向右移动;μ越小,曲线越向左移动。
(2)σ: 离散度参数,决定曲线的形态:当μ一定时,σ越大,表示数据越分散,曲线越“胖”;σ越小,表示数据越集中,曲线越“瘦”。
4、正态分布曲线下的面积有一定的分布规律简述直线相关与秩相关的区别参数检验与非参数检验有何区别,各有何优缺点?(1)区别:参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。
非参数检验:不依赖总体分布的具体形式,检验分布位置是否相同。