卫生统计学复习题
- 格式:doc
- 大小:168.50 KB
- 文档页数:13
《卫生统计学》一、名词解释1.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。
计量资料亦称定量资料、测量资料。
.其变景值是定量的,表现为数值大小,一般有度量衡单位。
2.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
3.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
等级资料乂称有序变量。
4.总体:总体指特定研究对象中所有观察单位的测量值。
5.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本。
6.抽样误差:抽样误差是指样本统计量与总体参数的差别。
在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
7.频数表:用来表示一•批数据各观察值在不同取值区间出现的频繁程度(频数)。
8.算术均数:描述一组数据在数量上的平均水平。
总体均数用P表示,样本均数用X 表示。
9.中位数:将-•组观察值由小到大排列,位次居中的那个数。
10.极差:亦称全距,即最大值与最小值之差, 用于资料的粗略分析,其计算简便但稳定性较差。
11.方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
12.标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。
13.变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。
14.正态分布:若资料X的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。
通常用记号M u ,。
9表示均数为u , 标准差为。
的正态分布。
15.标淮正态分布:均数为0、标准差为1的正态分布被称为标准正态分布,通常记为Mo,I2)o16.统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。
卫生统计学考试试题卫生统计学是一门运用统计学原理和方法,研究卫生领域中数据的收集、整理、分析和解释的学科。
它对于医学研究、公共卫生决策、医疗质量评估等方面都具有重要的意义。
以下是一套卫生统计学考试试题,旨在考查您对这门学科的理解和应用能力。
一、选择题(每题 3 分,共 30 分)1、以下哪种数据类型通常用于表示性别?()A 定量数据B 定性数据C 等级数据D 连续数据2、均数和标准差的关系是()A 标准差越大,均数代表性越好B 标准差越小,均数代表性越差C 均数越大,标准差越小D 标准差越大,均数代表性越差3、用于描述正态分布资料集中趋势的指标是()A 中位数B 几何均数C 算术均数D 众数4、两样本均数比较,t 检验的前提条件是()A 两样本来自正态总体且方差齐B 两样本来自正态总体C 两样本方差齐D 以上都不对5、完全随机设计方差分析中,组间变异主要反映()A 随机误差B 处理因素的作用C 抽样误差D 测量误差6、进行直线相关分析时,若 r>0,则()A 两变量呈正相关B 两变量呈负相关C 两变量无线性相关D 以上都不对7、对于四格表资料,当n≥40 且有一个理论频数1≤T<5 时,宜采用()A 四格表确切概率法B 校正卡方检验C 配对卡方检验D 直接计算概率法8、标准化法的目的是()A 消除内部构成不同对总率的影响B 消除混杂因素对结果的影响C 使率能够直接进行比较D 以上都对9、生存分析中的生存时间指的是()A 从观察起点到终点事件发生所经历的时间B 从观察起点到终点事件未发生所经历的时间C 从起点事件发生到终点事件发生所经历的时间D 从起点事件发生到终点事件未发生所经历的时间10、以下哪种统计图适用于描述构成比资料?()A 直方图B 折线图C 圆图D 箱式图二、简答题(每题 10 分,共 30 分)1、简述标准差和标准误的区别与联系。
2、简述假设检验的基本步骤。
3、请说明生存分析中生存率和生存曲线的概念及意义。
卫生统计学考试试题及答案一、选择题(每题2分,共20分)1. 卫生统计学研究的对象是()A. 疾病的发生与发展规律B. 疾病的流行规律C. 疾病的防治措施D. 疾病的统计方法答案:B2. 下列哪种分布类型属于偏态分布()A. 正态分布B. 二项分布C. Poisson分布D. 偏态分布答案:D3. 在卫生统计学中,下列哪种指标用于描述数据的离散程度()A. 平均数B. 中位数C. 极差答案:D4. 在卫生统计学中,下列哪种指标用于描述两个变量之间的关系()A. 相关系数B. 回归系数C. t检验D. χ²检验答案:A5. 下列哪种检验方法用于比较两个样本率的差异()A. t检验B. χ²检验C. F检验D. Z检验答案:B6. 在卫生统计学中,下列哪种检验方法用于比较两个独立样本的均数差异()A. t检验B. χ²检验D. Z检验答案:A7. 在卫生统计学中,下列哪种检验方法用于比较两个相关样本的均数差异()A. t检验B. χ²检验C. F检验D. 配对t检验答案:D8. 下列哪种情况适宜采用秩和检验()A. 数据分布未知B. 数据分布已知C. 数据为正态分布D. 数据为偏态分布答案:A9. 在卫生统计学中,下列哪种检验方法用于分析多因素对结果的影响()A. 单因素方差分析B. 多因素方差分析C. 多元回归分析D. 多重线性回归分析答案:C10. 下列哪种情况适宜采用logistic回归分析()A. 因变量为连续变量B. 因变量为分类变量C. 自变量为连续变量D. 自变量为分类变量答案:B二、填空题(每题2分,共20分)1. 卫生统计学中的基本任务包括:①数据的收集;②数据的整理;③数据的描述;④______。
答案:数据的分析2. 在卫生统计学中,描述数据集中趋势的指标有:平均数、中位数、众数,其中______是唯一一个位置平均数。
答案:中位数3. 在卫生统计学中,描述数据离散程度的指标有:极差、方差、标准差,其中______是方差的平方根。
实用卫生统计学复习题第一章绪论一、名词解释:1.同质与变异2.总体和样本3.参数和统计量4.抽样误差5.概率6.计量资料7.计数资料8.等级资料二、是非题:1.用定性的方法得到的资料称作数值变量资料,亦称作计数资料。
()2.观察某人群的血型,以人为观察单位,结果分为A型、B型、AB型和O型,是有序分类资料。
() 3.分类变量或称定量变量,其变量值是定量的,表现为数值大小,一般有度量衡单位,亦称计量资料。
()4.调查某地10岁女孩的身体发育状况,以人为观察单位,测得每个人的身高(cm)、体重(kg)、血压(mmHg),此资料称为多项分类变量资料。
()5.用定量的方法测定观察单位某个量的大小的资料,称数值变量资料。
()7.等级分组资料兼有计数与计量资料的性质。
()8.将观察单位按某一属性的不同程度分组计数,所得各组的观察单位称为计数资料。
()三、单选题:1.计量资料﹑计数资料和等级分组资料的关系有A.计量资料兼有计数资料和等级分组资料的一些性质B.计数资料兼有计量资料和等级分组资料的一些性质C.等级分组资料兼有计量资料和计数资料的一些性质D.计数资料有计量资料的一些性质E.等级分组资料又可叫半计数资料2.为了由样本推断总体,样本应该是A.总体中任意一部分B.总体中的典型部分C总体中有意义的一部分 D.总体中有价值的一部分E.总体中有代表性的一部分3.统计学上所说的系统误差﹑测量误差和抽样误差三种误差,在实际工作中有A.三种误差都不可避免B.系统误差和测量误差不可避免C.系统误差和抽样误差不可避免D.测量误差和抽样误差不可避免E.三种误差都可避免4.抽样误差指的是A.个体值和总体参数值之差B.个体值和样本统计量值之差C.样本统计量值和总体参数值之差D. 总体参数值和总体参数值之差5.医学统计工作的基本步骤是A.调查资料﹑校对资料﹑整理资料 B.调查资料﹑归纳资料﹑整理资料 C.收集资料﹑校对资料﹑整理资料 D.收集资料﹑整理资料﹑分析资料 E.收集资料﹑校对资料﹑归纳资料6.统计学中所说的总体是指A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体答案名词解释:(1)同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
复习资料一《卫生统计学》第一大题:单项选择题(总分:60分)1欲了解某市8岁小学生的身高情况,该市某小学二年级8岁小学生是:()A.样本B.有限总体C.无限总体D.个体2、在计算方差时,若将各观察值同时减去某一常数后求得的方差:()A.会变小B.会变大C.不变D.会出现负值3、某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为()A.概率B.构成比C.发病率D.相对比4、对于服从双变量正态分布的资料,如果直线相关分析算出的…值越大,则经回归分析得的相应的b值:A.越大B.越小C.比r小D.可能较大也可能较小5、在比较甲、乙两种监测方法测量结果是否一直时,若采用配对设计秩和检验,甲、乙两法测量值之差中有-0.02、0.02,若差值绝对值的位次为3、4,则这两个差值的秩次分别为:()A.-3.5, 3.5B.-3.5, -3.5C.3.5, 3.5D.-3, 46、某卫生局对其辖区内甲、乙两医院医疗技术人员的业务素质进行考核,在甲医院随机抽取100人,80人考核结果为优良;乙医院随机抽取150人,100人考核结果为优良。
本题中资料类型与设计类型分别为:A.定量资料成组设计B•定量资料配对设计C•分类资料成组设计D.分类资料配对设计7、在某农村地区随机抽取100名儿童,进行蛔虫感染情况粪检,结果50名儿童蛔虫卵粪检为阳性,则该地儿童蛔虫卵粪检总体阳性率的95%的置信区间为:()A.35%-60%B.37%-63%C.30%-70%D.40% -60%8、某研究欲了解男性高血压患者与女性高血压患者血脂是否有差异,从某市 6 家医院随机调查了 400人,测量血脂水平,经t检验,得P<0.05,有统计学差异,由此推断该地男、女高血压患者血脂总体均数有差别,这里所谓有统计学差异是指: ( )A.两样本均数差别有统计学差异B•两总体均数差别有统计学差异C•两样本均数和两总体均数的差别有统计学差异D. 其是有一个样本均数和总体均数有统计学差异9、假设某地35岁以上正常成年男性收缩压的总体均数为120.2mmHg,标准差为11.2mmHg,后者反映的是: ( )A.个体变异的大小B.抽样误差的大小C.系统误差的大小D.总体的平均水平10、Wilcoxon 两样本比较的秩和检验在编秩时,若遇到两组中有相同数值,应: ( )A.不计秩次B.依次序编秩C.取其平均秩次D.以平均秩次的整数为秩11、下列关于样本含量的叙述,正确的是: ( )A.样本含量越大越好B.以实际可以收集到的样本例数为准C.时间、财力、人力等条件允许下的最大样本例数D.一定的推断精度和检验效能下的最少样本例数12、两样本均数比较,经t 检验,差别有显著性时, P 越小,说明: ( )A.两个样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D. 越有理由认为两样本均数不同13、成组设计的方差分析中,有( )A.MS组间=MS组内B.SS组内=SS组间C.MS总=MS组间+MS组内D.SS总=SS组间 +SS 组内14、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数=1,则有:()A.SS 总=SS 残B.SS 残=SS 回C.SS 总=SS 回D.SS 总 >SS 回15、正态分布曲线下,横轴上,从均数 .到.+1.96S S的面积为:()A.95%B.45%C.97.5%D.47.5%16、下列关于新生儿特征的变量中,属于定量资料的一组数据为A.头围、性别、身高B.头围、性别、胎次 C•头围、性别、体重 D.头围、身高、体重17、某地区9岁男童肺活量的分布类型通常是A.正态分布B.对数正态分布C.正偏态分布D.负偏态分布18、两组定量资料的比较,若已知n1、n2均小于30,总体方差齐且呈正分布,宜采用A.t检验B.tt检验t ' C检验D.秩和检验19、对于3 >4行列表的X2检验,其自由度计算公式为A.3-1B.4-1C.3 4->D. ( 3-1) (4-1)20、某研究者欲比较两种血红蛋白检测方法是否相同,从健康人中招募了24名志愿者,每名志愿者采集10ml血样分装在2个试管中,分别用两种方法进行检测,对检测结果用配对检验进行统计分析,则其自由度为A.11B.12C.22D.2321、关于假设检验,下面说法正确的是A.检验水准只能取0.05B.假设检验是统计推断的内容之一C.假设检验的结论不会犯错误D.假设检验就是t检验22、同一两独立样本均数比较的资料,进行方差分析的结果与t检验的结果A.完全等价,且t=FB.完全等价,且< =FC.完全等价,且「=FD.不同,方差分析的结果更可靠23、随机事件发生概率 P 的变化范围为A.P > OB.P > 1C.0 < PW 1D.0524、 反映一组两端有不确切值资料的离散水平,最适宜的指标是A.RB.Qu-QLC.SD.」一 -'125、 下列关于配伍组设计方差分析变异分解的式子正确的是A.SS 总=SS 配伍+SS 误差B.SS 总=SS 处理+SS 误差C.SS 总=SS 配伍+SS 处理+SS 误差D.MS 总=MS 配伍+MS 处理+MS 误差 26、 对直线回归方程1 =0.635x ,下列说法正确的是A.所有实测点都在回归直线上B.所绘回归直线不过点C")C.回归直线经过原点 D.x 的取值范围为-_'27、 若3个样本率比较,得到川0.05,2 , PV 0.05,按照0.05检验水准,下列说法正 确的是A.可以认为3个总体率都不相同B.可以认为3个总体率不全相同C.可以认为3个总体率相同D.可以认为3个样本率相同28、 描述2000〜2010年成都市女性居民子宫颈癌发病率的时间变化趋势,宜绘制A.条图B.普通线图C.直方图D.散点图 29、 已知某药物治疗糖尿病有效率为60%,根据纳入标准和排除标准选取200例糖尿病患者,采用新药 A 进行治疗,结果140例患者有效。
卫生统计学试题及答案一、单项选择题(每题2分,共20分)1. 卫生统计学中,以下哪个不是描述数据分布的度量?A. 平均数B. 中位数C. 众数D. 方差答案:D2. 在统计学中,以下哪个概念用于描述数据的离散程度?A. 均值B. 标准差C. 相关系数D. 回归系数答案:B3. 以下哪个不是卫生统计学中的抽样方法?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样答案:D4. 卫生统计学中,以下哪个是用于描述两个变量之间关系的度量?A. 相关系数B. 回归系数C. 标准差D. 方差答案:A5. 在卫生统计学中,以下哪个是用于估计总体参数的统计量?A. 样本均值B. 总体均值C. 样本方差D. 总体方差答案:A6. 卫生统计学中,以下哪个是用于比较两个独立样本均值的统计检验?A. t检验B. 卡方检验C. 方差分析D. 相关性检验答案:A7. 在卫生统计学中,以下哪个是用于描述数据分布偏斜程度的度量?A. 峰度B. 偏度C. 标准差D. 方差答案:B8. 卫生统计学中,以下哪个是用于比较两个相关样本均值的统计检验?A. t检验B. 配对t检验C. 方差分析D. 卡方检验答案:B9. 在卫生统计学中,以下哪个是用于比较多个样本均值的统计检验?A. t检验B. 配对t检验C. 方差分析D. 卡方检验答案:C10. 卫生统计学中,以下哪个是用于描述数据分布的集中趋势的度量?A. 方差B. 标准差C. 均值D. 偏度答案:C二、多项选择题(每题3分,共15分)11. 卫生统计学中,以下哪些是描述数据分布的度量?A. 平均数B. 中位数C. 众数D. 标准差答案:ABCD12. 在卫生统计学中,以下哪些是用于估计总体参数的统计量?A. 样本均值B. 样本方差C. 总体均值D. 总体方差答案:AB13. 卫生统计学中,以下哪些是用于比较两个样本均值的统计检验?A. t检验B. 卡方检验C. 方差分析D. 配对t检验答案:AD14. 在卫生统计学中,以下哪些是用于描述数据分布偏斜程度的度量?A. 峰度B. 偏度C. 标准差D. 方差答案:AB15. 卫生统计学中,以下哪些是用于比较多个样本均值的统计检验?A. t检验B. 配对t检验C. 方差分析D. 卡方检验答案:C三、填空题(每题2分,共20分)16. 卫生统计学中,用于描述数据分布的离散程度的度量包括________、________和________。
卫生统计学试题汇总医学统计学复习题一、名词解释1、总体2、样本3、随机抽样4、变异5、概率6、随机误差(偶然误差)7、参数8、统计量9、算术均数10、中位数11、百分位数12、频数分布表13、几何均数14、四分位数间距15、方差16、标准差17、变异系数18、标准正态分布19、医学参考值范围20、可信区间21、统计推断22、参数估计23、标准误及24、检验水准25、检验效能26、率27、直线相关28、直线回归29、实验研究30、回归系数二、单项选择1.观察单位为研究中的()。
A.样本B.全部对象C.影响因素D.个体E.观察指标2.总体是由( )组成。
A.部分个体B.全部对象C.全部个体D.同质个体的所有观察值E.相同的观察指标3.抽样的目的是()。
A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例D.研究总体统计量E.研究特殊个体的特征4.参数是指( ) 。
A.参与个体数B.总体中研究对象的总和C.样本的统计指标D.样本的总和E.总体的统计指标5.关于随机抽样,下列哪一项说法是正确的()。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随机抽取个体D.为确保样本具有更好的代表性,样本量应越大越好E.选择符合研究者意愿的样本6.反映计量资料平均的指标是()。
A.频数B.参数C.百分位数D.平均数E.统计量7.表示总体均数的符号是( ) 。
A.σB.μC.XD. SE. M8.下列指标中,不属于集中趋势指标的是()。
A.均数B.中位数C.百分位数D.几何均数E.众数9. ( )分布的资料,均数等于中位数。
A.对称分布B.正偏态分布C.负偏态分布D.对数正态分布E.正态分布10.一组某病患者的潜伏期(天)分别是:2、5、4、6、9、7、10和18,其平均水平的指标该选()。
A.中位数B.算术均数C.几何均数D.平均数E.百分位数末端有确定数据11.利用频数分布表和公式∑-+=LmfnfiLM2(计算中位数时,要求()。
卫生统计学考试复习题库大全附答案1 、统计推断的两个方面为A 、点估计与区间估计B 、参数估计与假设检验 ( 正确答案 )C 、统计图表与假设检验D 、统计图表与参数估计E 、统计预测与统计控制2. 总体的定义是指根据研究目的确定的总体是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种观察值变量值的集合。
A 、所有样本的全体B 、观察单位的全体C 、根据研究目的确定的同质观察单位的全体 ( 正确答案 )D 、观察单位某种变量值的集合E 、样本中同质观察单位某种变量值的集合3. 计量资料的正确定义是指计量资料又称数值变量,其变量值是定量的,表现为数值大小,一般有度量衡单位。
A 、每个观察单位的观测值都是绝对数的资料B 、每个观察单位的观测值都是相对数的资料C 、每个观察单位的观测值都是平均数的资料D 、每个观察单位都有 1 个数值,无论该观测值是绝对数、相对数还是平均数的资料 ( 正确答案 )E 、将每个观察单位按某种属性或类别分组,然后清点各组的观测单位数得到的资料4. 下列关于总体和样本说法正确的是总体:根据研究的目的所划定范围内的同质的个体构成的全体,所有同质观察单位某种观察值(即变量值)的集合。
样本:总体中随机抽取的一部分观察单位的观测值的集合。
A 、总体的指标称为参数,用拉丁字母表示B 、样本的指标称为统计量,用希腊字母表示C 、总体中随机抽取的部分观察单位组成了样本D 、总体中随机抽取的部分观察单位的变量值组成了样本 ( 正确答案 )E 、总体中随意抽取的部分观察单位的变量值组成了样本5. 欲测量某地 2002 年正常成年男子的血糖值,其总体为A 、该地所有成年男子B 、该地所有成年男子血糖值C 、 2002 年该地所有正常成年男子血糖值 ( 正确答案 )D 、 2002 年所有成年男子E 、 2002 年所有成年男子的血糖值答案解析:欲测量某地 2002 年正常成年男子的血糖值,其总体为 2002 年该地所有正常成年男子的血糖值,所以答案选 C 。
卫生统计学复习题库(含答案)1.根据某地6至16岁学生近视情况的调查资料制作统计图,反映患者的年龄分布。
适用的图形种类是直方图,因为6至16岁是连续变量,得到的是连续变量的频数分布。
2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,适用的图形种类是复式直条图,因为有一个检测指标和两个分组变量。
3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,适用的图形种类是复式直条图,因为有一个检测指标和两个分组变量。
4.调查某疫苗在儿童中接种后的预防效果,样本是1000名易感儿童,因为这是研究的总体。
5.要通过样本作统计推断,样本应该是总体中随机抽取的一部分。
6.关于均数,正确的说法是均数是所有观察值的平均值。
7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,适用的描述平均水平的指标是几何均数。
The geometric mean is used to reflect the average level of a set of variable values that are XXX or a log-normal n (skewed n)。
such as antibody titers。
XXX us diseases。
XXX.According to the n d data of 164 cases of Salmonella food poisoning patients。
the one-sided 95% upper limit of the n d was calculated using the percentile method as 57.8 hours。
This means that approximately 5% of the patients have an n d greater than 57.8 hours.A is incorrect: Approximately 5 people have an n d greater than 57.8 hours。
中南大学网络教育课程专试3C习题及参考答案一、名词解释:1.计量资料3.等级资料5.样本7.频数表9.中位数11.方差13.变异系数15.标准正态分布17.抽样误差19.可信区间21.假设检验中P的含义23.检验效能25.方差分析27.相对数29.构成比31.非参数统计33.相关系数35.回归系数卫生统计学2.计数资料4.总体6.变异8.算术均数10.极差12.标准差14.正态分布16.统计推断18.标准误20.参数估计22.1型和II型错误24.检验水准26.随机区组设计28.标准化法30.Y ates 校正32.直线回归34.统计图二、单项选择题:1.观察单位为研究中的A.样本B.全部对象2 .总体是由A.个体组成B.研究对象组成3.抽样的目的是A.研究样本统计量C.研究典型案例研究误差4.参数是指A.参与个体数C.样本的统计指标C.影响因素D.个体C.同质个体组成D.研究指标组成B.由样本统计量推断总体参数D.研究总体统计量B.总体的统计指标D.样本的总和5.关于随机抽样,下列哪一项说法是正确的?A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变7.比较身高和体重两组数据变异度大小宜采用A.变异系数B.方差C.极差D.标准差8.以下指标中()可用来描述计量资料的离散程度。
A.算术均数B.儿何均数C.中位数D.标准差9.血清学滴度资料最常用来表示其平均水平的指标是A.算术平均数B.中位数C.儿何均数D.平均数10.两样木均数的比较,可用B.距宜线的纵向距离的平方和最小D.与直线的垂直距离的平方和最小 B.随机化、重复、设置对照D.处理因素、受试对象、实验效应16. 非参数统计应用条件是 A. 总体是正态分布 C. 不依赖于总体分布 17. 下述哪些不是非参数统计的特点? A.不受总体分布的限定C. 适用于等级资料B. 若两组比较,耍求两组的总体方差相等 D. 要求样本例数很大B. 多数非参数统计方法简单,易于掌握 D.检验效能总是低于参数检验22. 两个小样本比较的假设检验,应首先考虑A. t 检验B.秩和检验C. 任选一种检验方法D.资料符合哪种检验的条件 23. 对于配对比较的秩和检验,其检验假设为A. 样本的差数应来自均数为0的正态总体B. 样本的差数应来自均数为0的非正态总体C. 样本的差数来自中位数为0的总体D. 样本的差数来自方差齐性和正态分布的总体24. 用最小二乘法确定直线|口【归方程的原则是各观察点A.距直线的纵向距离相等 C.与直线的我直距离相等25. 实验设计的三个基本要素是A.受试对象、实验效应、观察指标 C.齐同对比、均衡性、随机化26. 实验设计的基本原则A.方差分析B. t 检验C.两者均可11. 配伍组设计的方差分析中,U 配伍等于A. V &-V 误差B. V 总一 1/处理C. V 总-V 处理+ V 误巷D. V 处理一 V 误差 12. 在均数为耳,标准差为b 的正态总体中随机抽样,|兄一//|2()的概率为5%。
第一章绪论统计学(statistics):就是收集数据、整理数据、分析数据,并由这些数据得到结论的原则和方法。
是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。
总体(population):根据研究目的确定的同质研究对象的全体。
样本(sample):是指从研究总体中抽取的一部分有代表性的个体,这些个体组成样本。
抽样(sampling):是从研究总体中抽取少量有代表性的个体。
同质(homogeneity):总体中的个体具有相同的性质,它是进行统计分析的前提。
变异(variation):因个体差异引起的现象。
同一总体中不同个体间存在的差异。
计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。
将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位称为等级资料。
统计量(statistic):在科研工作中,通过对样本中的观察单位的变量值进行统计分析所得到的统计指标。
参数(parameter):是反映总体特征的统计指标。
概率(probability):表示一个事件发生的可能性大小的数。
(概率的统计定义:在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率。
第二章定量资料的统计描述计量资料:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。
频数:对一个随机变量做出重复的观察,其中某变量值出现的次数。
频数表:当变量值个数较多时,对各变量值出现的频率列表即为频率分布表(frequency distribution table),简称频率表。
对称分布:频数集中位置在正中,左右两侧频数分布大体对称。
偏峰分布:集中位置偏向一侧,频数分布不对称。
峰向左侧偏移的分布为正偏峰分布,而峰向右侧偏移的分布称负偏峰分布。
加权法:当资料中相同观察值较多时,可将相同观察值的个数,即频数f乘以该观察值x,以代替相同观察值逐个相加。
各组段的频率称为权重系数。
中位数(median, M):是将一组观察值从小到大按顺序排列,位次居中的那个数。
百分位数(percentile,P):是一个数值,它将原始观察值分为两部分,理论上有x%的观测值比Px小,有(100-x)%的观测值比Px大。
离散趋势:即个体值之间的变异程度,数据越分散,变异程度越高。
极差(range,R):也叫全距,表示一组观察值中最大值与最小值之差,反映个体差异的范围。
方差(variance):用来度量随机变量和数学期望(即均值)之间的偏离程度,由离均差的平方和除以样本个数得到。
标准差(standard deviation):也称均方差,是各数据偏离平均数的距离的平均数,是描述反应正态分布计量资料离散程度的指标。
是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大小样本均可,最为常用。
变异系数(coefficient of variation):是衡量资料中各观测值变异程度的一个统计量,用标准差与平均数的比值来表示,用于量纲不同和变量间或均数相差较大的变异程度的比较。
第三章定性资料的统计描述定性资料:观察结果表现为互不相容的类别或属性,资料整理时,按某种属性分类,然后清点每类的数据。
定性变量分为多分类和二分类变量。
相对数(relative number):两个有联系的指标的比。
率(rate):描述某种现象发生的频率和强度的指标。
构成比(constituent ratio) :事物内部各组成部分所占整体的比重或分布,常用百分数表示,又称作百分比(percentage)。
相对比(ratio):两个有关指标的比,描述二者的相对水平,反映一个指标是另一个指标的几倍或几分之几。
两个指标可以是绝对数,也可是相对数;可以性质相同或不同。
标准化率:寻找一个统一的分布作为标准组,然后每个比较组均按该分布标准计算相应的率,所得到的率是相对于标准组的,故称为标准化率标准化法:常用于内部构成不同的两个或多个率比较的一种方法,基本思想是指定一个统计标准,按指定标准计算调制率,使之具有可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
标准化死亡比(standard mortality ratio SMR) :(或发病比、患病比等),即被标化组实际死亡(发病、患病等)数与预期死亡(发病、患病等)数之比。
期望寿命:指0岁时的预期寿命。
一般用“岁”表示。
即在某一死亡水平下,已经活到X岁年龄的人们平均还有可能继续存活的年岁数。
实际人口:某一时点,某一地区调查时实际存在的人数(包括临时在该地的人)。
法定人口:某一地区常住居民人数。
性别比:男性人口与女性人口的比值。
老龄人口比重:65岁及以上的人口称老龄人口。
老龄人口占总人口的比例即为老龄人口比重。
人口金字塔:是一种用几何图形来形象地表示人口性别年龄构成的方法。
它以年龄为纵轴,由小到大从基底往上排列,以各年龄组男女人口各占总人口的百分构成(或人口的绝对数)为横轴,男性在左边,女性在右边来绘制的直方图,其图形形如金字塔,故称为人口金字塔。
粗出生率(CBR) :指某年每千人口中的活产数总生育率(GFR):也称普通生育率,是指某年的活产数与同年育龄妇女人口数之比,通常用千分率表示。
年龄别生育率(ASFR):也称年龄组生育率,是指某年每千名某年龄育龄妇女的活产数。
总和生育率(TFR) :是一定时期,每岁一组的年龄别生育率总和。
粗死亡率(简记为CDR):也称普通死亡率,是指某年平均每千名人口中的死亡数。
年龄别死亡率(ASDR):也称年龄组死亡率,是指一年内某年龄组死亡人数与相应的平均人口数之比。
婴儿死亡率(IMR):是指某年不满1岁的婴儿死亡数与同年活产数之比。
新生儿死亡率(NMR):指某地某年活产儿中未满28天的新生儿死亡频数。
某病病死率(CFR):指在某一年间内(1年)换某病者因该病死亡的百分比。
发病率(incidence rate IR) :表示在观察期内,可能发生某种疾病的一定人群中新发生该病的频率。
患病率(prevalence rate PR):又称现患率,表示在某时点上受检人数中现患某种疾病的频率。
有效率:接受治疗的病人中治疗有效的频率动态数列(dynamic series):是一系列按时间顺序排列起来的统计指标(可以为绝对数,相对数或平均数),用以观察和比较该事物在时间上的变化和发展趋势。
绝对增长量:是说明事物在一定时期增长的绝对值,即报告期指标值与基期指标值之差。
平均发展速度:是各环比发展速度的几何平均数,说明某事物在一个较长时期中逐期(如逐年)平均发展的程度。
平均增长速度:是各环比增长速度的平均数,说明某事物在一个较长时期中逐期平均增长的程度。
第四章统计表与统计图简单表(simple table):只按单一变量分组,由一组横标目和一组纵标目组成复合表:又称组合表(combinative table),是将两个或两个以上变量结合起来分组,即由一组横标目和两组及以上纵标目结合起来作为“主语”。
统计图(statistical chart):是用点的位置、线段的升降、直条的长短、面积的大小等来表达统计数据的一种形式。
第五章常用概率分布正态分布(normal distribution):又称高斯分布,是医学和生物界最常见的分布。
该分布是以均数为中心,低于均数的频数与高于均数的频数大致相等,越接近均数,频数越多,离均数越远,频数逐渐减少,形成以均数为中心两侧基本对称的钟型分布。
用N(μ、σ2)表示。
正态曲线(normal curve):是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟形曲线。
标准正态分布(standard normal distribution):总体均数为0、总体标准差为1的正态分布。
医学参考值范围(reference ranges):亦称医学正常值范围,是指特定人群“正常人”的解剖、生理、生化及组织代谢产物含量等数据的波动范围。
第六章参数估计基础总体分布(population distribution):是总体中各元素的观察值所形成的频数或频率分布通常是未知的,可以假定它服从某种分布。
样本分布(sample distribution):也称经验分布,是一个样本中各观察值的频数或频率分布。
当样本容量n逐渐增大时,样本分布逐渐接近总体的分布抽样分布(sampling distribution):是某一样本统计量的全部可能取值的概率分布。
抽样误差(Sampling error ):由抽样引起的样本统计量与总体参数间的差异样本均数的标准差:称为样本均数的标准误(standard error of mean ,SE),简称均数标准误,它反映样本均数之间的离散程度,也反映样本均数抽样误差的大小。
标准误(standard error):样本均数的标准差,即均数的标准误SEM,用于表示均数抽样误差的指标,反映样本均数之间的离散程度和样本均数抽样误差的大小。
t分布:在实际的工作中,往往σ是未知的,常用s作为σ的估计值,为了与μ变换区别,称为t变换,统计量t值的分布称为t分布可信区间(CI):按一定的概率或可信度(1-α)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间。
中心极限定理(central limit theorem):设从均值为μ,方差为σ2的一个任意总体中抽取容量为n的样本,当n充分大(通常n≥30)时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。
参数估计:是指用样本指标(统计量)来估计总体指标(参数)点(值)估计(point estimation):即把样本统计量直接作为总体参数的估计值,如用样本均数来估计总体均数。
这种方法虽然很简单,但是未涉及随机误差,而随机误差在抽样研究中是不可忽视的。
区间估计(interval estimation):即按一定的概率估计总体均数在哪个范围,它把抽样误差引入估计量,确定具有特定概率意义的区间。
参考值范围:指同质总体中大多数个体变量值的分布范围。
95%参考值范围:指同质总体中95%的个体值分布在此范围内。
它与标准差有关,各个体值变异越大,该范围越宽,分布也越分散。
准确度(可信度):反映在可信度1-α的大小,即区间包含总体均数的概率的大小,当然愈接近1愈好;精度(精确度):反映在区间的长度,当然长度愈小愈好。
第七章假设检验基础统计推断(statistical inference):由样本信息对相应总体的特征进行的特征性进行推断。