卫生统计学简答题
- 格式:docx
- 大小:18.07 KB
- 文档页数:7
卫生统计学考试试题卫生统计学是一门运用统计学原理和方法,研究卫生领域中数据的收集、整理、分析和解释的学科。
它对于医学研究、公共卫生决策、医疗质量评估等方面都具有重要的意义。
以下是一套卫生统计学考试试题,旨在考查您对这门学科的理解和应用能力。
一、选择题(每题 3 分,共 30 分)1、以下哪种数据类型通常用于表示性别?()A 定量数据B 定性数据C 等级数据D 连续数据2、均数和标准差的关系是()A 标准差越大,均数代表性越好B 标准差越小,均数代表性越差C 均数越大,标准差越小D 标准差越大,均数代表性越差3、用于描述正态分布资料集中趋势的指标是()A 中位数B 几何均数C 算术均数D 众数4、两样本均数比较,t 检验的前提条件是()A 两样本来自正态总体且方差齐B 两样本来自正态总体C 两样本方差齐D 以上都不对5、完全随机设计方差分析中,组间变异主要反映()A 随机误差B 处理因素的作用C 抽样误差D 测量误差6、进行直线相关分析时,若 r>0,则()A 两变量呈正相关B 两变量呈负相关C 两变量无线性相关D 以上都不对7、对于四格表资料,当n≥40 且有一个理论频数1≤T<5 时,宜采用()A 四格表确切概率法B 校正卡方检验C 配对卡方检验D 直接计算概率法8、标准化法的目的是()A 消除内部构成不同对总率的影响B 消除混杂因素对结果的影响C 使率能够直接进行比较D 以上都对9、生存分析中的生存时间指的是()A 从观察起点到终点事件发生所经历的时间B 从观察起点到终点事件未发生所经历的时间C 从起点事件发生到终点事件发生所经历的时间D 从起点事件发生到终点事件未发生所经历的时间10、以下哪种统计图适用于描述构成比资料?()A 直方图B 折线图C 圆图D 箱式图二、简答题(每题 10 分,共 30 分)1、简述标准差和标准误的区别与联系。
2、简述假设检验的基本步骤。
3、请说明生存分析中生存率和生存曲线的概念及意义。
统计学简答汇总第一章:绪论〔无〕第二章:定量变量的统计描述1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
不同点:表2-5.表2-5 均数,几何均数和中位数的相异点平均数意义应用场合均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布几何均数平均增减倍数①等比资料;②对数正态分布资料中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两察值水平端出现不确定值2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系?答:1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。
百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。
多个百分位数结合使用,可更全面地描述总体或样本的分布特征。
〔2〕计算:中位数和百分位数均可用同一公式计算,即Px=L+〔i/f x〕〔n·x%-Σf L〕可根据研究目的选择不同的百分位数代入公式进行计算分析。
〔3〕应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围确实定。
中位数常和其它分位数结合起来描述分布的特征,在实际工作中更为常用。
百分位数还可以用来描述变量值的离散趋势〔四分位数间距〕。
3.同一资料的标准差是否一定小于均数?答:不一定。
同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。
变异大,标准差就大,有时比均数大;变异小,标准差小。
4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?〔1〕样本含量的大小,样本含量越大,标准差越稳定。
〔2〕分组的多少〔3〕分布形状的影响,偏态分布的标准差较近似正态分布大〔4〕随机测量误差大小的影响〔5〕研究总体中观察值之间变异程度大小5.标准差与变异系数的异同点有哪些?答:标准差:是以算数平均数为中心,反映各观测值离散程度的一个绝对指标.当需要对同一总体不同时期或对不同总体进行比照时,缺乏可比性.当总体平均水平不同或计量单位不同时,用标准差是无法实现两组数据离散程度大小比照的.变异系数:标准差与平均数的比值称为变异系数,记为C·V.变异系数可以消除单位和〔或〕平均数不同对两个或多个资料变异程度比拟的影响。
卫生统计学考试试题及答案(附解释)解析卫生统计学试题及答案(一)1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B.半对数线图C.直方图D.直条图E.复式直条图【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布)直方图(适用于数值变量,连续性资料的频数表变量)直条图(适用于彼此独立的资料)2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图(一个检测指标,两个分组变量)【答案】E3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______.A.直方图B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)D.直条图E.复式直条图【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则______.A.该研究的样本是1000名易感儿童B.该研究的样本是228名阳性儿童C.该研究的总体是300名易感儿童D.该研究的总体是1000名易感儿童E.该研究的总体是228名阳性儿童【答案】D5.若要通过样本作统计推断,样本应是__________.A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分【答案】C6.下面关于均数的正确的说法是______.A.当样本含量增大时,均数也增大B.均数总大于中位数C.均数总大于标准差D.均数是所有观察值的平均值E.均数是最大和最小值的平均值【答案】D7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.A.均数B.几何均数D.方差E.四分位数间距【答案】B几何均数(geometric mean)是用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学研究中常适用于免疫学的指标。
《卫⽣统计学》试题及答案《卫⽣统计学》试题及答案⼀、选择题(每题1分,共50分)(⼀)A 型题(此类题型有四个备选答案,请从中选择最佳答案⼀个) 1.若要通过样本去推断总体,要求样本应是()A.总体中典型的⼀部分B.总体中任⼀部分C.总体中随机抽取的⼀部分D.总体中选取的有意义的⼀部分 2.统计量( )A.是统计总体数据得到的量B.反映总体特征的统计指标C.是通过参数估计得到的数值D.是由样本数据计算出的统计指标 3.计算频率表资料的平均数时各组的组中值应为( )A.本组段变量值的平均数B.(本组段上限值+本组段下限值)/2C.本组段的上限值+本组段的下限值D.本组段变量值的中位数 4.均数和标准差的关系是()A.两者都可以描述资料的变异程度B.标准差越⼤,均数的代表性越好C.均数越⼤,标准差越⼤D.标准差越⼩,均数的代表性越好 5.正态分布曲线下横轴上,从均数到正⽆穷⼤的⾯积为( )。
A .50%B .47.5%C .95%D .不能确定6.某部队夏季拉练,发⽣中暑21 例,其中北⽅籍战⼠为南⽅籍战⼠的2.5 倍,则结论为()。
A .北⽅籍战⼠容易发⽣中暑B .南⽅籍战⼠容易发⽣中暑C .北⽅、南⽅籍战⼠都容易发⽣中暑D .尚不能得出结论 7.标准正态分布曲线下横轴上,从0到1.96的⾯积为( )。
A .50% B .47.5% C .95% D .不能确定8.某市抽样调查了2013年1⽉1⽇⾄2013年12⽉31⽇部分城乡居民脑卒中发病与死亡情况,年平均⼈⼝数为19.1万⼈,其中城镇9.7万⼈,农村为9.4万⼈,在城镇的病例数为500⼈,死亡⼈数450⼈,农村病例数为400⼈,死亡⼈数为300⼈。
根据该资料,城镇居民脑卒中年发病率为()。
A. 47.1/万B.51.5/万C.53.2/万 D . 51.5% 9.据上题资料,城镇居民脑卒中的病死率为()。
A. 47.1/万 B.51.5/万 C.90% D . 51.5% 10.据该资料,农村居民脑卒中的年死亡率为()。
统计学简答汇总第一章:绪论(无)第二章:定量变量的统计描述1.均数﹑几何均数与中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
不同点:表2-5、表2-5 均数,几何均数与中位数的相异点平均数意义应用场合均数平均数量水平应用甚广,最适用于对称分布,特别就是正态分布几何均数平均增减倍数①等比资料;②对数正态分布资料中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两察值水平端出现不确定值2.中位数与百分位数在意义上﹑计算与应用上有何区别与联系?答:1)意义:中位数就是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。
百分位数就是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位就是P50即中位数。
多个百分位数结合使用,可更全面地描述总体或样本的分布特征。
(2)计算:中位数与百分位数均可用同一公式计算,即Px=L+(i/f x)(n·x%-Σf L)可根据研究目的选择不同的百分位数代入公式进行计算分析。
(3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。
中位数常与其它分位数结合起来描述分布的特征,在实际工作中更为常用。
百分位数还可以用来描述变量值的离散趋势(四分位数间距)。
3.同一资料的标准差就是否一定小于均数?答:不一定。
同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。
变异大,标准差就大,有时比均数大;变异小,标准差小。
4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?(1)样本含量的大小,样本含量越大,标准差越稳定。
(2)分组的多少(3)分布形状的影响,偏态分布的标准差较近似正态分布大(4)随机测量误差大小的影响(5)研究总体中观察值之间变异程度大小5.标准差与变异系数的异同点有哪些?答:标准差:就是以算数平均数为中心,反映各观测值离散程度的一个绝对指标、当需要对同一总体不同时期或对不同总体进行对比时,缺乏可比性、当总体平均水平不同或计量单位不同时,用标准差就是无法实现两组数据离散程度大小对比的、变异系数:标准差与平均数的比值称为变异系数,记为C·V、变异系数可以消除单位与(或)平均数不同对两个或多个资料变异程度比较的影响。
统计学简答汇总第一章:绪论(无)第二章:定量变量的统计描写1.均数﹑几何均数和中位数的实用规模有何异同?答:雷同点,均暗示计量材料分散趋势的指标.不合点:表25.表25 均数,几何均数和中位数的相异点平均数意义运用处合均数平均数量程度运用甚广,最实用于对称散布,特别是正态散布几何均数平均增减倍数①等比材料;②对数正态散布材料中位数位次居中的不雅①偏态材料;②散布不明材料;③散布一端或两察值程度端消失不肯定值2.中位数与百分位数在意义上﹑盘算和运用上有何差别与接洽?答:1)意义:中位数是百分位中的第50分位数,经常运用于描写偏态散布材料的分散地位,反应位次居中的不雅察值程度.百分位数是用于描写样本或总体不雅察值序列在某百分地位的程度,最经常运用的百分位是P50即中位数.多个百分位数联合运用,可更周全地描写总体或样本的散布特点.(2)盘算:中位数和百分位数均可用同一公式盘算,即Px=L+(i/fx)(n·x%ΣfL)可根据研讨目标选择不合的百分位数代入公式进行盘算剖析.(3)运用:中位数经常运用于描写偏态散布材料的分散趋势;百分位数经常运用于医学参考值规模的肯定.中位数常和其它分位数联合起来描写散布的特点,在现实工作中更为经常运用.百分位数还可以用来描写变量值的离散趋势(四分位数间距).3.同一材料的尺度差是否必定小于均数?答:不必定.同一材料的尺度差的大小与均数无关,重要与本材料的变异度有关.变异大,尺度差就大,有时比均数大;变异小,尺度差小.4.测得一组材料,如身高或体重等,从统计上讲,影响其尺度差大小的身分有哪些?(1)样本含量的大小,样本含量越大,尺度差越稳固.(2)分组的若干(3)散布外形的影响,偏态散布的尺度差较近似正态散布大(4)随机测量误差大小的影响(5)研讨总体中不雅察值之间变异程度大小5.尺度差与变异系数的异同点有哪些?答:尺度差:是以算数平均数为中间,反应各不雅测值离散程度的一个绝对指标.当须要对同一总体不合时代或对不合总体进行比较时,缺少可比性.当总体平均程度不合或计量单位不合时,用尺度差是无法实现两组数据离散程度大小比较的.变异系数:尺度差与平均数的比值称为变异系数,记为C·V.变异系数可以清除单位和(或)平均数不合对两个或多个材料变异程度比较的影响.6.若何表达一批计量数据的根本特点?答:从分散趋势和离散趋势两方面答复.7. 描写计量材料离散程度(不同大小)的指标有哪些,各实用于什么情况?答:罕有的几种描写离散程度的指标:极差或全距,四分位数差距,方差与尺度差,变异系数.极差合适:数据散布非对称的情况.四分位数差距合适:数据散布非对称的情况.方差与尺度差合适:对称散布或近似正态散布材料,能充分运用全部个别的信息.变异系数实用:当比较两材料的变异程度大小时,假如变量单位不合或均数不同较大时,直接比较无可比性,实用变异系数比较. 8.尺度差有何用处?答:①描写正态散布的变异程度;②正态散布时,均数与尺度差同时写出:X+S;③盘算变异系数;④用尺度差估量变量值的频数散布;⑤用尺度差盘算尺度误.9. 统计描写的根本办法有哪些,各自有何特色?答:统计描写的根本办法:用表.图和数字的情势归纳分解原始材料的重要信息.表:具体.精确.图:直不雅.指标:分解性好.10.简述变异系数的实用机会.答:变异系数实用于变量单位不合或均数不同较大时,直接比较无可比性,实用变异系数比较.11. 如何精确描写一组计量材料?答:(1).根据散布类型选择指标.(2).正态散布材料选用均数与尺度差,对数正态散布材料选用几何均数,一般偏态散布材料选用中位数与四分位数间距.12.原始数据单位变换后,对均数和方差有何影响?答:均数和方差均转变.用实例解释.13.列表的原则和根本请求是什么?答:(1)列表的原则:重点凸起,简单清晰明了;主谓分明,层次清晰.(2)列表的根本请求:①应有简明简要解释统计表内容的标题.既不克不及过与简单,也不呢能过于繁琐或不确实.②标目文字要简明,有单位的标目要注明,标目不宜过多,层次应清晰.③线条不宜过多.除顶线.底线.纵标面前目今与合计行上面的线条外,其他线条一般均应省去.表的左上角不宜有斜线.④表内数字小数位数保存应一致,位次应对齐,不宜留空格.暂缺或未记载用“…”暗示,很多字用“—”暗示,数字是“0”则应填写“0”.⑤备注一般不列入表内,运用“*”号引出,写在表的下面.14.经常运用的统计图有哪几种?他们的实用前提是什么?答:经常运用的统计图有条图.百分条图.圆图.线图.半对数线图.直方图.散点图和统计地图等.(1)直条图:用等宽直条的长短来暗示互相自力的各项指标的数值大小,如发病率等.(2)百分条图.圆图:用长条各段的面积.圆的扇形面积来暗示事物内部各构成部分的散布情况,即各构成比重的大小,如构成比.(3)通俗线图:用线段的起落来暗示持续性材料随时光的变迁.某事物现象的动态及变更趋势.(4)半对数线图:用线段的起落来暗示持续性材料随时光的变迁和某事物现象成长变更的速度.(5)直方图:用直方面积的大小暗示数值变量材料频数散布的情况.(6)散点图:用点的密集程度和趋势暗示两变量间的相干关系.(7)统计地图:用不合的纹线或色彩解释指标高下,描写某事物现象在行政区域上的散布情况.15.半对数线图的图形若何做剖析?答:用于暗示事物的成长速度(比拟较).其横轴为算数尺度,纵轴为对数尺度,在比较几组数据的变更速度(比拟较)时,特别是两组数据相差悬殊时,宜用半对数线图.第三章:定性变量的描写1.为什么不克不及以构成比代率?答:二者解释的问题不合.构成比只能解释某事物内部各构成部分在全部中所占的比重或散布,不克不及解释某现象产生的频率或强度.2.简述相对数尺度化的根本思惟.答:根本思惟: 采取同一的尺度生齿年纪构成,以清除不合生齿构成对两地逝世亡率的影响,使得到的尺度化逝世亡率具有可比性.3.解释在何种情况下应选用率的直接标化法,何种情况选用间接标化法?答: 率的直接标化法:已知各组的年纪别逝世亡率pi.间接标化法:已知各组的逝世亡总数和各年纪组生齿数.4.率的直接标化法,与间接标化法有何不合?答: (1)实用前提不合(见第上题);(2)“尺度”不合:前者选定一个“尺度生齿”或“尺度生齿构成” . 后者选定一套“尺度年纪别逝世亡率” .5.运用相对数时应留意哪些问题?答:运用相对数指标的时刻要留意:分母不宜过小;不要以比代率;材料的可比性;样本指标比较时应做假设磨练.6.经常运用相对数指标有哪些? 它们的意义上有何不合?答:经常运用相对数指标:率.构成比.比.率又称频率指标或强度相对数.解释某现象产生的频率或强度.经常运用来暗示某一事物成长的趋势或程度及特点.构成比又称构成指标或构造相对数.部分与全部之比,解释某事物内部各构成部分在全部中所占的比重或散布.经常运用来暗示疾病或逝世亡的顺位.位次或所占比重.比(又称比拟较)暗示同类的或有接洽的两个现象间的比较关系,经常运用倍数或百分数暗示.7.统计学上材料是否“具有可比性”指的是什么? 你能举出一些不成比的例子吗?答:除研讨身分外,其余重要影响身分应雷同或邻近.一般不雅察单位同质,研讨办法雷同,不雅察时间相等,以及地区.平易近族等客不雅前提一致.例如内科和外科的治愈率就无可比性.8.何谓生齿老龄化?请简述其影响身分.答 1:生齿老龄化是指老年生齿(65 岁及以上)在生齿中所占的比重升高的现象.在没有迁徙的情况下,生齿老龄化的过程重要受生育率和逝世亡率两种身分的影响.生育率降低,使低年纪生齿的比重降低,高年纪生齿的比重响应增长;逝世亡率(主如果中老年生齿的逝世亡率)降低,使寿命延长,老年生齿比重增长.一般来说,生齿老龄化的速度和程度重要取决于生育率的降低速度.当生育率程度降低达到很低的程度且很难再有较大程度的降低时,中老年生齿逝世亡率的降低对生齿老龄化的影响才比较明显.9.发病率.时点患病率.时代患病率的差别.答:(1)发病率是指不雅察期内,可能产生某病的人群中新发病例的频率,其不雅察期多为年.月.日等,急性罕有病多盘算发病率.(2)时点患病率反应在检讨或查询拜访时点必定人群中某病的现患情况(包含该病的新旧病例数).不雅察时点在理论上是无长度的,但现实上不雅察时光不宜过长,一般不超出个月.(3)时代患病率反应在不雅察时代必定人群中消失或风行某病的频度,包含不雅察时代的新发病例和现患病例数,为慢性病的统计指标.10.疾病统计的不雅察单位“病人”和“病例”的差别.答:(1)一小我每次患病都可作为一个病例.以病例为单位的疾病统计,可研讨居平易近各类疾病的频度.疾病的种类及疾病的变动,以获得居平易近患病的根本纪律.(2)病人是指一个有病的人.在不雅察时代内,不雅察对象患有疾病即算作一个病人,不管其患病的种类及患病次数的若干.以病工资单位的疾病统计,在必定程度上反应居平易近的患病频度,可找出具体的患病人群,便于开展对病人小我的防治工作.11.病逝世率和逝世亡率的差别.答:(1)某病病逝世率暗示在划定的不雅察期内,某病患者中因该病而逝世亡的频率.它是反应疾病的轻微程度的指标.在用病逝世率进行比较时应留意病情轻重等内部构成不合的影响.盘算公式为:不雅察期内因某病逝世亡的人数某病病逝世率= 同期该病患者数×1000‰(2)某病逝世亡率暗示在划定的不雅察期内,人群中因某病而逝世亡的频率.它可以反应不合地区或年月某种疾病的逝世亡程度.盘算公式为:不雅察期内因某病逝世亡的人数某病逝世亡率= 同期平均生齿数×1000‰12.简述婴儿逝世亡率指标的现实意义.答:婴儿逝世亡率指某地某年不满一周岁婴儿的逝世亡数与同期活产总数的比值.婴儿逝世亡率= 某年不满周岁婴儿逝世亡数×1000‰ /同期活产数婴儿逝世亡率的高下对平均寿命有重要的影响,它是反应社会卫生状态和婴儿保健工作的重要指标,也是逝世亡统计指标中较为迟钝的指标.婴儿逝世亡率不受年纪的影响,不合国度或地区之间可以互相比较.13.请解释频率型指标与强度型指标的重要差别?答:重要差别:指标的解释不合,频率型指标是暗示事物内部某个构成部分所占的比重或散布,或指某现象产生的频率.强度型指标是指单位时光内某现象产生的频率.14.尺度化法的根本思惟?答:采取同一尺度构成以清除某身分的内部构成不合对总率的影响,使经由过程尺度化后的尺度化率具有可比性.15.请比较发病率和患病率的不合.答:发病率暗示一准时代内,在可能产生某病的必定人群活过的总人年中,新产生的某病病历数,其分子是新病历数,分母是总人年数;患病率,又称现患率,指某时点上受检人数中先患某种病的人数,通经常运用于描写病程较长或发病时光不轻易明白的疾病的患病情况,其分子包含新旧病例数,分母是受检总人数.在必定的人群和时光内,发病率和患病率有亲密关系,两者与病程(D)的关系是:PR=IR×D.16.请比较逝世亡率与病逝世率的不合.答:逝世亡率与病逝世率的分子是一样的,均暗示因某病逝世亡的人数,但逝世亡率的分母是总人年数,着重反应产生的强度,或单位时光内逝世亡的概率;病逝世率的分母是患某病的人数,反应疾病逝世亡的概率.17.运用相对数应留意的事项.答:1.懂得相对数的寄义不成望文生义;2.频率型指标的解释要紧扣总体和属性;3.盘算相对数时分母应有足够数量;4.精确地归并频率(强度)型指标;5.相对数间的比较要具备可比性;6.对相对数的统计揣摸.18.运用尺度化的留意事项.答:1.尺度化的运用规模很广,实用于“某事宜的产生率”可所以治愈率,也可所以患病率,还可所以发病率.病逝世率等.当某个分类变量在两组中散布不合时,这个分类变量就成为两组频率比较的混淆身分,尺度化法的目标就是清除这个混淆身分的影响.19.疾病统计有几类指标,各有什么意义?答:发病率.时点患病率.时代患病率.治愈率.生计率.残疾患病率.前3种详见上述简答题.治愈率:暗示受治病人中治愈的频率.有用力暗示受治病人中治疗有用的频率.两个率重要用于对急性病伤害或防治后果的评价.但治愈和有用的尺度要有明白而具体的划定,只有在尺度雷同的情况下才可以互相比较.生计率:病人能活到某一时点的概率.经常运用于对慢性病及血汗管病等的治疗后果评价和预后评估.20.反应疾病的预防后果和治疗后果的指标有哪些?各有什么特色?答:①发病率:疾病防治后果;②患病率:慢性病预防后果;③治愈率:急性病防治后果;④生计率:慢性病的治疗后果.各指标寄义详见上述简答题.21.测量生育程度有几个指标?各指标有什么不合?答:①粗生育率;②总生育率;③年纪别生育率;④总和生育率.各指标寄义详赐教材P41.22.测量生齿再生育程度有几个指标?各指标有什么不合?答:①天然增长率;②粗再生育率;③净再生育率.各指标寄义详赐教材P42.23.生齿统计应包含哪几个方面?答:医学生齿统计是从卫生保健的角度研讨和描写生齿数量.散布.构造.变动及其纪律,研讨生齿与卫闹事业成长的互相关系,是卫生统计学的重要构成部分.包含描写生齿学特点的指标,生育和生齿逝世亡的指标.详见书本P4044.24.生齿金字塔有几种典范的外形?各解释什么?答:生齿金字塔直不雅地暗示了生齿的年纪.性别构造.每一层代表一个年纪组的生齿,上部代表老年人,下部代表少年儿童,左半部代表男性,右半部代表女性,程度偏向的长度暗示男性和女性生齿的数量各在总生齿中所占的百分比.生齿金字塔一共分3种类型:①年青型:下宽上窄,呈真正的金字塔形,标明少年儿童生齿占总生齿的比重大,预示着将来生齿的成长趋势是增长的.其生齿增长模式一般为“高下高”模式,重要消失有成长中国度;②成年型:底部与中部的宽窄基底细近,出生率.逝世亡率差不久不多,预示着将来生齿的成长趋势是稳固的.其生齿增长模式一般为“低低低”模式;③老年型:上宽下窄,标明少年儿童生齿的比重缩小,老年生齿比重增大,是出生率长期降低的成果.这种类型的生齿问题主如果育龄生齿比重低,假如生育程度不变,预示着将来生齿的成长趋势是负增长的.其生齿增长模式一般为“低低低”模式,一般消失于蓬勃国度.第四章:经常运用概率散布1.正态散布﹑尺度正态散布与对数正态散布在概念上和运用上有何异同?答:概念上:①雷同点:正态散布.尺度正态散布与对数正态散布都是变量的持续型散布.其特点是:散布曲线在横轴上方,略呈钟型,以均数为中间,双方对称,均数处最高,双方逐渐减小,向外延长,不与横轴订交.②相异点:暗示办法不合,正态散布用N (µ,σ2)暗示,尺度正态散布用N(0,1)暗示,对数正态散布N (μlgX,σ2lgX)暗示.(1)运用上:①雷同点:正态散布.对数正态散布都可以转换为尺度正态散布.②相异点:尺度正态散布是尺度正态变量u的散布,尺度正态曲线下的面积独一的由u决议,给运用带来极大便利.对医学材料呈偏态散布的数据,有的经对数变换后屈服正态散布.正态散布.对数正态散布可描写变量值的散布特点,可用于正常值规模估量和质量控制等.正态散布是许多统计办法的理论基本.2.医学中参考值规模的寄义是什么?肯定的原则和办法是什么?寄义:参考值规模亦称正常值规模,它是指特定健康状态人群(清除了有关疾病和身分对所研讨指标有影响的所谓“正常人”不合于“健康人”概念)的剖解.心理.生化等数据绝大多半人的摇动规模.(2)原则:① 抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得成果越靠得住.一般以为样本含量最好在100例以上,以能得到一个散布较为稳固的样本为原则.② 对选定的正常人进行精确而同一的测定,包管测定命据靠得住是肯定正常值规模的前提.③ 剖断是否要分组(如男女.年纪.地区等)肯定正常值规模.④ 决议取双侧规模值照样单侧规模值.⑤ 选择恰当的百分规模⑥ 肯定可疑规模⑦ 估量界值(3)办法:① 百分位数法:Px=L+(i/fx)(n·x%ΣfL)② 正态散布法(对数正态散布):百分位数法用于各类散布型(或散布不明)材料;正态散布法用于屈服或近似正态散布(屈服对数正态散布)的材料.3.对称散布材料在“均数±1.96倍尺度差”的规模内,也包含95%的不雅察值吗?答:不必定.均数±1.96倍尺度差是正态散布的散布纪律,对称散布不必定是正态散布.4.正态散布的重要特点有哪些?答:(1)正态曲线在横轴上方均数处最高.(2)正态散布以均数为中间,阁下对称.(3)正态散布有两个参数,即均数(地位参数)和尺度差(变异度参数).(4)正态曲线下的面积散布有必定例律.5.参考值规模是指什么?答:参考值规模又称正常值规模,即大多半正常人某指标值的规模.“正常人”是指清除了影响研讨指标的疾病和有关身分的同质人群.6.简述估量参考值规模的步调与要点.答:设计:①样本:“正常人” ,大样本n≥100.②单侧或双侧.③指标散布类型.盘算:①若直方图看来像正态散布,用正态散布法.②若直方图看来不像正态散布,用百分位数法.7.简述正态散布的用处.答:(1)估量频数散布.(2)制订参考值规模.(3)质量控制.(4)统计磨练的理论基本.8.简述可托区间在假设磨练问题中的感化.答:可托区间不但能答复不同有无统计学意义,并且还能提醒不同有无现实意义.可托区间只能在预先划定的概率即磨练水准的前提下进行盘算,而假设磨练可以或许获得一个较为确实的概率 P 值.故将二者联合起来,才是对假设磨练问题的完全剖析.9. 二项散布.Poisson散布各有哪些特点?答:二项散布和 Poisson 散布都是离散型散布.二项散布的外形取决于π与 n 的大小:π=0.5 时,不管 n 大小,散布对称.π≠0.5时,图形呈偏态,随n 的增大,逐渐对称.当 n足够大,π或 1π不太小,二项散布 B(n,π)近似于正态散布 N( nπ, nπ(1π) ).Poisson 散布:λ值愈小散布愈偏,λ愈大散布趋于对称,当λ足够大时,散布接近正态散布 N(λ,λ ).10.简述二项散布.Poisson散布.正态散布的关系.答:当 n 足够大,π或 1π不太小时,二项散布近似于正态散布.当n 足够大,π或 1π很小时,二项散布近似于 Poisson散布.λ较大时,Poisson 散布近似于正态散布.11.二项散布的运用前提是什么?答:⑴每次实验有且仅有两个互相排挤的成果(A或非 A).⑵每次实验中,产生 A的概率雷同,均为π.⑶各次实验自力,即 n 次不雅察成果互相自力.12.医学参考值规模肯定的办法是什么?答:百分位数法和正态散布法.13.简述二项散布.Poisson散布.正态散布的差别与接洽.答:差别:二项散布.Poisson散布是离散型概率散布,用概率函数描写其散布状态,而正态散布是持续型概率散布,用密度函数和散布函数描写其散布状态.接洽:Poisson散布可以视为n 很大而π很小的二项散布.当n很大而π和1—π都不是很小的时刻二项散布渐近正态散布,当λ》=20的时刻Poisson 散布渐近正态散布.14.控制图的基起源基本理.答:当影响某一数值指标的随机身分许多,而每个身分所起的感化均不太大时,这个指标的随机摇动属于随机误差,则往往屈服正态散布.相反,假如除随机误差外,还消失某些影响较大的身分导致的误差,称为体系误差,这时指标的摇动就不再屈服正态散布.15.二项散布的特点?答:二项散布图的岑岭在μ=nπ处或邻近;π为0.5时,图形是对称的;当π不等于0.5时,散布不合错误称,且对同一n,π离0.5愈远,对称性愈差.对同一π,跟着n的增大,散布趋于对称.当n→∞时,只要π不太接近0或1,二项散布趋于对称. 16.Poisson散布的特点?答:(1)Poisson散布的总体均数与总体方差相等,均为λ.(2)当λ较小时,图形呈偏态散布;当λ较大时,图形呈正态散布.(3)Poisson散布的不雅察成果具有可加性.17.正态散布曲线的地位与外形的特色?答:(1)关于χ=μ对称.(2)在χ=μ处取得该概率密度函数最大值,在χ=μ±σ处有拐点.(3)曲线下面积为 1.(4)μ决议曲线在横轴上的地位,μ增大,曲线沿横轴向右移;反之,μ减小,曲线沿横轴向左移.(5)σ决议曲线的外形,当μ恒准时,σ越大,数据越疏散,曲线越“矮胖”; σ越小,数据越分散,曲线越“瘦高”.18.什么叫尺度正态散布?答:尺度正态散布又称为u散布,是以0为均数.以1为尺度差的正态散布,记为N(0,1).尺度正态散布曲线下面积散布纪律是:在1.96~+1.96规模内曲线下的面积等于0.9500,在2.58~+2.58规模内曲线下面积为0.9900.统计学家还制订了一张统计用表(自由度为∞时),借助该表就可以估量出某些特别u1和u2值规模内的曲线下面积.19.肯定医学参考值规模的办法及特色?答:①百分位数法:双侧95%医学参考值规模是(P2.5,P97.5),单侧规模是P95以下(人体有害物资如血铅.发汞等),或P5以上(如肺活量).该法实用于任何散布类型的材料.②正态散布法:若X屈服正态散布,医学参考值规模还可以依正态散布的纪律盘算.20.二项散布的界说是什么?二项散布有哪些基赋性质?答:界说:二项散布是n个自力的是/非实验中成功次数的离散概率散布,个中每次实验成功的概率均为p.基赋性质:①图形特点:具体见15题简答题;②二项散布的均数和尺度差:详赐教材P66页公式.21.二项散布道理可进行哪些统计剖析?答:材料需起首知足以下前提:①每次实验只能产生两种对峙的可能成果之一,分别产生两种成果的概率之和恒等于1;②每次实验产生某种成果的概率π固定不变;③反复实验是互相自力的,。
卫生统计学简答题(总4页) -CAL-FENGHAI.-(YICAI)-Company One1-CAL-本页仅作为文档封面,使用请直接删除卫生统计学简答题方差分析的基本思想和应用条件是什么答:方差分析的基本思想是,对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。
不同之处在于变异分解的项目因设计不同而异。
具体来讲,根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F 分布作出统计推断,从而推论各种研究因素对试验结果有无影响。
其应用条件是,①各样本是相互独立的随机样本,均服从正态分布;②各样本的总体方差相等,即方差齐性。
多组定量资料比较时,统计处理的基本流程是什么答:多组定量资料比较时首先应考虑用方差分析,对其应用条件进行检验,即方差齐性及各样本的正态性检验。
若方差齐性,且各样本均服从正态分布,选单因素方差分析。
若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis 秩和检验,或通过某种形式的数据变换使其满足方差分析的条件。
若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如Bonferonni、LSD法等)进行两两比较。
简述秩和检验的优缺点秩和检验的优点是(1)不受总体分布限制,适用面广;(2)适用于等级资料及两端无确定值的资料;(3)易于理解,易于计算。
缺点是符合参数检验的资料,用秩和检验,则不能充分利用信息,检验效能低。
试述假设检验与置信区间的联系与区别。
答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。
置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等。
试述两类错误的意义及其关系。
答:Ⅰ类错误(typeⅠerror):如果检验假设0H实际是正确的,由样本数据计算获得的检验统计量得出拒绝0H的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设0H(弃真)的错误称为Ⅰ类错误。
卫生统计学试题及答案(一)1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B.半对数线图C.直方图D.直条图E.复式直条图【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布)2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图(一个检测指标,两个分组变量)【答案】E? 3.为了反映某地区2000~____年男性肺癌年龄别死亡率的变化情况,可采用______.A.直方图B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)D.直条图E.复式直条图【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则______.A.该研究的样本是1000名易感儿童B.该研究的样本是228名阳性儿童C.该研究的总体是300名易感儿童D.该研究的总体是1000名易感儿童E.该研究的总体是228名阳性儿童【答案】D5.若要通过样本作统计推断,样本应是__________.A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分【答案】C6.下面关于均数的正确的说法是______.A.当样本含量增大时,均数也增大B.均数总大于中位数C.均数总大于标准差D.均数是所有观察值的平均值E.均数是最大和最小值的平均值【答案】D7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.A.均数B.几何均数C.中位数D.方差E.四分位数间距【答案】B8.有人根据某种沙门菌食物中毒患者164例的潜伏期资料,用百分位数法求得潜伏期的单侧95%上限为57.8小时,其含义是:______.A.大约有95人的潜伏期小于57.8小时B.大约有5人的潜伏期大于57.8小时C.大约有5人的潜伏期小于57.8小时D.大约有8人的潜伏期大于57.8小时(全体的百分之五,即是约有8人)E.大约有8人的潜伏期小于57.8小时【答案】D9.以下说法中不正确的是______.A.方差除以其自由度就是均方B.方差分析时要求各样本来自相互独立的正态总体C.方差分析时要求各样本所在总体的方差相等D.完全随机设计的方差分析时,组内均方就是误差均方E.完全随机设计的方差分析时,F=MS组间/MS组内【答案】A10.两组数据中的每个变量值减去同一常数后,作两个样本均数比较的假设检验______.A.t值不变B.t值变小C.t值变大D.t值变小或变大E.不能判断【答案】A11.甲乙两地某病的死亡率进行标准化计算时,其标准的选择______.A.不能用甲地的数据B.不能用乙地的数据C.不能用甲地和乙地的合并数据D.可用甲地或乙地的数据E.以上都不对【答案】D12.以下属于数值变量的是______.A.性别B.病人白细胞计数C.血型D.疗效E.某病感染人数【答案】B13.以下关于样本的说法,不正确的是______.A.样本是从总体中随机抽取的B.样本来自的总体应该是同质的C.样本中应有足够的个体数D.样本来自的总体中不能有变异存在E.样本含量可以估计【答案】D14.以下属于分类变量的是___________.A.IQ得分B.心率C.住院天数D.性别E.胸围【答案】D15.在抽样研究中,当样本例数逐渐增多时_____.A.标准误逐渐加大B.标准差逐渐加大C.标准差逐渐减小D.标准误逐渐减小E.标准差趋近于0【答案】D16.某医院一年内收治202例腰椎间盘后突病人,其年龄的频数分布如下,为了形象表达该资料,适合选用_____.年龄(岁):10~20~30~40~50~60~人数:6405085 20 1A.线图B.条图C.直方图D.圆图E.散点图【答案】C17.关于构成比,不正确的是_____.A.构成比中某一部分比重的增减相应地会影响其他部分的比重B.构成比说明某现象发生的强度大小(某现象发生的强度大小用“概率”即“率”表示)C.构成比说明某一事物内部各组成部分所占的分布D.若内部构成不同,可对率进行标准化E.构成比之和必为100%【答案】B18.若分析肺活量和体重之间的数量关系,拟用体重值预测肺活量,则采用_____.A.直线相关分析B.秩相关分析C.直线回归分析D.方差分析E.病例对照研究【答案】C19.根据下述资料,样本指标提示_____.甲疗法乙疗法病情病人数治愈数治愈率(%)病人数治愈数治愈率(%)轻型403690605490重型604270402870合计10078781008282A.乙疗法优于甲疗法B.甲疗法优于乙疗法C.甲疗法与乙疗法疗效相等D.此资料甲、乙疗法不能比较E.以上都不对【答案】C20.若算得F药物=7.604,P<0.01;F区组=1.596,P>0.05.按α=0.05水准,则4种药物的抑瘤效果和5个随机区组的瘤重的推断结论分别为_____.A.药物组间瘤重不同,区组间也不同B.不能认为药物组间瘤重不同,不能认为区组间不同C.药物组间瘤重不同,但不能认为区组间不同D.不能认为药物组间瘤重不同,但区组间不同E.药物差别较大,不能认为区组间不同【答案】C卫生统计学试题及答案(二)1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____.A.b无统计学意义B.b有高度统计学意义C.b有统计学意义(r有统计学意义,b也有统计学意义)D.不能肯定b有无统计学意义E.a有统计学意义【答案】C2.关于基于秩次的非参数检验,下列说法错误的是_____.A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大D.当样本足够大时,秩和分布近似正态E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B3.随机事件的概率为______.A.P=1B.P=0C.P=-0.5D.0≤P≤1E.-0.5<P<0.5< P>【答案】D4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P越小,说明______.A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同【答案】C5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率,应用何种统计检验方法来较好地分析此数据_____.A.配对t检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验【答案】A6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____.A.T值越大P值越小B.T值越大越有理由拒绝H0C.P值与T值毫无联系D.T值越小P值越小E.以上都不对【答案】D7.方差分析中要求______.A.各个样本均数相等B.各个总体方差相等C.各个总体均数相等D.两样本方差相等E.两个样本来自同一总体【答案】B8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。
卫生统计学自考试题及答案一、单项选择题(每题1分,共10分)1. 下列哪项不是卫生统计学的主要研究内容?A. 疾病的流行规律B. 疾病的预防措施C. 卫生服务的需求与供给D. 统计图表的绘制答案:D2. 以下哪个指标用于衡量一个地区居民的健康状况?A. 发病率B. 死亡率C. 期望寿命D. 患病率答案:C3. 在卫生统计中,以下哪个概念是指一定时间内某病新发生的病例数与暴露人口数之比?A. 死亡率B. 患病率C. 发病率D. 感染率答案:C4. 以下哪个统计量可以用来描述一组数据的离散程度?A. 平均数B. 中位数C. 标准差D. 众数答案:C5. 在卫生统计中,相对危险度(RR)是指:A. 病例组与对照组的发病率之比B. 病例组与对照组的患病率之比C. 病例组与对照组的疾病特异性死亡率之比D. 病例组与对照组的疾病风险之比答案:D6. 以下哪种抽样方法属于非概率抽样?A. 系统抽样B. 分层抽样C. 整群抽样D. 便利抽样答案:D7. 在卫生统计中,以下哪个指标用于衡量疾病对个体健康影响的严重程度?A. 疾病负担B. 疾病频率C. 疾病严重度D. 疾病持续期答案:A8. 下列哪项是卫生统计学中常用的描述性统计分析方法?A. 回归分析B. 卡方检验C. 描述性统计D. 生存分析答案:C9. 在卫生统计中,以下哪个指标用于衡量医疗服务的覆盖面?A. 服务利用率B. 服务满意度C. 服务可及性D. 服务公平性答案:A10. 以下哪个统计图适合展示不同地区或不同时间的连续数据变化趋势?A. 柱状图B. 饼图C. 线图D. 散点图答案:C二、多项选择题(每题2分,共10分)11. 以下哪些因素可以影响疾病的流行?A. 环境因素B. 遗传因素C. 社会经济因素D. 行为因素E. 医疗条件答案:ABCDE12. 在卫生统计学中,以下哪些指标属于描述性统计指标?A. 平均数B. 标准差C. 患病率D. 发病率E. 相关系数答案:ABD13. 下列哪些方法可以用来计算疾病的相对危险度?A. 队列研究B. 病例对照研究C. 交叉设计研究D. 生态学研究E. 实验研究答案:ABD14. 在卫生统计学中,以下哪些因素可能影响样本的代表性?A. 抽样方法B. 样本大小C. 抽样误差D. 非抽样误差E. 抽样比例答案:ABCD15. 以下哪些因素需要在进行卫生统计分析时进行调整?A. 年龄B. 性别C. 种族D. 经济状况E. 教育水平答案:ABCDE三、简答题(每题5分,共20分)16. 简述卫生统计学的定义及其在公共卫生领域的作用。
卫生统计学试题及答案一、选择题(每题1分,共10分)1. 卫生统计学是研究什么的科学?A. 疾病的预防和治疗B. 疾病的流行规律C. 卫生服务的管理和评价D. 卫生数据的收集、处理和分析2. 以下哪个不是卫生统计学中常用的数据类型?A. 计量资料B. 计数资料C. 排名资料D. 等级资料3. 卫生统计学中的描述性统计主要解决什么问题?A. 数据的收集B. 数据的描述C. 数据的推断D. 数据的预测4. 卫生统计学中的参数估计和假设检验的目的是什么?A. 描述数据分布B. 推断总体参数C. 预测未来趋势D. 判断数据的可靠性5. 以下哪个是卫生统计学中常用的分布?A. 正态分布B. 均匀分布C. 泊松分布D. 所有选项都是6. 卫生统计学中的相关分析和回归分析的区别是什么?A. 相关分析可以判断因果关系B. 回归分析可以判断因果关系C. 相关分析是描述性分析D. 回归分析是推断性分析7. 卫生统计学中的样本量计算的目的是?A. 减少数据收集的成本B. 确保研究结果的可靠性C. 提高数据收集的效率D. 减少数据收集的时间8. 在卫生统计学中,生存分析主要研究的是?A. 生存时间的分布B. 生存时间的预测C. 生存时间的比较D. 所有选项都是9. 卫生统计学中的多变量分析通常用于?A. 单因素分析B. 双因素分析C. 多个因素的分析D. 非线性因素的分析10. 卫生统计学中,哪个指标用于衡量疾病在人群中的分布?A. 发病率B. 死亡率C. 患病率D. 流行率答案:1-5 DCBDA 6-10 CDCCA二、简答题(每题5分,共20分)1. 简述卫生统计学在公共卫生领域中的应用。
答:卫生统计学在公共卫生领域中的应用主要包括疾病流行病学的调查研究、健康服务的评估、健康政策的制定与评价、健康数据的收集与分析等。
通过统计方法,可以对人群健康状况进行描述和分析,为预防控制疾病提供科学依据。
2. 解释什么是标准差,并说明其在卫生统计学中的意义。
卫生统计学简答题方差分析的基本思想和应用条件是什么?答:方差分析的基本思想是,对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。
不同之处在于变异分解的项目因设计不同而异。
具体来讲,根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,从而推论各种研究因素对试验结果有无影响。
其应用条件是,①各样本是相互独立的随机样本,均服从正态分布;②各样本的总体方差相等,即方差齐性。
多组定量资料比较时,统计处理的基本流程是什么?答:多组定量资料比较时首先应考虑用方差分析,对其应用条件进行检验,即方差齐性及各样本的正态性检验。
若方差齐性,且各样本均服从正态分布,选单因素方差分析。
若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis秩和检验,或通过某种形式的数据变换使其满足方差分析的条件。
若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如Bonferonni、LSD法等)进行两两比较。
简述秩和检验的优缺点秩和检验的优点是(1)不受总体分布限制,适用面广;(2)适用于等级资料及两端无确定值的资料;(3)易于理解,易于计算。
缺点是符合参数检验的资料,用秩和检验,则不能充分利用信息,检验效能低。
试述假设检验与置信区间的联系与区别。
答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。
置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等。
试述两类错误的意义及其关系。
答:Ⅰ类错误(typeⅠerror):如果检验假设0H实际是正确的,由样本数据计算获得的检验统计量得出拒绝0H的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设0H(弃真)的错误称为Ⅰ类错误。
Ⅱ类错误(type Ⅱ error):假设检验的另一类错误称为Ⅱ类错误(type Ⅱ error),即检验假设0H原本不正确(1H正确),由样本数据计算获得的检验统计量得出不拒绝0H(纳伪)的结论,此时就犯了Ⅱ类错误。
Ⅱ类错误的概率用β表示。
在假设检验时,应兼顾犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)。
犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)成反比。
如果把Ⅰ类错误的概率定得很小,势必增加犯Ⅱ类错误的概率,从而降低检验效能;反之,如果把Ⅱ类错误的概率定得很小,势必增加犯Ⅰ类错误的概率,从而降低了置信度。
为了同时减小α和β,只有通过增加样本含量,减少抽样误差大小来实现。
什么资料适合用秩和检验进行检验?简述秩和检验步骤。
答:提示:进行有序资料的比较时宜采用秩和检验。
(1)等级资料;(2)偏态资料;(3)分布不明的资料;(4)资料中各组方差不齐,且转换后不能达到方差齐性;(5)一端或两端无界。
秩和检验步骤为:①建立假设H0和H1,并确定检验水准α;②根据不同的设计类型对资料进行编秩并计算秩和;③根据计算的秩和直接查表或计算相应的统计量再查表,确定P值下结论。
进行有序资料的比较时宜采用秩和检验。
服从二项分布及Poisson分布的条件分别是什么?答:二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。
Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率π很小。
2. 二项分布、Poisson分布分别在何种条件下近似正态分布?简答:二项分布的正态近似:当n较大,π不接近0也不接近1时,二项分布B(n,π)近似正态分布N(πn, )1(ππ?n)。
Poisson分布的正态近似:Poisson分布)(λΠ,当λ相当大时(≥20),其分布近似于正态分布简述简单线性回归分析的基本步骤。
答:①绘制散点图,考察是否有线性趋势及可疑的异常点;②估计回归系数;③对总体回归系数或回归方程进行假设检验;④列出回归方程,绘制回归直线;⑤统计应用。
简述线性回归分析与线性相关的区别与联系。
答:区别:(1)资料要求上,进行直线回归分析的两变量,若X为可精确测量和严格控制的变量,则对应于每个X的Y值要求服从正态分布;若X、Y都是随机变量,则要求X、Y服从双变量正态分布。
直线相关分析只适用于双变量正态分布资料。
(2)应用上,说明两变量线性依存的数量关系用回归(定量分析),说明两变量的相关关系用相关(定性分析)。
(3)两个系数的意义不同。
r说明具有直线关系的两变量间相互关系的方向与密切程度,b表示X每变化一个单位所导致Y 的平均变化量。
(4)两个系数的取值范围不同:-1≤r≤1,∞<<∞?b。
(5)两个系数的单位不同:r没有单位,b有单位。
联系:(1)对同一双变量资料,回归系数b与相关系数r的正负号一致。
b>0时,r>0,均表示两变量X、Y同向变化;b<0时,r<0,均表示两变量X、Y反向变化。
(2)回归系数b与相关系数r的假设检验等价,即对同一双变量资料,rbtt=。
由于相关系数r的假设检验较回归系数b的假设检验简单,故在实际应用中常以r的假设检验代替b的假设检验。
(3)用回归解释相关:由于决定系数2R=SS回 /SS总,当总平方和固定时,回归平方和的大小决定了相关的密切程度。
回归平方和越接近总平方和,则2R越接近1,说明引入相关的效果越好。
例如当r=0.20,n=100时,可按检验水准0.05拒绝H0,接受H1,认为两变量有相关关系。
但2R=(0.20)2=0.04,表示回归平方和在总平方和中仅占4%,说明两变量间的相关关系实际意义不大直线相关与回归有何联系与区别?联系:(1)对符合相关回归条件的资料,其相关系数与回归系数的正负号相同。
(2)回归系数与相关系数的假设检验是等价的,对同一样本的资料,回归系数的t检验与相关系数的t检验其数值相等,即tr=tb。
(3)可以用回归解释相关。
r的平方称为决定系数(coefficient of determination)。
区别:回归要求因变量Y是正态分布的随机变量;X可以是精确测量或严格控制的变量,也可以是呈正态分布的随机变量,当X是精确测量或严格控制的变量时,此时的回归称Ⅰ型回归。
当X是呈正态分布的随机变量时,此时的回归称为Ⅱ型回归。
相关要求变量X、Y都是呈正态分布的随机变量。
当说明两变量间依存变化的数量关系时用回归,当说明两变量间的相关关系时用相关简述多重线性回归分析中,自变量筛选的标准与原则1、残差平方和(SSE)缩小或决定系数增大2、残差平方(MSE)缩小与调整确定系数(R2a)增大3、Cp统计量准则:较小的Cp值,Cp=p作为最优的准则,如p个自变量的模型是合适的,则标准差与标准误有何区别和联系?标准差和标准误都是变异指标,但它们之间有区别,也有联系。
区别: ①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。
标准误用于估计参数的可信区间,进行假设检验等。
③它们与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。
联系: 标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。
(联系: 1、二者都是表示变异度大小的统计指标 2、标准误与标准差大小成正比,与抽样例数n的平方根成反比)何谓假设检验?其一般步骤是什么?所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后根据样本所提供的信息,借助一定的分布,观察实测样本情况是否属于小概率事件,从而对所提出的假设作出拒绝或不拒绝的结论的过程。
假设检验一般分为以下步骤: ①建立假设:包括: H0,称无效假设;H1: 称备择假设;②确定检验水准:检验水准用α表示,α一般取0.05;③计算检验统计量:根据不同的检验方法,使用特定的公式计算;④确定P值:通过统计量及相应的界值表来确定P值;⑤推断结论:如P>α,则接受H0,差别无统计学意义;如P≤α,则拒绝H0,差别有统计学意义。
常用统计图的适用范围是什么?常用的统计图及适用条件是: ①条图,适用于相互独立的资料,以表示其指标大小;②百分条图及远圆图,适用于构成比资料,反映各组成部分的大小;③普通线图: 适用于连续性资料,反映事物在时间上的发展变化的趋势,或某现象随另一现象变迁的情况。
④半对数线图,适用于连续性资料,反映事物发展速度(相对比)。
⑤直方图: 适用于连续性变量资料,反映连续变量的频数分布。
⑥散点图: 适用于成对数据,反映散点分布的趋势。
简述率的标准化法的基本思想当比较两个总率时,如果两组内部某种重要特征在构成上有差别,则直接比较这两个总率是不合理的;因为这些特征构成上的不同,往往造成总率的升高或下降,从而影响两个总率的对比。
率标准化法的基本思想就是采用统一的内部构成计算标准化率,以消除内部构成不同对指标的影响,使算得的标准化率具有可比性。
例如比较两人群的死亡率、出生率、患病率时,常要考虑人群性别、年龄的构成是否相同;试验组和对照组治愈率的比较时,常要考虑两组病情轻重、年龄、免疫状态等因素的构成是否相同。
如其构成不同,需采用统一的标准进行校正,然后计算校正后的标准化率进行比较,这种方法称为标准化法。
简述χ2检验的的基本思想χ2检验是检验理论频数与实际频数的吻合程度,从基本公式(TTA22)(?∑=χ)可以看出,在检验假设成立的情况下,T(理论频数)与A(实际频数)之差一般不会很大,此时χ2值也较小;反之,χ2值较大。
当χ2值较大,且大于一定的界值时,就拒绝H0,接受H1,认为两样本率有统计学差异。
当χ2值较小,且小于特定的界值时,就不拒绝H0,认为两样本率差异无统计学意义简述当不满足行×列的2χ检验的条件时的处理办法。
当不满足行×列的2χ检验的条件(R×C表中不宜有1/5的格子数小于5,或有一个格子的理论频数小于1时,可采用下述方法处理:(1)增大样本例数,(2)删除理论数较小的行和列,(3)将理论数较小的行或列与性质相近的行或列合并,但在合并时应注意合并的合理性。
(2)和(3)两种处理方法会丢失部分信息。
请简述正态分布的特征1、曲线在横轴上方均数处最高;2、以均数为中心,左右对称;3、正态分布有两个参数:(1)μ: 位置参数,确定曲线位置当σ一定时,μ越大,曲线越向右移动;μ越小,曲线越向左移动。
(2)σ: 离散度参数,决定曲线的形态:当μ一定时,σ越大,表示数据越分散,曲线越“胖”;σ越小,表示数据越集中,曲线越“瘦”。