第二章 定量资料的统计描述
- 格式:doc
- 大小:65.50 KB
- 文档页数:4
卫生统计学习题第二章定量资料的统计描述1. 1985年某省农村30例6-7岁正常男童胸围(cm)测量结果如下:51.6 54.1 54.0 56.9 57.7 55.558.3 55.4 53.8 57.7 51.3 53.8 57.3 54.8 52.1 55.3 54.8 54.7 53.4 57.1 53.1 55.9 51.4 54.6 56.1 61.859.3 56.8 59.8 53.9(1)试编制以上数据的频数表,绘制直方图,概括其分布特征。
(2)用合适的统计量描述其集中趋势和离散趋势。
(3)对样本进行正态性检验第三章定性资料的统计描述1.某地通过卫生服务的基线调查得到如下资料,试作如下分析:(1)计算全人口的性别比;(2)计算育龄妇女(15~49岁)占总人口的百分比;(3)计算总负担系数;(4)计算老年人口系数某地人口构成情况年龄组(岁)男(%)女(%)年龄组(岁)男(%)女(%)0~ 4.2 4.0 45~ 2.4 2.75~ 3.2 3.1 50~ 2.1 2.410~ 4.4 4.2 55~ 1.2 2.215~ 5.5 5.3 60~ 1.3 2.420~ 5.1 5.2 65~ 1.1 1.425~ 6.0 6.1 70~ 0.8 1.230~ 4.3 4.5 75~ 0.5 0.935~ 3.2 3.3 80~ 0.2 0.540~ 2.3 2.5 85~ 0.1 0.2第四章常用概率分布1.假定虚症患者中,气虚型占30%。
现随机抽查30名虚症患者,求其中没有1名气虚型的概率、有4名气虚型的概率。
2.某溶液平均1毫升中含有大肠杆菌3个。
摇均后,随机抽取1毫升该溶液,内含大肠杆菌2个和低于2个的概率各是多少?3.某人群中12岁男童身高的分布近似正态分布,均数为144.00cm,标准差为5.77cm,试估计(1)该人群中12岁男童身高集中在哪个范围?(2)求人群中12岁男童身高的95%和99%参考值范围;(3)求人群中12岁男童身高低于140cm的概率;(4)求人群中12岁男童身高超过160cm的概率;第五章参数估计基础1.某研究表明新研制的一种安眠药比旧安眠药增加睡眠时间。
医学统计学简答题第二章定量数据的统计描述1.变异系数与标准差的区别标准差使用的度量衡单位与原始数据相同,在两组数据均数相差不大,单位也相同时,从标准差的大小就可以直接比较两样本的变异程度。
但是有时我们需要对均数相差较大或单位不同的几组观测值的变异程度进行比较,标准差不再适宜,这时就应该使用变异系数了。
2.集中趋势和离散趋势的指标及适用范围(1)集中趋势:算术均数、几何均数、中位数,统称平均数,均反映集中趋势。
算术均数:主要适用于对称分布,尤其适合正态分布资料。
几何均数:应用于对数正态分布,也可应用于呈倍数关系的等比资料。
在医院中主要用于抗原(体)滴度资料。
中位数:适合条件:a.极偏态资料。
b.有不确定的数据(有>或<)。
c.有特大值或特小值。
d.分布不明的资料。
(2)离散趋势:极差、四分位数间距、方差和标准差、变异系数均反映离散趋势极差:除了两端有不确定数据之外,均可计算极差。
四分位间距:用于描述偏态分布资料。
方差和标准差:用于描述正态分布计量资料的离散程度。
变异系数:a.均数相差较大。
b.单位不同。
3.简述变异系数的实用时机变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。
4.怎样正确描述一组计量资料(1)根据分布类型选择指标(2)正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料选用中位数与四分位数间距。
5.标准差与标准误的联系和区别有哪些?区别:(1)概念不同:标准差是描述观察值(个体值)之间的变异程度,S越小,均数的代表性越好;标准误是描述样本均数的抽样误差,标准误越小,均数的可靠性越高。
(2)用途不同:标准差与均数结合估计参考值范围。
(3)计算含量的关系不同:当样本含量n足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0。
联系:标准差、标准误均为变异指标,当样本含量不变是,标准误与标准差成正比。
6.正态分布的主要特征(1)正态曲线在横轴上方均数处最高,即频数最大(2)正态分布以均数为中心,左右对称,无限接近于x轴(3)曲线与横轴所围面积为1。
公卫助理医师-综合笔试-卫生统计学-第二单元定量资料的统计描述[单选题]1.一组观察值如果每个值都同时增加或减少一个不为0的常数,则A.均数改变,几何均数不变B.均数改变,中位(江南博哥)数不变C.均数,几何均数和中位数都改变D.均数不变,几何均数和中位数改变E.均数,几何均数和中位数都不变正确答案:C参考解析:一组观察值如果每个值都同时增加或减少一个不为0的常数,则均数、几何均数、中位数都改变。
本题选C。
掌握“集中趋势指标★”知识点。
[单选题]3.表示儿童体重资料的平均水平最常用的指标是A.算术平均数B.中位数C.几何均数D.变异系数E.百分位数正确答案:A参考解析:算术平均数简称均数,均数适用于描述单峰对称分布资料,特别是正态分布或近似正态分布资料的集中位置。
掌握“集中趋势指标★”知识点。
[单选题]4.变异系数越大,说明A.标准差越大B.平均数越小C.平均数越大D.标准差和均数都大E.单位均数的变异越大正确答案:E参考解析:变异系数大,说明单位均数的变异越大。
变异系数的定义是标准差与算术均数之比,描述了数值的相对离散程度,本题正确答案为E。
掌握“离散趋势指标★”知识点。
[单选题]5.某人算得某资料的标准差为-3.4,可认为A.变量值都是负数B.变量值负的比正的多C.计算有错D.变量值多数为0E.变量值一个比一个小正确答案:C参考解析:标准差一定大于或等于0,不可能为负数,故答案为C。
掌握“离散趋势指标★”知识点。
[单选题]6.下列关于方差和标准差的叙述,不正确的是A.方差的单位与标准差的单位相同B.方差的单位是标准差单位的平方C.都用于描述定量资料频数分布的变异程度D.二者值越大,说明资料的变异程度越大E.均适用于对称分布,特别是正态分布或近似正态分布资料正确答案:A参考解析:方差的单位是观察值单位的平方,在实际工作中使用不便,因此将方差开算术平方根得到标准差,故选项A不正确,选项B正确;方差和标准差均是描述对称分布,特别是正态分布或近似正态分布资料变异程度的常用指标,值越大,说明资料的变异程度越大,选项C、D、E正确,故本题应选A。
【精品】定量资料的统计描述定量资料的统计描述是指通过定量数据分布的一系列统计量来描述一个样本或总体的特征。
常用的统计量包括中心位置、离散程度、分布形态和相关性等。
中心位置中心位置是指数据分布的平均水平。
常用的中心位置统计量包括平均数、中位数和众数。
平均数是所有数据值的总和除以数据个数。
它具有良好的代表性,但受极端值的影响较大,因此需要谨慎使用。
中位数是将数据按大小排序后位于中间的数值,当数据存在极端值时,中位数比平均数更能正确反映数据的中心位置。
众数是数据中出现次数最多的数值,适用于分布具有明显峰值的情况。
离散程度离散程度是指数据分布的距离平均值的大小。
常用的离散程度统计量包括标准差、方差、极差和四分位数差等。
标准差是数据离均值的平均距离,是最常用的衡量数据分散程度的统计量。
方差是标准差的平方,由于平方的量级较大,因此比标准差不易解释。
极差是数据最大值与最小值之差,不考虑数据内部的分布情况,因此不具有代表性。
四分位数差是在数据中将数值分为四个部分,即25%、50%、75%三个分位点,然后用75%分位点减去25%分位点,用于描述数据离散程度。
分布形态分布形态是指数据分布的偏态和峰态。
常用的分布形态统计量包括偏度和峰度。
偏度是反映数据分布偏斜程度的统计量,正偏分布表示分布的长尾在分布的右侧,负偏分布表示分布的长尾在分布的左侧。
当偏度为0时,表示分布是对称的。
峰度是反映数据分布峰态的统计量,正峰分布表示分布的峰在分布的中心较高,负峰分布表示分布的峰在分布的中心较低。
当峰度为0时,表示分布的峰态基本接近正态分布。
相关性相关性是指两个变量之间的关联程度。
常用的相关性统计量包括相关系数和协方差。
相关系数是反映两个变量之间线性相关程度的统计量,取值范围为-1~1之间,正值表示正相关,负值表示负相关,0表示不相关。
协方差是反映两个变量之间相关性的统计量,数值大小表示两个变量之间的相关程度,但由于单位的影响,不易比较。
第二章定量资料的统计描述
一、选择题
1.资料的统计分析包括统计描述和统计推断两部分内容,而统计描述是指A.由样本统计量推断总体参数
B.对总体参数进行估计
C.用统计指标、统计图表描述资料的特征
D.对搜集到的资料进行整理
E.比较指标间的差异有无统计学意义
2.定量资料频数分布的两个重要特征是
A.样本与总体B.统计量与参数
C.样本均数与总体均数D.集中趋势与离散程度
E.标准差与标准误
3.常用的平均数指标是
A.样本均数、总体均数、中位数B.均数、几何均数、中位数
C.均数、几何均数、标准差D.均数、几何均数、变异系数
E.均数、中位数、方差
4.描述一组正态分布或近似正态分布资料的平均水平宜采用
A.平均数B.几何均数C.中位数D.变异系数E.均数
5.反映一组血清抗体滴度资料的平均水平,常选用的指标是
A.平均数B.几何均数C.中位数D.变异系数E.均数
6.描述传染病的平均潜伏期宜采用
A.平均数B.几何均数C.中位数D.变异系数E.均数
7.某病患者8人的潜伏期(天)如下:2、3、3、3、4、5、6、30+,则平均潜伏期为
A.7天B.3天C.4天D.3.5天E.大于7天
8.一组数据中各观察值均加(或减)某一个不等于0的常数后
A.均数不变,标准差改变B.均数改变,标准差不变
C.二者均改变D.二者均不改变
E.变异系数不变
9.以下资料类型中,适宜用均数与标准差进行统计描述的是
A.任意分布B.正偏态分布C.负偏态分布D.正态分布E.对称分布10.某研究者测量了某地237人晨尿中的氟含量(/
mg L),结果如下
尿氟0.2~0.6~ 1.0~ 1.4~ 1.8~ 2.2~ 2.6~ 3.0~ 3.4~ 3.8~
人数75 67 30 20 16 19 6 2 1 1
对该资料的集中趋势和离散趋势进行描述宜采用
A.均数与标准差
B.中位数与四分位数间距
C.众数与标准差
D.均数与变异系数
E.中位数与变异系数
11.比较身高和体重两组数据的变异度大小宜采用
A.标准差B.全距C.方差D.变异系数E.四分位数间距
12.比较某地1~2岁与5~5.5岁儿童身高的变异度大小宜采用
A.全距B.四分位数间距C.标准差D.方差E.变异系数
二、计算分析题
1.为了解某地区健康成年女性的血清总蛋白含量水平,某研究者于2013年在该
地区随机抽取了110名健康成年女子,测得其血清总蛋白含量(/
g L),结果见表
2-1。
表2-1 110名健康成年女子的血清总蛋白含量(/
g L)
72.3 76.9 72.2 77.9 70.2 73.2 77.3 73.2 73.4 72.1 71.6 74.6 75.7 73.7 70.7 79.2 75.5 66.4 80.5 79.2 75.5 74.0 70.1 70.8 82.6 73.9 72.7 71.6 71.3 70.8 72.5 76.7 74.7 70.6 66.4 72.0 73.3 68.2 72.0 75.9
65.5 67.9 77.9 75.2 75.2 74.9 75.6 73.6 75.6 78.1 74.8 78.8 74.2 77.7 78.1 70.4 87.0 81.3 76.7 73.8 74.0 72.4 76.4 71.7 74.2 75.8 62.2 68.0 71.1 69.7 73.9 70.0 75.6 76.5 73.1 70.8 77.9 75.6 73.9 70.7 72.2 72.1 74.3 72.6 74.9 77.2 67.4 77.3 70.7 68.9 76.7 77.0 73.5 73.4 68.3 70.6 75.1 78.5 70.8 70.4 70.7 80.8
77.0
65.5
74.0
64.5
73.4
77.4
73.7
67.2
(1)绘制频数分布表及直方图,并简述其分布特征。
(2)计算适当的集中趋势和离散趋势指标。
2.欲评价某市2012年空气质量情况,该市环监站搜集了376个监测点大气中2SO 的日平均浓度(3/g m μ),结果见表2-2。
表2-2 某市376个监测点2SO 的日平均浓度(3/g m μ)
浓度
频数
25~ 32 50~ 62 75~ 56 100~ 54 125~ 50 150~ 47 175~ 43 200~ 8 225~ 7 250~ 5 275~ 4 300~ 2 325~350
6
(1)简述其分布特征。
(2)计算适当的集中趋势和离散趋势指标。
3.某地46例微丝蚴血症患者治疗后5年用间接荧光抗体试验检测其抗体滴度,结果见表2-3,请计算其平均抗体滴度。
表2-3 46例微丝蚴血症患者治疗后抗体滴度
抗体滴度1:10 1:20 1:0 1:80 1:160 1:320
例数 6 11 12 8 5 4
(刘军祥)。