习题-计量资料统计描述
- 格式:doc
- 大小:25.50 KB
- 文档页数:3
医用统计学-计量资料的统计描述练习题一、名词解释1.中位数2.四分位数间距3.标准差4.变异系数5.正态分布二、是非题1.不论数据呈什么分布,都可以用算术均数和中位数表示其平均水平。
()2.少数几个数据比大多数数据大几百倍,一般不宜用算术均数表示其平均水平。
()3.只要单位相同,用s和用CV来表示两组资料的离散程度,结论是完全一样的。
()4.四分位数间距也是描述连续分布数据离散度的指标。
()5.理论上,对于正态分布资料,总体百分位数的P5~P95和μ±1.96σ范围内都包含95%的变量值。
()三、最佳选择题1、描述一组偏态分布资料的变异度,以()指标较好。
A.全距B.标准差C.变异系数D.四分位间距E.方差2、用均数和标准差可以全面描述()资料的特征。
A.正偏态分布B.负偏态分布C.正态分布D.对称分布E.对数正态分布3、各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变E.以上都不对4、比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.方差C.极差D.标准差E.四分位间距5、偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位间距E.方差6、各观察值同乘以一个不等于0的常数后,()不变。
A.算术均数B.标准差C.几何均数D.中位数E.变异系数7、()分布的资料,均数等于中位数。
A.对数正态B.正偏态C.负偏态D.偏态E.正态8、对数正态分布是一种()分布。
(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)A.正态B.近似正态C.左偏态D.右偏态E.对称9、最小组段无下限或最大组段无上限的频数分布资料,可用()描述集中趋势。
A.均数B.标准差C.中位数D.四分位间距E.几何均数10、血清学滴度资料最常用来表示其平均水平的指标是()。
A.算术均数B.中位数C.几何均数D.变异系数E.标准差11、中位数是表示变量值_______的指标。
《医学统计学习题》计量资料一、名词解释题:(20分)1、总体:根据研究目的确定的同质的观察单位其变量值的集合。
2、计量资料:又称为定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。
3、抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。
4、总体均数的可信区间:按一定的概率大小估计总体均数所在的范围(CI)。
常用的可信度为95%和99%,故常用95%和99%的可信区间。
二、选择题:(20分)1、某地5人接种某疫苗后抗体滴度为:1:20、1:40、1:80、1:160、1:320。
为求平均滴度,最好选用:A、中位数B、几何均数C、算术平均数D、平均数2、为了直观地比较化疗后相同时间点上一组乳癌患者血清肌酐和血液尿素氮两项指标观察值的变异程度的大小,可选用的变异指标是:A、标准差B、标准误C、相关系数D、变异系数3、某疗养院测得1096名飞行员红细胞数(万/mm2),经检验该资料服从正态分布,其均数值为414.1,标准差为42.8,求得的区间(414.1-1.96×42.8,414.1+1.96×42.8),称为红细胞数的:A、99%正常值范围B、95%正常值范围C、99%可信区间D、95%可信区间4、某医院一年内收治202例腰椎间盘后突病人,其年龄的频数分布如下:年龄(岁)10~20~30~40~50~60~人数 6 40 50 85 20 1为了形象表达该资料,适合选用:A、线图B、条图C、直方图D、圆图8、标准正态分布曲线下,0到1.96的面积为:A、90%B、95%C、47.5%D、50%9、均数与标准差的关系是:A、均数大于标准差B、均数越大,标准差越大C、标准差越大,均数的代表性越大D、标准差越小,均数的代表性越大10、某临床医生测得900例正常成年男子高密度脂蛋白(g/L)的数据,用统计公式求出了该指标的95%的正常值范围,问这900人中约有多少人的高密度脂蛋白(g/L )的测定值在所求范围之内?A、855B、755C、781D、8911、某地5人接种某疫苗后抗体滴度为:1:20、1:40、1:80、1:160、1:320。
计量资料的统计描述方法怎样表达一组数据?描述计量资料的常用指标—A 、描述平均水平(中心位置):均数X 、中位数和百分位数、几何均数G 、众数(mode ) B 、描述数据的分散程度:标准差、四分位数间距、 变异系数、方差、全距(一)均数mean 和标准差standard deviation1. (算术)均数X均数是描述一组计量资料平均水平或集中趋势的指标。
*直接计算公式:12nX X X X X nn+++==∑应用条件:适用于对称分布,特别是正态分布资料。
2. 中位数(median )M 和百分位数(percentile )A.中位数M是将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。
应用条件:用于任何分布类型,包括偏态资料、两端数据无界限的资料。
计算:n 为奇数时--1()2n M X+=n 为偶数时--()(1)2212n n M X X +⎛⎫=+ ⎪⎝⎭9人数据:12,13,14, 14, 15, 15, 15, 17, 19天B.百分位数是将N 个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X 百分位数。
中位数是第百分50位数。
四分位数间距(quartile range )= 第25百分位数(P25)~第75百分位数(P75)。
四分位数间距用于描述偏态资料的分散程度(代替标准差S ),包含了全部观察值的一半。
)(天155219===+X X M 8845122221415214.5()M X X X X ⎛⎫==== ⎪⎝⎭+如果只调查了前八位中学生,则:+(+)(+)天百分位数计算(频数表法):(%)XX XL Xi P L nX f f =+-∑X L :第X 百分位数所在组段下限 L Σf :小于X L 各组段的累计频数 X i :第X 百分位数所在组段组距n :总例数 f x :所在组段频数注:有的教材X= r ;L f ∑=C例:求频数表的第25、第75百分位数(四分位数间距)组段 频数f 累积频数∑f 56~ 2 2 59~ 5 762~ 12 19 ∑f 25 L 25 65~15 34 P 25在此68~ 25 5971~ 26 85 ∑f 75 L 75 74~19 104 P 75在此77~ 15 119 80~ 10 129 83~851 130合 计130① 确定Px 所在组段:P 25所在的组段:n X %=130×25%=32.5,65~组最终的累积频数=34,32.5落在65~组段内;P 75所在的组段:n X %=130×75%=97.5, 此值落在74~组段 ② 确定Px 所在组段的X L 、X i 、f x 、L Σf ③ P 25=65+3x[(130x25%-19)/15]=65.90P 75=74+3x[(130x75%-85)/19]=74.66四分位数间距=65.90~74.66 (次/分)3.几何均数G (geometric mean )应用:适用于成等比数列的资料,特别是服从对数正态分布资料。
实习二计量资料的统计描述名词解释1. 均数答:均数是能反映全部观察值的平均水平的统计指标,适用于对称分布尤其是正态分布资料。
2. 标准差答:标准差是用于描述资料离散趋势的统计指标,适用于对称分布资料,尤其正态分布资料的。
标准差大,表明资料的变异度大,组内数据参差不齐的程度较明显。
填空题1 计量资料的分布特征有____和____。
答:集中趋势和离散趋势。
2 描述计量资料集中趋势的常用指标有____ 、____和____答:均数、几何均数和中位数。
3 描述计量资料离散趋势的常用指标有____ 、_______和____答:极差、方差与标准差和变异系数是非题1. 频数表中组数越多越好。
(⨯)解释:频数表中组数不宜过多也不宜过少。
2. 对称分布资料理论上均数和中位数一致(∨)解释:对于对称分布的资料,两者的计算结果在理论上是相同的。
但在实际计算中往往也会存在一定偏差。
选择题1 有5人的血清滴度为:1:20,1:40,1:80,1:160,1:320则平均滴度是A.1:40B.1:80C.1:160D.1:320答:应选B。
描述平均滴度宜用几何均数。
2.一组变量值,其大小分别为10,12,9,7,11,其中位数是A.9B.7C.10D.11答:应选C。
先将观察值由小到大顺序排列,7,9,10,11,12。
n为奇数时,M=X3=103.一组变量值,其大小分别为10,12,9,7,11,39,其中位数是A.9B.7C.10.5D.11答:应选C。
先将观察值由小到大顺序排列,7,9,10,11,12,39。
n为偶数时,M=( X3 +X4)/2 =(10+11)/2=10.5114. 某组资料共5例, ∑X2=190, ∑X=30, 则均数和标准差分别是A.6 和1.29B.6.33和2.5C.3和6.78D.6和1.58答:应选D,计算步骤是先用∑X除以5求得均数,数值为6。
再代入直接法求标准差公式,求得标准差为1.58。
第二章 计量资料的统计描述一、教学大纲要求(一)掌握内容1. 频数分布表与频数分布图 (1)频数表的编制。
(2)频数分布的类型。
(3)频数分布表的用途。
2. 描述数据分布集中趋势的指标掌握其意义、用途及计算方法。
算术均数、几何均数、中位数。
3. 描述数据分布离散程度的指标掌握其意义、用途及计算方法。
极差、四分位数间距、方差、标准差、变异系数。
(二)熟悉内容连续型变量的频数分布图:等距分组、不等距分组。
二、 教学内容精要计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。
常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。
(一)频数分布表的编制频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数。
如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。
对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。
制作连续型数据频数表一般步骤如下:1.求数据的极差(range )。
min max X X R -= (2-1) 2.根据极差选定适当“组段”数(通常8—10个)。
确定组段和组距。
每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ<U 。
3.写出组段,逐一划记。
频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。
(二)描述频数分布中心位置的平均指标描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。
1.算术均数(对称分布)算术均数(arithmetic mean )简称均数,描述一组数据在数量上的平均水平。
第二节 计量资料的统计描述数值变量的统计描述主要是分成两步:一是正态分布性检验,二是统计描述指标的计算。
根据资料是否正态,选择的指标不一样,如资料呈正态性分布则选用算术均数和标准差,如资料呈非正态分布则用中位数和四分位间距进行描述。
统计指标计算的具体命令有三个:Frequencies:可以产生详细的频数表,还可以按要求给出某百分位点的数值;Descriptive:适用于正态分布资料;Explore:功能最强大,直接给出四分位间距和可信区间。
一、原始资料的统计描述例16.2 某地某年测量了100名正常成年男子血清总胆固醇(mol/L)含量,数据见表16.4,请进行统计描述。
表16.4 某地某年100名成年男子血清总胆固醇(mol/L)含量3.374.795.10 4.77 5.32 4.50 5.10 4.70 4.44 5.164.37 6.255.55 4.56 3.35 4.08 4.63 3.61 4.97 4.175.77 5.09 4.38 5.18 4.79 5.15 4.79 5.30 4.77 4.404.895.86 3.40 3.38 4.55 5.15 4.24 4.32 5.85 3.245.85 3.04 3.896.16 4.58 5.72 4.87 5.17 4.61 4.124.43 4.31 6.14 4.88 2.70 4.60 6.55 4.76 4.48 6.515.18 3.91 5.39 4.52 4.47 3.64 4.09 5.966.14 4.696.36 4.60 5.09 4.47 3.56 4.23 4.34 5.18 5.69 4.25 6.30 3.95 4.03 5.38 5.217.22 4.31 4.71 5.21 3.97 5.12 4.55 4.90 3.05 5.20 4.74 5.54 3.93 3.50 6.381.建立数据文件 取变量CHO,定义为数值型,宽度为8,2位小数。
第一单元计量资料的统计描述【习题】分析计算题某医院神经科用火焰原子吸收光谱法测定了102名男性脑卒中患者头发中微量元素锌(Zn)的含量(μg/g),资料如下:408710511312112713314215216821554881051131211271341431531732206192106113122127135143153176749410711412412813614315517777941071161241281371451561808095109117124128138147156182819610911912513013814716318382971111191251301381491631868310211212012613114015116618885105112120126132141151168195(1) 编制频数表并绘制直方图,简述频数分布类型和频数分布特征。
(2) 计算适当的集中趋势指标和离散程度指标。
某医院神经科用火焰原子吸收光谱法测定了102名男性脑卒中患者头发中微量元素铜(Cu)的含量(μg/g),资料如表1,求男性脑卒中患者头发中微量元素铜的平均含量。
表1 102名男性脑卒中患者头发中微量元素铜(Cu)的含量/(μg·g-1)频数表头发中铜的对数值频数f0~ 10~ 20~ 40~ 30~180~360~220~ 60~ 30~ 30~ 0 4合计102某年某地一次伤寒暴发潜伏期的分布情况如表2,计算该年伤寒暴发的平均潜伏期。
表2 某年某地一次伤寒暴发潜伏期频数表潜伏期/d发病人数f3~35~247~209~1711~1413~715~617~219~121~232合计96测得566名成年男子的心率及血压情况如表3,试比较这些指标的离散程度。
表3 566名成年男子的心率及血压指标X S心率/(次·min-1)收缩压/kPa舒张压/kPa脉压差/kPa根据1999年某大学的体检资料,得该校312名一年级女大学生的平均 身高X =㎝,标准差S =㎝,请据此资料:(1) 计算其95%频数范围。
计量资料统计描述----习题
1、中位数是表示变量值()的指标。
A.平均水平
B.变化范围
C.频数分布
D.相互间差别大小
E.变异程度
2、血清学滴度资料最常计算()来表示平均水平。
A.算术均数
B.中位数
C.几何均数
D.全距
E.百分位数
3、最小组段无下限或最大组段无上限的频数分布资料宜用()
A.算术均数
B.中位数
C.几何均数
D.全距
E.标准差
4、原始数据同减去一个不等于零的常数后,()。
A. x 不变,S 变
B. x 变,S 不变
C. x 和S 都不变
D. x 和S 都变
E.以上均不对
5、变异系数CV()。
A.表示X 的绝对离散度
B.表示X 的相对离散度
C.表示x的绝对离散度
D.表示x的相对离散度
E.以上均不对
6、描述一组偏态分布资料的变异度,以()指标较好。
A.全距
B.标准差
C.变异系数
D.四分位数间距
E.均数
7、用均数和标准差可以全面描述()资料的特征。
A.正偏态分布
B.负偏态分布
C.正态分布和近似正态分布
D.分布不知
E.对数正态分布
8、比较身高和体重两组数据变异度大小宜采用()
A.变异系数
B.标准差
C.四分位数间距
D.全距
E.方差
9、偏态分布宜用()描述其分布的集中趋势
A.算术均数
B.标准差
C.中位数
D.众数
E.百分位数
10、各观察值同乘以一个不等于0 的常数后,()不变。
A.算术均数
B.标准差
C.中位数
D.四分位数间距
E.变异系数
11、()分布的资料,均数等于中位数。
A.对称
B.左偏态
C.右偏态
D.偏态
E.以上均不对
12、随机抽查某地成年女子身高,算得均数x =160cm,标准差S=5cm,则可计算变异系数CV=-------
5 160 C.(160/5)cm D.(5/160)cm ×160
13、变异系数CV 的数值()。
A.一定大于1
B.一定小于1
C.可大于1,也可小于1
D.一定比标准差小
E.不能判定
14、列数8、-3、5、0、4、-1 的中位数是()。
、关于标准差,哪项是错误的()。
A.反映全部观察值的离散程度
B.度量了一组数据偏离平均数的大小
C.反映了均数代表性的好坏
D.不会小于算术均数
E.适用于对称分布资料
16、5 人的血清滴度为<1:20、1:40、1:80、1:160、1:320 描述平均滴度,用哪种指标较好()。
A.平均数
B.几何均数
C.算术均数
D.中位数
E.众数
17、列数40、48、50、52、60 的中位数为()。
B. 50
C. 52
18、某病患者8 人的潜伏期如下:2、3、3、3、4、5、6、30 则平均潜伏期()。
A.均数为7 天,很好的代表了大多数的潜伏期
B.中位数为3 天
C..中位数为4 天
D.中位数为天,不受个别人潜伏期长的影响
E.几何均数为天不受个别人潜伏期长的影响
19、某地调查20 岁男大学生100 名,身高标准差为,体重标准差为,比较两者的变异程度,结果()。
A.体重变异度大
B.身高变异度较大
C.两者变异度相同
D.由于单位不同,两者标准差不能直接比较
E.以上答案均不对
20 算术均数与中位数相比,( )
A.抽样误差更大
B.不易受极端值的影响
C.更充分利用数据信息
D.更适用于分布有明显偏态分布资料
E.更适用于有不确定数值的资料
21、正态曲线下、横轴上,从均数到+∞的面积为()。
% % C. E.不能确定(与标准差的大小有关)
22、标准正态分布的均数与标准差分别为()。
与1 与0 与0 与1E.以上答案都不对
23、正态分布有两个参数μ与σ,()相应的正态曲线的形状越扁平。
A. μ越大
B. μ越小
C. σ越大
D. σ越小
E.以上四个都不对
24、正态曲线下、横轴上,从x到均数的面积为()。
% % C. % (50%-5%/2)
25、标准正态分布曲线下,横轴上从-1至的面积为% ()
A >%
B %
C %
D % %+
26、对于正态分布总体,理论上μ+σ与百分数(B)相等
A B C D 、确定正常值时应考虑():
%的范围%的范围%的范围
%的范围 E.在照顾到误诊率和漏诊率后的范围
28、确定正常人的某项指标的正常范围时,调查对象是()
A.从未患过病的人B、排除影响被研究指标的疾病和因素的人
C.只患过小病,但不影响被研究指标的人
D、排除了患过某病或接触过某因素的人
E.以上答案都不对
29、正常值范围应():
A.取双测界限 B取单测界限 C.同时计算单、双测界限
D.根据实际情况取单侧或双测界限
E.根据研究目的取
30、要评价某市一名5 岁男孩的身高是否偏高或偏矮,其统计方法是()
A.用该市5 岁男孩身高的95%或99%正常值范围来评价
B.作身高差别的显著性检验来评价C、用身高均数的95%或99%可信区间来评价
D.不能作评价
E.以上答案均不对。