卫生统计学第7版-方积乾主编-课件第二章-定量资料的统计描述学习资料
- 格式:ppt
- 大小:787.50 KB
- 文档页数:69
【教学内容】一、频数分布表与频数分布图(Frequency / Frequency distribution)二、描述平均水平统计指标(Description of central tendency)算术均数:对称分布几何均数:测定值按等比级数变化中位数:不规则分布练习1data ex1_1;input x@@;cards;112 120 130 118 123 135 125 117;proc means;/*调用means过程*/var x;/*指定作统计计算的变量*/run;~Ps:对N个数、均数、标准偏差、最小值、最大值练习2例10:抽样调查某地120名18岁~35岁健康男性居民血清铁含量(umol/L),数据如下。
表四,试计算均数、标准差、标准误、最小值、最大值、极差和变异系数。
表四 120名18岁~35岁健康男性居民血清铁含量频数分布--------------------------------------------------------------------- 含量( umol/L )组中值频数6~ 7 18 ~ 9 310 ~ 11 612 ~ 13 814 ~ 15 1216 ~ 17 2018 ~ 19 2720 ~ 21 1822 ~ 23 1224 ~ 25 826 ~ 27 428~30 29 1--------------------------------------------------------------------data a10; input x f;cards;7 19 311 613 815 1217 2019 2721 1823 1225 827 429 1;proc means n nmiss mean std stderr min max range cv;means后面的变量为SAS专用的统计量,是属于过程的可选项var x;freq f;/*指定频数变量*/run;期望下列之一: ;alpha, chartype, CLASSDATA, CLM, COMPLETETYPES, CSS, CV, DATA, DESCEND, DESCENDING,DESCENDTYPES, EXCLNPWGT, EXCLNPWGTS, EXCLUSIVE, FW, IDMIN, KURTOSIS, LCLM, MAX, MAXDEC, MEAN, MEDIAN, MIN, MISSING,N, NDEC, NMISS, NONOBS, NOPRINT, NOTRAP, NWAY, ORDER, P1, P10, P25, P5, P50, P75, P90, P95, P99, PCTLDEF, PRINT,PRINTALL, PRINTALLTYPES, PRINTIDS, PRINTIDVARS, PROBT, Q1, Q3, QMARKERS, QMETHOD, QNTLDEF, QRANGE, RANGE, SKEWNESS, STDDEV, STDERR, SUM, SUMSIZE, SUMWGT, T, UCLM, USS, VAR, VARDEF.ERROR 202-322: 该选项或参数不可识别,将被忽略。
第2章 定量资料的统计描述案例2-1(P27)答:该资料为一正常人群发汞值的检测结果,已整理成频率分布表(P27)。
统计描述时应首先考察资料的分布规律,通过频率(频数)分布表(表2-9 P27)和直方图(图2-3 P14)可以看出,此238人发汞值的频数分布呈正偏态分布,即观察值绝大多数集中在发汞值较小的组段。
对偏态分布,选用算术均数和标准差进行统计描述是不恰当的。
应选用中位数描述该市居民发汞平均水平,选用四分位间距描述居民发汞值变异度,计算如下:25507523.5(23825%20) 4.7(mol/kg)6625.5(23850%86) 6.6(mol/kg)6027.5(23875%146)8.9(mol/kg)48(%)x x L x iP L n x f f P u P u P u =+?==+?==+?==+?S离散程度指标:四分位间距=P75-P25=8.9-4.7=4.2umol/kg。
故该市居民发汞平均水平为6.6 umol/kg,离散度为4.2umol/kg,思考与练习(P31)1.答:(1)某年某地120例6-7岁正常男童胸围测量结果(cm)的频数分布Group Frequency Percent Cumulative Percent49.0- 1 .8 .850.0- 4 3.3 4.251.0- 8 6.7 10.852.0- 6 5.0 15.853.0- 19 15.8 31.754.0- 18 15.0 46.755.0- 14 11.7 58.356.0- 26 21.7 80.057.0- 10 8.3 88.358.0- 9 7.5 95.859.0- 4 3.3 99.261.0-62.0 1 .8 100.0Total 120 100.0(2)(3) 利用频数分布表数据计算均数和标准差0149.5161.56623.01112055.19(cm)fX X f∑=∑⋯⨯++⨯==⋯++=(4)………..S 2.33(cm)=255075153.0(12025%19)53.58(cm)19155.0(12050%56)55.29(cm)14156.0(12075%70)56.77((cm)26%)x x L x i P L n f f P x P P ==+?==+?==+?=+?S2.答:该资料最大值为一不确定值,根据此特点,宜用中位数和四分位间距进行统计描述.M=16.5(天) P25=15(天) P75=20(天) Q=20-15=5(天)3.答:根据资料中血凝抑制抗体滴度指标呈等比数列变化的特点,计算其平均滴度应选用几何均数,由于是频数表资料,故用加权法计算几何均数。