数值变量的统计描述
- 格式:ppt
- 大小:224.00 KB
- 文档页数:33
第一章数值变量资料的统计描述统计描述(statistical description)即利用原始数据,选择适宜的统计指标及统计图表,简明准确地探察数据的分布类型和数量特征,以便研究者根据样本信息,正确地推论其总体规律的统计分析方法。
统计指标(statistical index)是表示数据分布特征的一个或一组数值,是统计分析的基本依据.第一节频数分布的概念与应用对获取的数据进行统计学分析之前,了解数据的分布特征是至关重要的。
因为很多参数分析方法都要求样本数据来自某种已知分布的总体,否则,就应对数据实施合适的数据转换,或者采用非参数分析方法。
对频数表及频数图进行分析是描述性统计学分析的基本内容,也是表达或探索数据分布特征的基本手段.一、频数分布1.频数分布(frequency distribution)的概念频数(frequency)是相同观察值或观察结果出现的次数;分布(distribution)指随着随机变量取值的变化,其相应的概率变化的规律性。
频数分布即观察值(变量值)按大小分组,各个组段内观察值个数(频数)的分布,它是了解数据分布形态特征与规律的基础.2.频数分布的特征(1)集中趋势(central tendency):指一组变量值的集中倾向或中心位置.(2)离散趋势(tendency of dispersion):指一组变量值的分散倾向。
3.频数分布的类型⑴对称分布:指集中位置居中、左右两侧的频数分布基本对称的频数分布。
又可分为正态分布(normal distribution)和非正态分布(non-normal distribution).⑵偏态分布:是集中位置偏倚、两侧频数的分布不对称的频数分布,可分为两类:①正偏态:亦称右偏态,特点是峰偏左,此时均数与众数之差为正值,长尾向右侧(即观察值较大一端)伸延;②负偏态:亦称左偏态,特点为峰偏右,此时均数与众数之差为负值,长尾向左侧(即观察值较小一端)伸延。
第八章数值变量资料的统计描述A1型题1.描述一组正态或近似正态分布资料的平均水平用( )A.算术均数B.几何均数C.中位数D.平均数E.众数2.血清学滴度资料最常计算( )以表示其平均水平。
A.均数B.中位数C.几何均数D.全距E.标准差3.表示变量值变异情况的指标最常用的是( )A.四分位数间距B.全距C.标准差D.变异系数E.方差4.两组呈正态分布的数值变量资料,但均数相差悬殊,若比较离散趋势,最好选用的指标为( )A.全距B.四分位数间距C.方差D.标准差E.变异系数5.下列哪一项不是标准差的应用范围( )A.说明观察值的离散程度B.计算变异系数C.与均数一起描述正态分布的特征D.与均数一起根据正态分布的规律估计总体均数的可信区问E.计算标准误6.在同一总体中随机抽样,样本含量n越大,则理论上( )越小A.样本标准差B.中位数C.标准误D.第95百分位数E.均数7.算术均数与中位数相比( )A.抽样误差更大B.不易受极端值影响C更充分利用数据信息D.更适用于分布不明的资料E.更适用于偏态分布资料8.单位不相同均数相差较大时,比较连续性资料的离散趋势,最好用( )A.全距B.SC.CVD.四分位间距E.方差9.变异系数的数值( )A.一定大于1B.一定小于1C.可大于1也可小于1D.一定比S小E.一定比S大10.标准正态分布的均数与标准差分别为( )A.0,lB.1,0C.0,0D.1,1E.1.96,2.5811.各观察值均加(或减)同一个数后( )A.均数不变,标准差不一定变B.均数不变,标准差变C.均数不变,标准差也不变D.均数变,标准差不变E.均数变,标准差也变12.( )分布的资料,均数等于中位数A.正态B.左偏态C.右偏态D.倒数偏态E.对数偏态13.对120名男大学生的身高进行了测量,每个测量值减去均数所得的差值再除以标准差,所得数值的分布为( )A.正态分布B.标准正态分布C.正偏态分布D.负偏态分布E.偏态分布14.若一组数据呈正态分布,其中大于χ一2.58s的变量值占( )A.99.5%B.99%C.1%D.0.5%E.5%15.正态分布曲线下(∥±1.96口)区问的面积占总面积的( )A.97.5%B.95%C.5%D.2.5%E.1%16.某项计量指标仅以过高为异常,且资料呈偏态分布,则其95%参考值范围可为( ) A.≤P95B.≥P5C.≤P97.5D.≥P95E.P2.5~P97. 517.某项计量指标仅以过低为异常,且资料呈偏态分布,则其95%参考值范围可为( ) A.≤P95B.P2.5~P97.5C.≤P97.5D.≥P95E.≥P518.X1和X2是两个独立的随机变量,(X1+X2)与(X1一X2)的方差相比,理论上( ) A.更大B.可以大也可以小C.更小D.相等E.没有关系A3型题共同题干(19~21)随机抽取某地2000名正常人血铅测定值。
实验二、数值变量资料的统计描述一、实验内容(项目)1.均数、几何均数、中位数的选择和计算。
2.标准差、方差、变异系数的选择和计算。
二、实验目的和要求能正确选择应用并计算各种指标,能对数值变量资料进行基本的统计描述。
三、主要实验仪器及材料计算机、SPSS软件、数据资料。
四、实验步骤:1.教师演示相应软件操作。
2.学生独立用软件完成统计资料的分析和计算,并提交分析计算结果。
3.教师引导下讨论结果,总结,完成并上交实验报告。
统计资料:1、某医科大学抽查了100名健康女大学生的血清总蛋白含量(g/L),检查结果如下:74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 75.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 74.0 72.0 76.5 74.3 76.5 77.6 67.3 72.0 73.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 75.8 73.5 75.0 72.7 70.4 77.2 68.8 67.3 75.8 73.5 75.0 72.7 73.5 72.7 81.6 73.5 75.0 72.7 70.4 76.5 72.7 77.2 84.3 75.0 71.2 71.2 69.7 73.5 70.4 75.0 72.7 67.3 70.3 76.5 73.5 78.0 68.0 73.5 68.0 73.5 68.0 74.3 72.7 73.7 试分析:(1) 输入资料建立文件。
(2) 对变量血清总蛋白含量频数分布分析:样本量、均数、中位数、最小值、最大值、方差、标准差、极差、总和、峰度系数、偏度系数及其标准误;绘制住院时间的频数分布表及直方图,观察其分布特征。