数值变量的统计描述[1]
- 格式:pptx
- 大小:4.05 MB
- 文档页数:25
数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 BA算术均数 B几何均数 C中位数 D全距 E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 CA XB GC MD SE CV13.各观察值均加(或减)同一数后:BA均数不变,标准差改变 B均数改变,标准差不变C两者均不变 D两者均改变 E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时? CA 5B 5.5C 6D lOE 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:DA全距 B标准差 C方差 D变异系数 E极差16.下列哪个公式可用于估计医学95%正常值范围 AA X±1.96SB X±1.96SXC μ±1.96SXD μ±t0.05,υSXE X±2.58S17.标准差越大的意义,下列认识中错误的是 BA观察个体之间变异越大 B观察个体之间变异越小C样本的抽样误差可能越大 D样本对总体的代表性可能越差E以上均不对18.正态分布是以 EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布 E均数为中心的频数分布19.确定正常人的某项指标的正常范围时,调查对象是 BA从未患过病的人 B排除影响研究指标的疾病和因素的人C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人 E以上都不是20.均数与标准差之间的关系是 EA标准差越大,均数代表性越大 B标准差越小,均数代表性越小C均数越大,标准差越小 D均数越大,标准差越大E标准差越小,均数代表性越大11、常用平均数如下,除了:EA、均数B、几何均数C、中位数D、众数E、全距12、变异指标如下,除了:EA、全距B、标准差C、变异系数D、四分位数间距E、中位数13、某数值变量资料的分布性质未明,要计算集中趋势指标,下列适宜的指标是:CA、XB、GC、MD、SE、CV14、各观察值均加(或减)同一数后:BA、均数不变,标准差改变B、均数改变,标准差不变C、两者均不变D、两者均改变E、以上均不对15、某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时:CA、5B、5.5C、6D、lOE、1216、比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:DA、全距B、标准差C、方差D、变异系数E、极差17、表示血清学滴度资料平均水平最常计算: BA、算术均数B、几何均数C、中位数D、全距E、率18、标准差越大的意义,下列认识中错误的是:BA、观察个体之间变异越大B、观察个体之间变异越小C、样本的抽样误差可能越大D、样本对总体的代表性可能越差E、以上均不对19、均数与标准差适用于:AA、正态分布的资料B、偏态分布C、正偏态分布D、负偏态分布E、不对称分布20、正态分布是以:EA.t值为中心的频数分布B.参数为中心的频数分布C.变量为中心的频数分布D.观察例数为中心的频数分布E.均数为中心的频数分布1.标准正态分布曲线的特征是:BA. =0 =0 B. =0 =1 C. =1 =0D. =0 =不确定 E. =1 =不确定2.描述计量资料的主要统计指标是:AA.平均数B.相对数C.t值D.标准误E.概率3、一群7岁男孩身高标准差为5cm,体重标准差为3kg,则二者变异程度比较:DA、身高变异大于体重B、身高变异小于体重C、身高变异等于体重D、无法比较E、身高变异不等于体重4、随机抽取某市12名男孩,测得其体重均值为3.2公斤,标准差为0.5公斤,则总体均数95%可信区间的公式是:CA、3.2±t0.05.11 ×0.5B、3.2 ±t0.05.12 ×0.5/C、3.2 ±t0.05.11 ×0.5/D、3.2±1.96×0.5/E、3.2 ±2.58×0.5/5. 某组资料共5例, X2=190, X=30, 则均数和标准差分别是 DA.6 和 1.29B.6.33 和 2.5C.38 和 6.78D.6 和 1.58 E 6和2.56.以下指标中那一项可用来描述计量资料离散程度。
第一章数值变量资料的统计描述统计描述(statistical description)即利用原始数据,选择适宜的统计指标及统计图表,简明准确地探察数据的分布类型和数量特征,以便研究者根据样本信息,正确地推论其总体规律的统计分析方法。
统计指标(statistical index)是表示数据分布特征的一个或一组数值,是统计分析的基本依据.第一节频数分布的概念与应用对获取的数据进行统计学分析之前,了解数据的分布特征是至关重要的。
因为很多参数分析方法都要求样本数据来自某种已知分布的总体,否则,就应对数据实施合适的数据转换,或者采用非参数分析方法。
对频数表及频数图进行分析是描述性统计学分析的基本内容,也是表达或探索数据分布特征的基本手段.一、频数分布1.频数分布(frequency distribution)的概念频数(frequency)是相同观察值或观察结果出现的次数;分布(distribution)指随着随机变量取值的变化,其相应的概率变化的规律性。
频数分布即观察值(变量值)按大小分组,各个组段内观察值个数(频数)的分布,它是了解数据分布形态特征与规律的基础.2.频数分布的特征(1)集中趋势(central tendency):指一组变量值的集中倾向或中心位置.(2)离散趋势(tendency of dispersion):指一组变量值的分散倾向。
3.频数分布的类型⑴对称分布:指集中位置居中、左右两侧的频数分布基本对称的频数分布。
又可分为正态分布(normal distribution)和非正态分布(non-normal distribution).⑵偏态分布:是集中位置偏倚、两侧频数的分布不对称的频数分布,可分为两类:①正偏态:亦称右偏态,特点是峰偏左,此时均数与众数之差为正值,长尾向右侧(即观察值较大一端)伸延;②负偏态:亦称左偏态,特点为峰偏右,此时均数与众数之差为负值,长尾向左侧(即观察值较小一端)伸延。
实习二统计描述第164~180页实习二统计描述医学统计资料类型¾数值变量资料:又称为计量资料。
变量值是定量的,有单位的,表示为数值的大小。
¾无序分类资料:又称为计数资料。
变量值是定性的,没有单位,表示为相互独立的类别。
¾有序分类资料:又称为等级资料。
变量值是定性的,没有单位,各类别具有程度上的差异。
注:不同类型的资料,统计方法不同;各种类型的资料之间是可以相互转化的。
一、数值变量资料的统计描述统计描述包括两个方面:集中趋势的描述和离散趋势的描述一、数值变量资料的统计描述(一)数值变量资料的频数表频数表(frequency table):当变量值或者观测值较多时,将变量值分为适当的组段,统计各组段中相应的频数(或者人数),以描述数值变量资料的分布特征和分布类型。
一、数值变量资料的统计描述(一)数值变量资料的频数表频数表的用途1.描述数值变量资料的分布特征集中趋势(central tendency):频数最多的组段代表了中心位置(平均水平),从两侧到中心,频数分布是逐渐增加的。
离散趋势(tendency of dispersion):从中心到两侧,频数分布是逐渐减少的。
反映了数据的离散程度或者变异程度。
一、数值变量资料的统计描述(一)数值变量资料的频数表频数表的用途2.描述数值变量资料的分布类型正态分布:集中位置居中,左右两侧频数基本对称。
常见近似正态分布。
偏态分布:集中位置偏向一侧,频数分布不对称。
正偏态分布:集中位置偏向数值小的一侧或者左侧,有较长的右尾部。
负偏态分布:集中位置偏向数值大的一侧或者右侧,有较长的左尾部。
一、数值变量资料的统计描述(二)数值变量资料的频数分布图及正态曲线直方图及近似正态分布直方图及正偏态分布(二)数值变量资料的频数分布图及正态曲线一、数值变量资料的统计描述(三)集中趋势指标描述1.算数均数(均数mean )适用于正态分布或者近似正态分布总体均数:µ;样本均数:一、数值变量资料的统计描述一、数值变量资料的统计描述(三)集中趋势指标描述2.几何均数(geometric mean,G)适用于一种特殊的偏态分布资料:等比资料(常见于抗体滴度)。
第八章数值变量资料的统计描述三、习题A1型题1 . 描述一组正态或近似正态分布资料的平均水平用()A .算术均数B .几何均数C .中位数D .平均数E .众数2 . 血清学滴度资料最常计算()以表示其平均水平。
A .均数B .中位数C .几何均数D .全距E .标准差3 .表示变量值变异情况的指标最常用的是()A .四分位数间距B .全距C .标准差D .变异系数E .方差4 .两组呈正态分布的数值变量资料,但均数相差悬殊,若比较离散趋势,最好选用的指标为()A .全距B .四分位数间距C .方差D .标准差E .变异系数5 .下列哪一项不是标准差的应用范围()A .说明观察值的离散程度B .计算变异系数C .与均数一起描述正态分布的特征D .与均数一起根据正态分布的规律估计总体均数的可信区间E .计算标准误6 .在同一总体中随机抽样,样本含量n 越大,则理论上()越小 A .样本标准差B .中位数C .标准误D .第95百分位数E .均数7 .算术均数与中位数相比()A .抽样误差更大B .不易受极端值影响C .更充分利用数据信息D .更适用于分布不明的资料E .更适用于偏态分布资料8 .单位不相同均数相差较大时,比较连续性资料的离散趋势,最好用() A .全距B . SC . CVD .四分位间距E .方差9 .变异系数的数值()A .一定大于1B .一定小于1C .可大于1 也可小于1D .一定比S 小E .一定比S 大10 .标准正态分布的均数与标准差分别为() A . O , 1B . 1 , OC . O , OD . 1 , lE . 1.96 , 2.5811 .各观察值均加(或减)同一个数后() A .均数不变,标准差不一定变 B .均数不变,标准差变C .均数不变,标准差也不变D .均数变,标准差不变E .均数变,标准差也变12 . ( )分布的资料,均数等于中位数 A .正态B .左偏态C .右偏态D .倒数偏态E .对数偏态A2型题13 .对120 名男大学生的身高进行了测量,每个测量值减去均数所得的差值再除以标准差,所得数值的分布为()A .正态分布B .标准正态分布C .正偏态分布D .负偏态分布E .偏态分布14 .若一组数据呈正态分布,其中大于x -2.58s 的变量值占()A . 99.5 %B . 99 %C . l %E . 5 %15 .正态分布曲线下(μ士1.96σ)动区间的面积占总面积的()A . 97.5 %B . 95 %C . 5 %D . 2.5 %E . 1 %16 .某项计量指标仅以过高为异常,且资料呈偏态分布,则其95%参考值范围可为()A .≤P95B . ≥P5C .≤P97.5D .≥P95E . P2.5 ~ P97.517 .某项计量指标仅以过低为异常,且资料呈偏态分布,则其95%参考值范围可为()A . ≤P95B . P2.5 ~ P97.5C .≤P97.5D . ≥P95E . ≥P518 . X1 和X2 :是两个独立的随机变量,( X1 + X2 )与(X1 - X2)的方差相比,理论上()A .更大B .可以大也可以小C .更小D .相等E .没有关系A3型题共同题干(19 ~ 21 )随机抽取某地2000 名正常人血铅测定值。
实验二、数值变量资料的统计描述一、实验内容(项目)1.均数、几何均数、中位数的选择和计算。
2.标准差、方差、变异系数的选择和计算。
二、实验目的和要求能正确选择应用并计算各种指标,能对数值变量资料进行基本的统计描述。
三、主要实验仪器及材料计算机、SPSS软件、数据资料。
四、实验步骤:1.教师演示相应软件操作。
2.学生独立用软件完成统计资料的分析和计算,并提交分析计算结果。
3.教师引导下讨论结果,总结,完成并上交实验报告。
统计资料:1、某医科大学抽查了100名健康女大学生的血清总蛋白含量(g/L),检查结果如下:74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 75.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 74.0 72.0 76.5 74.3 76.5 77.6 67.3 72.0 73.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 75.8 73.5 75.0 72.7 70.4 77.2 68.8 67.3 75.8 73.5 75.0 72.7 73.5 72.7 81.6 73.5 75.0 72.7 70.4 76.5 72.7 77.2 84.3 75.0 71.2 71.2 69.7 73.5 70.4 75.0 72.7 67.3 70.3 76.5 73.5 78.0 68.0 73.5 68.0 73.5 68.0 74.3 72.7 73.7 试分析:(1) 输入资料建立文件。
(2) 对变量血清总蛋白含量频数分布分析:样本量、均数、中位数、最小值、最大值、方差、标准差、极差、总和、峰度系数、偏度系数及其标准误;绘制住院时间的频数分布表及直方图,观察其分布特征。
数值变量资料的名词解释引言:统计学是现代科学的重要组成部分,它能够帮助我们从大量的数据中提取有用的信息,进行推断和预测。
其中,数值变量资料是统计学中的重要概念之一。
本文将对数值变量资料进行详细解释,并探讨其应用和意义。
1. 数值变量概述数值变量通常表示一种现象或事物的数量或程度,可以进行数值计算和度量。
在统计学中,数值变量可以分为两类:离散变量和连续变量。
离散变量是指取有限或可数个数值的变量,例如年龄组、学历等;而连续变量是指在一定范围内可能取无限个数值的变量,例如身高、体重等。
2. 数值变量的度量尺度数值变量的度量尺度可以分为四种类型:名义尺度、序数尺度、区间尺度和比例尺度。
名义尺度仅用于分类目的,例如性别、民族等;序数尺度在分类的基础上还能够表达顺序关系,例如教育程度的高低;区间尺度不仅能表达顺序关系,还能够表示数值间的差异,例如温度;而比例尺度在区间尺度的基础上,能够进行比较和计量,例如收入、年龄等。
3. 数值变量的测量方法在统计学中,对于数值变量的测量通常采用自报、观察和测量仪器等方法。
自报是通过询问被调查者来获得具体数值,例如收入、家庭人口等;观察是通过实地观察来获得数值,例如身高、体重等;而测量仪器能够提供更准确和客观的数值,例如血压、心率等。
4. 数值变量的统计描述为了更好地理解和分析数值变量,统计学提供了多种描述和总结的方法。
其中,常见的统计描述包括均值、中位数、众数、极差和标准差等。
均值是指所有观察值的总和除以观察值的个数,可以反映数值的集中趋势;中位数是将观察值按顺序排列后位于中间位置的数值,可以反映数值的中间位置;众数是指在数值变量中出现次数最多的数值,可以反映数值的最常出现的特点;极差是指观察值的最大值与最小值之差,可以反映数值的范围;标准差是指观察值与均值的差异程度,可以反映数值的分散程度。
5. 数值变量的可视化为了更直观地展示数值变量的特征和规律,统计学提供了多种可视化方法。
第八章数值变量资料的统计描述三、习题A1型题1 . 描述一组正态或近似正态分布资料的平均水平用()A .算术均数B .几何均数C .中位数D .平均数E .众数2 . 血清学滴度资料最常计算()以表示其平均水平。
A .均数B .中位数C .几何均数D .全距E .标准差3 .表示变量值变异情况的指标最常用的是()A .四分位数间距B .全距C .标准差D .变异系数E .方差4 .两组呈正态分布的数值变量资料,但均数相差悬殊,若比较离散趋势,最好选用的指标为()A .全距B .四分位数间距C .方差D .标准差E .变异系数5 .下列哪一项不是标准差的应用范围()A .说明观察值的离散程度B .计算变异系数C .与均数一起描述正态分布的特征D .与均数一起根据正态分布的规律估计总体均数的可信区间E .计算标准误6 .在同一总体中随机抽样,样本含量n 越大,则理论上()越小A .样本标准差B .中位数C .标准误D .第95百分位数E .均数7 .算术均数与中位数相比()A .抽样误差更大B .不易受极端值影响C .更充分利用数据信息D .更适用于分布不明的资料E .更适用于偏态分布资料8 .单位不相同均数相差较大时,比较连续性资料的离散趋势,最好用()A .全距B . SC . CVD .四分位间距E .方差9 .变异系数的数值()A .一定大于1B .一定小于1C .可大于1 也可小于1D .一定比S 小E .一定比S 大10 .标准正态分布的均数与标准差分别为()A . O , 1B . 1 , OC . O , OD . 1 , lE . 1.96 , 2.5811 .各观察值均加(或减)同一个数后()A .均数不变,标准差不一定变B .均数不变,标准差变C .均数不变,标准差也不变D .均数变,标准差不变E .均数变,标准差也变12 . ( )分布的资料,均数等于中位数A .正态B .左偏态C .右偏态D .倒数偏态E .对数偏态A2型题13 .对120 名男大学生的身高进行了测量,每个测量值减去均数所得的差值再除以标准差,所得数值的分布为()A .正态分布B .标准正态分布C .正偏态分布D .负偏态分布E .偏态分布14 .若一组数据呈正态分布,其中大于 x -2.58s 的变量值占()A . 99.5 %B . 99 %C . l %D . 0.5 %E . 5 %15 .正态分布曲线下(μ士1.96σ)动区间的面积占总面积的()A . 97.5 %B . 95 %C . 5 %D . 2.5 %E . 1 %16 .某项计量指标仅以过高为异常,且资料呈偏态分布,则其95%参考值范围可为()A .≤P95B . ≥ P5C .≤P97.5D .≥P95E . P2.5 ~ P97.517 .某项计量指标仅以过低为异常,且资料呈偏态分布,则其95%参考值范围可为()A . ≤P95B . P2.5 ~ P97.5C .≤P97.5D . ≥P95E . ≥ P518 . X1 和X2:是两个独立的随机变量,( X1+ X2)与(X1- X2)的方差相比,理论上()A .更大B .可以大也可以小C .更小D .相等E .没有关系A3型题共同题干(19 ~ 21 )随机抽取某地2000 名正常人血铅测定值。