第八章 数值变量资料的统计描述
- 格式:ppt
- 大小:1.02 MB
- 文档页数:3
数值变量资料的统计分析数值变量的统计分析是一种重要的数据分析方法,通过对数值变量的各种统计指标和分布进行分析,可以帮助我们了解和揭示数据的内在规律和特征。
数值变量的统计分析在各个领域和学科中都有着广泛的应用,如经济学、社会学、医学等。
本文将从描述统计、推断统计和回归分析三个方面介绍数值变量资料的统计分析方法。
描述统计是对数值变量资料进行整体描述的统计方法。
常用的描述统计指标包括中心趋势和离散程度两方面。
中心趋势指标包括平均数、中位数和众数。
平均数是最常用的中心趋势指标,它代表了样本数据的集中位置。
中位数是将数据按从小到大的顺序排列后,处于中间位置的数值,它对极端值不敏感,更能反映总体的典型水平。
众数是出现频率最高的数值,可以用来了解数据的分布特点。
离散程度指标包括范围、方差和标准差等。
范围是最大值和最小值的差值,表示了数据集的广度。
方差和标准差是衡量数据分散程度的指标,方差是每个数值与平均数的差的平方的平均值,标准差是方差的平方根,反映了数据的离散程度。
推断统计是利用样本数据对总体进行推断的统计方法。
常用的推断统计方法包括参数估计和假设检验。
参数估计是通过样本数据估计总体的未知参数,如均值、方差等。
常用的参数估计方法有点估计和区间估计。
点估计是通过样本数据得到总体参数的一个估计值。
常用的点估计方法有最大似然估计和矩估计。
区间估计则是对参数进行估计的同时还给出了一个可信的范围,可以用于报告不确定性。
假设检验是利用样本数据对总体参数进行假设检验的统计方法,用于判断总体参数是否符合一些假设。
假设检验包括单样本检验、双样本检验和方差分析等。
回归分析是一种用于研究变量之间关系的统计方法。
回归分析可以用于建立数值变量之间的函数关系,并用于预测和解释变量之间的关系。
常用的回归分析方法包括线性回归、多元回归和非线性回归等。
线性回归是建立线性关系模型的一种方法,通过最小二乘估计法来估计回归系数。
多元回归是在线性关系模型的基础上引入多个自变量进行分析。
第八章数值变量资料的统计描述三、习题A1型题1 . 描述一组正态或近似正态分布资料的平均水平用()A .算术均数B .几何均数C .中位数D .平均数E .众数2 . 血清学滴度资料最常计算()以表示其平均水平。
A .均数B .中位数C .几何均数D .全距E .标准差3 .表示变量值变异情况的指标最常用的是()A .四分位数间距B .全距C .标准差D .变异系数E .方差4 .两组呈正态分布的数值变量资料,但均数相差悬殊,若比较离散趋势,最好选用的指标为()A .全距B .四分位数间距C .方差D .标准差E .变异系数5 .下列哪一项不是标准差的应用范围()A .说明观察值的离散程度B .计算变异系数C .与均数一起描述正态分布的特征D .与均数一起根据正态分布的规律估计总体均数的可信区间E .计算标准误6 .在同一总体中随机抽样,样本含量n 越大,则理论上()越小A .样本标准差B .中位数C .标准误D .第95百分位数E .均数7 .算术均数与中位数相比()A .抽样误差更大B .不易受极端值影响C .更充分利用数据信息D .更适用于分布不明的资料E .更适用于偏态分布资料8 .单位不相同均数相差较大时,比较连续性资料的离散趋势,最好用()A .全距B . SC . CVD .四分位间距E .方差9 .变异系数的数值()A .一定大于1B .一定小于1C .可大于1 也可小于1D .一定比S 小E .一定比S 大10 .标准正态分布的均数与标准差分别为()A . O , 1B . 1 , OC . O , OD . 1 , lE . 1.96 , 2.5811 .各观察值均加(或减)同一个数后()A .均数不变,标准差不一定变B .均数不变,标准差变C .均数不变,标准差也不变D .均数变,标准差不变E .均数变,标准差也变12 . ( )分布的资料,均数等于中位数A .正态B .左偏态C .右偏态D .倒数偏态E .对数偏态A2型题13 .对120 名男大学生的身高进行了测量,每个测量值减去均数所得的差值再除以标准差,所得数值的分布为()A .正态分布B .标准正态分布C .正偏态分布D .负偏态分布E .偏态分布14 .若一组数据呈正态分布,其中大于 x -2.58s 的变量值占()A . 99.5 %B . 99 %C . l %D . 0.5 %E . 5 %15 .正态分布曲线下(μ士1.96σ)动区间的面积占总面积的()A . 97.5 %B . 95 %C . 5 %D . 2.5 %E . 1 %16 .某项计量指标仅以过高为异常,且资料呈偏态分布,则其95%参考值范围可为()A .≤P95B . ≥ P5C .≤P97.5D .≥P95E . P2.5 ~ P97.517 .某项计量指标仅以过低为异常,且资料呈偏态分布,则其95%参考值范围可为()A . ≤P95B . P2.5 ~ P97.5C .≤P97.5D . ≥P95E . ≥ P518 . X1 和X2:是两个独立的随机变量,( X1+ X2)与(X1- X2)的方差相比,理论上()A .更大B .可以大也可以小C .更小D .相等E .没有关系A3型题共同题干(19 ~ 21 )随机抽取某地2000 名正常人血铅测定值。