第四章 中心趋势测量
- 格式:doc
- 大小:42.50 KB
- 文档页数:4
数据的中心趋势和离散程度数据分析是现代社会中不可或缺的一部分,它帮助我们理解和解释各种现象。
在数据分析中,了解数据的中心趋势和离散程度是非常重要的。
本文将介绍数据的中心趋势和离散程度的概念,并提供几种用于测量的方法。
一、中心趋势中心趋势是一组数据集中的一个值,它代表了数据的平均水平或核心位置。
最常用的中心趋势度量是算术平均数或平均值。
平均数被定义为一组数值之和除以该组数值的数量。
例如,给定一组数值:2, 4, 6, 8, 10,它们的平均数为6。
另一个常用的中心趋势度量是中位数。
中位数是将一组数据按照大小顺序排列后,位于中间位置的值。
如果数据集中有偶数个数值,则中位数为中间两个数值的平均值。
例如,给定一组数值:2, 4, 6, 8,它们的中位数为5。
除了平均数和中位数,还有一种用于测量中心趋势的度量是众数。
众数是数据集中出现频率最高的数字。
如果数据集中存在多个众数,则称为多峰分布。
例如,给定一组数值:2, 2, 4, 6, 8,它们的众数为2。
二、离散程度离散程度描述了数据集中数值的分散程度或散布范围。
如果数据集中的数值都非常接近,那么离散程度很小;如果数值相差很大,那么离散程度很大。
最常用的离散程度度量是方差和标准差。
方差是每个数值与平均数之差的平方的平均值。
标准差是方差的平方根。
方差和标准差越大,表示数据集的离散程度越大。
例如,给定一组数值:2, 4, 6, 8, 10,它们的方差为8,标准差为2.83。
这意味着这组数据的离散程度相对较小。
而如果给定一组数值:2, 2, 4, 6, 20,它们的方差为56,标准差为7.48。
这组数据的离散程度较大。
除了方差和标准差,还有其他一些度量离散程度的方法,例如范围和百分位数。
范围是数据集的最大值和最小值之间的差值。
百分位数是将数据集按大小顺序排列后,某个百分比处的数值。
例如,第75百分位数是将数据集分为四个相等的部分后,处于第三个部分的数值。
总结:在数据分析中,了解数据的中心趋势和离散程度是非常重要的。
第四章 集中趋势测量法统计资料经分类整理后,已经使杂乱无章的资料成为有系统有条理的资料。
为从中获取有用信息,寻求一简单数值以代表总体(或样本)是最起码的,这就提出了平均指标的计算问题。
平均指标的功用是表明现象总体在一定条件下某一数量标志所达到的一般水平。
第一节 算术平均数在社会统计学中.算术平均数是反映集中趋势最常用、最基本的平均指标。
由于统计总体的标志总量通常都是各总体单位标志值之和,而且是与其总体单位数相对应的,因此用总体标志总量除以总体单位数即得算术平均数。
算术平均数一般用X 表示,它在推论统计中被称为均值。
算术平均数表示某一总体之总体单位平均所得的标志值的水平。
在实际工作中,由于统计资料整理的情况不尽相同,我们在运用定义计算算术平均数时,要视资料有没有分组加以区别对待。
在形式上,分组资料的计算式与未分组资料的计算式是有区别的,尽管它们在本质上并没有什么不同。
以后我们将看到,其他平均和变异指标的计算也同样如此。
1.对于未分组资料对于未分组资料,计算算术平均数要用原始式。
2.对于分组资料对于分组资料,计算算术平均数要用加权式。
对于单项数列,很显然,算术平均数X 不仅受各变量值(i X )大小的影响,而且受各组单位数(频数)的影响。
由于i X 对于总体的影响要由频数(i f )大小所决定,所以i f 也被称为权数。
值得注意的是,在统计计算中,权数不仅用来衡量总体中各标志值在总体中作用,同时反映了指标的结构,所以它有两种表现形式:绝对数(频数)和相对数(频率)。
这样一来,在统计学中,凡对应于分组资料的计算式,都被称为加权式。
对于组距数列,由于每一组变量值不止一个,因此先要用每一组的组中值权充该组统一的变量值,然后再计算给定数列的算术平均数。
3.算术平均数的性质(1) 各变量值与算术平均数的离差之和等于0。
(2)各变量值对算术平均数的离差的平方和,小于它们对任何其他数(X ’)偏差的平方和。
也就是说,各变量值与算术平均数的离差的平方和为最小值。
《计量地理学》课程笔记第一章绪论一、计量地理学的产生1. 背景- 地理学的传统研究方法主要是定性的描述和分析,但随着科学技术的进步,地理学家们开始寻求更精确、更系统的分析方法。
- 第二次世界大战后,计算机技术的迅速发展以及大量地理数据的积累为地理学的定量研究提供了可能。
2. 起源- 20世纪50年代,美国地理学家沃尔德华·克里斯塔勒(Walter Christaller)和威廉·阿瑟·刘易斯(William Arthur Lewis)等人的工作标志着计量地理学的诞生。
- 我国计量地理学的发展始于20世纪70年代末,随着改革开放的推进,引入了西方的计量地理学理论和方法。
3. 产生原因- 地理学研究的内在需求:为了更深入地理解地理现象的规律性和内在联系,需要定量化的研究方法。
- 数学与统计学的发展:为地理学提供了新的工具和方法,如回归分析、聚类分析等。
- 计算机技术的应用:使得复杂的数据处理和模型运算成为可能。
二、计量地理学的研究对象和内容1. 研究对象- 地理空间分布:研究地理现象在空间上的分布特征和规律。
- 地理现象的变化:分析地理现象随时间的变化趋势和周期性。
- 地理要素关系:探讨不同地理要素之间的相互作用和影响。
2. 研究内容- 地理数据的采集与处理:包括数据收集、清洗、转换和存储等。
- 地理现象的定量描述:使用数学模型和统计方法对地理现象进行描述。
- 地理模型的构建与应用:建立地理现象的数学模型,用于预测和决策支持。
- 地理空间分析:研究地理现象的空间格局、空间过程和空间关系。
三、计量地理学的研究方法1. 数学方法- 概率论:用于描述和推断地理现象的不确定性。
- 数理统计:用于数据分析、假设检验和模型建立。
- 线性代数:用于处理地理数据的矩阵运算。
- 微积分:用于分析地理现象的变化率和累积量。
2. 统计方法- 描述性统计:对数据进行总结和可视化。
- 推断性统计:从样本数据推断总体特征。
研究生统计学数据分析教案引言统计学是一门广泛应用于各个领域的学科,旨在帮助人们收集、分析和解释数据。
在现代社会中,数据分析扮演着重要的角色,能够揭示出隐藏在大量数据背后的规律和趋势。
因此,研究生统计学课程中的数据分析教学显得尤为重要。
本篇文章将介绍一份全面的研究生统计学数据分析教案,旨在帮助学生掌握数据分析的基本概念、工具和技巧。
教学目标•了解数据分析的基本概念和原理•学会使用各种统计工具和软件进行数据分析•掌握数据可视化的技巧,有效传达分析结果•培养独立思考和解决问题的能力教学大纲第一章:统计学基础H1:统计学概述•H2:什么是统计学?•统计学的定义和作用•统计学的发展历程•H2:统计学的应用领域•各个领域中数据分析的重要性•统计学在科学研究中的应用H1:数据类型和数据收集•H2:数据类型•定性数据与定量数据的区别•离散数据与连续数据的区别•H2:数据收集方法•问卷调查•实验设计•抽样方法第二章:数据处理和清洗H1:数据处理•H2:数据收集与数据处理的关系•数据收集之后的处理意义•数据处理的目的和步骤•H2:数据清洗•识别和处理缺失数据•识别和处理异常值H1:数据转换和平滑•H2:数据转换•常见的数据转换方法•数据转换的应用场景•H2:平滑技术•平滑数据的方法和原理•平滑技术的优缺点比较第三章:统计描述和推断H1:统计描述•H2:数据的中心趋势测量•平均数、中位数和众数的计算•中心趋势测量在数据分析中的应用•H2:数据的离散程度测量•方差和标准差的计算•离散程度测量在数据分析中的应用H1:统计推断•H2:参数估计•点估计和区间估计•常见参数的估计方法•H2:假设检验•步骤和原理•假设检验的应用举例第四章:数据分析与可视化H1:数据分析方法•H2:描述性数据分析•频数分析和交叉分析•描述性数据分析的应用场景•H2:推断性数据分析•方差分析和回归分析•推断性数据分析的应用举例H1:数据可视化•H2:可视化基础•图表种类及其选择•有效传达数据分析结果的原则•H2:数据可视化工具•常见的数据可视化软件和工具介绍•如何选择合适的数据可视化工具第五章:案例分析与实践H1:案例分析•H2:实际案例分析•对真实数据进行整理和分析•探索案例分析的重要性•H2:案例实践•分组合作完成案例实践项目•对案例分析结果进行展示和讨论结论研究生统计学数据分析教案旨在帮助学生全面掌握数据分析的基本原理、工具和技巧。
数据挖掘实验报告班级:091002学号:091002122姓名:刘晓梅指导老师:刘建伟完成日期:2012-05-23中心趋势度量一、实验目的中心趋势度量包括均值、中位数、众数和中列数,这些描述性统计量能够更好地理解数据的分布。
加深对中心趋势度量的方法的理解以及应用。
二、实验内容利用java语言实现均值、中位数、众数和中列数的算法,然后输出。
三、具体实现源代码:package com.datamining.zxqsdl;importjava.util.Scanner;public class Centerqsdl{private static double datas[];private static intnum;static Scanner input = new Scanner(System.in);public static void main(String[] args) {System.out.println("-----欢迎您的使用!-----");init();System.out.println();boolean flag = true;while(flag){menu();System.out.println("请输入您的选择的功能的序号:");int choice = input.nextInt();switch(choice){case 1:double mean=getMean(datas,num);System.out.println("平均值是:"+mean);break;case 2:double median = getMedian(datas, num);System.out.println("中位数是:"+median);break;case 3:double mode = getMode(datas,num);System.out.println("众数是:"+mode);break;case 4:double midrange = getMidrange(datas,num);System.out.println("中列数是:"+midrange);break;case 5:flag = false;break;default:System.out.println("您输入的序号不合法,请重新输入:");break;}if(!flag){System.out.println("欢迎下次光临,再见!");exit();}else{System.out.print("输入0返回:");choice = input.nextInt();if(choice == 0){flag = true;}}}}//退出系统public static void exit(){System.exit(0);}public static void menu(){System.out.println("1.求平均值\n2.求中位数\n" +"3.求众数\n4.求中列数\n5.退出");}//初始化数组public static void init(){System.out.println("请输入需要的数据元组的个数num:");num = input.nextInt();//输入数组长度datas = new double[num];System.out.println("请输入数据元组的值:");for(inti = 0;i <num;i++){datas[i] = input.nextDouble();//为数组赋值}System.out.println("您输入的数据元祖是:");for(inti = 0; i<datas.length;i++){System.out.print(datas[i]+" ");//输出数组}}//得到平均值public static Double getMean(double datas[],intnum){ double sum = 0;for(inti = 0;i<datas.length;i++){sum += datas[i];//得到总数和}return sum/datas.length;}//得到中位数public static Double getMedian(double datas[],intnum){ double median = 0;if(num % 2 == 1){//奇数时median = datas[(num + 1)/2-1];}else{//偶数时median = (datas[num/2 -1] + datas[(num/2)])/2.0;}return median;}//得到众数public static Double getMode(double datas[],intnum){ int counts[] = new int[num];intmaxCount = counts[0];int index = -1;int n=0;for(inti = 0;i<datas.length;i++){//得到频数的数组int count = 1;for(int j=i+1;j<counts.length;j++){if(datas[i]==datas[j]){count++;}}counts[n++]=count;}for(inti=0;i<counts.length;i++){//得到最大频数对应的数值if(counts[i]>maxCount){maxCount = counts[i];index = i;}}returndatas[index];}//得到中列数public static Double getMidrange(double datas[],intnum){ double max = datas[0];double min = datas[0];for(inti = 0;i<datas.length;i++){if(datas[i]>max){max = datas[i];//得到最大值}if(datas[i]<min){min = datas[i];//得到最小值}}double sum = max + min;//得到最大值和最小值的和return sum /2.0;}}四、心得体会尽管对于java语言已经比较熟悉,但是我在做这次实验时仍然遇到了不少的困难。
《社会统计学》全书目录第一章导论第一节什么是社会统计学社会统计的产生与发展•社会统计学的对象与特点•社会统计的方法•社会统计工作的程序第二节社会统计学的几个基本概念总体与单位•标志与变量•指标与指标体系第二章社会统计资料的搜集第一节统计调查的方法及种类原始资料与次级资料•静态资料与静态资料•全面调查与非全面调查•一般调查与专项调查•经常性调查与一次性调查第二节统计调查的组织形式普查•重点调查•典型调查•抽样调查第三节概念的操作化与测量概念的操作化•定类尺度•定序尺度•定距尺度•定比尺度第四节统计误差登记性误差•代表性误差•抽样误差第三章社会统计资料的整理第一节统计分组的原则与标准“穷举”与“互斥”•频数(或次数)分布数列•品质数列与变量数列第二节统计表统计表的格式、内容与种类•统计表的制作规则第三节变量数列的编制对于离散变量•对于连续变量•组距和组数的确定•累计频数第四节统计图直方图•折线图•曲线图•累计顿数分布曲线•洛仑兹曲线与基尼系数第四章集中趋势测量法第一节算术平均数对于未分组资料的算术平均数计算•对于分组资料的算术平均数计算•算术平均数的性质第二节中位数对于未分组资料的中位数计算•对于分组资料的中位数计算•中位数的性质•其他分割法第三节众数对于未分组资料的众数计算•对于分组资料的众数计算•众数的性质第四节几何平均数、调和平均数及其他几何平均数•调和平均数•各种平均数的关系第五章离中趋势测量法第一节全距与四分位差全距•四分位差第二节平均差对于未分组资料A•D的计算•对于分组资料A•D的计算•平均差的性质第三节标准差对于未分组资科S的计算•对于分组资料S的计算•标准差的性质•标准分第四节相对离势变异系数•异众比率•偏态系数第六章概率与概率分布第一节概率论随机现象和随机事件•事件之间的关系•先验概率•经验概率第二节概率的数学性质概率的数学性质•排列与样本点的计数•运用概率方法进行统计推断的前提第三节概率分布、期望值与变异数离数型随机变量及其概率分布•连续型随机变量的概率分布•分布函数•数学期望•变异数第七章假设检验第一节二项分布二项分布的数学形式•二项分布的讨论第二节统计检验的基本步骤建立假设•求抽样分布•选择显著性水平和否定域•计算检验统计量•判定第三节正态分布正态分布的数学形式•标准正态分布•正态曲线下的面积•二项分布的正态近似法第四节中心极限定理抽样分布•中心极限定理第五节总体均值和成数的单样本检验σ已知,对总体均值的检验•学生t分布(小样本总体均值的检验)•关于总体成数的检验第八章常用统计分布第一节超几何分布超几何分布的数学形式•超几何分布的数学期望与方差•关于超几何分布的近似第二节泊松分布泊松分布的数学形式•泊松分布的性质•关于泊松分布的近似第三节卡方分布( 分布)卡方分布的数学形式•卡方分布的性质•样本方差的抽样分布第四节F分布F分布数学形式•F分布的性质•关于F分布的近似第九章参数估计第一节点估计无偏性•一致性•有效性第二节区间估计精确性和可靠性•抽样平均误差与概率度•区间估计的步骤第三节其他类型的置信区间未知,小样本总体均值的区间估计•总体成数的估计•总体方差的区间估计第四节抽样平均误差简单随机抽祥的抽样误差•分层抽样的抽样误差•整群抽样的抽样误差•等距抽祥的抽样误差第五节样本容量的确定影响样本容量的因素•确定样本容量第十章双样本假设检验及区间估计第一节两总体大样本假设检验大样本均值差检验•大样本成数差检验第二节两总体小样本假设检验小样本均值差检验•小样本方差比检验第三节配对样本的假设检验单一实验组的假设检验•一实验组与一控制组的假设检验•对实验设计与相关检验的评论第四节双样本区间估计σ12和σ22已知,对均值差的区间估计•σ12和σ22未知,对均值差的区间估计•大样本成数区间估计•配对样本均值差的区间估计第十一章非参数检验第一节符号检验配对样本的“符号检验”•符号检验与二项检验•简便检验•“符号检验”的作用第二节配对符号秩检验配对样本的符号秩检验•配对符号秩检验的步骤•符号秩检验的效力第三节秩和检验独立样本的秩和检验•秩和•秩和检验的具体步骤•U检验第四节游程检验独立样本的游程检验•游程•游程检验的具体步骤•差符号游程检验第五节累计频数检验独立样本的累计频数检验•累计频数检验的步骤•没有预测方向和已经预测方向•经验分布与理论分布之比较第十二章相关与回归分析第一节变量之间的相互关系相关程度与方向•因果关系第二节定类变量的相关分析列联表•削减误差比例•系数•系数第三节定序变量的相关分析同序对、异序对、同分对•Gamma系数•肯德尔等级相关系数•萨默斯(d系数)•斯皮尔曼等级相关系数•肯德尔和谐系数第四节定距变量的相关分析相关表和相关图•积差系数的导出和计算•积差系数的性质第五节回归分析线性回归•积差系数的PRE性质•相关指数R第六节曲线相关与回归第十三章检验与方差分析第一节拟合优度检验问题的导出•拟合优度检验(比率拟合检验) •正态拟合检验第二节无关联性检验独立性、理论频数及自由度•关于频数比较和连续性修正•列联表的卡方分解•关系强度的量度第三节方差分析总变差及其分解•关于自由度•关于检验统计量Fo的计算•相关比率•关于方差分析的几点讨论第四节回归方程与相关系数的检验回归系数的检验•积差系数的检验•回归方程的区间估计第十四章动态分析与指数分析第一节时间数列及其指标分析时间数列的构成与分类•动态比较指标•动态平均指标第二节时间数列的趋势分析随手绘法•移动平均法•半数平均法•最小平方法第三节指数分析法动态指数及其分类•质量指标综合指数•数量指标综合指数•用与个体指数的联系来求综合指数•其他权数形式的质量和数量综合指数•指数体系和因素分析•静态指数第一章导论统计是关于数字和数据合成的学问。
数据的中心趋势度量数据的中心趋势度量是用来描述一组数据的集中程度的统计指标。
常见的中心趋势度量有平均数、中位数和众数。
下面将分别介绍这三种度量方法及其应用。
平均数是最常用的一种中心趋势度量方法,它是将数据中所有观测值相加,再除以观测值的总数。
平均数能够体现数据的总体水平,具有较好的稳定性和可比性,适用于数据分布比较均匀和无极端值的情况。
例如,统计一批学生的考试成绩时,可以计算平均数来表示全班学生的总体水平。
也可以使用加权平均数来处理一些特殊情况,比如不同组别的样本具有不同的权重。
中位数是把一组数据按照从小到大的顺序排列后,位于中间的数值。
对于数据的分布和离群值不太确定的情况,中位数是较为稳健的中心趋势度量方法。
中位数对于数据的极值没有影响,适用于数据存在一些极端值的情况。
例如,在统计一组员工的工资时,如果存在一位薪资极高的员工,使用平均数可能会被其拉高,此时使用中位数就能更好地反映员工的典型薪资水平。
众数是一组数据中出现频率最高的数值,可以有一个或多个众数。
众数对于描述数据的集中趋势有着较好的表示能力,特别适用于描述分类数据。
例如,统计一组学生的体育项目选择时,可以计算众数来了解学生们最喜欢的体育项目,进而依据此做出相应的决策。
除了以上介绍的三种常见的中心趋势度量方法,还有一些其他的度量方法,如四分位数、加权中位数等。
四分位数可以将有序数据分成四个相等的部分,分别是第一四分位数(下四分位数)、中位数和第三四分位数(上四分位数),通过四分位数可以了解数据的分布情况以及样本的集中程度。
加权中位数是一种对中位数的扩展,用于处理数据存在不同权重的情况,对于某些分布不平衡的数据具有更好的描述性能。
在实际应用中,选择适合的中心趋势度量方法需要考虑数据特点、目的以及应用场景。
不同中心趋势度量方法对极端值的敏感程度不同,也反映了数据的不同特点。
同时,根据数据的类型和分布情况,可以采用不同的中心趋势度量方法,以更好地理解数据背后的信息和规律。
探索统计学中的中心趋势测量在统计学中,中心趋势是一种常用的测量方式,用于描述数据集中的一个代表性数值。
中心趋势可以帮助我们更好地理解数据的分布和集中程度。
本文将探索统计学中的中心趋势测量方法,包括均值、中位数和众数,并比较它们的特点和适用情况。
1. 均值(Mean)均值是最常见的中心趋势测量方法,它表示数据集的平均值。
计算均值的方法是将所有数据相加,然后除以数据的总数。
均值对于大部分数据集来说是一个很好的描述性指标,它受到所有数据的影响,相对较稳定。
然而,均值也容易受到数据异常值的影响,从而导致输出结果不够准确。
2. 中位数(Median)中位数是将数据集中的所有数值按照从小到大的顺序排列,找出中间位置的数值。
对于偶数个数据,取中间两个数的平均值作为中位数。
与均值相比,中位数的计算方式更加稳健,不受异常值的影响。
中位数适用于存在极端值或者偏态分布的数据集,能够更好地反映数据集的中心位置。
3. 众数(Mode)众数是指数据集中最频繁出现的数值。
一个数据集可以有一个或者多个众数,也可以没有众数。
众数主要用于描述离散型变量的中心趋势,比如衣服的尺码或者颜色等。
众数对于描述非数值型变量的中心位置很有用,但对于连续型变量的中心趋势测量作用较小。
除了上述三种常见的中心趋势测量方法,还有一些其他的测量方法,比如加权平均数、调和平均数等。
这些方法在特定的数据场景下有着自己的应用优势,但在普遍情况下使用较少。
在选择中心趋势测量方法时,需要考虑数据的类型、分布情况以及分析目的。
如果数据集较小且无极端值,均值是一个较好的选择;如果数据集中存在异常值,可以考虑使用中位数;而对于非数值型变量,众数是一个合适的选项。
在实际应用中,可以根据具体情况综合考量使用不同的中心趋势测量方法。
总结起来,中心趋势测量方法是统计学中一种重要的数据描述方式,通过均值、中位数和众数等指标,能够有效揭示数据集的集中程度。
不同的测量方法有着各自的特点和适用情况,在实际应用中需要根据数据特点和分析目的选择合适的测量方法。
第四章中心趋势测量
一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确答案的序号,填写在题中的括号内。
每小题2分,共20分)
1. 在某市随机抽取10 家企业,7月份利润额(单位:万元) 分别为7
2.0 、6
3. 1 、20. 0 、23. 0 、5
4. 7 、54.3 、23. 9 、2
5.0 、2
6. 9 、29.0,那么这10家企业7月份利润额均值为( )。
A. 39. 19
B. 28. 90
C. 19.54
D. 27.95
2. 对于右偏分布,平均数、中位数和众数之间的关系是( )。
A. 平均数〉中位数〉众数
B. 中位数〉平均数〉众数
C. 众数〉中位数〉平均数
D. 众数〉平均数〉中位数
二、名词解释(每题4分,共20分)
3. 中位数
4. 均值
三、简答题{每题 1 0分,共30分}
5. 简述众数、中位数和平均数作为测量中心趋势的指标所适用的数据类型。
6. 简述定类变量、定序变量和数值型变量集中趋势测量的方法。
四、计算题(每题 1 5分,共30分)
7. 某校社会学专业同学统计课成绩如下表所示。
社会学专业同学统计课成绩表
学号成绩学号成绩学号成绩101023 76 101037 75 101052 70 101024 91 101038 70 101053 88 101025 87 101039 76 101054 93 101026 78 101040 90 101055 62 101027 85 101041 76 101056 95 101028 96 101042 86 101057 95 101029 87 101043 97 101058 66 101030 86 101044 93 101059 82 101031 90 101045 92 101060 79 101032 91 101046 82 101061 76 101033 80 101047 80 101062 76 101034 81 101048 90 101063 68 101035 80 101049 88 101064 94 101036 83 101050 77 101065 83
要求:
(1) 对考试成绩按由低到高进行排序,求出众数、中位数和平均数。
(2) 对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。
答案:1. A 2. A
3. 中位数
中位数是中心趋势的一种测量,是将-组数据排序后,处于中间位置的变量值。
( 2分)作为中心趋势的测量指标,它适用于定序数据、定距数据和定比数据,且不受极端值的影响。
(2 分)
4. 均值
均值是集中趋势最主要的测量值。
(l分)它是将全部数据进行加总然后除以数据总个
数,也称为算数平均数。
(3分)
5.简述众数、中位数和平均数作为测量中心趋势的指标所适用的数据类型。
众数是对中心趋势最低层次的测量,是适用范围最大的一种测量方式,适用于任何类型的数据,即定类、定序、定距和定比数据都可以用众数来测量其中心趋势。
(3分)
中位数适用于除了定类数据外的所有其他类型数据,因为中位数是处于中间位置的变量值,而定类数据不存在类别的先后次序或大小,因而中位数不适用于定类数据。
(3分)
平均数是集中趋势最主要的测量指标,但是平均数仅适用于定距数据和定比数据,定类数据和定序数据计算平均数没有意义。
(3 分)
一般说来,定类数据的中心趋势测量指标是众数,定序数据的中心趋势测量指标是中位数,而数值型数据(定距和定比数据)的中心趋势测量指标是平均数。
(1分)
6.简述定类变量、定序变量和数值型变量集中趋势测量的方法。
定序变量是层次最低的变量,用众数作为其中心趋势的测量。
(3分)定序变量主要使用中位数、四分位数作为集中趋势的测量,同时也可以使用众数作为测量值,但是中位数和四分位数利用序次关系,因而更多使用这两者。
(3分)
数值型数据(定距和定比数据)的集中趋势测量指标是平均数,同样,数值型数据可以使用众数和中位数、四分位数作为中心趋势的测量,但是更主要的是使用均值,因为均值利用所有数据信息。
(4分)
7.(1)考试成绩由低到高排序:
62,66,68,70,70,75,76,76,76,76,76,77,78,79,
80,80,80,81,82,82,83,83,85,86,86,87,87,88,
88,90,90,90,91,91,92,93,93,94,95,95,96,97 (1分)
众数:76 (2分)
中位数:83 (2分)
平均数:N
X X X X N
+⋅⋅⋅++=
21
= (62 + 66 + …… + 96 + 97) ÷ 42 = 3490 ÷ 42
= 83.095 (2分)
( 2 )
按成绩分组 频数 频率(%) 向上累积 向下累积 频数
频率(%) 频数
频率(%) 60 - 69 3 7.143 3 7.143 42 100.000 70 - 79 11 26.190 14 33.333 39 92.857 80 - 89 15 35.714 29 69.048 28 66.667 90 - 99
13
30.952
42
100.000
13
30.952
(8分)。