第3章 描述性统计分析
- 格式:ppt
- 大小:1.96 MB
- 文档页数:42
描述性统计分析【导言】在科学研究、市场调查、社会调查以及政策制定等各个领域中,描述性统计分析是一种重要的分析方法。
它主要通过对数据的整理、总结和分析,来描述数据的特征、分布和关系等。
本文将简要介绍描述性统计分析的概念和应用领域,并探讨其在实际问题中的意义和方法。
【一、描述性统计分析的概念】描述性统计分析是一种通过对数据的整理、总结和分析,来描述数据的特征、分布和关系等的方法。
它不仅可以帮助我们更好地理解数据,还可以从中发现问题和规律,为后续的分析和决策提供依据。
描述性统计分析主要包括数据的中心趋势度量、数据的离散程度度量和数据的分布特征等内容。
【二、描述性统计分析的应用领域】描述性统计分析在各个领域中都有广泛的应用,以下是几个常见的应用领域:1. 科学研究:在科学研究中,描述性统计分析可以帮助研究人员对实验数据进行整理和总结,发现数据中的规律和趋势,从而对研究对象进行深入的理解和解释。
2. 市场调查:在市场调查中,描述性统计分析可以帮助市场研究人员对市场数据进行整理和总结,了解产品的市场需求、消费者的购买行为和市场竞争情况,为市场营销活动提供科学依据。
3. 社会调查:在社会调查中,描述性统计分析可以帮助调查人员对社会问题的数据进行整理和总结,了解社会现象的普遍性和差异性,为制定社会政策提供参考依据。
4. 教育评估:在教育评估中,描述性统计分析可以帮助教育管理者对学生成绩、教学效果等数据进行整理和总结,洞察学生的学习状况和教育的质量问题,为教育改革提供参考依据。
【三、描述性统计分析的意义】描述性统计分析的意义主要体现在以下几个方面:1. 描述数据特征:通过描述性统计分析,我们可以对数据的中心趋势、离散程度等特征进行客观的量化和描述,从而更好地理解数据。
2. 发现问题和规律:通过描述性统计分析,我们可以发现数据中的异常值、缺失值等问题,从而及时采取措施进行修复;同时,还可以发现数据中的规律和趋势,为后续的分析和决策提供依据。
实验三、描述性统计分析实验报告上海对外贸易学院实验报告⼀、实验⽬的和要求1.熟练掌握描述性统计分析的基本原理2.熟练掌握频数分析原理、SPSS操作及案例分析3.熟练掌握基本描述统计量原理、SPSS操作及案例分析4.熟练掌握探索性分析原理、SPSS操作及案例分析5.熟练掌握原理交叉列联表原理、SPSS操作及案例分析6.熟练掌握多选项分析的SPSS操作及案例分析⼆、实验内容及结果分析1.频数分析(数据⽂件:3-studentscore.sav)(1)完成各门成绩的统计结果(抓图后复制到下⾯)图1分析解释:(2)完成语⽂成绩区间频度分布表(抓图后复制到下⾯)图2分析解释:(3)计算全部学⽣各门成绩的平均值、标准差、极差和四分位数(抓图后复制到下⾯)图3分析解释:2.基本描述统计量(数据⽂件:3-studentscore.sav)计算全部学⽣各部门成绩的平均值、标准差、最⼤值和最⼩值(抓图后复制到下⾯)图4分析解释:3.探索性分析(数据⽂件:3-studentscore.sav)(1)完成语⽂成绩茎叶图和箱图(抓图后复制到下⾯)图5分析解释:图6分析解释:(2)语⽂成绩正态分布检验的Q-Q概率图(抓图后复制到下⾯)(数据⽂件:4-Explore.sav)图7分析解释:(3)完成考察学⽣“英语”、“数学”、“语⽂”三门课程成绩的分布、极端值以及正态分布性和⽅差的齐性。
(抓图后复制到下⾯)图8分析解释:4.交叉列联表分析(数据⽂件:4-crosstabulation.sav)(1)⼆维交叉列联表(P64,抓图后复制到下⾯)图9分析解释:(2)X2检验结果(P671,抓图后复制到下⾯)图10分析解释:三、思考题(P79-P80)完成思考题3、4,并将关健图抓下来粘贴到相应题下⾯,并进⾏简单的解释。
四、学完“描述性统计分析”章节后的收获。
第三章描述性统计分析3.1 3.23.4相关概念集中趋势的数据描述表示分布形状的统计量3.3离散趋势的数据描述3.2.1 表示集中趋势的统计量均值(Mean )•均值是所有观测值的平均数,SAS 系统中的均值主要指的是算术平均数。
表示为:nx x x n x n ni i +⋯⋯+==∑=111•n :样本含量•x i :观测值中位数(Median 或Med )•中位数的计算方法是:首先将数据从小到大排序为:x (1),...,x (n) ,然后计算⎪⎪⎩⎪⎪⎨⎧+=++为偶数为奇数中位数n x x n x n n n )(21)12()2()21(•如果n 为奇数,中位数是处于正中心位置的数据;•如果n 为偶数,中位数是处于正中心位置的二项数据的平均数。
例如:一单位6人,其中5个员工和1个经理,月薪分别:300,400,500,400,300,50000元月薪均值:8650元中位数:400元!!•中位数不受个别极端数据的影响,具有稳健性。
比均值更能代表数据的集中趋势。
优点•其它值比中位数大多少或少多少,无法反映出来。
•当样本量比较小时,中位数不太稳定。
缺点众数(Mode)•观测值中出现次数最多的数称为众数。
在属性变量分析中,常需要考虑频数,因此众数用的比较多。
百分位数(Percentile)将观测值按从小到大顺序排列,k百分位数(k-percentile),是指有k%的观测值小于这个k百分位数0.5分位数就是中位数Q10.25分位数常称为下四分位数,记为Q1Q30.75分位数常称为上四分位数,记为Q3Q3-Q1表示中间50%的观测值,它排除了两边极端值的影响,具有很好的稳定性。
•百分位数,是一个位置指标,描述数据分布和位置的统计量。
3.2.2 PROC MEANS 分析实例其中:–统计关键字列表:指定要计算的统计量,省略此项,过程会自动计算观测数、均值、标准差、最大值、最小值5个统计量。
–分析变量列表:指定所要分析的所有变量,多个变量之间用空格隔开。
《统计学原理》国开(电大)形成性考核答案集第一章统计学导论1.1 统计学的定义与应用问题1: 统计学的定义是什么?{统计学是研究数据收集、整理、分析和解释的科学,旨在通过量化的方法来揭示和理解现象的规律性和内在联系。
}问题2: 统计学在哪些领域中有应用?{统计学在众多领域中都有应用,包括但不限于经济学、生物学、医学、工程学、心理学、社会科学和商业管理等。
}1.2 统计数据的类型问题3: 定量数据和定性数据的区别是什么?{定量数据是数值化的,可以进行数学运算的数据,而定性数据则是非数值化的,通常表现为类别或属性。
}1.3 统计数据的来源问题4: 描述性统计和推理性统计的区别是什么?{描述性统计旨在对数据进行总结和描述,而推理性统计则通过样本数据来对总体进行推断和预测。
}第二章数据的收集与整理2.1 调查问卷设计问题5: 如何设计一个有效的调查问卷?{设计有效的调查问卷需要明确调查目的,选择合适的调查方法,确保问题的清晰性和逻辑性,避免引导性问题,并考虑隐私和伦理问题。
}2.2 数据整理与图表展示问题6: 什么是频数和频率分布表?{频数是指某个数值出现的次数,频率分布表则是将数据按照一定的区间分组,列出每个组的频数和频率。
}第三章描述性统计分析3.1 频数与频率分布问题7: 如何计算累积频率?{累积频率是指将数据从小到大排序后,从最小值开始累加各个数值的频率,直到该累计频率达到或超过某个指定的概率。
}3.2 统计量度问题8: 什么是众数、中位数和平均数?{众数是一组数据中出现次数最多的数值,中位数是将数据从小到大排列后位于中间位置的数值,平均数则是所有数值加和后除以数值的个数。
}3.3 离散程度的度量问题9: 方差和标准差的定义是什么?{方差是衡量数据分布离散程度的统计量,它是各个数值与其平均数差值的平方的期望值;标准差是方差的平方根,用于衡量数据分布的离散程度。
}第四章推理性统计分析4.1 概率论基础问题10: 什么是随机变量和概率分布?{随机变量是一个将试验的所有可能结果映射到实数上的函数,概率分布则是描述随机变量取各种可能值的概率。