《统计学》重点归纳(20200625174335)
- 格式:docx
- 大小:48.08 KB
- 文档页数:14
统计学原理与实务各章节复习知识点归纳(考试复习资料精华版-根据历年考试重点以及老师画的重点原创整理)第一章总论重点在“第三节:统计学中的基本概念”考点一:掌握以下四组概念(含义及举例)——肯定考一个名词解释!①总体、总体单位(统计)总体:是由客观存在的,具有某种共同性质的许多个别事物构成的整体。
总体单位:构成总体的个别事物。
②标志、标志值及分类标志:说明总体单位特征的名称。
分类:Ⅰ按性质不同a.品质标志:说明总体单位的品质特征,一般用文字表现。
(有些品质标志虽然以数量表现,但实质表现产品质量差异。
例如产品质量的具体表现未“一等、二等、三等”。
)b.数量标志:说明总体单位的数量特征。
只能用数值来表现。
Ⅱ按变异情况可变标志:当一个标志在各个总体单位表现不尽相同时称为可变标志不变标志:……都相同……不变标志。
标志值:标志的具体表现。
③变量、变量值变量:指数量标志。
变量值:指数量标志值,具有客观存在性。
④指标的含义及分类(统计)指标:是综合反映统计总体某一数量特征的概念和数值,简称指标。
a.按其反映总体现象内容不同:数量指标(绝对数,绝对指标,总量指标),质量指标(相对数或平均数,相对指标和平均指标)。
b.按其作用不同:总量指标,相对指标和平均指标。
c.按反映的时间特点不同:试点指标和时期指标d.计量单位的特点:实物指标、价值指标和劳动指标。
★指标和标志的区别与联系:区别:①标志是说明总体单位特征的名称;指标是说明总体的数量特征;②标志既有反映总体单位数量特征的,也有反映总体单位品质特征;而指标只反映总体的数量特征;③凡是统计指标都具有综合的性质,而标志一般不具有。
联系:①许多指标由数量标志值汇总而得;②指标与数量标志可随统计研究目的而改变;课后习题:社会经济统计学研究对象的特点是:数量性、总体性、变异性。
统计研究运用的方法主要包括:大量观察法、统计分组法、综合指标法、统计模型法标志值就是标志表现。
第二章统计调查考点一:统计报表的分类①填报内容和实施范围:国家、部门和地方统计报表②调查范围:全面、非全面③报送周期长短:日报、旬报、月报、季报、半年报和年报④填报单位:基层、综合报表考点二:“普查”的含义普查:是普遍调查的简称。
统计学知识点汇总一、统计学统计学是一门关于数据资料的收集、整理、分析和推断的科学。
二、统计学的产生与发展(1)政治算术学派最早的统计学源于17世纪英国。
其代表人物是威廉·配第,代表作《政治算术》。
政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,为统计学的发展开辟了广阔的前景。
其被称为“无统计学之名,有统计学之实”。
(2)记述学派亦称国势学派,创始人和代表人物是德国康令和阿亨瓦尔,主要使用文字记述方法对国情国力进行研究,其学科内容与现代统计学有较大差别。
因此被称为“有统计学之名,无统计学之实”。
(3)社会统计学派创始人和代表人物,德国恩格尔和梅尔。
该学派主张统计是实质性的研究社会现象的社会科学,认为统计学的研究对象是社会现象,目的在于明确社会现象内部的联系联系和相互关系。
(4)数理统计学派创始人是比利时统计学家凯特勒,他所著的代表作《社会物理学》等将概率论和统计方法引入社会经济方面的研究,其认为统计学是一门通用的方法论科学。
从19世纪中叶到20世纪中叶,数理统计学得到迅速发展。
到20世纪中期,数理统计学的基本框架已经形成,数理统计学派成为英美等国统计学界的主流。
三、统计的特点(1)数量性:社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。
(2)总体性:社会经济统计的认识对象是社会经济现象的总体的数量方面。
例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。
(3)具体性:社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。
这是统计与数学的区别。
(4)社会性:社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。
四、统计工作过程(1)统计设计根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。
基本统计方法第一章 概论1. 总体(Population ):根据研究目的确定的同质对象的全体(集合);样本(Sample ):从总体中随机抽取的部分具有代表性的研究对象。
2. 参数(Parameter ):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量(Statistic ):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。
3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。
第二章 计量资料统计描述1. 集中趋势:均数(算术、几何)、中位数、众数2. 离散趋势:极差、四分位间距(QR =P 75-P 25)、标准差(或方差)、变异系数(CV )3. 正态分布特征:①X 轴上方关于X =μ对称的钟形曲线;②X =μ时,f(X)取得最大值;③有两个参数,位置参数μ和形态参数σ;④曲线下面积为1,区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。
4. 医学参考值范围的制定方法:正态近似法:/2X u S α±;百分位数法:P 2.5-P 97.5。
第三章 总体均数估计和假设检验1. 抽样误差(Sampling Error ):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。
抽样误差不可避免,产生的根本原因是生物个体的变异性。
2. 均数的标准误(Standard error of Mean, SEM ):样本均数的标准差,计算公式:X σσ=误差的大小。
3. 降低抽样误差的途径有:①通过增加样本含量n ;②通过设计减少S 。
4. t 分布特征:①单峰分布,以0为中心,左右对称;②形态取决于自由度ν,ν越小,t 值越分散,t 分布的峰部越矮而尾部翘得越高;③当ν逼近∞,X S 逼近X σ, t 分布逼近u 分布,故标准正态分布是t分布的特例。
统计学重点部分归纳 Document serial number【KKGB-LBS98YT-BS8CB-BSUT-BST108】第三章全距也称极差,是一组数据的最大值与最小值之差。
R=最大值-最小值组距分组数据可根据最高组上限 -最低组下限计算。
四分位数:数据按大小顺序排序后把分割成四等分的三个分割点上的数值。
SPSS中四分位数的位置为(n+1)/4, 2(n+1)/4, 3 (n+1)/4。
Excel中四分位数的位置分别为(n+3)/4, 2(n+1)/4,(3 n+1)/4。
如果四分位数的位置不是整数,则四分位数等于前后两个数的加权平均。
四分位距等于上四分位数与下四分位数之差IQR=Q3-Q1反映了中间50%数据的离散程度,数值越小说明中间的数据越集中。
不受极端值的影响。
可以用于衡量中位数的代表性。
方差是一组数据中各数值与其算术平均数离差平方的平均数,标准差是方差正的平方根。
是反映定量数据离散程度的最常用的指标。
离散系数:标准差与其相应的均值之比,表示为百分数。
特点:(1)反映了相对于均值的相对离散程度;(2)可用于比较计量单位不同的数据的离散程度;(3)计量单位相同时,如果两组数据的均值相差悬殊,离散系数可能比标准差等绝对指标更有意义数据分布的不对称性称作偏态。
偏态系数就是对数据分布的不对称性(即偏斜程度)的测度。
峰度:数据分布的扁平或尖峰程度。
峰度系数:数据分布峰度的度量值,对数据分布尖峰或扁平程度的测度,一般用K表示。
箱线图用于描述数据分布特征的一种图形。
最简单的箱线图可以根据数据的最大值、最小值和三个四分位数绘制的:先根据三个四分位数Q1、Q2、Q3画出中间的盒子,然后由盒子两端分别向最大、最小值连线。
在SPSS中标准的箱线图一般是这样绘制的:先根据三个四分位数Q1、Q2、Q3画出中间的盒子;由Q3至Q3+*IQR区间内的最大值向盒子的顶端连线,由Q1至*IQR区间内的最小值向盒子的底部连线;处于Q3+*IQR至Q3+3*IQR或者 *IQR至Q1-3*IQR范围内的数据用圆圈标出;大于Q3+3*IQR或者小于Q1-3*IQR的用星号标出。
统计学知识点梳理统计学是一门研究数据收集、整理、分析和解释的学科,它在各个领域都有着广泛的应用。
从科学研究到商业决策,从社会调查到医疗保健,统计学的方法和理论都发挥着重要的作用。
下面让我们来梳理一下统计学中的一些关键知识点。
一、数据的类型数据可以分为定性数据和定量数据。
定性数据是描述事物性质或特征的数据,例如性别、职业、颜色等,通常用类别或标签来表示。
定量数据则是可以用数字来衡量的数量数据,如身高、体重、年龄等,又可以进一步分为离散数据和连续数据。
离散数据只能取有限个或可数个值,比如班级里的学生人数;连续数据可以在某个区间内取任意值,例如时间、温度等。
二、数据收集数据收集是统计学的第一步。
常见的数据收集方法包括普查、抽样调查和实验。
普查是对研究对象的全体进行调查,能够获得全面准确的信息,但往往成本高、耗时长。
抽样调查则是从总体中抽取一部分样本进行调查,通过合理的抽样方法,可以用样本数据来推断总体特征。
抽样方法有简单随机抽样、分层抽样、系统抽样等。
实验是在控制条件下对研究对象进行观察和测量,以探究因果关系。
三、数据整理收集到的数据通常需要进行整理,以便于分析。
整理数据的方法包括数据分组、编制频数分布表和绘制统计图等。
数据分组是将数据按照一定的规则分成若干组,以便观察数据的分布特征。
频数分布表可以直观地展示每个组的数据个数,而统计图如直方图、折线图、饼图等则能更形象地呈现数据的分布和趋势。
四、描述性统计描述性统计是对数据的集中趋势、离散程度和分布形态进行描述和概括。
集中趋势的度量指标包括均值、中位数和众数。
均值是所有数据的算术平均值,容易受到极端值的影响;中位数是将数据排序后位于中间位置的数值,对极端值不敏感;众数是数据中出现次数最多的数值。
离散程度的度量指标有方差、标准差和极差。
方差和标准差反映了数据的离散程度,标准差是方差的平方根;极差则是数据中的最大值与最小值之差。
分布形态可以通过偏态和峰态来描述。
统计学第一章导论1.1.1什么是统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
数据分析所用的方法分为描述统计方法和推断统计方法。
1.2统计数据的类型1.2.1分类数据、顺序数据、数值型数据按照所采用的计算尺度不同,可以将统计数据分为分类数据、顺序数据、数值型数据。
分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表示。
例如:支付方式、性别、企业类型等。
顺序数据:只能归于某一有序类别的非数字型数据。
例如:员工对改革措施的态度、产品等级、受教育程度等。
数值型数据:按数字尺度测量的观测值,其结果表现为具体的数值。
例如:年龄、工资、产量等。
统计数据大体上可分为品质数据(定性数据)和数量数据(定量数据、数值型数据)。
1.2.2观测数据和实验数据按照统计数据的收集方法,可以分为观测数据和实验数据。
观测数据:通过调查或观测而收集的数据。
例如:降雨量、GDP、家庭收入等。
实验数据:在实验中控制实验对象而收集到的数据。
例如:医药实验数据、化学实验数据等。
1.2.3截面数据和时间序列数据按照被描述的现象与时间的关系,可分类截面数据和时间序列数据。
截面数据:在相同或近似相同的时间点上收集的数据。
例如:2012年我国各省市的GDP。
时间序列数据:同一现象在不同的时间收集的数据。
例如:2000-2012年湖北省的GDP。
1.3.1总体和样本总体:包含所研究的全部个体(数据)的集合。
样本:从总体中抽取的一部分元素的集合。
1.3.2参数和统计量参数:用来描述总体特征的概括性数字度量。
统计量:用类描述样本特征的概括性数字度量。
例如:某研究机构准备从某乡镇5万个家庭中抽取1000个家庭用于推断该乡镇所有农村居民家庭的年人均纯收入。
这项研究的总体是5万个家庭;样本是1000个家庭;参数是5万个家庭的人均纯收入;统计量是1000个家庭的人均纯收入。
第二章数据的搜集2.1数据的来源2.1.1数据的间接来源间接来源的数据:如果与研究内容有关的原信息已经存在,我们只是对这些原信息重新加工、整理,使之成为我们进行统计分析可以使用的数据。
统计学知识点总结第2章统计描述1. 对定量资料进⾏统计描述时,如何选择适宜的指标?定量资料统计描述常⽤的统计指标及其适⽤场合描述内容指标意义适⽤场合平均⽔平均数个体的平均值对称分布⼏何均数平均倍数取对数后对称分布中位数位次居中的观察值①⾮对称分布;②半定量资料;③末端开⼝资料;④分布不明众数频数最多的观察值不拘分布形式,概略分析调和均数基于倒数变换的平均值正偏峰分布资料变异度全距观察值取值范围不拘分布形式,概略分析标准差(⽅差)观察值平均离开均数的程度对称分布,特别是正态分布资料四分位数间距居中半数观察值的全距①⾮对称分布;②半定量资料;③末端开⼝资料;④分布不明变异系数标准差与均数的相对⽐①不同量纲的变量间⽐较;②量纲相同但数量级相差悬殊的变量间⽐较定性资料:阳性事件的概率,概率分布,强度和相对⽐。
2. 应⽤相对数时应注意哪些问题?答:(1)防⽌概念混淆相对数的计算是两部分观察结果的⽐值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。
(2)计算相对数时分母不宜过⼩样本量较⼩时以直接报告绝对数为宜。
(3)观察单位数不等的⼏个相对数,不能直接相加求其平均⽔平。
(4)相对数间的⽐较须注意可⽐性,有时需分组讨论或计算标准化率。
3. 常⽤统计图有哪些?分别适⽤于什么分析⽬的?常⽤统计图的适⽤资料及实施⽅法图形适⽤资料实施⽅法条图组间数量对⽐⽤直条⾼度表⽰数量⼤⼩直⽅图定量资料的分布⽤直条的⾯积表⽰各组段的频数或频率百分条图构成⽐⽤直条分段的长度表⽰全体中各部分的构成⽐饼图构成⽐⽤圆饼的扇形⾯积表⽰全体中各部分的构成⽐线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势,表⽰两现象间的相关关系箱式图定量资料取值范围⽤箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布⽤茎表⽰组段的设置情形,叶⽚为个体值,叶长为频数第3章概率分布1. 服从⼆项分布及Poisson分布的条件分别是什么?⼆项分布成⽴的条件:①每次试验只能是互斥的两个结果之⼀;②每次试验的条件不变;③各次试验独⽴。
统计学复习重点第一章统计数据信息处理的方法:1.描述统计方法;2.推断统计方法统计数据的含义:统计数据工作、统计资料、统计学政治算数学派:威廉。
配第;国势学派:康令;数理统计学派:凯特勒统计数据研究的对象具备如下特点:1.数量性2.具体性3.总体性4.社会性统计工作的基本任务:服务与监督基本方法:1.大量观察法 2.综合指标法 3.统计数据分组法总体:即统计总体,是指客观存在的、在同一性质基础上结合起来的许多个别事物的整体总体单位:形成统计数据总体的个别单位标志:表明总体单位特征的名称品质标志:表明总体单位质的特征,用属性则表示数量标志:说明总体单位量的特征,用数量表示,数量标志的具体体现:标志值指标:表明总体的综合数量特征。
1.按结构分后:指标名称、指标数值2.按内容分:数量指标(绝对数)、质量指标(相对数、平均数)标志与指标的联系和区别:区别:1.标志(指数量标志)不一定经过汇总,可直接取得;而指标(指数量指标)一定经过汇总就可以获得。
2.标志一般不具备时间、地点等条件;但完整的统计指标一定要讲明时间、地点、范围联系:1.有些数量标志值汇总可以获得指标的数值。
既可以指总体各单位标志量的总和,也可以指总体单位数的总和2.数量标志与指标之间存在变换关系。
随着统计目的的改变,如果原来的总体单位变成了统计总体,则与之相对应的数量标志就成了统计指标变异:就是标志在各总体单位具体表现的差异——通常意义上的变异;严苛说道,变异指品质标志的不同表现变量:指气门的数量标志。
变量的具体内容数值整体表现即为变量值(线性变量、连续变量)统计指标体系:研究社会经济现象的一系列相互联系的统计指标为统计指标体系流量:即为一定时期内生产的产品和劳务而获得的总收入或开支的总量。
就是时期指标。
存量:即某一时点上过去生产与积累起来的产品、货物、存储、资产负债的结存数。
是时点的指标。
流量之比、存量之比及流量与存量之比既不是流量也不是存量。
统计学重点知识归纳总结统计学是一门研究数据收集、分析、解释和呈现的学科。
它在各个领域都有广泛的应用,包括经济学、医学、社会科学等。
本文将对统计学的重点知识进行归纳总结,帮助读者更好地理解和应用统计学。
一、概率论基础概率论是统计学的基础,它研究的是随机现象发生的概率。
在概率论中,我们常用到以下几个重要的概念和定理:1. 事件与概率:事件是指试验的某种结果,概率是该事件发生的可能性大小。
概率的基本性质包括非负性、规范性和可列可加性。
2. 条件概率与独立性:条件概率是指事件A在另一事件B已经发生的条件下发生的概率。
两个事件A和B是独立的,当且仅当它们的联合概率等于各自的概率的乘积。
3. 随机变量与概率分布:随机变量是指随机试验结果的数值表示。
离散随机变量的概率分布通过概率质量函数来描述,连续随机变量的概率分布则通过概率密度函数来描述。
4. 期望和方差:随机变量的期望是其取值与其概率的乘积的总和。
方差衡量了随机变量离其期望值的偏离程度。
二、抽样与估计抽样是指从总体中选择一部分个体进行观察和测量的过程。
统计学中,我们常使用的抽样方法包括简单随机抽样、系统抽样和分层抽样等。
1. 抽样分布和抽样误差:当样本容量足够大时,样本的统计量(如均值和比例)的分布接近正态分布。
抽样误差是样本统计量与总体参数之间的差异。
2. 置信区间:置信区间是对总体参数的一个范围估计。
一般情况下,置信区间使用样本统计量和抽样分布来计算。
3. 抽样分布的中心极限定理:中心极限定理指出,当样本容量足够大时,样本均值的分布接近正态分布,且均值的期望等于总体均值。
4. 参数估计:利用样本数据来估计总体参数的值。
常用的参数估计方法包括最大似然估计和最小二乘估计。
三、假设检验与推断假设检验是统计学中的一种方法,用于判断总体参数是否符合某个特定的假设。
推断统计学是基于样本数据对总体特征进行推断的过程。
1. 假设检验的步骤:假设检验的步骤包括建立原假设和备择假设、选择显著性水平、计算检验统计量和进行决策。
1、统计(d e)含义(1)统计工作:即统计实践,是指很据科学(de)方法从事统计设计、收集、整理、分析研究和提供各种统计资料和统计咨询意见(de)活动(de)总称.其成果是统计资料(原始调查资料和加工处理后(de)系统资料);(2)统计资料:即统计工作过程中所获得(de)各种有关数字资料以及与之相关(de)其他资料(de)总称.通常以统计表、统计图和统计报告(de)形式变现,用以反映社会经济现象(de)规模、水平、速度、结构和比例关系等信息(de)数字和文字资料;(3)统计科学:即统计理论,是指统计工作实践(de)理论概括和科学总结.2、统计学统计学:是一门搜集、整理、分析数据方法(de)科学,其目(de)是探索数据(de)内在数量规律性,以达到对客观事物(de)科学认识.3、统计学(de)研究对象统计学研究(de)对象是:社会经济现象总体(de)数量特征和数量关系.其根本特征:在质与量(de)辩证统一中,研究大量社会经济现象总体(de)数量方面,反映社会现象发展变化(de)规律性在具体时间、地点和条件下(de)数量表现,揭示事物(de)本质、相互联系、变动规律和发展趋势.4、统计学研究特点数量性、总体性、具体性、社会性5、统计工作(de)过程及基本职能统计工作(de)过程:统计设计、统计调查、统计整理、统计分析(定性—定量—定性:循环往复)统计设计:指根据统计研究对象(de)特点和研究(de)目(de)、任务,对统计工作(de)各个方面和各个环节(de)通盘考虑和安排,是统计认识过程(de)第一个阶段,即定性认识(de)阶段;统计调查:指根据统计研究对象和目(de)要求,依据统计设计(de)内容、指标和指标体系(de)要求,有计划、有目(de)、有组织(de)收集原始资料(de)工作过程,即由定性到定量认识(de)阶段;统计整理:指根据统计研究(de)目(de),将统计调查得到(de)原始资料和通过各种方法得到(de)次级资料进行科学(de)分类和汇总,使其条理化、系统化(de)工作过程,即为统计分析准备在一定程度上可以反映总体特征(de)统计资料;统计分析:指在统计整理(de)基础上,根据研究(de)目(de)和任务,应用各种科学(de)统计方法,从静态和动态两个方面对研究对象(de)数量方面进行计算、分析研究,认识和揭示所研究对象(de)本质和规律性,做出科学(de)结论,进而提出建议和可预测性(de)意见(de)工作过程,即从定量到定性深入认识(de)阶段.统计工作(de)基本职能:信息、咨询、监督6、统计学研究(de)基本方法大量观察法、统计分组法、综合指标法、时间数列分析法、指数法、抽样推断法、相关分析法.7、统计学(de)基本概念(1)总体:指客观存在(de),有性质相同(de)许多个别事物组成(de)整体;(2)总体单位:指组成总体(de)许多性质相同(de)个别事物,简称单位/个体;(3)标志:用于说明总体单位特征(de)名称或概念,有数量标志和品质标志之分;(4)标志表现:标志特征在各单位(de)具体体现,数量标志表现为具体(de)数值,品质标志表现为对特征加以描述(de)文字;(5)统计指标:用于说明总体数量特征(de)名称或概念及数值:一个完整(de)统计指标包括指标名称、指标数值、指标计量单位、计算方法、指标所属(de)时间和空间等因素;(6)统计总体(de)特征:同质性、大量性、差异性(7)统计指标(de)特点:数量性、综合性、具体性(8)统计总体与总体单位关系:不是固定不变(de),而是相对(de)概念,根据研究(de)目(de)和研究对象(de)变化而变化(de):即总体可能为单位,单位也可能为总体(9)指标和标志关系:指标和标志是一对相对(de)概念,分别对应与统计总体和统计总体单位,用于反映各自(de)数量特征,二者既有区别,又有联系.区别:指标用于反映总体数量特征,是具体(de)量,不论数量指标还是质量指标,其具体表现都是数值;标志用于反映总体单位特征,数量标志以数值表示为一定(de)量,但品质标志只能用适当(de)文字来表达.联系:统计指标是建立在标志表象(de)基础上,它是由各个总体单位(de)标志表现加总而来,没有总体单位(de)标志表现,就不可能有总体(de)指标值.(10)指标(de)分类指标(de)表现形式:总量指标、相对指标、平均指标总体现象(de)内容:数量指标、质量指标现象(de)时间状况:静态指标、动态指标数据(de)取值依据:客观指标、主观指标(11)数量指标:指反映社会经济现象(de)规模大小或数量多少(de)统计指标,一般表现为:总量指标、绝对数(12)质量指标:表明总体内部构成、比例、发展速度和一般水平等(de)指标,一般表现为相对指标和平均指标,其数值表现为相对数和平均数.(13)统计变异:指统计总体中各单位之间存在(de)差异和同一总体在不同时间上(de)差异(14)统计变量:现象本身所固有(de)随条件变化而变化(de)量,变量值是变量(de)具体数值表现;(15)连续变量与离散变量:依据变量值是否连续来划分,相邻两个变量值之间是否可以连续分割得到新(de)变量值8、统计调查(de)类型调查对象包含(de)范围:全面调查(统计报表和普查)、非全面调查调查登记(de)时间是否连续:经常性调查、一次性调查调查(de)组织形式:一般调查(统计报表制度)、专门调查9、调查对象:指要对其进行调查研究(de)现象(de)总体,由许多性质相同(de)个别单位组成10、调查单位:构成调查对象(de)总体单位,在某项调查中登记其具体特征(de)单位,即调查项目(de)直接承担者11、调查项目:即调查内容,确定登记调查单位(de)特征(标志)12、报告单位:即填报单位,向上报告调查内容,提交调查资料(de)单位13、调查时间:调查资料所属(de)时间,时期现象(起讫时间)、时点现象(统一标准时间);调查期限:调查工作(de)时限,从调查准备开始到收集递交资料直至报告完毕(de)整个调查过程所需时间.14、统计调查方案(de)设计过程(1)确定调查目(de)和任务(2)确定调查对象和调查单位(3)确定调查项目(4)确定调查时间、调查期限、调查空间、调查方法(5)调查(de)组织工作15、统计调查收集资料(de)方式(1)统计报表:指依照国家有关法律规定,自上而下(de)统一布置,自下而上(de)逐级定期提供基本资料(de)一种统计报告制度.a)特点:保证统计资料(de)统一性和时效性;统计指标比较系统,所得到(de)资料较为全面,真实可靠;具有周期性,相对稳定b)作用:用于研究现象发展变化(de)趋势和规律性;逐级汇总递交可以满足各级部门对统计资料(de)需要c)局限性:受主观影响大,由于虚报瞒报而影响报表资料(de)质量;周期过于频繁会加重基层负担(2)普查:指专门组织(de)一次性全面调查,用于调查在一定时点上社会经济现象(de)总量.a)特点:全面性、专门性、一次性b)作用:用于掌握某些关系国情国力(de)重大事件(de)准确而全面(de)数据,并为抽样调查提供抽样框,搜集更多更全面(de)信息c)局限性:由于耗费人力、物力、财力过大,不易进行经常性调查(de)实施(3)抽样调查:指按照随即原则从总体中选取一部分单位作为样本进行观察,然后根据所获得(de)样本数据,对调查对象总体(de)特征值作出具有一定可靠程度(de)估计和推算.(抽样估计、抽样推断)a)特点:依据随机性原则从总体中抽取样本单位;依据部分调查资料对总体(de)数量特征进行估计;抽样误差可以事先计算并加以控制.(耗费少、准确度高、干扰少)b)作用:用样本来推断总体数量特征c)局限性:调查对象总体范围大,单位数目多时;不必要进行全面调查时;具有破坏性(de)调查;用于检查和修正全面调查资料时(4)重点调查:指在调查对象中选择一部分重点单位作为代表进行(de)非全面调查a)特点:耗费少,调查单位少,可以快速取得总体情况,调查资料(de)收集灵活详细b)作用:用于了解总体(de)基本情况c)局限性:不需要了解总体(de)全面情况,仅了解总体基本情况;总体中存在重点单位,即标志值总量在全部单位标志总量中占据重大比例(de)单位(5)典型调查:指在对多研究(de)现象进行分析(de)基础上,有意识(de)选择若干个具有代表性(de)典型单位而进行(de)深入细致(de)调查a)特点:选择有目(de),有意识性,调查单位少,便于做深入细致(de)研究,资料细致全面,但主观性大b)作用:用于研究新生事物,探索其发展方向,形成预见,并加以推广;研究同类事物发展变化(de)一般规律和趋势;总结经验教训;补充全面调查(de)不足,估计总体数量特征,验证全面调查(de)真实性c)局限性:不能确定推断(de)把握程度,估计误差无法衡量;典型单位(de)选取必须对总体具有充分(de)代表性,同时要根据研究(de)目(de)和调查对象(de)不同特点来选取调查类型16、统计调查(de)误差:指统计调查所得到(de)统计数据与统计总体(de)实际数量之间(de)差别.包括登记性误差和代表性误差.登记性误差:调查误差,记录错误、计算错误、汇总错误及调查者虚报等;代表性误差(仅存在于非全面调查中):系统性误差(未遵循随即原则导致(de)偏差)和抽样误差(由于抽样(de)随机性导致(de)误差)17、统计分组:指根据统计研究(de)目(de)和社会经济现象(de)特点,按照一个或几个标志将统计总体区分为性质不同(de)若干个组成部分(de)一种统计方法18、统计分组(de)基本原则:穷尽性原则和互斥性原则19、统计分组(de)作用区分社会经济现象(de)性质和不同类型;反映现象总体(de)内部结构;分析现象之间(de)依存关系20、统计分组(de)种类品质标志分组和数量标志分组(分组标志性质);简单分组和复合分组(一个/多个)复合标志更能深入反映总体(de)内部结构,有利于更细致(de)分析问题21、分组标志选择(de)依据(1)依据研究问题(de)目(de)和任务(2)在若干同类标志中,选择最能反映问题本质(de)标志进行分组(3)结合研究对象所处(de)具体历史经济条件,采用具体问题具体分析(de)方法选择分组标志22、统计分组(de)关键:选择分组标志和正确(de)划分各组之间(de)界限23、分配数列:指在统计分组(de)基础上,将总体(de)所有单位按组分类整理,计算各组(de)(de)单位数,并按照组顺序加以排列所形成(de)反映总体单位总数在各组分配情况(de)次数分布.(次数分配、分布数列)24、统计表(de)表式结构:总标题、横行标题、纵栏标题、指标数值25、总量指标:指反映现象在一定时间、地点和条件下总规模、总水平和工作总量(de)一种统计指标,即绝对数指标.(总量、增减量)26、总量指标(de)种类按其反应总体总量(de)内容:总体单位总量(唯一性)、总体标志总量(多个)按反应现象(de)时间状况:时期指标、时点指标(各期数值可否直接加总、指标值(de)大小与时期长短直接相关与否、是否连续登记取得指标值)按计量单位:实物量指标、价值量指标27、总量指标(de)作用(1)总量指标是认识现象总体特征(de)起点(2)总量指标是实行各项管理工作(de)基本依据(3)总量指标是计算相对数和平均数(de)基础(4)总量指标属于绝对数指标数值,其大小随着总体范围(de)大小和观察时期(de)长短而发生增减变化,不能深入反映现象发展变化(de)程度与差别28、相对指标:指两个有联系(de)现象(de)数值对比(de)结果,用于反映事物间在数量上相互联系(de)形式和程度,又称为相对数.(同一总体或不同总体)29、相对指标(de)作用(1)相对指标可以反映现象(de)发展程度、密度、结构、强度、普遍程度或比例关系,为人们认识事物发展(de)质量与现状提供依据(2)相对指标可以使某些不能直接对比(de)现象找到可比(de)基础,从而准确(de)现象之间(de)差异程度30、相对指标(de)类型及各自(de)作用(1)比重相对数:结构相对指标,即利用分组(de)方法,将同一总体区分为性质不同(de)若干部分,以部分数值与总体数值对比而得(de)比重或比率.(部分/总体)作用:分析事物(de)内部结构,从而反映事物(de)性质和特征,以及事物发展(de)不同阶段和量变引起(de)质变(de)过程;反映事物总体(de)质量和工作质量及资源有效利用情况.(2)比例相对数:即总体中各部分数值对比而得到(de)用于反映总体(de)各部分之间(de)数量联系程度(de)比例关系(de)相对指标.(部分/部分)作用:用于反映总体内部各部分(de)实际数量上(de)比例关系,判断内部结构(de)协调程度,从而为制定政策和计划提供依据(3)动态相对数:指同一现象不同时间上(de)指标值之比,即报告期与基期(de)指标值之比,用于反映现象在时间上(de)变动方向和程度.(报告期水平/基期水平)(4)强度相对数:指两个性质不同但有一定联系(de)总量指标之比.(总体/总体)作用:说明现象(de)强弱程度,从而反映一个国家或地区(de)经济发展水平(de)高低和经济实力(de)强弱;反映现象(de)密度和普遍程度;反映社会生产活动(de)条件和效果.(有名数/无名数)(正指标/逆指标)(5)计划完成程度指标:将现象在一定时期内(de)实际完成数与计划任务数对比得到(de)相对指标.(实际完成数/计划完成数{相对数/绝对数})两种形式:计划完成程度=(1+实际增长(de)%)/(1+计划增长(de)%)100%计划完成程度=(1—实际增长(de)%)/(1—计划增长(de)%)100%(多降低或提高了几个百分点)31、计算和运用总量指标(de)原则(1)主义现象(de)同类性(2)统计总量指标时要有明确(de)统计含义和合理(de)计算方法(3)统一(de)计量单位32、计算和应用相对指标(de)原则(1)正确选择选择对比(de)基数(2)合理应用相对指标(3)在统计分组(de)基础上,进行对比分析(4)多种相对指标综合应用(5)相对指标和绝对指标(de)结合应用33、平均指标:指在同质总体内,运用一定(de)方法将总体各单位在某一标志下(de)数量差异抽象化,以反映总体在一定时间、地点和条件下所达到(de)一般水平(de)综合统计指标.(统计均值或平均数)34、平均指标(de)特点(1)平均指标只在同质总体内计算(2)平均指标是一个代表性指标(3)平均指标属于内涵指标(质量指标),其大小不随总体范围(de)大小而增减35、平均指标(de)作用(1)平均指标可以用来进行对比分析(2)平均指标可以分析现象之间(de)依存关系(3)算术平均数可以反映总体分布(de)集中趋势.(中位数、众数)36、平均指标(de)分类数值平均数:算数、调和、几何平均数(简单/加权平均)分按计算方法位置平均数:中位数、众数类按考查内容:动态平均数、静态平均数37、统计平均数—数值平均数(1)算数平均数:总体标志总量/总体单位总量性质:各单位标志值与其算数平均数(de)离差之和为0;离差(de)平方之和为最小值缺陷:易受极端数值(de)影响,当变量数列呈偏态分布时,会引起算术平均数会发生偏移,其代表性就会严重降低.(2)调和平均数:变量值倒数(de)算术平均数(de)倒数,即倒数平均数(缺乏总体单位数(de)资料时)(3)几何平均数:变量值连乘积(de)项数方根.用于计算平均比率或平均速度38、统计平均数—位置平均数(1)中位数:是将总体各单位(de)标志值按大小顺序进行排列,处于中间位置(de)标志值,从而可以反映现象(de)一般水平中位数(de)确定:奇数项((N+1)/2);偶数项(两个居中(de)标志值(de)算术平均数)(2)众数:指数据分布中出现次数最多(de)数,即总体现象中出现次数最多(de)标志值,从而用于说明现象(de)一般水平.下限公式:M0=L+i[X1/(X1+X2)] (下限加上限减)X1:众数组次数与前一组次数之差;X2:众数组次数与后一组次数之差i:众数组组距,L:众数组(de)上限中位数和众数不受极端值(de)影响,较之于数值平均数,具有一定(de)稳定性39、标志变异指标:是反映总体各单位标志值分布特征(de)另一个重要综合指标,用以反映总体各单位标志值(de)差异程度,即反映分配数列中以平均数为中心(de)各标志值变动范围或离差程度,又称为标志变异度.40、标志变异指标(de)作用(1)标志变异指标可以衡量平均数(de)代表性高低(2)标志变异指标可以反映总体(de)稳定性和均衡性(3)标志变异指标可以反映总体标志值分布偏离正态分布(de)情况41、极差=最大标志值—最小标志值(最高组(de)上限—最低组(de)下限)42、仅考虑极端值,未考虑中间值(de)分布和影响,不能正确全面反映总体离散程度平均差(AD):总体中各标志值对其算数平均数(de)离差绝对值(de)算术平均数.(平均绝对离差)仅考虑总体中个各标志值(de)变异程度对总体变异程度(de)影响,不便于进行数理推导标准差:总体中各单位标志值与其算术平均数离差平方(de)平均数.方差:标准差(de)平方.变量对算数平均数(de)方差小于对任常数(de)方差43、是非标志(de)平均数(P)、方差(PQ)和标准差(均方根差)44、标志变异系数:绝对数或平均数形式(de)变异指标值/算术平均数 (离差系数)标准差系数:标准差与其算数平均数之比(de)相对数标志变异系数作用:消除数列平均水平高低对标志变异程度大小影响;反映不同水平不同性质(de)变量数列(de)变异程度.45、偏度:用于测定一个次数分布(de)非对称程度(de)统计指标.(左偏/负偏、右偏/正偏)相对于对称分布.偏态=算术平均数—众数算数平均数与众数之间(de)距离越远,实际分布(de)绝对偏态越大,表明次数分布(de)非对称程度越大.峰度:反映某个分布于正态分布相比尖峭程度(de)统计指标:正态分布、尖顶分布、平顶分布.46、时间序列分析:将同一空间、不同时间某一现象(de)统计指标数值,按时间先后顺序排列,即形成时间序列,即动态数列/时间数列.(现象所属(de)时间、与时间对应(de)统计指标数值)47、时间序列(de)种类,按统计指标(de)类型可分为三种:绝对数时间数列(时期数列、时点数列);相对数时间数列;平均数时间数列.48、时间数列(de)编制原则:时间长短统一、总体范围一致、指标(de)经济内容应统一、各指标值(de)计算方法、计算价格和计算单位都要统一49、时间序列(de)分析主要有:增量分析、平均分析、速度分析(1)增量分析:a)发展水平:时间数列中指标(de)每个数值,用以反映现象发展变化实际达到(de)规模、相对水平和一般水平.发展水平是时间数列中最基本(de)分析指标,是进行增量分析、平均分析和速度分析(de)基础.(最初水平、中间水平和最末水平)/(基期水平与报告期水平)b)增减量:报告期水平与基期水平之差.(逐期增减量与累计增减量)同比增减量=报告期水平—上年同期水平c)平均增减量:将逐期增减量(de)数量差异抽象化,用来说明现象在较长时期内平均每期增减数量(de)统计分析指标平均增减量=逐期增减量之和/逐期增长量(de)个数(2)平均分析:d)动态平均数:将时间序列中不同时间(de)发展水平加以平均而得到(de)平均数.(序时平均数、平均发展水平):消除现象在短期内偶然因素产生波动(de)影响,使时间数列更好(de)表现现象发展变化(de)趋势.:分为绝对数时间序列平均分析、相对数时间序列平均分析、平均数时间序列平均分析e)绝对数时期数列:简单算术平均数;绝对数时点数列:间隔相等(de)间断时点数列(假定指标值(de)变动均匀):首尾折半法,平均数=[(a0+a1)/2 +a2+a3+```+(an-1+an)/2]/n间隔不等(de)间断时点数列(加权序时平均):权数为各相邻时点(de)间隔长度f)相对数时间序列:两个绝对数时间序列(de)动态平均数之比g)平均数时间序列:静态平均数时间序列由两个绝对数时间序列相应项对比形成动态平均数:分子序列与分母序列(de)动态平均数之比(3)速度分析:a)发展速度:用相对数(de)形式表示(de)动态指标,是时间序列中两个不同时期发展水平对比(de)结果.发展速度=报告期水平/基期水平(定基发展速度/环比发展速度)同比发展速度=报告期水平/上年同期水平b)增长速度:用相对数形式表示(de)动态相对指标,是各期(de)增减量与基期发展水平(de)比值.增长速度=各期(de)增减量/基期水平增长速度=发展速度—1同比增长速度(年距增长速度)=同比增长量/上年同期水平c)平均发展速度:现象在一个较长时期内发展变化(de)平均程度,是各期环比发展速度(de)动态平均数.(水平法/累积法)平均增长速度:现象在一个较长时期内增长变化(de)平均程度平均增长速度=平均发展速度—1水平法(几何平均法):仅侧重于末期(de)发展速度(仅涉及到最初水平和最末水平)(最末一期(de)定基发展速度(de)均方根)50、长期趋势分析:指客观现象由于受某种基本因素(de)影响,在一段相当长(de)时间内,持续向上或向下发展变化(de)趋势.51、长期趋势分析(de)作用(1)研究现象在过去一段时间内(de)发展方向和趋势,以便认识和掌握现象发展变化(de)规律性(2)利用现象发展(de)长期趋势,可以对未来(de)情况作出预测(3)测定长期趋势,还可以将长期趋势从时间序列中分离出来,更好(de)研究季节变动和循环变动52、长期趋势测定(de)方法:时距扩大法、移动平均法、最小平方法53、最小平方法:直线趋势分析类似于价格离散率(de)计算(原序列(de)各实际值与趋势值(de)离差平方和最小)关键:时间序列号(de)择取,一般(0,1,2,3,4,5);简便(-3,-2,-1,1,2,3)54、季节变动(de)测定与分析:(按季/月平均法)(1)根据历年同季/月(de)数据总和,计算历年同季/月(de)平均水平(2)根据历年各季/月(de)数值总和,计算总(de)季/月(de)平均水平(3)将历年同季/月(de)平均水平与总(de)季/月(de)平均水平对比,得到季节比率(季节指数):用于表明各季水平比全期总水平高或低(de)程度,即季节变动(de)一般规律性.:季节变动可以消除季节变动对时间序列造成(de)影响,便于测定现象(de)循环变动和不规则变动55、统计指数:狭义,反映不能直接相加(de)多因素组成(de)复杂现象总体(de)综合变动(de)相对数.56、统计指数(de)作用:反映复杂现象(de)综合变动方向和程度(以相对数(de)形式说明现象(de)变动方向和程度,以绝对数(de)形式表明现象变动(de)结果);测定复杂现象(de)总变动中各个因素变动(de)影响方向和程度.57、统计指数(de)种类(1)按研究对象(de)范围:个体指数、总指数(综合指数和平均指数)(2)按说明(de)指标性质:数量指标指数、质量指标指数(3)按对比(de)情况:动态指数、静态指数(4)按计算方法及特点:综合指数、平均指数58、综合指数:将总量指标分解为两个或两个以上(de)因素,并将其中一个或一个以上(de)因素固定下来,仅观察其中一个因素(de)变动,由此计算(de)总指数59、综合指数计算过程:(先综合后对比)(1)引入同度量因素,使不能直接相加(de)指标过渡到能够进行综合计算(2)将同度量因素固定在同一时期,以观察其他因素变动(de)情况(3)通过不同经济内容(de)两个总量指标(de)对比,来观察呗研究因素(de)综合变动,即复杂现象(de)总变动.。
统计学的重点知识点梳理统计学是一门研究数据收集、分析和解释的学科,它在各个领域都扮演着重要的角色。
无论是在科学研究、商业决策还是社会调查中,统计学都是必不可少的工具。
为了更好地理解和应用统计学,我们需要掌握一些重要的知识点。
本文将对统计学的重点知识点进行梳理和介绍。
一、概率与统计基础概率与统计是统计学的基础,它们是研究随机现象的理论基础。
概率是描述随机事件发生可能性的数学工具,统计则是通过收集和分析数据来进行推断和决策。
在学习统计学时,我们需要了解概率的基本概念,如样本空间、事件、概率公理等。
同时,还需要学习统计学的基本概念,如总体、样本、参数、统计量等。
二、数据收集与整理数据收集是统计学的第一步,它涉及到样本的选择、数据的采集和整理。
在进行数据收集时,我们需要注意样本的代表性和采样方法的选择。
数据整理包括数据的清洗、转换和归类等过程,以确保数据的准确性和可用性。
三、描述统计学描述统计学是统计学的重要分支,它通过图表和统计指标来描述和总结数据的特征。
常用的描述统计学方法包括频数分布表、直方图、饼图、散点图、均值、中位数、众数、标准差等。
通过描述统计学,我们可以对数据的分布、中心趋势和离散程度有一个直观的认识。
四、概率分布概率分布是描述随机变量取值概率的函数。
常见的概率分布包括二项分布、正态分布、泊松分布等。
了解不同概率分布的特点和应用场景,可以帮助我们更好地理解和分析数据。
五、参数估计与假设检验参数估计是根据样本数据对总体参数进行估计的过程。
常见的参数估计方法包括点估计和区间估计。
假设检验是根据样本数据对总体假设进行推断的过程。
在进行参数估计和假设检验时,我们需要选择适当的统计方法和显著性水平,并进行假设的建立和检验。
六、回归与相关分析回归分析是研究变量之间关系的统计方法,它可以用于预测和解释变量间的依赖关系。
相关分析是研究变量之间相关性的统计方法,它可以用于判断变量间的相关程度和方向。
通过回归与相关分析,我们可以建立数学模型来描述变量之间的关系,并进行预测和解释。
统计学重点整理及复习资料第一章统计有三个含义,即:统计工作、统计资料、统计学。
统计学的研究对象:社会经济现象数量的总体数量特征及数量关系。
(学科性质:方法论)统计学的特点:数量性、总体性、具体性、社会性、广泛性。
统计工作的过程:设计、调查、整理、分析。
统计的研究方法:统计分组法、大量观察法、综合指标法、统计模型法、统计推断法。
统计总体:客观性、同质性、差异性。
组成统计总体的个别单位称为总体单位。
标志:统计学中总体单位所具有的属性或者特征;分为数量标志和品质标志(不可量性). 指标:反应总体某一综合数量特征的名称或范畴;可分数量指标和质量指标(率、平均)。
变异:指可变的品质标志;变量:指可变化的数量标志,变量的树枝也叫做变量值(标志值)。
第二章统计调查:指根据统计研究的目的和要求,运用科学的调查方法有计划的、有组织的向社会实际搜集各项统计资料的过程。
统计调查的意义:是人们认识社会的基本方式、是统计的重要环节、在统计学中占有重要地位。
统计调查的基本要求:准确、及时、系统、和完整性。
统计调查的种类:1、按组织方式可分为统计报表制和专门调查。
2、按调查对象可分为全面调查和非全面调查。
3、按登记事物的连续性可以分为经常性调查和一次性调查(时点状态)。
4、按搜集资料的不同可分为直接观察法、报告法、采访法、问卷调查法。
统计方案的设计:一、确认调查任务和目的,二、确定调查对象和单位,三、确定调查项目和设计调查表,四、确定调查时间地点,五、制定调查的组织实施计划。
专门调查可分为:普查、重点调查、典型调查和抽样调查。
普查:为了特定的研究目的而专门组织的一次性全面调查;特点:1、一次性调查2、主要调查一定时点的情况3、普查的数据一般比较准确,规范化程度较高;原则:1、必须统一规定普查的时点2、正确选择普查的时期3、在普查范围内各调查单位或调查点应尽可能的同时进行4、同类普查的内容在各次普查中应尽可能的保持一致。
重点调查:在所要调查的总体中选择一部分重点单位进行非全面调查用以反应总体的基本情况。
统计学期末复习重点一.单项选择(20 X 2=40)单选题所涉及的知识点,不用死记概念,要理解其内涵,灵活应用!第一章.绪论统计的定义:统计是人们认识客观世界总体数量变动关系和变动规律的活动的总称,是认识客观世界的有力工具。
统计学的定义:统计学是关于数据的科学,研究如何收集(如调查与试验)、分析(回归分析)、表述数据(图与表),并通过数据得出基本结论.统计的研究对象的特点:①数量性.统计数据是客观事物量的反映。
②总体性.统计的数量研究是对现象总体中各单位普遍存在的事实进行大量观察和综合分析.③变异性.总体各单位的特征表现存在着差异,而且这些差异并不是事先可以预知的。
统计的分类:统计可分为描述统计,推断统计、核算统计、理论统计、应用统计描述统计:汇总的表、图和数值。
包括搜集数据、整理数据、展示数据推断统计:用样本数据对总体性质进行估计,检验核算统计:对国家或地区经济运行过程及各类总量进行描述和分析总体:根据一定目的确定的所要研究的事物的全体.它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。
总体单位(简称单位):是组成总体的各个个体。
根据研究目的的不同,单位可以是人、物、机构等实物单位,也可以是一种现象或活动等非实物单位。
样本:由总体的部分单位组成的集合。
样本容量:样本所包含的总体单位数标志(变量):总体各单位普遍具有的属性或特征。
标志的分类:①品质标志:单位属性方面的特征.品质标志的表现只能用文字、语言来描述.②数量标志:单位数量方面的特征.数量标志可以用数值来表现几种常用的统计软件:SAS SPSS MINITAB STATISTICA Excel思考题:1、在调查某高校学生的学习状况时,总体是(C )A该校全部学生B该校每个学生C该校全部学生的学习情况D被随机抽取进行数据采集的全部学生2。
要了解全国的人口情况,总体单位是( A )。
A.每一个人B。
每一户C.每个省的人口D。
全国总人口第二章.数据数据:所收集、分析、汇总表述和解释的事实及数字,数据是进行统计分析研究的基础;是统计学研究对象的特征,是客观事实;不仅仅局限于数字范畴,包括非数字形式的其他信息。
统计学》期末重点1. 统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(1)(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(2)(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(3)(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;(4)观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
(5)实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;(6)截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
(7)时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
2. 变量的题型第10 页,习题1.1(1)年龄:数值型变量(2)性别:分类变量(3)汽车产量:离散型变量(4)员工对企业某项改革措施的态度(赞成、中立、反对):顺序变量(5)购买商品时的支付方式(现金、信用卡、支票):分类变量3.随机抽样(概率抽样)的抽样方式。
(1)简单随机抽样(2)分层抽样:就是抽样单位按某种特征或者某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。
将各层的样本结合起来,对总体目标量进行估计。
(3)整群抽样:(4)系统抽样(5)多阶段抽样分层抽样与整群抽样的区别:分层抽样的层数就是样本容量;整群抽样的群中单位的个数就是样本容量4.非概率抽样的几种类型(1)方便抽样(2)判断抽样(3)自愿样本(4)滚雪球抽样滚雪球抽样往往用于对稀少群体的调查。
在滚雪球抽样中,首先选择一组调查单位,对其实施调查后,再请他们提供另外一些属于研究总特的调查对象,调查人员根据调查线索,进行此后的调查。
这个过程持续下去,就会形成滚雪球效应。
优点:容易找到那些属于特定群体的被调查者,调查成本也比较低。
(5)配额抽样比较概率抽样和非概率抽样的特点,指出各自适用情况概率抽样:抽样时按一定的概率以随机原则抽取样本。
每个单位别抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽到的概率。
技术含量和成本都比较高。
如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样:操作简单,时效快,成本低,而且对于抽样中的统计学专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
它同样使用市场调查中的概念测试(不需要调查结果投影到总体的情况)。
5.数据预处理内容数据审核(完整性和准确性;适用性和实效性),数据筛选和数据排序。
6.数据型数据的分组方法和步骤分组方法:单变量值分组和组距分组,组距分组又分为等距分组和异距分组。
分组步骤:(1)确定组数(2)确定各组组距3)根据分组整理成频数分布表7.散点图与饼图的主要用途饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。
散点图是描述变量之间关系的一种直观方法,从中可以大体上看出变量之间的关系形态及关系强度。
8.举例说明开口组组中值的计算方法缺下限开口组组中值=上限-1/2邻组组距缺上限开口组组中值=下限+1/2邻组组距9.怎样理解平均数在统计学中的地位?平均数在统计学中具有重要的地位,是集中趋势的最主要的测度,主要适用于数值型数据,而不适用于分类数据和顺序数据。
10.中位数与众数的区别众数:是一组数据中出现次数最多的变量值,用M0表示。
众数主要用于测度分类数据的集中趋势,当然也适用于作为顺序数据以及数值型数据集中趋势的测度值。
中位数:是一组数列排序后处于中间位置上的变量值,用M e。
中位数主要用于测度顺序数据的集中趋势,当然也适用测度数值型数据的集中趋势,但不适用于分类数据。
简述众数、中位数和平均数的特点和应用场合。
众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。
众数只有在数据量较多时才有意义,数据量较少时不宜使用。
主要适合作为分类数据的集中趋势测度值。
中位数是一组数据中间位置上的代表值,不受极端值的影响。
当数据的分布偏斜较大时,使用中位数也许不错。
主要适合作为顺序数据的集中趋势测度值。
平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。
当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。
但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。
11.标准差系数(离散系数或变异系数)的计算及其应用为什么要计算离散系数?方差和标准差是反映数据分散程度的绝对值,一方面其数值大小受原变量值本身水平高低的影响,也就是与变量的平均数大小有关;另一方面,它们与原变量的计量单位相同,采用不同计量单位的变量值,其离散程度的测度值也就不同。
因此,为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。
12.什么是次序统计量由小到大的排序x(1)- X(2) - - X(i) 一- X(n) 中,第i个值X(i)就作为次序统计量X⑴的序统计量13.什么是自由度?自由度:随机变量所包含的独立变量的个数。
14.偏态系数(SK取值的不同意义如果一组数据的分布是对称的,则偏态系数等于0;如果偏态系数明显不等于0,表明分布是非对称的。
若偏态系数大于1或小于-1,成为高度偏态分布;若偏态系数在0.5-1或-1--0.5之间,被认为是中等偏态分布;偏态系数越接近0,偏斜程度就越低。
15.中心极限定理的内容2 _设从均值"方差为二的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值X的抽(第89页,第96页习题4.8 (1))设X1,X2,是从总体X中抽取的一个样本,n X(i)称为第i个次序统计量,它是样本(X 1,X 2,,X n )满足如下条件的函数:每当样本得到一组观测值X1'X2' X n 时,其观测值,而X ⑴,X(2) X(n)称为次序统计量。
其中,X(1)和X (n)分别为最小的的最大次16. 评价估计量的标准 (1) 无偏性无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。
设总体参数为 9,所选择的估计量为9 ,如果E (9) =9 ,则称9为9的无偏估计量。
(2) 有效性有效性是指对同一整体参数的两个无偏估计量,有更小的标准的估计量更有效。
在无偏估计的条件下,估 计量的方差越小,估计也就越有效。
(3) 一致性一致性是指随着样本量的增大,估计量的指越来越接近被估计总体的参数。
换而言之,一个大样本给岀的 估计量要比一个小样本给出的估计量更接近总体的参数。
17. 简述样本量与置信水平、总体方差、估计误差的关系 样本量越大置信水平越高,总体方差和边际误差越小18. 大样本条件下总体均值的区间估计总体均值"在「〉置信水平下的置信区间为:总体均值不包括在置信区间的概率;1_y为置信水平; Z 2是标准正态分布右侧面积为2时的Z 值;CJZ 2 n 是总体均值的估计误差)_ 2(2)大样本条件下,方差' 未知,正态总体或非正态总体样分布近似服从均值为 ,方差为 的正态分布(1)大样本条件下,方差 2已知,正态总体或非正态总体- CFX _2 . n 为置信下限;- CFXZ 2 r 为置信上限,-n为事先确定的一个概率值,也称风险值,是总体均值"在置信水平下的置信区间为:- SX—Z:2,n2(S为样本方差,s为样本标准差)19.置信区间可靠性与精确性的关系置信度又称置信水平是对总体参数进行区间估计时构造的随机区间包含参数真值的概率。
精确度是对总体参数进行区间估计时构造的随机区间的平均长度。
置信度和精确度是评价区间估计优劣的两个标准,置信度度和精确度都高则说明区间估计较好,但是二者是此消彼长的关系,提高置信度必将以降低精确度为代价。
20.假设检验和参数估计有什么相同点和不同点?参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,然而推断的角度不同。
参数估计讨论的是用样本统计量估计总体参数的方法,总体参数卩在估计前是未知的。
而在参数假设检验中,则是先对卩的值提岀一个假设,然后利用样本信息去检验这个假设是否成立。
21.假设检验的种类及假设的正确写法建设检验的一般流程:首先提岀原假设和备择假设,分别为:H o:H i:然后,确定适当的检验统计量,需要考虑样本量的多与少,总体标准差规定显著性水平检验统计量的确定:①若是大样本条件下,采用z统计量,计算公式为:②若是小样本条件下,采用t统计量,计算公式为匚已知与否,等等。
(t 统计量的自由度为n-1)注:即使是小样本,若 c 已知,仍可继续使用z 统计量 最后,进行统计决策。
比例问题的检验,z 统计量的计算公式为:(p 为样本比例;兀0为总体比例n 的假设值) (1 )双侧检验在双侧检验中,只要 」 或」 两者之中有一个成立,就可以拒绝原假设0 0以大样本条件下为例,双侧检验的决策准则为:若Z V Z2,不拒绝H 。
若z >z“2,拒绝H 。
(Z 的下标〉2表示双侧检验)不管双侧检验或是单侧检验,若使用 P 值检验,pvot ,拒绝 H 0; PX ,(2 )单侧检验① 左单侧检验(下限检验) 希望所考查的数值越大越好 ② 右单侧检验(上限检验) 希望所考查的数值越小越好22. 大样本条件下总体均值的假设检验( 192页例题)5.总体方差假设检验的方法2 (n-1)s2(J2若进行双侧检验,在确定的 :-水平下,拒绝域分布在 统计量分布曲线的两边;(1 -二 n0)不能拒绝H 。
2统计量分布曲线的一边。
具体在左还是在右,需根据原假设和备择假设23.假设检验中犯两类错误及其概率之间的关系假设检验的结果可能是错误的,所犯的错误有两种类型,一类错误是原假设H0为真却被我们拒绝了,犯这种错误的概率用a表示,所以也称a错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概论用B表示,所以也称B错误或取伪错误。
两类错误之间存在什么样的数量关系:在假设检验中,a与B是此消彼长的关系。
如果减小a错误,就会增大犯B错误的机会,若减小B错误,也会增大犯a错误的机会。
故,二者是此消彼长的关系。
24.列联表的概念及自由度的确定列联表是由两个以上的变量进行交叉分类的頻数分布表。
自由度=(R-1) ( C-1)简述列联表的构造与列联表的分布两个以上的变量进行交叉分类的頻数分布表,包括观察值的分布与期望值的分布。