统计学复习提纲
- 格式:doc
- 大小:25.00 KB
- 文档页数:5
统计学原理复习提纲(复习总要求:结合每章节后客观题和作为作业布置的计算题)第一章绪论主要内容:1 、统计的三个含义及其之间的关系。
P5三个含义:统计工作(活动)、统计资料、统计学三者关系:统计工作(活动),即统计实践活动,是基础;统计工作的成果是统计资料,统计资料是统计实践活动的产物。
统计学是统计实践经验的理论概括和科学总结,它来源于统计实践,又高于统计实践,反过来指导统计实践。
2、统计学研究的对象:大量社会经济现象总体的数量方面(数量特征和数量关系)统计学的特点:1、数量性2、总体性3、具体性4、社会性3、统计的作用(功能):1、信息功能2、咨询功能3、监督功能4、统计研究的理论基础、基本方法与工作过程.统计研究的理论基础:哲学唯物辩证法、社会经济学、数学统计研究的基本方法:大量观察法、分组法、综合指标法、归纳判断法及其他相关的方法统计工作过程P10—11: (统计任务、统计设计)统计调查、统计整理、统计分析 (统计信息管理),三个阶段并非孤立的、而是密切联系的一个整体,其中各环节往往是交叉进行的。
重点掌握内容: (能联系实际进行判断)5、统计学的几个基本概念:P11—16(1)总体与总体单位.统计总体是根据一定目的确定的所要研究事物的全体,它是客观存在,并在某一相同性质基础上结合起来的许多个别单位的整体。
简称总体.总体特点:同质性、大量性、变异性(或者差异性)构成总体的这些个别单位称为总体单位。
总体可分为有限总体/无限总体总体与总体单位具有相对性,随着研究任务的改变而改变(2)标志与指标。
标志是说明总体单位特征的名称.分为品质标志、数量标志。
指标(统计指标)是说明现象总体量的特征的概念。
特点:数量性、综合性、具体性。
数量指标反映现象发展的总规模、总水平—总量指标质量指标反映现象发展的相对水平、工作质量—相对指标、平均指标指标和标志既有区别又有联系,两者的区别是:第一,指标是说明总体特征的,而标志是说明总体单位特征的;第二,指标都是可量的,而标志不一定是可量的。
统计学原理复习提纲第一部分考试方式及考试时间1.考试时间及题型单项选择(6题×2分=12分)多项选择(4题×2分=8分)判断正误(5题×2分=10分)简答题(2题×10分=20分)计算题(3题,50分)考试时间90分钟。
闭卷考试,可以带计算器。
2.考试成绩:平时作业和期中测验占30%(中央电大四次作业和上课测评的成绩),期末考试成绩占70%。
(100分*30%+ X*70%大于60分,X=?)把形考的比重加大,强调大家在学习过程中对学习内容的理解,而不是把所有的精力放到期末的死记硬背上。
形成性考核成绩不及格的学生不得参加本次终结性考试。
3.复习的时候如何利用资料进行复习。
教材是最基本的复习依据。
一定要根据教学大纲和考核说明当中所规定的考试的范围认真复习和理解教材的相关内容。
然后做学习指导书和作业的题目。
大家知道每一种指标的计算公式是固定的,但是出题的形式和类型是有所变化的,平时的形成性考核作业篇幅有限,同时考试到大家的实际情况,一些经典的题都是以作业的形式给大家了。
大家在复习中会发现总做练习的题练习的数量就不够,这样你反过来在学习指导书中做相应的题目,它有足够的数量的题帮助你练习。
最后我们下发的期末复习指导,它分为考核说明和各章的复习题。
考核说明规定了你所学的内容当中哪些是属于一般的了解的,哪些是掌握的,哪些是熟练掌握的。
这样你就用这这四种复习资料就完全够了。
另外,请大家注意:在试卷的后面我们把所有的课程所涉及的常用公式都附上去了。
实际上也是课程进行考试改革的一种尝试。
统计学原理课程有它的特殊性,既有概念的理解,也有方法的掌握。
学习中更重要的是要求大家掌握方法的应用,而不是死记硬背。
统计分析方法的应用很多时候都是落到指标的计算和分析上。
相关公式的记忆不是很关键的,而在于要根据资料和研究目的进行恰当的公式选择。
在平时的四次作业中每一章重点掌握的公式以名词形式出现,其目的就是在平时的学习过程中加强同学们对公式本身的建立和应用的理解。
第一章绪论第一节统计的产生和发展一、统计的产生:源于人类的计数与统计实践活动。
二、统计的发展1、英国的政治算术学派(17世纪)【“有实无名”的统计学】创始人:英国的威廉·配第(政治经济学之父)代表作:《政治算术》——统计学诞生的标志;文中针对英、法、荷兰的国情,利用数字、重量、尺度的方法,并配以朴素的图表(现代统计学广为采用的方法和内容)进行三国国力的比较,但没有使用“统计学”一词。
2、德国的国势学派(又称记述学派)(18世纪)【“有名无实”的统计学】代表人物:康令、阿亨瓦尔康令在大学开设“国势学”课程,以文字技术和比较为主,反映各国的国情国力;阿亨瓦尔继承和发展了康令的思想,并于1749年首次使用“统计学”代替“国势学”,认为统计学是关于各国基本制度的学问,但缺乏数字和内容。
3、数理统计学派(19世纪)代表人物:凯特勒(比利时)(古典统计学的完成者,近代统计学的先驱者)代表作:《社会物理学》——他将概率论引进统计学,完成了统计学和概率论的结合。
第二节统计学的性质和特点一、统计的三个含义:统计工作(过程)、统计资料(成果)和统计学(理论)。
二、统计学的研究对象:大量社会现象(主要是经济现象)的总体数量方面的方法论科学。
三、统计学的特点:数量性、总体性、具体性、社会性、广泛性。
第四节统计学中的几个基本概念一、统计总体与总体单位1、统计总体:是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。
统计总体可以分为有限总体和无限总体,总体所包含的单位数有限的比如人口数、企业数,反之比如大海里的鱼资源数。
2、总体单位:是指构成总体的个别单位。
注:总体和总体单位的划分是相对的,它们随着统计研究对象和研究目的变化而相互转化。
二、统计标志与统计指标1、统计标志:用来说明总体单位所具有的属性或特征的名称。
可分为品质标志和数量标志。
品质标志是说明总体单位质的特征,不能用数字来表示的,如性别、籍贯、工种等;数量标志是说明总体单位量的特征,是可用数字来表示的,如年龄、身高、收入等。
统计学复习提纲一、概念1、统计学:即统计理论,是指研究如何收集、整理、分析和预测客观现象统计资料的方法论科学;2、统计调查:根据统计研究预定的目的和任务,运用科学的方法和手段,有计划、有组织地向客观实际采集数据的过程;3、统计整理:统计数据整理即统计整理,是指根据特定的研究目的与要求,将收集到的各种原始资料进行科学的加工整理,使之条理化、系统化的工作过程;4、总体参数:根据总体各单位标志值计算的反映总体数量特征的综合指标称为总体指标,又称全及指标,也称为总体参数;5、统计量:6、频数:各组所出现的单位数;频率:各组频数与总体单位数之比,反映了各组频数的大小对总体所起作用的相对强度;7、统计指标:简称指标,是反映社会经济现象总体数量特征的概念和数值;8、普查:是为某种特定目的而专门组织的一次性的全面调查;9、众数:是一组数据中出现次数最多的变量值;10、参数估计:就是用样本的数量特征(统计量)对总体的数量特征(参数)进行估计的统计方法;11、相关系数:是指在直线相关条件下,两个变量之间相关关系密切程度和方向的统计分析指标;12、平均发展水平:是将不同时期的发展水平加以平均而得的平均数。
二、简答1、统计分组及其作用:统计分组是根据统计研究的目的和客观现象的内在特点,按某个变量(或几个变量)把被研究的总体划分成为若干个不同性质的组。
作用:⑴划分社会经济现象的类型;⑵揭示社会经济现象内部结构;⑶分析社会经济现象之间的依存关系。
2、统计调查问卷及其设计原则:统计调查问卷是把所要调查的项目及其可能的答案,按照一定的结构和顺序排列所形成的问答卷。
设计原则:⑴主题明确;⑵一般性;⑶逻辑性;⑷明确性;⑸非诱导性;⑹便于整理、分析。
3、常用的离散程度的测度指标有:极差、平均差、标准差和方差以及离散系数等变异指标。
4、时点指标及其特点:时点指标是反映现象在某一时刻(瞬间)状况的数量。
特点:不连续性5、统计指数的性质及作用:⑴综合性;⑵相对性;⑶平均性;⑷代表性6、影响抽样误差的因素有哪些:⑴抽样单位数的多少;⑵总体各单位标志值的差异程度;⑶抽样方法;⑷抽样的组织形式。
名词解释1.统计学:是一门搜集、整理和分析统计数据的方法的科学,目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。
2.描述统计:描述统计学是研究为了反映客观现象的数量特征,而需采用的数据采集方法、数据加工整理方法、数据综合分析方法,计算各项指标反映数据的构成和分布等方法以及用一定形式的表式和图形把结果显示出来的方法等。
3.推断统计:推断统计学是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表达的推断。
4.总体(Population):指具有某种特征的一类事物的全体,又称母体。
5.个体(Element):构成总体的每个基本单元。
6.样本(Sample):从总体中抽取的一部分个体,即总体的一个子集。
7.参数:(Parameter):总体参数,指描述一个总体情况的一些统计指标。
如总体平均值或期望值,用符号μ表示;反映总体分散情况的指标如标准差,用σ表示;反映某事物两特性总体之间关系的统计指标为相关系数,用ρ表示;表示两特性之间数量关系的统计指标是回归系数,用β表示。
8.统计量(Statistic):是样本的函数,只跟样本有关,与总体参数无关。
如样本平均数(X)、样本标准差(S)、样本相关系数(r)、回归系数(b)等。
可以用统计量对总体参数进行估计或进行假设检验。
9.随机现象:在相同条件下进行的实验或观察,其可能结果不止一个,事先无法确定,这类现象称为随机现象。
10.定类尺度:也叫类别尺度或列名尺度。
只能按照事物的某种属性对其进行平行的分类或分组。
是最粗略,计量层次最低的计量尺度。
如性别(男、女)、学历、企业性质、职业、地区等。
11.定序尺度:也叫顺序尺度,是对事物之间等级差别或顺序差别的一种测度。
它不仅可以将事物分成不同的类别,而且还可以确定这些类别的优劣或顺序。
12.定距尺度:也叫等距尺度或间隔尺度,不仅能将事物分为不同类型并进行排序,而且还可以准确地指出类别之间的差距是多少,表现为数值。
统计学复习纲要概论统计学是一门研究收集、整理、分析和解释数据的学科,被广泛应用于各个领域,如经济学、医学、社会科学等。
统计学的核心是通过对数据的分析和推断来了解和解释现象,并为决策提供依据。
为了帮助学习统计学的同学复习要点,下面将给出一个统计学复习纲要概论。
一、概率论的基本概念:1.概率的定义和性质2.条件概率和独立性3.随机变量和概率密度函数4.期望和方差的概念和计算二、统计学基本原理:1.样本与总体2.统计量和抽样分布3.参数估计与假设检验的基本思想三、参数估计:1.点估计和区间估计的概念和方法2.极大似然估计和最小二乘估计的原理和应用3.置信区间的计算方法和解释四、假设检验:1.假设检验的基本步骤和原理2.单样本均值和比例的假设检验3.两个样本均值和比例的假设检验4.卡方检验和F检验的应用五、线性回归分析:1.简单线性回归的原理和应用2.多元线形回归的原理和应用3.回归分析中的诊断和解释六、方差分析:1.单因素方差分析的原理和应用2.多因素方差分析的原理和应用3.方差分析中的效应大小和事后比较七、非参数统计:1.非参数统计的概念和方法2.秩和符号检验的应用3. Wilcoxon秩和检验的应用以上是一个统计学复习纲要的概论,其中包含了统计学的基本概念、原理和方法。
在复习过程中,可以通过课本、习题集和练习题来巩固理论知识,并通过实际数据的分析来加深理解。
此外,还可以使用统计软件来进行数据分析和实证研究,以提高对统计学的理解和应用能力。
最后,建议同学们在复习过程中要多进行思考和总结,理解概念背后的原理,并能够灵活运用于实际问题的解决中。
统计学复习提纲一、名词解释1.统计学:收集、处理、分析、解释数据并从数据中得出结论的原则和方法。
2.描述统计:研究数据收集、处理和描述的统计学方法。
3.推断统计:研究如何利用样本信息推断总体特征的统计学方法。
4.变量:描述观察对象某种特征的概念。
5.总体和样本:总体:包含所有研究的全部个体(数据)的集合。
样本:从总体中抽取的一部分元素的集合。
6.样本量:构成样本的元素的数目。
7.参数和统计量:参数:对总体特征的某个概括性度量,包括总体均值、总体比例、总体方差。
统计量:对样本特征的某个概括性度量,包括样本均值、样本比例、样本方差。
8.系统抽样:也称等距抽样,先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个元素,直至抽取n个元素组成一个样本为止。
9.频数:落在某一特定类别的数据个数。
10.比例:一个样本(或总体)中各类别的频数占全部频数的比值。
11.比率:一个样本(或总体)中各不同类别频数之间的比值。
12.随机变量:事先不能确定其取值的变量。
13.期望值:随机变量的平均取值。
14.抽样分布:样本统计量的概率分布,是由样本统计量所有可能取值形成的相对频数分布。
15.标准误差:也称标准误,样本统计量分布的标准差,用于衡量样本统计量的离散程度。
16.中心极限定理:随着样本量n的增大(通常要求n>=30),不论原来的总体是否服从正态分布,样本均值的概率分布都将趋于正态分布,其分布的期望值为总体均值μ,方差为总体方差的1/n。
17.置信区间:由样本统计量构造出的总体参数在一定置信水平下的估计区间。
18.置信系数:也称置信水平,在重复构造的总体参数的多个置信区间中包含总体参数真值的区间所占的比例。
19.假设:对总体的某种看法,在参数检验中,假设是对总体参数的具体数值所作的陈述。
20.假设检验:利用样本提供的信息判断假设是否成立的统计方法。
21.原假设和备择假设:原假设:研究者想收集证据予以推翻的假设。
统计学复习提纲第一章:绪论1、1)统计的含义:统计一词有统计工作、统计资料、统计科学三种含义,但最基本的还是统计工作。
没有统计工作就不会有统计资料,没有丰富的统计实践经验就不会产生统计科学。
2)统计的研究对象:统计学的研究对象是统计工作的规律,即搜集、整理和分析统计数据的方法,是一门方法论科学。
3)统计的特点:数量性、具体性、综合性2、统计学的基本概念1)总体:总体是指在某种共性的基础上由许多个别事物结合起来的整体。
总体有三方面特征:同质性、大量性、差异性总体可分为有限总体和无限总体2)总体单位:构成总体的个别事物叫总体单位。
总体和总体单位是根据统计研究的目的来确定的。
3)标志:标志是指说明总体单位特征的名称。
标志可分为数量标志(用数字回答问题)和品质标志(用文字回答问题)。
标志还可分为不变标志和可变标志。
不变标志:所有总体单位共同具有的特征。
它是构成总体的必要条件和确定总体范围的标准。
可变标志:在总体各单位之间必然存在差异的标志。
4)变量:可变标志中既有品质标志也有数量标志。
可变的数量标志就叫变量。
变量的具体数值叫变量值。
凡变量值只能以整数出现的变量,叫离散变量。
凡变量值可作无限分割的变量,叫连续变量。
5)指标与指标体系:指标:说明总体数量特征的概念。
指标体系:以共同的研究目的为纽带而相互联系的一系列统计指标。
6)指标与标志的区别与联系区别有二:第一,指标说明总体的特征;而标志说明总体单位的特征。
第二,指标只反映总体的数量特征,所有指标都要用数字来回答;标志则既有反映总体单位的数量特征(用数字回答),也有反映总体单位的品质特征(用文字回答)。
二者联系:主要表现:许多标志的数值都是由总体各单位的数量标志的标志值汇总而得来的。
品质标志虽然本身不具有数值,但有些指标是按品质标志分组分组计算得出。
由于总体和总体单位可随统计研究的目的而易位,故指标和数量标志在一定的条件下可以变换。
第二章:统计调查1、统计调查:是指根据统计研究的目的,有组织、有计划地搜集统计资料的过程。
统计学基础复习提纲复习内容:第一章:统计数据;第二章;数据搜集;第四章:数据分布特征的测度;第五章:抽样与参数估计;第六章:假设检验;第七章:相关与回归分析;第八章:时间序列分析和预测:第九章:指数。
重点内容:第一章统计和数据(1)统计的概念和应用(2)统计数据类型:分类数据、顺序数据、数值型数据;观测数据和实验数据;截面和时间序列数据。
(3)统计中的基本概念:总体与样本;参数与统计量;变量。
第二章数据搜集(1)数据来源:直接来源和间接来源(2)调查设计:调查方案设计和调查问卷设计(3)统计数据质量第四章数据分布特征的测度(1)集中趋势的测度:平均数;中位数和分位数;众数(2)离散程度的度量:极差和四分位差;平均差;方程和标准差;离散系数(3)偏态与峰态度量:偏态系数;峰态系数第五、六章参数估计与假设检验(1)参数估计的基本原理:点估计与区间估计(2)总体均值的区间估计和总体比率的区间估计(3)样本容量的确定(4)假设检验的基本原理:原假设与备择假设;两类错误与显著性水平;检验统计量与拒绝域。
(5)总体均值的检验:大样本检验方法;小样本检验方法。
第七章相关与回归分析(1)变量间关系度量:相关关系的描述和测度;散点图与离散系数。
(2)一元线性回归:一元线性回归模型;参数的最小二乘估计;回归方程的拟合优度;显著性检验。
(3)利用回归房产进行估计和预测第八章时间序列分析与预测(1)时间序列的分解和描述:图形描述;增长率分析(2)预测方法的选择和估计(3)平稳序列的预测:移动平均法;指数平滑法(4)趋势序列的预测:线性趋势预测;非线性趋势预测平均数:x 二2 4 10 11| 14 151096 9.610(2-9.6)2(4-9.6)2 川(15-9.6)2n -110-12、一家公司在招收职员时,首先要进行两项能力测试。
在A 测试中,其平均分数是100分, 标准差是15分;在B 项测试中,其平均数是 400分,标准分数是50分。
统计学复习二、复习1.统计数据的来源有哪些?2.调查方案主要内容有哪些?3.数据分类的原则有哪些?4.基本的抽样方式有哪些?5.随机抽样的各种方式及其概念。
6.抽样目的是什么?7.抽样误差的特点及影响抽样误差大小的因素有哪些?8.有限总体、无限总体简单随机抽样的特点。
9.各种相对数的特点。
10.统计分组后数据的分布特征描述。
11.几何平均数的特点。
12.计算离散系数有何意义。
13.置信区间的特点是什么?14.由均值的样本容量的计算公式推导置信区间的长度及确定样本容量需考虑哪几个因素?15.离散趋势的测定指标有哪些及其特点。
16.组距数列的平均数、众数、中位数的计算及怎么利用它们的位置来判断数据的分布状态(计算题)。
17.假设检验的显著性水平 的涵义。
18.单个总体均值和比例的假设检验。
19.单个总体均值和比例的置信区间的估计。
20.回归直线拟合程度的主要统计量是什么?21.综合指数的应用及编制综合指数时,有哪些因素可以作为权数。
22.同度量因素概念及其作用。
23.时间数列的影响因素及特点。
24.会用按季平均法计算季节指数。
25.相关系数与P值的关系。
26.序时平均数的概念。
27.平均增长量的计算公式。
28.平均指标包括哪些?29.环比发展速度与定基发展速度的换算。
30.环比增长速度与定基增长速度的换算。
31. 回归分析输出结果如下:回归统计Multiple R 0.909091 R Square0.826446 Adjusted R Square 0.783058 标准误差 0.9770080.977008观测值 6dfSSMSFSignificance F回归分析 1 18.18182 18.18182 19.04762 0.012021残差 4 3.818182 0.954545 总计 522Coefficients 标准误差t StatP-valueLower 95%Upper 95%a. 列出回归方程,解释回归方程中10b b 和的含义,解释相关系数及其含义,列出判定系数r 2,并解释其含义。
第一章导论1.什么是统计学?统计方法可以分为哪两大类?统计学是收集、分析、表述和解释数据的科学。
统计方法可分为:1。
描述统计是研究数据收集、整理和描述的统计学分支,是用图、表、统计量等方式对已有数据的特征进行描述。
内容包括:搜集数据、整理数据、展示数据、描述性分析。
目的:描述数据特征、找出数据的基本规律.2。
推断统计是研究如何利用样本数据推断总体特征统计学分支,是指利用这种概率关系,由样本统计量推估总体参数。
内容包括:参数估计、假设检验。
目的:对总体特征作出推断。
2.统计数据可分为哪几种类型?不同数据的类型各有什么特点?按计量尺度分:1。
分类数据:对事物进行分类的结果,数据表现为类别,用文字来表述.2。
顺序数据:对事物类别顺序的测度,数据表现为类别,用文字来表述。
3.数值型数据:对事物的精确测度,结果表现为具体的数值.按收集方法分:1。
观测的数据:通过调查或观测而收集到的数据。
2.试验的数据:在试验中控制试验对象而收集到的数据,在没有对事物人为控制的条件下而得到的。
按时间状况分:1.截面数据:在相同或近似相同的时间点上收集的数据,描述现象在某一时刻的变化情况。
2.时间序列数据:在不同时间上收集到的数据,描述现象随时间变化的情况。
3.总体、样本、参数、统计量、变量的概念。
总体:所研究的全部元素的集合。
样本:从总体中抽取的一部分元素的集合。
构成样本的元素的数目称为样本容量。
参数:用来描述总体特征的概括性数字度量.统计量:用来描述样本特征的概括性数字度量。
变量:说明现象某种特征的概念.4。
变量的类型、特点及应用.类型和特点:1.分类变量的取值只有类别属性之分,无大小。
2.顺序变量的取值除类别属性之外,还有等级、次序的差别。
3.数值变量的取值:数值.应用:分类数据和数值数据都可以计算众数,但数值数据还能计算平均数,前者却不能。
第二章数据的收集1.简述普查和抽样调查的特点。
普查:1.为特定目的专门组织的非经常性全面调查。
2.通常是一次性或周期性的。
3.一般需要规定统一的标准调查时间.4。
数据的规范化程度较高。
5.应用范围比较狭窄。
抽样调查:1.从总体中随机抽取一部分单位(样本)进行调查。
2.目的是推断总体的未知数字特征。
3。
最常用的调查方式。
4。
具有经济性、时效性强、适应面广、准确性高等特点.2。
统计数据的具体收集方法有哪些?数据的搜集方法:1.询问调查:访问调查、邮寄调查、电话调查、电脑辅助调查、座谈会、个别深度访问。
2。
观察实验:观察法、实验法.3.调查方案包括那几个方面的内容?调查方案的内容包括:调查目的、调查对象和调查单位、调查项目和调查表等。
调查目的应说明调查所要达到的具体目标是什么;调查对象和调查单位是确定要向谁调查;调查项目和调查表说明的是调查的具体内容。
4。
什么是问卷?它由哪几部分组成?设计问卷的提问项目应注意哪些问题?封闭型问题答案的设计主要有哪些方法?问卷中问题顺序的设计应注意哪些问题?问卷是用来搜集调查数据的一种工具.一般由开头部分、甄别部分、主体部分和背景部分组成。
设计问卷的提问项目应注意:提问的内容尽可能短、用词要确切通俗、一项提问只包含一项内容、避免诱导性提问和否定形式的提问、避免敏感性问题等。
封闭型问题答案的设计方法有:两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法五种。
问卷中问题顺序的设计应注意:问题的安排应具有逻辑性、问题的顺序应先易后难、能引起被调查者兴趣的问题放在前面、开放性问题放在后面、版面格式的设计等。
5。
统计数据的误差种类。
1.抽样误差:所有样本可能的结果与总体真值之间的平均性差异。
在利用样本数据推断时所产生的随机误差。
2。
非抽样误差:除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异。
6。
统计数据的质量要求是什么?1.精度:最低的抽样误差或随机误差。
2。
准确性:最小的非抽样误差或偏差.3.关联性:满足用户决策、管理和研究的需要.4。
及时性:在最短的时间里取得并公布数据.5.一致性:保持时间序列的可比性。
6。
最低成本:以最经济的方式取得数据。
第三章数据整理与展示1.数据的预处理包括哪些内容?数据的预处理:1。
数据的审核:检查数据中的错误。
2。
数据的筛选:找出符合条件的数据.3。
数据排序:升序和降序,寻找数据的基本特征.2.分类数据和顺序数据的整理和图示方法各有哪些?分类数据和顺序数据的结果均表现为类别,这类数据本身就是分了类的,因此整理时主要是在分类的基础上计算各类别的频数、比例、比率以及百分比等,同时给出频数分布。
常用的图示方法有条形图和圆形图等。
3.数值型数据的分组方法有哪些?简述组距分组的步骤。
数据分组的方法有单变量值分组和组距分组两种.组距分组的步骤:1。
确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。
在实际分组时,可以按Sturges提出的经验公式来确定组数K,即:组数=1+[lg(n)/lg(2)]。
2。
确定组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即:组距=(最大值-最小值)/组数。
3。
统计出各组的频数并整理成频数分布表。
4.直方图与条形图有何区别?直方图与条形图的区别:1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义.2。
直方图的各矩形通常是连续排列;条形图则是分开排列。
3.条形图主要用于展示分类数据;直方图则主要用于展示数值型数据.第四章数据分布特征的测度1.一组数据的分布特征可以从哪几个方面进行测度?数据特征的测度:1.集中趋势:众数、中位数、均值。
2.离散程度:异众比率、四分位差、方差和标准差、离散系数。
3。
分布的形状:偏态、峰态。
2。
怎样理解均值在统计学中的地位?均值在统计学中具有重要的地位,是集中趋势的最主要测度值,其缺点是易受极端值的影响。
它主要适用于数值型数据,而不适用于分类数据和顺序数据.3.简述众数、中位数和均值的特点和应用场合。
1.众数:不受极端值影响,具有不惟一性,数据分布偏斜程度较大时应用。
2。
中位数:不受极端值影响,数据分布偏斜程度较大时应用。
3。
平均数:易受极端值影响,数学性质优良,数据对称分布或接近对称分布时应用.4。
简述异众比率、四分位差、方差或标准差的适用场合。
1。
异众比率:用于测度分类数据的离散程度,衡量众数对一组数据的代表程度.2.四分位差:用于测度顺序数据的离散程度,衡量中位数对一组数据的代表程度。
3。
方差或标准差:用于测度数据离散程度的最常用测度值,衡量均值对一组数据的代表程度。
第五章抽样与参数估计1.什么是抽样分布?在重复选取容量为n的样本时,由每一个样本算出的该统计量数值的相对频数分布或概率分布,称为样本统计量的抽样分布。
2。
抽样均值抽样分布的两个主要特征值是什么?他们与总体参数有什么关系?特征值是:数学期望和方差.这两个特征一方面与总体分布的均值和方差有关,另一方面也与抽样方法是重复抽样,还是不重复抽样有关,无论是重复抽样,还是不重复抽样,样本均值的数学期望始终等于总体均值,而样本均值的方差则与抽样方法有关,在重复抽样下,样本均值的方差为总体方差的1/n,在不重复抽样的条件下,样本均值的方差则需要用修正系数(N-n)/(N—1)去修正重复抽样时样本均值的方差。
3.样本统计量的分布与总体分布的关系是什么?如果原有总体是正态分布,无论样本容量大小,样本统计量也服从正态分布。
如果原有总体是非正态分布,当n为大样本时(n>=30),由中心极限定理可知,当样本容量n增大时,不管原来的总体是否服从正态分布,样本统计量的抽样分布都将服从于正态分布.当n为小样本时,其分布则不是正态分布,这时就不能按正态分布进行推断。
4。
什么是置信度?将构造置区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例(概率)称为置信度.如抽取了100个样本,根据每一个样本均构造了一个置信区间,这样,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%的置信区间则没有包含。
这里,95%这个值被称为置信水平(或置信度).5。
什么是参数区间估计?参数区间估计的含义:估计总体参数的区间范围,并给出区间估计成立的概率值。
P (θ1≤θ≤θ2) =1—α.其中:1—α(0〈α<1)称为置信度;α是总体参数未在区间内的比例,其取值大小由实际问题确定,经常取1%、5%和10%.置信区间是[θ1,θ2],样本容量一定时置信度越大(估计的可靠性越大)相应置信区间也越宽(总体参数的取值范围越大,估计越不精确)。
第六章假设检验1.什么是检验统计量?什么是标准化检验统计量?根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量.标准化检验统计量=(点估计量-假设值)/点估计量的抽样标准差。
2.什么是显著性水平?它对于假设检验决策的意义是什么?在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率,称为P值,也称为观察到的显著性水平。
一般是在原假设成立条件下,所规定的小概率的数量界限.对应拒绝域的面积大小.该面积对应的底边代表z的取值区间.也就是统计量处于该区间,则否定H0.3。
统计学中是如何表述假设检验的?统计学中表述假设检验思想为:对某总体抽样,如果根据样本计算的某个统计量表明在原假设H0成立的条件下是几乎不可能发生的,就否定H0,并接受其对立面H1。
反之,如果在H0成立的条件下,根据样本所计算的某个统计量发生的可能性并非很小,则接受原假设。
4.简述假设检验的一般步骤.1。
陈述原假设H0和备择假设H1。
2.从所研究的总体中抽出一个随机样本。
3.确定一个适当的检验统计量,并利用样本数据算出其具体数值。
4.确定一个适当的显著性水平α,并计算出其临界值,指定拒绝域。
5。
将统计量的值与临界值进行比较,作出决策:若统计量的值落在拒绝域内,拒绝原假设H0,否则不拒绝原假设H0.双侧检验:|统计量|〉临界值,拒绝H0;左侧检验:统计量<—临界值,拒绝H0;右侧检验:统计量>临界值,拒绝H0。
第七章相关与回归分析1.解释相关关系的含义,说明相关关系的特点。
相关关系是指变量之间存在的不确定的数量关系。
其特点是:1。
变量间关系不能用函数关系精确表达。
2。
一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y 的取值可能有几个,各观测点分布在直线周围。
3。
可以用散点图粗略判断相关,用相关系数定量判断相关程度。
2.简述相关系数的取值及其意义。
取值及其意义:相关系数r:对变量之间线性关系强度的度量1。