统计学第三版,袁卫等,高等教育出版社,期末复习资料
- 格式:doc
- 大小:24.00 KB
- 文档页数:2
统计学基础知识期末复习资料统计学是一门研究收集、整理、分析和解释数据的学科。
它是一个广泛的学科领域,应用于各个行业和领域。
在期末考试前夕,复习统计学的基础知识是非常重要的。
本文将为你提供统计学基础知识的复习资料,帮助你更好地准备期末考试。
1. 描述性统计描述性统计是统计学的基础,它涉及到对数据进行整理、总结和分析。
描述性统计包括以下几个方面:- 中心趋势的测量:包括平均数、中位数和众数。
平均数是一组数据的算术平均值,中位数是一组数据的中间值,众数是一组数据中出现次数最多的值。
- 变异性的测量:包括范围、方差和标准差。
范围是一组数据的最大值和最小值之间的差距,方差是数据偏离平均值的平方和的平均值,标准差是方差的平方根。
- 分布形状的测量:包括偏度和峰度。
偏度描述了数据的分布形状的对称性,偏度为0表示数据分布是对称的,偏度大于0表示数据分布是正偏的,偏度小于0表示数据分布是负偏的。
峰度描述了数据分布的尖峰程度,峰度大于0表示数据分布是尖峰的,峰度小于0表示数据分布是平坦的。
2. 概率基础概率是描述事件发生可能性的数值。
在统计学中,概率是非常重要的,因为它用于计算和预测事件的发生概率。
以下是概率的基本概念:- 随机试验和样本空间:随机试验是指在相同条件下可以重复进行的实验,样本空间是随机试验所有可能结果的集合。
- 事件和事件的概率:事件是样本空间的子集,事件的概率是事件发生的可能性。
- 条件概率和独立事件:条件概率是指在已知某一事件发生的前提下,另一事件发生的概率。
两个事件是独立的,当且仅当一个事件的发生不受另一事件发生与否的影响。
- 概率分布:概率分布是指随机变量所有可能取值与其对应的概率之间的关系。
常见的概率分布包括离散概率分布和连续概率分布。
3. 参数估计和假设检验参数估计和假设检验是统计学中常用的方法,用于从样本中推断总体的特征或进行统计推断。
以下是参数估计和假设检验的基本概念:- 参数估计:参数估计是根据样本数据推断总体参数的数值。
《统计学》课程期末复习(一)单项选择题1.社会经济统计学是一门()A.自然科学B.实质性科学C.社会科学D.新兴科学2.统计有三种涵义,其中( )是基础.是源。
A.统计学B.统计资料C.统计活动D.统计方法3.下列变量中属于连续变量的是()A.职工人数B.设备台数C.学生的年龄D.工业企业数4.数量指标是反映( )A.总体的绝对数量指标B.总体内部数量关系的指标C.总体单位数量指标D.总体的相对数量指标5.质量指标是说明()A.总体内部数量关系的指标B.总体的绝对数量指标C.总体单位数的指标D.总体单位质量的指标6.()是统计的根本准则,是统计的生命线。
A.及时性B.真实性C.全面性D.总体性7.某市1995年工业企业经济活动成果的统计年报的呈报时间为1996年元月31日,则调查时间为( )A.1年零1个月B.1年C.1个月D.1天8.对我国各铁路交通枢纽的货运量进行的调查,属于()A.普查B.重点调查C.抽样调查D.典型调查9.某手表厂为了解手表产品质量情况而进行的调查,属于()A.普查B.重点调查C.抽样调查D.典型调查10.某市1995年社会商品零售总额统计年报的呈报时间为1996年元月31日,则调查期限为( )A.1年零1个月B.1年C.1个月D.1天11.按照计划,今年产量比上年增加30%,实际比计划少完成10%,同上年比今年产量实际增长程度为()。
A.75%B.40%C.13%D.17%12.某厂2003年完成产值2000万元,2004年计划增长10%,实际完成2310万元,超额完成计划()。
A.5.5%B.5%C.115.5%D.15.5%13.甲.乙两数列的平均数分别为100和14.5,它们的标准差为12.8和3.7,则( )。
A.甲数列平均数的代表性高于乙数列B.乙数列平均数的代表性高于甲数列C.两数列平均数的代表性相同D.两数列平均数的代表性无法比较14.事先将总体各单位按某一标志排列,然后依排列顺序和按相同的间隔来抽选调查单位的抽样称为( )。
1什么是统计学?怎样理解统计学与统计数据的关系?统计学是一门收集,整理,显示和分析统计数据的学科。
其目的是探索数据内在的数量规律性。
统计学的目的在于对统计数据的研究,离开了统计数据,统计方法乃至统计学便失去意义。
2简要说明统计数据的来源:直接获取和间接获取3获取直接统计统计数据的渠道主要有哪些?:普查和抽样调查4简要说明抽样误差和非抽样误差抽样误差是利用样本推断总体时产生的误差。
抽样误差是不可避免的,但又是可以计量的,并且是可以控制的。
一般来说样本量越大,抽样误差越小,抽样误差与样本量的平方根呈反比关系。
非抽样误差是由于调查过程中各有关环节工作失误造成的。
非抽样误差在普查,抽样调查中都有可能发生。
理论上来说,这种误差是可以避免的。
5怎样理解均值在统计学中的地位?均值是对所有数据平均后计算的一般水平代表值,数据信息提取最充分,特别是当要用样本信息对总体进行推断是,均值就更显示出它的各种优良特征。
均值在整个统计方法中应用最广,对经济,管理和工程等实际工作也是最为重要的一个代表值和统计量。
均值是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。
6中心极限定理中心极限定理Central Limit Theorem:设从均值为μ、方差为σ^2;(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n的正态分布。
7一组数据的分布特征可以从哪几个方面进行测度?一是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。
8为什么要计算离散系数?第一,极差、平均差、方差和标准差等都是反映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响。
第二,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。
统计学各章节期末复习知识点统计学是一门研究数据收集、分析和解释的学科。
作为一门广泛应用于各个领域的学科,统计学的知识点非常丰富。
以下是统计学各章节的期末复习知识点汇总:1.数据收集与描述-数据类型:定量数据和定性数据-数据收集方式:问卷调查、观察、实验-描述统计:中心趋势(均值、中位数、众数)、离散程度(范围、方差、标准差)、数据分布(直方图、条形图、饼图)2.概率论基础-随机试验与样本空间-事件与事件概率-古典概型、几何概型和统计概型-条件概率与独立性-伯努利试验与二项分布3.随机变量及其分布-随机变量与分布函数-离散型随机变量与其分布律-连续型随机变量与其概率密度函数-均匀分布、正态分布、指数分布等常见分布4.多个随机变量的分布-边缘分布与条件分布-两个离散型随机变量的联合分布律-两个连续型随机变量的联合概率密度函数-相互独立的随机变量的分布5.随机变量的数字特征-数学期望与其性质-方差与标准差-协方差与相关系数-矩、协方差矩阵与相关系数矩阵6.大数定律与中心极限定理-辛钦大数定律-中心极限定理-切比雪夫不等式与伯努利不等式7.统计推断基础-参数估计:点估计、区间估计-置信区间与置信水平-假设检验:原假设与备择假设、显著性水平、拒绝域-类型Ⅰ错误和类型Ⅱ错误-样本容量与统计检验的效应大小8.单样本与双样本推断-单个总体均值的推断:正态总体与非正态总体-单个总体比例的推断-两个总体均值的推断:独立样本与配对样本-两个总体比例的推断9.方差分析与回归分析-单因素方差分析-两因素方差分析-简单线性回归分析:最小二乘法-多元线性回归分析:拟合优度、剩余平方和、变量选择10.非参数统计方法-指标:秩和检验、秩和相关检验、符号检验- 分布:符号检验、秩和检验、秩和相关检验、Kolmogorov-Smirnov检验这些是统计学各个章节的期末复习知识点的一个概述。
每个章节都拥有更加详细和复杂的内容,需要学生在复习中深入理解并进行练习。
第三部分章节题库第1章数据与统计学一、单项选择题1.被马克思誉为“政治经济学之父,在某种程度上也是统计学的创始人”的是()。
A.布莱斯·帕斯卡B.威廉·配第C.费马D.约翰·格朗特【答案】B【解析】布莱斯·帕斯卡和费马是古典概率论的奠基人;约翰·格朗特是人口统计的创始人。
2.统计学的两大分类是()。
A.统计资料的收集和分析B.理论统计和运用统计C.统计预测和决策D.描述统计和推断统计【答案】D3.下列不属于描述统计问题的是()。
A.根据样本信息对总体进行的推断B.了解数据分布的特征C.分析感兴趣的总体特征D.利用图、表或其他数据汇总工具分析数据【答案】A【解析】描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法;推断统计是研究如何利用样本数据来推断总体特征的统计方法。
4.下列叙述中,采用推断统计方法的是()。
A.用饼图描述某企业职工的学历构成B.反映大学生统计学成绩的条形图C.一个城市在1月份的平均汽油价格D.从一个果园中采摘36个橘子,利用这36个橘子的平均重量估计果园中橘子的平均重量【答案】D【解析】推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。
由题可知,根据36个橘子的平均重量估计果园中橘子的平均重量属于推断统计方法。
5.如果一个样本因人故意操纵而出现偏差,这种误差属于()。
A.抽样误差B.非抽样误差C.设计误差D.实验误差【答案】B【解析】非抽样误差是由于调查过程中各有关环节工作失误造成的。
它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,人为干扰造成的误差,调查中由于被调查者不回答产生的误差等。
6.下列说法错误的是()。
A.抽样误差只存在于概率抽样中B.非抽样误差只存在于非概率抽样中C.无论是概率抽样还是非概率抽样都存在非抽样误差D.在全面调查中也存在非抽样误差【答案】B【解析】抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差;非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异。
《统计学》第三版,高等教育出版社袁卫等期末复习资料
1、有关统计误差
2、有关抽样的方法
3、有关向上积累和向下积累的计算
4、有关各个计算公式
5、统计学的目的就是探索数据的内在规律
6、统计图表的基本组成:组名称、次数、频率
7、基尼系数=A/(A+B),可以知道基尼系数等于0是表明社会的财富分配是绝对公平的,如果等于1表明是绝对不公平的
8、众数值得是曲线的最高点,如果曲线没有明显的集中趋势或者是最高峰点,众数可以不存在
9、中位数是指最中间的数,具有稳健性
10、平均数包括:算数平均数、几何平均数、调和平均数
11、均值,中位数,众数三者之间的关系,如果是右翩的话众数MO/中位数ME/均值,如果是左偏的话均值/中位数ME/众数MO
12、受端值影响的量:极差,均值,方差;不受端值影响的:内距
13、离散系数是用来对两组数据的差异程度进行分析比较,是从相对的角度观察差异和离散程度的
14、偏度SK的值为正是表明右偏,当SK 为负数时表明是
左偏,且SK的值越大偏斜的程度越大
15、峰度K大于0 时我尖峰分布,当K小于0 时是平峰分布
16、F分布的图形是右偏的
17、估计量的标准:1)无偏性2)有效性3)一致性
18、样本容量的确定是根据统计量的计算公式反推的
19、在方差分析中检验统计量F值的是组间平方和除以组内平方和。