统计学复习资料
- 格式:pdf
- 大小:250.38 KB
- 文档页数:20
统计学复习资料(名词解释、简答)计算题:以老师圈的重点,以及之前布置的作业为主,重点复习11/12章一、名词解释:时间序列数据:是在不同时间收集到的数据,这些数据是按时间顺序收集到的,用于所描述现象随时间变化的情况.总体:是包含所研究的全部个体(数据)的集合样本:是从总体中抽取的一部分元素的集合样本量:构成样本的元素的数目统计量:用来描述样本特征的概括性数字度量参数:用来描述总体特征的概括性数字度量概率抽样:即随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本非概率抽样:抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查简单随机抽样:指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本整群抽样:是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。
系统抽样:根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式抽样误差:由抽样的随机性引起的样本结果与总体真值之间的误差分组数据:根据统计研究的需要,将原始数据按照某种标准化分成不同的组别,分组后的数据称为分组数据。
方法有单变量值分组和组距分组两种。
众数:是一组数据中出现次数最多的变量值中位数:是一组数据排序后处于中间位置上的变量值平均数:也称均值,是一组数据相加后除以数据的个数得到的结果算术平均数:是指在一组数据中所有数据之和再除以数据的个数。
几何平均数:是n个变量乘积的n次方根方差:各变量值与其平均数离差平方的平均数经验法则:当一组数据对称分布时,经验法则表明:约有68%的数据在平均数1个标准差的范围之内。
约有95%的数据在平均数2个标准差的范围之内。
约有99%的数据在平均数3个标准差的范围之内。
1、统计学——是一门收集、整理、实和分析统计数据的科学,其目的使探索数据内在的数量规律。
2、统计学的两个含义指的什么?1当他以名词出现时表示一门科学名称—“统计学“。
2当他以复数名词出现时,表示”统计数据“或”统计资料“。
3、统计学分为哪两大类?其含义是什么??1描述统计——是用图形、表格和概括性的的数字对数据进行描述的统计方法。
2推断统计——是根据样本信息对总体进行估计、假设检验、预测的统计方法。
4、解释总体,变量,样本。
1总体就是我们所要研究的所有单位的总和2变量就是我们重点关注的是总体单位具有哪些特征或属性3样本就是总体的一部分。
5、数据的计量尺度分为哪几种?各有哪些特点?1列名尺度—最粗略的计量程度,2顺序尺度—比列名精确性高一些,3间隔尺度—可以对数据进行精确计量的尺度,4比列尺度—和间隔差别很小,主要在于对“0“的理解不同。
6、直接获取统计数据的方法有哪几种?1普查2抽样调查7、基尼系数反映的是什么问题?当基尼系数超过0.4说明什么?当基尼系数=0 表示收入绝对平均,基尼系数=1表示收入绝对不平均,基尼系数小于0.2表示分配平均,在0.2~0.4之间是比较合适的。
基尼系数为0.4时,被认为是收入分配不公的警戒线,超过0.4就应该采取缩小这一差距。
8、影响加权算数平均数的因素是什么?1组中值2权数3分组的组数。
9、众数、中位数、均值的关系是什么?1对称分布MO=ME=X 2右偏分布MO<ME<X 3左偏分布X<ME<MO。
10、反映现象集中趋势的主要指标有哪些?1众数2中位数3均值。
11、反映现象离散趋势的指标又哪些?1极差2方差3标准差。
12、为什么要计算离散系数而不是标准差系数?因为离散系数是从相对的角度观察变异和离散程度的,在比较相关事物的差异程度时,较之直接比较标准差要好些。
13、按抽样的组织方式如何分类?1简单随即抽样2分层抽样3系统抽样4正群抽样14、什么是参数?参数估计的方法又哪几种?参数——是描述总体数据分布特征的一个常量。
统计学复习资料一、填空题(每空1分,共10分)1.变量按其取值的连续性可分为_____________ 和_____________两种。
2.统计调查根据被研究总体范围的不同可分为_____________和_____________ 两种。
3.统计模型中除了用数学方程表示现象的基本关系式外,还应具有_____________ 与两项要素。
4.统计调查根据被研究总体范围的不同可分为_____________ 和_____________两种。
5.统计指标是一定社会经济范畴的具体表现,其特点有_____________和_____________·6.统计模型中除了用数学方程表示现象的基本关系式外,还应具有_____________ 与_____________两项要素。
7.总量指标按其反映时间状态不同分为_____________和_____________。
8.统计研究运用大量观察法是由于研究对象的_____________和_____________所决定的。
9.相关分析研究的是_____________关系,它所使用的分析指标是_____________·二、判断题1.对某市工程技术人员进行普查,该市工程技术人员的工资收入水平是数量标志。
( )2.总体的同质性是指总体中的各个单位在所有标志上都相同。
( )3.在对现象进行分析的基础上,有意识地选择若干具有代表性的单位进行调查,这种调查属于重点调查。
( )4.估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。
( )5.对我国主要粮食作物产区进行调查,以掌握全国主要粮食作物生长的基本情况,这种调查是重点调查。
( )6.若将某地区社会商品库存额按时间先后顺序排列,此种动态数列属于时期数列。
( )7.分析复杂现象总体的数量变动时,若研究的是数量指标的变动,则选择的同度量因素是数量指标。
一、判断题:1.运用大量观察法,必须对研究对象的所有单位进行观察调查。
()2.一般地,凡是编制数量指标指数,均应以相应的基期质量指标作为同度量因素。
()3.间隔相等间断时点数列序时平均数的计算方法采用简单序时平均法。
()4.分布在各组之内的单位数称频率。
()5.我国的人口普查每10年进行一次,因此,它是一种经常性调查方式。
()6.变量数列中任一组标志值为零,则无法计算调和平均数。
()7.权数的绝对值越大,对算术平均数的影响也就越大。
()8.全距易受极端数值的影响。
()9. 抽样平均误差越大,样本的代表性越大。
()10.相邻两项的累积增长量之差等于相应的逐期增长量。
()11某生产组有5名工人,日产零件数分别为68件.69件.70件.71件.72件,因此说这些是5个数量标志或5个变量。
()12变量按其值是否连续出现,可以分为确定性变量与随机变量。
()13某地区国内生产总值为1000亿万元”是一个要素完整的指标。
14比例相对指标是在分组的基础上计算的。
15 中位数是位置平均数,不受极端数值的影响。
7.权数的绝对值越大,对算术平均数的影响也就越大。
()16时点指标数值大小与时间长短成正比。
()17 抽样极限误差可以小于.大于或等于抽样平均误差。
()18 相对数时间序列求序时平均数时,根据所给数列简单平均即可。
()19 发展水平是计算其他动态分析标志的基础,它只能用总量指标来表示。
()20 编制销售量指数,一般是用报告期价格作同度量因素。
()21抽样平均误差的大小与样本容量的大小成正比例关系。
()22建立指数体系时,首先要分析研究对象与其影响因素之间的内在经济了解。
()23环比速度与定基速度之间存在如下关系式:各环比增长速度的连乘积等于定基增长速度。
()24回归分析中,两个变量是对等关系。
()25在测定相关关系之前,一般在理论分析的基础上,要利用相关表和相关图粗略地判断现象之间的相关程度和相关形态。
()26总指数的平均性是以综合性为基础的,没有综合性就没有平均性。
统计学概论复习资料一、单项选择题1、统计的总体性特点表现在【】。
A.它是从个体入手,达到对总体的认识B.它是从总体入手,达到对个体的认识C.它排除了认识个体现象的必要性D.它只对总体现象的量进行认识,抛开了对总体现象质的认识2、全国人口普查中,调查单位是【】。
3、次数密度是指【】。
4、【】通常是指召开座谈会或访问被调查者,通过面谈来实现搜集调查资料的一种调查形式。
5、下列哪个不是常用的基本抽样组织形式【】。
6、【】可以对于某种总体的假设进行检验。
7、下列哪个不是影响抽样平均误差的因素【】。
8、相关系数r的取值范围是【】。
≤r ≤≤r <1≤r ≤≤r ≤09、收入初次分配所形成的收入属于【】。
10、下列不存在对应负债的金融资产是【】。
二、多项选择题1、下列统计指标中,属于数量指标的有【】。
2、统计调查按搜集资料的方法,可以分为【】。
3、统计表按分组的情况分类,可分为【】。
4、分配数列按分组标志的性质不同分为【】。
A.变量数列B.品质数列C.单项数列D.组距数列E.次数分配数列5、次数分布的主要类型包括【】。
三、填空题1、是按所拟调查事项,有计划地通过访谈、询问方式向被调查者提出问题,通过他们的回答来获得有关信息和资料的一种调查形式,它也是调查的一种基本形式。
2、留置调查具有、被调查者的回答不受调查人员的影响、被调查者有详细思考时间、避免因误解而产生误差等优点。
3、市场调查包括、定性调查、媒体和、商户和工业品调查、特殊社会群体调查、民意测验和文案研究。
4、平均速度指标包括和,它们是反映经济现象在一个较长时期内逐期平均发展变化的程度和逐期平均增长变化的程度的指标。
用以观察现象在整个时期内的动态发展变化情况和趋势。
5、是人们认识事物、科学实验、社会调查和体验生活等认知活动中最常用的一种方法。
6、又称分层抽样或分类抽样。
它是先将总体中所有的单位按照某个标志分成若干类或组,然后再各类中直接随机抽取样本单位,可见它是统计分组与简单随机抽样的结合体。
《统计学》综合复习资料一、单选题1.统计一词的三种涵义是( A )A.统计活动、统计资料、统计学 B.统计调查、统计整理、统计分析C.统计设计、统计分组、统计预测 D.统计方法、统计分析、统计预测2.统计调查按其组织形式分类,可分为( C )A.普查和典型调查 B.重点调查和抽样调查C.统计报表和专门调查 D.经常性调查和一次性调查3.我国编制零售物价指数是采用( C )法来编制的。
A.综合指数 B.平均指标指数C.固定加权算术平均指数D.固定加权调和平均指数4.某商品价格比原先降低5%,销售量增长了5%,则销售额( B )。
A.上升B.下降C.不变D.无法确定5.现有一数列:3,9,27,81,243,729,2187,反映其平均水平最好用( C )。
A.算术平均数 B.调和平均数 C.几何平均数 D.众数6.欲以图形显示两变量X与y的关系,最好创建( D )。
A.直方图 B.圆形图 C.柱形图 D.散点图7.直接反映总体规模大小的指标是( A )。
A.总量指标 B.相对指标 C.平均指标 D.变异指标8.统计调查表可以分为( C )两种形式。
A.单一表和复合表B.简单表和复合表C.单一表和一览表D.简单表和分组表9.大量观察法的数学依据是(C )。
A.贝努里定律B.贝叶斯定理C.大数定律D.中心极限定理10.两变量的线性相关系数为 -1,说明两变量(C )。
A.完全正相关B.不完全相关C.完全负相关D.不存在线性相关关系11.若无季节变动,则季节比率理论上应该(B )。
A.小于1B.等于1C.大于1D.等于012.抽样平均误差的实质是(D )。
A.总体标准差B.样本的标准差C.抽样误差的标准差D.样本平均数的标准差13.某商品价格比上期下降5%,销售额比上期降低了5%,则销售量(C )。
A.上升B.下降C.不变D.无法确定14.几位工人的年龄分别是32岁,35岁,42岁,这几个数字是(C )。
统计学复习提纲1.下列数据中,属于数量标志的是()A.学生的性别B.学生的年龄C.学生的专业D.学生的住址答案:B2. 在国有企业设备普查中,每一个国有工业企业是()A. 调查对象B. 调查单位C. 填报单位D. 调查项目答案:C3.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于()A 简单分组B 平行分组C 复合分组D 再分组答案:B4.下面属于结构相对数的有()。
A. 人口出生率B. 恩格尔系数C. 产值利率值D. 工农业产值比答案:B5.下面四个平均数中,只有()是位置平均数A.算数平均数B.中位数C.调和平均数D.几何平均数答案:B6.累积增长量等于()。
A. 报告期水平与基期水平之差B. 报告期水平与前一期水平之差C. 报告期水平与某一固定基期水平之差D. 逐期增长量之差答案:C7.若价格指数下降,销售额指数持平,则销售量指数( )A. 下降B. 不变C. 上升D. 为零答案:C8、统计预测是对社会经济现象的未来,从( )方面进行的预测A. 质量B.性质C.数量D.理论答案:C9、为了研究某城市的居民收入状况,把该城市按人均年收入分组,其中最后两组是1800~2000元,2000元以上的,则最末一组的组中值是( )。
A、2000元B、2200C、2100D、2150答案:C10、假如各个标志值都增加5个单位,那么算数平均数会( )。
A、增加到5倍B、增加5个单位C、不变D、不能预期平均数的变化答案:B11.权数对算术平均数的影响作用,实质上取决于( )。
A.作为权数的各组单位数占总体单位数比重的大小B.各组标志值占总体标志总量比重的大小C.标志值本身的大小D.标志值数量的多少答案:A12.对某城市工业企业未安装设备进行普查,总体单位是( )。
A.工业企业全部未安装设备B.工业企业每一台未安装设备C.每个工业企业的未安装设备D.每一个工业企业答案:B13.以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身,这一标准称为( )。
第2章统计数据的搜集2.1 数据的来源对使用者,数据来源有两种方式:1 直接来源2 间接来源数据的直接来源(原始数据)通过调查方法获得的数据称为调查数据,而通过实验方法得到的数据称为实验数据. (1)调查方法常用于社会科学(通常取自有限总体)▽普查▽抽样调查(2)实验数据常用于自然科学, 目前也被逐渐运用到社会科学中.2.2 调查数据2.2.1 概率抽样与非概率抽样1 概率抽样(probability sampling)概率抽样也称随机抽样,主要有如下几个特点:(1)按一定的概率抽取样本,即抽取样本时使每个单位都有一定的机会被抽中.(2)每个单位被抽中的概率已知(或是可以计算出来的).(3)按样本对总体目标量的估计,估计量与每个样本单位被抽中的概率有关.1 概率抽样(probability sampling)抽取样本时是依据随机原则,主要方式有:(1)简单随机抽样(2)分层抽样(3)整群样本(4)系统抽样(5)多阶段抽样2 非概率抽样(non-probability sampling)抽取样本时并不是依据随机原则,而是根据研究目的和对数据的要求,采用某种方式从总体中选择部分单位进行调查.主要方式有:(1)方便抽样(2)判断抽样(3)自愿样本(4)滚雪球抽样(5)配额抽样3 概率抽样与非概率抽样的比较(1)概率抽样▽按随机原则抽选样本▽可以根据调查的结果推断总体(2)非概率抽样▽不按随机原则抽选样本▽不能根据调查的结果推断总体第二节统计数据的类型第 3 章数据的图表展示3.1 数据的预处理▽数据的审核—检查数据中的错误▽数据的筛选—找出符合条件的数据▽数据排序—升序和降序▽数据透视表—提取有用的信息图3-31数据的类型与图示方法第四章数据的概括性度量统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度,如算术平均数;二是分布的离中趋势,反映各数据远离其中心值的程度,如标准差;三是分布的偏态和峰度,反映数据分布的形状。
《统计学》复习资料(一)一单选题1. 下面的哪一个图形最适合描述结构性问题( )A. 条形图B. 饼图C. 对比条形图D. 直方图2. 下列描述正确的是A. 点估计比区间估计需要更大的样本容量B. 点估计相对于区间估计更加准确C. 点估计无法给出参数估计值的置信度和误差大小D. 区间估计无法给出参数估计值的置信度和误差大小3. 假设检验中所犯的错误有两种类型,β错误是指()A. 弃真错误,即拒绝正确的原假设。
B. 取伪错误,即接受一个错误的原假设。
C. 弃真错误,即接受一个错误的原假设。
D. 取伪错误,即拒绝正确的原假设。
4. 同时抛3枚质地均匀的硬币,巧合有2枚正面向上的概率为 ( )。
A. 0.125B. 0.25C. 0.375D. 0.55. 根据概率的统计定义,可用以近似代替某一事件的概率的是 ( )。
A. 大量重复试验中该随机事件出现的次数占试验总次数的比重B. 该随机事件包含的基本事件数占样本空间中基本事件总数的比重C. 大量重复随机试验中该随机事件出现的次数D. 专家估计该随机事件出现的可能性大小6. 为了反映商品价格与需求之间的关系,在统计中应采用( )A. 划分经济类型的分组B. 说明现象结构的分组C. 分析现象间依存关系的分组D. 上述都不正确7. 1.指出下面的数据哪一个属于分类数据( )A. A 年龄B. B 工资C. C 汽车产量D. D 购买商品的支付方式(现金、信用卡、支票)8. 在成数估计中,样本容量的取得通常与总体成数有关,但总体成熟未知,通常A. 取成数为0.5B. 取成数为0C. 取成数的标准差最小D. 取抽样误差最小9. 样本或总体中各不同类别数值之间的比值称为( )A. 频率B. 频数C. 比例D. 比率10. 调查项目( )A. 是依附于调查单位的基本标志B. 与填报单位是一致的C. 与调查单位是一致的D. 是依附于调查对象的基本指标11. 要反映我国工业企业的整体业绩水平,总体单位是:A. 我国每一家工业企业B. 我国所有工业企业C. 我国工业企业总数D. 我国工业企业的利润总额12. 一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。