当前位置:文档之家› 17.1 网络运行分析-统计学基础知识

17.1 网络运行分析-统计学基础知识

17.1 网络运行分析-统计学基础知识
17.1 网络运行分析-统计学基础知识

网络运行分析—统计基础

中国电信维护岗位认证教材编写小组编制

第一章:导论

1.统计研究的具体方法有哪些?

统计研究着眼于总体的数量特征,所用的基本方法都与总体数量性有关,这些基本方法是:(1)大量观察法。大量观察法是指统计研究客观事物的现状及其发展变化过程,要从总体的全部或足够多的个体进行观察和综合分析的一种统计研究基本方法。运用大量观察法,必须对研究对象的所有单位进行观察调查。例如,普查、抽样调查、统计报表调查等等都是大量观察法的具体应用。

(2)统计分组法。它是根据统计研究的任务和被研究总体内在特点,按照所确定的分类或分组标准,将被研究总体区分为性质不同的类别或组的一种统计研究基本方法。例如,国民经济分为一产、二产、三产业;按行业分为工业、农业、建筑业等;按核算方法分为货物与服务等等。一个统计总体是同质性、大量性与差异性的对立统一体,统计分组就是对这三种性质的综合分析。

(3)综合指标法。综合指标是指,统计绝对数、统计相对数和统计平均数。综合指标法是指将这三种指标有机的结合起来对总体的数量特征与数量关系进行全面分析的统计基本方法。例如,某班学生人数40人,统计期末考试总成绩3200分,这是统计绝对数;平均成绩80分,这是统计平均数;及格率96%,优秀率25%,这是统计相对数。他们综合说明该班统计科的学习情况。

(4)统计模型法。它是根据一定的理论和假定条件,应用数学方程式去模拟现实经济现象相互关系的一种统计研究基本方法。

(5)归纳推断法。从个别到一般,从事实到理论,进行概括的推理方法,逻辑上称为归纳法。常常存在这种情况;人们所能观察到的只是部分或有限的单位,而所需要判断的总体范围却是大量的,甚至是无限的。这就产生了根据部分数据资料对总体数量特征作出判断的问题。以一定的置信标准要求,根据部分数据判断总体数量特征与数量关系的归纳推断方法称为归纳推断法。

1、统计工作可以分为哪几个阶段?

(1)统计设计

(2)统计调查(数据采集)

(3)数据整理

(4)数据分析

(5)数据提供和管理

2、统计指标与统计标志

(1)说明总体特征的名称叫统计指标。表明总体综合数量特征与数量关系的数字资料称为指标。

例如,某班某期末学生40名,期末平均成绩80分,优秀率30%,及格率98%。它包括;时间限制、空间范围、指标名称、计算方法、计量单位、具体数值六个要素。

统计指标按照构成分类,分为2类:

●设计指标:指标名称、计量单位、计算方法。

●实际指标:时间、空间、名称、计量单位、核算方法/口径/范围、数值

统计指标按照数值分类,分为2类:

●数量指标:说明总体外延规模,表明总体总量与标志总量/流量与存量、用绝对数表示。

●质量指标:说明总体内部数量关系和状况、通过数量反映质量、用相统计相对数和统计

平均数表示。

一个统计总体可以有多个指标,都用数量表示。

(2)说明总体单位特征的名称叫统计标志。标志是表明总体单位属性或数量的名称。按照性质不同分为:

●品质标志:表明总体单位属性的名称。用文字表示,包括分类数据和排序数据。

●数量标志:表明总体单位数量的名称。用数值表示,包括测量值数据和计数值数据。

标志的表现,是指在标志名称的后面所列示出来的属性或数量。

例如,“民族”是品质标志名称,汉、回、蒙、藏、…,为品质标志的表现;“年龄”是数量标志名称,16岁、17岁、18岁、…,为数量标志的表现。

(3)指标是相应的总体单位及其标志值的汇总与综合。

(4)由于统计研究目的和任务的变更,原来的总体变成总体单位,那么原来的指标就相应地变成标志,两者变动方向相同。

3、举例说明样本、参数、统计量、变量这几个概念。

(1)样本是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。

(2)参数是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。

(3)统计量是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。

(4)变量是说明现象某种特征的概念。数量标志或统计指标的不同取值,统计上称为变量。也就是说标志或指标会出现不同值,包括时间上或空间上不同的值。因此,数量标志和统计指标的名称称为变量,其具体取值称为变量值。变量是可变的数量标志和指标。比如商品的销售额是不确定的,这销售额就是变量。

第二章:数据的收集

1、统计调查方式:统计报表、普查、抽样调查等。

(1)统计报表是按照国家有关法规的规定,自上而下地统一布置,以一定的原始记录为依据,按照统一表式、统一项目、统一报送时间和程序,自下而上地逐级提供基本统计数据的一种调查方式。

(2)普查是为某一特定目的而专门组织的一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。

(3)抽样调查是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。

(4)重点调查是对总体中重点单位进行调查,取得反映总体基本数据的调查方法。重点单位数占总体单位数比重小,他们的标志值之和占总体标志值总量的比重大,有举足轻重的作用。(5)典型调查是对调查对象进行分类划点的基础上,有意识挑选具有代表性的单位进行深入细致

的调查。有好典型与坏典型之分。

2、重点、典型、抽样调查的区别

三者都是非全面调查,区别如下:

3、全面调查与非全面调查的区别

二者区别是以所包含的调查单位是总体的全部还是部分为依据,而不是以最后得到的是否为全面资料为依据。因为有的非全面调查其目的仍然是获取总体数据,如,抽样调查。

4、经常性调查和一次性调查的区别

二者区别是以调查数据的登记在时间上是否具有连续性为依据。

经常性调查是指一段时期内的流量;一次性调查是指某时点上的存量。

5、采集统计数据的具体操作方法

(1)直接观察法:调查人员深入现场进行观察、计数、登记、检验等,取得第一手资料。

(2)报告法:被调查单位依据原始记录、核算资料、清查盘点,填报统计数据。

(3)访问法:调查者通过口头、邮件、网络、报纸杂志等方式向被调查者采集数据。

(4)问卷法:利用统一设计的答卷向被调查者采集统计资料。

6、统计数据的误差

统计数据的误差通常是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差和非抽样误差两类。

(1)抽样误差主要是指在样本数据进行推断时所产生的随机误差(无法消除);

(2)非抽样误差是人为因素造成的(理论上可以消除)

第三章:数据整理与展示

1、统计数据整理的内容与步骤:

(1)设计整理方案:主要明确规定出统计分组的方法和要汇总的统计指标与指标体系。

(2)数据审查:对于通过调查取得的原始数据,应主要从完整性和准确性两个方面去审核。(3)数据分组:根据统计研究的要求,按照选定的分组标志,将审核后的原始数据进行分类或分组。

(4)数据汇总与计算:对分组后的数据进行汇总与计算的方法主要有手工汇总和计算机汇总。(5)编制统计表、绘制统计图。

2、对分类数据和顺序数据主要是做分类整理,对数值型数据则主要是做分组整理。

3、直方图与条形图的差别:

(1)条形图是用条形的长度表示各类别频数的多少,宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。

(2)直方图的各矩形通常是连续排列,而条形图则是分开排列。

(3)条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。

4、变量分布数列的编制方法

(1)单项式变量分布数列的编制方法

单项数列是把每个变量值作为一组所生成的数列。例如,某生产组20名工人同种产品日产量如下(单位:件):

16 13 18 15 19 14 17 13 15 17

19 15 17 18 14 16 15 16 17 16

这是一个离散型变量,变量值不多、变动范围不大,宜编制单项式变量分布数列。

A.按变量值大小顺序排列:

13 13 14 14 15 15 15 15 16 16

16 16 17 17 17 17 18 18 19 19

B.每种变量值为一组(重复者只取一个)顺序排列:

13 14 15 16 17 18 19 七组

C.列入表中并汇总计算各组频数:

如下表所示,为20名工人的日产量资料:

也可以画图如下:

(2)组距变量数列的编制方法

例如,某班40名学生某科某次考试成绩如下:

54 60 62 97 85 52 83 79 95 80

89 85 77 68 86 93 70 81 78 89

71 89 80 85 75 78 90 66 78 73

82 82 99 77 88 84 75 88 76 80

试编制等距数列。

A.将数据顺序排列,并判断变量性质。

52 54 60 62 66 68 70 71 73 75

76 77 77 78 78 78 79 80 80 80

81 82 82 83 84 85 85 85 86 88

88 89 89 89 89 90 93 95 97 99

变量性质为连续变量,宜编制组距式变量数列。

B.计算全距

全距 = 最大变量值 - 最小变量值

该班成绩全距 = 99 – 52 = 47(分)

C.确定组限、组距和组数

组限是指每组的两端变量值,每个组的起点值称为下限,每个组的终点值称为上限。

组距是指上限值与下限值之差,即组距 = 上限值 - 下限值

组数是指变量数列应划分为多少个组。

确定组距与祖数的具体方法如下:

所使用的全距最小值应略低于实际资料的最小值,自50分开始,最大值应略高于实际资料最大值,最大值取100分。则本例全距为100-50=50。

若组距为5,则组数 = 全距÷组距 = 50 ÷ 5 = 10 (组)

若组距为10,则组数 = 50 ÷ 10 = 5 (组)

本例采用组距为10,组数为5。

D.列表汇总计算

汇总计算要遵循“不重不漏”的原则。

连续型变量数列相邻两组的组限采用“重限分组”的方法,即相邻两组之间的组限用同一个数值标记。为了处理好恰巧是组限的变量值的总体单位的归属问题,应按“不含上限,含下限”的原则处理。例如,60分者应归入60~70组中,70者应归入70~80组中, 80分者应归入80~90组中, 90分者应归入90~100组中。见下表。

将整理表编制成正式表,如下表所示:

组中值是每组的中点数值,计算方法(上限+下限)÷ 2 。如,(50+60)/2 = 55 、(60+70)/2 = 65 、(70+80)/2 = 75 、(80+90)/2 = 85 、(90+100)/2 = 95 等。

(3)开口组变量分布数列的编制

若变量值中有特大或特小的极端值出现时,为避免出现空白组或个别极端值被遗漏,最小组和最大组可采用开口组办法解决,即“╳╳以下”、“╳╳以上”。并以相邻组组距作为其组距。

例如,某班40名学生考试成绩如下:

36 56 60 60 64 64 64 68 68 68

70 70 75 75 75 75 78 78 78 78

78 78 79 79 79 79 84 84 85 85

88 88 89 89 89 89 95 95 98 100

编制等距变量数列如表2-7所示。

两个开口组均用邻组组距,即均为10。

60以下组组中值为:上限–邻组组距÷2 = 60–10÷2 = 55

90以上组组中值为:下限+邻组组距÷2 = 90 + 10÷2 = 95 5、本节小结

第四章:统计数据的显示

统计数据的显示方法有表格法与图示法两种形式。

一、统计表

1、统计表的概念

将汇总得到的统计数据按一定顺序排列在表格中,这种表格称为统计表。

2、统计表的结构

(1)形式上:总标题、横行标题、纵栏标题、数字资料。

(2)内容上:主词栏、宾词栏。

3、统计表的分类

(1)按作用分类:调查表、汇总表(整理表)、分析表

(2)按主词分类:简单表、分组表、复合表

(3)按宾词分类:简单排列、分组排列、层叠排列。

4、按主词分类示例

(1)简单表

●主词未经分组,只排列空间顺序。例如:

某年某进出口公司商品收购计划完成情况(单位:万元)

●主词按时间顺序排列的简单表。例如:

某年某企业增加值统计表(单位:百万元)

(2)分组表

分组表:主词只按一个标志分组的统计表。例如:

某年全社会固定资产投资统计表

(3)复合表

主词按两个或两个以上标志分组的统计表,如在校人数统计表:

在复合分组表中设计横行标题时,应在第一次分组的各组组别下退一、二字填写第二次分组的组别,此时第一次分组的组别就成为第二次分组的个组小计。若需再进行第三、四次分组,均可按此类推。例如:

5、按宾词分类示例

(1)简单排列

宾词不加任何分组,按项目或时间排列。如:某地区工业企业主要经济指标统计表

(2)平行排列

宾词各栏平行设计,如:各地社会商品零售总额统计表(单位:亿元)

再如,某商厦三个商场职工性别和年龄构成统计表

(3)层叠排列

两个或两个以上标志分组后上下层叠起来列示。例如:1998-2002年农村劳动力分布情况

二、统计图

利用几何图形或具体形象来显示统计数据,按表现形式分为几何图、象形图、统计地图等形式。

第五章总体变量分布特征描述

1、什么是统计绝对数?

它是表明总体规模的绝对数量,即表明现象大小多少的总量,在社会经济统计中称为总量指标。

统计绝对数多是在试验、调查和整理中直接获得,也有一些是间接或推算得到。

统计绝对数是统计描述的基础数据,是从数量上认识客观事物的起点数据,又是计算统计相对数与统计平均数的基础数据。

在运用统计绝对数时,应注意正确使用计量尺度和计量单位以及准确界定被研究对象的总体范围和口径。

2、统计绝对数分为哪几类?

(1)按其描述对象不同可分为:总体单位总数和标志值总量

●总体单位总数即单位总量,指总体内所包含的单位总数。

●标志值总量即标志总量,指总体内所有单位上标志值总和。

例如:某生产组25名工人日产量资料

(2)按时间状况分为:时期性总量(流量)和时点性总量(存量)

●时期性总量:指一段时间内的总量

●时间性总量:指某一时点上的总量

(3)按计量单位分:实物总量、价值总量、劳动时间总量

3、统计绝对数的计量单位有哪些?

A.实物单位

实物单位是根据事物的自然属性和物理属性度量其数量的计量单位,常用的有:

●自然单位。是按照现象的自然状态来度量其数量的计量单位。例如,人口用“人”、牛用

“头”、汽车用“辆”等计量单位。

●度量单位。是指国家度量衡制度统一规定的计量单位。例如,重量用“吨”、“克”表示;

长度用“公里”、“米”等表示;面积用“平方米”、体积用“立方米”等表示。

●复合单位。是指两种单位结合而成的计量单位。例如,发电量用“千瓦时”表示;货运量

用“吨公里”表示等等。

●双重或多重单位。是指同时采用两种或两种以上计量单位表明某一事物的数量。例如,电

动机用“千瓦/台”表示;拖拉机用“马力/台”表示;船舶用“艘/马力/吨”表示等等。

B.货币单位

是用货币来表示的计量单位。例如,我国用人民币元、角、分为计量单位;国际用美元、欧元、日元等表示。

C.劳动时间单位

是用劳动时间来表示的计量单位。例如,工日、工时等。1个工人工作1小时叫做1个工时,8个工时为1个工日。

4、一组数据的分布特征可以从哪几个方面进行测度?

(1)一是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;

(2)二是分布的离散程度,反映各数据据远离其中心值的趋势;

(3)三是分布的形状,反映数据分布偏斜程度和峰度。

5、变量分布集中趋势指什么?

集中趋势描述的实质是:找出变量值的集中点或中心值。

常用方法有:算术平均数、几何平均数、中位数和众数等。

6、变量分布离中趋势指什么?

均值是描述变量分布集中趋势,标准差是描述变量分布离中趋势,两者相辅相成共同反映变量分布特征的一对对立统一的代表值。

描述离中趋势的代表值常用的有:极差、标准差和离散系数等。(具体见第12点之后的介绍)

7、为什么要计算离散系数?

(1)极差、平均差、方差和标准差等都是反映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响。

(2)它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。

因此,为消除变量值水平高低和计量单位不同对离散程度的测度值的影响,需要计算离散系数。

8、各类数据离散程度的表示方法

(1)对于分类数据,主要用异众比率来测度其离散程度;

(2)对于顺序数据,主要用四分位差来测度其离散程度;

(3)对于数值型数据,主要用方差或标准差来测度其离散程度。

9、算术平均数的概念

算术平均数是测定集中趋势最常用的代表值,它是同质总体内某类变量所有变量值的平均数。它的实质是把同质总体中各单位变量值的差异(离差)正负相互抵消后反映变量集中趋势中心点的代表值。

因此,统计平均数是对变量数列围绕中心值分布状况的一种统计描述。

例如:

绘制成线段图:

甲数列集中程度大,乙数列离散程度大。显然,变量的离散趋势大集中趋势低如乙数列;离散趋势小集中趋势高如甲数列。

10、算数平均的分类

(1)简单算数平均

(2)加权算数平均

加权算数平均分为:

根据单项变量分布数列计算算术平均数

例如:某生产组10名工人生产甲产品,日产量分组资料见下表,试计算工人平均日产量

计算表明,平均日产量26件趋近工人数最多即频数最大的那个变量值30件。

由上例可以看出,用分组数据计算平均数,平均值的大小受两个因素影响:一个是各组变量值x,另一个是各组次数即频数f的影响。当各组变量值x不变时,各组次数即频数f对平均值的大小起着权衡轻重的作用。因此,次数f称为权数,这种方法称为加权算术平均法。

权数不仅可以用绝对数f表示,也可用相对数即频率f/Σf表示。即:

仍以上表为例,

根据组距式变量分布数列计算加权算术平均数

若掌握组距数列资料,计算方法是:先计算组中值xi ,然后再按上述方法计算加权算术平均数。

A.计算组中值:

缺下限组组中值 = 上限–邻组组距/2 = 400–100/2 = 350(件)

缺上限组组中值 = 下限–邻组组距/2 = 800–100/2 = 850(件)

上下限齐全组组中值 =(上限+下限)/2 = (500+400)/2 = 450(件)

B.计算平均数

综上,简单算术平均数与加权算术平均数之间没有根本区别,因为一个变量值乘上一个频数(权数)与多次加总同一个变量值是意义相同的。它们的基本公式都是相同的:

算术平均数 = 变量值总量 / 单位总量

11、几何平均数

(1)几何平均数的概念

(2)几何平均数的计算

(3)计算时应该注意的问题

(4)几何平均数的特点

(5)主要用途

计算几何平均数要求各观察值之间存在连乘积关系,主要用来:

●对比率、指数等进行平均

●计算平均发展速度:平均发展速度反映现象在一定时期内逐期发展变化的一般程度,

这个指标在国民经济管理和统计分析中有广泛的应用,是编制和检查计划的重要依

据。还可以用于一个国家或地区不同阶段发展状况的比较,以及同一时期不同国家或

地区发展状况的比较。

其中:样本数据非负,主要用于对数正态分布。

12、简述众数、中位数和均值的特点和应用场合及关系。

(1)众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数主要作为分类数据的集中趋势测度值。

(2)中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数以及其他分位数主

要适合于作为顺序数据的集中趋势测度值。

(3)均值是就数值型数据计算的,具有优良的数学性质,缺点是易受数据极端值的影响。均值主要适合于作为数值型数据的集中趋势测度值。均值是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。

关系:如果数据的分布是对称的,众数、中位数和均值必定相等,即Mo=Me=xbar;如果数据是左偏分布,说明数据存在极小值,三者之间的关系表现为:xbar<Me<Mo;如果数据是右偏公布,说明数据存在极大值,必然拉动均值向极大值一方靠,则Mo<Me<xbar(图)

13、极差

极差也称全距,是变量值中最大值与最小值之差。

用公式表示为:全距(R)= 最大变量值 - 最小变量值。如:

甲数列: 68 、69 、70 、71 、72 , R = 72-68 = 4

乙数列: 50 、60 、70 、80 、90 , R = 90-50 = 40

组距数列计算全距:

全距(R)= 最高值组上限值 - 最低值组下限值。

例如:40名工人日产量资料

全距R = 100-50 = 50(件)

用极差评价变量的离散状况:极差值越小表明变量值离散范围小,离散程度小,变量值集中,平均数代表性大;极差值越大,表明变量值离散范围大,离散程度大,变量值分散,平均数代表性小。极差值对极端值反映灵敏。

14、方差和标准差

方差和标准差是最重要、最常用的离中程度的度量方法,多用于以算数平均数为集中趋势度量的场合。

方差是各变量值与其均值离差平方的平均数。

15、标准差

标准差是方差的平方根。

标准差可以概括地、直接地、平均地描述变量发布的离散程度,是各变量值xi距离它们的平均

数远近的一种尺度。概率论指出,在正态分布中68%的变量值分布在距离平均数一个σ值的范围内,95%的变量值分布在距离平均数两个σ值的范围内,其余的5%远离平均数。

(1)简单式标准差:

计算示例:

甲组:

乙组:

计算表明,乙组比甲组标准差小,则乙组比甲组离中程度小,即乙组变量值分布范围比甲组集中,乙组平均数代表性大。

(2)加权式标准差:

计算示例:单项数列的标准差计算

计算公式如下:

再如:组距变量数列标准差计算

16、离散系数

若研究的总体不同,或计量单位不同,或平均数相差悬殊,它们离中趋势的绝对数是不可以比较的。为此,要计算离中趋势的相对数,即离散系数。

离散系数有几种,常用的是标准差系数,它是标准差除以平均数表明每单位平均数的离散程度,用百分数表示,是变量分散性的相对程度度量。标准差系数常用字母“V

σ”表示,计算公式为:

例如,

(1)比较总体相同,计量单位不同两组变量数列的离散程度

某市6岁男童体重与身高资料如下:

统计学基础知识要点 很重要

第一章:导论 1、什么是统计学?统计方法可以分为哪两大类? 统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没 有对事物进行人为控制的 条件下等到的;实验数据的 在实验中控制实验对象而 收集到的数据。按被描述的 对象与时间关系分时:截面 数据所描述的是现象在某 一时刻的变化情况;时间序 列数据所描述的是现象随 时间而变化的情况。 3、举例说明总体、样本、 参数、统计量、变量这几个 概念。 总体是包含研究的全部个 体的集合。比如要检验一批 灯泡的使用寿命,这一批灯 泡构成的集合就是总体。样 本是从总体中抽取的一部 分元素的集合。比如从一批 灯泡中随机抽取100个,这 100个灯泡就构成了一个样 本。参数是用来描述总体特 征的概括性数字度量。比如 要调查一个地区所有人口 的平均年龄,“平均年龄” 即为一个参数。统计量是用 来描述样本特征的概括性 数字度量。比如要抽样调查 一个地区所有人口的平均 年龄,样本中的“平均年龄” 即为一个统计量。变量是说 明现象某种特征的概念。比 如商品的销售额是不确定 的,这销售额就是变量。 第二章:数据的收集 1、调查方案包括哪几个方 面的内容? 调查目的,是调查所要达到 的具体目标。调查对象和调 查单位,是根据调查目的确 定的调查研究的总体或调 查范围。调查项目和调查 表,要解决的是调查的内 容。 2、数据的间接来源(二手 数据)主要是公开出版或公 开报道的数据;数据的直接 来源一是调查或观察,二是 实验。 3、统计调查方式:抽样调

统计学20个重点知识整理

一、统计的含义及其之间的关系 统计一词一般有三种含义,即统计工作、统计资料和统计学。 1、统计工作即统计实践活动,是指按照调查研究的任务,对社会经济现象的数量方面进行搜集资料、整理资料和分析运用资料等一系列调查研究的工作过程。 2、统计资料是指反映社会经济现象特征的各项数字资料以及与之有联系的其他资料,包括调查阶段搜集的原始资料,经过加工整理和分析后的图标和文字资料等系统资料。 3、统计学是研究怎样进行社会经济统计活动的方法论科学,它阐述了统计研究社会经济现象的数量和数量关系时应该遵循的原理、原则和采用的方法等,是系统化的知识体系。 4、关系:统计资料是统计工作的成果,是对社会经济现象进行统计研究的基础;统计学是统计活动经验的科学总结和理论概括,统计学来源于实践,又高于实践,对统计实践起着指导的作用;统计工作要以统计学的理论为指导,并检验和发展统计理论。 二、统计总体和统计单位及其之间的关系 1、统计总体:是由客观存在的、具有某种共同性质的许多个别单位所构成的整体,简称总体。 2、统计总体的特征:大量性、同质性、差异性 3、总体单位:构成统计总体的个别事物 4、例:要研究某一乡镇企业的职工素质情况,则该乡镇企业的全体人员构成一个总体,其中每一个职工就是总体单位。 5、关系:a.总体由总体单位组成; b.组成总体的个体是有差别的; C.根据统计研究目的的不同,总体与总体单位是可以相互转化的。 三、统计指标和统计标志之间的关系 两者之间既有明显的区别,又有密切的联系。主要区别在于: 1、指标说明总体特征;而标志则说明总体单位特征; 2、统计指标必须是可量的;统计标志未必都是可量的; 3、统计指标具有综合性;而统计标志一般不具有综合性; 两者之间的主要联系在于: 1、许多统计指标的指标数值是从总体单位的数量标志值汇总而来; 2、指标与标志之间存在着变换关系; 例如:要了解我国粮食生产状况,则我国的粮食总产量是指标,而某省的粮食总产量是标志。 四、一个完整的统计调查方案包括的内容 1、确定调查目的; 2、确定调查对象和调查单位; 3、确定调查项目,设计调查表; 4、确定调查时间和方法; 5、制定调查工作的组织实施计划 五、统计调查的分类 1、按统计调查方式的不同,可分为定期统计报表和专门调查; 2、按调查总体包括的范围不同,可分为全面调查和非全面调查; 3、按调查登记的时间是否具有连续性,可分为经常性调查和一次性调查; 4、按统计调查是否具有强制性,可分为政府统计调查、民间统计调查和涉外社会调查; 5、按收集资料的方法,可分为直接观察法、报告法、采访法和问卷法

统计学基础知识要点

第一章:导论 1、什么就是统计学?统计方法可以分为哪两大类? 统计学就是收集、分析、表述与解释数据的科学。统计方法可分为描述统计方法与推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据与数值型数据;按照统计数据的收集方法,分为观测的数据与实验的数据;按照被描述的对象与时间的关系,分为截面数据与时间序列数据。 按计量尺度分时:分数数据中各类别之间就是平等的并列关系,各类别之间的顺序就是可以任意改变的;顺序数据的类别之间就是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据就是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的就是现象在某一时刻的变化情况;时间序列数据所描述的就是现象随时间而变化的情况。 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体就是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就就是总体。样本就是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数就是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量就是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量就是说明现象某种特征的概念。比如商品的销售额就是不确定的,这销售额就就是变量。 第二章:数据的收集 1、调查方案包括哪几个方面的内容? 调查目的,就是调查所要达到的具体目标。调查对象与调查单位,就是根据调查目的确定的调查研究的总体或调查范围。调查项目与调查表,要解决的就是调查的内容。 2、数据的间接来源(二手数据)主要就是公开出版或公开报道的数据;数据的直接来源一就是调查或观察,二就是实验。 3、统计调查方式:抽样调查、普查、统计报表等。 抽样调查就是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查就是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表就是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。 除此之外,还有重点调查与典型调查。 4、统计数据的误差通常就是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差与非抽样误差两类。 抽样误差主要就是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差就是人为因素造成的(理论上可以消除) 5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理与研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。 6、数据的收集方法分为询问调查与观察实验。 7、统计调查方案包括哪些内容? 调查目的即调查所要达到的具体目标;调查对象与调查单位,调查对象就是根据调查目的确定的调查研究的总体或调查范围,调查单位就是构成调查对象中的每一个单位;调查项目与调查表,就就是调查的具体内容;其它问题,即明确调查所采用的方式与方法、调查时间及调查组织与实施细则。 第三章:数据整理与展示 1、对于通过调查取得的原始数据,应主要从完整性与准确性两个方面去审核。 2、对分类数据与顺序数据主要就是做分类整理,对数值型数据则主要就是做分组整理。 3、数据分组的步骤:确定组数、组距,最后制成频数分布表 统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。 组中值=(下限值+上限值)/2 4、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图与饼图。 5、直方图与条形图的差别:条形图就是用条形的长度表示各类别频数的多少,宽度则就是固定的,直方图就是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常就是连续排列,而条形图则就是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章:数据分布特征的测度 1、一组数据的分布特征可以从哪几个方面进行测度? 一就是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二就是分布的离散程度,反映各数据据远离其中心值的趋势;三就是分布的形状,反映数据分布偏斜程度与峰度。 2、简述众数、中位数与均值的特点与应用场合及关系。

统计学知识点梳理

型;有下划线的重点记忆!当然整理的知识点都就是重点!都要背与理解!Fighting!) 第一章绪论 一.统计的含义 即统计工作、统计资料与统计学 统计工作:统计实践活动,搜集,整理,分析与提供关于社会现象数字资料工作总称 统计资料:统计实践活动过程中所取得的各项资料,包括原始资料与加工整理资料 统计学:关于认识客观现象总体数量特征与数量关系的科学 二.统计工作过程 就一次统计活动来讲,一个完整的认识过程一般可以分为统计调查、统计整理与统计分析三个阶段。 统计调查:第一阶段,就是认识客观经济现象的起点,就是统计整理与统计分析的基础。 统计整理:第二阶段,处于统计工作的中间环节,起着承前启后的作用。

统计分析:第三阶段,通过第三阶段,事物由感性认识上升到理性认识。 三.总体与总体单位(会辨析总体与总体单位即可) 总体,亦称统计总体,就是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体;构成总体的这些个别单位称为总体单位。 总体由总体单位构成,要认识总体必须从总体单位开始,总体就是统计认识的对象。 例如:所有的工业企业就就是一个总体,其中的每一个工业企业就就是一个总体单位。 四.标志与指标 标志就是用来说明总体单位特征的名称。 指标,亦称统计指标,就是说明总体的综合数量特征的。一个完整的统计指标包括数量指标名称与指标数值两部分。(以上内容理解即可) 1、指标与标志的区别与联系(简答) 指标与标志的区别:(1)指标就是说明总体特征的,而标志就是说明总体单位特征的;(2)指标都能用数值表示,而标志中的品质标志不能用数值表示,就是用属性表示的;(3)指标数值就是经过一定的汇总取得的,而标志中的数量标志不一定经过汇总,可直接取得;(4)一个完整的统计指标,一定要讲时间、地点、范围,而标志一般不具备时间、地点等条件。 指标与标志的联系:(1)有许多统计指标的数值就是从总体单位的数量标志值汇总而来的; (2)两者存在着一定的变换关系,即由于研究目的不同,原来的统计总体如果变成总体单位了,则相应的统计指标也就变成数量标志了。 2、标志与标志值(会区分) 标志分为品质标志与数量标志,数量标志用来说明总体单位量的特征,可以用数值表示,即为标志值(如:年龄、工资额、身高) 3、变异与变量(会什么就是变异,什么就是变量) 变异:品质标志在总体单位之间的不同具体表现。如:性别表现为男、女,民族表现为汉、满、蒙等。 变量:数量标志抽象化即为变量,而数量标志的不同具体表现则称为变量值(或标志值)。如:某职工的年龄就是42岁,月工资2200元。 4、统计指标的划分 (1)统计指标按其所反映的总体内容的不同,可分为数量指标与质量指标。数量指标指说明总体规模与水平的各种总量指标。质量指标指反应现象总体的社会经济效益与工作质量的各种相对指标与平均指标。 (2)统计指标按其作用与表现形式的不同,有总量指标(绝对数)、相对指标(绝对数)、平均指标(平均数)三种。 第二章统计调查与整理 一、统计调查的含义 统计调查就是统计工作过程的第一阶段。它就是按照统计任务的要求,运用科学的调查方法,有组织的向社会实际搜索各项原始资料的过程。统计调查就是整个统计认识活动的基础,决定着统计认识过程及其结果的成败。 二、统计调查方案设计的内容+调查对象、调查单位的含义 ⒈确定调查目的;(为什么调查) 根据实际需要与可能确定 ⒉确定调查对象与调查单位;(向谁调查) 调查对象——社会现象的总体 调查单位——调查标志的承担者(总体单位)

统计学基础知识及其概念

一、概念篇 总体:总体是指客观存在的,在同一性质基础上结合起来的许多个别事务的整体,亦称统计总体。 总体单位:总体单位是指构成统计总体的个别事物的总称。 指标:指标是反映总体现象数量特征的概念。 标志:标志是说明总体单位特征的名称。 统计调查:是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集统计资料的过程。 调查对象:是根据调查目的、任务确定的调查的范围,即所要调查的总体,它是由某些性质上相同的许多调查单位所组成的。 调查单位:是所要调查的现象总体中的个体,即调查对象中的一个一个具体单位,它是调查中要调查登记的各个调查项目的承担者。 报告单位:是负责向统计调查机关提交调查资料的单位。 普查:是专门组织的一次性的全面调查,用来调查属于一定时点上或时期内的现象的总量。 抽样调查:是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或称为随机抽样。 抽样调查是抽取总体重的部分单位,收集这些单位的信息,用来对总体进行推断的调查方法。这里的总体是指抽样推断所要认识的研究对象的整体,它是由所要研究的范围内具同一性质的全体单位所组成的整体。被抽中的部分单位构成样本。一般的,将总体记作N,将样本记作n。 面谈访问法:是由访问员与被调查者见面,通过直接访问来填写调查问卷的方法。 统计整理:是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化,从而得到反映总体特征的综合资料的过程。 复合分组:对同一总体选择两个或两个以上的标志重叠起来进行分组。 复合分组体系:多个复合分组组成的分组体系。 频数:是指分配数列中各组的单位数,也称次数。 频率:是将跟组的单位数(频数)与总体单位数相比,求得的用百分比表示的相对数,也称比率或比重。 统计指标:是反映总体现象数量特征的基本概念及其具体数值的总称。 总量指标:是反映总体规模的统计指标,表明现象总体发展的结果。 平均指标:是总体各单位某一数量标志一般水平的统计指标。 是将一个总体内各个单位在某个数量标志上的差异抽象化,以反映总体的一般水平的综合指标。 标志变异指标:是表明总体各个单位标志值的差异程度(离散程度)的指标。 强度相对指标:是不属于同一总体的两个性质不同但相互间有联系的总量指标对比的比值,是用来反映现象的强度、密度和普遍程度、利用程度的综合指标。 加权算数平均数:是在总体经过分组形成变量数列(包括单项数列和组距数列),有变量值和次数的情况下,将各组变量值分别与其次数相乘后加总求得标志总量,再除以总体单位数(即次数总和)而求得的数值。 标准差:是总体各单位变量值与其平均数的离差平方的算术平均数的平方根。 发展速度:是表明社会经济现象发展程度的相对指标,它是根据两个不同时期发展水平对比求得,说明报告期水平是基期水平的几倍或百分之几,常用倍数或百分数来表示。由于所采用的基期不同,发展速度又可分为定基发展速度和环比发展速度。 概率抽样:概率抽样在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具代表性。 比例分析法:比例分析法又名“比率分析法”,是用倍数或百分比表示的分数式,即通过计算相关指标之间的相对比值,来揭示和对比不同规模、不同性质事物的水平和效益的好坏,或分析部分和整体之间比例关系的分析方法。 国家统计报表制度:国家统计报表制度是各级政府统计部门实施国家统计调查项目的业务工作方案,由国家统计局制定,或者由国家统计局和国务院有关部门共同制定。 现行国家统计报表制度分为周期性普查制度、经常调查制度和非经常性调查制度三大类。 周期性普查制度:是国家统计报表制度的一个类型,是就我国社会经济发展的状况,由国务院组织,每隔一段时

统计学原理考试知识点整理

第1章 绪论 1、统计的含义统计一词最基本的含义是对客观事物的数量方面进行核算和分析,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。 2、统计的特点P3 数量性 具体性 综合性 3、统计学的若干基本概念 总体与总体单位P10: 总体是指在某种共性的基础上由许多个别事物结合起来的整体,构成总体的个别事物叫总体单位; 总体的特征:同质性,大量性,差异性;总体的分类:有限总体与无限总体;标志、变异与变量P10: 标志,是指说明总体单位特征的名称。变异:总体单位之间品质和数量上的差异,即可变标志在总体各单位之间所表现出的差异。变量:可变的数量标志。 连续型变量与离散型变量联系和区别:连续型:变量值可作无限分割的变量离散型:变量值只能以整数出现的变量指标与标志P11 (指标,说明总体数量特征的概念)区别:第一,指标说明总体的特征,而标志则说明总体单位的特征。第二,指标只反映总体的数量特征,所有指标都要用数字来回答问题,没有用文字回答问题的指标。而标志既有反映数量也有反映品质。 第2 章统计调查 1、统计调查的含义及其在统计工作中的地位P13 含义:根据统计研究的目的,有组织、有计划地搜集统计资料的过程地位:是统计工作的第一阶段,是整个统计工作的基础一环 2、统计调查的基本原则P13-14 一、要实事求是,如实反映情况 二、要及时反映,及时预报 三、要数字与情况相结合 3、统计调查的组织形式:普查P14:含义:为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查、优缺点:,适用场合:主要用于一些重要项目呢的调查,如人口普查、耕地普查、基本单位普查、工业普查和库存普查等; 随机抽样调查P14:含义(按随机原则(机会均等原则)从总体中抽取部分单位进行调查,并借以推断和认识总体的一种统计方法)以及具体的抽样方法【第七章】系统抽样、多阶 简单随机、分层抽样、整群抽样、 段抽样)及适用场合;非随机抽样:含义(调查者有意识地或随意而 非随机地从总体中抽取部分单位进行调查的统计方法)以及具体的抽样方法P15 (重点抽样:只对总体中为数不多但影响颇大的重点单位进行研究的一种非

统计学课程知识点总结

1. 统计的研究对象的特点:数量性,总体性,变异性。 2. 统计研究的基本环节:统计设计,收集数据,整理与分析,统计资料的积累、开发与应用。 3. 统计总体:根据一定数目的确定的所要研究的的事物的全体。特点:同质性、大量性。 总体可分为有限总体和无限总体。 标志:总体各单位普遍具有的属性或特征。标志分为品质标志(表明单位属性,用文字、语言描述)和数量标志(表明单位数量,用数值表现)。 不变指标:一个总体中各单位有关标志的具体表现都相同。变异指标:在一个总体中,当一个标志在各单位的具体表现有可能都相同。 第二章 1. 统计调查方式:普查,抽样调查,重点调查,定期报表制度。 调查方式按调查的范围划分,可分为全面调查和非全面调查。 按时间标志可分为连续性(经常性)调查和不连续性(一次性)调查 (一) 普查是专门组织的一种全面调查。特点:非经常性调查、最全面调查。 (二) 抽样调查是一种非全面性调查,可分为概率调查和非概率调查。 (三) 重点调查是指在调查对象中,只选择一部分重点单位进行的非全面调查,它是一种不连续的调查。 (四) 定期报表制度又称统计报表制度,它是依照国家有关法规,自上而下地统一布置,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上逐级地定期提供统计资料的一种调查方式。 2. 我国现行的统计调查体系:以必要的周期性普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分定期报表综合运用的统计调查方法体系。 3.调查对象是指需要调查的现象总体。调查单位是指所要调查的具体单位,它是进行调查登记的标志的承担者。 4. 统计分组的原则:穷尽原则和互斥原则。 (先分后组) 间断型分组和连续型分组,等距和异距注意事项 第三章 1. 简单算术平均数121 n i n i x x x x x n n =++ +== ∑ 2. 加权算术平均数 11221121 n i i n n i n n i i x f x f x f x f x f f f f ==+++== +++∑∑ 3. 组距数列的算术平均数 4. 相对数的算术平均数 5. 调和平均数 6. 几何平均数 7. 算术平均数的性质: 1 1 , ()0n n i i i i nx x x x ===-=∑∑ 8. 组距数列的众数112O O O M M M L d ?=+??+? 9. 组距数列的中位数12e e e e M e M M M f S M L d f --=+?∑ 11. 方差(注意与样本方差的区别)P102: 10,11题 第四章 1. 事件的关系和运算:包含 ,相等 ,和 ,差 ,积 ,逆 ,不相容 。 2. 概率的计算:古典概型 ,几何概型 加法法则 ,乘法公式 条件概率 ,全概率与贝叶斯公式 3. 常见的随机变量的期望与方差

统计学基础知识

一、数据的特征值 (一)数据的位置特征值 1)平均值 如果从总体中抽取一个样本,得到一批数据x 1,x 2,x 3….x n ,则样本的平均值x 为: n-数据个数; x i -第i 个数据数; ∑-求和。 2)中位数 有时,为减少计算,将数据x 1,x 2,x 3….x n 按大小次序排列,用位居于正中的那个数或中间两个数的平均值(当数据为偶数时)表示数据的总体平均水平。 3)中值M 测定值中的最大值x max 与最小值x min 的平均值,用M 表示。 4)众数 在用频数分布表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,频数最多的区间代表值(一般取区间中值)也称众数。 (二)数据的离散特征值 1)极差R 测定值中的最大值x max 与最小值x min 之差称为极差。通常R 用于个数n 小于10的情况下,n 大于10时,一般采用标准偏差s 表示。 2)偏差平方和S 各测定值x i 与平均值 之差称为偏差。各测定值的偏差平方和称为偏差平方和,简称平方和,用S 表示。 无偏方差 各个测定值的偏差平方和除以(n-1)后所得的值称为无偏方差(简称方差),用s 2表示: ~ x _x _ x ∑ =--=-=n i i x x n n S s 1 2 _2)(1112 _ 2 _ 22 _ 1)(...) () (x x x x x x n -+-+-∑=-n i i x x 1 2 _ )(S = =

标准偏差s 2 (三)变异系数 以上反映数据离散程度的特征值,只反映产品质量的绝对波动大小。在工程实践中,测量较大的产品,绝对误差一般较大,反之亦然。因此要考虑相对波动的大小,在统计技术上 上式中σ和μ为总体均值和总体标准差,当过程在受控状态下,且样本容差较大时,可用样本标准差s 和样本均值 估计。 _x

统计学基础知识

第1章基本概念 本章主要内容 总体样本 统计量参数 资料类型 概率频率 1.1 统计学的基本概念 统计学和统计数字在英语中共用statistics一词作为复数名词意指统计数字作为单数名词表示统计学这个词源于state可见早期的统计数字是指官方所要求的信息现在 仍然如此但不限于此各行各业都有大量的统计数字其中蕴涵着丰富的信息Webster国际大词典第三版中说统计学是 a science dealing with the collection, analysis, interpretation and presentation of masses of numerical https://www.doczj.com/doc/c72994744.html,st JM主编的一本词典中统计学是the science and art of dealing with variation in data through collection, classification and analysis in such a way as to obtain reliable results从上面对统计学的定义中我们不难看到统计学至少含有如下三方面的内容第一统计学是处理资料中变异性的科学和艺术第二统计学的目的在于取 得可靠性的结果其求实性毫不含糊第三统计学是在搜集归纳分析和解释大量数据 的过程中完成使命的 简单地讲统计学是研究数据的搜集整理与分析的一门科学 在信息社会的今天统计学的原理与方法几乎应用于科技的所有领域产生了许多应用性分 支如工业统计卫生统计商业统计等等 一般而言统计工作的基本过程的主要包括设计搜集资料整理资料分析资料 1.2 统计学中的基本概念 1.2.1 总体与样本 总体(population)根据研究目的确定的同质观察单位的全体 总体的调查应包括内容单位范围时间 有限总体只包含有限个观察对象的总体 无限总体观察对象无限的总体 个体构成总体的基本单位 样本(sample)从总体中随机抽取部分观测单位其实测值的全体 调查总体对总体进一步限制使对总体的调查具备可操作性 在市场调查中问卷中的每一个题目都代表着一个特定的总体 如某次调查被访者均为20~30岁男性居民样本量为400 题目Q1 当您想到洋酒时您最先想到的品牌是什么 总体为该市20~30岁男性居民最先想到的洋酒品牌的全体 样本这400个被访者首先想到的品牌的全体 题目Q2 您的个人收入是多少 总体该市20~30岁男性居民的个人收入的全体 样本这400个被访者的个人收入 由此可见界定总体一个是甄别条件一个是指标

北邮大统计学基础第二次阶段作业

一、单项选择题(共10道小题,共100.0分) 1.某地区工业总产值20055年为40亿元,2010年为60亿元,其年平均 发展速度为( )。 A. B. C. D. 知识点: 第五章 学生答 案: [A;] 得分: [10] 试题分 值: 10.0 提示: 2.某企业上半年每月初工人人数资料如下: 1月1日4月1日6月1日7月1日610人668人680人690人则该企业上半年月份工人平均人数为( )。 A.(610+668+680)÷3 B.(1/2×610+668+680+1/2×690)÷3 C. D.(610+668+680+690)÷4 知识点: 第五章 学生答 案: [C;]

得分: [10] 试题分 值: 10.0 提示: 3.下列数列中哪一个属于时间数列( )。 A.学生按学习成绩分组形成的数列 B.工业企业按地区分组形成的数列 C.职工按工资水平高低排列形成的数列 D.出口额按时间先后顺序排列形成的数列 知识点: 第五章 学生答 案: [D;] 得分: [10] 试题分 值: 10.0 提示: 4.某公司下属五个企业,共有2000名工人。已知每个企业某月产值计划完 成百分比和实际产值,要计算该公司月平均产值计划完成程度,采用加权调和平均数的方法计算,其权数是( )。 A.计算产值 B.实际产值 C.工人数 D.企业数 知识点: 第四章 学生答 案: [B;] 得分: [10] 试题分 值: 10.0 提示: 5.若根据同一分组资料计算简单算术平均数和加权算术平均数,结果相同, 则可推定( )。 A.各组权数相等 B.各组权数不等 C.各组权数不起作用 D.变量值大致相等 知识点: 第四章

统计学重点知识点

基本统计方法 第一章 概论 1. 总体(Population ):根据研究目的确定的同质对象的全体(集合);样本(Sample ):从总体中随机抽取的部分具有代表性的研究对象。 2. 参数(Parameter ):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量(Statistic ):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。 3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。 第二章 计量资料统计描述 1. 集中趋势:均数(算术、几何)、中位数、众数 2. 离散趋势:极差、四分位间距(QR =P 75-P 25)、标准差(或方差)、变异系数(CV ) 3. 正态分布特征:①X 轴上方关于X =μ对称的钟形曲线;②X =μ时,f(X)取得最大值;③有两个参数,位置参数μ和形态参数σ;④曲线下面积为1,区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。 4. 医学参考值范围的制定方法:正态近似法:/2X u S α±;百分位数法: P 2.5-P 97.5。

第三章 总体均数估计和假设检验 1. 抽样误差(Sampling Error ):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。抽样误差不可避免,产生的根本原因是生物个体的变异性。 2. 均数的标准误(Standard error of Mean, SEM ):样本均数的标准差,计算公式: X σσ=误差的大小。 3. 降低抽样误差的途径有:①通过增加样本含量n ;②通过设计减少S 。 4. t 分布特征: ①单峰分布,以0为中心,左右对称; ②形态取决于自由度ν,ν越小,t 值越分散,t 分布的峰部越矮而尾部翘得越高; ③当ν逼近∞,X S 逼近X σ, t 分布逼近u 分布,故标准正态分布是t 分布的特例。 5. 置信区间(Confidence Interval , CI ):按预先给定的概率(1-α)确定的包含总体参数的一个范围,计算公式:/2,X X t S αν±或/2,X X u S αν±。95%CI 含义:从固定样本含量的已知总体中进行重复抽样试验,根据每个样本可得到一个置信区间,则平均有95%的置信区间包含了总体参数。 6. 假设检验的基本原理:小概率反证法的思想。 ①反证法:从问题的对立面(H 0)出发间接判断要解决的问题(H 1)

统计学知识点梳理

复习提纲:(计算部分全用红色标注了!其他红色的是我的推断,可能出什么题型;有下划线的重点记忆!当然整理的知识点都是重点!都要背和理解!Fighting!) 第一章绪论 一.统计的含义 即统计工作、统计资料和统计学 统计工作:统计实践活动,搜集,整理,分析和提供关于社会现象数字资料工作总称 统计资料:统计实践活动过程中所取得的各项资料,包括原始资料和加工整理资料 统计学:关于认识客观现象总体数量特征和数量关系的科学 二.统计工作过程 就一次统计活动来讲,一个完整的认识过程一般可以分为统计调查、统计整理和统计分析三个阶段。

统计调查:第一阶段,是认识客观经济现象的起点,是统计整理和统计分析的基础。 统计整理:第二阶段,处于统计工作的中间环节,起着承前启后的作用。 统计分析:第三阶段,通过第三阶段,事物由感性认识上升到理性认识。 三.总体与总体单位(会辨析总体与总体单位即可) 总体,亦称统计总体,是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体;构成总体的这些个别单位称为总体单位。 总体由总体单位构成,要认识总体必须从总体单位开始,总体是统计认识的对象。 例如:所有的工业企业就是一个总体,其中的每一个工业企业就是一个总体单位。 四.标志和指标 标志是用来说明总体单位特征的名称。 指标,亦称统计指标,是说明总体的综合数量特征的。一个完整的统计指标包括数量指标名称和指标数值两部分。(以上内容理解即可) 1.指标和标志的区别和联系(简答) 指标与标志的区别:(1)指标是说明总体特征的,而标志是说明总体单位特征的;(2)指标都能用数值表示,而标志中的品质标志不能用数值表示,是用属性表示的;(3)指标数值是经过一定的汇总取得的,而标志中的数量标志不一定经过汇总,可直接取得;(4)一个完整的统计指标,一定要讲时间、地点、范围,而标志一般不具备时间、地点等条件。 指标与标志的联系:(1)有许多统计指标的数值是从总体单位的数量标志值汇总而来的;(2)两者存在着一定的变换关系,即由于研究目的不同,原来的统计总体如果变成总体单位了,则相应的统计指标也就变成数量标志了。 2.标志与标志值(会区分) 标志分为品质标志和数量标志,数量标志用来说明总体单位量的特征,可以用数值表示,即为标志值(如:年龄、工资额、身高) 3.变异与变量(会什么是变异,什么是变量) 变异:品质标志在总体单位之间的不同具体表现。如:性别表现为男、女,民族表现为汉、满、蒙等。 变量:数量标志抽象化即为变量,而数量标志的不同具体表现则称为变量值(或标志值)。如:某职工的年龄是42岁,月工资2200元。 4.统计指标的划分 (1)统计指标按其所反映的总体内容的不同,可分为数量指标和质量指标。数量指标指说明总体规模和水平的各种总量指标。质量指标指反应现象总体的社会经济效益和工作质量的各种相对指标和平均指标。 (2)统计指标按其作用和表现形式的不同,有总量指标(绝对数)、相对指标(绝对数)、平均指标(平均数)三种。 第二章统计调查与整理 一.统计调查的含义 统计调查是统计工作过程的第一阶段。它是按照统计任务的要求,运用科学的调查方法,有组织的向社会实际搜索各项原始资料的过程。统计调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败。 二.统计调查方案设计的内容+调查对象、调查单位的含义 ⒈确定调查目的;(为什么调查) 根据实际需要和可能确定

统计学基础知识考试重点

统计学基础知识考试重点 第一章统计和数据 第二章 ●统计是用来处理数据的,是关于数据的一门学问。 1、统计学:是用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。 2、统计分析数据的方法分为:(1)描述统计(2)推断统计 3、描述统计:是研究数据搜集、处理和描述的统计学方法。 4、推断统计:是研究如何利用样本数据来推断总体特征的统计学方法。 5、推断统计包括:(1)参数估计(2)假设检验 6、定性变量的特点: 只反映现象的属性特点,不能说明具体量的大小和差异。 ●定性变量包括分类变量和顺序变量。 ●只反映现象分类特征的变量称分类变量。分类变量没有数值特征,所以不能对其数据进行数学运算。 ●如果类别具有一定的顺序,这样的变量称为顺序变量。顺序变量不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。 7、定量变量的特点: 可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异。 ●数值型数据(定量数据)作为统计研究的主要资料,其特征在于它们都是以数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差,而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差。其计量精度远远高于定性数据。在统计学研究中,数值型数据有着最广泛的用途。 8、数据按获取的方法不同分为:(1)观测数据(2)实验数据 9、观测数据:是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。 10、实验数据:一般是在科学实验环境下取得的数据。 11、统计数据资料的来源: (1)通过直接的调查或实验获得的原始数据,这是统计数据的直接来源; (2)别人调查的间接数据,并将这些数据进行加工和汇总后公布的数据,这是数据的间接来源。 12、数据的直接来源:(1)统计调查(2)实验法 ●通过统计调查得到的数据,一般称为观测数据。 ●运用实验法时,实验组和对照组的产生应当是随机的。 13、数据的间接来源:

《统计学基础知识》试题答案

《统计学基础知识》试题答案 一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。本题共40分,每小题1分。) 1(统计调查方案中的调查工作期限是指( )。 A(调查工作的起止时间 B(搜集资料的时间 C(时期现象资料所属的时间 D(时点现象资料所属的时间 2(有意识地选择几个城乡结合部地区调查外来流动人口在本市的生活状况,这种调查方式属于( )。 A(典型调查 B(重点调查 C(抽样调查 D(普查 3(对职工的生活水平状况进行分组研究,正确地选择分组标志应当用( )。 A(职工月工资总额 B(职工人均月收入额 C(职工家庭成员平均月收入额 D(职工的人均月岗位津贴及奖金数额 4(次数分布中的次数是指( )。 A(划分各组的数量标志 B(分组的组数 C(分布在各组的总体单位数 D(标志变异个数 5(某连续变量分为5组:第一组为40~50,第二组为50~60,第三组为60~70,第四组为70~80,第五组为80以上。依习惯上规定( )。 A(50在第一组,70在第四组 B(60在第二组,80在第五组

C(70在第四组,80在第五组 D(50在第二组,80在第四组 6(一个开口组距数列最大组的下限为600以上,其相邻组的下限为400,则该数列最大组的组中值应为( )。 A(500 B(650 C(700 D(800 7(时点指标的数值( )。 A(与其时间间隔长短无关 B(通常连续登记 C(时间间隔越长,指标数值越大 D(具有可加性 8(一个企业产品销售收入计划增长5,,实际增长9,,则计划超额完成程度为( )。 A(4, B(180, C(103.81, D(3.81, 9(将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为( )。 A(动态相对指标 B(结构相对指标 C(比例相对指标 D(比较相对指标 10(两个总体的平均数相等,标准差不等,若比较两总体平均数的代表性,以下说法正确的是( )。 A(标准差大的,代表性大 B(标准差小的,代表性大 C(标准差小的,代表性小 D(两平均数的代表性相同 11(加权算术平均数中权数的实质是( )。 A(各组的单位数 B(总体单位数 C(各组的单位数占总体单位数的比重

统计学贾俊平考研知识点总结

统计学重点笔记 第一章导论 一、比较描述统计和推断统计: 数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。 (1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。 (2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。 (3)两者的关系:描述统计是基础,推断统计是主体 二、比较分类数据、顺序数据和数值型数据: 根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。 (1)分类数据是只能归于某一类别的非数字型数据。它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。 (2)顺序数量是只能归于某一有序类别的非数字型数据。也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。 (3)数值型数据是按数字尺度测量的观察值。其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。 总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。 三、比较总体、样本、参数、统计量和变量: (1)总体是包含所研究的全部个体的集合。通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体。有限总体是指总体的范围能够明确确定,而且元素的数目是有限可数的,需要注意的是,统计意义上的总体,通常不是一群人或一些物品的集合,而是一组观测数据。 (2)样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量。例如我们从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。

统计学知识点全归纳全面准确

统计学知识点汇总 一、统计学 统计学是一门关于数据资料的收集、整理、分析和推断的科学。 二、统计学的产生与发展 (1)政治算术学派 最早的统计学源于17世纪英国。其代表人物是威廉·配第,代表作《政治算术》。政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,为统计学的发展开辟了广阔的前景。其被称为“无统计学之名,有统计学之实”。 (2)记述学派 亦称国势学派,创始人和代表人物是德国康令和阿亨瓦尔,主要使用文字记述方法对国情国力进行研究,其学科内容与现代统计学有较大差别。因此被称为“有统计学之名,无统计学之实”。 (3)社会统计学派 创始人和代表人物,德国恩格尔和梅尔。该学派主张统计是实质性的研究社会现象的社会科学,认为统计学的研究对象是社会现象,目的在于明确社会现象内部的联系联系和相互关系。 (4)数理统计学派 创始人是比利时统计学家凯特勒,他所著的代表作《社会物理学》等将概率论和统计方法引入社会经济方面的研究,其认为统计学是一门通用的方法论科学。 从19世纪中叶到20世纪中叶,数理统计学得到迅速发展。到20世纪中期,数理统计学的基本框架已经形成,数理统计学派成为英美等国统计学界的主流。 三、统计的特点 (1)数量性: 社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之

间的数量关系和质量互变的数量界限。 (2)总体性: 社会经济统计的认识对象是社会经济现象的总体的数量方面。例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。 (3)具体性: 社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。 (4)社会性: 社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。 四、统计工作过程 (1)统计设计 根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。(2)收集数据 统计数据的收集有两种基本方法,实验法和调查法。 (3)整理与分析 描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。 推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。 (4)统计资料的积累、开发与应用

相关主题
文本预览
相关文档 最新文档