当前位置:文档之家› 统计学讲义

统计学讲义

统计学讲义
统计学讲义

东南大学统计学辅导班笔记

总论

本章学习重点:本章是全课程的总纲,主要讲述统计学的对象和方法、统计的作用和统计学的基本概念。

本章学习难点:是统计学概念的理解和运用以及概念之间的相互关系。

第一节统计学的性质与作用

一、“统计”一词的含义

统计是一种社会调查活动,不论是宏观社会的整体调查研究,还是微观事物的观察分析,都需要统计。在日常生活中“统计”有着多种含义。例如,开学时,辅导员要统计一下到校的学生人数;篮球比赛中教练员要统计每个队员的投篮命中率、犯规的次数;农户在农作物收获后统计其产量等。这时“统计”是一个动词,我们一般称其为统计工作,它是指搜集、整理和分析数字资料的工作,具有计数的含义。

统计工作的结果形成一系列的数字资料,也称统计资料或统计数据,这是“统计”的另一个含义。它和前面讲的统计工作是紧密相连的,是统计工作的结果。例如,我们班的学生人数120人,女生占30%,男女生的比例为2.33:1等。国家统计局每年出版统计年鉴,反映国家的经济、文化教育以及科技发展等情况,这些都是在这个意义上的统计。

除了上面所讲的两个方面的含义之外,“统计”一词还有另外的含义,即作为一门科学的统计学,它是研究客观现象的数量方面的科学。

“统计”一词虽有上述三方面的涵义,但它们之间又是具有密切联系的。统计资料是统计工作的成果,统计学是统计实践活动的经验总结和理论概括,统计工作是在统计理论的指导下进行和完成的。

二、统计学的性质

1.统计学研究的对象是客观现象的数量方面。早期统计所研究的问题有人口调查、出生与死亡的登记等,后来又扩大到社会经济和生物实验等方面。目前不论社会的、自然的、或实验的,凡是有大量数据出现的地方,都要用到统计学。凡能以数量来表现的均可作为统计学的研究对象。统计方法已渗透到其他科学领域,成为当前最活跃的学科之一。

2.统计学研究的是总体现象的数量特征与规律性。统计学所研究的是总体的数量特征及其分布的规律性。总体是由许多个体组成的,各个个体在数量特征上受必然和偶然两种因素的支配,必然因素反映了该总体的特征,但由于受偶然因素的影响又是有差异的,如何通过这些个体的差异来描述或推断总体的特征就产生了统计学。

3.统计学是一门方法论的科学。在统计学界对统计学的性质有实质性科学和方法论科学之争。我们认为统计学是实用性很强的方法论科学,就统计工作来说,它总是研究实际问题的,统计的方法也是从现实问题中产生的。然而统计学的发展有一个过程,早期的国势学派和政治算术学派虽然也利用一些统计方法来记述和分析现实问题,但这时还没有形成独立的统计学。随着统计方法的应用日益广泛,其内容也不断发展和充实,尤其是概率论的发展为统计方法提供了理论基础,使统计的方法相对独立地形成了自己的科学体系,即统计学。其内容包括如何去搜集资料,如何对搜集的资料加以整理、概括和表示,以及如何对取得的数据进行分析和推断等一系列方法。这些方法和原理构成了统计学的基本内容。目前统计方法已成为科学研究和各种管理的重要工具,它是一门年轻而引人入胜的科学,并且还在不断地发展。

三、统计的作用

(1)为党和国家各级领导机构决策和执行服务;

(2)为企业单位、社会事业单位进行管理服务;

(3)为广大人民了解情况、参与社会经济活动、提高思想水平服务;

(4)为科研机构和人员进行理论研究服务;

(5)为各国人民相互了解、发展国际交流合作服务。

国家管理系统的决策、执行、信息、咨询、监督五个环节中,统计在信息、咨询、监督三个环节中具有重要的作用,因而往往将信息、咨询、监督称为统计的三大职能,其实统计的各项具体作用都是在统计信息的基础上派生出来的。

第二节统计学的理论基础和研究方法

一、统计学的理论基础

社会经济统计学是一门社会科学,它以马克思主义哲学和政治经济学作为自己的理论基础。坚持以马列主义的理论为指导,运用唯物辩证的方法,研究社会经济发展的新情况和新问题、总结新经验,是做好统计工作,发展统计学的根本保证。

二、统计的研究方法

1、大量观察法。统计要认识社会经济现象发展的特征和规律性,必须从总体上(其含义包括“全及总体”和“抽样总体”)进行观察,即对研究总体的全部或足够多数单位进行调查并进行综合分析,这种方法称为大量观察法。这是由统计研究对象的大量性和复杂性决定的。大量复杂的社会经济现象是在诸多因素的综合作用下形成的,各单位的特征及其数量表现有很大的差别,不能任意抽取个别或少数单位进行观察。必须在对被研究对象的全面分析的基础上,确定调查对象的范围,观察全部或足够多数的调查单位,借以对客观现象的规律性有所了解。运用大量观察法对同类社会经济现象进行调查和综合分析,使次要的、偶然的因素作用相互抵消,从而排除其影响,以研究主要的共同起作用的因素所呈现的规律性。统计调查中的许多方法,如统计报表、普查、抽样调查、重点调查等,都是对大量单位进行观察研究,来了解社会经济现象及其发展情况的。

2、综合分析法。综合分析法,是指对大量观察所获得的资料,运用各种综合指标的方法,以反映总体一般的数量特征,并对综合指标进行分解和对比分析,以研究总体的差异和数量关系。对大量原始数据进行整理汇总,计算

各种综合指标,以显示出现象在具体时间、地点以及各种因素共同作用下所表现的规模、水平、集中趋势和差异程度等,概括地描述总体的综合特征和变动趋势。常用的综合指标有,总量指标、相对指标、平均指标、变异指标、动态指标等。

3、统计分组法。根据统计研究的任务和事物内在的特点,将被研究的社会经济现象划分为性质不同的几个部分,称为统计分组法。分组法是统计整理阶段的专门方法,也是贯穿统计研究全过程的方法。通过对总体各个不同组成部分及其相互关系的分析,可以补充、丰富和深化对总体的认识。

4、归纳推断法。所谓归纳是指由个别到一般,由事实到概括的推理方法。归纳法可以使我们从具体的事实得出一般的知识,扩大知识领域,增长新的知识,所以是统计研究中常用的方法。(区别于演绎法,是由一般到个别,由全体到个体)

第三节统计学的基本范畴

一、统计总体与总体单位

(一)概念

统计总体和总体单位,又可以简称为总体和个体,是反映统计认识对象的基本概念。

凡是客观存在的,在同一性质基础上结合起来的许多事物的整体,就是统计总体。组成统计总体的个体称为总体单位。例如,一个工业企业,有以职工为单位组成的职工总体,有以每台设备组成的设备总体,有以产品为单位组成的产品总体,有以销售行为为单位组成的销售总体等。

总体和个体是多种多样的,常见的主要有两种,即:以某种客观存在的实体为单位组成的总体,如以个人、家庭、学校、设备、产品、商品等为单位组成的总体称作实体总体;以某种行为、事件为单位组成的总体,如买卖行为、工伤事故、犯罪事件、体育活动等为单位组成的总体称作行为总体。

一个统计总体中所包括的总体单位数可以是无限的,这样的总体称为无限总体;也可以是有限的,则称为无限总体。在社会经济现象中统计总体大多是有限的。在统计调查中,对无限总体不能进行全面调查,只能调查其中一小部分单位,据以推断总体。对有限总体既可作全面调查,也可只调查其中的一小部分。例如职工普查(全面)及职工抽查(小部分)。凡是调查总体的一小部分单位时,往往要根据局部资料来推算全体。为了保证推算的准确性,必须设法使局部资料具有较高的代表性。提高这种代表性的一个重要方法,就是使局部资料尽量能多包括一些单位。因为所包括的单位数如果太少,就会出现偏高或偏低的偶然现象,降低了代表性,如果单位数增多,这种偶然偏差就趋于互相抵消,从而提高了代表性,有可能据以显现出总体的真象来。例如,某市职工是一个总体,每个职工是一个总体单位,如果要了解该市职工工资的一般水平,只抽查少数几个职工是不行的,因为所抽查的那几个职工的工资可能偏高或偏低,不能代表全体。但如果抽查足够多的职工求其平均工资,则偶然性的偏差就会大大减少,就可得出比较可靠的数据。

(二)特点

统计总体的形成必须具备一定的条件,作为统计研究具体对象的统计总体,其形成条件主要有三条:

第一,同质性。组成统计总体的所有单位必须是在某些性质上是相同的,例如工业企业总体,必须是由进行工业生产经营的基层单位组成的。如果是国有工业企业总体,便又多了一个所有制性质上的相同标志,它的范围便小于工业企业总体了。或数量标志数值;

第二,大量性。统计总体是由许多总体单位构成的。小型总体(抽样总体)的单位数要足够多;

第三,差异性。构成总体的各单位除了同质性一面还必须有差异性一面,否则便不需要进行统计调查研究了。例如职工总体中的每个职工,在工种、性别、年龄、文化程度、工资等方面都有差异,这样才构成社会经济统计调查的内容。

这三个条件缺一不可,必须同时具备,才能形成统计总体。

(三)关系

总体和总体单位不是固定不变的,随研究目的不同,它们是可以变换的。(judgement)例如,我们研究某市机械工业状况,每个机械厂则是这个总体中的一个单位。如果我们把研究领域扩大为以工业局为单位的全部工业,则机械工业局即为总体单位。

二、标志与指标

(一)概念

标志是说明总体单位(个体)属性和特征的名称。例如,当我们研究的总体是我国煤炭工业的状况时,每个煤炭工业企业是总体单位,企业的经济类型、职工人数、产量等都是每个煤炭工业企业具有的标志。

标志按其表现形式有数量标志与品质标志两种。凡是表示总体单位数量特征的标志,称数量标志。它能用数量来表示,如企业的职工人数、产量、产值;职工的年龄、工龄、工资等。凡是表示总体单位质的特征的标志,称品质标志。如职工的性别、企业的经济类型、工人的工种等。标志的具体表现是在标志名称之后所表明的属性或数值,如某职工的性别是女,民族是汉族。这里的“性别”和“民族”是品质标志名称。而“女”和“汉族”是这类标志的属性的具体表现。又如该工人的年龄是35岁,工资是96元,则“年龄”和“工资”是数量标志的名称,而“35岁”和“96元”则是它们的数值表现。

统计指标是说明总体特征的。对统计指标的概念,有两种理解和使用方法。一种情况是把说明总体数量特征的名称,如全国总人口、工资总额、谷物总产量等等叫做统计指标。这是统计指标的设计形态。我们在讨论统计理论和进行统计设计时所说的统计指标,就属于这一种。另一种是把指标名称和具体时间地点的统计数值结合起来,如某年末全国总人口118517万人,北京市职工工资总额202.5亿元,河北省谷物总产量2136.4万吨等等,叫做统计指标。这是统计指标的完成形态,在实际工作中对统计数据进行加工整理、分析研究时所说的统计指标是指后一种。

(二)关系(as judgement)

1.指标与标志的区别:

(1)指标是说明总体特征的,而标志则是说明总体单位特征的。

(2)标志有不能用数值表示的品质标志与能用数值表示的数量标志,而指标都是用数值表示的,没有不能用数值表示的统计指标。

2.指标与标志的联系:

(1)有许多统计指标的数值是从总体单位的数量标志值汇总而来的,如一个煤炭工业局(公司)的煤炭总产量,是从所属各煤炭工业企业的产量汇总出来的。

(2)指标与标志(数量标志)之间存在着变换关系。由于研究的目的不同,原来的统计总体如果变成总体单位,则相对应的统计指标也就变成数量标志,反之亦然。

(比如:如果调查研究各分支煤炭工业企业的产量情况,那么分支企业是总体指标,如果转为研究煤炭工业局的总产量情况,那么各分支公司就成了个体标志)

三、变异与变量

统计中的标志与指标的具体表现各不相同,如性别标志表现为男、女,年龄标志表现为不同的年岁,劳动生产率标志表现为不同的生产水平等,这种差别称作变异,变异是普遍存在的,这是统计的前提条件,有变异才有统计,没有变异就用不着统计。

可变的数量标志和所有的统计指标称为变量。变量的具体表现称作变量值。如年龄这个数量标志,其标志值可以是20,30,40,50等。在这里把数量标志年龄称为变量,而把标志值20,30,40,50等称为变量值。某地区职工工资总额为指标(变量),其指标值1200万元为变量值。

变量按其变量值是否连续分为连续性变量与离散性变量。连续变量的数值都是连续不断的,相邻两值之间可取无限数值。例如,煤层厚度,煤层生产能力,产值等都是连续变量,其数值要用测量或计算的方法取得。离散变量的数值都是不连续的整数值,例如,职工人数、企业数、机器台数等,其数值的取得只能用计数的方法。

第四节统计指标与统计指标体系

在社会经济统计活动中,对事物的定量认识是从定性认识开始,并以定性为基础的。从定性认识到定量认识的过渡需要一架“桥梁”,这架“桥梁”便是统计指标、统计指标体系等。

一、统计指标

统计指标是社会经济统计活动和社会经济统计学中最重要的基本概念。统计正是用统计指标来反映总体的实际情况,并用统计指标来研究认识总体的发展变化情况、总体内部以及它和外部的数量关系。在社会经济统计中,统计指标占有中心地位,许多统计方法都是围绕统计指标而产生的。

(一)统计指标的概念和要素

统计指标的概念如前所述,它有两种理解和使用方法。一种情况是指说明总体数量特征的名称;一种情况是指说明总体数量特征的名称和指标数值。

统计指标,就其完成形态而言,由以下要素构成:第一,定性范围。包括指标名称和指标涵义。指标涵义要明确总体现象的质的规定性,包括时间标准和空间标准。例如,我国人口普查的总人口,其指标涵义是:指在规定的时点,具有中华人民共和国国籍的、在国内一定区域居住一年以上的人口总和。指标涵义比较复杂,指标名称是它的表现形式。第二,定量方法。包括计量单位和计量方法,是指标涵义的量化规范。例如,总人口的计量单位是一个人,全国总人口的计算方法是各地区人口加上现役军人的人口总数。第三,指标数值。根据定性规范和定量方法,经过实际调查和数据处理所取得的具体时间、具体空间的统计数值。

统计指标的设计形态只包括定性范围和定量方法两个要素,不包括指标数值。

(二)统计指标的特点和作用

第一,同质事物的可量性。没有质的规定性不能成为统计指标,有了质的规定性而不能用数量来表示也不能成

为统计指标。有些抽象度较高的社会经济概念是难以量化的,不能直接用来作为统计指标的名称,必须将它分解或转化为可以量化的概念才能成为统计指标。例如,我国大部分地区的人民生活正在发生又温饱上升到小康的阶段性变化,为了衡量是不是达到了小康水平,只有人均收入水平或人均消费水平是不够的,党中央和国务院已经提出“生活质量达到或超过中等收入国家水平”的要求。“生活质量”是怎样衡量呢?可以把它分解为:平均预期寿命、平均受教育年限、婴儿死亡率、每人每日摄取热量等等可以量化的概念,然后用一定的方法加以综合计算。这样,“生活质量”便成为一个统计指标了。

第二,量的综合性。统计指标反映的是总体的量,它是许多个体现象的数量综合的结果。一个职工的工资不能成为统计指标,一个企业或一个地区的工资总额或平均工资才成为统计指标。

第三,具体性。统计指标是现象总体在一定时间、地点条件下的数量特征的具体表现,不存在脱离质的内容的统计指标。

(三)统计指标的种类

1.统计指标按它所说明的总体现象内容的特征,可以分为数量指标和质量指标。

数量指标是反映总体某一特征的绝对数量。这类指标主要说明总体的规模、工作总量和水平,一般用绝对数表示。例如,某一地区的总人口、工业企业总数、国民生产总值等等。质量指标是反映总体的强度、密度、效果、结构、工作质量等,例如,人口密度、劳动生产率、资金利润率等。这类指标一般用平均数、相对数表示。这些质量指标的数值并不随总体范围的大小而增减。例如一个100 万人口的城市第三产业在国民生产总值所占的比重也可能小于某个30万人口的城市第三产业在国民生产总值中所占的比重。

2.统计指标按其具体内容和作用可以分为总量指标、相对指标和平均指标。

总量指标是反映总体现象规模的统计指标,它表明总体现象发展的结果。例如上述的总人口、国民生产总值等便是。相对指标是两个有联系的总量指标和平均指标相比较的结果,又分两种情况:同一指标不同时期的数值对比可以说明事物的发展变化,如人口增长率、成本降低率;用总体中部分数值与总体数值相比说明事物的内部结构,如三次产业在国民生产总值中所占比重。平均指标是按某个数量标志说明总体单位一般水平的统计指标,如平均工资、平均成本等等。

二总量指标

总量指标与相对指标(课本p84-96)

(一)、总量指标的意义

一)总量指标的概念

总量指标是指统计汇总后得到的具有计算单位的总和指标,反映被研究对象在一定时期或时点的规模、水平或性质相同总体规模的数量差异。一般用绝对数表示,又称绝对数指标。

二)计量单位

1.实物单位

实物指标表明现象总体的使用价值总量。它根据现象的自然属性和特点采用实物单位计量。实物单位有自然单位,度量衡单位,标准实物量单位,复合单位。

2.价值单位

价值指标表明现象总体的价值总量,它以货币单位计量。

3.劳动量单位

以劳动过程中消耗的劳动时间为计量单位,如工时、工日、人工数等,为成本核算和计算劳动生产率提供依据。

三)作用

1.从总体上认识社会经济现象的起点。

了解一个国家或地区的基本情况,从其基本状况和基本实力入手。

2.计算其它统计指标的基础。

统计综合指标中的相对指标,平均指标的计算都是以绝对数指标为基础计算的。

(二)总量指标的种类

1.按指标反映的具体内容划分为总体单位总量指标和总体标志总量指标

总体单位总量指标:是用来反映总体中单位数的多少,说明总体本身规模大小的总量指标。如:对某地区居民粮食消费情况进行研究,该地区的居民人口数便是总体单位总量指标。

总体标志总量指标:是用来反映总体中标志值总和的总量指标。如:上例中粮食消费总量便是总体标志总量指标。

总体单位总量指标和总体标志总量指标的地位随统计研究的目的而变化。如:研究该地区粮食消费价格,粮食消费总量变为总体单位总量指标了。

2.按指标反映的时间状况划分为时期指标和时点指标

时期指标:反映社会经济现象在一定时期内发展变化过程总量的指标,如:商品销售额、总产值、基本建设投资额等。

时点指标:反映社会经济现象在一定时点上状况的数量的指标,如:人口数、房屋的居住面积,企业数等。

时期指标和时点指标的特点(区别):

a.性质相同的时期指标的数值可以相加,时点指标相加则无意义。

b.同类时期指标数值的大小与时期长短有直接关系,时点指标则没有这种关系。

c.时期指标数值是经常登记取得,时点指标不是。区分时期指标和时点指标决定了统计处理与应用上的不同,在运用时期和时点指标时,注意同一指标若从不同的角度考虑则总量指标的性质也不同,如:年末人口数和年初人口数是时点指标,但年末人口数一年初人口数=人口净增数则为时期指标。

3.按指标采用的计量单位划分为价值指标、实物指标和劳动量指标

价值指标、实物指标和劳动量指标前面已经讲过,这里就不讲了。

(三)应用总量指标注意的问题(alte)

1.要有明确的计算范围、计量单位与口径。

2.现象的同类性。

三、相对量指标

(一)相对指标的意义

统计中,数字的作用在于进行比较和分析。“比较为统计之母”是有道理的,孤立的数字,不进行任何比较分析,不能说明任何问题。因此,对事物进行判断、鉴别和比较,就要借助于相对指标。

广东财经社会统计学期末考试试卷(A卷)

广东财经社会统计学期末考试试卷(A卷) 一、单项选择题(请将正确选项的序号填在答题纸相应的位置。) 1.社会统计中的变量一般分四个层次,其中最高层次的变量是 D 。 A、定类变量 B、定序变量 C、定距变量 D、定比变量 2.标准正态分布的均值一定 C 。 A、等于1 B、等于-1 C、等于0 D、不等于0 3.计算中位值时,对于未分组资料,先把原始资料按大小顺序排列成数列,然后用公式 D 确定中位值所在位置。 A、n/2 B、(n-1)/2 C、(n+2)/2 D、(n+1)/2 4.下列统计指标中,对极端值的变化最不敏感的是 A 。 A、众值 B、中位值 C、四分位差 D、均值 5.如果原假设是总体参数不小于某一数值,即大于和等于某一数值,应采用的检验是。 A、两端检验 B、右端检验 C、左端检验 D、无法判断 6.在一个右偏的分布中,大于均值的数据个数将。 A、不到一半 B、等于一半 C、超过一半 D、视情况而定 7.下列关于“回归分析和相关分析的关系”的说法中不正确的是。 A、回归分析可用于估计和预测 B、相关分析是研究变量之间的相互依存关系的密切程度 C、相关分析不需区分自变量和因变量 D、回归分析是相关分析的基础 8.假定男性总是与比自己年轻3岁的女性结婚,那么夫妻年龄之间的积距相关系数r为。 A、-1 < r< 0 B、0 < r< 1 C、r = 1 D、r = -1 9.“4、6、8、10、12、26”这组数据的集中趋势宜用测量。 A、众值 B、中位值 C、均值 D、平均差 10.某校期末考试,全校语文平均成绩为80分,标准差为4.5分,数学平均成绩为87分,标准差为9.5分。某学生语文得了83分,数学得了92分,从相对名次的角度看,该生的成绩考得更好。 A、数学 B、语文 C、两门课程一样 D、无法判断 三、判断题(请在答题纸相应位置打√或?。) 1.无论分布曲线是正偏还是负偏,中位值都居于均值和众值之间。 2.一组数据的均值代表了该组数据中大多数的数据。 3.对于连续型随机变量,讨论某一点取值的概率是没有意义的。 4.异众比率越大,各变量值相对于众值越离散,众值的代表性越好。 5.只要样本量足够大,则不论总体分布如何,样本均值的抽样分布都服从正态分布。 6.检验均值差异时,独立样本采用“差的均值”、关联样本采用“均值的差”进行检验。 7.在显著性水平既定的情况下,一端检验比两端检验更容易拒绝H0。 8.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关;当r=0时,变量X 和变量Y都是完全不相关。 9.方差分析就其内容来说,是分析或检验总体间的均值是否存在差异。 10.纳伪的概率β可以根据原假设H0所设的分布计算出来。 1

社会统计学讲义

《社会统计学》讲义 教学目的和要求: 通过本课程的学习,使学生熟悉常用的统计方法,并且学会如何将统计分析知识应用于社会调查研究之中,掌握统计方法的灵活运用。本课程偏重统计方法的实际应用,而非其数理基础。在教学过程中,注重对于不同统计分析方法适用条件的说明,统计公式的讲解,以及对于统计值意义的说明。 教学重点和难点: 本课程的教学重点是不同统计分析方法所适用的条件以及统计值意义的解释。难点是统计公式的讲解以及不同统计分析方法在实际社会调查研究中的应用。 教法特点说明: 课堂讲授为主,注重对实例的讲解。 教材和参考书目: 1、卢淑华著:《社会统计学(第三版)》,北京大学出版社,2007年。 2、李沛良著:《社会研究的统计应用》,社会科学文献出版社,2002年。 3、柯惠新等著:《调查研究中的统计分析法》,北京广播学院出版社,1992年。 4、风笑天著:《现代社会调查方法》,华中科技大学出版社,2001年。 5、袁方主编:《社会研究方法教程》,北京大学出版社,1997年。

第一章统计学简史 教学目的和要求: 通过本章的学习使学生了解统计学的产生、发展历程有初步的认识。 教学重点和难点: 重点是国势学派与政治算数学派的差异,难点是文字记述与数字记述各自的特点。 教学方法: 课堂讲授 教学内容: 一、统计学的起源 统计技术:古埃及、古中国(大禹治水) 统计学:17世纪中叶Status(拉丁词汇,国家、状态)——Statistics 研究国家的宏观状态①国势学②政治算术 二、国势学(17世纪的德国) 德国大学学派:H·Coring 用文字记录一个国家的状况和制度 G·Achenwall 第一个定义——把国家的显著事项全部记录 下来的学科 三、政治算术(17世纪的英国) 英国的经验主义者:用数量或数字的方法说明国家的特征 J·Graunt 《关于伦敦死亡表的观察》用数量分析社 会、政治问题 William Petty 《政治算术》 四、概率论(数理特征更加明显) 1.J Bernoulli(贝努里)瑞士大数法则借助大数法则可以从社会现象复杂 不定的偶然性中寻找规律,它说明了社会现象的稳定性 2.Gauss(高斯)德国正态分布(中心极限定理的基础) 五、数理统计学 Adolphe Quetelet(阿道夫·凯特勒)法籍比利时人 数理统计学派的创始人“经验社会学之父”《社会物理学》

《概率论与数理统计》笔记

《概率论和数理统计》笔记 一、课程导读 “概率论和数理统计”是研究随机现象的规律性的一门学科 在自然界,在人们的实践活动中,所遇到的现象一般可以分为两类: 确定性现象随机现象 确定性现象 在一定的条件下,必然会出现某种确定的结果.例如,向上抛一枚硬币,由于受到地心引力的作用,硬币上升到某一高度后必定会下落.我们把这类现象称为确定性现象(或必然现象).同样,任何物体没有受到外力作用时,必定保持其原有的静止或等速运动状态;导线通电后,必定会发热;等等也都是确定性现象. 随机现象 在一定的条件下,可能会出现各种不同的结果,也就是说,在完全相同的条件下,进行一系列观测或实验,却未必出现相同的结果.例如,抛掷一枚硬币,当硬币落在地面上时,可能是正面(有国徽的一面)朝上,也可能是反面朝上,在硬币落地前我们不能预知究竟哪一面朝上.我们把这类现象称为随机现象(或偶然现象).同样,自动机床加工制造一个零件,可能是合格品,也可能是不合格品;射击运

动员一次射击,可能击中10环,也可能击中9环8环……甚至脱靶;等等也都是随机现象. 统计规律性 对随机现象,从表面上看,由于人们事先不能知道会出现哪一种结果,似乎是不可捉摸的;其实不然.人们通过实践观察到并且证明了,在相同的条件下,对随机现象进行大量的重复试验(观测),其结果总能呈现出某种规律性.例如,多次重复抛一枚硬币,正面 朝上和反面朝上的次数几乎相等;对某个靶进行多次射击,虽然各次弹着点不完全相同,但这些点却按一定的规律分布;等等.我们把随机现象的这种规律性称为统计规律性. ●使用例子 摸球游戏中谁是真正的赢家 在街头巷尾常见一类“摸球游戏”.游戏是这样的:一袋中装有16个大小、形状相同,光滑程度一致的玻璃球.其中8个红色、8个白色.游戏者从中一次摸出8个,8个球中.当红白两种颜色出现以下比数时.摸球者可得到相应的“奖励”或“处罚”: 结果(比数) A (8:0) B (7:1) C (6:2) D (5:3) E (4:4) 奖金(元)10 1 0.5 0.2 -2 注:表中“-2”表示受罚2元

社会统计学试卷A及答案解析

级专业2010学年第 1 学期《社会统计学》试卷 A 姓名:学号: (□开卷□闭卷) 一、选择题:2*10=20分 1、要了解400个学生的学习情况,则总体单位是( B ) 。 A 400个学生 B 每一个学生 C 400个学生的成绩 D 每一个学生的成绩 2、只与一个自由度有关的是( A ) 分布 B 超几何分布C 泊松分布 D F分布 A 2 3、将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种 抽样方式叫( B )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 4、在方差分析中,自变量是(A )。 A 定类变量 B 定序变量 C 定距变量 D 定比变量 5、某城市男性青年27岁结婚的人最多,该城市男性青年结婚平均年龄为26.2岁,则该城 市男性青年结婚的年龄分布为(B)。 A.正偏B.负偏 C.对称D.不能作出结论 6、分析统计资料,可能不存在的平均指标是( A )。 A 众数 B 算术平均数 C 中位数 D 几何平均数 7、在一个左偏的分布中,小于平均数的数据个数将( C )。 A 超过一半 B 等于一半 C 不到一半 D 视情况而定 8、若P(A)=0.2,P(B)=0.6,P(A/B)=0.4,则) P =( D )。 A (B A 0.8 B 0.08 C 0.12 D 0.24。 9、关于学生t分布,下面哪种说法不正确(B )。 A 要求随机样本 B 适用于任何形式的总体分布

C 可用于小样本 D 可用样本标准差S 代替总体标准差σ 10、对于大样本双侧检验,如果根据显著性水平查正态分布表得 Z α/2=1.96,则当零假 设被否定时,犯第一类错误的概率是( C )。 A 20% B 10% C 5% D .1% 二、判断题:2*10=20分 1、所有的统计指标都是变量。 ( 对 ) 2、统计所研究的对象就是社会经济现象的数量方面。 (错 ) 3、随机变量在相同的条件下进行观测,其可能实现的值不止一个。 (对 ) 4、在社会现象中,即使相同的意识作用也完全可能有不确定的结果,这就提供了概率论应用的可能性。 ( 对 ) 5、成功次数的期望值λ是决定泊松分布的关键因素。 ( 对 ) 6、进行区间估计,置信水平总是预先给定的。 ( 对 ) 7、可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1-α)”。(错 ) 8、将收集到得的数据分组,组数越多,丧失的信息越多。 (错 ) 9、N 个变量值连乘积的平方根,即为几何平均数。 (错 ) 10、当样本容量n 无限增大时,样本均值与总体均值的绝对离差小于任意正数的概率趋于零。 (错 ) 三、简答题:5*7=35分 1、大数规律 大数规律是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。 2、配对样本 所谓配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产生的。 3、消减误差比例 变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关 系时预测Y 的误差1E ,再将其化为比例来度量。将削减误差比例记为PRE 。 4、同分对 如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i j Y =Y (此时X 序列中无i j X =X ),则这个配对仅是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。 5、什么是分层抽样? 分层抽样也叫类型抽样,就是先将总体按某种特征或属性分若干类别或层次,再按照一定比 例在各个子类别或层次中随机抽取,最后将各抽取的单位合并成样本。 6、简述回归分析和相关分析之间的密切联系。 一般说来,只有当两个变量之间存在着较高程度的相关关系时,回归分析才变得有意义和有价值。相关程度越高,回归预测越准确。因此,往往先进行相关分析,然后才选用有明显相关关系的变量作回归分析。与此同时,相关关系往往要通过回归分析才能阐释清楚,例如皮尔逊相关系数的PRE 性质。回归分析具有推理的性质,而相关分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。因而从分析层次上讲,回归分析更深刻一些。 7、P 值决策与统计量的比较 P 值是被称为观察到的(或实测的)显著性水平。用P 值进行检验比根据统计量检验提供更多

社会统计学复习题(有答案)复习课程

社会统计学复习题(有 答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产 品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。

卢淑华讲义全

社会统计学讲义(卢淑华) 第一章社会学研究与统计分析 一、社会调查资料的特点(随时掌握) 随机性、统计规律性; 二、统计学的作用:为社会研究提供数据分析和推论的方法 三、统计分析的作用及其前提。 四、统计分析方法的选择 1、全面调查和抽样调查的分析方法 2、单变量和多变量的统计分析方法 五、不同变量层次的比较;定类、定序、定距、定比 定义、数学特征、运算特性、涵盖关系、等 第二章单变量统计描述分析 一、统计图表,熟悉不同层次变量对应的分析图表,不能混淆。尤其是直方图的意义。 二、标明组限与真实组限的换算,重要。 三、集中趋势测量法 1、定义、优缺点、注意事项; 2、众值:定义、计算公式、解释、运用,注意事项; 3、中位值:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项; 4、均值:定义、计算公式(分组与加权)、解释、运用,注意事项; 5、众值、中位值和均值的关系及其相互比较,会用众值和中位值估算均值; 四、离散趋势测量法 1、定义、优缺点、注意事项,与集中趋势的关系; 2、异众比例:定义、计算公式、解释、运用,注意事项; 3、质异指数:定义、计算公式、解释、运用,注意事项; 4、四分位差:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;要会举一反三,如求十分位差、以及根据数据求其在总体中的位置。 4、方差及标准差:定义、计算公式(分组与加权)、解释、运用,注意事项; 第三章概率 一、概率:就是指随机现象发生的可能性大小。随机现象具有不确定性和随机性。 二、概率的性质: 1、不可能事件的概率为0; 2、必然事件的概率为1; 3、随机事件的概率在0-1之间; 三、概率的计算方法: 1、古典法:计算等概率事件,P=有效样本点数/样本空间数; 2、频率法:求随机事件在多次试验后的极限频率。 3、概率是理论值,只有一个,频率是试验值,不同的试验有不同的频率。 四、概率的运算:会画文氏图 1、加法公式:两个或多个随机事件的求和概率‘ 2、乘法公式:两个或多个随机时间共同发生的概率。分为独立事件的乘法和条件概率的乘法公式。 (1)独立:P(AB)=P(A)*P(B) (2)条件:PAB)=P(A)*P(A/B)=P(B)*P(B/A) 3、条件概率:将(2)反过来即可。P(B/A)是指在A发生的条件下B发生的概率。 4、全概公式:互不相容的完备事件组,求任意一个事件的发生 5、逆概公式:与4相反。

社会统计学期末复习提纲

《社会统计学》课程期末复习提纲 ·考试题型: 一、填空题(10×1分=10分)二、判断题(10×1分=10分) 三、单项选择题(20×1分=20分)四、简答题(2×6分=12分)五、计算题(4题共48分) ·各章复习要点 第一章总论 P.2 统计的含义:统计工作·统计资料·统计学。其中:统计工作和统计资料是活动过程和成果的关系;统计学和统计工作是理论和实践的关系。 “统计”一词包含三种涵义,并且具有密切的联系。其中:统计工作和统计资料之间是工作与成果的关系;统计学和统计工作之间是理论和实践的关系。(y ) P.11—P.13 定类尺度;定序尺度;定距尺度;定比尺度(结合课件相关内容) 量化尺度特征功能举例 1、定类尺度确定类别分类民族的测量 2、定序尺度确定类别排列顺序分类排序考试成绩等级的测量 3、定距尺度确定类别排列顺序测数量差别和间隔距离无绝对零点分类排序加减智商的测量 4、定比尺度确定类别有序排序测数量差别和间隔距离有绝对零点分类排序加减乘除体重的测量何谓定类尺度和定序尺度?两者有何区别?1定类尺度是确定事物类别的计量尺度---高一个层次 2定类只能区分不同性质的现象并予以归类---可将所区分的类别按高低,大小,好坏,强弱,优劣等顺序做有序排列。 3定类不能进行数的比较和数学运算--能进行大小比较。 何谓定距尺度和定比尺度?两者区别定距尺度是确定研究对象之间某些数值相差的距离的尺度---最高的数据计量尺度 缺乏绝对零点---有,0 2. 0只表示一个值,即0值---0是绝对零点,表示没有 3.只能加减,不能乘除---加减乘除,高层次的各种统计分析。 P.13—P.14 总体和总体单位 一、总体和总体单位 (一)总体 1、概念总体(也称为统计总体)是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体(同质个体的集团)。 2、特点·客观性·大量性同质性·差异性 1、总体单位除了必须具备同质性外,还必须具备1、差异性(或变异性)性,否则

2014年秋社会统计学期末复习训练题

2014年秋社会统计学期末复习训练题 一、单项选择题 1.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。这项研究的总体是() A.332.1万户家庭B.3000户家庭 C.332.1户家庭的年均收入D.3000户家庭的年均收入 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为()A.频率B.累积频数C.累积频率D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平B.比较多组数据的平均水平 C.反映一组数据的离散程度D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有( ) A.50%的数据B.68%的数据C.95%的数据D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、 54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19B.28.90C.19.54D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计B.区间估计C.有效估计D.无偏估计 7.在频数分布表中,比率是指() A.各组频数与上一组频数之比B.各组频数与下一组频数之比 C.各组频数与总频数之比D.不同小组的频数之比 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布B.观察值是相互独立的 C.各总体的方差相等D.各总体的方差等于0 9.判断下列哪一个不可能是相关系数() A.-0.9B.0C.0.5D.1.2 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数B.离散系数C.回归系数D.判定系数 11.在假设检验中,不拒绝虚无假设意味着() A.虚无假设是肯定正确的B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的D.没有证据证明虚无假设是错误的

统计学概论课件讲义

授课目录第一章质量管理概说 第二章统计学概论 第三章机率概论及机率分配 第四章统计制程管制与管制图 第五章计量值管制图 第六章计数值管制图 第七章制程能力分析 第八章允收抽样的基本方法 第九章计数值抽样计划 第十章计量值抽样计划 第十一章量具之再现度与再生度第十二章质量管理之新七大手法

1. 导论 统计学是一探讨如何搜集数据与分析数据的科学研究方法。在不确定的状态下,藉由样本数据所提供的讯息,经归纳分析、推论检定、决策与预测等过程。『以事实(数字)作决策』。

2.1认识统计 ◎自古以来,人类从事各项研究活动均是为求真理,亦是社会文明进步的原动力。然而通往真理的路上充满混沌与挫折,如何厘清真相,统计学自然就成为一门极重要的科学研究工具。 ◎统计学是由搜集数据、整理数据、分析数据及解释意义等规则与程序所组成。 ◎统计学研究过程: 推论= 估计+ 假设检定 Inferential Statistics = Estimation + Testing Hypothesis

2.2 统计精神就是科学研究的精神 ◎ 著名统计学家费雪(R. A. Fisher, 1890-1962)曰:统计方法的目的是基于经验观察,去改进我们对系统的了解---即统计的基本精神。 ◎ 架构一系列有组织有系统且可分析的研究过程,以获得客观可靠的结论---即科学研究的精神。 系 统 理 论---线 性 系 统 “Ref: The Six Sigma Way , by Peter S. Pande, Robert P. Neuman, & Roland R. Cavanagh, McGraw-Hill.” 『系统三要素---输入、过程、输出』

贾俊平《统计学》复习笔记课后习题详解及典型题详解(数据的搜集)【圣才出品】

第2章数据的搜集 2.1 复习笔记 一、数据的来源 1.数据的直接来源 数据的直接来源是指通过直接调查或实验活动直接获得一手数据,直接来源的数据又分为调查数据和实验数据。它们的不同之处在于: (1)调查数据为通过调查方法得到的数据,而实验数据为通过实验方法得到的数据。 (2)调查数据通常是针对社会现象而获取的,而实验数据大多是针对自然现象而获取的; (3)调查数据通常取自有限总体,即总体所包含的个体单位是有限的;而实验数据是指在实验中通过控制实验对象所搜集到的变量的数据。 2.数据的间接来源 (1)间接来源的数据(二手资料) 如果与研究内容有关的原信息已经客观存在,只是对这些原信息重新加工、整理,使之成为进行统计分析可以使用的数据,则称为间接来源的数据。 (2)二手资料的优点 搜集方便;数据采集快;采集成本低。 (3)二手资料的作用

分析所要研究的问题;提供研究问题的背景,帮助研究者更好地定义问题,检验和回答某些假设和疑问,寻找研究问题的思路和途径。 (4)二手资料的局限性 针对性不够;资料的相关性不够;口径可能不一致;数据也许不准确,也许过时等。 (5)对二手资料进行评估的内容 ①资料是谁搜集的?数据搜集者的实力和社会信誉度会在一定程度上影响数据说服力; ②搜集的目的是什么?为了某种特殊的利益而搜集的数据是值得怀疑的; ③数据是怎样搜集的?搜集数据的方法有很多,不同方法所采集到的数据,其解释力和说服力都是不同的。如果不了解搜集数据所用的方法,很难对数据的质量做出客观的评价。数据的质量来源于数据的产生过程; ④什么时候搜集的?过时的数据的说服力会受到质疑。 (6)使用二手数据的注意事项 使用二手数据,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。在引用二手数据时,应注明数据的来源,以尊重他人的劳动成果。 二、调查方法 1.概率抽样和非概率抽样 (1)概率抽样 概率抽样(随机抽样):指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。 ①概率抽样的特点 a.抽样时是按一定的概率以随机原则抽取样本,随机原则就是在抽取样本时排除主观

2020年自考《社会统计学》模拟试题及答案

2020年自考《社会统计学》模拟试题及答案 一、填空题 1.统计数据分组的关键在于。 2.一般说来,统计分组具有三方面的作用:(1) ;(2) ;(3) 。 3.根据分组标志的不同,统计分组可以有分组和分组。 4.按每个变量值分别列组所编制的变量分布数列叫,其组数等于。 5.在组距式数列中,表示各组界限的变量值叫。各组中点位置上的变量值叫。 6.组距式变量数列,根据各组的组距是否相等可以分为和。 7.已知一个数列最后一组的下限为900,其相邻的组中值为850,则最后一组的上限和组中值分别为和。 8.统计资料的表现形式主要有和。 9.从形式上看,统计表主要由、、和四部分组成;从内容上看,统计表由和两部分组成。 10.统计数据整理就是对搜集得到的进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的的工作过程。 11.数据的预处理是数据整理先行步骤,它是在对数据分类或分组之前对和所做的必要处理,包括对数据的、和。 12.直方图是用——的宽度和高度来表示频数分布的图形。 13.雷达图是一种的图示方法。 二、单项选择题

1.统计分组的关键问题是( ) A确定分组标志和划分各组界限B确定组距和组数 C确定组距和组中值D确定全距和组距 2.要准确地反映异距数列的实际分布情况,必须采用( ) A次数B累计频率C频率D次数密度 3.按品质标志分组,分组界限的确定有时会发生困难,这是由于( ) A组数较多B标志变异不明显C两种性质变异间存在过渡形态D分组有粗有细 4.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( ) A260 B 215 C 230 D 185 5.下列分组中按品质标志分组的是( ) A人口按年龄分组B产品按质量优劣分组 C企业按固定资产原值分组D乡镇按工业产值分组 6.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于( ) A简单分组B平行分组C复合分组D再分组 7.用组中值代表各组内的一般水平的假定条件是( ) A各组的次数均相等B各组的组距均相等 C各组的变量值均相等D各组次数在本组内呈均匀分布 8.对统计总体按两个及以上标志分组后形成的统计表叫( )

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错)

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

统计学笔记(精修版)

绪论 第一节统计学的含义和作用 一、什么是统计学 1.统计学的含义 统计学是有效收集、处理、分析和解释数据,发现规律,以便更好决策的一门方法论学科。 2. 分析数据的方法有描述统计、推断统计。 ⑴描述统计 ①描述统计是将所收集的数据处理后,用数值、表格或图形形式表现的有用信息。 ②描述统计是基础,它为推断统计、统计咨询、统计决策提供必要 ⑵推断统计就是根据样本数据特征去估计或检验总体的数据特征。 二、统计学的作用和重要性 1.统计学的作用 人们用数据发现的规律做出更好的决策。 2.要发现规律,对统计数据通常有要求:客观性、适用性、准确性和及时性。 三、统计学是如何解决实际问题的? 统计学解决实际问题的基本思路是: ①提出与统计有关的实际问题; ②建立有效的指标体系; ③收集数据; ④选用或创造有效的统计方法处理、显示所收集数据的特征; ⑤根据所收集数据的特征、结合定性、定量知识作出总体特征的合理推断; ⑥根据推断给出更好决策的建议; 不解决问题时,重复第②-⑥步。 第二节统计学的基本概念 一、总体、单位和样本 1.总体 统计总体是根据一定目的确定的,由客观存在的、具有某种同质性的许多个别事物构成的整体。 ⑴同质性是确定统计总体的基本标准,它是根据统计的研究目的而定的。研究目的不同,所确定的总体也不同,其同质性的意义也随之变化。 ⑵统计总体还应具备大量性,即统计总体应应该由足够数量的同质性单位构成。 2.总体单位(简称单位)是组成总体的各个个体。如典型案例1中英军的每架战机;事例4中的每个居民。 3.由总体的部分单位组成的集合称为样本(又称子样)。构成样本的单位称为样品,样本中样品的数目称为样本容量。 4. 统计学解决问题的目的是认识总体的数据特征。但是,当调查是破坏性的,或者出于成本、时间等因素考虑时,不必要或不可能对构成总体的所有单位都进行调查。

2018年春社会统计学期末复习训练题 (4)

2018年春社会统计学期末复习题 一、单项选择题 1.以下关于因变量与自变量的表述不正确的是() A.自变量是引起其他变量变化的变量 B.因变量是由于其他变量的变化而导致自身发生变化的变量 C.自变量的变化是以因变量的变化为前提 D.因变量的变化是以自变量的变化为前提 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率 B.累积频数 C.累积频率 D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有() A.50%的数据 B.68%的数据 C.95%的数据

D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为 72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19 B.28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计 B.区间估计 C.有效估计 D.无偏估计 7.在频数分布表中,比率是指() A.各组频数与上一组频数之比 B.各组频数与下一组频数之比 C.各组频数与总频数之比 D.不同小组的频数之比 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布 B.观察值是相互独立的 C.各总体的方差相等 D.各总体的方差等于0

9.判断下列哪一个不可能是相关系数() A.-0.9 B.0 C.0.5 D.1.2 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数 B.离散系数 C.回归系数 D.判定系数 11.在假设检验中,不拒绝虚无假设意味着() A.虚无假设是肯定正确的 B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的 D.没有证据证明虚无假设是错误的 12.下列变量属于数值型变量的是() A.工资收入 B.产品等级 C.学生对考试改革的态度 D.企业的类型 13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形()

统计学原理读书笔记

统计学原理读书笔记 1、统计工作是指对社会经济现象数量方面进行搜集、整理和分析工作的总称,它是一种社会调查研究活动。统计资料也即统计信息,是统计部门或单位进行工作所搜集、整理、编制的各种统计数据资料的总称,它是进行国民经济宏观调控的决策依据,是社会公众了解国情、国力和社会经济发展状况的信息主题。统计学是关于统计过程的理论和方法的科学。 2、统计学在研究社会经济现象时,首先从定性研究开始,即在搜集原始统计资料(统计调查)之前,就要根据所要研究对象的性质和研究任务、目的,确定调查对象的范围,规定分析这个对象的统计指标、指标体系和分组方法。——定性工作,为定量分析做准备。在定量分析基础上再达到认识社会经济现象的本质、特征或规律。 3、质——量——质 4、统计学特点: ①数量性(用大量数字资料说明事物的规模、水平、结构、比例关系、差别程度、普遍程度、发展速度、平均规模和水平、平均发展速度等) ②总体性(针对总体,研究过程是从个体到总体,即必须对足够大量的个体进行登记、整理和综合,是它过度到总体的数量方面,从而把握社会经济现象的总规模、总水平及其变化与发展的总趋势。 ③具体性(一定的质规定一定的量,一定的量表现一定的质。) ④社会性 5、统计工作的基本任务 ①全面、准确、及时地提供有关社会经济发展情况的资料为决策管理服务。 会议记录 买单率X 客单价 ‖‖ 商圈人流X20%=进店客流X(买单人数/进店客流数)X(营收/买单人数)=营收 进店客流少——行销品牌问题 买单率低——产品组合问题 客单价高——商圈和选址问题 选址在远离市区,开大商场,要求开车来,这样买单率和客单价会高,件单价会低,一买一车。选址在市内,开便利店,要求件单价高,客单价低,客流大。 人口变项——目的是做市调 人口结构——消费结构。 人口 品 项

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

(完整版)社会统计学简答题与计算题复习资料

社会统计学复习材料 简答题 1、统计数据的质量要求: 1、精度:最低的抽样误差或随机误差; 2、准确性:最小的非抽样误差或偏差; 3、关联性:满足用户决策、管理和研究的需要; 4、及时性:在最短的时间里取得并公布数据; 5、一致性:保持时间序列的可比性; 6、最低成本:以最经济的方式取得数据。 2、抽样误差及其影响因素: 1、由于抽样的随机性所带来的误差; 2、所有样本可能的结果与总体真值之间的平均性差异; 3、影响抽样误差的大小的因素:样本量的大小,总体的变异性。 3、判断计量优劣的评判标准: 用样本的估计量直接作为总体参数的估计值, 无偏性:估计量抽样分布的数学期望等于被估计的总体参数; 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效;一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。4、假设检验的一般步骤: (1)陈述原假设和备择假设; (2)从所研究的总体中抽出一个随机样本; (3)确定一个适当的检验统计量,并利用样本数据算出其具体数值;

(4)确定一个适当的显著性水平,并计算出其临界值,指定拒绝域; (5)将统计量的值与临界值进行比较,作出决策; (6)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0。 5、假设检验中的两类错误及其之间的关系 错误: 1、第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设,第Ⅰ类错误的概率记为a ,即显著性 水平; 2、第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设,第Ⅱ类错误的概率记为b 。 a 和 b 的关系就像翘翘板,a 小b 就大,a 大b 就小。因此,在样本容量n 固定情况下, 不能同时减少两类错误!一般采用增加样本容量的办法来解决。 关系:当显著性水平a 减小时,由于拒绝域的减小,弃真的错误会减小,但由此而来的是 接受域增大了,因此纳伪的概率b 要增大。反之亦然(P235)。也就是说如果要减小b ,就 增大显著性水平a 。 6、置信区间与置信度的关系表达式: ()αεθθεθ -=+≤≤-1??P []εθεθ+-?,?称作置信区间。α-1称作置信度,可信度,或置信水平。α称置信水平。在样本容量一定的情况下,置信区间和置信度是相互制约的。置 信度愈大,则相应的置信区间也域宽。当把区间估计得小一些,估计的精确程度提高了,但换取的代价将是估错的可能性增加了,也就是可靠性或置信度 α-1下降了。(P201) 7、正态分布曲线的特征: (1)一个高峰:曲线是单峰,有一个最高点。 (2)一个对称轴。曲线的高峰处有一个对称轴,在轴的左右两边是对称的。

统计学课件讲义 第4章 统计数据的整理与显示

第4章统计数据的整理与显示 一、统计数据整理 1、概念:统计整理,就是指根据统计研究目的,将统计调查所得的原始资料进行科学的分 类汇总,或对已经加工的次级资料进行再加工,为统计分析准备系统化、条理化 的综合资料的工作过程。 2、作用:它是从对现象的感性认识过渡到理性认识的开始,是这个过程的连续点,并为这 个过程提供坚实的基础。在统计工作中起着承前启后的作用 3、整理汇总必须遵守的原则:在对所研究的社会经济现象进行深刻分析的基础上,抓住最 基本、最能说明问题本质特征的统计分组和统计指标对统计 数据加工整理。 4、数据整理的程序: 设计和编制统计资料的整理方案→对调查获得的资料进行审核{对原始资料进行审核对二手数据进行审核 数据筛选 →按照一定的组织方式和方法,对原始资料进行分组、编码、汇总和计算→对整理好的统计资料再次进行审核,改正在汇总过程中产生的各种差错→将汇总整理的结果编制成统计表或绘制统计图,简明扼要地表明现象的数量特征→积累、公布和管理统计数据 注:对原始资料的审核包括准确性审核、及时性审核和完整性审核 对二手数据的审核包括完整性审核、准确性审核、重审数据的适用性和时效性 5、统计汇总是整理的核心其组织形式基本有3种:集中汇总、逐级汇总和综合汇总,统计汇总的技术主要有手工汇总和电子计算机数据处理2种。 二、统计分组 1、概念:统计分组是指根据事物内在的特点和统计研究的需要,将统计总体按照一定的标 志区分为若干组成部分的一种统计方法。 2、原则:组内同质,组间差异原则、穷尽原则、互斥原则 3、作用:I.可以区分现象质的差别 II.可以分析总体内部结构和总体结构特征 III.可以揭示现象之间的依存关系 4、种类: 按分组标志的多少,统计分组可分为简单分组和复合分组 按分组的标志性质不同,统计分组可分为品质分组(属性分组)和数量分组(变量分组)。 品质分组:就是按品质标志进行分组。一般地,对于类别数据,采用品质分组。 数量分组:就是按数量标志分组。数量标志的变异性体现在它不断变动自身的数量上,故也称为变量分组。 品质分组所形成的数列成为品质数列,数量分组所形成的数列称为变量数列。 按分组的作用和任务不同,统计分组可分为类型分组、结构分组和分析分组 5、分组标志的选择:统计分组中关键的问题在于选择分组标志和各组界限的划分,而选择分组标志则是统计分组的核心问题。 I.根据统计研究的目的与任务选择分组标志 II.在若干个标志中,要抓住具有本质性的或主要的标志作为分组的依据 III.根据现象所处的历史条件或经济条件来选择标志

相关主题
文本预览
相关文档 最新文档