第1章 统计绪论
- 格式:doc
- 大小:36.00 KB
- 文档页数:9
统计学知识点第一章绪论1、统计包含三种涵义(1)统计工作:一种调查研究活动。
资料搜集、整理和分析。
统计资料:即统计信息,工作成果。
包括统计数据和分析报告。
统计学:研究如何搜集、整理、分析数据资料的一门方法论科学。
(2)统计资料:对现象的数量进行搜集、整理和分析的活动过程。
统计资料:通过统计实践活动取得的说明对象某种数量特征的数据原始资料:直接从各调查单位搜集的用来反映个体特征的数据资料次级资料:由原始资料加工得到的在一定程度上能反映总体特征的数据资料(3)统计学:是研究总体一定条件下的数量特征及其规律性的方法论学科统计学的性质:统计学是通用的方法论科学;统计学使用大量观察和归纳推理的方法,得出对事物总体的综合认识;统计学结合现象的“质”研究现象的“量”特点:数量性(统计研究过程是从质和量的辩证统一中研究现象的数量特征,从数量上认识事物的性质和规律)、总体性(统计所研究的是由同类事物构成的群体现象的数量特征)、具体性、社会性2、统计学的分类理论统计学:研究的内容是统计的一般理论和方法,包括描述统计学、推断统计学应用统计学:研究的内容是运用于某一特定领域的统计问题,国民经济统计学、社会统计学、人口统计学3、统计研究方法(1)方法论——大数定律(2)统计研究的基本方法大量观察法:是指对所研究的事物的全部或足够数量进行观察的方法。
它可以使影响个体的偶然因素相互抵消,显示出现象的一般特征。
其数理依据是反映随机现象基本规律的大数定律。
诸如,各种基本的、必要的统计报表、普查、重点调查和抽样调查等。
统计描述法:指通过对客观实际的调查了解,并对搜集到的数据进行加工整理、综合分析,从而计算出各种能反映总体数量特征的综合指标,借以反映现象总体的总量规模、结构比例、速度快慢等实际状况。
统计描述的内容包括统计分组法、综合指标法和统计模型法。
统计推断法:是以一定的置信标准要求,根据样本数据来判断总体数量特征的归纳推理的方法。
第一章绪论1.社会经济统计的研究对象是社会经济现象总体的各个方面。
( X )2.统计着眼于事物的整体,不考虑个别事物的数量特性。
(X )3.改革开放以来,我国社会经济统计学对如何运用抽样调查方法,有很大的充实和发展。
(V )4.统计研究现象的量,是从定性研究开始的。
(V )5.统计指标对总体特征只有定量作用。
(X )6.离散变量的数值包括整数和小数。
(X )7.变量数列有两类:一类是离散变量,这种变量只能用整数表示;另一类是连续变量,这种变量可以用任意数值表示,例如职工人数、企业个数、设备台数。
(X )8.指标和标志一样,都是有名称和数值两部分组成的。
(X )9.三个同学的成绩不同,因此存在三个变量。
(X )10.在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。
(X)11.质量指标是反映总体质的特征的,因此,可以用文字来表述。
(X )12.总体单位是标志的承担者,标志是依附于单位的。
(V )13.连续变量的数值包括整数和小数。
(V )14.指标体系是许多指标集合的总称。
(X )15.品质标志是说明总体单位质的特征的,是不能用数值来表示的。
(V )16.所有指标都能用数值表示,而标志则不是。
(V )17.只要有了某个指标,就能对总体进行完整、全面的认识。
(X )18.数量指标是由数量标志汇总而来的,质量指标是由品质标志汇总而来的。
(X)19.总体单位总量和总体标志总量是固定不变的,不能互相变换。
(X )20.如果改变研究目的,原来的统计总体成为统计单位后,则相对应的统计指标也就变成了数量标志了。
(V )。
第一章绪论练习题一、填空题1.政治算术派产生于世纪资本主义的英国,代表人物是,代表作是。
2.国势学派产生于世纪的德国,创始人是。
3.数理统计学派的创始人是比利时学者。
4.按照统计方法的类型,可将统计学分为和。
5.总体是由许多具有的个别事物组成的整体;总体单位是的组成单位。
6.统计总体具有四个基本特征,即,,和。
7.标志是说明总体单位特征的名称,按表现形式不同分为和两种。
|8.统计指标按其所说明的总体现象内容的不同,可分为和。
9.指标与标志的主要区别在于:(1)指标是说明特征的,而标志则是说明特征的;(2)标志有不能用表示的与能用表示的,而指标都是能用的。
10.一个完整的统计工作过程可以划分为、、、四个阶段。
11.样本是从中抽出来,作为代表的部分单位组成的集合体。
12.推断统计学研究的是如何根据去推断的方法。
13.统计学自身的发展,沿着两个不同的方向,形成和。
14.数学研究的是数量规律,而统计学则是研究、数量规律。
15.统计指标是说明客观现象总体数量特征的和的统一体。
16.理论统计学是以为中心建立统计方法体系,而应用统计学是以为中心应用统计方法分析和解决实际问题。
二、单项选择题:1.统计总体的同质性是指( )A总体各单位具有某一共同的品质标志或数量标志B总体各单位具有某一共同的品质标志属性或数量标志值C总体各单位具有若干互不相同的品质标志或数量标志D总体各单位具有若干互不相同的品质标志属性或数量标志值2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体单位是( )A该全部工业企业 B 这800家工业企业C每一件产品 D 800家工业企业的全部工业产品生产情况3.要了解全国的人口情况,总体单位是( )A每个省的人B每一户]C全国总人口D全国的每一个人4.有200家公司每位员工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为( )A 这200家公司的全部员工B 这200家公司5.要了解某班50个学生的学习情况,则总体单位是( )A该班全体学生 B 该班全体学生的学习成绩C该班的每一个学生D该班每一个学生的学习成绩6.设某地区有60家生产皮鞋的企业,要研究它们的产品生产情况,不能成为指标是( )A所有企业B企业数C 60家企业的皮鞋总产量D所有企业生产的皮鞋的合格率)7.一个统计总体( )A只能有一个标志B可以有多个标志C只能有一个指标D可以有多个指标8.论述如何从所研究的领域或专门问题出发,视研究对象的性质而采用适当的统计方法去解决实际问题的统计学是( )A 描述统计学B 推断统计学C 理论统计学D 应用统计学9.以产品等级来反映某种产品的质量,则该产品等级是( )A数量标志B数量指标C品质标志D质量指标10.某工人月工资为1897元,工资是( )【A品质标志B数量标志C变量值D指标11.在调查设计时,学校作为总体,每个班作为总体单位,各班学生人数是( )A变量B指标C变量值D指标值12.某班四名学生金融学考试成绩分别为70分、80分、86分和95分,这四个数字是( )A标志B指标值C指标D变量值13.年龄是( )A变量值B离散型变量"C连续型变量D指标名称14.工业企业的职工人数、职工工资是( )A连续型变量B离散型变量C前者是连续型变量,后者是离散型变量D前者是离散型变量,后者是连续型变量15.质量指标是在数量指标基础上对总体内部数量关系和状况的反映。
第1章绪论1.1 什么是统计?1. “统计”一词与“国家”来自同一词源:status。
2. 统计是用来处理数据的,从数据中找出信息,并做出结论。
统计有三个基本含义:⏹指统计数据的收集活动,统计工作。
如人口普查。
⏹指统计活动的结果,指的是具体的数据,统计数据。
如“56%的观众认为2005年春节晚会‘千手观手’最好看”。
⏹指分析统计数据的方法和技术,即统计学。
一般从第三个含义来定义统计,即统计是指一组方法,用来设计实验,获得数据,然后在这些数据基础上组织、概括、演示、分析、解释和得出结论。
3. 统计数据的规律。
实例一:人口的性别比。
实例二:掷硬币。
实例三:粮食作物与施肥量的关系。
4. 总体与样本。
这两术语是我们今后学习的核心。
⏹总体是指所有研究要素的全体汇总。
汇总是全部的,它包含所有被研究的对象。
⏹样本是指从一个总体中抽出部分要素的汇总。
如:测量华南理工大学本科生的身高。
这里,华南理工大学全体本科生就是一个总体。
若因为种种原因,只抽出了500个学生进行测量,以之来推断全体本科生的身高,这里抽出的500个学生就是样本。
5. 看陈希孺院士的序。
统计方法之正确使用有赖于三个方面:⏹数据的取得必须符合随机性的要求。
⏹模型和方法的选择。
⏹在统计分析结果的解释上。
1.2 统计学与相关学科1. 统计学是一门收集、整理和分析统计数据的方法科学,其目的是探索数据的内在规律性,以达到对观察事物的科学认识。
2. 描述统计学:指的是统计数据的收集、整理、显示和分析的方法。
一般对总体数据进行描述以认识总体数据数量规律性。
推断统计学:在对样本数据描述的基础上,利用概率论知识对统计总体的求知数量特征进行推断。
3. 相关学科:数学及在各学科中的应用。
1.3 统计的使用与滥用在进入统计学的学习之前,我们看四个例子,运用统计能帮助我们解决实际问题。
⏹一灯泡厂每天大约生产50万只灯光,质量控制部门必须检验灯泡的次品率。
这个任务可以通过检验每一只灯泡来完成,但这样做的花费巨大而且会造成每只灯泡价格的猛涨。
另一方法是从每天生产的50万只灯泡中选出1 000只,然后检验这1 000只灯泡。
如果这1 000只灯泡是以正确的方式被选出来的,那么从中检测出的次品比例,可被用于估计全天所有产品的次品比例。
⏹为了调查研究“人在戒烟后体重会增加”这一断言,研究人员选择了一个由400个参与者构成的样本,他们都成功地参与了戒烟运动。
每个人在活动开始前和一年后都称量了体重。
参与者体重的平均变化是增加了5磅。
研究人员由此总结说有证据表明这一断言是正确的。
⏹为了研究氮肥对小麦产量的影响,研究人员一共可以利用15块田地。
他们随机地选择3块田分配给五种被考察的氮肥中的一种。
在所有这15块田中种上同种小麦。
所有这些田都以同样的方式耕作,直到收获的季节,记录下这15块田的亩产量。
试验者想决定任何麦田的最佳氮肥施肥量,但显然他只能在有限的一些田块中做试验。
当得出使试验田有最大产量所需要的氮肥量后,研究人员能断言,这个施肥量对于与试验田具有相同特征的麦田也适用吗?⏹民意调查问题。
统计的使用很多,这里我们重点对统计的滥用进行介绍。
“有三类谎言:谎言、糟透的谎言和统计”。
使用统计“就像喝醉酒的人使用街灯柱——支撑的功能多于照明”。
为什么会滥用?⏹不好的样本。
这是滥用统计的一个主要来源:不恰当的方法收集数据。
问题一:ABC曾进行过一次民意调查,186000名参加者拨通900电话说出他们对将联合国总部保留在美国这件事情的看法。
结果表明,那些打电话的人中,有67%的人赞成将联合国移出美国。
另一个对500人进行的“科学的”民意调查表明,有72%的人希望联合国留在美国。
哪一个更能真实地反映美国民众的一般观点??自选择调查(自愿回答样本)。
回答者自己决定是否要被包括进样本中。
⏹小样本。
基于非常小的样本而得出广泛的结论或推论。
⏹带有引导性的问题。
调查中问题的措辞可能会引出想得到的回答。
⏹误导性的图表。
夸大或缩小数据的真实含义。
⏹太精确的数据。
⏹局部描述。
⏹故意曲解数据。
问题二:你能否说出下面这个事情中的4个主要缺陷?一家日报做了一项调查,让读者打电话来回答:“你是否支持开发能够杀害上千万无辜百姓的核武器?”调查的结果是20位读者回答了问题,其中87%说“不”,而13%说“是”。
1.4 实验设计——案例与活动一:小儿麻痹疫苗的检验实验一般来说,我们收集数据就是为了一个特定的目的,收集数据后对其进行分析以帮助我们达到目的。
我们获得数据通常有两个主要来源:调查和实验。
如,人口普查是调查;CCTV通过某种方式进行电话调查,以确定在晚上9点收看CCTV的人占整个群体的百分比也是调查。
一个实验的例子是小儿麻痹疫苗的检验:1954年,20万儿童被实际注射了小儿麻痹疫苗,另20万儿童只是注射了一种安慰剂,不包括任何药物成分。
这是一个设计得较好的实验,将进行处理的那一组的影响和没有进行处理的那一组影响进行比较,使用两个组就能够评价小儿麻痹疫苗在预防小儿麻痹方面的效果。
为什么说这是一个比较好的实验呢??一般来说,设计一个能产生有效结果的实验时,应该遵循一些基本的步骤:1. 确认你的目的:确认要回答的准确问题,并且清楚地确认相关总体。
在小儿麻痹疫苗检验实验中,目的是“小儿麻痹疫苗是否有效地降低了小儿麻痹症对儿童这个总体的影响”。
2. 收集样本数据。
样本数据收集方式对实验的成功是绝对重要的。
样本数据必须是问题中样本的代表,样本必须足够大;以使处理的影响能够反映出来,问题的研究应该在没有额外因素干扰的情况下进行。
在小儿麻痹疫苗检验实验中,样本容量是20万儿童,足够大,可以看出小儿麻痹疫苗的有效性。
使用致盲技术来控制额外因素的影响。
在这类试验中,经常会出现没有得到治疗的对象错误地相信他接受了治疗并且汇报改善了症状,这就是安慰剂效应。
安慰剂效应可以通过致盲技术来处理,小儿麻痹疫苗检验实验中使用了双重致盲技术:接受注射的孩子不知道他们被注射了小儿麻痹疫苗还是安慰剂;进行注射和评价结果的医生也不知道孩子是被注射了疫苗还是安慰剂。
3. 使用随机程序以避免偏向。
在小儿麻痹疫苗检验实验中,孩子们通过一个被随机选择的过程被分为两组,使得这两组都有相似的对象组成。
并在考虑基于孩子健康、年龄和居住地以及其他相关因素等方面对孩子进行分组。
这里我们再强调一次,收集数据的方式非常重要,不仔细收集的数据是毫无用处的,没有什么统计方法可以拯救它。
一般来说,有五种经常使用的抽样方式。
⏹随机抽样。
随机样本中,总体中的每个成员都有相等的机会被选中。
一个有n个对象的简单随机样本是以这样一种方式被选择的,即n个对象中的每个可能的样本都有相同的机会被选中。
⏹系统抽样。
在总体中选择某个起点,然后选择每第K个元素。
现在要对华南理工大学29500个学生的生活费用进行调查,我们可先按某种方式对这29500个学生进行排序(如按姓名的拼音进行升序排列)以组成一个花名册,然后选择每50个学生,得到590个学生组成的样本。
这是一个非常简单常用的方法,如果我们随机地选择起点,就能得到一个随机样本,每个学生都有可能被抽中。
问题三:这种方式能得到一个简单随机样本吗?⏹方便抽样。
仅使用那些容易获得的样本。
方便抽样的结果可能很好,但在其他很多情况下它是严重有偏的。
⏹分层抽样。
指将总体细分为至少两个小组(或称层)这些层都有某种相同的特征(如性别、年龄段),然后从每一个层中抽出一些样本。
⏹聚类抽样。
指首先将总体分成一些类,然后在这些类中随机选择一些,再选择这些被选中的类中的全部成员。
在实践中,专业人士经常使用这5种方法的某种组合来收集数据。
4. 分析数据,形成结论。
分析发现,小儿麻痹疫苗确实有效。
这里要提醒大家的是,无论你将样本选择和实验设计及其实施得多么好,结果中仍然会出现一些错误。
如你可能随机选择了1000个成年人,如果他们高中毕业,就让他们回答“是”,以记录一个样本比;如果你再选择另外一个由1000个成年人组成的样本,你可能会得到不同的样本比。
抽样误差。
是指样本结果和真实结果之间的差异;这种误差由偶然的样本波动引起的。
当样本数据错误地收集、记录或分析时就会产生非抽样误差。
问题四:在习题⑴--⑿中识别抽样的类型:随机、系统、方便、分层和聚类。
⑴电话调查。
某公司计划对广州市市民进行一次民意调查,他们使用计算机随机生成电话号码,自动拨打。
⑵MTV调查。
某MTV的营销专业正在进行一项调查,其中500个人将随机从10—19,20—29等年龄组中的每个组中选出。
⑶新闻报告。
一名ABC新闻记者对在街上走过他身边的人进行民意调查。
⑷医学研究。
中山大学的一名研究人员对30个随机选择的医院的每所医院所有的心脏病人进行了调查。
⑸汽车物主身份。
GM公司的一名研究人员将所有登记在册的汽车分为微型、小型、中小型、中型和大型等各类。
她对从每个类中随机选择的200名车主进行了调查。
⑹陪审员选择。
某县陪审委员会获得了一个列有42763名车主的表,他们将表中每第100个人选出组成了一个陪审团。
⑺学生饮酒。
工商管理学院对学生饮酒进行了一项调查,他们随机地选出10个班级,然后对每个班中的所有学生进行检查。
⑻游说议员。
一个烟草工业的游说者将535个议员的名字写在一些个人索引卡片上,将它们放在一个盒子里,然后选出50个不同的人员,通过这种方式得到了由议会成员组成的样本。
⑼教育与工资。
某经济学家正在研究教育对工资的影响,他对“从低于高中文化、高中文化、同于高中文化”这些类中的每个类随机选出的150名工人进行了调查。
⑽犯人。
某监狱守卫调查了其中二个管辖区的所有犯人。
⑾检查站。
警察在某检查站每数到第5个司机就令其停车检查。
⑿离开检查。
CNN正在策划一项离开调查,100个投票站将被随机选出,其中所有的投票人在他们离开时都被考察。
作业⑴看报纸,收集有关调查的消息,并仔细检查是否可信。
⑵预习第二章。