统计学()
- 格式:doc
- 大小:153.00 KB
- 文档页数:6
统计学一、定义:统计学是一门对群体现象数量特征进行计量、描述、分析和推论的科学。
二、:一)统计的含义1、统计工作:资料的搜集、整理和分析这一系列的工作。
2、统计资料:统计工作的成果。
3、统计学:统计工作的理论概括。
二)统计的性质1、统计是调查研究社会的方法之一2、统计是核算的工具之一(会计核算、统计核算、业务核算)3、统计是国家或企业管理、监督的工具三、统计的特点四、统计学的理论基础五、统计学的研究方法(一)数量性(一)历史唯物论(一)大量观察法(二)工具性(二)辨证唯物主义(二)综合指标法(三)广泛性(三)政治经济学(三)归纳推断法(四)总体性(四)数学和计算机(四)大数定律(五)社会性总体:统计总体就是根据一定的目的和要求所确定的研究事物的全体,它是由客观存在的、具有某种相同性质的许多单位组成的集体。
总体单位:总体单位是指构成总体的每一个单位。
关系:统计总体和总体单位并不是固定不变的。
两者可以相互转换。
标志:标志是说明总体单位的属性和特征的名称。
品质标志(用文字表示),如中的性别、籍贯、政治面貌等;数量标志(用数字表示)。
数量标志的具体数值表现称为标志值,如某同学年龄为21岁,21岁就是标志值。
指标:是说明总体的属性和特征的。
任何一个统计指标必须用数字说明。
(标志和指标也是可以相互转换的。
)统计总体中各单位之间的差异称为变异。
正由于总体中各单位之间存在差异,才需要进行统计,也才有各种各样的统计方法。
如果总体各单位之间没有差异,也就没有统计。
在数量标志中,不变的数量标志称为常量或参数。
可变的数量标志称为变量。
变量取值又称为变量值,也就是标志值。
变量按其取值的连续性又分为离散变量和连续变量两种。
统计调查是根据统计的研究目的和任务,有组织、有计划地向客观实际搜集资料的工作过程。
统计调查是搜集资料获得感性认识的阶段,它既是对现象总体认识的开始,也是进行资料整理和分析的基础环节。
搜集统计资料的方式:一种是对原始资料的搜集。
第一章统计和统计数据名词解释1.统计学:收集处理分析解释数据并从数据中得出结论的科学。
2.描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。
3.推断统计:研究如何利用样本数据来推断总体特征的统计方法。
4.分类数据:只能归于某一类别的非数字型数据。
5.顺序数据:只能归于某一有序类别的非数字型数据。
6.数值型数据:按数字尺度测量的观察值。
7.总体:包含所研究的全部个体(数据)的集合。
8.样本:从总体中抽取的一部分元素的集合。
9.参数:用来描述总体特征的概括性数字度量。
10.变量:说明现象某种特征的概念。
11.分类变量:说明事物类别的一个名称。
12.顺序变量:说明事物有序类别的一个名称。
13.数值型变量:说明事物数字特征的一个名称。
14.概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
15.非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
16.简单随机抽样:从包括总体的N个单位的抽样框中随机,一个个抽取n个单位作为样本,每单位等概论。
17.分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同层中独立、随机地抽取样本。
18.整群抽样:总体中若干单位合并为组,群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。
19.系统抽样:总体中所有单位按顺序排列,在规定范围内随机抽取一单位作为初始单位,然后按事先规则确定其它样本单位。
20. 抽样误差:由于抽样的随机性引起的样本结果与总体真值之的误差简答题。
1.概率抽样与非概率抽样比较:性质不同,非概不依据随机原则选样本,样本统计量分布不确切,无法使用样本的结果对总体相应参数进行推断。
操作简便,时效快,成本低,专业要求不很高。
概率抽样依据随机原则抽选样本,理论分布存在,对总体有关参数可进行估计,计算估计误差,得到总体参数的置信区间。
提出精度要求。
2.数据收集方法的选择:抽样框中有关信息,目标总体特征,调查问题的内容,有形辅助物的使用,实施调查的资源,管理与控制,质量要求3.误差的控制:抽样误差是抽样随机性带来的,不可避免可以计算,改大样本量。
统计学(选择,判断)判断1.描述统计是⽤⽂字和图表对客观世界进⾏描述。
()2.箱线图主要展⽰分组的数值型数据的分布。
()3.抽样极限误差可以⼤于、⼩于或等于抽样平均误差。
4.直接对总体的未知分布进⾏估计的问题称为⾮参数估计;当总体分布类型已知,仅需对分布的未知参数进⾏估计的问题称为参数估计。
()5.相关系数为0表明两个变量之间不存在任何关系。
()6.当置信⽔平⼀定时,置信区间的宽度随着样本量的增⼤⽽减少()7.在单因素⽅差分析中,SST =SSE+SSA()。
()8.右侧检验中,如果P值<α,则拒绝H9.抽样调查中,样本容量的⼤⼩取决于很多因素,在其他条件不变时,样本容量与边际误差成正⽐。
()10.当原假设为假时接受原假设,称为假设检验的第⼀类错误。
()11.简单随机抽样由于样本是完全随机的,适⽤于任何情形。
12.采⽤多阶段抽样时,阶段数越多,结果越正确。
13.四分位差是下四分位数与上四分位数14.点估计就是⽤样本统计量代表总体参数15.总体⽐例标准差的最⼤值是116.在简单随机抽样时,当总体单位数较多时,若抽样⽐例为64%,则不重复抽样的抽样平均误差⽐重复抽样的抽样平均误差⼤约减少40%17.当置信⽔平⼀定时,置信区间的宽度随着样本量的增⼤⽽减少18.重复简单随机抽样的抽样平均误差⼩于不重复简单随机抽样的抽样平均误差。
19.平均差与标准差都表⽰各标志值对其算术平均数的平均离差。
20.单⼀表能容纳较多的标志,因⽽能把许多单位的资料填列于⼀张表中,这有利于⽐较和分析。
等距抽样在决定间距时要注意总体中有⽆周期性变化。
采⽤多阶段抽样时,阶段数越多,结果越正确。
两个变量的相关分析中要求其中⼀个是⾃变量,另⼀个是因变量。
标志是单位的属性或特征,指标是总体的数量特征,两者没有关系。
在评判估计量好坏中,有效性就是指估计的正确性。
21.如果总体情况复杂,适宜于采⽤分层抽样。
整群抽样要求群与群之间差异要⼤。
22.在评判估计量好坏中,⽆偏性就是指估计的正确性。
统计学第一章1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品(2)变量:口味(如可用10分制表示)(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。
(4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题1描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。
3. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。
统计学(第五版)贾俊平课后习题答案(完整版)第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
统计学1.1统计有三种含义,即统计活动、统计数据和统计学。
1. 统计活动又称统计工作,是指收集、整理和分析统计数据,并探索数据的内在数量规律性的活动过程。
2. 统计数据统计资料,即统计活动过程所获得的各种数字资料和其他资料的总称。
3. 统计学统计学是指阐述统计工作基本理论和基本方法的科学,是对统计工作实践的理论概括和经验总结。
1.2数据的计量尺度①定类尺度:对事物进行平行的分类只能区分事物之间的类别,但不能比较类别间的大小;使用时必须符合类别穷尽和互斥的要求;主要表现为频数或频率。
②定序尺度:对事物分类的同时给出各类别的顺序。
不仅能区分事物类型,还能比较类间的优劣和顺序;使用时必须符合类别穷尽和互斥的要求;统计量主要是频数和累计频数。
③定距尺度:是对事物类别或次序之间间距的测度。
不仅能区分事物类型,进行排序、比较大小,还可以精确地计量大小的差异;没有绝对零点。
④定比尺度:对事物之间比值的一种测度。
不仅能区分事物类型,进行排序、比较大小,计量大小的差异,还能计算两个测度值之间的比值;具有绝对零点。
1.3统计调查组织方式普查是为某一特定目的而专门组织的一次性全面调查方式。
抽样调查从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。
统计报表是按照国家有关法规规定,自上而下统一布置,自下而上逐级填报的一种调查组织方式。
重点调查是从全部总体中选择少数重点单位进行调查,尽管在全部总体单位中出现的频数极少,但其某一数量标志在所要研究的数量标志值总量中却占有很大的比重。
典型调查是从全部总体单位中选择一个或几个有代表性的单位进行深入细致的调查。
1.4描述统计:研究如何取得反映客观现象的数据,并通过图表形式对所搜集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。
推断统计:研究如何根据样本数据去推断总体数量特征。
2.1数据审核:准确性审核、全面性审核、及时性审核2.3频数分布分组方法:1)单变量值分组:将一个变量值作为一组;适合于离散变量且变量值较少的情况。
《统计学》一.填空1. 统计学是研究大量社会经济现象的(总体数量方面的)方法论科学。
2. 统计指标按其反映的总体内容的不同可以分为(数量指标)和(质量指标)3. 统计调查按调查对象包括范围的不同可以分为(全面调查)和(非全面调查)4. 从构成要素看,统计表包括三个部分:(总标题),(分标题),(数字资料)5. 相对数的表现形式有两种,一种是(有名数),另一种是(无名数)6. 就一次统计活动来讲,一个完整的认识过程一般可以分为(统计调查),(统计整理)和(统计分析)三个阶段。
7. 品质标志是说明总体单位质的特征的,是不能用(数值)来表示的8. 总量指标按其反映的时间状况不同,分为(时期指标和时点指标)9. 平均指标是指在(同质总体内)将各单位某一数量标志的差异抽象化,用以反映总体在具体条件下的(一般水平)。
10. (标志变动度也即标志变异指标),是指在总体中各单位标志值差异大小的程度,又称离散程度或离中程度11. 动态数列按统计指标的性质不同,可以分为(绝对数动态数列)(相对数动态数列)和(平均数动态数列)12. 在实际工作中,计算平均发展速度主要有两种方法,一种是(几何平均法),另一种是(方程法)13. 按照统计指数的内容不同,分为(数量指标和质量指标)14. 全及总体按其各单位标志性质的不同可以分为(变量总体和属性总体)两类15. 从相关关系的表现形态来划分,可分为(直线相关和曲线相关)两种16. 统计一词的涵义是指(统计工作,统计计资料和统计学)17. (分组标志)是统计分组的依据。
18. 累计次数有两种方法一种是(向上累计),另一种是(向下累计)19. 某企业生产某种产品,本年度计划单位成本降低6%,实际降低7.6 %,则:成本降低率计划完成相对数量是:(1 —7.6%) / (1-6%)= 98.3%20. (强对相对指标)是两个性质不同,但有一定联系的总量指标对比的结果。
21. 算对平均数的基本公式:总体标志总量/总体单位总量22. 将不同时期的发展水平加以平均而得的平均数叫(平均发展水平),在统计上又称(序时平均数)或(动态平均数)23. 统计指数按照说明现象的范围不同,分为(个体指数和总指数)24. (同度量因素)是把不能直接相加的指标过渡为可以相加的因素。
1、依据统计数据的收集方法不同,可将其分为【观测数据】数据和【实验数据】数据。
2、收集的属于不同时间上的数据称为【时间序列】数据。
5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 1080,中位数为1080。
7、设总体X ~),(2σμN ,x为样本均值,S 为样本标准差。
当σ未知,且为小样本时,则n sx μ-服从自由度为n-1的___t__分布。
1、数据分析所用的方法分为 描述统计方法 和 推断统计方法 。
2、数据的基本类型有 分类数据 、 顺序数据 和 数值型数据 。
3、在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据:1080,750,780,1080,850,960,2000,1250,1630(单位:元),则人均月收入的平均数是 1153.3 ,中位数是 1020 。
4、设连续型随机变量X 在有限区间(a,b)内取值,且X 服从均匀分布,其概率密度函数0()1f x b a ⎧⎪=⎨⎪-⎩则X 的期望值为 2a b + ,方差为2()12b a - 。
1、收集数据的基本方法是 自填式 、 面访式 和 电话式 。
2、依据统计数据的收集方法不同,可将其分为 观测数据 和 实验数据 。
3、分类数据、顺序数据和数值型数据都可以用 饼图 、 条形图 等图形来显示。
5、测定数值型数据的离散程度,依据研究目的及资料的不同,可用的指标有 方差 、 离散系数 。
5、原假设0H 为真时却被我们拒绝,称为 弃真错误 。
7、对回归方程线性关系的检验,通常采用的是 F 检验。
2、如果我们要研究某班学生的学习状况,则总体是 ,总体单位是_ _ 。
4、利用估计的回归方程进行区间估计有两种类型,一是 置信区间估计 ,二是 预测区间估计 。
8、在参数估计时,评价估计量的主要有三个指标是无偏性、 、有效性、一致性。