统计学笔记(精修版)
- 格式:docx
- 大小:1.43 MB
- 文档页数:47
以下是统计学中的一些基本概念和知识,供参考:
统计学基本概念
总体与样本:总体是研究对象全体的集合,样本是从总体中抽取的一部分元素的集合。
变量:用来描述数据的名称或符号。
数值变量与分类变量:数值变量是可度量的数据,如身高、体重等;分类变量是定性数据,如性别、血型等。
参数与统计量:参数是描述总体特征的指标,如总体均值、总体方差等;统计量是从样本中计算出来的指标,如样本均值、样本方差等。
描述性统计
频数分布表:将数据分为若干个组,统计每个组内的数据个数。
直方图:用直条矩形面积代表各组频数,矩形的面积总和代表频数的总和。
平均数:描述数据集中趋势的指标,计算方法有算术平均数、几何平均数、调和平均数等。
标准差:描述数据离散程度的指标,表示数据分布的宽窄程度。
概率与概率分布
概率:描述随机事件发生的可能性大小的数值。
概率分布:描述随机变量取值的概率规律的函数。
常见的概率分布有二项分布、泊松分布、正态分布等。
参数估计与假设检验
点估计:用单一的数值估计未知参数的值。
区间估计:用一定的置信水平估计未知参数的范围。
假设检验:根据样本数据对未知参数进行检验,判断假设是否成立。
常见的假设检验方法有t检验、卡方检验、F检验等。
相关分析与回归分析
相关分析:描述两个变量之间的线性关系的强度和方向。
回归分析:基于自变量和因变量之间的相关关系建立数学模型,用于预测因变量的值。
常见的回归分析方法有线性回归、逻辑回归等。
第一章统计总论1、统计的概念(1)统计工作:即统计实践,它是对社会自然现象客观存在的现实数量方面进行搜集,整理和分析的过程。
(2)统计资料:是指统计实践活动过程所取得的各项数字资料以及与之相关的其它实际资料的总称。
(3)统计学:统计学(理论),是指关于认识客观现象总体数量特征和数量关系的科学。
2、统计几个概念的关系(1)统计工作与统计资料的关系是统计活动与统计成果的关系;(2)统计工作与统计学是实践与理论的关系。
3、社会统计学的研究对象社会经济现象总体的数量特征和数量关系。
4、社会统计学的研究对象的特点社会性:与人类社会生产活动相联系的数量;总体性;有许多单独数量组成;具体性:研究的是具体事物的数量方面,而不是抽象的量。
5、统计学的研究方法大量观察法、统计分组法、综合指标法、统计模型法、归纳推断法。
6、统计总体的概念根据一定的目的与要求所确定的研究事物的全体。
它是由客观存在的,具有某种共同性质的许多个别事物所构成的整体。
7、统计总体的性质大量性、同质性、具体性。
8、统计总体的单位的概念构成总体的个别事物(个体单位),是总体的基本单位,构成基础。
9、统计总体和单位的联系与区别联系:互相依存,密不可分。
单位是形成总体的基本个体,同时单位也只有依赖于总体才存在区别:含义上的区别、总体是指标的载体,单位是标志的载体。
10、单位标志的概念简称标志,总体中各单位所共同具有的属性和特征。
是说明总体单位属性和特征的名称。
11、单位标志的表现表明标志特征在各个单位的具体表现(用来回答标志的文字或数字)。
12、统计的职能信息职能(基础职能)、咨询职能、监督职能13、统计总体的概念反映社会经济现象总体某一综合数量特征的社会经济范畴的数据。
14、统计指标的分类(1)数量指标:也称总量指标,反映社会经济现象的总规模和总水平的统计指标。
(2)质量指标:反映社会经济现象的相对水平或工作质量的统计指标。
15、统计指标的特点(1)一定社会经济范畴的具体表现(2)可量性(3)综合性16、统计指标与统计标志的关系联系:(1)互相依存,相互生成。
统计学第三章笔记最近在学统计学,这第三章可真是让我印象深刻啊!这一章主要讲的是数据的收集、整理和展示。
说起来好像挺简单,但里面的门道可多了去了。
就拿数据收集来说吧,以前我总觉得收集数据不就是随便问问、随便记记嘛。
可学了这章才知道,这里面的讲究可大了。
比如说,你要确定收集数据的目的是什么,是为了了解市场需求,还是为了评估产品质量?目的不一样,收集的方法和对象也就大不相同。
就拿我前段时间做的一个小调查来说吧。
我想知道我们小区居民对小区停车位紧张问题的看法。
一开始,我想得可简单了,就拿着个本子在小区门口见人就问。
结果呢,有的人行色匆匆,根本不理我;有的人随便应付几句,也说不到点子上。
后来我才发现,这样的收集方法太盲目了。
我回去好好琢磨了一下,重新制定了计划。
我先在小区的业主群里发了个简单的通知,告诉大家我要做这个调查,并且说明了调查的目的和意义,希望大家能支持。
然后,我把调查问卷分成了线上和线下两种方式。
线上的通过问卷星来收集,线下的我选择在小区人多的地方,比如小广场、超市门口设点,专门找那些看起来不忙、愿意交流的居民来填写。
为了让问卷更有针对性,我可花了不少心思。
问题不能太多,不然人家会嫌烦;也不能太简单,否则收集不到有用的信息。
我把问题分成了几个部分,比如居民目前的停车情况,每天找车位花费的时间,对小区停车位规划的建议等等。
而且,每个问题都提供了几个选项,方便大家回答。
在收集数据的过程中,我还遇到了一些有趣的事儿。
有个大爷特别热情,拉着我聊了半天,从小区的历史讲到现在的管理问题,差点把我带偏了。
还有个大妈,对停车位的问题特别有意见,一个劲儿地跟我抱怨,我都插不上话。
不过通过和他们的交流,我也更深入地了解了大家的想法和需求。
数据收集完了,接下来就是整理。
这也是个繁琐但重要的工作。
我把线上线下收集到的问卷都汇总到一起,先进行筛选,把那些填写不完整或者明显乱填的去掉。
然后,对每个问题的答案进行分类统计。
统计学原理笔记
一、统计学的基本概念
- 统计学的定义与目的
- 数据的类型:定性数据与定量数据
- 统计学的两个主要分支:描述统计学与推断统计学
二、数据的搜集与整理
- 数据来源:调查、实验、观察等
- 数据搜集方法
- 数据整理与清洗:缺失值处理、异常值处理、数据转换等
三、描述统计学
- 数据的集中趋势度量:均值、中位数、众数
- 数据的离散程度度量:极差、方差、标准差
- 数据的分布形态:偏态与峰态
四、概率与概率分布
- 概率的基本概念与性质
- 随机变量与概率分布
- 常见的概率分布:正态分布、二项分布、泊松分布等
五、抽样与抽样分布
- 抽样的基本原理
- 抽样误差的来源与控制
- 抽样分布与中心极限定理
六、统计推断
- 点估计与区间估计
- 假设检验的基本概念与步骤
- 常见的假设检验方法:t检验、χ²检验等
七、相关与回归分析
- 相关分析的概念与方法
- 简单线性回归分析的原理与应用
- 多元线性回归分析的原理与应用
八、统计学在实际问题中的应用
- 市场调查与营销分析中的应用
- 财务与投资分析中的应用
- 医学与生物统计学中的应用
九、统计软件的应用
- 常用的统计软件介绍与使用
- 数据分析与结果解释的演示分析
十、统计学的限制与误用
- 统计学的限制与局限性
- 统计学误用的情况与注意事项
- 如何正确应用统计学方法进行数据分析。
《统计学》(贾俊平)1 参数估计1.参数估计:统计推断的重要内容之一,以抽样和抽样分布为基础,用样本统计量来估计未知总体参数。
2.估计量:估计总体参数的统计量。
3.估计值:用具体样本计算出的估计量的值,即估计量的实现。
4.点估计:用某个估计值作为总体参数的估计。
5.区间估计:以点估计为基础,给出总体参数估计的一个区间范围,由点估计量加减边际误差得到。
能由抽样分布给出估计量与总体参数接近程度的概率度量,即置信水平。
6.置信区间:总体参数的估计区间。
统计学家在某种程度上确信它会包含总体参数真值,是随机区间。
7.置信水平(置信度):重复构造置信区间多次,其中包含总体参数真值的区间个数所占的比例。
它是针对随机区间而言的。
8.估计量评价标准:无偏性、有效性、一致性。
9.理论基础 ①大数定律:揭示了大量随机现象均值的稳定性。
常见的有伯努利大数定律(频率稳定性),辛钦大数定律(简单随机样本均值依概率收敛于总体均值),切比雪夫大数定律。
是用样本估计总体的理论基础。
②中心极限定理:揭示了独立同分布随机变量之和的极限分布是正态分布。
常见的有伯努利试验场合、独立同分布试验场合的中心极限定理。
是区间估计和假设检验的理论基础。
③抽样分布基本定理(正态假定)a. 2~(,/)X N n μσ;b. 222(1)/~(1)n S n σχ--;c. X 与2S 相互独立;d.~(1)X t n -; e. 2212122212/~(1,1) ()/S S F n n σσ--独立样本;f.221212~(2) (=)X Y t n n σσ+-独立样本,。
10.单总体参数估计①目标量:μ,π,2σ。
②影响因素:a.是否是正态总体;b.总体方差是否已知;c.是大样本还是小样本。
③抽样分布a.~(0,1)X Z N =; b.~(1) ~~(0,1) () t n X t N -⎧=⎨⎩,大样本; c.~(0,1) (5()5)Z N np n n p =≥-≥大样本,,;d. 2222(1)/~(1)n S n χσχ=--。
统计学原理主讲人:林则宏第一章绪论第一节统计学的产生与发展第二节统计学的性质与特点***第三节统计学的几个基本概念***第四节统计学与其他学科的关系课堂练习第一节统计学的产生与发展一统计活动的产生与发展二统计学的产生与发展统计活动的产生与发展1、统计活动在我国的产生与发展2、统计活动在国外的产生与发展统计学的产生与发展一萌芽期(17中叶-18末)1、国势学派代表人物:康令、阿亨瓦尔2、政治算术学派代表人物:配第、格朗特统计学的产生与发展二近代期(18末-19末)1、数理统计学派代表人物:拉普拉斯、凯特勒2、社会统计学派代表人物:恩格尔、梅尔一、统计与统计学的涵义什么是统计?1. 统计工作收集、整理、分析、推断数据的活动2. 统计资料统计工作的结果。
3. 统计学分析数据的方法与技术一、统计与统计学的涵义1. 数据搜集:例如,调查与试验2. 数据整理:例如,分组3. 数据展示:例如,图和表•数据分析:例如,回归分析二、统计研究对象的特点1、数量性2、总体性3、具体性4、变异性三、统计数据的内在规律(一些例子)•正常条件下新生婴儿的性别比为107:100•投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现1~6点的频率各为1/6•农作物的产量与施肥量之间存在相关关系四、统计学的应用领域应用统计的领域应用统计的领域(续)统计学的分科描述统计•内容搜集数据整理数据分析数据展示数据•目的描述数据特征找出数据的基本规律推断统计•内容参数估计假设检验•目的▪对总体特征作出推断描述统计与推断统计的关系理论统计与应用统计•理论统计▪研究统计学的一般理论研究统计方法的数学原理•应用统计▪研究统计学在各领域的具体应用统计学与数学的关系(联系)•统计学运用到大量的数学知识•数学为统计理论和统计方法的发展提供基础•不能将统计学等同于数学统计学与数学的关系(区别)数学研究的是抽象的数量规律,统计学则是研究具体的、实际现象的数量规律数学研究的是没有量纲或单位的抽象的数,统计学研究的是有具体实物或计量单位的数据 统计学与数学研究中所使用的逻辑方法不同▪数学研究所使用的主要是的演绎▪统计学则是演绎与归纳相结合,占主导地位的是归纳统计学与其他学科的关系•统计学可以用到几乎所有的学科领域统计学可以帮助其他学科探索学科内在的数量规律性•统计学不能解决各学科领域的所有问题对统计分析结果的解释需要各学科领域的专业人员第四节统计学中的几个主要术语一、总体与总体单位1、总体指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。
大一统计学笔记整理1. 统计学导论- 统计学的定义:统计学是一门研究如何收集、整理、分析和解释数据的科学- 统计学的应用领域:从商业到医学、社会科学到自然科学等各个领域都需要统计学的应用- 统计学的基本概念:总体、样本、参数和统计量- 统计学的研究方法:描述统计和推断统计- 数据的收集方式:观察法和试验法- 数据的分类:定量数据和定性数据- 描述统计的主要指标:频数、频率、平均数、中位数、众数、标准差和方差2. 数据的整理与呈现- 数据的整理:数据表、频数分布表和频数分布图- 数据的呈现:直方图、饼图、折线图、散点图和箱线图- 数据的处理:缺失数据的处理、异常值的处理和数据的变换3. 正态分布与抽样分布- 正态分布的性质:钟形曲线、对称性、均值和标准差的关系- 标准正态分布:Z分数和Z表的使用- 中心极限定理:大样本时抽样分布近似服从正态分布- 抽样分布的概念:样本均值的抽样分布、样本比例的抽样分布等- 样本均值的抽样分布:抽样误差、标准误和置信区间4. 统计推断与假设检验- 统计推断的基本思想:从样本推断总体- 参数估计:点估计和区间估计- 假设检验:零假设和备择假设、显著性水平、P值和拒绝域- 单样本检验:均值的假设检验和比例的假设检验- 双样本检验:两个独立样本均值的假设检验和配对样本均值的假设检验5. 回归与相关分析- 简单线性回归:回归方程、回归系数的估计和拟合优度- 多重线性回归:多元回归方程、多重共线性和变量选择- 相关分析:皮尔逊相关系数、斯皮尔曼等级相关系数和点双相关系数注意:以上内容仅为大一统计学的基础知识,详细内容和推导公式可参考相关教材和课堂讲义。
第一章 绪论参数与统计量参数: 刻画总体特征的指标 统计量: 刻画样本特征的指标统计的核心问题: 样本、总体总体与样本总体:确定的全部同质个体的某个(或某些)变量值 样本:总体中有代表性的一部分样本选择的原则——代表性、随机性、可靠性、可比性资料的代表性与可比性所谓代表性是指该样本从相应总体中经随机抽样获得,能够代表总体的特征;所谓可比性是指各对比组间除了要比较的主要因素外,其它影响结果的因素应尽可能相同或相近频率与概率区别和联系 (1) 区别频率: 是随机的,在试验前不能确定,无法从根本上来刻画事件发生的可能性的大小 概率: 是一个确定的常数,是客观存在的,与试验次数无关 。
(2) 联系频率: f=m/n (n 为观察次数,m 为发生频数)(0<f<1),当n 越大,f 越趋向于一个常数,即概率。
概率可看作频率在理论上的期望值,并从数量上反映了随机事件发生的可能性。
变异是统计学存在的基础变量及变量值:研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值),称为资料。
按变量值的性质将资料进行分类。
离散型变量; 连续型变量a 计量资料(定量) 连续型变量 + 部分不具有分类性质的离散型变量b 计数资料(定性) 离散型变量(分为无序分类资料(计数资料) + 有序计数资料(等级资料))c 等级资料(定性) 有序的计数资料/半计量资料(具有计数资料和计量资料特性)变量类型的转化(计量——计数(数值—— - + ++)协变量: 在实验设计中,为一个独立变量(解释变量),不为实验者所操纵,但仍影响实验结果μσπρβ,,,,,,,,X S p r b误差系统误差和随机误差(随机测量误差,抽样误差)。
(1)系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。
特点:具有累加性(2)随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。
绪论第一节统计学的含义和作用一、什么是统计学1.统计学的含义统计学是有效收集、处理、分析和解释数据,发现规律,以便更好决策的一门方法论学科。
❖ 2. 分析数据的方法有描述统计、推断统计。
⑴描述统计①描述统计是将所收集的数据处理后,用数值、表格或图形形式表现的有用信息。
②描述统计是基础,它为推断统计、统计咨询、统计决策提供必要⑵推断统计就是根据样本数据特征去估计或检验总体的数据特征。
二、统计学的作用和重要性1.统计学的作用人们用数据发现的规律做出更好的决策。
2.要发现规律,对统计数据通常有要求:客观性、适用性、准确性和及时性。
三、统计学是如何解决实际问题的?统计学解决实际问题的基本思路是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法处理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量知识作出总体特征的合理推断;⑥根据推断给出更好决策的建议;不解决问题时,重复第②-⑥步。
第二节统计学的基本概念❖一、总体、单位和样本1.总体统计总体是根据一定目的确定的,由客观存在的、具有某种同质性的许多个别事物构成的整体。
⑴同质性是确定统计总体的基本标准,它是根据统计的研究目的而定的。
研究目的不同,所确定的总体也不同,其同质性的意义也随之变化。
⑵统计总体还应具备大量性,即统计总体应应该由足够数量的同质性单位构成。
2.总体单位(简称单位)是组成总体的各个个体。
如典型案例1中英军的每架战机;事例4中的每个居民。
3.由总体的部分单位组成的集合称为样本(又称子样)。
构成样本的单位称为样品,样本中样品的数目称为样本容量。
4. 统计学解决问题的目的是认识总体的数据特征。
但是,当调查是破坏性的,或者出于成本、时间等因素考虑时,不必要或不可能对构成总体的所有单位都进行调查。
❖二、标志、指标(参数)和统计量1.标志:(1)总体单位普遍具有的属性或特征称为标志。
(2)标志按其表现分为品质标志和数量标志两种。
❖①品质标志表明单位属性方面的特征,品质标志的表现只能用非数值来描述.(如:典型案例1中英军战机的类型,事例4中每个居民的性别。
)❖②数量标志表明单位数量方面的特征,其表现用数值来描述(如: 典型案例1中英军战机的弹孔位置,事例4中每个居民的收入。
)2.参数(标志)⑴统计总体具有的数量特征的概念和数值称为统计指标,也称为参数。
⑵统计指标由两项基本要素构成,即指标的概念和指标的取值。
(指标的概念是对所研究现象本质的抽象概括,也是对总体数量特征的质的规定性。
)(例如事例4中居民人口数100万人,总收入31.4亿元。
)⑶统计指标按表示形式可以分为数量指标和质量指标.①凡是反映现象总规模、总水平的统计指标称为数量指标,用绝对数来表示。
例如事例4中居民总数100万人、总收入31.4亿元等,②凡是反映现象相对水平和工作质量的统计指标称为质量指标,用相对数或平均数来表示.例如企业职工平均工资5000元、工人出勤率93%等。
质量指标是总量指标的派生指标,以反映现象之间的内在联系和对比关系。
⑷单个指标不能反映总体的全貌,这便需要设立指标体系。
统计指标体系是由一系列相互联系的统计指标组成的有机整体,用以反映所研究现象各方面相互依存相互制约的关系。
3.统计量⑴统计量是样本观测量的一个已知函数,用来说明样本的特征。
是样本观测量的一个已知函数,用来说明样本的特征。
⑵抽取的样本不同,统计量的观测值也就不同。
如样本平均数、样本方差、样本比例是统计量,抽取样本后,人们通常用与总体参数对应的统计量观测值, 作为总体参数的估计.(如某汽车制造企业从生产的一批轿车中抽取了16辆轿车,用这些轿车的平均行驶里程值、合格率值分别作为该批轿车平均行驶里程、合格率的估计。
)三、数据❖(一)变量与变量值1.即说明现象的某一事实或数量的特征称为变量,将上述标志、指标和统计量的名称进行归纳就是变量。
2.变量的具体表现是变量值,数据就是变量及其表现,也可称为反映客观事物的事实或数量依据。
如:收入是一个变量,收入的表现是变量值。
3.将在特定研究过程中收集的所有数据集合在一起,称为数据集。
4.根据变量值的确定与否,变量分为确定性变量(受确定性因素影响,因素是明确的,可解释,可控制的)与随机变量(受许多不确定因素影响,如员工的起床时间)。
(二)数据的计量尺度收集数据时需要用到以下四种由低到高的计量尺度:定类尺度、定序尺度、定距尺度和定比尺度,计量尺度的不同决定了不同的数据分析与处理方法。
1.定类尺度是说明客观现象无序类别的计量。
定类尺度的主要数学特征是“=”或“≠”.如居民的性别是男、女计量,战机的类型是战斗机、轰炸机、侦察机等计量,这一场合的所使用的数值只作为无序分类的代码。
2. 定序尺度是说明客观现象有序类别的非数值计量。
定序尺度的主要数学特征是“<”或“>”.例如,对居民的满意度计量可以分为非常满意、满意、一般、不满意、非常不满意五类。
这一场合的所使用的数值只作为有序分类的代码。
3. 定距尺度是说明客观现象数值间距有意义的计量。
其用确切的数值反映现象之间在量方面的差异,定距尺度的主要数学特征是“+”“–” 。
如总量指标是定距尺度计量的。
(0不代表不存在)4.定比尺度是说明客观现象两个数值比有意义的计量。
定比尺度的主要数学特征是“x”“/”如质量指标中的相对数、平均数是定比尺度计量的(0代表不存在)5数据分类⑴定类尺度,定序尺度的数据统称为定性数据。
定性变量是指带有定性数据的变量。
⑵定距尺度,定比尺度的数据统称为为定量数据。
定量变量是指带有定量数据的变量。
根据定量变量值连续出现与否,定量变量分为连续性变量与离散型变量。
①连续型变量是指变量在某一区域内的取值是连续不断的,无法一一列举。
如:军机的弹孔位置,产品的寿命等。
②离散型变量是指变量的取值是间断的,可以一一列举。
例如,产品数等。
(三)数据的类型根据对客观现象观察的角度不同,统计数据可分为:横截面数据、时间序列数据和面板数据。
1.横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位进行观察而获得的数据。
例如,2014年全国各省、市、自治区的居民收入总值就属于横截面数据。
2.时间序列数据又称为动态数据,它是指在某一段时期内按时间顺序对同一总体进行观察而获得的数据。
例如,“十二五”期间我国按年份顺序的居民收入总值就属于时间序列数据3 .面板数据则是同时在时间和截面空间上取得的二维数据。
例如2005-2014年30个企业的总产值数据。
面板数据则由30个企业10年的数据组成,共有300个观测值。
从某一年份看,它是由30个企业总产值数第二章收集数据第一节统计调查方案设计调查方案设计是指导整个调查过程的纲领性文件,其主要内容主要包括以下几个方面:一、确定调查目的1.调查要达到的具体目标2.回答“为什么调查?”3.调查之前必须明确二、确定调查对象和调查单位1.调查对象:调查研究的总体或调查范围2.调查单位:需要对之进行调查的单位。
可以是调查对象的全部单位(全面调查),也可以是调查对象中的一部分单位(非全面调查)3.回答“向谁调查?三、选择合适的调查方式、调查方法1.调查方式是指调查的组织方式,主要有:普查、抽样调查、典型调查、重点调查和统计报表制度2.调查方法是指收集统计资料的方法,主要有:问卷法、访谈法、观察法和实验法四、设计调查项目和调查表1.调查项目:调查的具体内容2.调查表:表现调查项目的表格或问卷。
有单一表和一览表两种形式。
3. 回答“调查什么?”五、确定调查时间统计调查时间包括两种涵义:调查时间和调查期限1.调查时间:调查资料的所属时间(时期或时点)。
2.调查期限:进行调查工作的时间,包括搜集资料和报送资料的整个工作所需要的时间六、调查报告的撰写调查报告的撰写包括:调查过程的描述、依据调查数据所做的决策、对调查结果的评价【在调查方案中,应给出:提交调查报告的具体时间,并对调查的精度、费用等提出具体要求】七、制订调查工作的组织实施计划第二节数据收集来源一、数据收集的来源1.原始数据:必须要求调研者亲自收集2.二手数据:调研者需要识别和评估二手数据的有效性二、二手数据的收集1. 二手数据的来源⑴内部二手数据⑵外部二手数据2.二手数据收集的特点优点:快捷、成本低、易获取缺点:相关性差、时效性差、可靠性低四、二手数据收集的注意事项二手数据的评估主要包括:1.研究目的的评估——调研的目的是什么2.二手数据来源评估——谁收集了这些资料3.研究内容评估——收集了一些什么样的资料4.调查方式、方法评估——这些资料如何获得的5.二手数据相关性评估——这些资料与其他资料的一致程度如何6.二手数据时效性评估——这些资料是何时收集的第三节原始数据的收集一、数据收集的分类1.按数据收集的组织方式不同,分为统计报表和专门调查统计报表:按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级填报的一种调查组织方式。
专门调查:为了某一特定目的或专门问题而专门组织的调查2.按数据收集对象包括范围的大小不同,分为全面调查和非全面调查全面调查:对构成调查对象中的所有党委进行一一不漏的调查非全面调查:是在统计调查过程中,仅对调查中的一部分单位进行调查。
包括:抽样调查、重点调查、典型调查和非全面统计报表3.按数据收集的登记时间是否连续,分为经常性调查和一次性调查经常性调查:又称连续性调查,它是为了观察社会经济现象在一定时期内的数量变化所进行的调查登记或数据收集一次性调查:又称不连续性调查,它是对所研究的社会经济现象间隔一段时间所进行的调查登记或数据收集4.按数据收集实施主体的不同,分为政府统计调查和民间统计调查❖二、数据收集的调查方式数据收集的调查方式,按照组织方式主要有:普查、抽样调查、典型调查、重点调查和统计报表制度1.普查:专门组织的一次性全面调查普查的特点:⑴通常是一次性调查,周期性强⑵全面性调查,收集的资料全面、系统、准确⑶普查的点多面广,工作量大,投入多普查应遵循以下原则:⑴时间统一性原则⑵登记工作的规范性原则⑶普查项目统一规定原则⑷同类普查同周期性原则2.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本数据推断总体数量特征的一种非全面调查。
⑴概率抽样:根据随机原则从总体中抽选样本,并根据样本信息对总体的某些特征做出估计推断,对推断可能出现的误差可以从概率意义上加以控制非概率抽样:调查组根据自己的方便或主观判断抽取样本的方法⑵抽样调查优势:经济性、时效性、准确性⑶几种具体的抽样方式:①简单随机抽样——是指从总体N个单位中随机抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
②分层抽样——主要特征分层按比例抽样,主要使用于总体中的个体有明显差异。