统计学第一章
- 格式:docx
- 大小:16.60 KB
- 文档页数:3
第一章1、数据类型:按照所采用的计量尺度不同,我们将数据分为:分类数据(归于某一类别的非数字型数据,ex:血型),顺序数据(有序类别的非数据型数据,ex:喜好,产品等级),数值型数据(按照数字尺度测量的观测值)2、统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,样本统计量通常用小写英文字母表示,若存在未知变量就不是统计量。
第二章1、概率抽样(随机抽样):(1)特点:按一定的概率以随机原则抽取样本(抽取样本时使每个单位都有一定的机会被抽中)。
每个单位被抽中的概率是已知的,或是可以计算出来的。
当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率(2)简单随机抽样:体现在每一个样本点的选取上(简单直观方便,但是效率低)(3)分层抽样:适用于总体差距大,体现在每一层样本点选取上(精度最高)(4)系统抽样:第一个样本点的选取是随机的(简单,提高精度,但是方差估计难)(5)整群抽样:要求:群集间互斥且周延,群集与群集间差异小,群集内类似总体每一群的选取是随机的(简单,相对集中,方便,但是精度较差)(6)多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。
2、非概率抽样(1)抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查(2)有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式3、比较:4、抽样误差:所有样本可能的结果与总体真值之间的平均性差异影响因素:样本量的大小、总体的变异性第三章1、数据审核:(1)原始数据:完整性,准确性;(2)二手数据:适用性,时效性,确认是否有必要做进一步的加工整理2、分类数据的图示:(1)条形图:主要反映分类数据的频数分布(2)帕累托图:各类别数据出现的频数多少排序的柱形图,用于展示分类数据分布。
(3)饼图:主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题。
第一章:绪论第一节统计的产生与发展1.统计—总括地计算;对某一现象有关的数据进行搜集、整理、计算和分析等;统计学概括地说统计就是用数字作为语言表述事实。
它有三层含义即:统计资料、统计工作、统计学2统计资料是反映一定社会经济现象或科学技术内容的统计数字和相联系的文字分析报告。
3统计工作是在一定理论指导下,采用适宜的科学方法搜集、处理统计资料的一系列调查研究过程。
3统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。
其目的就是探索数据内在的数量规律性(为什么?)。
P8三者之间的关系:统计工作和统计资料是过程与成果的关系;统计工作和统计学是实践与理论的关系,理论源于实践,理论又高于实践,反过来又指导实践。
统计学是统计工作的经验概括和总结,是系统化了的知识体系。
第二节统计的基本问题1.统计的作用认识世界的有力武器是治国和管理的重要手段是科学研究的有效工具P42.统计的特点数量性总体性(综合性)具体性3.统计工作过程统计设计→统计调查→统计整理→统计分析4、统计设计就是根据统计活动的目的,结合研究对象的性质、特点,对统计范围、统计指标、分类目录、资料搜集整理方法、分析要求及有关组织工作等方面所作出的整体规划。
5、统计调查就是根据统计活动的目的所确定的统计指标,把研究对象中各总体单位的某些必须了解的特征记录下来。
6、统计整理就是根据统计设计的要求,将调查资料进行审核、分组、汇总、编制统计表等科学加工处理的过程,以便清晰地反映研究总体的综合特征。
7、统计分析就是根据统计研究的任务,以统计数据为基础,结合具体情况,运用静态和动态分析方法进行研究,肯定成绩,发现问题,找出原因,根据事物的本质及其规律性,提出解决问题的方法,更好地为社会主义现代化建设服务。
第三节统计学的若干基本概念1、总体:指在某种共性的基础上由许多个别事物结合起来的整体。
简言之总体是同质个体所组成的整体。
基本统计方法第一章概论1•总体(Population ):根据研究目的确定的同质对象的全体(集合) ;样本(Sample ):从总体中随机抽取的部分具有代表性的研究对象。
2.参数(Parameter ):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量(Statistic ):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。
3.统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。
第二章计量资料统计描述1.集中趋势:均数(算术、几何)、中位数、众数2.离散趋势:极差、四分位间距( QR=P75-P25)、标准差(或方差)、变异系数(CV)3.正态分布特征:①X轴上方关于X= 对称的钟形曲线;②X= 时,f(X)取得最大值;③ 有两个参数,位置参数和形态参数;④曲线下面积为1,区间土的面积为68.27% ,区间±1.96 的面积为95.00%,区间±2.58 的面积为99.00%。
4.医学参考值范围的制定方法:正态近似法:X U /2 S ;百分位数法:P2.5-P 97.5。
第三章总体均数估计和假设检验1.抽样误差(Sampling Error ):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。
抽样误差不可避免,产生的根本原因是生物个体的变异性。
2.均数的标准误(Standard error of Mean, SEM):样本均数的标准差,计算公式:八n。
反映样本均数间的离散程度,说明抽样误差的大小。
3.降低抽样误差的途径有:①通过增加样本含量n;②通过设计减少S。
4.t分布特征:①单峰分布,以0为中心,左右对称;②形态取决于自由度,越小,t值越分散,t分布的峰部越矮而尾部翘得越高;③当逼近a ,S X逼近X, t分布逼近u分布,故标准正态分布是t分布的特例。
5.置信区间(Con fide nee In terval , CI ):按预先给定的概率(1-)确定的包含总体参数的一个范围,计算公式:X t /2, S X或X U /2, S X。
第一章总论第一节统计的产生和发展一、统计的含义统计一词通常有三种含义:即统计工作、统计资料、统计学。
统计工作是对社会、经济以及自然现象的总体数量方面进行搜集、整理和分析过程的总称;统计资料是统计工作的成果,即是通过统计工作所取得的各种数字资料及与之相关的其它资料的总称;统计学是一门系统地论述统计理论和方法的科学;它们既有区别又有联系:统计学与统计工作是理论与实践的关系,而统计工作的成果便是统计资料。
二、统计工作的产生与发展统计学科的产生与发展17世纪中叶有:政治算术学派{代表人物:威廉·配第}国势学派(记述学派){代表人物:康令、阿亨瓦尔}。
配第为了让人们知道和确信“英国的事业和各种问题,并非处于可悲的状态”,在他的代表作《政治算术》(1671-1676年间写成)中用数字比较分析了英、荷、法三国的经济实力和造成这种实力差异的原因,并从贸易、税别、分工、资本和利用闲散劳动力等多方面提出了英国的强盛之道。
19世纪后半叶有:数理统计学派{代表人物:凯特勒}、社会统计学派。
第二节统计的研究对象一、统计的性质统计是认识社会的有力武器,四层含义:社会经济统计是一种武器,就是一种工具、一种手段、一种方法;它是一种认识武器,是用来认识和反映客观世界运动、发展、变化的武器;它是一种认识社会的武器,即它是一门研究社会经济的科学;它是认识社会的有力武器。
二、统计的特点数量性、具体性、总体性、社会性第三节统计研究的基本方法和统计工作过程一、统计研究的基本方法统计工作的基本任务有两条:一是服务,二是监督。
大量观察法、综合指标法、统计分组法二、统计工作过程就一次统计活动来讲,一个完整的认识过程可分为传统的三阶段:统计调查即根据统计任务所确定的指标体系,拟订调查纲要,搜集被研究对象的准确材料;统计整理就是对调查资料加以汇总综合,使之系统化、条理化;统计分析就是将加工整理好的统计资料加以分析研究,采用各种分析方法,计算各种分析指标,揭示被研究对象的基本特征和发展的规律性,必要时还要对其未来的发展作出科学的预测。
第一章统计学导论
1.1统计学概述
一、什么是统计学
1、统计学是收集、分析、表述和解释数据的科学
2、统计是人们认识客观世界总体数量变动关系和变动规律的活动的总称,是人们认识客观世界的一种有力工具
3、统计研究对象的特点
①(客观)数量性;②总体性;③变异性
二、统计学的产生与发展
1、统计学是由管理国家的需要而产生的
2、作为一门科学的统计学的产生与发展,始于十七世纪的欧洲
①古典统计学(17世纪中—18世纪中):分为政治算术学派和国势学派
②近代统计学(18世纪末—19世纪末):分为数理统计学派和社会统计学派
③现代统计学(20世纪以来):分为数理统计学派和社会经济统计
三、统计学的分类
1、理论统计学——研究的内容是统计的一般理论和方法
①描述统计学:收集、加工数据,并用图形、表格和数值方法来汇总数据的统计学
②推断统计学:用样本数据对总体的某些特征进行估计和检验的统计学
2、应用统计学——研究的内容是运用某一特定领域的统计问题
包括:社会统计学、人口统计学、卫生统计学、体育统计学……
1.2统计学的基本概念
一、总体、个体与样本
1、统计总体(总体):由客观存在的、具体某种共同性质的许多个别事物的全体。
又分为有限总体和无限总体。
(具有客观性、大量性、同质性、变异性、相对性等特点)
2、总体单位(个体):构成总体的个体,即每一个单位
(总体由总体单位组成,要认识总体必须从认识总体单位开始,总体是统计认识的对象)注意:总体与总体单位的区分不是固定的:同一研究对象,在一种情况下是总体,在另一种情况下可能成了总体单位
3、样本:从总体中抽取,并作为总体代表的一部分总体单位的集合体。
(样本取自总体,样本不唯一)
二、标志与指标
1、标志:说明总体单位属性和特征的名称。
标志的具体表现称为标志值
①品质标志:表明事物“质”的特征的标志。
如:国籍、性别、民族、政治面貌
②数量标志:表明事物“量”的特征的标志。
如:年龄、身高、体重
③不变标志:所有总体单位的标志值相同。
④可变标志:总体单位的标志值不完全相同(是一个变量)
2、标志值
如:中国、男、汉、党员(文字表述)
如:21岁、192cm、70公斤
3、统计指标:是指反映现象总体数量特征的概念及数值
时间限制、空间限制、指标名称、具体数值、计量单位
2020年末、南昌市、总人口、450 、万人
A、统计指标的分类
①按时间特征分类:时期指标、时点指标
②按表现形式分类:总量指标、相对指标、平均指标
③按内容特征分类:数量指标、质量指标
B、统计指标体系:是指具有某种内在联系的一系列统计指标所构成的整体
(全面、综合的对客观事物进行描述)
4、标志和数值的联系与区别
①联系
A、标志是总体指标的来源和基础,指标则是标志的综合
B、数量标志与指标之间存在着变换关系
②区别
A、标志是说明总体单位特征的,指标是说明统计总体数量特征的
B、有的标志用数值表示,有的标志用文字表示,而指标都是用数值表示的
三、数据的种类
1、数据的计量尺度
①定类测量尺度
a)按现象性质差异进行的辨别与区分。
测量结果形成定类数据。
b)定类数据确切的值一般是以文字表述的,但可以用数值标识,仅起标签作用
c)定类数据的各类别间是平等的,没有高低、大小、优劣之分。
d)例如性别、种族、运动项目
②定序测量尺度
a)对现象顺序差异进行的辨别与区分。
测量结果形成定序数据
b)定序数据确切的值一般以文字表述的,也可以用数值标识,仅起标签作用
c)定序数据各类别间有高低优劣之分,不能随意排列,但差异无法准确计量
d)例如:大学生>中学生>小学生
③定距测量尺度
a)按现象绝对数量差异进行的辨别和区分。
测量结果形成定距数据
b)定距数据的值以数字表述,有计量单位,可以进行加减运算
c)定距数据各类别间有大小之分,但没有绝对的零点,不能进行乘除运算
d)例如:天气预报:九江:最高温度3℃,最低—7℃。
南昌:最高温度6℃,最低—2℃。
故而两地最高温度相差3℃。
九江最低温度较南昌最低温度低5℃,反之,最高温度……
④定比测量尺度
a)对现象绝对差异和相对差异进行的辨别和区分。
测量结果形成定比数据
b)定比数据确切的值以数字表述,有计量单位,可以进行加减运算
2、统计数据的分类
①按反映时间属性的不同:分为截面数据和时间数列数据
②按采取的计量尺度不同:分为分类数据、顺序数据、定距数据和定比数据(其中前两个是定性数据、后两个是定量数据)
1.3统计学工作过程
统计研究目的:统计设计。
又分为收集数据(实验统计调查)、统计整理、描述分析和推断分析(统计总体数量特征)、资料的积累、开发与应用。