当前位置:文档之家› 统计学重点

统计学重点

统计学重点
统计学重点

1.统计学是收集、处理、分析、解释数据并从数据中得出结论的科学

统计学分为描述统计和推断统计(分为参数估计和假设检验)

2、包含所研究的全部个体的集合,称为总体。

从总体中抽取的一部分元素的集合,称为样本。

用来描述总体特征的概括性数字度量,称为参数。

用来描述样本特征的概括性数字度量,称为统计量。

变量分为:分类变量、顺序变量、数值型变量。

5种鉴别图表优劣的准则:一张好的图表应当1 精心设计、有助于洞察问题的实质2 使复杂的观点得到简明、确切、高效的阐述3能在最短的时间内以最少的笔墨给读者提供最大量的信息4是多维的5表述数据的真实情况

变量值与其平均数的离差除以标准差后的值,称为标准分数。

标准分数以测度每个数值在该组数据中的相对位置,并可以用它来判断一组数据是否有离群点。z=(x-μ)/σμ为平均数,σ为标准差

变异系数:变异系数是衡量资料中各观测值变异程度的另一个统计量。

变异系数=标准差/平均数

点估计:从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计

区间估计:根据一个样本的观察值给出总体参数的估计范围

概率抽样的分类

1)纯随机抽样:

对总体的所有容量不做任何的分类和排队,完全按随机原则逐个抽取样本容量.

2)、分层抽样

类型抽样:将全及总体中的所有单位按某一主要标志分组,然后在各组中采用纯随机抽样或等距抽样方式,抽取一定数目的调查单位构成所需的样本.

3)、系统抽样

先将总体各单位按某一有关标志(或无关标志)排队,然后相等距离或相等间隔抽取样本单位4)、整群抽样

在全及总体中以群(或组)为单位,按纯随机方式或等距抽样方式,抽取若干群(或组),然后对所有抽中的各群(或各组)中的全部单位一一进行调查

假设检验:事先对总体参数或分布形式作出某种假设然后利用样本信息来判断原假设是否成立

当原假设为真时拒绝原假设,所犯错误称为第Ⅰ类错误,又称弃真错误。

当原假设为假时没有拒绝原假设,所犯错误称为第Ⅱ类错误,又称取伪错误。

在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率,称为P值,也称观察到的显著性水平。

利用P值进行决策准则:如果P值<α,拒绝H0:;如果P值>α,不决绝H0.

假设检验的步骤

1、 提出原假设和备择假设

2、确定适当的检验统计量

3、规定显著性水平α

4、计算检

验统计量的值 5、作出统计决策

对两个变量之间线性相关程度的度量称为简单相关系数

若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ 若是根据样本数据计算的,则称为样本相关系数,记为 r

时间序列:时间序列是指反映客观现象的同一指标在不同时间上的数值,按时间先后顺序排列而形成的序列,

时间序列可以分为绝对数时间序列、相对数时间序列和平均数时间序列三种

绝对数时间序列,简称绝对序列:它是把同一总量指标在不同时间上的数值按时间先后顺序排列而形成的时间序列。 相对数时间序列:它是把一系列同类的统计相对数按照时间先后顺序排列起来而形成的时间序列,反映事物之间对比关系的变化情况 平均数时间序列:它是把一系列同类的统计平均数按照时间先后顺序排列起来而形成的时间序列,表现事物一般水平的变化过程的发展趋势。

【例12.1】 设某粮油商店1999年和1998年三种商品的零售价格和销售量资料如表12-1。试分别以基期销售量和零售价格为权数,计算三种商品的价格综合指数和销售量综合指数 表12-1 某粮油商店三种商品的价格和销售量 商品名称

计量 单位 销售量 单价(元) 1998 1999 1998 1999 粳 米 公斤 1200 1500 3.6 4.0 标准粉 公斤 1500 2000 2.3 2.4 花生油

公斤

500

600

9.8

10.6

表12-2 加权综合指数计算表 商品名称 计量

单位

销售量 单价(元)

销售额(元) 1998 q 0 1999 q 1 1998 p 0 1999

p 1 1998 p 0q 0 1999 p 1q 1 p 0q 1 p 1q 0 粳 米

标准粉

花生油 kg

kg

kg

1200 1500 500 1500 2000 600 3.6 2.3 9.8 4.0 2.4 10.6 4320 3450 4900 6000 4800 6360 5400 4600 5880 4800 3600 5300 合计 —

12670

17160

15880

13700

2222-?--=y y n x x n y x xy n r ()()22

22∑∑∑∑∑∑∑-?--=y y n x x n y x xy n r

拉氏指数: 价格综合指数为

销售量综合指数为

结论∶与1998年相比,三种商品的零售价格平均上涨了8.73%,销售量平均上涨了25.34%

帕氏指数: 价格综合指数为

销售量综合指数为

结论∶与1998年相比,三种商品的零售价格平均上涨了8.06%,销售量平均上涨了25.26

从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。 1) 样本均值的抽样标准差等于多少?

2) 在95%的置信水平下,估计误差是多少?

解: 1) 已知σ = 5,n = 40,?x = 25 ∵

= 5 /√40 ≈ 0.79

2) 已知

∴ 估计误差 E = 1.96×5÷√40 ≈ 1.55

2. 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

1) 假定总体标准差为15元,求样本均值的抽样标准误差。 2) 在95%的置信水平下,求估计误差。

3) 如果样本均值为120元,求总体均值μ的95%的置信区间。

12670137000

0010

1%73.1081267013700000101===∑

q p q p p 12670158800

01001%34.1251267015880001001

===∑

∑q p q p q 158********

0110

1%06.1081588017160101101===∑

∑q p q p p 137001716001110

1%26.12513700171600

11101===∑

∑q p q p q n

x n x σσ=

104560 1.96=104560

3.

检验统计量的基本形式为

抽样调查的特点:1.经济性2时效性强3适用面广4准确性高 调查问卷设计提问项目注意项目:1提问的内容尽可能短2用词准确通俗3一项提问只包含一项内容4避免诱导性提问5避免否定式提问6避免敏感性提问。

直方图与条形图的区别:1条形图的每一矩形表示一个类别,其宽度没有意义,而直方图的宽度表示各组组距2由于分组数据具有连续性,直方图的各矩形通常是连续排列的,而条形图是分开排列的3条形图主要用于展示定性数据,而直方图主要用于展示定量数据。

茎叶图相比直方图优点:茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息。而直方图虽然能很好的显示数据分布,但不能保留原始数据信息。在应用方面,直方图一般使用于大批量数据,茎叶图适用于小批量数据。

设计图表时,应绘制得尽可能简洁,以能够清晰显示数据、合理表达统计目的为目标。 一组数据相加后除以数据的个数而得到的结果,称为平均值,也称均值。 一组数据排序后处于中间位置上的变量值,称为中位数。 众数是一组数据中出现频率最多的数值。

变量值与其平均数的离差除以标准差后的值,称为标准分数。 相关系数显著性检验的步骤? 消费者价格指数缩写为CPI ,是反映一定时期内消费者所购买的生活消费品价格和服务项目的价格的变动趋势和程度的相对数。 消费者价格指数的作用:1用于反映通货膨胀状况2用于反映货币购买力的变动趋势3用于反映对职工实际工资的影响4用于缩减经济序列

股票价格指数是反映某一股票市场上多种股票价格变动趋势的一种相对数,简称股票指数,其单位一般用“点”表示。

n

0-n x z σμ0-=

统计学课程知识点总结

1. 统计的研究对象的特点:数量性,总体性,变异性。 2. 统计研究的基本环节:统计设计,收集数据,整理与分析,统计资料的积累、开发与应用。 3. 统计总体:根据一定数目的确定的所要研究的的事物的全体。特点:同质性、大量性。 总体可分为有限总体和无限总体。 标志:总体各单位普遍具有的属性或特征。标志分为品质标志(表明单位属性,用文字、语言描述)和数量标志(表明单位数量,用数值表现)。 不变指标:一个总体中各单位有关标志的具体表现都相同。变异指标:在一个总体中,当一个标志在各单位的具体表现有可能都相同。 第二章 1. 统计调查方式:普查,抽样调查,重点调查,定期报表制度。 调查方式按调查的范围划分,可分为全面调查和非全面调查。 按时间标志可分为连续性(经常性)调查和不连续性(一次性)调查 (一) 普查是专门组织的一种全面调查。特点:非经常性调查、最全面调查。 (二) 抽样调查是一种非全面性调查,可分为概率调查和非概率调查。 (三) 重点调查是指在调查对象中,只选择一部分重点单位进行的非全面调查,它是一种不连续的调查。 (四) 定期报表制度又称统计报表制度,它是依照国家有关法规,自上而下地统一布置,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上逐级地定期提供统计资料的一种调查方式。 2. 我国现行的统计调查体系:以必要的周期性普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分定期报表综合运用的统计调查方法体系。 3.调查对象是指需要调查的现象总体。调查单位是指所要调查的具体单位,它是进行调查登记的标志的承担者。 4. 统计分组的原则:穷尽原则和互斥原则。 (先分后组) 间断型分组和连续型分组,等距和异距注意事项 第三章 1. 简单算术平均数121 n i n i x x x x x n n =++ +== ∑ 2. 加权算术平均数 11221121 n i i n n i n n i i x f x f x f x f x f f f f ==+++== +++∑∑ 3. 组距数列的算术平均数 4. 相对数的算术平均数 5. 调和平均数 6. 几何平均数 7. 算术平均数的性质: 1 1 , ()0n n i i i i nx x x x ===-=∑∑ 8. 组距数列的众数112O O O M M M L d ?=+??+? 9. 组距数列的中位数12e e e e M e M M M f S M L d f --=+?∑ 11. 方差(注意与样本方差的区别)P102: 10,11题 第四章 1. 事件的关系和运算:包含 ,相等 ,和 ,差 ,积 ,逆 ,不相容 。 2. 概率的计算:古典概型 ,几何概型 加法法则 ,乘法公式 条件概率 ,全概率与贝叶斯公式 3. 常见的随机变量的期望与方差

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

统计学知识点梳理

型;有下划线的重点记忆!当然整理的知识点都就是重点!都要背与理解!Fighting!) 第一章绪论 一.统计的含义 即统计工作、统计资料与统计学 统计工作:统计实践活动,搜集,整理,分析与提供关于社会现象数字资料工作总称 统计资料:统计实践活动过程中所取得的各项资料,包括原始资料与加工整理资料 统计学:关于认识客观现象总体数量特征与数量关系的科学 二.统计工作过程 就一次统计活动来讲,一个完整的认识过程一般可以分为统计调查、统计整理与统计分析三个阶段。 统计调查:第一阶段,就是认识客观经济现象的起点,就是统计整理与统计分析的基础。 统计整理:第二阶段,处于统计工作的中间环节,起着承前启后的作用。

统计分析:第三阶段,通过第三阶段,事物由感性认识上升到理性认识。 三.总体与总体单位(会辨析总体与总体单位即可) 总体,亦称统计总体,就是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体;构成总体的这些个别单位称为总体单位。 总体由总体单位构成,要认识总体必须从总体单位开始,总体就是统计认识的对象。 例如:所有的工业企业就就是一个总体,其中的每一个工业企业就就是一个总体单位。 四.标志与指标 标志就是用来说明总体单位特征的名称。 指标,亦称统计指标,就是说明总体的综合数量特征的。一个完整的统计指标包括数量指标名称与指标数值两部分。(以上内容理解即可) 1、指标与标志的区别与联系(简答) 指标与标志的区别:(1)指标就是说明总体特征的,而标志就是说明总体单位特征的;(2)指标都能用数值表示,而标志中的品质标志不能用数值表示,就是用属性表示的;(3)指标数值就是经过一定的汇总取得的,而标志中的数量标志不一定经过汇总,可直接取得;(4)一个完整的统计指标,一定要讲时间、地点、范围,而标志一般不具备时间、地点等条件。 指标与标志的联系:(1)有许多统计指标的数值就是从总体单位的数量标志值汇总而来的; (2)两者存在着一定的变换关系,即由于研究目的不同,原来的统计总体如果变成总体单位了,则相应的统计指标也就变成数量标志了。 2、标志与标志值(会区分) 标志分为品质标志与数量标志,数量标志用来说明总体单位量的特征,可以用数值表示,即为标志值(如:年龄、工资额、身高) 3、变异与变量(会什么就是变异,什么就是变量) 变异:品质标志在总体单位之间的不同具体表现。如:性别表现为男、女,民族表现为汉、满、蒙等。 变量:数量标志抽象化即为变量,而数量标志的不同具体表现则称为变量值(或标志值)。如:某职工的年龄就是42岁,月工资2200元。 4、统计指标的划分 (1)统计指标按其所反映的总体内容的不同,可分为数量指标与质量指标。数量指标指说明总体规模与水平的各种总量指标。质量指标指反应现象总体的社会经济效益与工作质量的各种相对指标与平均指标。 (2)统计指标按其作用与表现形式的不同,有总量指标(绝对数)、相对指标(绝对数)、平均指标(平均数)三种。 第二章统计调查与整理 一、统计调查的含义 统计调查就是统计工作过程的第一阶段。它就是按照统计任务的要求,运用科学的调查方法,有组织的向社会实际搜索各项原始资料的过程。统计调查就是整个统计认识活动的基础,决定着统计认识过程及其结果的成败。 二、统计调查方案设计的内容+调查对象、调查单位的含义 ⒈确定调查目的;(为什么调查) 根据实际需要与可能确定 ⒉确定调查对象与调查单位;(向谁调查) 调查对象——社会现象的总体 调查单位——调查标志的承担者(总体单位)

统计学原理考试知识点整理

第1章 绪论 1、统计的含义统计一词最基本的含义是对客观事物的数量方面进行核算和分析,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。 2、统计的特点P3 数量性 具体性 综合性 3、统计学的若干基本概念 总体与总体单位P10: 总体是指在某种共性的基础上由许多个别事物结合起来的整体,构成总体的个别事物叫总体单位; 总体的特征:同质性,大量性,差异性;总体的分类:有限总体与无限总体;标志、变异与变量P10: 标志,是指说明总体单位特征的名称。变异:总体单位之间品质和数量上的差异,即可变标志在总体各单位之间所表现出的差异。变量:可变的数量标志。 连续型变量与离散型变量联系和区别:连续型:变量值可作无限分割的变量离散型:变量值只能以整数出现的变量指标与标志P11 (指标,说明总体数量特征的概念)区别:第一,指标说明总体的特征,而标志则说明总体单位的特征。第二,指标只反映总体的数量特征,所有指标都要用数字来回答问题,没有用文字回答问题的指标。而标志既有反映数量也有反映品质。 第2 章统计调查 1、统计调查的含义及其在统计工作中的地位P13 含义:根据统计研究的目的,有组织、有计划地搜集统计资料的过程地位:是统计工作的第一阶段,是整个统计工作的基础一环 2、统计调查的基本原则P13-14 一、要实事求是,如实反映情况 二、要及时反映,及时预报 三、要数字与情况相结合 3、统计调查的组织形式:普查P14:含义:为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查、优缺点:,适用场合:主要用于一些重要项目呢的调查,如人口普查、耕地普查、基本单位普查、工业普查和库存普查等; 随机抽样调查P14:含义(按随机原则(机会均等原则)从总体中抽取部分单位进行调查,并借以推断和认识总体的一种统计方法)以及具体的抽样方法【第七章】系统抽样、多阶 简单随机、分层抽样、整群抽样、 段抽样)及适用场合;非随机抽样:含义(调查者有意识地或随意而 非随机地从总体中抽取部分单位进行调查的统计方法)以及具体的抽样方法P15 (重点抽样:只对总体中为数不多但影响颇大的重点单位进行研究的一种非

(完整word版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

统计学考试要点整理

2010级3班整理生物统计学基础知识整理 生物统计学整理 第一部分名词解释本文档仅供参考,仍有不足,有许多名词没有交待,需自己补充。本资料与课本,课后习题册搭配使用效果更好,有疑问联系大正 1生物统计学:是一门探讨如何从事生物学实验研究的设计,取样,分析,资料整理与推 论的科学.是数理统计在生物学研究中的应用,它是应用数理统计的 原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科, 属于应用统计学的一个分支。 2总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 3个体:构成总体的每个成员称为个体。 4样本:总体的一部分称为样本 5样本含量:样本内包含的个体数目称为样本含量 6抽样:从总体中获得样本的过程。 7连续性数据:与某种标准做比较所得到的数据称为连续型数据,又称为度量数据 8离散型数据:由记录不同类别个体的数目所得到的数据,称为离散型数据 9变量的方法:对连续性数据进行分析的方法,通常称为变量的方法 10属性的方法:对离散型数据进行分析的方法 11对于数据的变异程度,经常使用的度量方法有三中,1 范围或称为极差 2 平均离差 3 标准离差或称为标准差 12概率论:研究偶然现象本身规律性的科学 13统计学:基于实际观测结果,利用概率论得出的规律,揭示偶然性中所寄寓的必然性 的科学 14随机实验:在我们做第一次观测时,并不能准确得知下一次的结果,这样的实验叫做随机实验 随机误差:试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,称之为随机误差。 15基本事件:试验的每一最基本结果用小写拉丁字母表示

2.什么叫总体?什么叫样本?为什么要抽样?怎样抽样? 1)总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 2)样本:总体的一部分称为样本 3)从总体中获得样本的过程称为抽样,抽样的目的是希望通过对样本的 研究,推断其总体。生物统计学中往往总体数目是无限个,为方便研究总 体特征需要抽样。 4)从总体中抽取样本时,总体中的每一个个体被抽中的机会必须都一样,不能带有偏见,我们得到的样本应该是该市总体的一部分,需要进行随机 抽样。随机抽样的方法很多,例如抽签,拈阄等。最好方法是使用随机数 字表进行抽样。 5)随即数字表抽样步骤:第一步,闭上眼睛用铅笔在随机数字表上任意 点上一点,假若点到奇数,就用第一页表;假若点到偶数,就用第二页表。 第二步,在选定的那一页上,在点一次,决定从那个字开始。决定开始以 后进行读书(例如,总体有 4728 个个体,那就四位数字为一节读下去,

统计学知识点全归纳全面准确

统计学知识点汇总 一、统计学 统计学是一门关于数据资料的收集、整理、分析和推断的科学。 二、统计学的产生与发展 (1)政治算术学派 最早的统计学源于17世纪英国。其代表人物是威廉·配第,代表作《政治算术》。政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,为统计学的发展开辟了广阔的前景。其被称为“无统计学之名,有统计学之实”。 (2)记述学派 亦称国势学派,创始人和代表人物是德国康令和阿亨瓦尔,主要使用文字记述方法对国情国力进行研究,其学科内容与现代统计学有较大差别。因此被称为“有统计学之名,无统计学之实”。 (3)社会统计学派 创始人和代表人物,德国恩格尔和梅尔。该学派主张统计是实质性的研究社会现象的社会科学,认为统计学的研究对象是社会现象,目的在于明确社会现象内部的联系联系和相互关系。 (4)数理统计学派 创始人是比利时统计学家凯特勒,他所著的代表作《社会物理学》等将概率论和统计方法引入社会经济方面的研究,其认为统计学是一门通用的方法论科学。 从19世纪中叶到20世纪中叶,数理统计学得到迅速发展。到20世纪中期,数理统计学的基本框架已经形成,数理统计学派成为英美等国统计学界的主流。 三、统计的特点 (1)数量性: 社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之

间的数量关系和质量互变的数量界限。 (2)总体性: 社会经济统计的认识对象是社会经济现象的总体的数量方面。例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。 (3)具体性: 社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。 (4)社会性: 社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。 四、统计工作过程 (1)统计设计 根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。(2)收集数据 统计数据的收集有两种基本方法,实验法和调查法。 (3)整理与分析 描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。 推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。 (4)统计资料的积累、开发与应用

医学统计学考试重点

考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

统计学重点

简答 1、抽样框是包含全部抽样单位的名单框架。主要有三种形式:名单抽样框;区域抽样框;时间表抽样框。 2、样本估计量的标准差定义为抽样平均误差;抽样平均误差的平方为抽样方差;一定概率下抽样误差的可能范围,称为极限误差 3、必要抽样数目因素影响(1)总体方差(或总体标准差)(2)允许误差范围(3)置信度(4)抽样方法(5)抽样组织形式 4、估计量:样本指标又称样本统计量与或估计量。 标准为:无偏性;有效性;一致性 5、点估计常用的方法有哪两种?其基本思想是什么?一是矩估计法。其基本思想是:由于样本来源于总体,样本矩在一定程度上反映了总体矩,而且由大数定律可知,样本矩依概率收敛与总体矩。因此,只要总体x的k阶原点矩存在,就可用样本矩作为相应总体矩的估计量,用样本矩的函数作为总体矩的函数的估计量。 二是极大似然估计法。其基本思想是:设总体分不函数形式已知,但又未知参数,未知参数可以取很多值,在未知参数的一切可能取值中选一个使样本观测值出现的概率为最大的参数作为估计量。 6什,么是抽样推断?抽样推断都有哪几方面的特点? 答:抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推断总体相应数量特征的统计分析方法。特点:(1)是由部分推算整体的一种认识方法论。(2)建立在随机取样的基础上。(3)运用概率估计的方法。(4)抽样推断的误差可以事先计算并加以控制。 7,什么是参数和统计量?各有何特点? 答:参数指的就是某一个全及指标,它反映了全及总体某种数量特征,统计量即样本指标,它反映了样本总体的数量特征。其特点是:全及指标是总体变量的函数,但作为参数其指标值是确定的、唯一的,是由总体各单位的标志值或标志属性决定的;而统计量是样本变量的函数,是总体参数的估计值,其数量由样本各单位标志值或标志属性决定,统计量本身也是随机变量, 8数据计量尺度:定类尺度、定序尺度、定距尺度、定比尺度。其中定类是分类数据,定序是顺序数据,定距和定比是数值型数据。 常用的调查方式:统计报表、普查、抽样调查、重点调查、典型调查。 9.方差分析:是检验多个总体均值是否相等的统计方法。它是通过检验个总体的均值是否相等来判断分类型自变量对数值型因变量是否有影响。表面上看,方差分析是检验多个总体均值是否相同,但本质上他所研究的是分类型自变量对数值型因变量的影响。例如,他们之间有没有关系,关系的密切程度如何等。10,一组数据的分布从三个方面进行测度:集中趋势,离散程度,偏态和峰太。数据的集中趋势是指一组数据项某一中心靠拢的倾向,它反映了一组数据中心点的位置所在,数据的离散程度反映了各变量值远离其中新的程度,数据的偏态和峰太是测度数据分布形状的两个重要指标。, 11离散系数是用来对两组数据的差异程度进行相对比较的。因为在比较相关的.两组数据的差异时,方差和标准差是以均值为中心计算的,因而有时直接比较方差是不准确的,需要剔除均值大小不等的影响,计算并比较离散系数。他是从相对的角度观察差异和离散系数的,在比较相关事务的差异程度时,较之直接比较标准差要好。 1.一个完整的统计调查方案应包括那些内容? 答:1、确定目的和任务;2、确定对象和单位;3、确定内容,拟定调查表;4、确定时间和期限;5、确定方法;6、确定组织和计划。 2.统计调查误差哪有几种?如何防止或尽量减少调查误差?答:统计调查误差有两种,一种是登记误差,一种是代表性误差。防止和减少登记误差,应制定周密的调查方案,并抓好调查方案的实施工作,利用先进的设备和手段。防止代表性误差,关键在于调查单位的选取。在重点调查和典型调查中应加强选取单位前的研究,在抽样调查中则要严格遵守随机抽样原则,以便选出的调查单位对总体具有较高的代表性。 3.对于连续型变量编制组距式变量数列组限应如何设置?为 什么? 答:对于连续型变量编制组距式变量数列组限应重叠设置。因为连续型变量的数值是连续不断的,相邻两值之间可以取无限个数值,在编制组距式变量数列时,如果组限不重叠设置,就会使一部分变量值无阻可归。 4.简述总量指标的作用? 答:总量指标是对社会经济现象的认识的起点,是实行经济管理的依据之一,是计算其它形式的统计指标的基础。 5.总体单位总量和总体标志总量有何区别? 答:总体单位总量是指总体中单位数的总和,总体标志总量是总体各单位某项指标值之和,二者是从同一总体的俩个方面来看的,它们的含义和作用都不相同。但二者的地位随着研究目的的不同和总体的变化而发生变化。区分它们的关键在于指标本身所反映的内容,属于总体单位的个数为总体单位总量,属于总体中各单位某一标志值的总和为总体标志总量。 6.简述时期指标和时点指标的特点? 答:1、时期指标数值可以连续计数,即通过连续登记获得数据,每个数据都说明了现象在一段时期内发生的总量;而时点指标只能间断计数,即每隔一定时间登记一次,每个数据都表示现象在某一时点上达到的水平。2、性质相同的时期指标数值可以相加,相加后说明较长时期内现象发展的总量;时点指标数值一般相加后没意义。3、同类时期指标数值大小与时期长短成正比;时点指标数值大小与时点间隔长短没有直接关系。 7.平均指标有何作用? 答:平均指标的作用有:1、可以对比同类现象在不同单位、地区的一般水平;2、可以对比某一现象在不同时间的变化;3、可

统计学知识点梳理

复习提纲:(计算部分全用红色标注了!其他红色的是我的推断,可能出什么题型;有下划线的重点记忆!当然整理的知识点都是重点!都要背和理解!Fighting!) 第一章绪论 一.统计的含义 即统计工作、统计资料和统计学 统计工作:统计实践活动,搜集,整理,分析和提供关于社会现象数字资料工作总称 统计资料:统计实践活动过程中所取得的各项资料,包括原始资料和加工整理资料 统计学:关于认识客观现象总体数量特征和数量关系的科学 二.统计工作过程 就一次统计活动来讲,一个完整的认识过程一般可以分为统计调查、统计整理和统计分析三个阶段。

统计调查:第一阶段,是认识客观经济现象的起点,是统计整理和统计分析的基础。 统计整理:第二阶段,处于统计工作的中间环节,起着承前启后的作用。 统计分析:第三阶段,通过第三阶段,事物由感性认识上升到理性认识。 三.总体与总体单位(会辨析总体与总体单位即可) 总体,亦称统计总体,是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体;构成总体的这些个别单位称为总体单位。 总体由总体单位构成,要认识总体必须从总体单位开始,总体是统计认识的对象。 例如:所有的工业企业就是一个总体,其中的每一个工业企业就是一个总体单位。 四.标志和指标 标志是用来说明总体单位特征的名称。 指标,亦称统计指标,是说明总体的综合数量特征的。一个完整的统计指标包括数量指标名称和指标数值两部分。(以上内容理解即可) 1.指标和标志的区别和联系(简答) 指标与标志的区别:(1)指标是说明总体特征的,而标志是说明总体单位特征的;(2)指标都能用数值表示,而标志中的品质标志不能用数值表示,是用属性表示的;(3)指标数值是经过一定的汇总取得的,而标志中的数量标志不一定经过汇总,可直接取得;(4)一个完整的统计指标,一定要讲时间、地点、范围,而标志一般不具备时间、地点等条件。 指标与标志的联系:(1)有许多统计指标的数值是从总体单位的数量标志值汇总而来的;(2)两者存在着一定的变换关系,即由于研究目的不同,原来的统计总体如果变成总体单位了,则相应的统计指标也就变成数量标志了。 2.标志与标志值(会区分) 标志分为品质标志和数量标志,数量标志用来说明总体单位量的特征,可以用数值表示,即为标志值(如:年龄、工资额、身高) 3.变异与变量(会什么是变异,什么是变量) 变异:品质标志在总体单位之间的不同具体表现。如:性别表现为男、女,民族表现为汉、满、蒙等。 变量:数量标志抽象化即为变量,而数量标志的不同具体表现则称为变量值(或标志值)。如:某职工的年龄是42岁,月工资2200元。 4.统计指标的划分 (1)统计指标按其所反映的总体内容的不同,可分为数量指标和质量指标。数量指标指说明总体规模和水平的各种总量指标。质量指标指反应现象总体的社会经济效益和工作质量的各种相对指标和平均指标。 (2)统计指标按其作用和表现形式的不同,有总量指标(绝对数)、相对指标(绝对数)、平均指标(平均数)三种。 第二章统计调查与整理 一.统计调查的含义 统计调查是统计工作过程的第一阶段。它是按照统计任务的要求,运用科学的调查方法,有组织的向社会实际搜索各项原始资料的过程。统计调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败。 二.统计调查方案设计的内容+调查对象、调查单位的含义 ⒈确定调查目的;(为什么调查) 根据实际需要和可能确定

统计学重要考点总结

第一章导论 1.2、 描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计 方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 1.3、统计学据可以分成哪几种类型,各有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同,分为:观测数据、和实验数据。 观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域。 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 1.4 分类数据:只能归于某一类别的非数字型数据,是对事物进行分类的结果,该数据表现为类别,使用文字来表述的,分类数据主要由分类尺度计量形成的。 顺序数据:只能归于某一有序类别的非数字型数据,这些类别是有顺序的,它是由顺序尺度计量形成的。 数值型数据:按数字尺度测量的观察值,是使用自然或度量衡单位对事物进 行测量的结果,其结果表现为具体的数值。 第二章数据的搜集 2.2比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽 样,什么情况下适合采用非概率抽样。 概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本

被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。 非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。 第三章数据的图表搜集 3.4直方图和条形图有何区别? 条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积 表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,高度 与宽度都有意义; 直方图各矩形连续排列,条形图分开排列;3条形图主要展示分类数据,直方图主要展示数值型数据。 3.6饼图和环形图的不同? 饼图只能显示一个样本或总体各部分所占比例。环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。 第四章习题答案 4.5简述众数、中位数和平均数的特点和应用场合。 众数:主要用于分类数据集中趋势的度量;是一组数据的峰值; 优点:不受极值的影响。 缺点:具有不唯一性;只有数据量较大时才有效果 中位数:主要用于顺序数据集中趋势的度量;是一组数据中间位置的代表制;优点:不受极值的影响;数据分布偏斜程度较大时是一个不错的选择。 平均数:主要用于数值型数据集中趋势的度量;是一组数据的重心所在。 优点:利用了所有数据信息;数据误差相互抵消,具有无偏性; 缺点:易受极值影响;当数据分布偏斜程度较大时代表性差。 4.9测度数据分布形状的统计量有哪些?峰态系数、偏态系数。

统计学重点整理及复习资料

统计学重点整理及复习资料 第一章 统计有三个含义,即:统计工作、统计资料、统计学。 统计学的研究对象:社会经济现象数量的总体数量特征及数量关系。(学科性质:方法论) 统计学的特点:数量性、总体性、具体性、社会性、广泛性。 统计工作的过程:设计、调查、整理、分析。 统计的研究方法:统计分组法、大量观察法、综合指标法、统计模型法、统计推断法。 统计总体:客观性、同质性、差异性。组成统计总体的个别单位称为总体单位。 标志:统计学中总体单位所具有的属性或者特征;分为数量标志和品质标志(不可量性). 指标:反应总体某一综合数量特征的名称或范畴;可分数量指标和质量指标(率、平均)。 变异:指可变的品质标志;变量:指可变化的数量标志,变量的树枝也叫做变量值(标志值)。 第二章 统计调查:指根据统计研究的目的和要求,运用科学的调查方法有计划的、有组织的向社会实际搜集各项统计资料的过程。 统计调查的意义:是人们认识社会的基本方式、是统计的重要环节、在统计学中占有重要地位。统计调查的基本要求:准确、及时、系统、和完整性。 统计调查的种类:1、按组织方式可分为统计报表制和专门调查。2、按调查对象可分为全面调查和非全面调查。3、按登记事物的连续性可以分为经常性调查和一次性调查(时点状态)。4、按搜集资料的不同可分为直接观察法、报告法、采访法、问卷调查法。 统计方案的设计:一、确认调查任务和目的,二、确定调查对象和单位,三、确定调查项目和设计调查表,四、确定调查时间地点,五、制定调查的组织实施计划。 专门调查可分为:普查、重点调查、典型调查和抽样调查。 普查:为了特定的研究目的而专门组织的一次性全面调查;特点:1、一次性调查2、主要调查一定时点的情况3、普查的数据一般比较准确,规范化程度较高;原则:1、必须统一规定普查的时点2、正确选择普查的时期3、在普查范围内各调查单位或调查点应尽可能的同时进行4、同类普查的内容在各次普查中应尽可能的保持一致。

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

统计学重点整理-CH11

.H reject not do , F If . H reject , > F If o c o c F F ≤ others the from different is means the of one least At ::321a k o H H μ μμμ==== Chapter 11: Analysis of Variance Experimental Design a plan and a structure to test hypotheses in which the researcher controls or manipulates one or more variables. Independent Variable Treatment variable 實驗變數 - one that the experimenter controls or modifies in the experiment. Classification variable - a characteristic of the experimental subjects that was present prior to the experiment, and is not a resu lt of the experimenter’s manipulations or control. Levels or Classifications - the subcategories of the independent variable used by the researcher in the experimental design. Independent variables are also referred to as factors. Analysis of Variance (ANOVA)變異數分析 – a group of statistical techniques used to analyze experimental designs . ANOVA begins with notion that individual items being studied are all the same One-Way ANOVA 單因素變異數分析: Procedural Overview The null hypothesis states that the population means for all treatment levels are equal Even if one of the population means is different from the other, the null hypothesis is rejected Testing the hypothesis is done by portioning the total variance of data int6o the following two variances Variance resulting from the treatment (columns) Error variance or that portion of the total variance unexplained by the treatment One-Way ANOVA: Sums of Squares Definitions One-Way ANOVA: Computational Formulas Assumptions underlie ANOVA

统计学贾俊平考研知识点总结

统计学重点笔记 第一章导论 一、比较描述统计和推断统计: 数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。 (1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。 (2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。 (3)两者的关系:描述统计是基础,推断统计是主体 二、比较分类数据、顺序数据和数值型数据: 根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。 (1)分类数据是只能归于某一类别的非数字型数据。它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。 (2)顺序数量是只能归于某一有序类别的非数字型数据。也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。 (3)数值型数据是按数字尺度测量的观察值。其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。 总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。 三、比较总体、样本、参数、统计量和变量: (1)总体是包含所研究的全部个体的集合。通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体。有限总体是指总体的范围能够明确确定,而且元素的数目是有限可数的,需要注意的是,统计意义上的总体,通常不是一群人或一些物品的集合,而是一组观测数据。 (2)样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量。例如我们从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。

相关主题
文本预览
相关文档 最新文档