社会调查研究方法资料的整理和分析课件内容
- 格式:doc
- 大小:99.00 KB
- 文档页数:8
第七章资料的整理和分析【本章内容要点】
·定量资料的整理
·定性资料的整理
·资料的统计分析
·资料的理论分析
【本章重点】
·资料的整理方法
·资料的统计分析方法
【本章教学内容】
第一节资料的整理
一、定量资料的整理
(一)定量资料的概念
定量资料是研究者从社会研究中用计量方法测量某项指标所获得的数值材料。
(二)整理的方法
1、资料的审查
(1)完整性
(2)统一性
(3)合格性
2、资料的分类和编码
(1)编码步骤
·对回答进行分类;
·建立回答类别与变量数值间的对应关系。
(2)编码方法
·预编码
·后编码
·边缘编码
【预编码范例】
你打算报考哪一类专业?
口1、文科
口2、外语
口3、理、工、农(含林、牧、渔)、医口4、音乐、体育、美术
口5、军事院校
口6、未决定(不知道)
【边缘编码范例】
【登录卡范例】
【数据文件范例】
【编码簿范例(部分)】
【编码簿的主要项目】
1、问题号码
2、变量号码
3、项目名称
4、编码的内容说明
5、序列号
3、资料的登录
(1)个案登录
(2)总体登录
【个案登录卡片实例】
4、资料的汇总
二、定性资料的整理
(一)概念
定性资料是研究者从实地研究中所得到的各种以文字、符号表示的观察记录、访谈笔记,以及其他类似的记录材料。
(二)整理方法
1、资料的审查
(1)真实性
(2)准确性
(3)适用性
2、资料的分类
(1)有效性原则
(2)互斥性原则
(3)完备性原则
(4)各类别必须处于同一分类层次
3、资料的汇总和编辑
(1)完整
(2)系统
(3)简明
(4)集中
三、计算机处理资料的一般过程
(一)输入前的准备
1、资料的审查
2、资料的分类与编码
3、登录
(二)输入数据
1、键盘输入
2、卡片输入
3、光电输入
(三)数据的处理
1、对已输入到计算机中的数据资料进行定义
2、进行数据处理方面的操作
3、数据的输出
第二节资料的分析
一、资料的统计分析
(一)概念
所谓统计分析就是运用统计学方法对所收集的数据资料进行定量分析,以揭示事物内在的数量关系、规律和发展趋势,从而达到认识事物本质的一种资料分析方法。
1、描述统计分析
2、推论统计分析
(二)描述统计分析
1、集中趋势分析
集中趋势分析是指用一个典型值或代表值来反映一组数据的一般水平。
2、离散趋势分析
离散趋势分析是指用一个特别的数值来反映一组数据相互之间的离散程度。
(三)推论统计分析
1、参数估计
参数估计是利用实际随机抽样调查资料计算的样本统计量去估计总体参数值的一种推论统计分析方法。
(1)点估计
(2)区间估计
·抽样推断的可靠程度(置信度)
·总体平均数区间估计
【例】某茶叶公司销售一种名茶,规定每包规定重量不低于150克,现按简单随机抽样方法抽取1%检验,结果如下表所示。
要求:以99.73%的概率评估这批茶叶平均每保重量的范围是否符合规格
解: 100包茶叶样本平均数和标准差计算表
∵F(t)=0.9973 ∴由查表可得t=3
计算结果表明:这批茶叶平均每包重量范围符合规格重量的要求。
∵F(t)=0.9973 ∴由查表可得t=3
计算结果表明:这批茶叶平均每包重量范围符合规格重量的要求。
·总体成数区间估计
【例】某茶叶公司销售一种名茶,规定每包规定重量不低于150克,现抽取1%检验,结果如下表
解:∵根据规定名茶每包规格重量不低于150克
∴从样本资料来看,第三组与第四组的名茶为合格品
∵F(t)=0.9973 ∴由查表可得t=3
计算结果表明:这批茶叶包装合格率的范围在[56.26%,83.74%]之间。
∵F(t)=0.9973 ∴由查表可得t=3
计算结果表明:这批茶叶包装合格率的范围在[56.32%,83.68%]之间。
2、假设检验
假设检验也称为显著性检验,是根据样本调查结果证实或推翻总体有关假设的一种推论统计分析方法。
【相关术语】
·原假设(零假设):H0
·备择假设(替代假设):H1
·双侧检验(双边检验、双尾检验)
·单侧检验(单边检验、单尾检验)
双侧检验与单侧检验(假设的形式)
·检验统计量
·显著性水平:α
·弃真错误:第Ⅰ类错误
·取伪错误:第Ⅱ类错误
假设检验中的两类错误
H检验
事先规定允许犯弃真错误的概率α,然后尽量减少犯取伪错误的概率β。
【假设检验步骤】
1、提出假设
2、规定显著性水平
3、确定适当的检验统计量
4、确定临界值、拒绝域和接受域
5、计算检验统计量的值
6、做出决策
·总体均值的检验(大样本)
假定条件:正态总体或非正态总体大样本(n≥30)
使用Z检验统计量
σ2 已知:
σ2未知:
【例】假设某公司经理希望检验今年每个工人因病缺勤的天数与过去标准差为14天的平均值8天相比是否已经发生变化。
随机抽取49名工人,今年每个工人的平均缺勤天数为10.6天(采用a=0.05进行检验)。
解:已知μ0=8(天) σ=14(天) x =10.6(天) α=0.05 n=49(名) 根据题意提出假设:H 0:μ=8 H 1:μ≠8 ∵n=49(名) σ=14(天) μ0=8(天) ∴3.149
14
86.100
=-=
-=
n
x z σμ
∵α=0.05
∴由查表可得 临界值±Z α/2=±1.96 ∵-1.96<1.3<1.96 ∴接受H 0
即样本提供的证据表明:今年工人的平均缺勤天数与过去相比没有显著变化。
·总体成数的检验
假定条件:1、总体服从二项分布
2、可用正态分布来近似(大样本)
检验的Z 统计量
【例】某城市开展居民吸烟率的调查。
五年前,该市曾普查16岁以上成年居民吸烟情况,经常吸烟的成年人(每天吸5支以上)占30%。
这次抽取一个400人构成的样本,调查得,吸烟率为27%。
试问能否做出5年来该市吸烟率有明显下降的判断? (采用a =0.05进行检验)。
解:已知 P 0=30% p =27% α=0.05 n=400(人) 根据题意提出假设:H 0 :P ≥30% H 1:P <30% ∵n=400(人) P 0=30% p =27% ∴()
304.1400
)
3.01(3.03.027.01000-=-⨯-=
--=
n
P P P p z
∵α=0.05
∴由查表可得 临界值-Z α=-1.65 ∵-1.304>-1.65 ∴接受H 0
即样本提供的证据表明:样本提供的证据表明:五年来该市吸烟率没有明显下降。
【参数估计和假设检验的关系】
【例】总体均值的双侧检验 提出假设:H 0:μ=μ0 H 1:μ≠μ0
若总体为正态分布且方差已知 则选择检验Z 统计量n
x z σμ0
-=
根据双边检验规则在显著性水平α情况下当-Z α/2<Z <Z α/2时接受H 0
【总体均值的区间估计】 【总体成数的区间估计】
二、资料的理论分析
(一)概念
所谓理论分析是指在对所收集的资料进行整理和统计分析的基础上,借助抽象思维,即运用概念、命题、推理、比较、分类、归纳、演绎、分析、综合等思维方式,对资料进行“去粗取精、去伪存真、由此及彼、由表及里”的加工制作,揭示事物的本质和内在联系,使之上升到理性认识的过程。
(二)分析步骤 1、从总体上把握资料 2、确定分析目标 3、选择适当的分析方法 4、分析资料 (三)分析方法
1、比较分析法和类型分析法
2、因果分析法和矛盾分析法
3、归纳分析法与演绎分析法
4、结构分析法与功能分析法
【课后作业】
1、从某校随机抽取300名教师进行调查,得出他们的平均年龄为42岁,标准差为5岁。
求:在95%的置信度下,该校全体教师平均年龄的置信区间是多少?
2、研究某村委会自治改革后,村民的满意程度如何。
在改革前,该村委会村民只有51%的居民满意村委会的工作,改革后,经抽取40人调查,其中有32人表示满意,现要求以0.05的显著性水平检验,问改革后是否有更多的村民满意村委会的工作?
/2/2p z p z αα⎡⎤
-+⎢⎥⎢⎥⎣⎦。