社会调查研究方法资料的整理和分析课件内容
- 格式:doc
- 大小:1.54 MB
- 文档页数:14
第七章资料的整理和分析【本章内容要点】·定量资料的整理·定性资料的整理·资料的统计分析·资料的理论分析【本章重点】·资料的整理方法·资料的统计分析方法【本章教学内容】第一节资料的整理一、定量资料的整理(一)定量资料的概念定量资料是研究者从社会研究中用计量方法测量某项指标所获得的数值材料。
(二)整理的方法1、资料的审查(1)完整性(2)统一性(3)合格性2、资料的分类和编码(1)编码步骤·对回答进行分类;·建立回答类别与变量数值间的对应关系。
(2)编码方法·预编码·后编码·边缘编码【预编码范例】你打算报考哪一类专业?口1、文科口2、外语口4、音乐、体育、美术口5、军事院校口6、未决定(不知道) 【边缘编码范例】【登录卡范例】【数据文件范例】【编码簿范例(部分)】【编码簿的主要项目】1、问题号码2、变量号码3、项目名称4、编码的内容说明5、序列号3、资料的登录(1)个案登录(2)总体登录【个案登录卡片实例】4、资料的汇总二、定性资料的整理(一)概念定性资料是研究者从实地研究中所得到的各种以文字、符号表示的观察记录、访谈笔记,以及其他类似的记录材料。
(二)整理方法1、资料的审查(1)真实性(2)准确性(3)适用性2、资料的分类(1)有效性原则(2)互斥性原则(3)完备性原则(4)各类别必须处于同一分类层次3、资料的汇总和编辑(1)完整(2)系统(3)简明(4)集中三、计算机处理资料的一般过程(一)输入前的准备1、资料的审查2、资料的分类与编码3、登录(二)输入数据1、键盘输入2、卡片输入3、光电输入(三)数据的处理1、对已输入到计算机中的数据资料进行定义2、进行数据处理方面的操作3、数据的输出第二节资料的分析一、资料的统计分析(一)概念所谓统计分析就是运用统计学方法对所收集的数据资料进行定量分析,以揭示事物内在的数量关系、规律和发展趋势,从而达到认识事物本质的一种资料分析方法。
1、描述统计分析2、推论统计分析(二)描述统计分析1、集中趋势分析集中趋势分析是指用一个典型值或代表值来反映一组数据的一般水平。
2、离散趋势分析离散趋势分析是指用一个特别的数值来反映一组数据相互之间的离散程度。
(三)推论统计分析1、参数估计参数估计是利用实际随机抽样调查资料计算的样本统计量去估计总体参数值的一种推论统计分析方法。
(1)点估计ˆˆˆˆ设为总体平均数的估计量,为总体成数的估计量,则有=X X P P X x P p(2)区间估计·抽样推断的可靠程度(置信度)·总体平均数区间估计【例】某茶叶公司销售一种名茶,规定每包规定重量不低于150克,现按简单随机抽样方法抽取1%检验,结果如下表所示。
要求:以99.73%的概率评估这批茶叶平均每保重量的范围是否符合规格重量的要求。
解: 100包茶叶样本平均数和标准差计算表()()()()x x P x X F t P x X t F t μ-∆=-=≤即≤15030150.30100xf x f ===∑∑(克)()2276.00.76100x x fs f-===∑∑0.0872x μ=≈=≈若在简单随机重复抽样条件下(克)0.0867x μ=≈=≈若在简单随机不重复抽样条件下(克)∵F(t )=0.9973 ∴由查表可得t=3计算结果表明:这批茶叶平均每包重量范围符合规格重量的要求。
∵F(t)=0.9973 ∴由查表可得t =3计算结果表明:这批茶叶平均每包重量范围符合规格重量的要求。
·总体成数区间估计【例】某茶叶公司销售一种名茶,规定每包规定重量不低于150克,现抽取1%检验,结果30.08720.2616x x t μ∆==⨯=则(克)x xx X x ∆∆∵-≤≤+150.30.2616150.30.2616150.0384150.5616X X ∴-≤≤+即≤≤0.0867x μ=≈=≈若在不重复抽样条件下(克)30.08670.2601x x t μ∆==⨯=则(克)x x x X x ∆∆∵-≤≤+150.30.2601150.30.2601150.0399150.5601X X ∴-≤≤+即≤≤解:∵根据规定名茶每包规格重量不低于150克 ∴从 样本资料来看,第三组与第四组的名茶为合格品∵F (t )=0.9973 ∴由查表可得t=3计算结果表明:这批茶叶包装合格率的范围在[56.26%,83.74%]之间。
∵F(t)=0.9973 ∴由查表可得t=3计算结果表明:这批茶叶包装合格率的范围在[56.32%,83.68%]之间。
150200.770%100n p n +====则样本合格率0.0458 4.58%pμ=≈=≈=若在简单随机重复抽样条件下0.04564.56%p μ=≈=≈=若在简单随机不重复抽样条件下30.04580.137413.74%p p t μ∆==⨯==则p pp P p ∆∆∵-≤≤+70%13.74%70%13.74%56.26%83.74%P P ∴-≤≤+即≤≤30.04560.136813.68%p p t μ∆==⨯==则p pp P p ∆∆∵-≤≤+70%13.68%70%13.68%56.32%83.68%P P ∴-≤≤+即≤≤2、假设检验假设检验也称为显著性检验,是根据样本调查结果证实或推翻总体有关假设的一种推论统计分析方法。
【相关术语】·原假设(零假设):H 0 ·备择假设(替代假设):H 1 ·双侧检验(双边检验、双尾检验) ·单侧检验(单边检验、单尾检验)双侧检验与单侧检验(假设的形式)拒绝域和接受域(双侧检验)临界值临界值α/2α/2拒绝H0拒绝H01 -α拒绝域和接受域(左侧检验)临界值α拒绝H 01 -α临界值α1-α拒绝H 0拒绝域和接受域(右侧检验)·检验统计量·显著性水平:α ·弃真错误:第Ⅰ类错误 ·取伪错误:第Ⅱ类错误=样本统计量-被检验参数假设值检验统计量样本统计量的标准差假设检验中的两类错误H 检验【一般检验原则】事先规定允许犯弃真错误的概率α,然后尽量减少犯取伪错误的概率β 。
【假设检验步骤】1、提出假设 2、规定显著性水平 3、确定适当的检验统计量 4、确定临界值、拒绝域和接受域 5、计算检验统计量的值 6、做出决策·总体均值的检验(大样本)假定条件:正态总体或非正态总体大样本(n ≥30) 使用Z 检验统计量 σ2 已知:)1,0(~0N nx z σμ-=σ2 未知:)1,0(~0N nsx z μ-=【例】假设某公司经理希望检验今年每个工人因病缺勤的天数与过去标准差为14天的平均值8天相比是否已经发生变化。
随机抽取49名工人,今年每个工人的平均缺勤天数为10.6天(采用a =0.05进行检验)。
解:已知μ0=8(天) σ=14(天) x =10.6(天) α=0.05 n=49(名) 根据题意提出假设:H 0:μ=8 H 1:μ≠8 ∵n =49(名) σ=14(天) μ0=8(天) ∴3.1491486.100=-=-=nx z σμ∵α=0.05∴由查表可得 临界值±Z α/2=±1.96 ∵-1.96<1.3<1.96 ∴接受H 0即样本提供的证据表明:今年工人的平均缺勤天数与过去相比没有显著变化。
·总体成数的检验假定条件:1、总体服从二项分布2、可用正态分布来近似(大样本)检验的Z 统计量)1,0(~)1(000N nP P P p z --=【例】某城市开展居民吸烟率的调查。
五年前,该市曾普查16岁以上成年居民吸烟情况,经常吸烟的成年人(每天吸5支以上)占30%。
这次抽取一个400人构成的样本,调查得,吸烟率为27%。
试问能否做出5年来该市吸烟率有明显下降的判断? (采用a=0.05进行检验)。
解:已知 P 0=30% p=27% α=0.05 n=400(人) 根据题意提出假设:H 0 :P ≥30% H 1:P<30% ∵n=400(人) P 0=30% p=27% ∴()304.1400)3.01(3.03.027.01000-=-⨯-=--=nP P P p z∵α=0.05∴由查表可得 临界值-Z α=-1.65 ∵-1.304>-1.65 ∴接受H0即样本提供的证据表明:样本提供的证据表明:五年来该市吸烟率没有明显下降。
【参数估计和假设检验的关系】【例】总体均值的双侧检验 提出假设:H 0:μ=μ0 H 1:μ≠μ0若总体为正态分布且方差已知 则选择检验Z 统计量nx z σμ0-=根据双边检验规则在显著性水平α情况下当-Z α/2<Z<Z α/2时接受H 0【总体均值的区间估计】【总体成数的区间估计】22022x Z Z x Z xZ ααααμ-+-≤22x Z X x Z n n αασ-+⋅≤≤/2/2··x z x z αασσ⎡⎤-⎢⎣,+/2/2p z p z αα⎡⎤-+⎢⎥⎢⎥⎣⎦临界值临界值α/2α/21 -α置信水平F (t )2Z α2Z α-二、资料的理论分析(一)概念所谓理论分析是指在对所收集的资料进行整理和统计分析的基础上,借助抽象思维,即运用概念、命题、推理、比较、分类、归纳、演绎、分析、综合等思维方式,对资料进行“去粗取精、去伪存真、由此及彼、由表及里”的加工制作,揭示事物的本质和内在联系,使之上升到理性认识的过程。
(二)分析步骤1、从总体上把握资料2、确定分析目标3、选择适当的分析方法4、分析资料(三)分析方法1、比较分析法和类型分析法2、因果分析法和矛盾分析法3、归纳分析法与演绎分析法4、结构分析法与功能分析法【课后作业】1、从某校随机抽取300名教师进行调查,得出他们的平均年龄为42岁,标准差为5岁。
求:在95%的置信度下,该校全体教师平均年龄的置信区间是多少?2、研究某村委会自治改革后,村民的满意程度如何。
在改革前,该村委会村民只有51%的居民满意村委会的工作,改革后,经抽取40人调查,其中有32人表示满意,现要求以0.05的显著性水平检验,问改革后是否有更多的村民满意村委会的工作?。