当前位置:文档之家› 定性数据的统计分析理论与应用研究_刘洋

定性数据的统计分析理论与应用研究_刘洋

定性数据的统计分析理论与应用研究_刘洋

定性数据的统计分析理论与应用研究

刘 洋 西安财经学院

摘 要:定性数据的统计研究一直以来在统计研究方法中都起着十分重要的作用,尤其近几年更是成为统计学研究的重点之一。由于统计方法的逐步发展,定性数据的研究也正不断有新的突破和新的方法,以求找到更适合自身的理论方法。相应分析方法和结构方程模型方法都是较新的定性数据分析应用中的方法。

关键词:定型数据 相应分析 统计分析

一、定性数据的背景及发展

1.研究背景及意义。随着实际问题中愈来愈多定性数据的出现,学会使用定性数据来处理实际问题便成为了必要的技能之一,定性数据的统计方法也成为统计学研究的重点之一。定性研究方法是根据社会现象或事物所具有的属性和在运动中的矛盾变化,从事物的内在规律性来研究事物的一种方法或角度。它以普遍承认的公理、一套演绎逻辑和大量的历史事实为分析基础,从事物的矛盾性出发,描述、阐述所研究的事物。定性数据的性质间接决定了定性数据成为了统计研究中不可小觑的一部分,也为统计研究方法在实际中遇到的困难扫清了很多障碍。

2.定性数据的发展。定性研究起于19世纪,早期的定性研究是从社会调查运动中的实际问题引发的,但是很少有人能意识到它的价值所在。Pearson(1904)首次提出了列联表的概念,也就意味着开始了定性数据的研究。Bartlett(1935)定义了三维列联表三变量的交互作用,但仍不能进行结构复杂的大量数据的研究。随着科技的不断发展,统计学运用计算机处理数字的能力越来越强,使定性数据的研究更是有大幅的提高,现在对定性数据的研究方法更是多样的,例如相应分析、结构方程模型等。

二、定性数据相关的统计分析理论

1.定性数据。在统计学中,数据按照其取值分为四种类型,即计量数据、计数数据、名义数据和有序数据。其中,计量数据和计数数据称为定量数据。名义数据和有序数据称为定性数据,定性变量中包含了名义定性变量和有序定性变量。

2.相应分析。相应分析(correspondence analysis)也叫对应分析,其特点是它所研究的变量可以是定性的,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。通常意义下的相应分析,是指对两个定性变量(因素)的多种水平进行相应性研究,因而它的应用越来越广泛,现在这种方法已经成为常用的多元分析方法之一。相应分析的思想首先由Richardson和Kuder于1933年提出,后来法国统计学家Benzecri等对该方法进行了详细的论述而使其得到了发展。

3.结构方程模型。结构方程模型(Structural Equation Modeling)在20世纪80年代以来迅速发展,是可以处理多个原因、多个结果关系,或者处理不可直接观测变量即潜变量的好方法,解决了一些传统的统计方法不能很好解决的问题。结构方程模型可以假设潜变量的存在,即潜变量可以在结构方程模型中使用,而不是作为观测变量。使定性数据得到了更好更全面的分析,适用于新的统计方法。主要适用于数据较多的定性数据的调查问卷。

三、定性数据统计分析的实证研究

1.数据处理。

1.1数据来源。本文所采用数据来自于由朱建平主编的《应用多元统计分析》一书中相应分析章节举例。应用spss17.0做相关分析。

1.2定性数据数字化。每个定性数据都含有不可量化成分,所以,在分析定性数据之前需要把定性数据中所代表的不同含义或不同范围用简单整数表示,一种含义或范围只能用一个整数表示,这样就使得定性数据数字化。

2.定性数据的相应分析。

2.1相应分析原理。相应分析是在列联表的基础上通过交互汇总数据来解释变量之间的内在联系,用相同的因子轴同时描述两个因素各个水平的情况,把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上。一般情形,取两个公共因子,在一张二维平面图上绘出两个因素各个水平的情况,即可以直观地描述两个因素A和因素B以及各个水平之间的相关关系。同时揭示了同一变量的各个类别之间的差异以及不同变量各个类别之间的对应关系。

2.2相应分析实证。研究数据为1992年美国总统大选的部分数据。对1847位选民的最高学历与所支持总统候选人进行相应分析。由于该分析通过了卡方检验,所以相应分析的分析结果是有效的。

从图1中可以发现大学本科(bachelor)层次的选民最支持Bush,其次是高中(high school)层次的选民。Clinton更受研究生(graduate degree)层次的选民的青睐,而Perot的支持者更多是专科学历者(junior college)。大学本科和高中学历的选民是普通选民所拥有的最普遍学历,也就是说得到的支持中这部分学历的选民最多的话,也就可以说明这个人得到了相对大多说人的支持。

相应的对选民的年龄与所支持的总统候选人间进行相应分析的结果可以看出,年龄在45-64岁之间的选民最支持Clinton,35-44岁的选民其次,这部分选民相对而言更多的选择了支持Bush。Clinton与Bush更多的赢得的是中年人的支持,其中Clinton赢得了相对较多的老年群体的票数支持。Perot与两名竞争对手在支持选民年龄上显示了很大不同,支持他的选民相对年轻化,且选民随之年龄的增长逐渐减少,超过65岁的选民几乎没有支持者。

3.模型结果分析。以上模型分析了该定性数据的显著特点与有趣的分类,知道了选民在最高学历与年龄的不同上对所支持政客不同的相对应分析,让我们从新认识了这组定性数据。通过以上实证分析模型证实利用相关分析的方法可以对定性数据进行有效合理的分析,使得我们更好的对定性数据进行理解。由于定性数据本身的特点,使得我们不能很好的直接通过定性数据本身观测、理解和使用定性数据,但是借助于相关分析,我们可以透过定性数据难以分析的数据特点来理解定性数据,使数据为研究服务。

四、结论与建议

1.结论。定性数据不应只通过数据表面的观测进行分析,由于定性数据自身性质会给相关研究带来误导性信息且不准确。所以定性数据的统计研究方法为统计研究做出了重要贡献。虽然定性数据在问卷调查的应用中还是相对突出的,但是了解和学会定性数据的分析方法可以使你在任何数据的面前不再担心它的种类,都能做到游刃有余。

定性数据的分析理论正在迅速发展,一些相关理论已经相当成熟,但要深入分析,仍需不断探索新理论与新方法。分析定性数据的对数线性模型、结构方程模型和相应分析方法都已相对成熟,而非线性主成分分析方法仍在起步,需要更多的研究与实证支持。

2.建议。由于定性数据的多样性,可以在分析定性数据时使用多种分析方法,以便正确数据所包含信息。定性数据和定量数据一般都是相互结合使用,互相融合,共同发展的,定性数据在数量化之后也属于定量数据,所以在发展定性数据统计研究方法的同时,定量数据的统计研究方法也会相应进步,相互取长补短。定性数据的分析方法仍然满足不了数字化的发展,对新方法的创新仍是耽误之急。希望完善以前好用的方法,不断创新新方法。

参考文献:

[1]葛新锋.有序数据的多元分析模型及实证研究[D].山西财经大学,2009.

[2]王静龙、梁小筠.定性数据统计分析[M].中国统计出版社,2008.

[3]朱建平.应用多元统计分析[M].科学出版社,2013.

[4]王济川,王小倩,姜宝法.结构方程模型:方法与应用[M].高等教育出版社,2011.

[5]Donald J. Treiman.量化数据分析:通过社会研究检验想法[M].社会科学文献出版社,2012.

作者简介:刘洋(1989—),女,吉林东丰人,西安财经学院2013级统计学专业研究生,研究方向:经济统计。

2014年·8月·中期经营管理者

学 术

理 论

经营管理者 Manager' Journal

207

定性研究的论文案例

竭诚为您提供优质文档/双击可除 定性研究的论文案例 篇一:定量与定性研究的比较分析(结合案例分析) 基于“流动子女教育问题”对定量与定性研究的比较分析在做定量研究和定性研究的比较之前,我们必须弄清楚两者的概念,才能找准方向,但要我完整的解释什么是定量研究和定性研究,我是做不到的。只能根据文献资料做一个简单粗浅的解释。 一、概念界定定性研究又叫质性研究,它是指通过发掘问题、理解事件现象、分析人类的行为与观点来对社会现象的质的分析和研究,通过对社会现象发展过程及其特征的深入分析,对社会现象进行历史的、详细的考察,解释社会现象的本质和变化发展的规律。定量研究又叫量化研究,它是指在数学方法的基础上,确定事物某方面量的规定性的科学研究,通过研究社会现象的数量特征、数量关系和数量变化,进而去分析、考验、解释以及预测社会现象的发展趋势的研究方法和过程。 二、比较分析

根据阅读《流动人口子女教育研究的现状与趋势》(定性研究)与《关于长沙市进城农民工子女教育问题的调查与思考》(定量研究)这两篇关于流动子女教育问题主题的文献,以及结合“社会研究方法”课程的学习,我主要谈一下定性研究与定量研究的研究方法和研究逻辑方面的区别:(一)研究方法 关于两者研究的基本方式。《流动人口子女教育研究的现状与趋势》这篇定性研究文章主要是采取了“文献研究”的方式。通过对已有统计资料及相关教育文献的研究,如它开篇就例举了5篇对一个城市(如上海市、厦门市)或城市中的某一个区范围内的流动人口子女教育总体状况的调查,也运用了一些文献中可以适用的数据来了解流动人口对其子 女教育的意向状况和民工学校(打工子弟学校)的情况,探讨文献研究中关于流动人口子女教育问题的原因分析以及根 据现有资料来发现目前此领域的研究趋势,最终分析研究所得的资料提出自己对于今后对流动人口子女教育问题的研 究方向应深入和发展的几点意见。整篇文章作者都只是做一些总结和阐述,来描述性地解释流动子女教育研究的现状及趋势及解释一些问题的理解。因此,在研究方式上定性研究对于数据上的要求不是很高,也就是不注重对数据的具体分析。而是要求研究者有敏锐的洞察力,来分析自己所掌握的资料等来运用历史回顾、文献分析、访问、观察、参与经验

定量研究论文

定量研究论文 Final revision by standardization team on December 10, 2020.

论定量研究在社会研究中的运用 【摘要】定量研究和定性研究是社会科学研究领域中两种相对立的范式。尽管他们之间在哲学层面和技术层面都存在着区别,但是这两种方法的最终目的都是为了增加研究过程和结果的科学性和客观性。所以,在社会工作研究和工作中,只有将定量研究和定性研究方法并用才是科学的做法。 【关键词】定量研究社会工作方法论 社会工作是是助人自助的专业行为,在社会工作实践中,社工经常会遇到各种复杂的案例,需要解决各种社会问题,而在解决问题之前,对于社工最重要的就是要能全面的分析案主,帮助案主挖掘出产生问题的原因,即隐藏在某些表面现象后面的本质问题。在寻找问题根源,最求真理的过程中,社工的认识始终处于一个不断地建立一打破一重新建立的循环中逐渐发现解决问题的方法或真理。这个过程是一个复杂的过程,社工往往会走很多弯路,甚至失败,走入“绝境”。因此,作为专业的社会工作者,就必须使用科学合理的社会科学研究方法。社会科学研究方法有很多,定量研究和定性研究是其中的两种方法,在本文中,笔者将围绕定量研究谈谈在社会工作过程中的运用。 一、概念的界定 定量研究也称量化研究,它的思想起源于法国大革命和第一次工业革命,法国大革命使得民主思想深入人心;第一次工业革命之后,由于工业的发展和物质进化的激发,哲学的自然主义兴起,对科学的内容和形式给予了更多的重视。对民主与科学的崇尚逐步取代了宗教和神权,更多的自然主义的科学家关心社会问题,间接地的促进了社会科学研究的发展。目前,社会科学界对““定性研究方法”并无明确的定义。定量研究是指确定事

统计学

第一章总论 1、统计数据有哪些分类?不同类型的数据有什么不同特点?试举例说明。 (一)统计数据按照所采用的计量尺度不同,可以分为定性数据与定量数据两类。 一、定性数据是指只能用文字或数字代码来表现事物的品质特征或属性特征的数据,具体又分为定类 数据与定序数据两种。 (1)定类数据:按照事物的某种属性对其进行平行的分类或分组所形成的数据。特点:①定类数据只测度了事物之间的类别差,而对各类之间的其他差别却无法从中得知,因此各类地位相同, 顺序可以任意改变②对定类数据,可以且只能计算每一类别中各元素个体出现的频数。 人口的性别(男、女),为了便于统计处理,用数字代码来表示各个类别,例如分别用1、0表示男性与 女性,要注意的是,这时的数字没有任何程度上的差别或大小多少之分,只是符号而已。 (2)定序数据:对事物之间等级或顺序差别测度所形成的数据。特点:①不仅可以测度类别差(分类),还可以测度次序差(比较优劣或排序)②无法测出类别之间的准确差值,因此该尺度的 计量结果只能排序,不能进行算术运算。产品等级(一等品、二等品…)考试成绩(优、良、差) 二、定量数据是指用数值来表现事物数量特征的数据,具体又分为定距数据与定比数据两种。 (1)定距数据:对事物类别或次序之间间距的测度所形成的数据。特点:①不仅能将事物区分为不同类型并进行排序而且可准确指出类别之间的差距是多少②定距尺度通常以自然或物理单位为计量尺度,因此测量结果往往表现为数值③计量结果可以进行加减运算(加减运算有意义)④“0”是测量尺度上的一个测量点,并不代表“没有”。100分制考试成绩;摄氏温度对不同地区温度的测量。 (2)定比数据(比率尺度):是能够测算两个测度值之间比值的数据。特点:①与定距尺度属于同一层次,计量结果也表现为数值②除了具有其他三种计量尺度的全部特点外,还具有可计算两个测度值之间比值的特点③“0”表示“没有”,即它有一固定的绝对“零点”,因此它可进行加、减、乘、除运算(而定距尺度只可进行加减运算)职工月收入、企业产值、企业销售收入3亿元,人的身高176厘米、体重65公斤,物体的长度30厘米、面积600平方厘米、容积9000立方厘米,水稻的平均亩产400 公斤/亩,某地区的人均国内生产总值25000元/人、第三产业比重48%等,都是定比数据。 (二)统计数据按照其表现形式不同,可以分为绝对数、相对数和平均数三类 绝对数:反映现象或事物绝对数量特征的数据,它以最直观、最基本的形式体现现象或事物的外在数量特征,有明确的计量单位。 相对数:反映现象或事物相对数量特征的数据,它通过另外两个相关统计数据的对比来体现现象(事物)内部或现象(事物)之间的联系关系,其结果主要表现为没有明确计量单位的无名数,少部分表现为有明确计量单位的有名数(限于强度相对数)。 1.结构相对数。将同一总体内的部分数值与全部数值对比求得比重,用以说明事物的性质、结构或质量。居民食品支出 额占消费支出总额比重、产品合格率等。 2.比例相对数。将同一总体内不同部分的数值对比,表明总体内各部分的比例关系,如,人口性别比例、投资与消费比例等。 3.比较相对数。将同一时期两个性质相同的指标数值对比,说明同类现象在不同空间条件下的数量对比关系。如,不同地区 商品价格对比,不同行业、不同企业间某项指标对比等。 4.强度相对数,将两个性质不同但有一定联系的总量指标对比,用以说明现象的强度、密度和普遍程度。如,人均国内生产 总值用“元/人”表示,人口密度用“人/平方公里”表示,也有用百分数或千分数表示的,如,人口出生率用‰表示。 5.计划完成程度相对数,是某一时期实际完成数与计划数对比,用以说明计划完成程度。 6.动态相对数,将同一现象在不同时期的指标数值对比,用以说明发展方向和变化的速度。如,发展速度、增长速度等。平均数:反映现象或事物平均数量特征的数据,体现现象某一方面的一般数量水平。 (三)统计数据按照其来源不同,可以分为观测数据与实验数据两类。 (四)统计数据按照其加工程度不同,可以分为原始数据与次级数据两类。 (五)统计数据按照其时间或空间状态不同,可以分为时序数据与截面数据两类。 2、总体、样本、个体三者关系如何?试举例说明。 总体:统计研究的客观对象的全体,是具有某种共同性质的事物所组成的集合体(也称为母体) 个体:构成统计总体的个别事物称为个体(也称总体单位)

定型数据分析论文

评分表 题目:探讨大学生是否是党员对智育成绩高能入党的看法 学号:xxxx 姓名:xxxx 评分标准 项目要求分值得分 写作1.题目恰当 2.摘要书写合理、规范10 3.图表,公式规范 4.引用,注释规范 10 5.文章书写结构合理,语言流畅, 结构完整。无错别字 30 内容6.观点合理10 7.分析方法,手段合理恰当。30 8.结论可信10 合计100

定性数据分析期末论文 题目:探讨大学生是否是党员对智育成绩高能入党的看法班级:xxx级数学与应用数学xxx班 姓名: xxx 学号: xxx

探讨大学生是否是党员对智育成绩高能入党的看法 摘要 1、目的 为了更好的建立党员与群众之间的关系,党员与党员之间的关系,从而更科学更具体的发展我们系的党员。我们通过调查2011级四个班的学生们对是否是党员与对智育成绩高能入党的看法。通过这个调查了解同学们的心声,听听她们的意见。 2、方法 通过对2011级四个班的同学进行发问卷的形式进行调查,了解他们对智育成绩高能否入党的看法,并对这个数据进行收集整理分析,其中对数据进行分层与压缩处理,其中压缩包括层压缩,行压缩,列压缩,分别用Excel和spss软件,把数据表示成直观的图表表示和数据处理结果的直观显示。 3、结果 通过对2011级四个班的同学进行问卷调查,并对数据进行分析处理结果如下: G=5986 H=3682 Kendall T系数T=0.1533 se(T)=0.4417 U=T/se(T) =0.3471 P=P(N(0,1) ≥0.3471)≈0 Gamma系数r=0.2383 se(r)=0.6992 U=r/ se(r) =0.3408 P=P(N(0,1) ≥0.3408)≈0 Somers 系数se(d B|C)=0.2417 U= d B|C/ se(d B|C) P=P(N(0,1)

关于大数据分析结课论文

大数据论文 摘要数据发展到今天,已不再是一个新的概念,基于大数据技术的应用也层出不穷,但作为一项发展前景广阔的技术,其很多作用还有待挖掘,比如为人们的生活带来方便,为企业带来更多利益等。现今,互联网上每日产生的数据已由曾经的TB级发展到了今天的PB级、EB级甚至ZB级。如此爆炸性的数据怎样去使用它,又怎样使它拥有不可估量的价值呢?这就需要不断去研究开发,让每天的数据“砂砾”变为“黄金”。那么如何才能将大量的数据存储起来,并加以分析利用呢,大数据技术应运而生。大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。大数据的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化的处理。本文就大数据技术进行了深入探讨,从大数据的定义、特征以及目前的应用情况引入,简述了大数据分析的统计方法、挖掘方法、神经网络方法和基于深度学习框架的方法,并对大数据分析流程和框架、大数据存储模式和服务机制、大数据分析中的多源数据融合技术、高维数据的降维技术、子空间分析、集成分析的处理方法等做了概述。最后,以网络信息安全为例,阐述了该领域的大数据分析过程和方法。 关键词大数据;数据挖掘;深度学习;大数据分析;网络信息安全一、大数据概述

1.1大数据的定义和特征 目前,虽然大数据的重要性得到了大家的一致认同,但是关于大数据的定义却众说纷纭。大数据是一个抽象的概念,除去数据量庞大,大数据还有一些其他的特征,这些特征决定了大数据与“海量数据”和“非常大的数据”这些概念之间的不同。一般意义上,大数据是指无法在有限时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。科技企业、研究学者、数据分析师和技术顾问们,由于各自的关注点不同,对于大数据有着不同的定义。通过以下定义,或许可以帮助我们更好地理解大数据在社会、经济和技术等方而的深刻内涵。2010年Apache Hadoop组织将大数据定义为,“普通的计算机软件无法在可接受的时间范围内捕捉、管理、处理的规模庞大的数据集”。在此定义的基础上,2011年5月,全球著名咨询机构麦肯锡公司发布了名为“大数据:下一个创新、竞争和生产力的前沿”的报 告,在报告中对大数据的定义进行了扩充。大数据是指其大小超出了典型数据库软件的采集、存储、管理和分析等能力的数据集。该定义有两方而内涵:(1)符合大数据标准的数据集大小是变化的,会随着时间推移、技术进步而增长;(2)不同部门符合大数据标准的数据集大小会存在差别。目前,大数据的一般范围是从几个TB到数个PB(数千TB)[2]。根据麦肯锡的定义可以看出,数据集的大小并不是大数据的唯一标准,数据规模不断增长,以及无法依靠传统的数据库技术进行管理,也是大数据的两个重要特征。大数据价值链可分为4个阶段:数据生成、数据采集、数据储存以及数据分析。数据分析是大数据价值链的最后也是最重要的阶段,是大数据价值的实现,是大数据应用的基础,其目的在于提取有用的值,提供论断建议或支持决策,通过对不同领域数据集的分析可能会产生不同级别的潜在价值。 在日新月异的IT业界,各个企业对大数据都有着自己不同的解读.大数据的主要特征5个,即5" V”特征:Volume(容量大)、Variety(种类多)、Velocity(速度快)、难辨识(veracity)和最重要的Value(价值密度低)。 Volume(容量大)是指大数据巨大的数据量与数据完整性。可指大数据集合中包含的数据多,也可指组成大数据的网络包含的子数据个数多。 Variety(种类多)意味着要在海量、种类繁多的数据间发现其内在关联。大数据中包含的各种数据类型很多,既可包含各种结构化数据类型,又可包含各种非结构化数据类型,乃至其他数据类型。 Velocity(速度快)可以理解为更快地满足实时性需求。大数据的结构和内容等都可动态变化,而且变化频率高、速度快、范围广,数据形态具有极大的动态性,处理需要极快的实时性。 Veracity (难辨识)可以体现在数据的内容、结构、处理、以及所含子数据间的关联等多方面。大数据中可以包含众多具有不同概率分布的随机数和众多具有不同定义域的模糊数。数间关联模糊不清、并且可能随时随机变化。

定性数据分析第五章课后答案.doc

定性数据分析第五章课后答案 定性数据分析第五章课后作业 1、为了解男性和女性对两种类型的饮料的偏好有没有差异,分别在年青人和老年人中作调查。调查数据如下: 试分析这批数据,关于男性和女性对这两种类型的饮料的偏好有没有差异的问题,你有什么看法?为什么?解:(1)数据压缩分析首先将上表中不同年龄段的数据合并在一起压缩成二维2X2列联表1.1,合起来看,分析男性和女性对这两种类型的饮料的偏好有没有差异? 表1.1 “性别X偏好饮料”列联表 二维2X2列联表独立检验的似然比检验统计量-2ln A的值为0.7032, P值为p=P(x2⑴m0.7032)=0.4017>0.05,不应拒绝原假设,即认为“偏好类型”与“性别”无关。(2)数据分层分析 其次,按年龄段分层,得到如下三维2X2X2列联表1.2,分开来看,男性和女性对这两种类型的饮料的偏好有没有差异? 表1.2三维2X2X2列联表 在上述数据中,分别对两个年龄段(即年青人和老年人)进行饮料偏好的调查,在“年青人”年龄段,男性中偏好饮料A占58. 73%,偏好饮料B占41.27%;女性中偏好饮料A占58. 73%,偏好饮料B占41.27%, 我们可以得出在这个年龄段,男性和女性对这两种类型的饮料的偏好有一定的差异。同理,在“老年人”年龄段,也有一定的差异。 (3)条件独立性检验

为验证上述得出的结果是否可靠,我们可以做以下的条件独立性检验。即由题意,可令C表示年龄段,C1表示年青人,C2表示老年人;D表示性别,D1表示男性,D2表示女性;E表示偏好饮料的类型,E1表示偏好饮料A,E2表示偏好饮料B。欲检验的原假设为:C给定后D和E条件独立。 按年龄段分层后得到的两个四格表,以及它们的似然比检验统计量-2ln A的值如下: C1层 C2层 -2ln A=6.248 -2ln A =11.822 条件独立性 检验问题的似然比检验统计量是这两个似然比检验统计量的和,其值为-2lnA=6.248+11.822=18.07 由于r=c=t=2,所以条件独立性检验的似然比检验统计量的渐近x 2分布的自由度为r(c-l)(t-l)=2,也就是上面这2个四格表的渐近x 2分布的自由度的和。由于p值P(x 2(2)318.07)=0.000119165很小,所以认为条件独立性不成立,即在年龄段给定的条件下,男性和女性对两种类型的饮料的偏好是有差异的。 (4)产生偏差的原因 a、在(1)中,将不同年龄段的数据压缩在一起合起来后分析发现男性和女性在对两种类型的饮料的偏好上是没有差异的。但将数据以不同的年龄段

定性研究论文框架:学术论文的八股文写作方法

写在前面: 大部分的学术论文,基本遵循了“前言/背景介绍→文献回顾→研究方法/设计→研究结果→讨论”的框架。换句话说,当你在写作一篇学术论文时,完全可以按照上述路径架构自己的论文,然后在这个框架中,填充自己的具体研究内容就可以了。 前言/背景介绍 描述研究所涉及的相关社会背景和清晰阐述具体研究问题。如研究在哪里开展的,研究的社 会背景和脉络是什么,以及本研究对该领域的实践和政策等方面的有什么重要意义。 将本研究问题和具体的研究目标跟与此相关的社会问题、健康问题或相关知识、理论联系起来。简要论述为什么定性研究方法适用于该研究问题。 文献回顾 首先,回顾与本研究问题相关的最新研究发现。 其次,简要讨论相关的,尤其是研究对象相关理论视角。 然后,指出在回应类似研究问题的复杂性时采用不同研究方法可能会遇到的局限。 最后,总结以往研究的优点和不足。 研究方法 研究方法部分应详细阐述开展本研究的原因、研究过程以及执行步骤。应注意,如果定性研 究只是研究所采取的混合研究方法(mixed methods)的一个组成部分,那么在文章中应尽早 明确这一点。 描述研究者的价值判断或者所持观点和立场,包括可能会影响到研究过程和结果的研究者的 个人特征和背景。描述作者的反身性(reflexivity)不仅能使读者清楚地认识到作者是如何看 待研究对象和研究本身,而且对透明化(transparent)研究过程具有重要意义。此部分一般需交代以下各方面要求的内容,但也视具体研究而定,如不适用,请简述原因: 01具体研究方法 确定具体的研究视角或方法(例如传记法、叙事研究法、民族志法、扎根理论法、现象学法 和影像发声方法等)。 简要描述研究中用到的理论视角和关键概念(允许使用图表来帮助理解这些概念)。 告诉读者关于选择研究方法的基本原理,为什么这个方法适合此研究问题,以及所选的研究 方法将如何完成论文所描述的研究目标。 02招募和抽样过程 详细阐明研究成员是如何招募来的。如果研究的对象是人的话,他们是如何参与到本研究中的。 清楚描述抽样方法和抽样的类型(如目的性抽样、方便性抽样、滚雪球抽样等)。 汇报样本量以及样本的特征,被调查者是否存在中途退出或拒绝参与的情况,并解释为什么 该样本量足够满足本研究需求。 详细描述本研究抽样方法在内的研究单位、涉及物质环境及调查环境,但需要保护被调查者 的隐私。

定性数据的统计分析理论与应用研究_刘洋

定性数据的统计分析理论与应用研究 刘 洋 西安财经学院 摘 要:定性数据的统计研究一直以来在统计研究方法中都起着十分重要的作用,尤其近几年更是成为统计学研究的重点之一。由于统计方法的逐步发展,定性数据的研究也正不断有新的突破和新的方法,以求找到更适合自身的理论方法。相应分析方法和结构方程模型方法都是较新的定性数据分析应用中的方法。 关键词:定型数据 相应分析 统计分析 一、定性数据的背景及发展 1.研究背景及意义。随着实际问题中愈来愈多定性数据的出现,学会使用定性数据来处理实际问题便成为了必要的技能之一,定性数据的统计方法也成为统计学研究的重点之一。定性研究方法是根据社会现象或事物所具有的属性和在运动中的矛盾变化,从事物的内在规律性来研究事物的一种方法或角度。它以普遍承认的公理、一套演绎逻辑和大量的历史事实为分析基础,从事物的矛盾性出发,描述、阐述所研究的事物。定性数据的性质间接决定了定性数据成为了统计研究中不可小觑的一部分,也为统计研究方法在实际中遇到的困难扫清了很多障碍。 2.定性数据的发展。定性研究起于19世纪,早期的定性研究是从社会调查运动中的实际问题引发的,但是很少有人能意识到它的价值所在。Pearson(1904)首次提出了列联表的概念,也就意味着开始了定性数据的研究。Bartlett(1935)定义了三维列联表三变量的交互作用,但仍不能进行结构复杂的大量数据的研究。随着科技的不断发展,统计学运用计算机处理数字的能力越来越强,使定性数据的研究更是有大幅的提高,现在对定性数据的研究方法更是多样的,例如相应分析、结构方程模型等。 二、定性数据相关的统计分析理论 1.定性数据。在统计学中,数据按照其取值分为四种类型,即计量数据、计数数据、名义数据和有序数据。其中,计量数据和计数数据称为定量数据。名义数据和有序数据称为定性数据,定性变量中包含了名义定性变量和有序定性变量。 2.相应分析。相应分析(correspondence analysis)也叫对应分析,其特点是它所研究的变量可以是定性的,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。通常意义下的相应分析,是指对两个定性变量(因素)的多种水平进行相应性研究,因而它的应用越来越广泛,现在这种方法已经成为常用的多元分析方法之一。相应分析的思想首先由Richardson和Kuder于1933年提出,后来法国统计学家Benzecri等对该方法进行了详细的论述而使其得到了发展。 3.结构方程模型。结构方程模型(Structural Equation Modeling)在20世纪80年代以来迅速发展,是可以处理多个原因、多个结果关系,或者处理不可直接观测变量即潜变量的好方法,解决了一些传统的统计方法不能很好解决的问题。结构方程模型可以假设潜变量的存在,即潜变量可以在结构方程模型中使用,而不是作为观测变量。使定性数据得到了更好更全面的分析,适用于新的统计方法。主要适用于数据较多的定性数据的调查问卷。 三、定性数据统计分析的实证研究 1.数据处理。 1.1数据来源。本文所采用数据来自于由朱建平主编的《应用多元统计分析》一书中相应分析章节举例。应用spss17.0做相关分析。 1.2定性数据数字化。每个定性数据都含有不可量化成分,所以,在分析定性数据之前需要把定性数据中所代表的不同含义或不同范围用简单整数表示,一种含义或范围只能用一个整数表示,这样就使得定性数据数字化。 2.定性数据的相应分析。 2.1相应分析原理。相应分析是在列联表的基础上通过交互汇总数据来解释变量之间的内在联系,用相同的因子轴同时描述两个因素各个水平的情况,把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上。一般情形,取两个公共因子,在一张二维平面图上绘出两个因素各个水平的情况,即可以直观地描述两个因素A和因素B以及各个水平之间的相关关系。同时揭示了同一变量的各个类别之间的差异以及不同变量各个类别之间的对应关系。 2.2相应分析实证。研究数据为1992年美国总统大选的部分数据。对1847位选民的最高学历与所支持总统候选人进行相应分析。由于该分析通过了卡方检验,所以相应分析的分析结果是有效的。 从图1中可以发现大学本科(bachelor)层次的选民最支持Bush,其次是高中(high school)层次的选民。Clinton更受研究生(graduate degree)层次的选民的青睐,而Perot的支持者更多是专科学历者(junior college)。大学本科和高中学历的选民是普通选民所拥有的最普遍学历,也就是说得到的支持中这部分学历的选民最多的话,也就可以说明这个人得到了相对大多说人的支持。 相应的对选民的年龄与所支持的总统候选人间进行相应分析的结果可以看出,年龄在45-64岁之间的选民最支持Clinton,35-44岁的选民其次,这部分选民相对而言更多的选择了支持Bush。Clinton与Bush更多的赢得的是中年人的支持,其中Clinton赢得了相对较多的老年群体的票数支持。Perot与两名竞争对手在支持选民年龄上显示了很大不同,支持他的选民相对年轻化,且选民随之年龄的增长逐渐减少,超过65岁的选民几乎没有支持者。 3.模型结果分析。以上模型分析了该定性数据的显著特点与有趣的分类,知道了选民在最高学历与年龄的不同上对所支持政客不同的相对应分析,让我们从新认识了这组定性数据。通过以上实证分析模型证实利用相关分析的方法可以对定性数据进行有效合理的分析,使得我们更好的对定性数据进行理解。由于定性数据本身的特点,使得我们不能很好的直接通过定性数据本身观测、理解和使用定性数据,但是借助于相关分析,我们可以透过定性数据难以分析的数据特点来理解定性数据,使数据为研究服务。 四、结论与建议 1.结论。定性数据不应只通过数据表面的观测进行分析,由于定性数据自身性质会给相关研究带来误导性信息且不准确。所以定性数据的统计研究方法为统计研究做出了重要贡献。虽然定性数据在问卷调查的应用中还是相对突出的,但是了解和学会定性数据的分析方法可以使你在任何数据的面前不再担心它的种类,都能做到游刃有余。 定性数据的分析理论正在迅速发展,一些相关理论已经相当成熟,但要深入分析,仍需不断探索新理论与新方法。分析定性数据的对数线性模型、结构方程模型和相应分析方法都已相对成熟,而非线性主成分分析方法仍在起步,需要更多的研究与实证支持。 2.建议。由于定性数据的多样性,可以在分析定性数据时使用多种分析方法,以便正确数据所包含信息。定性数据和定量数据一般都是相互结合使用,互相融合,共同发展的,定性数据在数量化之后也属于定量数据,所以在发展定性数据统计研究方法的同时,定量数据的统计研究方法也会相应进步,相互取长补短。定性数据的分析方法仍然满足不了数字化的发展,对新方法的创新仍是耽误之急。希望完善以前好用的方法,不断创新新方法。 参考文献: [1]葛新锋.有序数据的多元分析模型及实证研究[D].山西财经大学,2009. [2]王静龙、梁小筠.定性数据统计分析[M].中国统计出版社,2008. [3]朱建平.应用多元统计分析[M].科学出版社,2013. [4]王济川,王小倩,姜宝法.结构方程模型:方法与应用[M].高等教育出版社,2011. [5]Donald J. Treiman.量化数据分析:通过社会研究检验想法[M].社会科学文献出版社,2012. 作者简介:刘洋(1989—),女,吉林东丰人,西安财经学院2013级统计学专业研究生,研究方向:经济统计。 2014年·8月·中期经营管理者 学 术 理 论 经营管理者 Manager' Journal 207

医学统计学定性资料统计描述思考与练习带答案

第五章定性资料的统计描述 【思考与练习】 一、思考题 1.应用相对数时需要注意哪些问题? 2. 为什么不能以构成比代替率? 3. 标准化率计算的直接法和间接法的应用有何区别? 4. 常用动态数列分析指标有哪几种?各有何用途? 5. 率的标准化需要注意哪些问题? 二、案例辨析题 某医生对98例女性生殖器溃疡患者的血清进行检测,发现杜克雷氏链杆菌、梅毒螺旋体和人类单纯疱疹病毒2型病原体感染患者分别是30、51、17例,于是该医生得出结论:女性生殖器溃疡患者3种病原体的感染率分别为30.6%(30/98)、52.0%(51/98)和17.4%(17/98)。该结论是否正确?为什么? 三、最佳选择题 1. 某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为B A. 率 B. 构成比 C. 发病率 D. 相对比 E. 时点患病率 2. 标准化死亡比SMR是指A A. 实际死亡数/预期死亡数 B. 预期死亡数/实际死亡数 C. 实际发病数/预期发病数 D. 预期发病数/实际发病数 E. 预期发病数/预期死亡数 3. 某地人口数:男性13,697,600人,女性13,194,142人;五种心血管疾病的死

亡人数:男性16774人,女性23334人;其中肺心病死亡人数:男性13952人,女性19369人。可计算出这样一些相对数: 11395283.18%16774 p ==, 21395219369 83.08%1677423334p +==+, 313952 101.86/1013697600 p = =万, 416774122.46/1013697600p = =万,523334 176.85/1013194142 p = =万, 645p p p =+ 71395219369 123.91/101369760013194142 p += =+万 81677423334 149.15/101369760013194142 p += =+万 该地男性居民五种心血管疾病的死亡率为D A. 1p B. 2p C. 3p D. 4p E. 5p 4. 根据第3题资料,该地居民五种心血管病的总死亡率为E A. 1p B. 2p C. 5p D. 6p E. 8p 5. 根据第3题资料,该地男、女性居民肺心病的合计死亡率为D A. 2p B. 5p

数据分析课程论文

数据分析课程论文 题目:我国留守儿童的教育现状及发展对策研究作者: 班级学号姓名分工成绩 指导教师: 院系: 学期:2014-2015(1)

1、绪论 1.1、研究背景 1.2、研究意义 1.3、研究方法 1.4、概念 2、我国留守儿童家庭教育发展的状况 3、我国留守儿童家庭教育中存在的问题 4、我国留守儿童家庭教育发展的相关对策小结 参考文献

本文章是对留守儿童教育现状及对策研究,自改革开放以来,随着我国社会经济的发展和城市化进程以及农村产业结构调整的加快,国家对农民工更加关怀提供好的政策使得农村剩余劳动力纷纷外出寻找工作,许多人在外地城市站稳脚跟。但有相当一部分没有能力和条件将自己的子女安置在其所在的城市,只能将其留在家中,由老人照顾或者将子女托管给亲属朋友照顾。家长们把孩子托管给老人或者亲属,甚至让儿童自己在家就学。这便产生了农村留守儿童——我国社会转型期特殊的社会群体。许多儿童因种种原因而留守在家里,失去了直接监护人,孩子面临无人监管的状态,由于年龄小,自理能力差,行为上缺少教育,思想上缺少正确引导,学习上缺少帮助,心理上缺少疏导,生活上缺少照顾,从而引发了教育、情感、心理、生活等一系列问题。监管教育严重缺失,已成为制约留守儿童有效管理,影响其健康成长的严重社会问题。 关键词:留守儿童教育问题对策研究社会教育 对于留守儿童教育中存在的问题进行研究,并提出一些相应的对策

1 绪论 1.1 研究背景 自改革开放以来,国家对农民工更加关怀提供好的政策使得农村剩余劳动力纷纷外出寻找工作,许多人在外地城市站稳脚跟。但有相当一部分没有能力和条件将自己的子女安置在其所在的城市,只能将其留在家中,由老人照顾或者将子女托管给亲属朋友照顾。这些孩子基本上处于受义务教育阶段,据全国妇联统计,当前中国留守儿童约为5800万人,占全部农村儿童的32%左右。在全部的农村留守儿童中学龄前儿童占27%,已达到1570万人左右,而14周岁以下的留守儿童数量达到了4000多万人。这么一个庞大的弱势群体,国家虽然在关注但是关注的还远远程度不够。留守儿童由于亲情缺失,心理健康方面有阴影,很大一部分表现为内心封闭,情感冷漠,自卑孤僻,缺乏交流,缺乏爱心,甚至有的孩子还脾气暴躁冲动易怒,由小事引发打架斗殴。学习成绩方面也因为性格等放面的原因不能尽如人意 1.2 研究的目的和意义 随着我国社会、经济、政治的快速发展,越来越多的农村青壮年走入城市,农村留守儿童会越来越多,留守儿童的教育问题会越来越大。本课题研究能够了解留守儿童的学习现状,做到有针对性的分析问题。通过调查研究深入了解留守儿童主要存在问题,在留守儿童心理问题方面找到一些有效措施、纠正、排除、防止留守儿童出现心理、行为的偏差。促进学校的教育使教育教学质量提高,让留守儿童的父母安心务工,还可以积累一些留守儿童的教育经验。更好的帮助留守儿童健康向上的生活和发展。 1.3 国内外的研究现状 目前,国外对我国农村留守儿童关注较多,但是还谈不上研究。国内有社会各界人士已经对留守儿童做了大量的研究,搜索“留守儿童”就能搜索到很多有关于留守儿童的研究。党和政府对留守儿童教育比较关注,各地纷纷开展对留守儿童的关注活动并施行一系列的帮扶政策。但是关注的程度仍然不够,很多时候这些孩子在生活上得不到很好的照顾,失去了父母的约束,学习成绩下降,容易受到不良因素的诱惑。孩童时期正是一个极其需要父母在身边关爱、指引的重要时期,当留守儿童缺少父母的关爱时,极有可能性格发展缺失。尤其在对其管理、生活安排方面缺乏应有的照顾和爱护,由此很多问题得不到及时解决越积越多,甚至出现犯罪等现象。这样不仅仅影响自身发展同时还严重影响整个社会。 本研究采用定量和定性相结合的方法。定量研究主要是通过对部分人口抽样调查数据的统计分析和推断,把握全国农村的留守儿童在数量、区域分布、年龄、性别、受教育的状况、监护人情况等方面的总体状况和发展趋势。定性研究包括两个方面:一是了解政府机构相关

计数资料的统计学分析 (1)

[模拟] 计数资料的统计学分析 A型题题干在前,选项在后。有A、B、C、D、E五个备选答案其中只有一个为最佳答案。 第1题: 计数资料又称如下哪一种资料 A.数量资料 B.抽样资料 C.普查资料 D.调查资料 E.定性资料 参考答案:E 答案解析: 第2题: 计数资料是指将观察单位按下列哪一种分组计数所得的资料 A.数量 B.体重 C.含量 D.属性或类型或品质 E.放射性计数 参考答案:D 答案解析: 第3题: 计数资料的初步分析常常要用下列哪些相对数 A.频数 B.频数和频率指标 C.率、构成比和相对比 D.构成指标和相对比 E.比和构成比 参考答案:C 答案解析: 第4题: 频率指标,它说明某现象发生的如下哪一种

B.强度 C.比重大小 D.例数 E.各组的单位数 参考答案:B 答案解析: 第5题: 构成指标,它说明一事内部各组成部分所占的如下哪一种大小 A.比重 B.强度 C.频数 D.频率 E.例数 参考答案:A 答案解析: 第6题: 对480人进行老年性白内障普查,分60岁一、70岁一和80岁一三个年龄组受检人数分别为300、150和30人,白内障例数分别为150、90和24人。回答70岁一年龄组的患病率(%)是多少 A.5 B.50 C.60 D.80 E.20 参考答案:C 答案解析: 第7题: 对1000人进行老年性白内障普查,分50岁一和60岁一两个年龄组,受检人数分别为480人和520人,白内障例数分别为120人和280人。回答患者50岁一年龄构成比(%)是多少 A.53.9 B.12 C.30 D.28

参考答案:C 答案解析: 第8题: 在计数资料计算相对数时,应注意如下哪些问题 A.分母不宜过大 B.可比性 C.随机性 D.分母不宜过小 E.分母宜中 参考答案:D 答案解析: 第9题: 在计数资料进行相对数间比较时,应注意如下哪些问题 A.分母不宜太小 B.可比性 C.可用频率指标代替构成指标 D.随机性和正态分布 E.其可比性和遵循随机抽样 参考答案:E 答案解析: 第10题: X2检验是要计算检验统计量X2值、X2值是反应如下哪种情况 A.实际频数大于理论频数 B.理论频数大于实际频数 C.实际频率和理论频率的吻合程度 D.实际频数和理论频数的吻合程度 E.实际频率大于理论频率 参考答案:D 答案解析: 第11题: X2值愈大,则X2值的概率P值如下哪种情况

博士论文写作指南(定性研究类)

中山大学政治与公共事务管理学院 博士学位论文写作指南 (定性研究类) 一、目的 为使采用定性研究方法的博士生了解定性研究的基本知识点,掌握学位论文写作框架,制定本指南。 方法论是现代社会科学研究的核心性基础知识和研究技能,基本知识应完全并能够批判性地使用。 对于博士生来说,在定性方法论方面的要求是,能够准确使用且最好在一定程度创造性地使用所采用的研究方法,实现自己的研究目的。 写作过程的方法论细节或方法论学术问题,请与指导老师及导师组交流。 二、定性研究知识框架 Ⅰ定性研究的学术地位与趋势 定性研究是针对实证主义研究方法的局限而逐步形成的。 对定性研究方法有突出贡献的学科有人类学、社会学、心理学。等等。 目前,定性研究越来越为社会科学接受。 Ⅱ定性研究方法的含义及实质 定性研究方法是以后实证主义哲学思想(如符合互动理论,现象学,常人方法论等)为基础,在自然情境下通过研究者和研究对象之间的系统互动,综合运用多角化技术对所研究问题的逻辑关系和意义机制进行描述、解释、预测和应用的研究方法的统称。 Ⅲ定性研究的特征 定性研究是整体主义或情境主义。

定性研究是藉由人、情境与时空关系而形成研究框架。 定性研究不排除,但要求研究者尽量消除自己的“前设”和“偏见”,并随着研究的进展,不断调整自己的研究设计、方案。 Ⅳ定性研究种类 目前,比较公认的定性研究方法包括: 民族(人种)志研究; 现象学研究; 扎根理论; 历史比较研究法; 自传/传记/生命史。 此外,案例研究,规范研究也可以归属到定性研究的范围。 Ⅴ定性研究的一般过程 确定研究题目 选择某一种或若干种定性研究方法 选择研究情境 设计接触研究对象的策略及步骤 收集资料 编码分析以及解释资料 反省研究者在研究情境中所扮演的角色 理论结论 三、定性研究论文格式

数据分析与挖掘论文

数据挖掘算法——神经网络模型 摘要:通过分析数据挖掘中现有的算法的研究现状以及它们的局限性,介绍一种基于数据库的数据挖掘算法——神经网络模型,本文最后也提出了神经网络模型在数据挖掘中存在的一些问题和发展前景。 关键字:神经网络模型,数据挖掘 引言: 数据挖掘是适应信息社会从海量的数据库中提取信息的需要而产生的新学科。它是统计学、机器学习、数据库、模式识别、人工智能等学科的交叉。数据挖掘往往针对特定的数据、特定的问题,选择一种或者多种挖掘算法,找到数据下面隐藏的规律,这些规律往往被用来预测、支持决策。它的应用非常广泛,只要该产业有分析价值与需求的数据库,皆可利用数据挖掘工具进行有目的的发掘分析。常见的应用案例多发生在零售业、制造业、财务金融保险、通讯及医疗服务。 数据挖掘技术的方法: ①神经网络方法:神经网络由于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘的问题,因此近年来越来越受到人们的关注。典型的神经网络模型主要分3大类:以感知机、bp反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的前馈式神经网络模型;以hopfield的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈式神经网络模型;以art模型、koholon模型为代表的,用于聚类的自组织映射方法。神经网络方法的缺点是"黑箱"性,人们难以理解网络的学习和决策过程。 ②遗传算法:遗传算法是一种基于生物自然选择与遗传机理的随机搜索算法,是一种仿生全局优化方法。遗传算法具有的隐含并行性、易于和其它模型结合等性质使得它在数据挖掘中被加以应用。 ③决策树方法:决策树是一种常用于预测模型的算法,它通过将大量数据有目的分类,从中找到一些有价值的,潜在的信息。它的主要优点是描述简单,分类速度快,特别适合大规模的数据处理。 ④粗集方法:粗集理论是一种研究不精确、不确定知识的数学工具。粗集方法有几个优点:不需要给出额外信息;简化输入信息的表达空间;算法简单,易于操作。粗集处理的对象是类似二维关系表的信息表。目前成熟的关系数据库管理系统和新发展起来的数据仓库管理系统,为粗集的数据挖掘奠定了坚实的基础。但粗集的数学基础是集合论,难以直接处理连续的属性。而现实信息表中连续属性是普遍存在的。因此连续属性的离散化是制约粗集理论实用化的难点。 ⑤覆盖正例排斥反例方法:它是利用覆盖所有正例、排斥所有反例的思想来寻找规则。首先在正例集合中任选一个种子,到反例集合中逐个比较。与字段取值构成的选择子相容则舍去,相反则保留。按此思想循环所有正例种子,将得到正例的规则。 ⑥统计分析方法:在数据库字段项之间存在两种关系:函数关系(能用函数公式表示的确定性关系)和相关关系(不能用函数公式表示,但仍是相关确定性关系),对它们的分析可采用统计学方法,即利用统计学原理对数据库中的信息进行分析。可进行常用统计(求大量数据中的最大值、最小值、总和、平均值等)、回归分析(用回归方程来表示变量间的数量关系)、相关分析(用相关系数来度量变量间的相关程度)、差异分析(从样本统计量的值得出差异来确定总体参数之间是否存在差异)等。

论文写作指导——论文定性研究和定量研究

论文写作指导 ——规范·方法·范例 国泰安信息技术有限公司 GTA Information Technology Company

第二部分文体类型与研究方法 二、论文研究方法 (六)定性研究和定量研究 6.1 定性研究 定性研究是对现象进行“质”的理论思辨。主要功能是“解释”。其研究程序为: 6.1.1 收集资料 (1)观察法。主要观察并记录人们的言和行。观察者应尽可能的系统、准确、客观地记录所发生的事情,可以现场笔记或时间发生后不久的笔记,或现在录音或摄像。 (2)访谈法。记录可以是访谈当时的书面记录、访谈后的书面记录和录音。一般情况下,录音是更好的选择。 (3)专题小组讨论法。应先录音并转写成书面材料。 6.1.2 整理和分析资料 (1)方法。定性资料分析运用的是归纳法,通过整理分析资料得出假说或理论。 首先将原始资料系统化、条理化,然后将资料编码、分类、集中,比较和浓缩,最后对资料进行解释、推广,形成假说、理论或基础理论,并再次在原记录中对这些理论或假说进行验证、修改,这一过程需要好多次才能完成。 (2)基本分析程序 ①逐字逐句、认真细致地阅读原始材料,对具体内容进行分类、编码,对不同的文件赋予相应的属性,并在备忘录上记录自己的一些初步想法。然后,从访谈中抽出某一类别的内容再仔细的阅读、思考,并与其它类别的内容进行比较、联系,形成相应的理论,再回到访谈资料中验证理论是否正确,并进行修正。如此反复多次,得出结论。 ②运用“QSR Nvivo”定性分析软件对内容进行分析,前提将全部录音文字全部录入电脑;

③编码:用恰当的概述性文字对文字内容的某一部分做出标记; 自由编码 树状编码 案例编码 ④定性研究方法不容易,起资料收集、整理和分析很烦琐、复杂。对于某些特殊类型的问题需要用最恰当的方法; ⑤争议的焦点是能否用定量研究的评价标准如信度、效度和可推广性来评估定性研究的质量; ⑥比较一致的倾向是用效度来评估定性研究的质量,验证效度常用三角检验法(用三种或更多方法对结果进行比较、验证和补充。),也可用评估其信度(通过比较不同人员独立分析同一资料的结果是否一致来验证。)。 ⑦分析软件仅能免去笔记、剪贴的麻烦那,但仍需研究者逐字逐行地深入阅读分析。 (3)适合的研究领域: ①观察法:适合研究社会角色和正式组织; ②访谈法:适合研究个体经历; ③专题小组讨论法:更适合研究态度和经历以及在特定的文化背景下知识是如何产生的及如何运用的。 6.2 定量研究 定量研究的主要功能是“实证”,即进行“是什么”和“为什么”的描述、推断和预测,在经济学等领域称“实证研究”。采用的主要方法为:统计、测量、评价方法等。定量研究的基本过程与步骤如下: (1)选题阶段 ①选题。确定研究的内容,定义要研究的概念,即问题的界定。 a. 问题必须是有意义的、可操作的、有资料的; b. 概念化并陈述研究的问题

相关主题
文本预览
相关文档 最新文档