浅谈统计分析中的定量与定性
随着现代社会的发展,统计分析在具体的实践工作中得到广泛的应用,但将统计分析应用于工作实践中时,必须对定量分析与定性分析的关系问题有一个系统的认识和正确的把握,这样才能使统计分析在具体的工作中发挥其良好的作用,取得最佳的工作效果。
一、定量分析与定性分析的起源
作为社会实践发展产物的定量分析与定性分析是人们在认识事物过程中的两种理性思维分析方式。
定性分析的概念最早起源于古希腊,古希腊时代的一批著名的学者对定性分析的理念进行了很好的展开研究。早期古希腊的学者们在自己的研究领域中,都是给予自己所研究的自然世界以物理解释。例如著名的学者亚里士多德,在他的一生中研究过许许多多的自然现象,但在他的著作中对其发现的每个自然定理都是给出了一些性质定义,而没有用一个明确的数学公式,所进行的都是一些定性的研究。虽然这些定性分析的认识对人们认识感官世界发挥了极其重要的作用,但是这种认识只是感性的停留于事物表象的缺乏深入思考基础的一种认识方法。
在历史实践的发展过程中,定量分析出现于定性分析之后,其较之定性分析的优势是很明显的,它把事物定义在了人类能理解的范围,由量而定性。第一个将定量分析作为一种分析问题的基础思维方式的学者是伽利略,伽利略第一次在自己的研究领域中全面展开使用了定量分析的思维方法。在他研究的方方面面之中,他以实验、数学符号、公式等准确定量的东西取代了以前人们对事物原因和结果进行主观臆测成分居多的分析。可以这样说,“伽利略追求描述的决定是关于科学方法论的最深刻最有成效的变革。它的重要性,就在于把科学置于科学的保护之下。”数学本身是一门关于量的科学,只有当科学在成功地运用了数学的时候,才能称得上是一门科学。从整个理性发展的过程来看,伽利略提出的以定量代替定性的科学方法,是一个使人类的认识对象由模糊变得清晰起来,由抽象变得具体的过程,使得人类的理性在定性之上又增加了定量的特征,使得如空间、时间、重量、速度、加速度、能量等一些全新的量化概念,在一定的领域和范围内替代了那些与定量无关的概念,使理性思维进行了深刻的变革,上升到了另一个理性高度。
二、定量分析与定性分析的整体统一性
要想合理地运用定量分析与定性分析,就要准确全面地认识定量分析与定性
分析的整体统一性。定最分析的本质是对社会现象的数量特征、数量关系与数量变化所进行的分析,它最大的功能在于揭示和描述社会现象的相互作用和发展趋势。而定性分析的本质是对研究对象的“质”的方面所进行的分析,它是对获得的各种事物的材料运用归纳和演绎、分析与综合以及抽象与概括等方法进行思维加工,进而要想合理地运用定量分析与定性分析,就要准确全面地认识定量分析与定性分析的整体统一性。定最分析的本质是对社会现象的数量特征、数量关系与数量变化所进行的分析,它最大的功能在于揭示和描述社会现象的相互作用和发展趋势。而定性分析的本质是对研究对象的“质”的方面所进行的分析,它是对获得的各种事物的材料运用归纳和演绎、分析与综合以及抽象与概括等方法进行思维加工,进而去粗取精、去伪存真、由此及彼、由表及里,最终认识事物本质、揭示事物的内在规律。定性分析是定量分析的基础,主要是由定性分析的主要任务决定的,定性分析作为分析事物“质”的一种思维方式,它的主要任务是确定物质的组成。只有确定物质的组成之后,才能选择适当的分析方法进行定量分析,指从质的方面分析事物。要在各种纷繁复杂的研究的现象中准确的把握事物的本质,就要求我们要运用辩证唯物主义和历史唯物主义的科学观点来对研究材料进行分析,才能从众多的现象中揭示出其内在的规律,揭示出其最本质存在的东西。只有进行了这样全面科学的分析之后,才能准确地描述一个事物,才能正确地揭示出事物间的相互关系。这种分析方法对于人们准确的认识和判别事物的本质属性具有很大的参考和评估使用价值。综上所述,可以清楚地看出,定性分析与定量分析的本质关系应该是整体统一性的关系。定性是定量的前提,而定量分析使事物的定性更加科学、更加准确,促使定性分析得出广泛而深入的结论,是定性分析的升华。
三、定量分析与定性分析的方法特点
定量分析是一种依据统计数据,建立出数学模型,然后运用数学模型来对研究对象的各项指标及其数值进行计算分析的方法。定性分析则是一种凭着分析者的直觉、经验,以及凭借参考分析对象过去和现在的延续状况及其最新的信息资料,以此来对分析对象的性质、特点、发展变化规律做出判断的方法。定量分析运用了数学中的分析方法,因此是一种比较科学的分析方法,但在运用此方法时,需要较高的数学方面的知识素养,并且要有大量的相关数据。相比定量分析而言,定性分析是一种较为粗糙简单的分析方法,但是在分析者的数学基础薄弱时或者是所提供的数据资料不充分时,可以运用此方法进行分析判断,简言之,定性分析法更适合于简单的分析判断。
在这里需要强调的一点是,虽然两种分析方法对数学知识的要求有高低之
分,但决不能据此来把定性分析与定量分析截然分隔开来。实际上,现代的定性分析中同样也要采用一些数学工具作为辅助来进行计算。但有一点是必须的,那就是定量分析必须是建立在定性预测的基础之上,二者相互补充,相辅相成,定性是定量的依据,定量是定性的升华,只有合理科学地将两种方法结合运用,才能取得良好的工作效果。虽然定量分析与定性分析方法各有其自身独特的特点与性能,但是二者都具有一个共同之处,它们都是一种理性的思维方式,并且它们一般都是通过比较对照来分析问题和说明问题的。正是通过这种对各种指标的比较或对不同时期同一指标的对照才反映出数量的多少、质量的优劣、效率的高低、消耗的大小、发展速度的快慢等等,以此作为做鉴别依据、进而下判断提供确凿有据的信息。定量研究应该是要寻求将数据定量表示的方法,并要采用一些统计分析的形式。一般考虑进行一项新的调研项目时,定量研究之前常常都要以适当的定性研究开路,有时候定性研究也用于解释由定量分析所得的结果。定性研究是探索性研究的另一主要方法,调研者利用定性研究来定义问题或寻找处理问题的途径。在寻找处理问题的途径时,定性研究常常用于制定假设或是确定研究中应包括的变量。有时候定性研究和二手资料分析可以构成调研项目的主要部分,因此,掌握这两种基本方法对调研者来说是十分必要的。
但在具体的运用中定量分析与定性分析有一些区别之处。具体来说,定量分析是依据有关的数据信息通过运用数学方法来计算出分析对象的各项指标及其确切的数值,它是定性分析的量化基础。定性分析则是对研究结果的“质”的一种分析方法,它包括了两种含义:一种是专指作为研究方法的定性研究,如观察法和访谈法就是两种定性研究方法;另一种是作为研究结果的分析手段的定性分析和研究。与其含义相对应,可以将定性分析划为两种不同的层次:一种是研究结果本身就只是一些定性的描述材料,数量化的水平不高甚至没有数量化;另一种是与定量分析密切结合的定性分析。定性分析是建立在描述基础上的逻辑分析和推断,因此,用于定性分析的资料,通常是描述性的资料(包括描述性的数量统计),如文字、图片等。为了使分析可以顺利地进行,并且保证结论的正确性,因此,用于研究的资料必须要充分、全面,这就要求研究者在收集研究资料的时候,应该把握尽可能多的信息,只有在丰富的资料背景下进行逻辑分析,得出准确的判断结果,才能正确地揭示各种现象的内在联系。
四、定量分析与定性分析应用案例
以下通过讲一个市场调研的故事来说明在实际的应用中如何来看待定量分析与定性分析的关系。
美国的一个鞋厂老板先后派了两位市场经理去一个孤岛上进行市场调研。第
一位经理发现岛上的居民没有穿鞋的习惯也从不穿鞋,它运用定量分析根据这个数据得出该岛没有市场,告知老板后就返回来。第二位经理,看到岛上居民没鞋穿,其运用定性分析法得出该岛市场潜力巨大,因此告知老板即可寄一万双鞋进行销售。这个故事给了给我们以深刻的启示:在实际的运用中,要正确看待定量分析与定性分析,它们作为两种分析方法本身并无好坏之分,只是适用的场合、阶段不同罢了;此外,正确判断和感觉分析是共同使用、相互印证的,定性可以为定量研究提供更精确的来源,时期做出正确的判断。简言之即定性是定量的依据,定量是定性的具体化,二者结合起来灵活运用才能取得最佳效果。
五、结论
综上所述,在实际的工作中只有合理地把定性分析与定量分析结合起来灵活的进行运用,才能取得良好的效果。
定性--用文字语言进行相关描述 定量--用数学语言进行描述 定性分析与定量分析应该是统一的,相互补充的;; 定性分析是定量分析的基本前提,没有定性的定量是一种盲目的、毫无价值的定量;; 定量分析使之定性更加科学、准确,它可以促使定性分析得出广泛而深入的结论 定量分析是依据统计数据,建立数学模型,并用数学模型计算出分析对象的各项指标及其数值的一种方法。定性分析则是主要凭分析者的直觉、经验,凭分析对象过去和现在的延续状况及最新的信息资料,对分析对象的性质、特点、发展变化规律作出判断的一种方法。相比而言,前一种方法更加科学,但需要较高深的数学知识,而后一种方法虽然较为粗糙,但在数据资料不够充分或分析者数学基础较为薄弱时比较适用,更适合于一般的投资者与经济工作者。因此,本章以后几节所做的分析基本上以定性分析为主。但是必须指出,两种分析方法对数学知识的要求虽然有高有低,但并不能就此把定性分析与定量分析截然划分开来。事实上,现代定性分析方法同样要采用数学工具进行计算,而定量分析则必须建立在定性预测基础上,二者相辅相成,定性是定量的依据,定量是定性的具体化,二者结合起来灵活运用才能取得最佳效果。 不同的分析方法各有其不同的特点与性能,但是都具有一个共同之处,即它们一般都是通过比较对照来分析问题和说明问题的。正是通过对各种指标的比较或不同时期同一指标的对照才反映出数量的多少、质量的优劣、效率的高低、消耗的大小、发展速度的快慢等等,才能为作鉴别、下判断提供确凿有据的信息。 应用: 在证据法学研究中,定性分析方法和定量分析方法各有长处,可以相辅相成。但是由于我国证据法学的研究人员比较熟悉定性分析方法,所以有必要特别强调定量分析方法的功能和重要性。例如,我们不仅要分析某个证据规则是好还是不好,而且要分析其利弊比例……等等 专利分析法分为定量分析和定性分析两种。定量分析即对专利文献的外部特征(专利文献的各种著录项目)按照一定的指标(如专利数量)进行统计,并对有关的数据进行解释和分析。定性分析是以专利的内容为对象,按技术特征归并专利文献,使之有序化的分析过程。通常情况下需要将二者结合才能达到较好的效果。 定性分析与定量分析应该是统一的,相互补充的;定性分析是定量分析的基本前提,没有定性的定量是一种盲目的、毫无价值的定量;定量分析使定性分析更加科学、准确,它可以促使定性分析得出广泛而深入的结论。 定量分析是依据统计数据,建立数学模型,并用数学模型计算出分析对象的各项指标及其数值的一种方法。 定性分析则是主要凭分析者的直觉、经验,凭分析对象过去和现在的延续状况及最新的信息资料,对分析对象的性质、特点、发展变化规律作出判断的一种方法。相比而言,前一种方法更加科学,但需要较高深的数学知识,而后一种方法虽然较为粗糙,但在数据资料不够充分或分析者数学基础较为薄弱时比较适用,更适合于一般的投资者与经济工作者。但是必须指出,两种分析方法对数学知识的要求虽然有高有低,但并不能就此把定性分析与定量分析截然划分开来。事实上,现代定性分析方法同样要采用数学工具进行计算,而定量分析则必须建立在定性预测基础上,二者相辅相成,定性是定量的依据,定量是定性的具体化,二者结合起来灵活运用才能取得最佳效果。 不同的分析方法各有其不同的特点与性能,但是都具有一个共同之处,即它们一般都是通过比较对照来分析问题和说明问题的。正是通过对各种指标的比较或不同时期同一指标的对照才反映出数量的多少、质量的优劣、效率的高低、消耗的大小、发展速度的快慢等等,才能作为鉴别、下判断提供确凿有据的信息。数学的时候,才能称得上是一门科学。数学的时候,才能称得上是一门科学。 我所接触的稿件基本上都是运用科技统计数字作定量分析的。按常规推理,这种定量分析有扎实的统计数
一、问题选择 伴随着房地产市场得高速发展,住房及房地产业已经成为国家得支柱产业。一方面,城市住房价格也在持续增长,其增长速度已经远高于居民收入得增长速度,易引发一系列社会问题; 另一方面,因为其价值量大得特性,住房价格得过高或过低,不仅影响到国家经济得稳定,而且还会动摇社会得稳定。房价增长过快就是当前中国城市与社会经济发展中突出得问题之一,如何合理控制房价平稳增长值得深入研究。因此,本文选取中国房价为对象,从定性与定量两方面探究对其影响得主要因素。 二、分析 (一)定性分析 根据供求理论,普通商品得均衡价格出现在市场供求量相等得状态下,此时供求双方得意欲都得到满足。那么在研究房价得主要影响因素时,可以分别从供给与需求两方面探究。主要从以下几方面因素考虑: (1)居民人均可支配收入就是需求得表现,就是代表一个地区得人民得经济实力。人均可支配收入越多,人们提高生活质量与进行投资得欲望与能力就越强。房屋相对于其她商品来说,具有保值性与增值性,这种特点导致人们用大量得资金进行投资,促使房屋价格上升。理论上该变量与房价存在正相关性,即居民人均可支配收入越多,就会相对多得购置房屋,需求增长,在供给一定得情况下会导致供给需求失衡,进而房价上涨;反之则否。 (2)土地资源得稀缺性导致土地购置费不断上涨,而土地购置费在一定程度上反映了成本,进而在相当大得程度上影响了房屋得售价。随着开发得商品房不断增加,土地也越来越稀缺,房屋价格也会随着上涨。
(3) 商品房销售面积就是房地产市场需求得直观体现,销售面积越多,表明市场需求越大。商品房施工面积,即报告期内施工得房屋建筑面积。由于现在市场上大多采取房屋预售,故房屋施工面积就是房地产市场供给得体现。 (4)商品房竣工面积就是房地产市场供给得直观体现。在一定时期内竣工面积越多,供给越大,在需求一定得情况下会导致供给大于需求,进而房价下跌;反之则否。 影响房价得因素很多,根据一些专家、学者得研究及现实生活经验,再借助供给需求理论,可以从上面几个因素中筛选出两个作为主要指标:居民人均可支配收入与商品房竣工面积。居民人均可支配收入就是需求得代表,商品房竣工面积就是供给得表现,两者对于中国房价有着非常重要得影响。 (二)定量分析 基于数据得可得性,在研究影响中国房价得主要因素时选取居民人均可支配收入、土地购置费、商品房施工面积与商品房竣工面积以及商品房销售面积为指标,利用2015年中国31个省市自治区得数据,建立起影响商品房价格因素得多元线性回归模型,并利用Eviews软件进行参数估计,多元线性修正,异方差与自相关检验,最终得出计量结果如下: Housing prices = -2235、288+0、479474income-0、398707 Completed area (691、1071)(0、029356) (0、115891) t=(-3、234358) (16、33335) (-3、440344) 2 R=0、905550,2R=0、898803,F=134、2259 Housing prices 表示The average selling price of commercial housing ,income 表示Per capita disposable income,Completed area 表示Completed area of commercial housing。
定性分析和定量分析的概念及两者的关系1.什么叫定性分析 定性分析就是对研究对象进行“质”的方面的分析。具体地说是运用归纳和演绎、分析与综合以及抽象与概括等方法,对获得的各种材料进行思维加工,从而能去粗取精、去伪存真、由此及彼、由表及里,达到认识事物本质、揭示内在规律。 2.什么叫定量分析 定量分析是对社会现象的数量特征、数量关系与数量变化的分析。投资分析师使用数学模块对公司可量化数据进行的分析。通过分析对公司经营给予评价并做出投资判断。定量分析的对象主要为财务报表,如资金平衡表、损益表、留存收益表等。其功能在于揭示和描述社会现象的相互作用和发展趋势。 3.定性分析和定量分析的关系 定性分析与定量分析应该是统一的,相互补充的;定性分析是定量分析的基本前提,没有定性的定量是一种盲目的、毫无价值的定量;定量分析使定性分析更加科学、准确,它可以促使定性分析得出广泛而深入的结论。定量分析是依据统计数据,建立数学模型,并用数学模型计算出分析对象的各项指标及其数值的一种方法。定性分析则是主要凭分析者的直觉、经验,凭分析对象过去和现在的延续状况及最新的信息资料,对分析对象的性质、特点、发展变化规律作出判断的一种方法。 相比而言,前一种方法更加科学,但需要较高深的数学
知识,而后一种方法虽然较为粗糙,但在数据资料不够充分或分析者数学基础较为薄弱时比较适用,更适合于一般的投资者与经济工作者。但是必须指出,两种分析方法对数学知识的要求虽然有高有低,但并不能就此把定性分析与定量分析截然划分开来。事实上,现代定性分析方法同样要采用数学工具进行计算,而定量分析则必须建立在定性预测基础上,二者相辅相成,定性是定量的依据,定量是定性的具体化,二者结合起来灵活运用才能取得最佳效果。 不同的分析方法各有其不同的特点与性能,但是都具有一个共同之处,即它们一般都是通过比较对照来分析问题和说明问题的。正是通过对各种指标的比较或不同时期同一指标的对照才反映出数量的多少、质量的优劣、效率的高低、消耗的大小、发展速度的快慢等等,才能作为鉴别、下判断提供确凿有据的信息。
第一章总论 1、统计数据有哪些分类?不同类型的数据有什么不同特点?试举例说明。 (一)统计数据按照所采用的计量尺度不同,可以分为定性数据与定量数据两类。 一、定性数据是指只能用文字或数字代码来表现事物的品质特征或属性特征的数据,具体又分为定类 数据与定序数据两种。 (1)定类数据:按照事物的某种属性对其进行平行的分类或分组所形成的数据。特点:①定类数据只测度了事物之间的类别差,而对各类之间的其他差别却无法从中得知,因此各类地位相同, 顺序可以任意改变②对定类数据,可以且只能计算每一类别中各元素个体出现的频数。 人口的性别(男、女),为了便于统计处理,用数字代码来表示各个类别,例如分别用1、0表示男性与 女性,要注意的是,这时的数字没有任何程度上的差别或大小多少之分,只是符号而已。 (2)定序数据:对事物之间等级或顺序差别测度所形成的数据。特点:①不仅可以测度类别差(分类),还可以测度次序差(比较优劣或排序)②无法测出类别之间的准确差值,因此该尺度的 计量结果只能排序,不能进行算术运算。产品等级(一等品、二等品…)考试成绩(优、良、差) 二、定量数据是指用数值来表现事物数量特征的数据,具体又分为定距数据与定比数据两种。 (1)定距数据:对事物类别或次序之间间距的测度所形成的数据。特点:①不仅能将事物区分为不同类型并进行排序而且可准确指出类别之间的差距是多少②定距尺度通常以自然或物理单位为计量尺度,因此测量结果往往表现为数值③计量结果可以进行加减运算(加减运算有意义)④“0”是测量尺度上的一个测量点,并不代表“没有”。100分制考试成绩;摄氏温度对不同地区温度的测量。 (2)定比数据(比率尺度):是能够测算两个测度值之间比值的数据。特点:①与定距尺度属于同一层次,计量结果也表现为数值②除了具有其他三种计量尺度的全部特点外,还具有可计算两个测度值之间比值的特点③“0”表示“没有”,即它有一固定的绝对“零点”,因此它可进行加、减、乘、除运算(而定距尺度只可进行加减运算)职工月收入、企业产值、企业销售收入3亿元,人的身高176厘米、体重65公斤,物体的长度30厘米、面积600平方厘米、容积9000立方厘米,水稻的平均亩产400 公斤/亩,某地区的人均国内生产总值25000元/人、第三产业比重48%等,都是定比数据。 (二)统计数据按照其表现形式不同,可以分为绝对数、相对数和平均数三类 绝对数:反映现象或事物绝对数量特征的数据,它以最直观、最基本的形式体现现象或事物的外在数量特征,有明确的计量单位。 相对数:反映现象或事物相对数量特征的数据,它通过另外两个相关统计数据的对比来体现现象(事物)内部或现象(事物)之间的联系关系,其结果主要表现为没有明确计量单位的无名数,少部分表现为有明确计量单位的有名数(限于强度相对数)。 1.结构相对数。将同一总体内的部分数值与全部数值对比求得比重,用以说明事物的性质、结构或质量。居民食品支出 额占消费支出总额比重、产品合格率等。 2.比例相对数。将同一总体内不同部分的数值对比,表明总体内各部分的比例关系,如,人口性别比例、投资与消费比例等。 3.比较相对数。将同一时期两个性质相同的指标数值对比,说明同类现象在不同空间条件下的数量对比关系。如,不同地区 商品价格对比,不同行业、不同企业间某项指标对比等。 4.强度相对数,将两个性质不同但有一定联系的总量指标对比,用以说明现象的强度、密度和普遍程度。如,人均国内生产 总值用“元/人”表示,人口密度用“人/平方公里”表示,也有用百分数或千分数表示的,如,人口出生率用‰表示。 5.计划完成程度相对数,是某一时期实际完成数与计划数对比,用以说明计划完成程度。 6.动态相对数,将同一现象在不同时期的指标数值对比,用以说明发展方向和变化的速度。如,发展速度、增长速度等。平均数:反映现象或事物平均数量特征的数据,体现现象某一方面的一般数量水平。 (三)统计数据按照其来源不同,可以分为观测数据与实验数据两类。 (四)统计数据按照其加工程度不同,可以分为原始数据与次级数据两类。 (五)统计数据按照其时间或空间状态不同,可以分为时序数据与截面数据两类。 2、总体、样本、个体三者关系如何?试举例说明。 总体:统计研究的客观对象的全体,是具有某种共同性质的事物所组成的集合体(也称为母体) 个体:构成统计总体的个别事物称为个体(也称总体单位)
定性数据分析第五章课后答案 定性数据分析第五章课后作业 1、为了解男性和女性对两种类型的饮料的偏好有没有差异,分别在年青人和老年人中作调查。调查数据如下: 试分析这批数据,关于男性和女性对这两种类型的饮料的偏好有没有差异的问题,你有什么看法?为什么?解:(1)数据压缩分析首先将上表中不同年龄段的数据合并在一起压缩成二维2X2列联表1.1,合起来看,分析男性和女性对这两种类型的饮料的偏好有没有差异? 表1.1 “性别X偏好饮料”列联表 二维2X2列联表独立检验的似然比检验统计量-2ln A的值为0.7032, P值为p=P(x2⑴m0.7032)=0.4017>0.05,不应拒绝原假设,即认为“偏好类型”与“性别”无关。(2)数据分层分析 其次,按年龄段分层,得到如下三维2X2X2列联表1.2,分开来看,男性和女性对这两种类型的饮料的偏好有没有差异? 表1.2三维2X2X2列联表 在上述数据中,分别对两个年龄段(即年青人和老年人)进行饮料偏好的调查,在“年青人”年龄段,男性中偏好饮料A占58. 73%,偏好饮料B占41.27%;女性中偏好饮料A占58. 73%,偏好饮料B占41.27%, 我们可以得出在这个年龄段,男性和女性对这两种类型的饮料的偏好有一定的差异。同理,在“老年人”年龄段,也有一定的差异。 (3)条件独立性检验
为验证上述得出的结果是否可靠,我们可以做以下的条件独立性检验。即由题意,可令C表示年龄段,C1表示年青人,C2表示老年人;D表示性别,D1表示男性,D2表示女性;E表示偏好饮料的类型,E1表示偏好饮料A,E2表示偏好饮料B。欲检验的原假设为:C给定后D和E条件独立。 按年龄段分层后得到的两个四格表,以及它们的似然比检验统计量-2ln A的值如下: C1层 C2层 -2ln A=6.248 -2ln A =11.822 条件独立性 检验问题的似然比检验统计量是这两个似然比检验统计量的和,其值为-2lnA=6.248+11.822=18.07 由于r=c=t=2,所以条件独立性检验的似然比检验统计量的渐近x 2分布的自由度为r(c-l)(t-l)=2,也就是上面这2个四格表的渐近x 2分布的自由度的和。由于p值P(x 2(2)318.07)=0.000119165很小,所以认为条件独立性不成立,即在年龄段给定的条件下,男性和女性对两种类型的饮料的偏好是有差异的。 (4)产生偏差的原因 a、在(1)中,将不同年龄段的数据压缩在一起合起来后分析发现男性和女性在对两种类型的饮料的偏好上是没有差异的。但将数据以不同的年龄段
定性分析和定量分析的区别和联系 定性--用文字语言进行相关描述 定量--用数学语言进行描述 定性分析与定量分析应该是统一的,相互补充的;; 定性分析是定量分析的基本前提,没有定性的定量是一种盲目的、毫无价值的定量;; 定量分析使之定性更加科学、准确,它可以促使定性分析得出广泛而深入的结论 定量分析是依据统计数据,建立数学模型,并用数学模型计算出分析对象的各项指标及其数值的一种方法。定性分析则是主要凭分析者的直觉、经验,凭分析对象过去和现在的延续状况及最新的信息资料,对分析对象的性质、特点、发展变化规律作出判断的一种方法。相比而言,前一种方法更加科学,但需要较高深的数学知识,而后一种方法虽然较为粗糙,但在数据资料不够充分或分析者数学基础较为薄弱时比较适用,更适合于一般的投资者与经济工作者。因此,本章以后几节所做的分析基本上以定性分析为主。但是必须指出,两种分析方法对数学知识的要求虽然有高有低,但并不能就此把定性分析与定量分析截然划分开来。事实上,现代定性分析方法同样要采用数学工具进行计算,而定量分析则必须建立在定性预测基础上,二者相辅相成,定性是定量的依据,定量是定性的具体化,二者结合起来灵活运用才能取得最佳效果。 不同的分析方法各有其不同的特点与性能,但是都具有一个共同之处,即它们一般都是通过比较对照来分析问题和说明问题的。正是通过对各种指标的比较或不同时期同一指标的对照才反映出数量的多少、质量的优劣、效率的高低、消耗的大小、发展速度的快慢等等,才能为作鉴别、下判断提供确凿有据的信息。 应用: 在证据法学研究中,定性分析方法和定量分析方法各有长处,可以相辅相成。但是由于我国证据法学的研究人员比较熟悉定性分析方法,所以有必要特别强调定量分析方法的功能和重要性。例如,我们不仅要分析某个证据规则是好还是不好,而且要分析其利弊比例……等等 专利分析法分为定量分析和定性分析两种。定量分析即对专利文献的外部特征(专利文献的各种著录项目)按照一定的指标(如专利数量)进行统计,并对有关的数据进行解释和分析。定性分析是以专利的内容为对象,按技术特征归并专利文献,使之有序化的分析过程。通常情况下需要将二者结合才能达到较好的效果。
定性数据的统计分析理论与应用研究 刘 洋 西安财经学院 摘 要:定性数据的统计研究一直以来在统计研究方法中都起着十分重要的作用,尤其近几年更是成为统计学研究的重点之一。由于统计方法的逐步发展,定性数据的研究也正不断有新的突破和新的方法,以求找到更适合自身的理论方法。相应分析方法和结构方程模型方法都是较新的定性数据分析应用中的方法。 关键词:定型数据 相应分析 统计分析 一、定性数据的背景及发展 1.研究背景及意义。随着实际问题中愈来愈多定性数据的出现,学会使用定性数据来处理实际问题便成为了必要的技能之一,定性数据的统计方法也成为统计学研究的重点之一。定性研究方法是根据社会现象或事物所具有的属性和在运动中的矛盾变化,从事物的内在规律性来研究事物的一种方法或角度。它以普遍承认的公理、一套演绎逻辑和大量的历史事实为分析基础,从事物的矛盾性出发,描述、阐述所研究的事物。定性数据的性质间接决定了定性数据成为了统计研究中不可小觑的一部分,也为统计研究方法在实际中遇到的困难扫清了很多障碍。 2.定性数据的发展。定性研究起于19世纪,早期的定性研究是从社会调查运动中的实际问题引发的,但是很少有人能意识到它的价值所在。Pearson(1904)首次提出了列联表的概念,也就意味着开始了定性数据的研究。Bartlett(1935)定义了三维列联表三变量的交互作用,但仍不能进行结构复杂的大量数据的研究。随着科技的不断发展,统计学运用计算机处理数字的能力越来越强,使定性数据的研究更是有大幅的提高,现在对定性数据的研究方法更是多样的,例如相应分析、结构方程模型等。 二、定性数据相关的统计分析理论 1.定性数据。在统计学中,数据按照其取值分为四种类型,即计量数据、计数数据、名义数据和有序数据。其中,计量数据和计数数据称为定量数据。名义数据和有序数据称为定性数据,定性变量中包含了名义定性变量和有序定性变量。 2.相应分析。相应分析(correspondence analysis)也叫对应分析,其特点是它所研究的变量可以是定性的,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。通常意义下的相应分析,是指对两个定性变量(因素)的多种水平进行相应性研究,因而它的应用越来越广泛,现在这种方法已经成为常用的多元分析方法之一。相应分析的思想首先由Richardson和Kuder于1933年提出,后来法国统计学家Benzecri等对该方法进行了详细的论述而使其得到了发展。 3.结构方程模型。结构方程模型(Structural Equation Modeling)在20世纪80年代以来迅速发展,是可以处理多个原因、多个结果关系,或者处理不可直接观测变量即潜变量的好方法,解决了一些传统的统计方法不能很好解决的问题。结构方程模型可以假设潜变量的存在,即潜变量可以在结构方程模型中使用,而不是作为观测变量。使定性数据得到了更好更全面的分析,适用于新的统计方法。主要适用于数据较多的定性数据的调查问卷。 三、定性数据统计分析的实证研究 1.数据处理。 1.1数据来源。本文所采用数据来自于由朱建平主编的《应用多元统计分析》一书中相应分析章节举例。应用spss17.0做相关分析。 1.2定性数据数字化。每个定性数据都含有不可量化成分,所以,在分析定性数据之前需要把定性数据中所代表的不同含义或不同范围用简单整数表示,一种含义或范围只能用一个整数表示,这样就使得定性数据数字化。 2.定性数据的相应分析。 2.1相应分析原理。相应分析是在列联表的基础上通过交互汇总数据来解释变量之间的内在联系,用相同的因子轴同时描述两个因素各个水平的情况,把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上。一般情形,取两个公共因子,在一张二维平面图上绘出两个因素各个水平的情况,即可以直观地描述两个因素A和因素B以及各个水平之间的相关关系。同时揭示了同一变量的各个类别之间的差异以及不同变量各个类别之间的对应关系。 2.2相应分析实证。研究数据为1992年美国总统大选的部分数据。对1847位选民的最高学历与所支持总统候选人进行相应分析。由于该分析通过了卡方检验,所以相应分析的分析结果是有效的。 从图1中可以发现大学本科(bachelor)层次的选民最支持Bush,其次是高中(high school)层次的选民。Clinton更受研究生(graduate degree)层次的选民的青睐,而Perot的支持者更多是专科学历者(junior college)。大学本科和高中学历的选民是普通选民所拥有的最普遍学历,也就是说得到的支持中这部分学历的选民最多的话,也就可以说明这个人得到了相对大多说人的支持。 相应的对选民的年龄与所支持的总统候选人间进行相应分析的结果可以看出,年龄在45-64岁之间的选民最支持Clinton,35-44岁的选民其次,这部分选民相对而言更多的选择了支持Bush。Clinton与Bush更多的赢得的是中年人的支持,其中Clinton赢得了相对较多的老年群体的票数支持。Perot与两名竞争对手在支持选民年龄上显示了很大不同,支持他的选民相对年轻化,且选民随之年龄的增长逐渐减少,超过65岁的选民几乎没有支持者。 3.模型结果分析。以上模型分析了该定性数据的显著特点与有趣的分类,知道了选民在最高学历与年龄的不同上对所支持政客不同的相对应分析,让我们从新认识了这组定性数据。通过以上实证分析模型证实利用相关分析的方法可以对定性数据进行有效合理的分析,使得我们更好的对定性数据进行理解。由于定性数据本身的特点,使得我们不能很好的直接通过定性数据本身观测、理解和使用定性数据,但是借助于相关分析,我们可以透过定性数据难以分析的数据特点来理解定性数据,使数据为研究服务。 四、结论与建议 1.结论。定性数据不应只通过数据表面的观测进行分析,由于定性数据自身性质会给相关研究带来误导性信息且不准确。所以定性数据的统计研究方法为统计研究做出了重要贡献。虽然定性数据在问卷调查的应用中还是相对突出的,但是了解和学会定性数据的分析方法可以使你在任何数据的面前不再担心它的种类,都能做到游刃有余。 定性数据的分析理论正在迅速发展,一些相关理论已经相当成熟,但要深入分析,仍需不断探索新理论与新方法。分析定性数据的对数线性模型、结构方程模型和相应分析方法都已相对成熟,而非线性主成分分析方法仍在起步,需要更多的研究与实证支持。 2.建议。由于定性数据的多样性,可以在分析定性数据时使用多种分析方法,以便正确数据所包含信息。定性数据和定量数据一般都是相互结合使用,互相融合,共同发展的,定性数据在数量化之后也属于定量数据,所以在发展定性数据统计研究方法的同时,定量数据的统计研究方法也会相应进步,相互取长补短。定性数据的分析方法仍然满足不了数字化的发展,对新方法的创新仍是耽误之急。希望完善以前好用的方法,不断创新新方法。 参考文献: [1]葛新锋.有序数据的多元分析模型及实证研究[D].山西财经大学,2009. [2]王静龙、梁小筠.定性数据统计分析[M].中国统计出版社,2008. [3]朱建平.应用多元统计分析[M].科学出版社,2013. [4]王济川,王小倩,姜宝法.结构方程模型:方法与应用[M].高等教育出版社,2011. [5]Donald J. Treiman.量化数据分析:通过社会研究检验想法[M].社会科学文献出版社,2012. 作者简介:刘洋(1989—),女,吉林东丰人,西安财经学院2013级统计学专业研究生,研究方向:经济统计。 2014年·8月·中期经营管理者 学 术 理 论 经营管理者 Manager' Journal 207
第五章定性资料的统计描述 【思考与练习】 一、思考题 1.应用相对数时需要注意哪些问题? 2. 为什么不能以构成比代替率? 3. 标准化率计算的直接法和间接法的应用有何区别? 4. 常用动态数列分析指标有哪几种?各有何用途? 5. 率的标准化需要注意哪些问题? 二、案例辨析题 某医生对98例女性生殖器溃疡患者的血清进行检测,发现杜克雷氏链杆菌、梅毒螺旋体和人类单纯疱疹病毒2型病原体感染患者分别是30、51、17例,于是该医生得出结论:女性生殖器溃疡患者3种病原体的感染率分别为30.6%(30/98)、52.0%(51/98)和17.4%(17/98)。该结论是否正确?为什么? 三、最佳选择题 1. 某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为B A. 率 B. 构成比 C. 发病率 D. 相对比 E. 时点患病率 2. 标准化死亡比SMR是指A A. 实际死亡数/预期死亡数 B. 预期死亡数/实际死亡数 C. 实际发病数/预期发病数 D. 预期发病数/实际发病数 E. 预期发病数/预期死亡数 3. 某地人口数:男性13,697,600人,女性13,194,142人;五种心血管疾病的死
亡人数:男性16774人,女性23334人;其中肺心病死亡人数:男性13952人,女性19369人。可计算出这样一些相对数: 11395283.18%16774 p ==, 21395219369 83.08%1677423334p +==+, 313952 101.86/1013697600 p = =万, 416774122.46/1013697600p = =万,523334 176.85/1013194142 p = =万, 645p p p =+ 71395219369 123.91/101369760013194142 p += =+万 81677423334 149.15/101369760013194142 p += =+万 该地男性居民五种心血管疾病的死亡率为D A. 1p B. 2p C. 3p D. 4p E. 5p 4. 根据第3题资料,该地居民五种心血管病的总死亡率为E A. 1p B. 2p C. 5p D. 6p E. 8p 5. 根据第3题资料,该地男、女性居民肺心病的合计死亡率为D A. 2p B. 5p
[模拟] 计数资料的统计学分析 A型题题干在前,选项在后。有A、B、C、D、E五个备选答案其中只有一个为最佳答案。 第1题: 计数资料又称如下哪一种资料 A.数量资料 B.抽样资料 C.普查资料 D.调查资料 E.定性资料 参考答案:E 答案解析: 第2题: 计数资料是指将观察单位按下列哪一种分组计数所得的资料 A.数量 B.体重 C.含量 D.属性或类型或品质 E.放射性计数 参考答案:D 答案解析: 第3题: 计数资料的初步分析常常要用下列哪些相对数 A.频数 B.频数和频率指标 C.率、构成比和相对比 D.构成指标和相对比 E.比和构成比 参考答案:C 答案解析: 第4题: 频率指标,它说明某现象发生的如下哪一种
B.强度 C.比重大小 D.例数 E.各组的单位数 参考答案:B 答案解析: 第5题: 构成指标,它说明一事内部各组成部分所占的如下哪一种大小 A.比重 B.强度 C.频数 D.频率 E.例数 参考答案:A 答案解析: 第6题: 对480人进行老年性白内障普查,分60岁一、70岁一和80岁一三个年龄组受检人数分别为300、150和30人,白内障例数分别为150、90和24人。回答70岁一年龄组的患病率(%)是多少 A.5 B.50 C.60 D.80 E.20 参考答案:C 答案解析: 第7题: 对1000人进行老年性白内障普查,分50岁一和60岁一两个年龄组,受检人数分别为480人和520人,白内障例数分别为120人和280人。回答患者50岁一年龄构成比(%)是多少 A.53.9 B.12 C.30 D.28
参考答案:C 答案解析: 第8题: 在计数资料计算相对数时,应注意如下哪些问题 A.分母不宜过大 B.可比性 C.随机性 D.分母不宜过小 E.分母宜中 参考答案:D 答案解析: 第9题: 在计数资料进行相对数间比较时,应注意如下哪些问题 A.分母不宜太小 B.可比性 C.可用频率指标代替构成指标 D.随机性和正态分布 E.其可比性和遵循随机抽样 参考答案:E 答案解析: 第10题: X2检验是要计算检验统计量X2值、X2值是反应如下哪种情况 A.实际频数大于理论频数 B.理论频数大于实际频数 C.实际频率和理论频率的吻合程度 D.实际频数和理论频数的吻合程度 E.实际频率大于理论频率 参考答案:D 答案解析: 第11题: X2值愈大,则X2值的概率P值如下哪种情况
定量研究——是指,主要搜集用数量表示的资料或信息,并对数据进行量化处理、检验和分析,从而获得有意义的结论的研究过程。定量的意思就是说以数字化符号为基础去测量。 确定事物某方面量的规定性的科学研究,科学研究的重要步骤和方法之一。它通过对研究对象的特征按某种标准作量的比较来测定对象特征数值,或求出某些因素间的量的变化规律。由于其目的是对事物及其运动的量的属性作出回答,故称定量研究。 定量研究的四种测定尺度及特征 名义尺度所使用的数值,用于表现它是否属于同一个人或物。 顺序尺度所使用的数值的大小,是与研究对象的特定顺序相对应的。例如,给社会阶层中的上上层、中上层、中层、中下层、下下层等分别标为“5、4、3、2、1”或者“3、2.5、2、1.5、1”就属于这一类。只是其中表示上上层的5与表示中上层的4的差距,和表示中上层的4与表示中层的3的差距,并不一定是相等的。 5、4、3 等是任意加上去的符号,如果记为100、50、10 也无妨。 间距尺度所使用的数值,不仅表示测定对象所具有的量的多少,还表示它们大小的程度即间隔的大小。不过,这种尺度中的原点可以是任意设定的,但并不意味着该事物的量为“无”。例如,O°C 为绝对温度273°K,华氏32°F。 名义尺度和顺序尺度的数值不能进行加减乘除,但间距尺度的数值是可以进行加减运算的。然而,由于原点是任意设定的,所以不能进行乘除运算。例如,5℃和10℃之间的差,可以说与15℃和20℃之间的差是相同的,都是5°C。但不能说20℃就是比5℃高4倍的温度。 比例尺度的意义是绝对的,即它有着含义为“无”量的原点0。长度、重量、时间等都是比例尺度测定的范围。比例尺度测定值的差和比都是可以比较的。例如:5分钟与10 分钟之间的差和10分钟与15分钟之间的差都是5 分钟,10 分钟是2分钟的5倍。比例尺度可以进行加减乘除运算。 定性研究方法是根据社会现象或事物所具有的属性和在运动中的矛盾变化,从事物的内在规定性来研究事物的一种方法或角度。它以普遍承认的公理、一套演绎逻辑和大量的历史事实为分析基础,从事物的矛盾性出发,描述、阐释所研究的事物。进行定性研究,要依据一定的理论与经验,直接抓住事物特征的主要方面,将同质性在数量上的差异暂时略去。 定性研究有两个不同的层次,一是没有或缺乏数量分析的纯定性研究,结论往往具有概括性和较浓的思辨色彩;二是建立在定量分析的基础上的、更高层次的定性研究。在实际研究中,定性研究与定量研究常配合使用。在进行定量研究之前,研究者须借助定性研究确定所要研究的现象的性质;在进行定量研究过程中,
定量分析与定性分析 在现代的社会实践包括科学研究中,人们经常讲“定性与定量相结合”。定量分析与定性分析是社会学研究方法的基本划分,这种划分即使实证主义与人文主义两种方法论取向的集中体现,也是不同类型的研究方式的基本技术要求,从而也是具体研究技术的基本特征的概括性表达。它本身既不是某种研究方式,也非具体的研究技术。定量研究和定性研究是对社会现象量的方面和质的方面的探讨,不同的研究方式和研究技术在某种程度上都承担着这两个方面的研究功能。因此,从某种意义上讲,定量研究和定性研究代表着不同方法体系的基本技术特征。 一、概念 (一)定量分析 定量分析是对社会现象的数量特征、数量关系与数量变化的分析。投资分析师使用数学模块对公司可量化数据进行的分析。通过分析对公司经营给予评价并做出投资判断。定量分析的对象主要为财务报表,如资金平衡表、损益表、留存收益表等。其功能在于揭示和描述社会现象的相互作用和发展趋势。 (二)定性分析 定性分析就是对研究对象进行“质”的方面的分析。具体地说是运用归纳和演绎、分析与综合以及抽象与概括等方法,对获得的各种材料进行思维加工,从而能去粗取精、去伪存真、由此及彼、由表及里,达到认识事物本质、揭示内在规律。定性研究有两个不同的层次,一是没有或缺乏数量分析的纯定性研究,结论往往具有概括性和较浓的思辨色彩;二是建立在定量分析的基础上的、更高层次的定性研究。在实际研究中,定性研究与定量研究常配合使用。在进行定量研究之前,研究者须借助定性研究确定所要研究的现象的性质;在进行定量研究过
程中,研究者又须借助定性研究确定现象发生质变的数量界限和引起质变的原因。 定性分析的理念早在古希腊时代就得到了很好的展开,那个时候的一批的著名学者,在自己的研究之中都是给自己所研究的自然世界给以物理解释。例如:亚里士多德研究过许多的自然现象,但在他厚厚的著作之中,却发现不了一个数学公式。他对每一个现象的都是描述性质的,对发现的每一个自然定理都是性质定义。虽然这种认识对人们认识感官世界功不可灭,但却缺乏深入思考的基础,因为从事物的一种性质延伸到另一种性质,往往是超出了人类的认识能力。因而,定量分析作为一种古已有之但是没有被准确定位的思维方式,其优势相对于定性分析的是很明显,它把事物定义在了人类能理解的范围,由量而定性。 把定量分析作为一种分析问题的基础思维方式始于伽利略,作为近代科学的奠基者,伽利略第一次把定量分析全面展开在自己的研究之中,从动力学到天文学,伽利略抛弃了以前人们只对事物原因和结果进行主观臆测成分居多的分析,而代之以实验,数学符号,公式,可以这样说,“伽利略追求描述的决定是关于科学方法论的最深刻最有成效的变革。它的重要性,就在于把科学置于科学的保护之下。”而数学是关于量的科学。可以这样说,一门科学只有在成功的运用了数学的时候,才能称得上是一门科学。从理性的发展过程来看,伽利略提出的以定量代替定性的科学方法是人类认识对象由模糊变得清晰起来,由抽象变得具体,使得人类的理性在定性之上又增加了定量的特征,而且由于这种替代,那些与定量的无关的概念,如本质起源性质等概念在一定的领域内和一定的范围内被空间时间重量速度加速度惯性力能能量等全新的概念替代。 二、关系 定性分析与定量分析是人们认识事物时用到的两种分析方式。两者之间既有联系也有区别。 (一)联系
定量分析方法和定性分析方法的特点和优劣是什么? 定性分析:定性分析是对研究结果的"质"的分析。定性分析有两种含义:一种是专指作为研究方法的定性研究,如观察法和访谈法就是两种定性研究方法;另一种是作为研究结果的分析手段的定性分析和研究。与此相对应,还可以将定性分析划为两种不同的层次:一种是研究结果本身就是定性的描述材料,数字化的水平较低甚至没有数量化。另一种是与定量分析密切结合的定性分析。定性分析是建立在描述基础上的逻辑分析和推断。用于定性分析的资料,通常是描述性的资料(包括描述性的数量统计),如文字、图片等。为了使分析顺利进行,保证结论的正确性,研究资料必须要充分、全面,这就要求研究者在收集研究结果时应该把握尽可能多的信息。在丰富的资料背景下进行逻辑分析,才能准确地揭示各种现象的内在联系。 定量分析是依据统计数据,建立数学模型,并用数学模型计算出分析对象的各项指标及其数值的一种方法。定性分析则是主要凭分析者的直觉、经验,凭分析对象过去和现在的延续状况及最新的信息资料,对分析对象的性质、特点、发展变化规律作出判断的一种方法。 相比而言,前一种方法更加科学,但需要较高深的数学知识,而后一种方法虽然较为粗糙,但在数据资料不够充分或分析者数学基础较为薄弱时比较适用,更适合于一般的投资者与经济工作者。因此,本章以后几节所做的分析基本上以定性分析为主。但是必须指出,两种分析方法对数学知识的要求虽然有高有低,但并不能就此把定性分析与定量分析截然划分开来。事实上,现代定性分析方法同样要采用
数学工具进行计算,而定量分析则必须建立在定性预测基础上,二者相辅相成,定性是定量的依据,定量是定性的具体化,二者结合起来灵活运用才能取得最佳效果。 不同的分析方法各有其不同的特点与性能,但是都具有一个共同之处,即它们一般都是通过比较对照来分析问题和说明问题的。正是通过对各种指标的比较或不同时期同一指标的对照才反映出数量的多少、质量的优劣、效率的高低、消耗的大小、发展速度的快慢等等,才能为作鉴别、下判断提供确凿有据的信息。 另外,通常接触到的市场调查中,小组座谈会、深度访谈等是定性研究的具体方法,而大量的问卷调查、电话访问等是定量研究,大体上可以这么讲!市场研究基本上要经历:定性研究——定量研究——定性研究,这样一个简单的过程
统计学》期末重点 1. 统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (1)(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (2)(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (3)(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。统计数据;按统计 数据都收集方法分; (4)观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 (5)实验数据:在实验中控制实验对象而收集到的数据。统计数据;按被描述的现象与实践的关系分; (6)截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 (7)时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 2. 变量的题型 第10 页,习题1.1 (1)年龄:数值型变量 (2)性别:分类变量 (3)汽车产量:离散型变量 (4)员工对企业某项改革措施的态度(赞成、中立、反对):顺序变量 (5)购买商品时的支付方式(现金、信用卡、支票):分类变量 3.随机抽样(概率抽样)的抽样方式。 (1)简单随机抽样 (2)分层抽样:就是抽样单位按某种特征或者某种规则划分为不同的层,然后从不同的层中独立、随机地 抽取样本。将各层的样本结合起来,对总体目标量进行估计。 (3)整群抽样: (4)系统抽样 (5)多阶段抽样 分层抽样与整群抽样的区别:
分层抽样的层数就是样本容量;整群抽样的群中单位的个数就是样本容量 4.非概率抽样的几种类型 (1)方便抽样 (2)判断抽样 (3)自愿样本 (4)滚雪球抽样 滚雪球抽样往往用于对稀少群体的调查。在滚雪球抽样中,首先选择一组调查单位,对其实施调查后,再请他们提供另外一些属于研究总特的调查对象,调查人员根据调查线索,进行此后的调查。这个过程持续下去,就会形成滚雪球效应。 优点:容易找到那些属于特定群体的被调查者,调查成本也比较低。 (5)配额抽样 比较概率抽样和非概率抽样的特点,指出各自适用情况概率抽样:抽样时按一定的概率以随机原则抽取样本。每个单位别抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽到的概率。技术含量和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。 非概率抽样:操作简单,时效快,成本低,而且对于抽样中的统计学专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。它同样使用市场调查中的概念测试(不需要调查结果投影到总体的情况)。 5.数据预处理内容 数据审核(完整性和准确性;适用性和实效性),数据筛选和数据排序。 6.数据型数据的分组方法和步骤 分组方法:单变量值分组和组距分组,组距分组又分为等距分组和异距分组。分组步骤:(1)确定组数 (2)确定各组组距 3)根据分组整理成频数分布表 7.散点图与饼图的主要用途 饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。 散点图是描述变量之间关系的一种直观方法,从中可以大体上看出变量之间的关系形态及关系强度。
一、定性分析与定量分析 1、定义: 定性分析 就是对研究对象进行质的方面的分析,具体来说,就是运用归纳和演绎、综合与分析以及抽象与概括等方法,对获得的各种材料进行思维加工,从而能去粗取精,去伪存真、由此及彼、由表及里,达到认识事物的本质、揭示内在规律 定性分析主要是研究事物有没有,是不是的问题 定量分析 对社会的现象的数量特征、数量关系与数量变化的分析,其功能在于揭示和描述社会现象的相互作用和发展趋势 定性--用数量语言进行描述 定量--用数学语言进行描述 2.定性分析与定量分析的关系 (1)定性分析与定量分析应该是统一的,相互补充的;; 定性分析是定量分析的基本前提,没有定性的定量是一种盲目的、毫无价值的定量;; 定量分析使之定性更加科学、准确,它可以促使定性分析得出广泛而深入的结论 定量分析是依据统计数据,建立数学模型,并用数学模型计算出分析对象的各项指标及其数值的一种方法。 定性分析则是主要凭分析者的直觉、经验,凭分析对象过去和现在的延续状况及最新的信息资料,对分析对象的性质、特点、发展变化规律作出判断的一种方法。相比而言,前一种方法更加科学,但需要较高深的数学知识,而后一种方法虽然较为粗糙,但在数据资料不够充分或分析者数学基础较为薄弱时比较适用,更适合于一般的投资者与经济工作者。但是必须指出,两种分析方法对数学知识的要求虽然有高有低,但并不能就此把定性分析与定量分析截然划分开来。事实上,现代定性分析方法同样要采用数学工具进行计算,而定量分析则必须建立在定性预测基础上,二者相辅相成,定性是定量的依据,定量是定性的具体化,二者结合起来灵活运用才能取得最佳效果。 (2)不同的分析方法各有其不同的特点与性能,但是都具有一个共同之处,即它们一般都是通过比较对照来分析问题和说明问题的。正是通过对各种指标的比较或不同时期同一指标的对照才反映出数量的多少、质量的优劣、效率的高低、消耗的大小、发展速度的快慢等等,才能为作鉴别、下判断提供确凿有据的信息。 (3)研究目的不同