当前位置:文档之家› 多元分析

多元分析

多元分析
多元分析

多元分析

研究多个自变量与因变量相互关系的一组统计理论和方法。又称多变量分析。多元分析是单变量统计方法的发展和推广。人的心理和行为具有复杂的内在结构,受到多种因素的制约。仅采用单变量分析难以揭示其内在结构以及各种影响因素的主次作用和交互影响。

首先涉足多元分析方法是F.高尔顿,他于1889年把双变量的正态分布方法运用于传统的统计学,创立了相关系数和线性回归。其后的几十年中,C.E.斯皮尔曼提出因素分析法(见因素分析),R.A.费希尔提出方差分析和判别分析,S.S.威尔克斯发展了多元方差分析,H.霍特林确定了主成分分析和典型相关。到20世纪前半叶,多元分析理论大多已经确立。60年代以后,随着计算机科学的发展,多元分析方法在心理学以及其他许多学科的研究中得到了越来越广泛的应用。

常用的多元分析方法包括3类:①多元方差分析、多元回归分析和协方差分析,称为线性模型方法,用以研究确定的自变量与因变量之间的关系;②判别函数分析和聚类分析,用以研究对事物的分类;③主成分分析、典型相关和因素分析,研究如何用较少的综合因素代替为数较多的原始变量。

多元方差分析是把总变异按照其来源(或实验设计)分为多个部分,从而检验各个因素对因变量的影响以及各因素间交互作用的统计方法。例如,在分析2×2析因设计资料时,总变异可分为分属两个因素的两个组间变异、两因素间的交互作用及误差(即组内变异)等四部分,然后对组间变异和交互作用的显著性进行F检验。

多元方差分析的优点是可以在一次研究中同时检验具有多个水平的多个因素各自对因变量的影响以及各因素间的交互作用。其应用的限制条件是,各个因素每一水平的样本必须是独立的随机样本,其重复观测的数据服从正态分布,且各总体方差相等。

多元回归分析用以评估和分析一个因变量与多个自变量之间线性函数关系的统计方法。一个因变量y与自变量x1、x2、…xm有线性回归关系是指:其中α、β1…βm是待估参数,ε是表示误差的随机变量。通过实验可获得x1、x 2…xm的若干组数据以及对应的y值,利用这些数据和最小二乘法就能对方程中的参数作出估计,记为╋、勮…叧,它们称为偏回归系数。

多元回归分析的优点是可以定量地描述某一现象和某些因素间的线性函数关系。将各变量的已知值代入回归方程便可求得因变量的估计值(预测值),从而可以有效地预测某种现象的发生和发展。它既可以用于连续变量,也可用于二分变量(0,1回归)。多元回归的应用有严格的限制。首先要用方差分析法检验自变量y与m个自变量之间的线性回归关系有无显著性,其次,如果y与m个自变量总的来说有线性关系,也并不意味着所有自变量都与因变量有线性关系,还需对每个自变量的偏回归系数进行t检验,以剔除在方程中不起作用的自变量。也可以用逐步回归的方法建立回归方程,逐步选取自变量,从而保证引入方程的自变量都是重要的。

协方差分析把线性回归与方差分析结合起来检验多个修正均数间有无差别的统计方法。例如,一个实验包含两个多元自变量,一个是离散变量(具有多个水平),一

个是连续变量,实验目的是分析离散变量的各个水平的优劣,此变量是方差变量;而连续变量是由于无法加以控制而进入实验的,称为协变量。在运用协方差分析时,可先求出该连续变量与因变量的线性回归函数,然后根据这个函数扣除该变量的影响,即求出该连续变量取等值情况时因变量的修正均数,最后用方差分析检验各修正均数间的差异显著性,即检验离散变量对因变量的影响。

协方差分析兼具方差分析和回归分析的优点,可以在考虑连续变量影响的条件下检验离散变量对因变量的影响,有助于排除非实验因素的干扰作用。其限制条件是,理论上要求各组资料(样本)都来自方差相同的正态总体,各组的总体直线回归系数相等且都不为0。因此应用协方差分析前应先进行方差齐性检验和回归系数的假设检验,若符合或经变换后符合上述条件,方可作协方差分析。

判别函数分析判定个体所属类别的统计方法。其基本原理是:根据两个或多个已知类别的样本观测资料确定一个或几个线性判别函数和判别指标,然后用该判别函数依据判别指标来判定另一个个体属于哪一类。

判别分析不仅用于连续变量,而且借助于数量化理论亦可用于定性资料。它有助于客观地确定归类标准。然而,判别分析仅可用于类别已确定的情况。当类别本身未定时,预用聚类分析先分出类别,然后再进行判别分析。

聚类分析解决分类问题的一种统计方法。若给定n个观测对象,每个观察对象有p个特征(变量),如何将它们聚成若干可定义的类?若对观测对象进行聚类,称为Q型分析;若对变量进行聚类,称为R型分析。聚类的基本原则是,使同类的内部差别较小,而类别间的差别较大。最常用的聚类方案有两种。一种是系统聚类方法。例如,要将n个对象分为k类,先将n个对象各自分成一类,共n类。然后计算两两之间的某种“距离”,找出距离最近的两个类、合并为一个新类。然后逐步重复这一过程,直到并为k类为止。另一种为逐步聚类或称动态聚类方法。当样本数很大时,先将n个样本大致分为k类,然后按照某种最优原则逐步修改,直到分类比较合理为止。

聚类分析是依据个体或变量的数量关系来分类,客观性较强,但各种聚类方法都只能在某种条件下达到局部最优,聚类的最终结果是否成立,尚需专家的鉴定。必要时可以比较几种不同的方法,选择一种比较符合专业要求的分类结果。

主成分分析把原来多个指标化为少数几个互不相关的综合指标的一种统计方法。例如,用p个指标观测样本,如何从这p个指标的数据出发分析样本或总体的主要性质呢?如果p个指标互不相关,则可把问题化为p个单指标来处理。但大多时候p 个指标之间存在着相关。此时可运用主成分分析寻求这些指标的互不相关的线性函数,使原有的多个指标的变化能由这些线性函数的变化来解释。这些线性函数称为原有指标的主成分,或称主分量。

主成分分析有助于分辨出影响因变量的主要因素,也可应用于其他多元分析方法,例如在分辨出主成分之后再对这些主成分进行回归分析、判别分析和典型相关分析。主成分分析还可以作为因素分析的第一步,向前推进就是因素分析。其缺点是只涉及一组变量之间的相互依赖关系,若要讨论两组变量之间的相互关系则须运用典型相关。

典型相关分析先将较多变量转化为少数几个典型变量,再通过其间的典型相关系数来综合描述两组多元随机变量之间关系的统计方法。设x是p元随机变量,y是q 元随机变量,如何描述它们之间的相关程度?当然可逐一计算x的p个分量和y的q 个分量之间的相关系数(p×q个),但这样既繁琐又不能反映事物的本质。如果运用典型相关分析,其基本程序是,从两组变量各自的线性函数中各抽取一个组成一对,它们应是相关系数达到最大值的一对,称为第1对典型变量,类似地还可以求出第2对、第3对、……,这些成对变量之间互不相关,各对典型变量的相关系数称为典型相关系数。所得到的典型相关系数的数目不超过原两组变量中任何一组变量的数目。

典型相关分析有助于综合地描述两组变量之间的典型的相关关系。其条件是,两组变量都是连续变量,其资料都必须服从多元正态分布。

以上几种多元分析方法各有优点和局限性。每一种方法都有它特定的假设、条件和数据要求,例如正态性、线性和同方差等。因此在应用多元分析方法时,应在研究计划阶段确定理论框架,以决定收集何种数据、怎样收集和如何分析数据资料。

多变量分析

多变量分析为统计方法的一种,包含了许多的方法,最基本的为单变量,再延伸出来的多变量分析。

多变量统计分析(multivariate statistical analysis)

统计资料中有多个变量(或称因素、指标)同时存在时的统计分析,是统计学的重要分支,是单变量统计的发展。例如对630名炊事员高血压病进行调查,检查项目中除血压外,尚有年龄、性别、体重、体胖等15个项目(变量)。如果用单变量统计分析法考察超重与血压的关系,一般是把数据做成表1的形式。从表1可见,超重组与不超重组相比,高血压患病率高出一倍以上。但如果把资料按体胖者与不体胖者划分成两组,再考察每组内的超重与高血压患病率的关系,就未能发现超重与高血压患病率有任何明显的联系。也就是说,单变量统计分析忽视了另外因素(如此例中的体胖及年龄等)的影响。对于有多个变量客观存在而又相互影响的资料,采用简单的单变量统计分析是不合理的。多变量统计分析就能把变量间的内在联系和相互影响考虑在内。

统计学中的多变量统计分析起源于医学和心理学。1930年代它在理论上发展很快,但由于计算复杂,实际应用很少。1970年代以来由于计算机的蓬勃发展和普及,多变量统计分析已渗入到几乎所有的学科。到80年代后期,计算机软件包已很普遍,使用也方便,因此多变量分析方法也更为普及。

多变量统计的理论基础和工具是数学中的概率论和矩阵。但对于实际应用者而言,只要有合适的计算机和软件包以及掌握一些初步的多变量统计知识就可以使用它来解决实际问题。多变量统计的内容很多,但从实际应用角度看,主要包括回归分析、判别分析、因子分析、主成分分析、聚类分析、生存分析等六个大的分支。

回归分析当多个变量x1,x2,…,xm(称为回归变量或自变量、独立变量)同时影响某个指标y(称为因变量或依赖变量)时,可进行回归分析,回归分析的第一个任务就是求回归变量对指标y的影响的统计规律性(也称回归关系);第二个任务是寻找众多的回归变量中哪一些能对指标y产生影响(常称为因素分析或变量的筛选);第三个任务(也称相关分析)是在固定(或称消除)其他变量的影响后,考察每一个回归变量对指标y的相关程度(称为偏相关系数)。上述三个任务常是相互联系,可以同时完成。

回归变量x1,x2,…,xm与因变量y之间最常见的统计关系有两大类型:线性模型和非线性模型。线性模型中假定y 的主要部分(记为),可由x1,x2,xm线性表示为

其中b0,b1,b2,…,bm是未知常数,需用样本去估计,ε 是用取代y后的误差。这是最常用的模型,称为多重线性回归或多元线性回归。用样本估计线性回归模型中未知常数的方法也很多,经典的方法为最小二乘法,它的理论较为完善,此法较适用于回归变量之间的相关性不很大时。其他求未知常数b0,b1,b2,…,bm的方法还有岭回归、特征根回归、主成分回归等,它们常用于回归变量之间相关性很大时。

非线性回归模型中y的主要部分与x1,x2,…,xm的关系为非线性函数:

其中┃的形式已知,未知常数α1,α2;…用样本去估计。医学中最常见的非线性回归是logistic回归,它常用于疾病对照研究以及生长发育问题中。

在前述的炊事员高血压病调查中,使用线性模型和最小二乘法求出未知常数,再用逐步回归选取变量,可求得15个变量中有7个变量对炊事员舒张压有显著的影响,它们按偏相关系数大小排列为:年龄(0.297),体胖程度(0.253),肾炎史(0.162),性别(0.117),工作类别(0.081),高血压家族史(0.061),嗜咸程度(0.052)。从相关性大小看,体胖对舒张压的影响与年龄的影响大体相当。另外还可看出:工种,家族史和嗜咸对舒张压虽有影响,但影响甚小。

判别分析根据样本的某些指标来决定样本归属的类别。例如在医疗诊断中,要确定一个病人是否患有急性阑尾炎,这就是一个判别问题。为了回答这一问题往往需要对病人进行多项指标(变量)的检测,然后根据各项指标的观测值将病人归入患有急性阑尾炎或不患有急性阑尾炎的类中。判别分析通常是先确立一个判别函数,将各指标的观测值代入相应的变量,再根据某判别规则(如函数值大于某值)作出判断、鉴别或决策。例如,为了研究亚硝酸基盐化合物与胃癌的关系,有人曾对胃癌组(记为H1)、萎缩性胃炎组(H2)、浅表性胃炎组(H3)3组病人测量以下6个指标(变量):性别(x1,男为1,女为0)、年龄(x2)、胃液中pH值(x3)、唾液中亚硝酸盐浓度(x4)、胃液中亚硝酸盐浓度(x5)、胃液中二甲基亚硝酸胺浓度(x6)。用判别分析法,可求出6个指标(变量)在3个疾病组中分布有显著不同的是x1,x2,x4,x6;其余两个指标在不同组中的分布大体相同。对应于每个疾病组可建立以下的判别函数:u1=-11.48+2.68x1+0.37x2+0.04x4+0.90x6 (H1) u2=-14.06+3.79x1+0.35x2+0. 50x4+1.82x6 (H2) u3=-6.36+1.84x1+0.27x2+0.34x4+0.84x6 (H3)

在判别分析时,可将测得的病例值(x1,x2,x4,x6)代入判别函数,求得一组函数值u 1,u2,u3。这里的判别规则是:如果u1最大,则病例判属疾病组H1;如果u2最大,则判属H2;如果u3最大,则属H3。这样,诊断就变成了数据的处理及分析,现代化医院自动诊断的原理就基于此。通常说的把医生的经验和知识存入计算机,也就是在计算机中建立诊断的经验方式──判别函数。判别函数中变量前的系数含有重要的信息。上列中变量x3,x5前的系数都为0;x1前的3个系数(2.68,3.79,1.84)说明相对于女性(x1=0)而言,男性(x1=1)更容易得萎缩性胃炎(3.79)或胃癌(2.68);x2前的3个系数说明相同年龄者得胃癌、萎缩性胃炎、浅表性胃炎的比为0.37:0.35:0. 27;等等。

因子分析也称因素分析。医学、生物学及一切社会和自然现象中各变量(或事物)之间常存在有相关性或相似性。这是因为变量(或事物)之间往往存在有共性因素(称为公因子或共性因子),这些共性因子同时影响不同的变量(或事物)。因子分析的根本任务就是从众多的变量(或事物)中由表及里找出隐含于它们内部的公因子,指出公因子的主要特点,并用由实际测量到的变量(或事物)构造公因子。因子分析有R型及Q型之分,用于变量之间时称为R型因子分析,用于事物之间时称为Q型。

以R型因子分析为例,设样本中的变量为x1,x2,…,xm,隐藏的公因子为┃1,┃2,…,┃k。这时每个变量在理论上常可写成下面的形式:

上式右边的第一部分是变量中公因子(┃1,┃2,…,┃k)起作用的部分,后一部分是与公因子无关的部分(称为独立性部分)。因子分析的根本任务就是用样本求出┃1,┃2,…,┃k及其系数{α吗},系数α吗称为权或负荷系数,当样本是标准化数据且假定公因子之间彼此不相关时,则权α吗就是公因子┃j与变量xi间的相关系数。利用因子分析方法可以从所观测到的变量中推断出少数因子,用最少的因子来解释所观测到的变量,从而揭示事物之间内在的联系。对因子的实际解释必须结合专业知识并由实践检验。例如中国学者梁月华、孙尚拱曾用因子分析法找出隐含在6个易测量的生理指标(收缩压、舒张压、呼吸、心率、体温及唾液量)内部的公因子┃1,并用实验判定┃1可很好地代表交感神经的平衡状态,最后用┃1 论证了中医的“寒热”其本质就是交感神经的抑制或兴奋。

主成分分析是研究如何把彼此相关的变量综合成一个(或少数几个)综合指标(或称主成分),而该综合指标应能最大程度地反映观测变量所提供的信息。如记(x 1,x2,…,xm)为观测变量,欲求的综合指标Z一般可写成

实际上Z往往只能吸收m个变量中相关最大的一部分信息(类似于因子分析中┃1),此当观测变量间彼此很少有相关性时,使用主成分分析是不合适的。如果观测变量间相关性可以分成几组而各组间又很少相关,这时不能用一个主成分综合全体变量,而应多取几个主成分。

实际使用时,由于主成分分析与因子分析极为相似,所以不少统计学家常把两种分析不加区别,名称也相互套用。

主成分分析在医学研究中有很多应用,例如有人把5个易测量的老化征(白斑、老年斑、闭目单腿直立时间、老年环、脱齿数)综合成一个指标Z,计算表明综合值Z 可以吸收5个老化征全体信息中的43%,能综合地反映出形体老化的程度。

聚类分析也称为分类学。经典的分类学诞生于几百年前,比如化石分类、植物标本分类等。过去的分类多依靠一些特异性指标。如果对于所需分类的事物,不存在或难以使用特异性指标时就只能采用多变量统计分析法。把数学方法引进分类学并称之为“聚类分析”是60年代的事。此后聚类分析发展很快,并取得广泛应用,但还不大成熟。

聚类分析也可分为R型及Q型,对变量作分类称R型,对样品(观察单元、事物)作分类称Q型。分类的基础是相似性或距离。如果两个变量(或样品)彼此相似或距离很近,自然就分在同一类。因此在进行聚类分析时必须先定义相似性或距离。相似性或距离的定义法种类繁多。例如,常用变量间的相关系数代表变量间的相似性,以几何中两点间的欧氏距离(先要去量纲)代表两个样品间的距离。然后选用分类的数学公式,对它们的分类作出判别。这些公式也是种类繁多。至今没有一种公式是最优的。实际工作者常选用多种方法试算,再结合专业知识确定分类的结果。

生存分析生存分析起源于寿命表。生物的生存时间除了受健康的影响外,同时还受社会因素,生活条件等影响。生存分析研究哪些因素对“寿命”有显著影响,它的风险程度如何。20世纪末生存分析已不仅用于研究人的寿命问题,还用于一切广义的“寿命”或有关“死亡”的问题,比如发动机的寿命,病人手术后的生存时间,两种疗效的对比分析等。生存分析有多种模型,最常用的有Cox回归模型,它的特点是:m 个变量联合作用的相对风险可以表示成每个变量单独作用时相对风险的乘积(故也称为乘法模型)。另外常用的模型为可加性模型,它的特点是:m 个变量联合作用的相对风险可表示为每个变量单独作用之和。究竟应使用什么样的模型应在具体问题中结合专业知识确定。

多变量统计分析除了上述六个大的分支外,通径分析和典则相关分析也很常用。一般回归分析只能计算每一个变量(在固定其他变量时)对指标y的直接作用大小,而通径分析可同时计算每一个变量对指标y的间接作用(即通过与它相关的变量作用于y)。通径分析在流行病的遗传研究中已有不少应用。典则相关分析也是回归分析的进一步发展。对每个事物同时测量多个指标(y1,y2,…)和多个自变量(x1,x2,…),分析指标的综合与自变量的综合是如何相关时多使用典则相关分析。

话语分析基础知识PDF

话语分析的语用学基础 作者:冉永平 1.两门交叉学科 目前话语分析在研究超句现象、研究实际运用的自然语言等方面取得了较为一致的认识,但在话语生成、理解以及运用方面还未形成统一的理论格局和研究方法。 话语分析和语用学这两门语言学的分相学科都是本世纪六十年代末、七十年代初开始形成和发展起来的新兴交叉学科,在语言学研究领域中受到人们的普遍关注。但它们在研究范围和研究方法方面仍然众说纷纭,而且各自的基本理论尚需充实、完善和发展。二者之间的关系也难以定界,存在两种说法:(1)话语分析属于语用学;(2)话语分析包括语用学。话语分析和语用学的一个主要特征就是它们的学科交叉性,与语义学、认知语言学、社会语言学、系统功能语言学、语体学等学科相互交叉,这就决定了该学科在理论和研究方法上的多样性,需要形成多元化的研究格局。在有关话语分析的论著中,我们不难发现许多专家、学者进行的是交叉性研究,如话语和语法、话语和语义、话语和语用、话语和认知、话语和交际等。然而在语言学领域中占有重要地位的语用学目前也正处于一个横向跨面、纵向深入、研究范围逐渐扩大的发展阶段,与话语分析一样都以实际运用中的语言为研究对象,它们有较多交叉重叠之处。这为帮助我们了解语言现象本身提供了新的视角,补充纯语言形式研究的不足,但二者之间又可以相互借鉴和补充。 2.话语分析与语用学沟通的基础 话语分析的研究课题之一就是探讨语篇结构上彼此独立的句子是如何连接在一起构成语篇的,以及它们之间的衔接关系与意义连贯问题,它注重语篇结构分析。hatch(1992)指出,衔接指连句成篇的表面形式特征,它包括语用学家levinson(1983)提出的五种指示标记(人称指示、地点指示、时间指示、社交指示、话语指示)和halliday和hason(1976)提出的五种语法衔接关系(参照、替换、省略、连接、词汇搭配)等,而连贯指语篇内的潜在连接功能,通过交际制略因素、方案(script)理论、言语事件结构等表现出来。可以说语篇衔接与连贯往往是多层次的,最上面层是包括语篇和语用学的社会符号层;第二层是包括及物性、逻辑连接、语篇结构等的语义层;第三层是包括结构衔接和主述位结构等在内的结构层;最后一层也是最低层就是词汇层和音系层(胡壮麟,1996)。这说明话语分析最终要超出语篇结构分析,将常规话语分析和语用学分析结合起来,相互弥补,才能理解一个完整的语篇,把握语篇信息及其交际价值。 2.1语境 关系等;(3)话语的宏观使用环境,指广泛的社会和文化背景。这三方面的语境因素都会影响话语的组织、生成和理解。目前为话语分析提供了一定理论基础的系统功能语言学又将语篇语境因素分为三大类:(1)语场,指话题以及与之有关的活动;(2)语式,指话语活动所选择的渠道,口头的或书面的;(3)语旨,指参与者之间的社会关系以及话语在特定语境中的交际目的。这三种因素又与概念功能、人际功能、语篇功能有着密切联系。总之,影响话语分析的语境内涵十分丰富。语境在话语分析中具有无可否认的重要作用。话语分析注重语篇的衔接机制(cohesivemechanism),外照应(exophoricreferences)把语篇和情景联系起来,反映了语篇对情景的依赖程度,语篇的外照应项目越多,语篇对情景的依赖性就越强。话语分析关注的不是孤立于语篇语境之外的句子,而是语境之中句子之间或话语之间存在的模式和规律性,这与脱离语境研究句子的传统语言学截然不同。同样,意义连贯(coherence)也必须依赖语境。语篇所表达的意义可分为两种:直示意义和隐示意义。前者即语篇的表层意义,通过分析意义单位较容易把握,但后者往往需要结合语境,进行语用分析,超出语篇的直示意义,才能领悟其深层次的隐示意义。语境更是语用学的一个重要概念,是语用学研究的基础,它和言语行为的相互作用构成语用学的中心内容。语境与言语活动的参与者、言语行为,尤其与正确理解会话含义

(实验2)多元回归分析实验报告

陕西科技大学实验报告 课 程: 数理金融 实验日期: 2014 年 5 月 22 日 班 级: 数学112 交报告日期: 2013 年 5 月 23 日 姓 名: 常海琴 报告退发: (订正、重做) 学 号: 201112010101 教 师: 刘利明 实验名称: 多元回归分析 一、实验预习: 1.多元回归模型。 2.多元回归模型参数的检验。 3.多元回归模型整体的检验。 二、实验的目的和要求: 通过案例分析掌握多元回归模型的建立方法和检验的标准;并掌握分析解决实际金融问题的能力。 三、实验过程:(实验步骤、原理和实验数据记录等) 软件:Eviews3.1 数据:给定美国机动车汽油消费量研究数据。 实验原理:最小二乘法拟合多元线性回归方程 数据记录: 实例中1950年到1987年机动汽车的消费量、汽车保有量、汽油价格、人口数、国民生产总值 图1各个量之间的关系

陕西科技大学理学院实验报告 - 2 - 1、录入数据 图2录入数据 2、回归分析 443322110X X X X Y βββββ++++= 图3运行结果 Y=24553723+1.418520x1-27995762x2-59.87480x3-30540.88x4 S (25079670) (0.266) (5027085) (198.5517) (9557.981) T (0.979) (5.314) (-5.568) (-0.301) (-3.195) 2R =0.966951 F=241.3764 - R =0.9629 dw=0.6265 四、实验总结:(实验数据处理和实验结果讨论等) 用残差和最小确定直线位置是一个途径。计算残差和有相互抵消的问题。用残差绝对值和最小确定直线位置也是一个途径绝对值计算起来比较麻烦。最小二乘法用绝对值平方和最小确定直线位置。0β、1β、2β、3β、4β具有线性特性,无偏特性,有效性。-R =0.9629基本上接近于1,拟合效果较好。

多元线性回归模型的案例分析

1. 表1列出了某地区家庭人均鸡肉年消费量Y 与家庭月平均收入X ,鸡肉价格P 1,猪肉价格P 2与牛肉价格P 3的相关数据。 年份 Y/千 克 X/ 元 P 1/(元/千克) P 2/(元/千克) P 3/(元/千克) 年份 Y/千克 X/元 P 1/(元/ 千克) P 2/(元/ 千克) P 3/(元/千克) 1980 2.78 397 4.22 5.07 7.83 1992 4.18 911 3.97 7.91 11.40 1981 2.99 413 3.81 5.20 7.92 1993 4.04 931 5.21 9.54 12.41 1982 2.98 439 4.03 5.40 7.92 1994 4.07 1021 4.89 9.42 12.76 1983 3.08 459 3.95 5.53 7.92 1995 4.01 1165 5.83 12.35 14.29 1984 3.12 492 3.73 5.47 7.74 1996 4.27 1349 5.79 12.99 14.36 1985 3.33 528 3.81 6.37 8.02 1997 4.41 1449 5.67 11.76 13.92 1986 3.56 560 3.93 6.98 8.04 1998 4.67 1575 6.37 13.09 16.55 1987 3.64 624 3.78 6.59 8.39 1999 5.06 1759 6.16 12.98 20.33 1988 3.67 666 3.84 6.45 8.55 2000 5.01 1994 5.89 12.80 21.96 1989 3.84 717 4.01 7.00 9.37 2001 5.17 2258 6.64 14.10 22.16 1990 4.04 768 3.86 7.32 10.61 2002 5.29 2478 7.04 16.82 23.26 1991 4.03 843 3.98 6.78 10.48 (1) 求出该地区关于家庭鸡肉消费需求的如下模型: 01213243ln ln ln ln ln Y X P P P u βββββ=+++++ (2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。 先做回归分析,过程如下: 输出结果如下:

浅析批评性话语分析

浅析批评性话语分析 摘要:话语是社会和文化的构成要素,与其相互影响,相互包含。话语分析,既是其三者相互作用影响下的产物。批评性话语分析是其中最有影响的一个分析。本文从四个方面阐释了批评性话语分析,既概念、理论渊源、分析原则及主要方法。其中主要方法包括:系统功能语法分析、语篇体裁交织性分析和话语历史背景分析。这三种方法各有侧重,互为补充,它们使批评性话语分析成为传统的社会和文化分析的重要补充,使其变为一种社会行动,促进人类社会的进步。 关键词:批评性话语分析;分析原则;方法 1.引言 1.1什么是批评性话语分析 批评性话语分析(critical discourse analysis),简称CDA,也叫做批评语言学( critical linguist ics),旨在通过分析语言特征及其生成的社会文化背景挖掘隐含于语言中的意识形态, 进而揭露语言、权势和意识形态之间的复杂关系。批评性话语分析诞生于20世纪70 年代,英国语言学家Fowler 等在《语言和控制》(Language and Control)一书中首次提出批评语言学这一概念, 揭开了批评性话语分析研究的序幕。 批评性话语分析被认为是批评语言学最有影响的一个分析,它通过分析大众语篇揭示意识形态对语篇的影响和语篇对意识形态的反作用。不同学者对批评话语分析的诠释不尽相同。Van Dijk认为批评话语分析的研究动力和兴趣来自于紧迫的社会问题,他希望通过分析更好地理解这些问题。批评话语分析不仅关注社会不公正、不平等、权势,更意在揭露在这些不公正、不平等和权势的构建和维护过程中话语所起的微妙作用。Fairclough 认为“批评”的意思就是要揭示人们所不清楚的某些关系,比如语言、权势和意识形态之间的关系。Lazar 把批评话语分析理解为对已经“自然化”的事物“去神秘化”的过程。Cameron指出这种自然化往往是服务于特定利益而违背了他人的利益。批评性话语分析家认为话语是影响人们思想和实践的强有力方式, 因而有必要通过详细分析揭示其中的权势关系。 在语言学上,批评性话语分析吸收了美国人类学家Sapir & Whorf关于语言和思维关系的假说(语言相对论和语言决定论)以及Halliday系统功能语言学(Systemic Functional Linguistics)的理论, 主张人们在使用语言时所选择的语言形式是由其实现的社会功能所决定的(选择即意义),而CDA正是主张语言是一种社会实践, 试图使人们意识到以前所没意识到的语言和社会结构之间相互影响的关系。 Fairclough提出了批评性话语分析的三大论点:(1)语言是一种社会实践(social practice),它是社会秩序的一种永恒的介入力量,从各个角度反映现实,通过再现意识形态来操作、影响社会过程。(2) 在社会文化环境中,语言与价值观念、宗教信仰和权力关系之间是一种互为影响的关系。(3) 语言的使用可以促使话语的改变和社会的变革。Fairclough 承认批评性话语分析并非“毫无激情而纯客观的”社会科学,批评性话语分析家都是带着激情和强烈的责任感而投入工作的。批评性话语分析的独特之处就是它帮助被统治和被压迫群体反对统治者。它公开表明自己的动机是为被压迫群体谋求解放。这并不意味着批评性话语分析缺少坚实的理论基础,也不意味着批评性话语分析的学术标准低或方法不严谨。

多元回归分析报告matlab

回归分析MATLAB 工具箱 一、多元线性回归 多元线性回归:p p x x y βββ+++=...110 1、确定回归系数的点估计值: 命令为:b=regress(Y, X ) ①b 表示???? ?? ????????=p b βββ?...??10 ②Y 表示????????????=n Y Y Y Y (2) 1 ③X 表示? ?? ???????? ?? ?=np n n p p x x x x x x x x x X ...1............ (1) (12) 1 2222111211 2、求回归系数的点估计和区间估计、并检验回归模型: 命令为:[b, bint,r,rint,stats]=regress(Y,X,alpha) ①bint 表示回归系数的区间估计. ②r 表示残差. ③rint 表示置信区间. ④stats 表示用于检验回归模型的统计量,有三个数值:相关系数r 2 、F 值、与F 对应的概率p. 说明:相关系数2 r 越接近1,说明回归方程越显著;)1,(1-->-k n k F F α时拒绝0H ,F 越 大,说明回归方程越显著;与F 对应的概率p α<时拒绝H 0,回归模型成立. ⑤alpha 表示显著性水平(缺省时为0.05) 3、画出残差及其置信区间. 命令为:rcoplot(r,rint) 例1.如下程序. 解:(1)输入数据. x=[143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164]'; X=[ones(16,1) x]; Y=[88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102]'; (2)回归分析及检验. [b,bint,r,rint,stats]=regress(Y,X) b,bint,stats 得结果:b = bint =

话语分析的背景及形成原因和动力理论

【正文】 (中国社会科学院语言研究所徐赳赳) 提要:本文简要回顾了话语分析产生的历史背景,追踪了话语分析的发展历程,介绍了各个时期的不同 特点。同时对一些理论问题的不同看法,诸如话语分析与其他学科的划界、话语分析的研究对象、研究领域等 ,也作了介绍和归纳。本文还着重介绍了话语分析这门新学科近些年研究的新动向。 关键词:话语分析、篇章 1.历史背景 1952年,Zellig Harris写了一篇题为“Discourse Analysis”(话语分析)的论文,刊登在Languag e杂志上。此后,Discourse Analysis这个术语逐渐为人们所熟悉,一批研究者相继步入这个领域,进行探索 性的研究。在欧洲,Hartman,Schmidt等人开始从事话语分析,捷克斯洛伐克的学者对topic,comment等概念很 有兴趣,这引起了他们对话语结构的重视。由Halliday(1961)发展而来的“系统功能语法”,不只对句 子的主题结构进行分析,而且还对句子和话语的关系进行分析。在美国,Hymes (1964)编的Languagein Culture and Society(文化和社会中的语言)问世,书中已经注意到“言语交际”的形式,并进行了“讲话 形式”等课题的研究。Pike对语言和人类行为语位的研究,也促进了话语分析的发展,他和他的追随者对土著 语中叙述体的研究一直与话语分析紧紧联系在一起。 这段时间的研究是话语分析的萌芽时期,其特点是各自进行一些零星的研究,还未形成系统,其影响也不 大。 2.形成和发展 2.1.形成阶段 70年代(包括60年代底),从事话语研究的学者越来越多,研究成果大批出现,一门新学科的雏形开 始形成,在语言学界引起了重视。 2.1.1.大量论文、论文集和专著的出现 这段时期,研究话语的论文大量出现,专著和论文集也出了几十部。研究的课题主要集中在:reference (指称),deixis(指示),anaphora(回指),context(语境),topic and comment(话题和述题),co hesion and coherence(外在接应和内在接应),substitution(替换)等等。 有影响的论文集有:Studies in Text Grammar(篇章语法研究,Petofi& Rieser (eds.),1974);Text v s. Sentence: Basic Questions of Textlinguistics(篇章和句子:篇章语言学的基本问题,Petofi (ed.),

多元线性回归实例分析报告

SPSS--回归-多元线性回归模型案例解析!(一) 多元线性回归,主要是研究一个因变量与多个自变量之间的相关关系,跟一元回归原理差不多,区别在于影响因素(自变量)更多些而已,例如:一元线性回归方程为: 毫无疑问,多元线性回归方程应该为: 上图中的 x1, x2, xp分别代表“自变量”Xp截止,代表有P个自变量,如果有“N组样本,那么这个多元线性回归,将会组成一个矩阵,如下图所示: 那么,多元线性回归方程矩阵形式为: 其中:代表随机误差,其中随机误差分为:可解释的误差和不可解释的误差,随机误差必须满足以下四个条件,多元线性方程才有意义(一元线性方程也一样)1:服成正太分布,即指:随机误差必须是服成正太分别的随机变量。 2:无偏性假设,即指:期望值为0 3:同共方差性假设,即指,所有的随机误差变量方差都相等 4:独立性假设,即指:所有的随机误差变量都相互独立,可以用协方差解释。 今天跟大家一起讨论一下,SPSS---多元线性回归的具体操作过程,下面以教程教程数据为例,分析汽车特征与汽车销售量之间的关系。通过分析汽车特征跟汽车销售量的关系,建立拟合多元线性回归模型。数据如下图所示:

点击“分析”——回归——线性——进入如下图所示的界面:

将“销售量”作为“因变量”拖入因变量框内,将“车长,车宽,耗油率,车净重等10 个自变量拖入自变量框内,如上图所示,在“方法”旁边,选择“逐步”,当然,你也可以选择其它的方式,如果你选择“进入”默认的方式,在分析结果中,将会得到如下图所示的结果:(所有的自变量,都会强行进入) 如果你选择“逐步”这个方法,将会得到如下图所示的结果:(将会根据预先设定的“F统计量的概率值进行筛选,最先进入回归方程的“自变量”应该是跟“因变量”关系最为密切,

多元线性回归分析预测法

多元线性回归分析预测法 (重定向自多元线性回归预测法) 多元线性回归分析预测法(Multi factor line regression method,多元线性回归分析法) [编辑] 多元线性回归分析预测法概述 在市场的经济活动中,经常会遇到某一市场现象的发展和变化取决于几个影响因素的情况,也就是一个因变量和几个自变量有依存关系的情况。而且有时几个影响因素主次难以区分,或者有的因素虽属次要,但也不能略去其作用。例如,某一商品的销售量既与人口的增长变化有关,也与商品价格变化有关。这时采用一元回归分析预测法进行预测是难以奏效的,需要采用多元回归分析预测法。 多元回归分析预测法,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。 [编辑] 多元线性回归的计算模型[1] 一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释

因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。 设y为因变量,为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为: 其中,b0为常数项,为回归系数,b1为固定时,x1每增加一 个单位对y的效应,即x1对y的偏回归系数;同理b2为固定时,x2每增加一个单位对y的效应,即,x2对y的偏回归系数,等等。如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为: 其中,b0为常数项,为回归系数,b1为固定时,x2每增加一 个单位对y的效应,即x2对y的偏回归系数,等等。如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为: y = b0 + b1x1 + b2x2 + e 建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是: (1)自变量对因变量必须有显著的影响,并呈密切的线性相关; (2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的; (3)自变量之彰应具有一定的互斥性,即自变量之彰的相关程度不应高于自变量与因变量之因的相关程度; (4)自变量应具有完整的统计数据,其预测值容易确定。 多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和()为最小的前提下,用最小二乘法求解参数。以二线性回归模型为例,求解回归参数的标准方程组为 解此方程可求得b0,b1,b2的数值。亦可用下列矩阵法求得

话语分析

批评话语分析研究综述《批评语言学与批评话语分析之比较》 二、批评话语分析(理论基础) 批评话语分析是20世纪70年代末至80年代初由批评语言学发展而来的一种用于语篇分析的理论框架和研究方法。代表人物是Fa i rclough , Fo w ler , K ress ,vanD ij k , vanLeeuven , W odak等。其代表性的论著如 语言与权利 ( Fai rc l ough1989) , 语言、权利、意识形态 (W odak1989)以及 话语中的偏见 ( vanD ij k1984)标志着批评话语分析的形成。在具体的语篇分析中,他们或者以语言分析为主,或者从社会理论出发,对语篇的语言特征并不分析描述, 或者把社会理论与语言特征分析结合起来。根据他们研究的不同侧重点, 可以把这些学者分为以Fa i rc l ough为代表的兰卡斯特学派( Lancaster Schoo l )的社会变革论, 以W odak为代表的维也纳学派(V iennaSchoo l )的语篇历史法,以W et h -erell为代表的拉夫堡学派( LoughboroughSchoo l )的话语心理学, 以K ress和V anLeeuw en为代表的社会符号学,以V anD ij k为代表的社会认知法等等。其中, Fa i r -clough对批评话语分析的贡献尤为突出。 Fai rcolugh提出了独特的话语概念, 即: 语言是一种社会实践,作为意识形态的实践,它介入到社会中建构和改变社会的现实和政治关系。Fai rc l ough认为任何话语都可以同时视为一种三维的概念:语篇( tex t),口语或书面语; 话语实践( d iscoursepractice)和社会实践( soc ialpractice)。话语的这一性质要求话语分析也必须是三维的:对语篇的语言学描述( descri pt i on); 对语篇与话语实践过程之间的关系做出阐释( i nterpreta -t i on) ;对话语实践与社会实践之间关系做出解释( ex -plainat i on)。Fairco l ugh将这种三维话语和话语分析观图示如下:

spss多元回归分析报告案例

企业管理 对居民消费率影响因素的探究 --- 以湖北省为例改革开放以来,我国经济始终保持着高速增长的趋势,三十多年间综合国力得到显著增强,但我国居民消费率一直偏低,甚至一直有下降的趋势。居民消费率的偏低必然会导致我国内需的不足,进而会影响我国经济的长期健康发展。 本模型以湖北省1995年-2010 年数据为例,探究各因素对居民消费率的影响及多元关系。(注:计算我国居民的消费率,用居民的人均消费除以人均GDP,得到居民的消费率)。通常来说,影响居民消费率的因素是多方面的,如:居民总 收入,人均GDP,人口结构状况1(儿童抚养系数,老年抚养系数),居民消费价格指数增长率等因素。 1. 人口年龄结构一种比较精准的描述是:儿童抚养系数(0-14 岁人口与15-64 岁人口的比值)、老年抚养系数(65岁及以上人口与15-64岁人口的比值〉或总抚养系数(儿童和老年抚养系数之和)。0-14岁人口比例与65岁及以上人口比例可由《湖北省统计年鉴》查得。

注:数据来自《湖北省统计年鉴》) 、计量经济模型分析 (一)、数据搜集 根据以上分析,本模型在影响居民消费率因素中引入6个解释变量。X1:居民总收入(亿元),X2:人口增长率(‰),X3:居民消费价格指数增长率,X4:少儿抚养系数,X5:老年抚养系数,X6:居民消费占收入比重(%)。 X3:居民 X2:人口X6:居民 Y:消费率(%)X1:总收入 (亿元) 增长率 (‰) 消费价格 指数增长 率 X4:少儿X5:老年 消费比重 (%) 抚养系数抚养系数 1995 51.96 1590.75 9.27 17.1 45.3 9.42 68.9 1997 50.35 2033.68 8.12 2.8 41.1 9.44 70.72 2000 44.96 2247.25 3.7 0.4 39 9.57 70.93

多元回归分析案例

多元回归分析案例 计量经济学案例分析 多元回归分析案例 学院: 数理学院 班级: 数学092班 学号: 094131230 姓名: 徐冬梅 摘要:为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,用Eviews软件对相关数据进行了多元回归分析,得出了相关结论 关键词:多元回归分析 ,Evicews软件, 中国人口自然增长; 一、建立模型 为了全面反映中国“人口自然增长率”的全貌,选择人口自然增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。国名总收入,居民消费价格指数增长率,人均GDP作为解释变量暂不考虑文化程度及人口分布的影响。 通过对表1的数据进行分析,建立模型。其模型表达式为: (i=1,2,,3) Y,,,,X,,X,,X,ui11i22i33ii 其中Y表示人口自然增长率,X 表示国名总收入,X表示居民消费价格指12 数增长率,X表示人均GDP,根据以往经验和对调查资料的初步分析可知,Y与3

X,X,X3呈线性关系,因此建立上述三元线性总体回归模型。Xi则表示各解12 释变量对税收增长的贡献。μi表示随机误差项。通过上式,我们可以了解到,每个解释变量增长,亿元,粮食总产值会如何变化,从而进行财政收入预测。相关数据: 表1 国民总收居民消费价人口自然增人均GDP年份入(亿元)格指数增长长率(%。)Y (元)X3 X1 率(CPI)%X2 1988 15.73 15037 18.8 1366 1989 15.04 17001 18 1519 1990 14.39 18718 3.1 1644 1991 12.98 21826 3.4 1893 1992 11.6 26937 6.4 2311 1993 11.45 35260 14.7 2998 1994 11.21 48108 24.1 4044 1995 10.55 59811 17.1 5046 1996 10.42 70142 8.3 5846 1997 10.06 78061 2.8 6420 1998 9.14 83024 -0.8 6796 1999 8.18 88479 -1.4 7159 2000 7.58 98000 0.4 7858 2001 6.95 108068 0.7 8622 2002 6.45 119096 -0.8 9398 2003 6.01 135174 1.2 10542 2004 5.87 159587 3.9 12336

话语分析理论的评价

西方语言学史课程作业 话语分析 小组成员:仲秋月(组长) 200921313309中文 汪藜 200921303209中文 白慧 200921288709中文 张志琼 200921312509中文 李敏 200921296309中文 话语分析 【摘要】自zellig harris于1952年在language 杂志上发表题为“ discourse analysis”的论文至今,在各个语言学家的努力下,话语分析的概念逐渐为人们熟悉,经历了从无到有、从小到大的发展过程。本文较为详细的整理介绍了话语分析的有关理论,包括定义、主要流派、发展阶段,并在前人的基础上指出了一些不足,对未来的一些展望。 【关键字】话语分析理论阐释 一、话语及话语分析 1、话语的概念 话语是特定的社会语境中人与人之间从事沟通的具体言语行为,及一定的说话人与受话人之间在特定社会语境中通过文本而展开的沟通的言语活动。“话语”一词的流行,人文社会科学领域里的“语言学转向”巴赫金( m.m.bakhtin )贡献突出。在他看来,作为一种言说或表述的话语,是“活”的而不是“死”的,它的范围小到一个符号、一个词或单独一句话,大到一篇文章、一部作品,甚至无形的舆论等,其真实含义都只能通过社会交往与对话实践才能获得。 最终奠定流行性“话语”理论基础的是福柯(michel foucault)。他将“话语”定义为“隶属于同一的形成系统的陈述整体”。在福柯看来,每一种“话语”构成一个相对独立的“单位”,它具有特定的实践功能,而“话语实践”又通过话语对象、陈述、概念和策略等可供分析的关系网络在动态运行中反映出来。福柯非常自觉地将他的话语实践即知识考古学的分析法与传统的思想史 研究加以区别。区别表现在以下几个方面:1.关于新事物的确定;2.关于矛盾的分析; 3.关于比较的描述; 4.关于转换的测定。 2、话语分析的概念 “话语”和“话语分析”是棘手的概念,这在很大程度上是由于存在着如此之多的相互冲突和重叠的定义,它们来自各种不同的理论和学科的立场。按照后现代主义的逻辑,由于谁也不宣称对“真理”的占有,故谁也都不能被简单“排除在合理性”之外,这就更增加了今人选择概括的难度。 首先,“话语分析”的主流带有明显的后现代倾向,它把一切思想理论都平等地视为论述或陈述(一套说辞),把一切知识都一律地视为带有特定价值预设即主观性的陈述整体,否认所有被视为真理(或科学)的权威,并致力于淡化人们追求客观、确然真理的兴趣;其次,它往往否认话语对象内涵的实在性或确定性,强调话语本身的所谓不自明性(一个模糊的、漂浮的“能指”)和建构性,重视揭露话语主体的言说或分析策略、政治动机、价值预设及其实践功能,致力于追究话语在社会实践中的权力关系、传播和运作的社会化过程、作用方式和形态等。与此同时,由于它是一种习惯于质疑一个陈述或说辞背后的思想预设、具有自我反思性和批判精神的研究路径,因而对于已有的各种权威解释和论断,它又通常具有某种解构性。第三,与上述强调话语内容的模糊性一点相关,它拒绝为其寻找历史上的相关物或相似物,拒绝进行延续性的探索和原有思想史常用的那种影响分析,也反对寻找与分析甚至同一

Excel大数据分析报告工具进行多元回归分析报告

使用Excel数据分析工具进行多元回归分析 使用Excel数据分析工具进行多元回归分析与简单的回归估算分析方法基本相同。但是由于有些电脑在安装办公软件时并未加载数据分析工具,所以从加载开始说起(以Excel2010版为例,其余版本都可以在相应界面找到)。 点击“文件”,如下图: 在弹出的菜单中选择“选项”,如下图所示: 在弹出的“选项”菜单中选择“加载项”,在“加载项”多行文本框中使用滚动条找到并选中“分析工具库”,然后点击最下方的“转到”,如下图所示:

在弹出的“加载宏”菜单中选择“分析工具库”,然后点击“确定”,如下图所示: 加载完毕,在“数据”工具栏中就出现“数据分析”工具库,如下图所示:

给出原始数据,自变量的值在A2:I21单元格区间中,因变量的值在J2:J21中,如下图所示: 假设回归估算表达式为: 试使用Excel数据分析工具库中的回归分析工具对其回归系数进行估算并进行回归分析:点击“数据”工具栏中中的“数据分析”工具库,如下图所示: 在弹出的“数据分析”-“分析工具”多行文本框中选择“回归”,然后点击“确定”,如下图所示:

弹出“回归”对话框并作如下图的选择: 上述选择的具体方法是: 在“Y值输入区域”,点击右侧折叠按钮,选取函数Y数据所在单元格区域J2:J21,选完后再单击折叠按钮返回;这过程也可以直接在“Y值输入区域”文本框中输入J2:J21; 在“X值输入区域”,点击右侧折叠按钮,选取自变量数据所在单元格区域A2:I21,选完后再单击折叠按钮返回;这过程也可以直接在“X值输入区域”文本框中输入A2:I21; 置信度可选默认的95%。 在“输出区域”如选“新工作表”,就将统计分析结果输出到在新表内。为了比较对照,我选本表内的空白区域,左上角起始单元格为K10.点击确定后,输出结果如下:

多元回归分析案例解析

计量经济学案例分析 多元回归分析案例 学院:数理学院 班级:数学092班 学号: 094131230 姓名:徐冬梅

摘要:为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,用Eviews 软件对相关数据进行了多元回归分析,得出了相关结论 关键词:多元回归分析 ,Evicews 软件, 中国人口自然增长; 一、 建立模型 为了全面反映中国“人口自然增长率”的全貌,选择人口自然增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP ”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。国名总收入,居民消费价格指数增长率,人均GDP 作为解释变量暂不考虑文化程度及人口分布的影响。 通过对表1的数据进行分析,建立模型。其模型表达式为: i i i i i u X X X Y ++++=332211ββββ (i=1,2,,3) 其中Y 表示人口自然增长率,X 1 表示国名总收入,X 2表示居民消费价格指数增长率,X 3表示人均GDP ,根据以往经验和对调查资料的初步分析可知,Y 与X 1,X 2 ,X3呈线性关系,因此建立上述三元线性总体回归模型。Xi 则表示各解释变量对税收增长的贡献。μi 表示随机误差项。通过上式,我们可以了解到,每个解释变量增长1亿元,粮食总产值会如何变化,从而进行财政收入预测。 相关数据: 表1 年份 人口自然增长率(%。)Y 国民总收 入(亿元) X1 居民消费 价格指数增长率(CPI )%X2 人均GDP (元)X3 1988 15.73 15037 18.8 1366 1989 15.04 17001 18 1519 1990 14.39 18718 3.1 1644 1991 12.98 21826 3.4 1893 1992 11.6 26937 6.4 2311 1993 11.45 35260 14.7 2998 1994 11.21 48108 24.1 4044 1995 10.55 59811 17.1 5046 1996 10.42 70142 8.3 5846 1997 10.06 78061 2.8 6420 1998 9.14 83024 -0.8 6796 1999 8.18 88479 -1.4 7159 2000 7.58 98000 0.4 7858 2001 6.95 108068 0.7 8622 2002 6.45 119096 -0.8 9398 2003 6.01 135174 1.2 10542 2004 5.87 159587 3.9 12336 2005 5.89 184089 1.8 14040 2006 5.38 213132 1.5 16024 2007 5.24 235367 1.7 17535 2008 5.45 277654 1.9 19264

话语分析

《英语话语分析与跨文化交际》读书报告 1.引言 这学期我所读的第二本关于文体学方面的书籍是《英语话语分析与跨文化交际》。该书由王得杏编著,北京语言文化大学出版社1998年12月出版。 话语分析是现代语言学里的一个新兴学科,发展十分迅速,已经成为语言学一个重要研究领域,是当前语言学界很多人关注的课题。人类学家、社会学家、心理学家、哲学家以及语言学家们从不同侧面视图揭示话语结构特征和内在运行规律,使它日益成为语言学中一个包罗万象的研究领域。本书既评介各种话语分析途径的理论观点,又综述近期各种研究途径的研究成果,以便读者全面了解各种话语分析理论的本来面貌。该书还概述了近些年来国内一些研究人员在话语分析研究,尤其是对以英语为外语的中国人在跨文化交际中的语言使用问题的研究成果。 该书发表于1998年,已经有很长的时间了。但是这本书对话语分析进行了较为全面地介绍和分析。他述评了各个研究途径的理论、方法和成果,全方位的介绍了话语分析这门新兴学科。 在下文,读者先介绍该书的内容简介,评价该书的优缺点,再谈读者的对重要部分的理解。2.该书的简介 本书第一章介绍了话语分析的源流、跨学科性,并列出了关于话语分析的几种比较有代表性的界说如哈里斯、威多森、拉波夫、斯塔布斯、法索尔德和莱文森等。 第二章集中探讨了言语行为理论,内容涉及哲学背景、奥斯汀的言语行为理论和赛尔对言语行为理论的发展。奥斯汀认为句子有的是用来陈述事实的,而有的是用来实施行为的。这种实施某种行为的句子叫施为语句。他认为施为语句必须满足某些条件才能成功地实施某种行为。他把这种条件称为“合适条件”(felicity conditions)。到后期奥斯汀又把言语行为分为三大类即:以言表意的行为、以言施事的行为和以言取校的行为。后来赛尔又补充道以言实施行为时参与一种受规则支配的行为。而这种规则被分为调节性规则和构成性规则。赛尔还从以言实施行为的必要充分条件中抽象出以言实施行为的结构。 第三章分析了谈话隐含。本章先介绍了格赖斯的谈话隐含理论。要理解该理论必须首先理解

SPSS多元线性回归分析报告实例操作步骤

SPSS 统计分析 多元线性回归分析方法操作与分析 实验目的: 引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。 实验变量: 以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。 实验方法:多元线性回归分析法 软件:spss19.0 操作过程: 第一步:导入Excel数据文件 1.open data document——open data——open;

2. Opening excel data source——OK. 第二步: 1.在最上面菜单里面选中Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method选择Stepwise. 进入如下界面: 2.点击右侧Statistics,勾选Regression Coefficients(回归系数)选项组中的Estimates;勾选Residuals(残差)选项组中的Durbin-Watson、

Casewise diagnostics默认;接着选择Model fit、Collinearity diagnotics;点击Continue. 3.点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中的Standardized Residual Plots(标准化残差图)中的Histogram、Normal probability plot;点击Continue.

多元回归分析SPSS

多元线性回归分析预测法 多元线性回归分析预测法(Multi factor line regression method,多元线性回归分析法) [编辑] 多元线性回归分析预测法概述 在市场的经济活动中,经常会遇到某一市场现象的发展和变化取决于几个影响因素的情况,也就是一个因变量和几个自变量有依存关系的情况。而且有时几个影响因素主次难以区分,或者有的因素虽属次要,但也不能略去其作用。例如,某一商品的销售量既与人口的增长变化有关,也与商品价格变化有关。这时采用一元回归分析预测法进行预测是难以奏效的,需要采用多元回归分析预测法。 多元回归分析预测法,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。 [编辑] 多元线性回归的计算模型[1] 一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。

设y为因变量,为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为: 其中,b 0为常数项,为回归系数,b1为固定时,x1每增加一 个单位对y的效应,即x 1对y的偏回归系数;同理b2为固定时,x2每增加一 个单位对y的效应,即,x 2对y的偏回归系数,等等。如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为: 其中,b 0为常数项,为回归系数,b1为固定时,x2每增加 一个单位对y的效应,即x 2对y的偏回归系数,等等。如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为: y = b 0 + b1x1 + b2x2 + e 建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自 变量的选择,其准则是: (1)自变量对因变量必须有显著的影响,并呈密切的线性相关; (2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的; (3)自变量之彰应具有一定的互斥性,即自变量之彰的相关程度不应高于自变量与因变量之 因的相关程度; (4)自变量应具有完整的统计数据,其预测值容易确定。 多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和()为最小的前提下,用最小二乘法求解参数。以二线性回归模型为例,求解回归参数的标准方程组为 解此方程可求得b 0,b1,b2的数值。亦可用下列矩阵法求得

话语分析

《话语分析》第七章评述 (Discourse Analysis)由Gillian Brown和George Yule共同编写,《话语分析》 Gillian Brown是剑桥大学英语教授,George Yule为路易斯安那州立大学语言学教授。它与之前的话语分析类著作的不同之处在于它全面地介绍了话语分析的不同理论与方法,系统地论述了语言是如何在实际生活中得到应用的,语料涉及谈话录音、通知、书信、小说、报刊文摘等。 本书分为七个章节。第一章引言部分着重探讨语言的形式与功能,继而讨论了句子与语句;第二章介绍了语境的作用,着重分析了情景语境;第三章作者讨论了话题与话语内容的表现;第四章探讨视角与话语结构的表现;第五章主要讨论信息结构,讲述了信息是如何通过短语和小句层次的小结构单位而得到包装的;第六章的研究对象相对于上一章来说是大块语料的成构,讨论它们是怎样被解读而成为连贯的语篇的,重点仍然是话语的指称这一中心问题;第七章探讨了话语理解中的连贯。本文主要对第七章进行讨论并作出简要评述。 第七章首先讨论了话语的连贯。话语连贯是篇章语言学领域一个十分重要的概念。多年来,众多学者就这一理论从不同角度展开一系列的探讨与研究,提出了多种修正意见与观点。De Beaugrande和Dressler(1981)认为,连贯是篇章世界的组成部分,只有读者的先有世界知识与篇章所表现的概念关系结构相吻合时,篇章意义或意义连续体才能实现;胡壮麟(1994)认为,言语行为、合作原则等语用学知识有助于语篇连贯;张德禄认为语篇连贯的条件包括认知模式、情景模式、文化语境、心理思维语义联系等;而本书作者认为,人们在对语篇进行阐释时需要依赖一种假设,即,话语是连贯的。 在日常交际中,我们常常依靠句法结构和语言信息中的词项进行理解,但我们不能认为缺乏这些文字形式上的输入我们就达不到理解。有时,我们可以从作家写出的语法十分规范的句子中得出其字面意义,但实际上我们并未全部理解它,因为我们还需要更多语言之外的信息。有时一个句子不一定在表现形式上有连贯,但通过一些原则,我们可以推断出它们是连贯的。 随后,作者介绍了言语行为理论,借此来说明即使在没有表示接应手段时句子之间的关系仍能得到理解。言语行为理论首先由英国哲学家Austin提出,后又经过Searle的修正和发展。Austin认为,语言研究的对象应该是词和句子所完成的行为;任何一个言语行为都由三个次行为构成,即言内行为,言外形为和言后行为。如果把语篇当作一个整体言语行为来看待的话,就会发现语篇在这三个层面上连贯的方式和特征是不一样的,即言内行为的连贯是以语法、词汇、逻辑关系和主位与述位结构等有形标志为表现特征,其特点是有形的;言外行为的连贯是根据社会文化语境和情景语境去推导说话人的含义而得出的,其特点是隐形

相关主题
文本预览
相关文档 最新文档