当前位置:文档之家› R语言学习系列28-协方差分析

R语言学习系列28-协方差分析

R语言学习系列28-协方差分析
R语言学习系列28-协方差分析

23. 协方差分析

一、基本原理

1. 基本思想

在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响。如果忽略这些因素的影响,则有可能得到不正确的结论。这种影响的变量称为协变量(一般是连续变量)。

例如,研究3种不同的教学方法的教学效果的好坏。检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响。

协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对于观察变量的影响,从而实现对控制变量效果的准确评价。

协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。

协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行。

当有一个协变量时,称为一元协方差分析,当有两个或两个以上

的协变量时,称为多元协方差分析。

2. 协方差分析需要满足的条件

(1)自变量是分类变量,协变量是定距变量,因变量是连续变量;对连续变量或定距变量的协变量的测量不能有误差;

(2)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设;协变量的回归系数(即各回归线的斜率)是相同的,且不等于0,即各组的回归线是非水平的平行线。否则,就有可能犯第一类错误,即错误地接受虚无假设;

(3)自变量与协变量相互独立,若协方差受自变量的影响,那么协方差分析在检验自变量的效应之前对因变量所作的控制调整将是偏倚的,自变量对因变量的间接效应就会被排除;

(4)各样本来自具有相同方差σ2的正态分布总体,即要求各组方差齐性。

二、协方差理论

1. 观测值=均值+分组变量影响+协变量影响+随机误差. 即

()ij i ij ij y u t x x βε=++-+(1) 其中,X 为所有协变量的平均值。 注:在方差分析中,协变量影响是包含在随机误差中的,在协方差分析中需要分离出来。

用协变量进行修正,得到修正后的y ij (adj)为

(adj)()ij ij ij i ij y y x x u t βε=--=++

就可以对y ij (adj)做方差分析了。关键问题是求出回归系数β.

2. 总离差=分组变量离差+协变量离差+随机误差,

(1)计算总离差平方和时,记

11

()()k n

xy ij ij i j T x x y y ===--∑∑

211

()k n

xx ij i j T x x ===-∑∑ 总离差平方和:211()k n

yy ij i j T y y ===-∑∑

最终要检验分组自变量对因变量有无显著作用。原假设H 0:无显著作用。假设检验是在H 0为真条件下进行,可认为t i =0,则

()ij T ij ij y u x x βε=+-+

按最小二乘法原理线性回归可得到β的估计值

?xy T xx

T T β= 记修正的总离差平方和(残差平方和)为T yy(adj),则

22(adj)?T xy yy yy xx yy xx T T T T T T β=-=-,自由度为n-2

注:2?T xx

T β为回归平方和,若?0T β=(回归线为水平线),表示协变量x 对y 无作用,用方差分析就可以解决了。

(2)计算组内离差平方和时,记

11

()()k n

xy ij i ij i i j E x x y y ===--∑∑

211()k n

xx ij i i j E x x ===-∑∑

组内总离差平方和:211()k n

yy ij i i j E y y ===-∑∑

根据协方差分析的基本假设:各组内回归系数相等(做协方差分析时需要检验这一点),得到组内回归系数βw 的估计值

?xy w xx

E E β= 记修正的组内总离差平方和(组内残差平方和)为E yy(adj), 则

22(adj)?xy yy yy w xx yy xx E E E E E E β=-=-,自由度为n-k-1

其中,2?w xx E β为组内回归平方和,当1??w wk

ββ== 时,组内总离差平方和认为完全是由随机因素引起的,E yy(adj)就是随机为误差。这里的?w β是1??,,w wk

ββ 的加权平均值。 (3)计算分组变量离差平方和B yy(adj),它反映的是各个水平之间的差异。

2(adj)(adj)(adj)(adj)?T yy yy yy yy xx yy B T E T T E β=-=--

即,分组变量离差=总离差-协变量离差-随机误差。

于是,就可以进行组间无差异检验了:

(adj)(adj)/1

/1yy yy B k F E n k -=--

3. 因此,在做协方差分析前,需要依次做两个假设检验:

(1)协变量对因变量的影响对与各组来说都是相同的,即各组

回归系数相等:1???:w wk w

βββ=== ; 步骤:

①先按回归系数相等和不相等分别表示模型

()ij i w ij ij y u t x x βε=++-+

()ij i wi ij ij y u t x x βε=++-+

并计算出误差平方和

2(adj)yy yy w xx E E E β=-

211

i k

yy wi xx i S E E β==-∑ 其中,1

i k yy yy i E E ==∑. ②计算F 值

(adj)11/1

/2yy E S k F S n k --=-

若F 值小于临界值F α,则说明各组回归系数无显著差异(相等)。

(2)这些相等的回归系数?0w

β≠. 即采用一元线性回归的显著性检验,

2(adj)/1=//(1)

w xx yy E F E n k β=--回归平方和/自由度残差平方和自由度 222

2

/(1)(/)/(1)xy xx

xy yy xy xx yy xx xy E E E n k E E E n k E E E --==----

4. 协方差分析的步骤

(1)检验数据是否满足假设条件:正态分布性、方差齐性、各分组通过协变量预测因变量的回归斜率相同;

(2)检验效应因子的显著性;

(3)估计校正的组均值;

(4)检验校正的组均值之间的差异。

三、R语言实现

协方差分析要求数据满足:正态性、方差齐性、各分组通过协变量预测因变量的回归斜率相同。

R语言用aov()函数进行协方差分析,基本格式为:

aov(formula, data, ...)

其中,data为数据框;

formula为协方差公式形式,形如y~x+A, x为连续型协变量,A 为组别因子。

例1研究分别接受了3种不同的教学方法的3组学生,在数学成绩上是否有显著差异,数据文件“ex28_cov.Rdata”。

先不考虑数学入学成绩,只以“教学方法”为分组变量,“后测成绩”为因变量进行单因素方差分析:

setwd("E:/办公资料/R语言/R语言学习系列/codes")

load("ex28_cov.Rdata")

head(scores)

before after teach

1 39 68 1

2 38 6

3 1

3 51 65 1

4 56 68 1

5 74 74 1

6 40 60 1

attach(scores)

table(teach)#各组的样本数

teach

1 2 3

30 32 33

aggregate(after, by=list(teach), mean)#各组均值Group.1 x

1 1 62.88333

2 2 72.67188

3 3 65.06061

shapiro.test(after)#正态性检验

Shapiro-Wilk normality test

data: after

W = 0.99105, p-value = 0.7772

bartlett.test(after~teach,data=scores)#方差齐性检验Bartlett test of homogeneity of variances

data: after by teach

Bartlett's K-squared = 0.69854, df = 2, p-value = 0.7052

fit.aov<-aov(after~teach,data=scores)

summary(fit.aov)

Df Sum Sq Mean Sq F value Pr(>F)

teach 2 1662 830.8 10.44 8.23e-05 ***

Residuals 92 7325 79.6

---

Signif.codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

说明:单因素方差分析的p值=8.23e-05, 远小于0.05, 表明,两种教学方法有非常显著的差异。

但是,后测成绩肯定会受到前测成绩(连续型)的影响,假定前测成绩与教学方法(即组别,是控制变量)不存在交互影响。因此,将后测成绩作为因变量;教学方法作为控制变量;前测成绩作为协变量进行协方差分析。

回归斜率相同检验,即前测成绩与后测成绩的回归线是否平行:

scores1<-subset(scores,teach==1)

scores2<-subset(scores,teach==2)

scores3<-subset(scores,teach==3)

par(mfrow=c(1,3))

plot(scores1$before,scores1$after,xlab="before",ylab= "after",main="teach=1")

abline(lm(after~before,data=scores1))

plot(scores2$before,scores2$after,xlab="before",ylab= "after",main="teach=2")

abline(lm(after~before,data=scores2))

plot(scores3$before,scores3$after,xlab="before",ylab=" after",main="teach=3")

abline(lm(after~before,data=scores3))

可见两组的直线趋势的斜率比较接近(平行),基本符合协方差假定。除了图形判断外,还可以通过交互作用是否显著,来判断斜率是否相同。因为若前验成绩与教学方法的交互作用显著,则说明前验成绩与后验成绩的关系,依赖于教学方法。

library(multcomp)

fit2<-aov(after~before*teach,data=scores)

summary(fit2)

Df Sum Sq Mean Sq F value Pr(>F)

before 1 2432 2432.0 35.391 5.22e-08 ***

teach 2 362 180.9 2.633 0.0775 .

before:teach 2 76 38.2 0.556 0.5752

Residuals 89 6116 68.7

---

Signif.codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1说明:交互项的p值=0.5752>0.05, 故不显著,支持了斜率相同的假设。

fit<-aov(after~before+teach,data=scores)#协方差分析

summary(fit)

Df Sum Sq Mean Sq F value Pr(>F)

before 1 2432 2432.0 35.739 4.35e-08 ***

teach 2 362 180.9 2.659 0.0755 .

Residuals 91 6192 68.0

---

Signif.codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1说明:协方差分析的结果表明:前测成绩的p值=4.35e-08远小于0.05, 说明“前测成绩”对“后测成绩产生了非常显著的影响;“教学方法”的p值=0.0755>0.05, 说明“教学方法”对“后测成绩”的影响不显著。

由于受到协变量的影响,我们希望获取调整后的各组均值——即去除协变量效应后的各组均值。可使用effects包中的effects()函数来计算调整的均值:

library(effects)

effect("teach", fit)

teach effect

teach

1 2 3

65.05722 70.04958 65.62718

与方差分析时一样,要想得到教学方法两两之间有无差异,可以均值的成对比较(略)。

下面讲一下自定义比较(使用multcomp包可以实现),例如,分组变量有4个水平ABCD,要比较A与D时,比较矩阵=[1 0 0 -1]T, 有

[A B C D]×[1 0 0 -1]T=0 等价于A=D

要想将A与D合并再与B比较有无差异,则可以指定L矩阵=[1 -2 0

1]T, 则

[A B C D]×[1 -2 0 1]T =0 等价于(A+D)/2 = B

注意:是从(A+D)/2 = B倒推比较矩阵,该式即A-2B+0C+D=0.

根据调整后的各组均值,教学方法1和3基本相同,虽然总体上

3种差异不显著,教学方法2与1、3是否有显著差异呢?那么就需要自定义比较。

library(multcomp)

contrast<-rbind("2 vs. 13"=c(-1,2,-1))

res.vs<-glht(fit,linfct=mcp(teach=contrast))

summary(res.vs)

Simultaneous Tests for General Linear Hypotheses

Multiple Comparisons of Means: User-defined Contrasts

Fit: aov(formula = after ~ before + teach, data = scores)

Linear Hypotheses:

Estimate Std. Error t value Pr(>|t|)

2 vs. 1

3 == 0 9.415 4.083 2.306 0.023

4 *

---

Signif.codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Adjusted p values reported -- single-step method)

说明:自定义比较:教学方法2与教学方法1,3是否有差异,设置比较矩阵为[-1,2,-1], 结果p值=0.0234<0.05, 拒绝原假设,即有显著差异。

另外,HH包中的ancova()函数,也是用来做协方差分析的,还能将结果可视化。基本格式为:

ancova(formula, data=, x, groups, ...)

其中,若formula不包括,x和groups为作图时需指明协变量和因子。

library(HH)

ancova(after~before+teach, data=scores)

Analysis of Variance Table

Response: after

Df Sum Sq Mean Sq F value Pr(>F)

before 1 2432.0 2431.96 35.7392 4.354e-08 ***

teach 2 361.9 180.93 2.6589 0.07546 .

Residuals 91 6192.3 68.05

---

Signif.codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

从图中可以看出,用前验成绩来预测后验成绩的回归线相互平行,只是截距项不同。教学方法13基本相同,教学方法2明显好于13。

上述代码会让直线保持平行,若用

ancova(after~before*teach, data=scores)

则生成的图形将允许斜率和截距项依据组别而发生变化,这对可视化那些违背回归斜率同质性的实例非常有用。

方差分析和协方差分析,协变量和控制变量

方差分析和协方差分析,协变量和控制变量 方差分析 方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。 方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。 假定条件和假设检验? 1. 方差分析的假定条件为:(1)各处理条件下的样本是随机的。(2)各处理条件下的样本是相互独立的,否则可能出现无法解析的输出结果。(3)各处理条件下的样本分别来自正态分布总体,否则使用非参数分析。(4)各处理条件下的样本方差相同,即具有齐效性。 2. 方差分析的假设检验假设有K个样本,如果原假设H0样本均数都相同,K个样本有共同的方差σ,则K个样本来自具有共同方差σ和相同均值的总体。如果经过计算,组间均方远远大于组内均方,则推翻原假设,说明样本来自不同的正态总体,说明处理造成均值的差异有统计意义。否则承认原假设,样本来自相同总体,处理间无差异。 作用 一个复杂的事物,其中往往有许多因素互相制约又互相依存。方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等。方差分析是在可比较的数组中,把数据间的总的“变差”按各指定的变差来源进行分解的一种技术。对变差的度量,采用离差平方和。方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和,这是一个很重要的思想。经过方差分析若拒绝了检验假设,只能说

修辞学在生活中的应用

修辞学在生活中的应用 文题: 人类文明的交流离不开语言,而语言的使用又离不开修辞,修辞渗透到生活的方方面面,一句话,一篇文章等。没有修辞与有修辞的语言表达效果就是大相径庭的,不同的修辞手法运用到不同的场景,产生的效果也就是不一样的。 关键词: 语言、修辞、生活 正文: 瞧到这个题目,许多人会存在这样的疑惑:什么就是修辞?语言不仅就是人类最基本的符号系统,更就是人类最重要的交际工具。交际主体根据自己的角色定位、交际意图、交际环境与对象的不同,尽可能运用合适的语言形式以实现自己的交际目的,这就就是修辞。在现代汉语中,修辞分别指“修辞行为”、“修辞规律”、“修辞理论”。(参考资料来自教材)通过教材,我们已经了解修辞学的定义,但只就是一个模糊的概念,如果通过生活的例子来解释什么就是修辞,应该会更加生动易懂。 小学的时候讲文章或诗句时,老师都会问,“这句话运用了什么修辞手法?有什么作用”所以从小学开始便对修辞手法有了一个初步的了解,但也仅仅只就是局限于“比喻、拟人、对比、借代、对偶、夸张……”等这一类的手法,未曾深入了解过。但这些修辞手法,在生活中运用得就是最普遍的。 在大学对修辞学的进一步学习中,我了解了比喻、比拟、借代、夸张、双关等修辞手法又有另外一种说法,叫修辞格。修辞格又称辞格、修辞方式,就是为了提高修辞行为的效果而运用的组织语言材料的策略性方法。

比喻在生活中的运用十分广泛,在口语中也就是经常被使用的。比如,朋友之间互相打趣,“别吃了,再吃就变成猪了”“您瞧您胖得跟猪似的”“哎呦您瞅瞅您这头发,哪烫的啊,跟方便面一样。”这就是比较口语化的运用了比喻的修辞手法的句子。比喻的手法在诗歌中更就是得到了充分的运用。比如贺知章的《咏柳》“不知细叶谁裁出,二月春风似剪刀。”李贺的《马诗》“大漠沙如雪,燕山月似钩”,这两句诗都就是运用了比喻的手法。 拟人也就是运用得很多的。“成熟的麦穗压弯了腰”“小鸟在窗外愉快地唱起了歌”,这些都就是随便一想便能想起的拟人句子。拟人能够使句子富有表现力,形象生动。 要讲的第三种修辞手法就是借代。通俗点说,借代就就是“借用”一物来“代替”所要言说之物。比如,“巾帼不让须眉”这句话中,巾帼指的就是女性,须眉指的就是男性,这就是根据男女性别的特征运用借代手法来表现的。还有杜甫的“朱门酒肉臭,路有冻死骨”以“朱门”表示富贵人家,“冻死骨”表示贫苦人民。“白衣天使救助了许许多多的人”,我们可以判断出,白衣天使指的就是医生或就是护士。 恰当地运用借代可以突出事物的本质特征,增强语言的形象性,而且可以使文笔 简洁精炼,语言富于变化与幽默感。借代的作用可以用十六字概括:以简代繁,以实代虚,以奇代凡,以事代情。 还有另外一种修辞手法也就是经常运用的——夸张。夸张在我们日常生活对话交流中被频繁地使用。“我好饿,饿得能吞下一头恐龙”“只要老师一发火,教室里安静得连根针掉下去的声音都听得见”。在古诗词中也有很多例子。比如,“瀚海阑干百丈冰,愁云惨淡万里凝”“飞流直下三千尺,疑就是银河落九天”“黄

语言学概论课后练习汇总

语言学概论课后练习汇总 第一章总论 本章思考题: 1.“在现代科学体系中语言学是领先和关键的学科。”怎样理解这句话的含义? 2.你怎样理解应用语言学这一术语? 3.有人说转换生成语言学是语言学的革命,有人则说它是“毒蛇蛋”;有人说它不断改变看法是理论上的不一贯,有人则说它是理论上的发展。你认为应该怎样正确看待转换生成语言学? 4.张三和李幺妹刚给2岁的孩子过完两周岁的生日,两人就为小孩的培养问题争吵了起来。张三说:“应该教儿子识字了。”李幺妹说:“应该教儿子学音乐。”请从语言学的角度给他们一点建议。 练习题 名词解 1.语言学 2.小学 3.专语语言学 4.共时语言学 5.历时语言学 二、填空题 1.语言学的三大发源地是______、______、______。 2.我国传统的语文学统称“小学”,包括______、______、______三方面。 3.研究语言的结构,主要包括______、______、______、______四个部分。 4.语言是传递信息的过程,主要包括______、______、______、______、______五个阶段。 5.专语语言学可以从______和______两个方向研究语言,分别被称为______语言学和______语言学。 6.______语言学的建立,标志着语言学开始走上独立发展的道路。 7.布龙菲尔德的代表性著作______是美国结构主义语言学的奠基性著作,对美国结构主义语言学的形成、发展有重要的作用。 8.______被称为现代语言学之父,其代表作《普通语言学教程》在语言学史上具有十分重要的地位。 三、问答题 1.古代的语言研究和今天的语言研究有哪些不同之处? 2.语言交际过程分为哪几个阶段?请举例说明。(可结合分析任举一个句子作说明.) 3.“语言学既是一门古老的学科,又是一门年轻的学科;既与社会科学有密切的联系,又与自然科学有密切的联系。”怎样理解这句话的含义? 4.语言学有哪些作用?请结合实际加以说明。(结合实际部分可以根据自己的学习,工作或生活经历举例) 5.简述语言学的分类。

在生活中学习 在学习中生活

在生活中学习在学习中生活 内容摘要:陶行知先生提倡“生活化教育”。他说“从效力上说,教育更通过生活才能发出力量而成为真正的教育”,教育若不能通过生活,就不能成为真正的教育。杜威也说“教育即生活、即生长,即经验改造。”对于语言学习者来说,学习语言,是为了表达和交流。英语,是人们在生活中进行交流表达的一种活的语言。它来自于生活,并为生活所用。由此,我联想到小学英语教学。众所周知,小学生年龄较小,教育与生活的关系也较密切, 我们要提倡生活教育,特别注重教育的生活化。努力将教育内容,教学活动置于真实的生活背景之中,从而激发学生学习英语的兴趣,让学生在生活中学习,在学习中生活,实现生活化教学。 关键词: 贴近生活走进生活融入生活 随着英语这门学科在小学的普及,课堂组织形式和教学手段均有所改进,学生的语言知识及应用水平有了大幅度的提高,但是家长和老师常常有这样的疑惑:为什么学生离开了课堂,回到现实生活中,就不能自如地运用所学到的知识?我认为主要原因是缺少语言氛围。语言产生于生活又服务于生活,两者互相联系不可分割,如果语言离开了当时的情景和实践,它将成为无源之水,无本之木。英语作为一门人与人交际的工具,只有在真实的场景中运用才能发挥其价值。对于学生来说,英语离开了生活,也就失去了生活体验,失去了情感,失去了学习的意义,练习也就会变得枯燥和乏味。因此,在日常的教学工作中,老师应尽量在课堂内、外引导学生在真实的情境中感知、理解和运用语言,让英语走进学生的生活。 一、营造生活化的学习环境 1 环境对人的发展有着极其重要的作用,学校是学生活动的最主要场所,校园语言环境也应该成为学生学习英语的重要课程资源。要重视校园生活化英语语言环境建设,因地制宜地营造一个让学生随时随地能接触英语的良好环境,让校园成为英语习得的有效场所。学生在校大多数时间在教室里度过,教室又是学生在校学习的场所,营造生活化的教室学习环境对学生学习的影响也不例外。如在学习星期、日期、天气等内容后,让学生轮流值日,在黑板上用英语写上每天的日期、星期、天气,并在上课时进行谈论,学生很快就能就这些内容进行交流。又如三年级的单词是分门别类进行学习的,每当进行一个单元的学习时,把教室布置成相应的一个地点(例:动物园、快餐店等),把单词的图片(可以是老师准备的,也可以是学生自己画的)贴在墙上,或把玩具放在角落里,让学生随时

协方差分析理论与案例

协方差分析理论与案例 假设我们有N 个个体的K 个属性在T 个不同时期的样本观测值,用it y ,it x ,…,N,t=1,…,T,k=1,…,K 表示。一般假定y 的观测值是某随机实验的结果,该实验结果在属性向量x 和参数向量θ下的条件概率分布为(,)f y x θ。使用面板数据的最终目标之一就是利用获取的信息对参数θ进行统计推断,譬如常假设假定的y 是关于x 的线性函数的简单模型。协方差分析检验是识别样本波动源时广泛采用的方法。 方差分析:常指一类特殊的线性假设,这类假设假定随机变量y 的期望值仅与所考察个体所属的类(该类由一个或多个因素决定)有关,但不包括与回归有关的检验。而协方差分析模型具有混合特征,既像回归模型一样包含真正的外生变量,同时又像通常的方差一样允许每个个体的真实关系依赖个体所属的类。 常用来分析定量因素和定性因素影响的线性模型为: *,1,,,1,,it it it it it y x u i N t T αβ'=++=???=??? 从两个方面对回归系数估计量进行检验:首先,回归斜率系数的同质性;其 次,回归截距系数的同质性。检验过程主要有三步: (1) 检验各个个体在不同时期的斜率和截距是否都相等; (2) 检验(各个体或各时期的)回归斜率(向量)是否都相等; (3) 检验各回归截距是否都相等。 显然,如果接受完全同同质性假设(1),则检验步骤中止。但如果拒绝了完全同质性性假设,则(2)将确定回归斜率是否相同。如果没有拒绝斜率系数的同质性假设,则(3)确定回归截距是否相等。(1)是从(2)、(3)分离出来的。 基本思想:在作两组或多组均数1y ,2y ,…,k y 的假设检验前,用线性回归分析方法找出协变量X 与各组Y 之间的数量关系,求得在假定X 相等时修定均数1y ',2y ',…,k y '然后用方差分析比较修正均数间的差别,这就是协方差分析的基本思想。 协方差分析的应用条件:⑴要求各组资料都来自正态总体,且各组的方差相等;(t 检验或方差分析的条件)⑵各组的总体回归系数i β相等,且都不等于0(回归方程检验)。因此,应用协方差分析前,要对资料进行方差齐性检验和回归系数的假设检验(斜率同质性检验),只有满足上述两个条件之后才能应用,否则不宜使用。 ⑴各比较组协变量X 与分析指标Y 存在线性关系(按直线回归分析方法进行判断)。 ⑵各比较组的总体回归系数i β相等,即各直线平行(绘出回归直线,看是否

应用语言学教学大纲

《应用语言学概论》 《应用语言学概论》课程教学大纲简介 (一)基本情况 英文课程名称:Applied Linguistics 课程类型:学科限定选修课 总学时:36 学分:2 使用教材:于根元主编:《应用语言学概论》,商务印书馆,2003年。 参考文献:1.冯志伟:《应用语言学总论》,广东教育出版社,1999年。 2. 桂诗春:《应用语言学》,湖南教育出版社,1988年。 (二)课程性质、目的和任务 《应用语言学》是人文学院汉语专业民族本科生的学科限定选修课,在第四学年第一学期开出。本课程旨在通过讲授应用语言学的基本理论、研究方法、性质、范围、语言规划、语言教学等问题,使学生进一步开阔语言学视野,了解应用语言学的基本理论体系,巩固和提升语言学理论水平。本课程的任务是讲授应用语言学的基本理论和方法,提高学生的语言学素养及实际应用能力。 (三)教学基本要求 《应用语言学》课程要讲授应用语言学的基本问题包括应用语言学的研究意义、性质、范围、发展、基本理论、研究方法、交叉学科等。理论语言学和应用语言学的关系是密不可分的:理论要以应用为基础,应用又以理论为指导。要求学生通过听课、讨论、阅读等方式,提高自己的语言学素养,调整语言观和理论建设,为自己的语言学习和分析解决实际的语言问题方面打下更坚实的基础。 (四)教学内容及要求 第一章绪论 1. 语言应用研究的意义 2. 应用语言学的学术背景 3. 应用语言学的形成和发展 4. 应用语言学的任务

教学要求:了解应用语言学的研究意义、形成、发展、任务等。 第二章应用语言学的性质和范围 1. 应用语言学的定义 2. 应用语言学的地位 3. 应用语言学的范围 4. 语言规划 5. 语言教学 6. 计算语言学 教学要求:了解和掌握应用语言学的定义、地位、范围等问题。 第三章应用语言学的研究方法 1. 调查和比较 2. 定量研究与定性研究 3. 实验方法和预测法 教学要求:了解调查法、比较法、实验法等应用语言学的研究方法。 第四章应用语方学的基本理论 1. 交际理论与动态理论 2. 中介理论和层次理论 3. 潜显理论和人文性理论 教学要求:了解和讨论交际理论、动态理论、人文性理论等应用语言学的基本理论。 第五章中国的应用语言学(上) 1. 推广普通话现代汉语规范化 2. 现代维吾尔语的规范化 3. 中国的语言教学新疆的语言教学 4. 计算语言学的研究 教学要求:了解和讨论现代汉语的规范化、我国及新疆的语言教学的相关问题。 第六章中国的应用语言学(下) 1. 新词术语播音主持语言 2. 法律语言广告语言

方差分析(ANOVA)与协方差分析(ANCOVA)

方差分析(ANOVA)与协方差分析(ANCOVA) 第5章方差分析(ANOVA)与协方差分析(ANCOVA) ——野外竞争试验 Deborah E.Goldberg Samuel M.Scheiner 5.1 引言 自从达尔文时期,竞争就占据了生态理论的中心,关于竞争的实验在许多来自许多不同环境的多生物种之间开展过(Jackson,1981综述; Connell,1984; Schoener,1984; Hairston,1989; Gurevitch,1992)。有各种各样的竞争实验,而本章的重点则放在怎样为具体的竞争问题选择适当的实验设计和统计分析。这类选择取决于所研究问题及系统的许多方面。对于大多数我们所给出的设计、基本的统计方法、方差分析(ANOVA)和协方差分析(ANCOVA)在实验设计与分析的教科书中也有详尽描述,我们在这里就不像本书其他章节那样提供详细的统计细节。对于ANOVA的基本介绍见第四章。虽然我们着重于竞争,但许多观点对其他类型的种间关系实验同样有效,如捕食者—猎物关系或者互惠共生关系。 5.2 关于竞争的生态问题 我们可以提出关于竞争的最简单问题莫过于竞争是否在野外存在,要回答这个问题,就必须利用实验处理,使潜在竞争者们的绝对多度可被控制,同时检验处理中存在低多度潜在竞争者时物种是否可能生长的更好。这类多度处理之间生长的差异即是竞争的量纲(或促进facilitation的量纲如果在较高多度下生长较佳)。在任何野外竞争调查中,发现是否存在竞争是重要的第一步,但是,就其本身而言,并没有什么意义。多数关于竞争的重要问题包括竞争强度的比较以及随之而来的实

笑话中的语言学浅析

笑话中的语言学概述 【摘要】:笑话,是供人们消遣和交际的一种创造性的语言形式,其主要功能是调侃、娱乐或讽刺。笑话在我们的生活中是常见的,给我们的生活带来了很多的快乐,是人们繁忙生活中的调味剂,是茶余饭后的一种谈资。笑话虽然文字不多,却富含了很多深刻的道理,更值得一提的是笑话中蕴含了很多的语言学知识。比如:笑话中通常会用谐音、修辞以及歇后语等手法来制造歧义和笑点来引人发笑。笔者试图对笑话的“搞笑体制”进行语言学阐释,以帮助我们理解笑话的运作手段,让我们笑的心里明白。 【关键词】汉语笑话、语言学分析、语音、词汇,语法、语用 零,概说 著名语言学家萨皮尔认为“每一种语言都是一种集体的表达艺术,其中隐藏着一些审美的因素——语言的、节奏的、象征的、形态的——是不能和任何别的语言全部共有的。”1我们的汉语也是同样的,汉语具有自己的特点,笔者认为对汉语笑话做研究是研究我国语言的一个很好的出发点。本文着重说明汉语的歧义与笑话的关系,以求对我们的母语中的笑话做一简要分析。文章主要分为四个方面: 一,语音中的谐音现象造成的歧义笑话 从语音层面看,语音的笑话主要依靠谐音和同音字词制造歧义以引起搞笑的效果。华东师大教授潘国文先生说:“整部汉语使用的历史,可以说是离不开对同音词现象的妙用,巧用。”2很多笑话是由于汉语的同音字谐音造成的。汉字中多音字词数量之多,是在其他语言中很难见到的。“现代汉语中常用的多音字大概有800多字。”3例如: “你看了我们的戏有何感想?” “很赶人。” “能不能说具体一点,哪场戏最感人呢?” “说不上哪场戏,反正观众看了都坐不住,争先恐后地退场。” “很赶人”中的”赶”和“很感人”的“感”谐音。一个表示能把人赶走,一个说能把人感动。导演最初听到评价的时候把“赶”听作了“感”,后面的语境告诉了我们了真正的用词,笑话的趣味也就是在这种的语境中油然而生。导演听到这时才知道自己被评论者取笑了。 吕叔湘先生认为:“很多笑话是利用同音字,也就是所谓的谐音。”4上例中的“感”和“赶”就是通过这种同音字而达到的令人发笑的效果的,正是谐音制造的歧义达到的这种搞笑效果。 我国的谐音笑话有得天独厚的生长土壤:汉语的音节数量有限,而汉字的数量较多,一个音节往往对应几个汉字甚至十几个汉字,这些特点使得汉语中有 1][美]萨皮尔,语言论[M],赵卓元译,北京:商务印书馆1985:201-202。 2潘文国《字本位与汉语研究》上海:华东师范大学出版社,2002 3邹韶华、马彪《歧义的倾向性研究》:中国社会科学出版社,2007:前言,第4页

协方差分析

协方差分析 某城市教育局在一次对全市初中一年级至高中三年级学生的调查研究中想要考察身心发展对学习成绩的影响,研究者手机了各学校初一年级至高三年级学生的学业成绩以及相关身心发展量表得分,在分析时以学生所在年级来代表年龄差异,但是由于男同学与女同学的身心发展存在差异,因此需要在结果中排除性别因素,然而无法在收集数据时只收集男同学的数据或收集女同学的数据,那么该如何排除性别因素对结果的影响呢? 在实验设计中,考虑到实际的实验情形,无法一一排除某些会影响实验结果的无关变量(干扰变量),为了排除这些不能在实验处理中所操作的变量,而其结果又会影响因变量,可以通过“统计控制”的方法来弥补实验控制的不足,为了提高实验研究的内在效率,必须将可能干扰实验结果的无关变量加以控制,不致产生严重的系统性误差。控制系统误差的方法有很多,例如以随机的方式将被试分配至不同群体;将系统误差加入实验设计,使其变成一个自变量;尽可能控制可控制的系统误差如光纤亮度、噪音等。 实验研究的优点众所周知,即其严密的逻辑性以及可以良好的控制误差,但是让一个标准的实验设计走出实验室,在社会科学领域实施通常比较困难。因此在社会科学领域中经常实施的是准实验设计,在准实验设计中无法使用实验控制法来完全控制无关的干扰变量,故经常增加实验内在效度的方法——统计控制法,最常用的便是协方差分析(analysis of covariance,ANCOV A)。 顾名思义,协方差分析是方差分析的一种,它也包括自变量与因变量,同方差分析,因变量为连续变量且需要满足方差分析关于因变量的假设条件,自变量为分类变量。不同的是,并不是实验所关注的自变量却为研究者进行控制的一类变量被加入分析,它们被称为“协变量”(covariate),要注意,协变量是连续变量。 1.协方差分析的假设 协方差分析的基本假设与方差分析相同,包括变量的正态性、观测值独立、方差齐性等,此外还有三个重要的假设: 1)因变量与协方差之间直线关系; 2)所测量的协变量不应有误差,如果选用的是多项的量表,应有高的内部一致性信度或重 测信度,α系数最好大于0.80。这一假设若被违反会造成犯一类错误的概率上升,降低统计检验力。 3)“组内回归系数同质性”(homogeneity of with in rgression),各实验处理组中一举 协变量(X)预测因变量(Y)的回归线的回归系数要相等,即斜率相等,各条回归线平行。如果斜率不等则不宜直接进行协方差分析。 2.协方差分析的方差分解 方差分析的原理是将因变量的总方差分解成自变量效果(组间)与误差效果(组内)两个部分,再进行F检验。协方差使用的也是这样的方差分析思路,将因变量的总方差先行分割为协变量可解释部分与不可解释部分,不可解释的部分再由方差分析原理进行拆解。协方差分析的方差拆解如下: 3.协方差分析的步骤 协方差分析结合了回归分析与方差分析的方法,计算方法比较复杂,由于涉及回归分析的基本思路,因此一下内容也许需要在阅读了本章第六部分“一元线性回归分析”后理解得更加透彻。 以单因素协方差分析为例说明协方差分析的步骤: 1)协方差分析的准备 (B:组间;W:组内;T:总和;n:组内样本容量;k:组间容量;x:协变量;y:因变量)

第4章方差分析

第四章方差分析 方差分析(Analysis of Variance,ANOVA)是将待分析资料的总变异剖分为不同的变异来源,以获得不同变异来源的总体方差的估计值。通过F检验,完成多个样本平均数之间的差异显著性检验(即多重比较),若处理效应为随机模型时,则进行方差组分的估计。 4.1 方差分析的SAS过程 用于方差分析的主要过程有方差分析(ANOVA)和广义线性模型(GLM)。对于无缺省(缺值、缺组等)资料,或称平衡资料,一般采用(ANOVA)过程,对缺省资料(非平衡资料)应采用(GLM)过程。事实上根据效应模型的不同,还有VARCOME(方差组分)过程,MIXED(混合模型)过程等。 4.1.1 ANOVA过程 1. 名词解释 自变量与依变量在方差分析中,自变量可称为独立变量、定性变量(Qualitative Variale)、分类变量(Classiflcation Variable)或类别变量(Categorcal Variable),相当于因素处理、水平变量。依变量又称反应变量(Response Variable),相当于观察值变量。 实验效应方差分析的目的是找出对依变量产生的实验效应,这种效应可分为3种:主效应,常以自变量的英文字母表示,如A、B等。互作效应,常以星号联接自变量表示,如A*B。嵌套效应,以小括号表示,如A(B)表示A效应嵌套在B效应之内。 2 语句说明: CLASS指令必须出现在MODEL指令之前,如选用TEST、MANOVA指令,则它们必须出现在MODEL指令之后。MEANS、TEST及MANOVA等指令可重复使用,其他指令则只能出现一次。

PROC ANOV A选项串中:⑴DA TA=输入数据集名称,指明对它执行ANOV A分析。⑵MANOV A 要求将含一个或一个以上依变量遗漏数据的观察值剔除。⑶OUTPUT=(含分析结果的)输出文件名称,包括平方和(SS),F检验值,以及各效应的显著程度。 CLASS变量名称串指明自变量,自变量可以是数值的或文字的。 MODEL指令定义分析所用的线性数学模型(见表6—1),删除号(/)后的选项:⑴NOUNI:不印出单变量方差分析的结果,适用于多变量的方差分析。⑵INT:要求SAS把线性模型内的截距(即资料的总平均数)当成一个参数,同时对这个截距作是否为零的假设检验。 MEANS指令前半部要求算出某些自变量(或互作)中各组的平均数,后半部(删除号后)共有24个选项,前17个选项分别对MEANS指令中所列的主效应平均数进行多种方法的多重比较。这些选项有:⑴BON:修正最小显著差异t检验。⑵DUNCAN:邓肯多重范围检验,即邓肯氏新复极差法。⑶DUNNETT(控制组组名):邓尼特控制差异检验。它是依据t分布由各组平均数与控制组(指定组如对照组)进行比较,采用双尾检验。⑷DUNNETTL(控制组组名):邓尼特小于控制均数检验。与控制组平均数的比较,采用单尾检验,临界值订在t分布的下端。⑸DUNNETTU(控制组组名):邓尼特大于控制均数检验。与控制组平均数的比较,采用单尾检验,临界值订在t分布的上端。⑹GABRIEL:贵博氏多重比较。⑺REGWF:R—E—G—W多重F检验。⑻REGWQ:R—E—G—W多种t检验。⑼SCHEFFE:执行沙菲氏(Scheffe)的多重比较检验。⑽SIDAK:Sidak调整T检验。⑾SUM(或⑿GTI):Sidak独立样本t检验。当两组样本含量不等时为哈氏(Hochberg)的GTI 检验。⒀SNK:纽曼—库尔多重范围检验,即q检验。⒁T(或⒂LSD):配对t检验或费歇尔最小显著差异检验。⒃TUKEY:图基固定极差检验。⒄W ALLER:娃尔—邓肯K—比率t检验。以上17种检验法最常用的为⑵、⑶、⑸、⒀、⒁。其它主要选项还有⒅ALPHA=P:界定检验的显著水准。内设值为P=0.05。当上面选项与选项⑵并用时,P值必须是0.10、0.05、0.01三者之一。与上面其他检验选项时,P可以是0.0001与0.9999间任何的值。⒆LINES:将显著性检验的平均数,由大到小排列。若某一对平均数之间无显著差异,则将它们印在同一行上,并以虚线将它们与其他有显著差异的平均数分开。当选用⑵、⑺、⑻、⒀或⒄等检验时,此选项会自动被包括在内,否则,必须附加此选项。⒇CLM:效应的各组平均数以置信区间方式表示。此项必须与⑴、⑹、⑼、⑽、⑾、⒁、⒂等联用。(21)CLDIFF:与(20)相仿,选用⑵、⑺、⑻、⒀、⒄时,附加此选项,将以置信区间方式显示各组平均数。(22)E=效应名称:它界定各显著检验的分母,缺省时以误差项的均方自动成为分母。 FREQ指令指明该变量值为各观察值重复出现的次数。 TEST指令用来指定F检验的分子与分母,H=分子,E=分母;一般而言,系统自动采用误差项的均方作为F检验的分母。但对于随机模型等,可选此项。 MANOV A指令主要用于执行多变量(多元)方差分析。 BY指令用于把数据文件分成几个小文件,然后逐一进行ANOV A分析,但文件内的数据必须先按照BY变量串的值做由小到大的重新排列。此步骤可籍PROC SORT达成。 以上指令中MODEL指令至关重要,同一资料,分析结果依模型不同而异。常用的模型定义语句有:MODEL Y=A;单因素方差分析,MODEL Y=A B两因素主效应模型,MODEL Y=A B A*B两因素带互作模型,MODEL Y=A B(A)嵌套(NESTED)模型用

语言学概论语言学的应用讲稿

语言学概论语言学的应用讲稿 语言学的研究成果可以用于解决生活中的实际问题。研究语言研究成果的实际应用问题的学科叫做应用语言学。应用语言学主要包括语言学习和语言信息处理两个方面。 第一节语言学习 一、语言学习 语言学习指掌握语言的过程,包括语言习得和语言学得。语言习得是指在自然交际中通过模仿、直觉等非有意识地掌握语言的过程。语言学得是指通过听说读写的练习和死记硬背等有意识地掌握语言的过程。儿童掌握母语的前期主要靠习得,后期也需要靠学得。成人学习外语的前期主要靠学得,后期也需要某种程度的习得。 母语学习又叫第一语言学习,外语学习又叫第二语言学习。 二、第一语言学习 (一)儿童语言习得的过程和原因 儿童语言习得的研究主要包括两个方面:一个是儿童学会说话和理解别人说话经过了哪些阶段和步骤,这就是“语言习得过程”的问题;另一个是儿童学会说话和理解别人说话是由什么原因和条件决定的,这就是“语言习得原因”的问题。前者更多的是一种对“其然”的观察,后者则主要是一种对“其所以然”的解释。目前对前一个问

题的看法基本一致,而在后一个问题上的争论还比较多。 先讨论第一个问题,即儿童语言习得的过程,或者通常所谓学会说话的过程。 儿童当然不是一生下来就具有了完备的语言能力,他们从完全不会说话到基本会说话要经历一段较长的时间,通常到五岁左右才能跟大人差不多一样地说话。这段时间里儿童怎么一步一步听懂别人说话和能自己说话,或者说怎么一步一步更接近成人的语言,这就是儿童的语言习得过程。每个儿童出生的地点可能不同,出生后接触的语言环境也可能不同,儿童最早开始说话的时间和儿童智力的发展也多少有些差异。但经过大量的观察和实验发现,儿童的语言习得大致还是相同的。即一般首先需要有一个语言前阶段,其中包括非自控阶段和咿呀学语阶段;然后才进入真正的语言阶段,其中又大致可分为单词阶段,双词阶段,实词与实词连接的简单句阶段,实词与虚词连接的复杂句阶段。这些阶段中有的持续时间较短,有的则持续时间稍长些,有的不同阶段在一个短时间内可能前后交叉,但阶段之间的转变还是十分明显的,甚至孩子的父母都能感觉得到。当然阶段的划分也可以用不同的标准,比如上面的划分主要是以儿童说话的现象为标准,而实际上儿童听的能力往往都要早于说的能力,或者说理解句子的能力往往要早于构造句子的能力。另外,儿童语音、语义和语法的发展也是有先后的。儿童语音能力的发展要早于语义和语法能力的发展。但语法能力的发展则肯定是观察儿童语言习得过程的最主要的线索。把这些综合起来,儿童语言习得的过程可以大致划分为以下几个阶段:

应用语言学的学科体系

应用语言学的学科体系 应用语言学研究领域十分广泛,并且随着语言应用领域的不断发展,应用语言学的新的研究对象即新的分支学科在不断产生。那么怎样来看待应用语言学的学科结构呢?或者说应用语言学的主要研究对象、研究领域是哪些呢? (一)国外应用语言学的主要研究领域 由于语言学在社会生活中的应用领域十分广泛,因而应用语言学从早期单一的研究对象发展到今天已经形成内容十分广泛丰富的研究领域。早期的应用语言学或传统的、狭义应用语言学专指语言教学,尤其特指第二语言教学,而目前应用语言学的研究对象可以说丰富多样、琳琅满目,研究范围日益扩大,如“国际应用语言学协会”设有19个科学委员会,即有19个研究领域,分别是:成人语言教学、应用计算语言学、儿童语言学、对比语言学与偏误分析、言谈分析、教育技术与语言培训、多语环境下的语言教育、语言与性别、特殊用途的语言(如聋哑人的手势语)、语言规划、语言测试、词典编纂与词汇学、母语教育、心理语言学、修辞学与风格学、第二语言习得、社会语言学、术语学、翻译等。像1996年召开的第11届国际应用语言学会议设有多个议题,如语言教学、心理语言学、社会语言学、语段学、语用学、语言测试与评估、翻译理论与实践、自然语言信息处理、语言与科技、语言文化学、生态语言学等等。 (二)我国应用语言学的研究领域 目前在我国,应用语言学的研究对象既包括语言教学、语言文字规划、词典学、人名学和地名学等传统的研究领域,也包括社会语言学、心理语言学、神经语言学、病理语言学、计算语言学、人类语言学、语言风格学、语言测试、术语学、计算语言学(包括语言信息处理)、儿童语言习得、翻译学、言语交际学、传播语言学(广播、电影、电视、报刊等新闻媒体语言以及广告语言、网络语言等)、法律语言学、刑侦语言学、体态语等研究领域。总之,对应用语言学的研究对象应该持一种开放的态度,随着语言应用领域的扩展,应用语言学的研究领域也必将随之拓展。 据刘春艳(2005)的统计,在《语言文字应用》杂志1992年第1期到2003年第4期中,从所发表的论文来看共涉及29个研究领域,除了词汇研究、汉字研究、语法研究、语言修辞研究、语音语义研究、语用研究、杂感、治学方法等不属于真正意义上的应用语言学研究领域外,其他21个研究领域都可以看作是应用语言学的研究对象,分别是:辞书研究、对外汉语教学研究、儿童语言研究、翻译研究、港澳台语文研究、计算语言学、普通话及推普研究、社会语言学、神经语言学、中介语研究、文化语言学、学科研究、语感研究、语文学习与教学研究、语言风格研究、语言规范研究、语文规划研究、语言立法、语言市场调查研究、语言应用、新词新语研究等。从这些丰富多彩的研究领域来看,我国的应用语言学研究在研究对象和研究领域上已经接近于外国的应用语言学。

23. 协方差分析

23. 协方差分析 一、基本原理 1. 基本思想 在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响。如果忽略这些因素的影响,则有可能得到不正确的结论。这种影响的变量称为协变量(一般是连续变量)。 例如,研究3种不同的教学方法的教学效果的好坏。检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响。 协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对于观察变量的影响,从而实现对控制变量效果的准确评价。 协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。 协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行。 当有一个协变量时,称为一元协方差分析,当有两个或两个以上

的协变量时,称为多元协方差分析。 2. 协方差分析需要满足的条件 (1)自变量是分类变量,协变量是定距变量,因变量是连续变量;对连续变量或定距变量的协变量的测量不能有误差; (2)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设;协变量的回归系数(即各回归线的斜率)是相同的,且不等于0,即各组的回归线是非水平的平行线。否则,就有可能犯第一类错误,即错误地接受虚无假设; (3) 自变量与协变量相互独立,若协方差受自变量的影响,那么协方差分析在检验自变量的效应之前对因变量所作的控制调整将是偏倚的,自变量对因变量的间接效应就会被排除; (4)各样本来自具有相同方差σ2的正态分布总体,即要求各组方差齐性。 二、协方差理论 1. 观测值=均值+分组变量影响+协变量影响+随机误差. 即 ()ij i ij ij y u t x x βε=++-+ (1) 其中,X 为所有协变量的平均值。 注:在方差分析中,协变量影响是包含在随机误差中的,在协方差分析中需要分离出来。 用协变量进行修正,得到修正后的y ij (adj)为 (adj)()ij ij ij i ij y y x x u t βε=--=++

应用语言学概论

应用语言学概论 一、绪论 语言应用研究的意义 应用语言学学科建立前的情况 提出: 19世纪末,波兰J、N、博杜恩·德·库尔德内提出了应用语言学这个概念。独立的应用语言学学科形成的标志就是1964年第一届国际应用语言学大会在法国召开与国际应用语言学会的成立。中国应用语言学学科形成的标志就是:1984年语言文字应用研究所成立,1992年《语言文字应用》杂志创刊,1995年首届全国语言文字应用学术研讨会举行与中国应用语言学会的筹建。 中国语言学的发展: 1、1898年马建忠的语法书《马氏文通》就是中国形成独立的语言学学科的标志,第一部系统地研究汉语语法的书。 2、19世纪与20世纪之交,我国的传统语文学进入语言学阶段,主要就是我国传统语文学自身发展的结果。 3、传统语文学真正摆脱经学附庸,发展成一门独立的语言文字学始于章炳麟,她的《文始》就是中国语言学史上第一本有理论有系统的语源学著作。她为“语言文字学”定名,提出语言文字发生发展的理论,汉语与汉字形、音、义结合的理论,语言文字进化、统一的理论。中国语言文字应用研究(大体经历三个时期): 1、19世纪与20世纪之交,我国语言学进入现代语言学,或从传统语文学进入语言学。 2、20世纪初到新中国成立前,主要就是围绕白话文运动开展。可概括为三个运动:白话文运动(白话文取得书面语的正统地位)、大众语运动、国语运动 3、新中国成立初到实行改革开放(1949——1978《中国语文》复刊),主要围绕语文知识大普及开展的。 应用语言学学科形成到现在的情况 中国应用语言学学科形成的标志就是:1984年9月语言文字应用研究所成立。 1984年前后的背景,一就是语言文字工作决策要进一步科学化;二就是语言科学研究要进一步为国家建设服务;三就是新兴的交叉学科要进一步发展。 《语言文字应用》创刊后,我国的应用语言学界有了发表学术成果、进行学术交流的阵地。 《中国人民共与国国家通用语言文字法》就是我国历史上第一部关于语言文字的法律,其颁行标志着我国的国家通用语言文字的使用将走上法制的轨道。 应用语言学学科的任务与本课程的目的 我国应用语言学学科形成的三个背景决定了我国应用语言学学科的任务,即:1、解决语言应用各方面的实际问题;2、解决决策问题;3、促进学科本身的发展。 总体来瞧,应用语言学可以分为四大块:语言教学、语言与现代科技的结合、广义的社会语言学、语言规划、 应用语言学首要任务之一就是确定应用语言学研究的对象与范围;其次就是语言以及语言应用的理论的研究;再次要关注解决实际问题;最后还有学科建设例如队伍的培养等问题。 本课程的目的同它的性质有关,一就是基础课,二就是包含许多基础理论。

方差分析和回归分析的区别与联系

一、方差分析和回归分析的区别与联系?(以双变量为例) 联系: 1、概念上的相似性 回归分析是为了分析变量间的因果关系,研究自变量X取不同值时,因变量平均值Y的变化。运用回归分析方法,可以从变量的总偏差平方和中分解出已被自变量解释掉的误差(解释掉误差)和未被解释掉的误差(剩余误差); 方差分析是为了分析或检验总体间的均值是否有所不同。通过对样本中自变量X取不同值时所对应的因变量Y均值的比较,推论到总体变量间是否存在关系。运用方差分析,也可以从变量的总离差平方和中分解出已被自变量解释掉的误差和未被自变量解释掉的误差。因此两种分析在概念上所具有的相似性是显而易见的。 2、统计分析步骤的相似性 回归分析在确定自变量X是否为因变量Y的影响因素时,从分析步骤上先对X和Y进行相关分析,然后建立变量间的回归模型。最后再进行参数的统计显着性检验或对回归模型的统计显着性进行检验。 方差分析在确定X是否是Y的影响因素时,是先从样本所的数据的分析入手,然后考察数据模型,最后对样本均值是否相等进行显着性检验。二者在分析步骤上也具有相似性。 3、假设条件具有一定的相似性 回归分析有五个基本假定,分别是:自变量可以是随机变量也可以是非随机变量;X与Y之间存在的非确定性的相关关系,要求Y的所有子总体,其方差都相等;子总体均值在一条直线上;随机变量Y i是统计独立的,即Y1的数值不影响Y2的数值,各Y值之间都没有关系;Y 值的每一个子总体都满足正态分布。 方差分析的基本假定有:等方差性(总体中自变量的每一取值所对应因变量Y i的分布都具有相同方差);Y i的分布为正态分布。 二者在假设条件上存在着相同。 4、在总离差平方和中的分解形式和逻辑上的相似性 回归分析中,TSS=RSS+RSSR,而在方差分析中,TSS=RSS+BSS。二者均是以已解释掉的误差与未被解释掉的误差之和为总离差平方和。 5、确定影响因素上的相似性 为简化分析起见,我们假设只有一个自变量X影响因变量Y。在回归分析中,要确定X是否是Y 的影响因素,就要看当X已知时,对Y的总偏差有无影响。如果X不是影响Y的因素,等同于只知变数Y的数据列一样,此时用Y去估计每个丫的值,所犯的错误(即偏差)为最小。如果因素X 是影响Y的因素,那么当已知X值后 6、在统计显着性检验上具有相似性 回归分析的总显着性检验,是一种用R2测量回归的全部解释功效的检验。检验RSSR*(N-2)/RSS,方差分析的显着性检验是一种根据样本数据提取信息所进行的显着性检验。它也是通过F检验进行的。 区别: 1、研究变量的分析点不同 回归分析法既研究变量Y又研究变量X并在此基础上集中研究变量Y与X的函数关系,得到的是在不独立的情况下自变量与因变量之间的更加精确的回归函数式,也即判断相关关系的类型,因此需建立模型并估计参数。方差分析法集中研究变量Y的值及其变差而变量X值仅用来把Y值划分为子群或组,得到的是自变量(因素)对总量Y是否具有显着影响的整体判断,因此不需要建立模型和估计参数。

SPSS学习系列23. 协方差分析

23. 协方差分析 (一)原理 一、基本思想 在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响。如果忽略这些因素的影响,则有可能得到不正确的结论。这种影响的变量称为协变量(一般是连续变量)。 例如,研究3种不同的教学方法的教学效果的好坏。检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响。 协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对于观察变量的影响,从而实现对控制变量效果的准确评价。 协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。 协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行。 当有一个协变量时,称为一元协方差分析,当有两个或两个以上

的协变量时,称为多元协方差分析。 二、协方差分析需要满足的条件 (1)自变量是分类变量,协变量是定距变量,因变量是连续变量;对连续变量或定距变量的协变量的测量不能有误差; (2)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设;协变量的回归系数(即各回归线的斜率)是相同的,且不等于0,即各组的回归线是非水平的平行线。否则,就有可能犯第一类错误,即错误地接受虚无假设; (3)自变量与协变量相互独立,若协方差受自变量的影响,那么协方差分析在检验自变量的效应之前对因变量所作的控制调整将是偏倚的,自变量对因变量的间接效应就会被排除; (4)各样本来自具有相同方差σ2的正态分布总体,即要求各组方差齐性。 三、基本理论 1. 观测值=均值+分组变量影响+协变量影响+随机误差. 即 ()ij i ij ij y u t x x βε=++-+(1) 其中,X 为所有协变量的平均值。 注:在方差分析中,协变量影响是包含在随机误差中的,在协方差分析中需要分离出来。 用协变量进行修正,得到修正后的y ij (adj)为 (adj)()ij ij ij i ij y y x x u t βε=--=++ 就可以对y ij (adj)做方差分析了。关键问题是求出回归系数β.

相关主题
文本预览
相关文档 最新文档