第六章相关系数检验
- 格式:doc
- 大小:84.50 KB
- 文档页数:3
第六章 相关系数检验一般来说,在回归模型的基本假设中,有一个假设条件是最为重要的,这就是假设变量之间在概率意义上存在线性关系;亦即)(i Y E =i X βα+或)(i E μ=0。
这里的“概率意义”,虽说与确定意义有差别,但由于概率意义的前提必须承认规律的存在;故我认为,这里的“线性关系”与确定意义下的“线性关系”并无根本性的区别。
因此,我们可以说,概率意义上的线性关系仍是一般意义上的线性思路或方法,只是分析的条件有所放松而已。
现在我们要问,在建立回归模型时,这个假设条件成立吗?显然需要进行检验,需要建立一种检验方法。
6·1、建立相关系数检验方法的基本思路实际上,建立相关系数检验方法的基本思路是较为简单和清晰的。
其基本思路是:建立一种方法(2R ),希望此方法在测定被解释变量Y 的总的变化中,推出回归直线能够解释的部分有多大;即通过两者之比的大小,来推断回归模型效果的好坏。
下面简要介绍其方法的建立过程:首先,我们有Y 的总的变化可表示为 : Y Y y i i -=回归直线能够解释的部分: Y Y y ii -=ˆˆ 由此我们可以得到,回归直线没有(或不能)解释的部分为:i i i Y Y e ˆ-= 因而我们有Y 的总的变差=∑∑∑++=+=)ˆ2ˆ()ˆ(2222i i i i i i i e e y y e yy 其中,)(ˆ)ˆ(ˆ)ˆ)(ˆ(ˆ222∑∑∑∑∑∑∑-=-=-=iii i i i i i i i i i i i xx y x y x x y x x y x e y βββββ=0(注意:i i i i x X Y Y y X Y X Y ββαβαβαβαˆˆˆˆˆˆˆ,ˆˆ,ˆˆ=---=-=∴+=∴-= ,另外 i i i i i i i x y y y Y Y e βˆˆˆ-=-=-=)。
所以,我们最终有Y 的总的变差==∑∑∑∑+=++=+=)ˆ()ˆ2ˆ()ˆ(222222i i i i i i i i i e y e e y y e yy 亦即,Y 的总的变差=回归直线能够解释的部分部分+回归直线不能够解释的部分显然这个结论是十分重要的,在计量经济学中已有许多类似的结果。
第六章 相关与回归分析思考与练习一、判断题1.产品的单位成本随着产量增加而下降,这种现象属于函数关系。
答:错。
应是相关关系。
单位成本与产量间不存在确定的数值对应关系。
2.相关系数为0表明两个变量之间不存在任何关系。
答:.错。
相关系数为零,只表明两个变量之间不存在线性关系,并不意味着两者间不存在其他类型的关系。
3.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。
答:对,因果关系的判断还有赖于实质性科学的理论分析。
4.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。
答:错。
两者是精确的函数关系。
5.总体回归函数中的回归系数是常数,样本回归函数中的回归系数的估计量是随机变量。
答:对。
6.当抽取的样本不同时,对同一总体回归模型估计的结果也有所不同。
答:对。
因为,估计量属于随机变量,抽取的样本不同,具体的观察值也不同,尽管使用的公式相同,估计的结果仍然不一样。
二、选择题1.变量之间的关系按相关程度分可分为:b 、c 、da.正相关;b. 不相关;c. 完全相关;d.不完全相关; 2.复相关系数的取值区间为:aa. 10≤≤R ;b.11≤≤-R ;c.1≤≤∞-R ;d.∞≤≤-R 1 3.修正自由度的决定系数a 、b 、da.22R R ≤; b.有时小于0 ; c. 102≤≤R ;d.比2R 更适合作为衡量回归方程拟合程度的指标 4.回归预测误差的大小与下列因素有关:a 、b 、c 、da 样本容量;b 自变量预测值与自变量样本平均数的离差c 自变量预测误差;d 随机误差项的方差三、问答题1.请举一实例说明什么是单相关和偏相关?以及它们之间的差别。
答:例如夏季冷饮店冰激凌与汽水的消费量,简单地就两者之间的相关关系进行考察,就是一种单相关,考察的结果很可能存在正相关关系,即冰激凌消费越多,汽水消费也越多。
然而,如果我们仔细观察,可以发现一般来说,消费者会在两者中选择一种消费,也就是两者之间事实上应该是负相关。
第六讲相关关系课时安排:6课时教学课型:理论课,课堂同步练习教学目的要求:理解相关分析的意义与条件;熟练掌握积差相关法的基本思想与分析方法;熟练掌握等级相关、点二列相关、二列相关及φ相关的使用前提与分析方法;能应用各种相关解决实际问题。
教学重点与教学难点:重点——积差相关的意义与应用;难点——各种相关方法的选择应用教学方法、手段、媒介:讲授、教材、板书、多媒体教学过程与教学内容:第一节相关与相关系数 (2)第二节积差相关 (8)第三节等级相关 (14)第四节质与量的相关 (22)第五节品质相关——φ相关 (25)本章小结 (28)学习目标:1.理解相关分析的意义与条件2.熟练掌握积差相关法的基本思想与分析方法(重点)3.熟练掌握等级相关、点二列相关、二列相关及φ相关的使用前提与分析方法(难点)4.能应用各种相关解决实际问题问题导入:在学校、社会及家庭教育中,人们常常会遇到一些涉及事物关系的问题,譬如学生品德与家庭教育的关系,个体的智力水平高低与成绩的关系,学生身高与体重的关系,各科成绩之间的关系,人的兴趣爱好与学科成绩的关系,一般能力与特殊能力的关系,智力与创造力的关系,教育经费投入与教学效果的关系等等。
对这些问题的解释需要借助相关分析的方法进行说明。
客观世界涉及事物关系的问题比比皆是。
然而,我们在前几章所处理的数据均属单—变量范围的,即分析一种变量及其取值的分布情况与特征,属单变量的分析。
而涉及事物的关系的时候,至少要有两个变量,分析或研究两个或两个以上变量之间相互关系的量数称相关量数。
第一节 相关与相关系数一、事物的关系与相关量数事物或现象之间的关系大致可分为三种类型:一是因果关系:这种关系说明的是事物之间互相依存、互为因果的关系,是事物之间存在的一种必然关系,即一种引起与被引起的关系,因在前果在后的顺序是不能颠倒的。
二是函数关系(共变关系):这是事物之间的一种共变关系,其特点是函数与反函数可以互换位置。
相关系数检验实习自我鉴定在这次相关系数检验实习中,我作为实习生发挥了积极的参与和学习态度。
以下是我对自己在该实习中的表现的自我鉴定:首先,在实习过程中,我认真学习了相关系数检验的理论知识和实际操作方法。
在实习开始之前,我主动查阅了相关的资料,并与导师进行了交流,以确保自己对相关系数检验有了充分的了解和掌握。
这使得我能够在实习中准确地应用所学知识,进行数据处理和分析。
其次,我能够熟练地使用统计软件进行相关系数检验的计算和结果解释。
在实习中,我积极地使用SPSS等统计软件进行数据处理和分析,准确计算出相关系数,并能够解读和描述相关系数的意义和结果。
通过实际操作,我对统计软件的使用也有了更深入的认识和掌握。
此外,我在实习期间能够合理安排时间和任务,高效完成所分配的实习工作。
我能够根据实习的要求,制定合理的计划,并按照计划有条不紊地进行工作。
我深知时间的宝贵性,并且在实习中将时间合理分配,保证了实习任务的顺利完成。
最后,我还能够积极与同事和导师进行沟通和合作。
在实习过程中,我乐于分享自己的想法和经验,并尊重他人的意见和建议。
我经常与同事和导师进行讨论和交流,共同提高和解决问题。
通过这种合作和沟通,我不仅加深了对相关系数检验的理解,还学到了其他实习者的经验和见解。
总的来说,我认为自己在这次相关系数检验实习中表现出了良好的学习态度和实习能力。
通过理论学习和实践操作,我对相关系数检验有了更深入的理解和掌握,并能够灵活运用统计软件进行数据处理和分析。
我在实习中也充分发挥了团队合作和沟通能力,与他人合作,取得了良好的实习成果。
在未来的学习和工作中,我将继续努力提高自己的相关系数检验能力,并将这次实习中的经验应用到实际工作中去。
相关系数法相关系数是一种统计分析方法,用于衡量两个变量之间的关系强度和方向。
它的值在-1到1之间,接近-1表示负相关,接近1表示正相关,接近0表示无相关。
在实际应用中,相关系数可以帮助研究者了解变量之间的关系,从而做出合理的判断和决策。
下面将介绍一些常见的相关参考内容。
首先,相关系数可以用于研究两个变量之间的线性关系。
如果相关系数接近于1,说明两个变量之间存在强正相关关系。
例如,有研究发现,身高和体重之间的相关系数接近于1,这意味着身高越高的人往往体重也较大。
其次,相关系数还可以用于研究两个变量之间的非线性关系。
实际上,相关系数可以衡量任何类型的两个变量之间的关系,只要它们之间的关系可以用数值来表示。
例如,研究者可以计算气温和冷饮销量之间的相关系数,以了解它们之间的关系。
此外,相关系数还可以用于预测和建模。
通过计算历史数据中的相关系数,可以确定变量之间的关系模式,并将其用于未来的预测。
例如,经济学家可以计算CPI(消费者价格指数)和GDP(国内生产总值)之间的相关系数,从而预测未来的通胀水平。
相关系数也可以用于比较不同组别或样本之间的关系。
研究者可以计算不同地区、不同年龄段或不同性别之间的相关系数,以了解它们之间的关系差异。
例如,研究者可以比较男性和女性之间的相关系数,以了解性别在某个变量上的影响程度。
此外,相关系数还可以用于探索变量之间的因果关系。
尽管相关系数不能证明因果关系,但它可以提供一些提示。
如果两个变量之间存在较强的相关性,并且时间上的顺序关系合理,那么可以初步推断它们之间可能存在因果关系。
例如,研究者可以计算失业率和犯罪率之间的相关系数,以了解经济状况对犯罪率的影响。
综上所述,相关系数是一种有用的统计分析工具,可以帮助研究者理解变量之间的关系。
通过计算相关系数,研究者可以得到有关变量关系强弱、方向和形式的信息,从而做出科学合理的决策。
相关系数的显著性检验相关系数的显著性检验也包括两种情况:一种情况是样本相关系数r与总体相关系数ρ的比较;另一种情况是通过比较两个样本r的差异(r1-r2)推论各自的总体ρ1和ρ2是否有差异。
一、相关系数的显著性检验相关系数的显著性检验即样本相关系数与总体相关系数的差异检验。
由于相关系数r的样本分布比较复杂,受ρ的影响很大,一般分为ρ=0和ρ≠0两种情况(一)ρ≠0时图7—11样本相关系数r的分布图7—11表示从ρ=0及ρ=.8的两个总体中抽样(n=8)样本r的分布。
可看到ρ=0时r的分布左右对称,ρ=.8时r的分布偏得较大。
对于这一点并不难理解,ρ的值域-1~+1,r的值域也是-1~+1,当ρ=0时,的分布理应以0为中心左右对称。
而当ρ=0.8时,r的范围仍然是-1~+1,但r值肯定受ρ的影响,趋向+'的值比趋向+1的值要出现得多些,因而分布形态不可能对称。
所以,一般认为ρ=0时r的分布近似正态;ρ≠0时r的分布不是正态。
在实际研究中得到r=.30(或其他什么值)时,自然会想到两种情况:①由于r=.30,说明两列变量之间在总体上是相关的(ρ≠0)。
②虽然r=.30,但这可能是偶然情况,总体上可能并无相关(ρ=0)。
所以需要对r=.30进行显著性检验。
这时仍然可以用t检验的方法。
H0:ρ=0H1:ρ≠0(df=n-2)(2-27)如果t>t.05/2,则拒绝H0,说明所得到的r不是来自ρ=0的总体,或者说r是显著的。
若t< t.05/2,则说明所得到的r值具有偶然性,从r值还不能断定总体具有相关关系。
或者说r不显著。
[例1]18名被试进行了两种能力测验,结果r=.40,试问这两种能力是否存在相关解:H0:ρ=0H1:ρ≠0查附表2,t.05/2=2.12t=1.798<2.12不能拒绝H0所以r=.40并不显著,即不能推翻ρ=0的假设。
在实际应用中,更多地是直接查表来断定r是否显著。
相关系数检验一、相关系数简介相关系数是用以衡量两个变量之间的关联程度的统计学指标。
在实际数据分析中,相关系数检验是一种常用方法,用来验证变量之间的相关性是否显著。
二、Pearson相关系数Pearson相关系数是衡量两个连续变量之间线性关联程度的指标,范围在-1到1之间。
当相关系数接近1时,表示两个变量呈正相关;当相关系数接近-1时,表示两个变量呈负相关;相关系数接近0时,表示两个变量之间没有线性关系。
三、相关系数检验步骤1.提出假设:零假设为“两个变量之间不存在相关性”,备择假设为“两个变量之间存在相关性”。
2.计算相关系数:使用统计软件计算得到两个变量的Pearson相关系数。
3.确定显著性水平:选择适当的显著性水平α,一般取0.05。
4.计算临界值:根据显著性水平和样本容量自由度,查找相关系数的临界值。
5.判断显著性:比较计算得到的相关系数和临界值,若计算得到的相关系数显著大于临界值,则拒绝零假设,否则接受零假设。
四、案例分析以两种肥胖度评价方法为例,比较其与BMI指数之间的相关系数。
假设零假设为两种肥胖度评价方法与BMI指数之间不存在相关性,备择假设为存在相关性。
通过数据收集和计算得到相关系数后,进行相关系数检验,判断两种评价方法与BMI指数之间的关联程度是否显著。
五、结论相关系数检验是一种常用的统计方法,用来验证两个变量之间的相关性是否显著。
在实际数据分析中,通过计算相关系数并进行显著性检验,可以帮助我们理解变量之间的关联程度,从而做出合理的推断和决策。
以上是关于相关系数检验的简要介绍和步骤说明,希望能对您有所帮助。
相关系数检验法步骤一、相关系数检验法步骤相关系数检验法是一种用于检验两个变量之间关系强度的统计方法。
它可以衡量两个变量之间的相关性,并判断这种相关性是否显著。
以下是相关系数检验法的步骤:1. 收集数据:首先,需要收集相关的数据,包括两个变量的观测值。
这些数据可以通过实地调查、实验或其他可靠的数据源获得。
2. 计算相关系数:接下来,需要计算两个变量之间的相关系数。
常用的相关系数包括皮尔逊相关系数和斯皮尔曼相关系数。
皮尔逊相关系数适用于连续变量,而斯皮尔曼相关系数适用于等级变量或非线性关系。
3. 假设检验:在进行相关系数检验前,需要先建立假设。
通常,零假设为两个变量之间不存在相关关系,备择假设为两个变量之间存在相关关系。
4. 计算检验统计量:根据所选的相关系数和样本大小,计算相关系数的检验统计量。
检验统计量的计算方式与所选的相关系数有关。
5. 确定显著性水平:确定显著性水平,通常将其设定为0.05或0.01。
显著性水平表示拒绝零假设的临界值。
6. 判断是否拒绝零假设:将计算得到的检验统计量与显著性水平进行比较。
如果检验统计量的值小于显著性水平对应的临界值,则拒绝零假设,认为两个变量之间存在相关关系;如果检验统计量的值大于临界值,则接受零假设,认为两个变量之间不存在相关关系。
7. 解释结果:最后,根据检验结果对两个变量之间的相关性进行解释。
如果拒绝了零假设,可以说明两个变量之间存在相关关系,并根据相关系数的值来判断相关关系的强度和方向。
二、相关系数检验法的应用相关系数检验法广泛应用于各个领域的研究中。
以下是一些常见的应用场景:1. 经济学研究:在经济学中,相关系数检验法常用于分析不同变量之间的关系,如GDP与失业率、通货膨胀与利率等。
通过相关系数检验,可以了解变量之间的关系强度,为经济政策的制定提供依据。
2. 市场营销研究:在市场营销领域,相关系数检验法可以用来分析产品销售与广告投入、价格变动等因素之间的关系。
相关分析方法地理要素之间相互关系密切程度的测定,主要是通过对相关系数的计算与检验来完成的。
1. 两要素之间相关程度的测定1) 相关系数的计算与检验(1) 相关系数的计算相关系数——表示两要素之间的相关程度的统计指标。
对于两个要素x与y,如果它们的样本值分别为xi与yi(i=1,2,...,n),它们之间的相关系数:,r xy>0,表示正相关,即同向相关;rxy<0,表示负相关,即异向相关。
的绝对值越接近于1,两要素关系越密切;越接近于0,两要素关系越不密切。
■ 若记:则:■ 若问题涉及到x1,x2,…,xn等n个要素,多要素的相关系数矩阵:[相关系数矩阵的性质][举例说明]例1:中国1952~1999年期间的国内总产值(GDP)及其各次产业构成数据如表3.1.1(单击显示该表)所示。
试计算GDP与各次产业之间的相关系数及相关系数矩阵。
解:(1) 将表3.1.1中的数据代入相关系数计算公式计算,得到国内生产总值(GDP)与第一、二、三产业之间的相关系数分别为0.9954,0.9994,0.9989。
(2) 根据表3.1.1中的数据,进一步计算,得到国内生产总值及一、二、三产业之间的相关系数矩阵:(2) 相关系数的检验一般情况下,相关系数的检验,是在给定的置信水平下,通过查相关系数检验的临界值表来完成。
表3.1.2(点击显示该表)给出了相关系数真值(即两要素不相关)时样本相关系数的临界值[临界值表说明]2) 秩相关系数的计算与检验(1) 秩相关系数的计算秩相关系数——是描述两要素之间相关程度的一种统计指标,是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。
实际上,它是位次分析方法的数量化。
设两个要素x和y有n对样本值,令R1代表要素x的序号(或位次),R2代表要素y的序号(或位次),代表要素x和y的同一组样本位次差的平方,则要素x和y之间的秩相关系数被定义为(2) 秩相关系数的检验与相关系数一样,秩相关系数是否显著,也需要检验。
相关性检验的知识要点(1)相关系数r 的定义对于变量x 与y 随机抽取到的n 对数据11(,)x y ,22(,)x y ,……,(,)n n x y ,称()()nn i ii i x x y y x y nx y r ---==∑∑x 与y 的样本相关系数。
(2)相关系数r 的作用样本相关系数r 用于衡量两个变量之间是否具有线性相关关系,描述线性相关关系的强弱:①||1r ≤越接近1,表明两个变量之间的线性相关程度越强;越接近0,表明两个变量之间的线性相关程度越弱。
②当r >0时,表明两个变量正相关, 即x 增加,y 随之相应地增加,若x 减少,y 随之相应地减少.当r <0时,表明两个变量负相关, 即x 增加,y 随之相应地减少;若x 减少,y 随之相应地增加.若r=0,则称x 与y 不相关。
③当||0.75r >,认为x 与y 之间具有很强的线性相关关系。
④当大于时,表明有95%的把握认为x 与y 之间具有线性相关关系,这时求回归直线方程有必要也有意义,当0.05||r r ≤时,寻找回归直线方程就没有意义。
(3)利用相关系数r 检验的一般步骤:法一:①作统计假设:x 与y 不具有线性相关关系。
②根据样本相关系数计算公式算出r 的值。
③比较与的大小关系,得出统计结论。
如果||0.75r >,认为x 与y 之间具有很强的线性相关关系。
法二:①作统计假设:x 与y 不具有线性相关关系。
②根据样本相关系数计算公式算出r 的值。
③根据小概率与n-2在相关性检验的临界值表中查出r 的一个临界值(n 未数据的对数)。
④比较与,作统计推断,如果0.05||r r >,表明有95%的把握认为x 与y 之间具有线性相关关系。
如果0.05||r r ≤,我们没有理由拒绝原来的假设,即不认为x 与y 之间具有线性相关关系。
这时寻找回归直线方程是毫无意义的。
第六章 相关系数检验
一般来说,在回归模型的基本假设中,有一个假设条件是最为重要的,这就是假设变量之间在概率意义上存在线性关系;亦即)(i Y E =i X βα+或)(i E μ=0。
这里的“概率意义”,虽说与确定意义有差别,但由于概率意义的前提必须承认规律的存在;故我认为,这里的“线性关系”与确定意义下的“线性关系”并无根本性的区别。
因此,我们可以说,概率意义上的线性关系仍是一般意义上的线性思路或方法,只是分析的条件有所放松而已。
现在我们要问,在建立回归模型时,这个假设条件成立吗?显然需要进行检验,需要建立一种检验方法。
6·1、建立相关系数检验方法的基本思路
实际上,建立相关系数检验方法的基本思路是较为简单和清晰的。
其基本思路是:建立一种方法(2R ),希望此方法在测定被解释变量Y 的总的变化中,推出回归直线能够解释的部分有多大;即通过两者之比的大小,来推断回归模型效果的好坏。
下面简要介绍其方法的建立过程:
首先,我们有
Y 的总的变化可表示为 : Y Y y i i -=
回归直线能够解释的部分: Y Y y i
i -=ˆˆ 由此我们可以得到,回归直线没有(或不能)解释的部分为:i i i Y Y e ˆ-= 因而我们有
Y 的总的变差=∑∑∑++=+=)ˆ2ˆ()ˆ(2
2
22
i i i i i i i e e y y e y
y 其中,)(ˆ)ˆ(ˆ)ˆ)(ˆ(ˆ2
22∑∑∑∑∑∑∑-
=-=-=i
i
i i i i i i i i i i i i x
x y x y x x y x x y x e y βββββ
=0
(注意:i i i i x X Y Y y X Y X Y ββαβαβαβαˆˆˆˆˆˆˆ,ˆˆ,ˆˆ=---=-=∴+=∴-= ,另外 i i i i i i i x y y y Y Y e βˆˆˆ-=-=-=)。
所以,我们最终有
Y 的总的变差==∑∑∑∑+=++=+=)ˆ()ˆ2ˆ()ˆ(2
2
2
2
22
i i i i i i i i i e y e e y y e y
y 亦即,
Y 的总的变差=回归直线能够解释的部分部分+回归直线不能够解释的部分
显然这个结论是十分重要的,在计量经济学中已有许多类似的结果。
没有这样的结果,我们的方法就建立不起来,也没有什么意义了。
我们也应进一步思考,为什么会有这样好的结果呢?这实际上正是线性方法或线性思想的特征或优势所在。
6·2、相关系数的计算和特征
根据建立相关系数的基本思路,我们用2R 表示相关系数,则有
2R =已由解释变量说明的部分÷Y
的总的变差
=∑∑∑∑∑∑-
=--=
222
2221)
()ˆ(ˆi
i
i
i i
i y
e Y Y Y Y y
y
由此可知:
当i i Y Y =ˆ时,2R 达到最大值,即2R =1; 当Y Y i =ˆ时,2R 达到最小值,即2R =0; 所以 102≤≤R 。
2R 还能够写成其它形式,如
i
i x y βˆˆ= ,代入 ∑∑
∑∑=
i
i i
i
y
x y
y 2
222ˆˆβ ,而∑∑=i
i
i x
y
x 2ˆβ
,再代入则有
∑∑∑∑∑∑∑∑∑
∑∑=
⋅
=
=
=
)
)(()()()(ˆˆ2
2
2222
2222222
i i i i i
i i i i i
i i
i x y y x y
x x y x y x y
y R β
还可以写成另一个形式
R=
∑∑∑)
)((22i
i
i
i x
y y x , 这时11≤≤-R ,R=-1时,称之为完全负相关,而
R=1时,称之为完全正相关。
除了相关系数外,还有其他相关系数,如偏相关系数和复相关系数,它们都是涉及到多元回归问题的。
其中,所谓偏相关系数是指度量在其他所有变量保持不变的条件下,任意两个变量之间的相关程度的系数。
而复相关系数是指多个变量的相关系数中,例如 Y ,k X X X ,,,21 ,对于其中的变量Y 的复相关系数是指除Y 以外的其它变量k X X X ,,,21 对Y 的相关程度的度量(具体内容这里略去)。
6·3、相关系数的应用
相关系数的意义主要是在概率意义上反映了解释变量与被解释变量之间的线性相关程度,亦即检验假设
)(i Y E =i X βα+ 或 )(i E μ=0
相关系数最大的不足是不能给出变量之间的因果关系,亦即不能揭示变量之间相互依赖的确切关系。
正因为如此,相关系数高的原因是多种多样: (1) Y 和X 分别互为变化的原因; (2) Y 和X 同时互为变化的原因;
(3) 量Y 和X 的变化是由另一个变量W 引起的,而它们之间实际上并无直接
的因果关系; (4) 变量X 、Y 之间的相关可能纯粹是偶然的巧合,实际上并无任何因果关系。
因此,仅仅知道相关系数的结果是不够的,相关系数或相关分析不能给出X 和Y 之间是如何关联的。
实际上,变量之间的因果关系的确定只能依赖于经济理论或主观的经济分析。
另外,在实际应用中,人们往往采用相关系数来判断变量之间的相关程度。
值得指出地是,相关系数只是说明变量之间相关程度的充分条件,而不是必要条件。
例如,相关系数高的确能说明变量之间的相关程度、或线性相关程度高;但如果相关系数低,则不能说明变量之间的相关程度底,而只能说变量之间的线性相关程度底,完全不能够排除变量之间存在重要的非线性相关关系。
一般来说,相关系数低,或回归模型吻合度不好的主要原因有: (1) 模型中各变量之间本来就不存在因果关系; (2) 模型中漏掉了其它重要的变量;
(3) 变量之间关系的数学形式不正确(或成非线性关系)。
在上述原因中,尤其以第三种原因最为重要和突出,其解决的主要方式是回归模型的建立应以经济理论模型为依据,或建立模型前重视理论模型的分析。
第六章
作业
1、简述建立相关系数方法的基本思路,并指出相关系数检验存在的问题。