第2章回归归分析的推论
- 格式:pdf
- 大小:2.44 MB
- 文档页数:81
第二章经典线性回归模型:估计、统计性质与统计检验•经典线性回归模型:假设与OLS估计•OLS估计的小样本性质与统计检验•OLS估计的大样本性质与统计检验§1.1 经典线性回归模型:假设与OLS估计一、经典线性回归模型二、经典线性回归模型的OLS估计E(Y|X)回归分析的基本逻辑:寻找样本回归线,并用样本回归线近似代表总体回归线问题:能否代表?需要通过检验来回答!(1) 对残差平方和SSR(b )= Σe t 2=e ’e =(Y -Xb )’(Y -Xb ) 1阶偏导: ∂SSR/∂b = -2X ’(Y-Xb )2阶偏导: ∂2SSR/∂b ∂b ’= 2X ’X由于X ’X 为正定矩阵(Why?), 从而b =(X ’X )-1(X ’Y )是最小值 由1阶极值条件可以得到所谓正规方程(normal equations ): X ’(Y-Y-XbXb )=X ’e =0 ⇔ Σt X tj e t =0 (j=1,2,…,k )当模型含有值恒为1的常数项时, Σe t =0正规方程是OLS 所特有的,而不论是否有E(εt |X )=02、OLS 估计的数值性质(4)一些有用的等式a. X’e=0b. b −β=(X’X)-1X’ε因为b=(X’X)-1X’Y=(X’X)-1X’(Xβ+ε)=β+(X’X)-1X’ε c. 定义n×n方阵:P P X=X(X’X)-1X’(投影矩阵),M X=I n−P X(消灭矩阵)则P=P X’, M M X=M X’XP X2=P X, M M X2=M XX=X, M X X=O n×(k+1)且PXd. e=M X Y=M XεSSR(b)=e’e=Y’M X Y=ε’M Xε二元回归的示例图赤池信息准则(Akaike information criterion, AIC, 1973) AIC=ln[e’e/n]+2(k+1)/n=goodness of fit + model complexityAIC= -2ln L/n +2(k+1)/n贝叶斯信息准则(Baysian information criterion, BIC)施瓦茨准则(Schwarz criterion,SC, 1978)BIC=ln[e’e/n]+(k+1)ln(n)/nBIC/SC= -2ln L/n+(k+1)ln(n)/n贝叶斯信息准则对多引入多余的解释变量给出了更重的惩罚。
第2 章迴歸歸分析的推論Inferenes in Regression andCorrelation Analysis首先將針對迴歸的參數β及β1 做推論,並對這些參數做區間估計及檢定。
接著將討論,在給定一個X時,Y的機率分配之平均數E﹛Y﹜的區間估計、新觀測值Y的預測區間及迴歸線的信賴帶﹙confidence band﹚。
以及要討論迴歸分析中的變異分析法、一般線性檢定法﹙general linear test approach ﹚及描述性的觀聯量度﹙descriptive Measure of association ﹚。
最後將探討一個相關係數﹙correlation coefficient﹚即當X及Y都是隨機變數時,衡量X與Y之間關係的一個量。
•貫穿本章以及第一部份以後的各章節,除非另有說明,否則皆假設適用常態誤差迴歸模型(1.24)。
此一模型即是(2.1)其中β0 及β1 為參數;X i 為已知常數;εi獨立且服從N (0,σ2) 。
2.1 關於β1 的推論參數β1﹙即模型﹙2.1﹚之迴歸線的斜率﹚的推論感興趣。
例如,一個市場分析人員研究產品銷售量﹙Y﹚與廣告支出﹙X﹚之間的關聯時,可能會希望獲得β1的區間估計,因為它提供了每一單位廣告的支出,平均可增加多少產品銷售的訊息。
研究人員也會對β1的檢定有興趣,特別是下列的形式:H0︰ β1= 0H a︰ β1≠0當β1=0 時,表示X 與Y 之間並無直線關聯性存在。
圖2.1 說明了當β1=0 的情形。
此時迴歸線是水平的,而Y的機率分配的平均數都相等。
由於在此模型中所有Y的機率分配都是具有固定變異的常態分配,且當β1=0 時所有平均數也都相等,所以當β1=0 時,Y的機率分配都是相同的,這在圖2.1 中也可以看得到。
對於常態誤差迴歸模型﹙2.1﹚,β1=0 代表Y與X之間沒有線性關聯,同時表示Y與X之間沒有其他任何形式的關連。
,是指固定預測變數X的函數,當X固定時,1以它的不偏估計式誤差均方σ2{b} 的一個不偏估計式。
取(b1−β1) / s{b1} 的抽樣分配由於b1 是常態分配,所以其標準化統計量(b1−β1)/s{b1}是一個標準常態分配的隨機變數。
一般來說,會用s{b1}來估計σ{b1}。
當一個統計量經過標準化,但其分母為估計的標準差而非真實的標準差時,稱之為學生化統計量(studentizestatistic)。
一個關於此學生化統計量(b1−β1)/s{b1}的重要定理:對於迴歸模型(2.1),服從自由度(n-2)的t分配,即t(n-2) (2.10)在迴歸模型中有兩個參數﹙β0及β1﹚需要估計,因此損失兩個自由度。
β的信賴區間1由於(b1−β1) / s{b1} 服從t 分配,可以作下面的機率陳述:(2.12)α是顯著係數,一般常用0.05,在這邊t (α/2; n -2) 定義為具有自由度(n -2)的t 分配之第(α/2) 100 百分位數。
因為t 分配有對稱於0的特性,所以(2.13) 利用(2.13),(2.12)可以改寫成:(2.14)係數標準誤t 統計P-值下限 95%上限 95%軟體係數標準誤t 統計P-值下限 95%上限 95% EXCEL 軟體截距62.365926.1774 2.38240.02598.214116.518 X 變數 1 3.57020.347010.28960.0000 2.852 4.288係數標準誤t 統計P-值下限 95%上限 95% EXCEL 軟體截距62.365926.1774 2.38240.02598.214116.518 X 變數 1 3.57020.347010.28960.0000 2.852 4.288P2-8P2-9P2-10P2-8 信賴界限附錄Pag B-5,t (0.9995, 23) = 3.768附錄Pag B-4 t (0.95, 23) = 1.714EXCEL 軟體係數標準誤t 統計P-值下限 95%上限 95%截距62.365926.1774 2.38240.02598.214116.518s{b},是σ{b}的估計式。
,對b0 也有一個定理:服從自由度t(n -2)係數標準誤t 統計P-值下限 95%上限 95%截距62.365926.1774 2.38240.02598.214116.518 X 變數 1 3.57020.347010.28960.0000 2.852 4.288P2-8P2-9P2-10P2-8 信賴界限非95% 信賴區間2.3 對β及β1 做推論時的一些考慮偏離常態性的效應•如果Y的機率分配並不是常態,但並未嚴重偏離常態,則b0 及b1 的抽樣分配仍會近似常態,利用t 分配仍然可得近似預定的信賴常數或顯著水準。
•一般性的條件下,當樣本數增加時,它的分配將趨近常態分配。
而對於大樣本,t 的值可以藉由標準常態分配的z 值來取代。
信賴係數及錯誤風險的解釋•對於迴歸模型(2.1)是假設諸X i是已知的常數,因此信賴係數及檢定的錯誤風險,都是解釋為在固定X的值和所觀測值到的樣本相同之下重複抽樣的結果。
•例如,在Toluca公司的例子中,建構了一個信賴係數為95% 的β1 的信賴區間。
這個係數表示,若在X固定成和已得到的資料相同之下,重複抽樣取得很多樣本,並且每一組樣本都採用同一公式建構β1 的95% 的信賴區間,則這些區間中大約95% 會涵蓋到真正的β1。
分隔X 的水準•分別檢查b0 與b1 的變異數公式(2.3b)及(2.22b),可以發現當n 與σ2給定時,這些變異數將受到觀測值X 水準的間距影響。
比如說,若X 的水準越分散,的量就越大,而b1 的變異數就越小•(2.3b) (2.22b)檢定力•對β0與β1做檢定的檢定力(power of tests),可以從附錄的表B.5 查到。
例如,考慮要對β1做(2.19)的一般性檢定:H0:β1= β10H a:β1≠β10•檢定的統計量:t* = [b1-β10] /s{b1}這個檢定的檢定力,就是當H是對時,決策法則導引到a結論是H a 的機率。
2.4 E { Y h }的區間估計•令X h 表示想估計平均反應的X 水準,X h 可能是在樣本中出現過的一個值,也可能是在模型範圍內預測變數的另一個值。
X = X h 時的平均反應記為E {Yh },(1.12)給予E { Y h }的點估計式Ŷh 是:(2.28) •Ŷh 的抽樣分配如同前面所提到過的幾個抽樣分配,Ŷh 的抽樣分配是指:固定預測變數X 的水準,重複抽樣並計算Ŷh ,所得到的不同Ŷh 值的現象。
對於常態誤差迴歸模型(2.1),Ŷh 的抽樣分配為常態,並具有如下的平均數與變異數:(2.29)(2.29a)(2.29b)常態性因Ŷh是諸Y i 的線性組合,故可以得到Ŷh的抽樣分配是常態分配。
平均數由(2.29a)知,Ŷh 是E{Y h}的不偏估計量。
E{Ŷ}= β0+ β1X hh抽樣分配的X h與h距離多遠的影響,即受到越就越大,Ŷh 的變異數也越大。
圖2.3 以對這個現象做一個直觀的解釋。
在同一組當MSE 取代(2.29b)的σ2時,我們可以得到的的估計標準差s{Ŷh } 即為s 2{Ŷh }的正方根。
Ŷh 在不同樣本間的變異,當X h 遠離平均數接近平均數時來得大。
下,一般程式內定95%2.5 新觀測值的預測(Prediction of New bservation)•考慮給定預測變數X之一個標準,預測一個新觀測值Y的問題。
•一大學中的一位入學許可主管估計了已入學學生的高中平均等第成績(GPA)和其大學第一年GPA的迴歸關聯。
他希望預測一名高中GPA為3.5的入學申請者其進入大學第一年的GPA,以供是否准許入學的部分參考訊息。
•要預測的新觀測值Y是一次新試行的結果,和迴歸分析所依據的資料是獨立的。
以X h表示此一新試行的X 水準,而Y的新觀測值用Y h(new)表示。
假設適用基本樣本資料的迴歸模型對於新觀測值仍然適用。
}和本節所要討論的•前一節所討論的估計平均反應E{ Yh預測新反應值Y h(new),兩者間有根本上的差別。
前者是估計Y之分配的平均數,而後者是預測由Y的分配所取出的個別結果。
一、參數已知時Y h(new)的預測區間(prediction interval) 9為說明新觀測值Y之預測區間(prediction interval)h(new)的性質,首先假設所有的迴歸參數皆已知,之後捨棄這個假設,並做適當的修正。
假設在入學審查的例子中,迴歸模型的參數已知如下:β0 = 0.10 ,β1 = 0.95,E{Y}=0.10 + 0.95X,σ= 0.12入學許可主管考慮一名高中GPA為X h= 3.5 的申請者。
高中平均是3.5 的學生其大學平均成績為E{Y h} = 0.10 + 0.95(3.5) = 3.425Y 常一致h = 3.5 的申請者其大學第一年的GPA3.425 ±3 (0.12)≤Y h(new)≤3.785常態機率分配在平均數左右三倍標準差之內約占了99.7 ,此預測區間正確預測一位高中GPA是3.5的申請者其大學因為預測區間相當寬。
此預測並不十分精確,但至少此預測告訴入學許可主管,這位申請者進入大學後第一年的成績至少可達3.0 GPA。
(3.065≤Y h(new)≤3.785)預測區間是否有用,取決於區間的寬度和使用者所需要的精確度。
一般若常態誤差迴歸模型(2.1) 的參數已知,則Y h(new) 的1-α預測區間為: E{Y h} ±Z(1-α/2)·σ(2.34)以E{Y h}為界限的中心點,得到的是固定正確預測機率之下的最短區間,Z標準常態分佈(表B.1)二、參數未知時Y h(new) 的預測區間•當迴歸參數未知時,必須先估計:Y 的平均數用Ŷh 估計,而Y之變異數用MSE估計。
•圖2.5 顯示有兩個Y 的機率分配,對應到E{Y h} 的信賴區間上下界限值。
因為不知道平均數E{Y h} 究竟在哪裡,只能用信賴區間估計它,所以不能確定Y 之分配的位置。
圖2.5 顯示了兩個Y的分配所對的預測界限。
由於我們不能確定Y分配的位置,Y h(new)的預測界限顯然需考量兩個元素,如圖2.5所示:1. Y 分配的位置之可能變異。
2. Y 機率分配內之變異。
給定X,一新觀測值Y h(new)的預測界限可利用下列定理h求得:在常態誤差迴歸模型(2.1)的下,{ Y h(new) -Ŷh} / s{pred} ,服從t (n-2)(2.35) (2.35) 的學生化統計量的分子用了點估計量Ŷh ,而非平均數E{Y h},這是因我們並不知道真正的平均數,所以無法用它來做預測。