第三章 經(jīng)典單方程計(jì)量經(jīng)濟(jì)學(xué)模型-多元線性回歸_第1頁(yè)
已閱讀1頁(yè),還剩111頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、竭盡全力而不是盡力而為,在美國(guó)西雅圖一所著名的教堂里,一位德高望重的牧師同教會(huì)學(xué)校一個(gè)班的學(xué)生講故事。獵人帶著獵狗去打獵,獵人擊中了兔子的后腿,受傷的兔子拼命地逃跑,獵狗在后窮追不舍??墒亲妨艘魂囎?,獵狗沒追上,只好悻悻地回來。獵人氣急敗壞地說:“你真沒用,連一只受傷的兔子都追不到!”獵狗辯解道:“我已經(jīng)盡力而為了呀!”逃脫的兔子回來跟大家說:“他是盡力而已,我是竭盡全力呀!他沒有追上我最多挨一頓罵,而我若不竭盡全力的跑,可就沒命

2、了呀!”,牧師講完故事后,又向全班承諾:誰(shuí)要能背出《圣經(jīng).馬太福音》中第五章到第七章的全部?jī)?nèi)容,他就邀請(qǐng)誰(shuí)去“太空針”高塔餐廳參加免費(fèi)聚餐會(huì)?!妒ソ?jīng).馬太福音》中第五章到第七章的全部?jī)?nèi)容有幾萬(wàn)字,而且不押韻,要背誦起全文難度極大。盡管參加免費(fèi)的聚餐會(huì)是許多學(xué)生夢(mèng)寐以求的事情,但幾乎所有的人都望而卻步了。幾天后,班上一個(gè)11歲的男孩,胸有成竹從頭到尾按要求背了下來,竟然沒有出一點(diǎn)差錯(cuò)。牧師比別人更清楚,即使在成年的信徒中,能背誦這篇

3、文章的人也是罕見的。牧師不禁好奇地問:“你為什么能背下這么有長(zhǎng)有難的文字呢?”男孩不假思索地回答道:“我竭盡全力。”如今,那個(gè)男孩成了首富,他就是比爾.蓋茨。,,第三章 經(jīng)典單方程計(jì)量經(jīng)濟(jì)學(xué)模型:多元線性回歸模型Multiple Linear Regression Model,引 子:中國(guó)汽車的保有量會(huì)達(dá)到2億輛嗎 ?,中國(guó)經(jīng)濟(jì)的快速發(fā)展,使居民收入不斷增加,數(shù)以百萬(wàn)計(jì)的中國(guó)人開始得以實(shí)現(xiàn)擁有汽車的夢(mèng)想,中國(guó)也成為世界上成

4、長(zhǎng)最快的汽車市場(chǎng)。截至2015年底,全國(guó)機(jī)動(dòng)車保有量達(dá)2.79億輛,其中汽車1.72億輛。工信部裝備工業(yè)司副司長(zhǎng)王富昌日前指出,預(yù)計(jì)到2020年中國(guó)汽車保有量將超過2億輛。是什么因素導(dǎo)致中國(guó)汽車數(shù)量的增長(zhǎng)? 影響中國(guó)汽車行業(yè)發(fā)展的因素并不是單一的,經(jīng)濟(jì)增長(zhǎng)、消費(fèi)趨勢(shì)、市場(chǎng)行情、業(yè)界心態(tài)、能源價(jià)格、道路發(fā)展、內(nèi)外環(huán)境、相關(guān)政策等,都會(huì)使中國(guó)汽車行業(yè)面臨機(jī)遇和挑戰(zhàn)。,分析中國(guó)汽車行業(yè)未來的趨勢(shì),應(yīng)具體分析這樣一些問題:中

5、國(guó)汽車市場(chǎng)發(fā)展的狀況如何?(用銷售量觀測(cè))影響中國(guó)汽車銷量的主要因素是什么? (如收入、價(jià)格、費(fèi)用、道路狀況、能源、政策環(huán)境等)各種因素對(duì)汽車銷量影響的性質(zhì)怎樣?(正、負(fù))各種因素影響汽車銷量的具體數(shù)量關(guān)系是什么?所得到的數(shù)量結(jié)論是否可靠?中國(guó)汽車行業(yè)今后的發(fā)展前景怎樣?應(yīng)當(dāng)如何制定汽車的產(chǎn)業(yè)政策?很明顯,只用一個(gè)解釋變量已很難分析汽車產(chǎn)業(yè)的發(fā)展, 還需要尋求有更多個(gè)解釋變量情況的回歸分析方法。,怎樣分析

6、多種因素的影響?,第三章 多元線性回歸模型,本章主要討論: 如何將簡(jiǎn)單線性回歸的研究方法推廣到多元的情況 ●多元線性回歸模型及古典假定 ●多元線性回歸參數(shù)的估計(jì) ●多元線性回歸方程的擬合優(yōu)度 ●多元線性回歸的區(qū)間估計(jì)和假設(shè)檢驗(yàn) ●多元線性回歸模型的預(yù)測(cè) ●含有虛擬變量的多元線性回歸模型,§3.1 多元線性回歸模型,一、多元線性回歸模型 二、多元線

7、性回歸模型的基本假定,一、多元線性回歸模型,多元線性回歸模型:表現(xiàn)在線性回歸模型中的解釋變量有多個(gè)。一般表現(xiàn)形式:,i=1,2…,n,其中:k為解釋變量的數(shù)目,?j稱為回歸參數(shù)(regression coefficient)。 習(xí)慣上:把常數(shù)項(xiàng)看成為一虛變量的系數(shù),該虛變量的樣本觀測(cè)值始終取1。這樣: 模型中解釋變量的數(shù)目為(k+1),也被稱為總體回歸函數(shù)的隨機(jī)表達(dá)形式。它的非隨機(jī)表達(dá)式為:,方程表示:各變量X值

8、固定時(shí)Y的平均響應(yīng)。 ?j也被稱為偏回歸系數(shù),表示在其他解釋變量保持不變的情況下,Xj每變化1個(gè)單位時(shí),Y的均值E(Y)的變化; 或者說?j給出了Xj的單位變化對(duì)Y均值的“直接”或“凈”(不含其他變量)影響。,指對(duì)各個(gè)回歸系數(shù)而言是“線性”的,對(duì)變量則可是線性的,也可是非線性的例如:生產(chǎn)函數(shù)取自然對(duì)數(shù),多元線性回歸的“線性”,總體回歸模型n個(gè)隨機(jī)方程的矩陣表達(dá)式為,其中,樣本回歸函數(shù):用來估計(jì)總體回歸函數(shù),其隨機(jī)表

9、示式:,ei稱為殘差或剩余項(xiàng)(residuals),可看成是總體回歸函數(shù)中隨機(jī)擾動(dòng)項(xiàng)?i的近似替代。 樣本回歸函數(shù)的矩陣表達(dá):,或,其中:,總體回歸函數(shù) 或樣本回歸函數(shù) 或 其中: 都是有 個(gè)元素的列向量 是有 +1個(gè)元素的列向量 是第一列為1的

10、 階解釋變量數(shù)據(jù)矩陣 (截距項(xiàng)可視為解釋變量取值為1),總結(jié):,二、多元線性回歸模型的基本假定,假設(shè)1:回歸模型是正確設(shè)定的。 假設(shè)2:解釋變量在所抽取的樣本中具有變異性,且各X之間不存在嚴(yán)格線性相關(guān)性(無完全多重共線性)。 假設(shè)3,隨機(jī)誤差項(xiàng)具有條件零均值性,假設(shè)4,隨機(jī)誤差項(xiàng)具有條件同方差及不序列相關(guān)性,假設(shè)5,隨機(jī)項(xiàng)滿足正態(tài)分布,上述假設(shè)的矩陣符號(hào)表示式:,假設(shè)2,n?(k+1)矩陣X的秩為k+1,即X列

11、滿秩。 假設(shè)3,,,假設(shè)4:隨機(jī)誤差項(xiàng)具有條件同方差及不序列相關(guān)性。,其中,I為一n階單位矩陣。,假設(shè)5,向量? 有一多維正態(tài)分布,即,基本假定的推論:,注:CLRM 和 CNLRM,以上假設(shè)(正態(tài)性假設(shè)除外)也稱為線性回歸模型的經(jīng)典假設(shè)或高斯(Gauss)假設(shè),滿足該假設(shè)的線性回歸模型,也稱為經(jīng)典線性回歸模型(Classical Linear Regression Model, CLRM)。同時(shí)滿足正態(tài)性假設(shè)的線性回歸模

12、型,稱為經(jīng)典正態(tài)線性回歸模型(Classical Normal Linear Regression Model, CNLRM)。,§3.2 多元線性回歸模型的參數(shù)估計(jì),一、普通最小二乘估計(jì)二、參數(shù)估計(jì)量的性質(zhì)三、樣本容量問題四、參數(shù)估計(jì)舉例,說 明,估計(jì)對(duì)象:模型結(jié)構(gòu)參數(shù)隨機(jī)項(xiàng)的分布參數(shù)(方差)估計(jì)方法:3大類方法:OLS、ML或者M(jìn)M在經(jīng)典模型中多應(yīng)用OLS在非經(jīng)典模型中多應(yīng)用ML或者M(jìn)M,一、普通最小二

13、乘估計(jì),對(duì)于隨機(jī)抽取的n組觀測(cè)值,如果樣本函數(shù)的參數(shù)估計(jì)值已經(jīng)得到,則有:,i=1,2…n,根據(jù)最小二乘原理,參數(shù)估計(jì)值應(yīng)該是下列方程組的解,其中,于是得到關(guān)于待估參數(shù)估計(jì)值的正規(guī)方程組:,正規(guī)方程組的矩陣形式,,,條件?,即:,將上述過程用矩陣表示如下:,即求解方程組:,得到:,于是:,,? 正規(guī)方程組 的另一種寫法,對(duì)于正規(guī)方程組,,于是,或,(*)或(**)是多元線性回歸模型正規(guī)方程組的另一種寫法 。,(*),(**),? 樣

14、本回歸函數(shù)的離差形式,i=1,2…n,其矩陣形式為,其中 :,在離差形式下,參數(shù)的最小二乘估計(jì)結(jié)果為,,? 隨機(jī)誤差項(xiàng)?的方差?的無偏估計(jì),可以證明,隨機(jī)誤差項(xiàng) ? 的方差的無偏估計(jì)量為,,二、參數(shù)估計(jì)量的性質(zhì),在滿足基本假設(shè)的情況下,其結(jié)構(gòu)參數(shù)?的普通最小二乘估計(jì)、最大或然估計(jì)及矩估計(jì)仍具有: 線性性、無偏性、有效性。,同時(shí),隨著樣本容量增加,參數(shù)估計(jì)量具有: 漸近無偏性、漸近有效性、一致性。 利用矩陣表達(dá)可以很方

15、便地證明,注意證明過程中利用的基本假設(shè)。,1、線性性,其中,C=(X’X)-1 X’ 為一僅與固定的X有關(guān)的行向量。,2、無偏性,這里利用了假設(shè): E(X’?)=0,3、有效性(最小方差性),其中利用了,和,三、樣本容量問題,所謂“最小樣本容量”,即從最小二乘原理和最大或然原理出發(fā),欲得到參數(shù)估計(jì)量,不管其質(zhì)量如何,所要求的樣本容量的下限。,⒈ 最小樣本容量,樣本最小容量必須不少于模型中解釋變量的數(shù)目(包括常數(shù)項(xiàng)),即

16、 n ? k+1因?yàn)?,無多重共線性要求:秩(X)=k+1,2、滿足基本要求的樣本容量,從統(tǒng)計(jì)檢驗(yàn)的角度: n?30 時(shí),Z檢驗(yàn)才能應(yīng)用; n-k?8時(shí), t分布較為穩(wěn)定,一般經(jīng)驗(yàn)認(rèn)為: 當(dāng)n?30或者至少n?3(k+1)時(shí),才能說滿足模型估計(jì)的基本要求。,模型的良好性質(zhì)只有在大樣本下才能得到理論上的證明。,——地區(qū)城鎮(zhèn)居民消費(fèi)模型,被解釋變量:地區(qū)城鎮(zhèn)居民人均消費(fèi)Y解釋變量:地區(qū)城鎮(zhèn)居民人均工資

17、性收入X1地區(qū)城鎮(zhèn)居民人均其它X2樣本:2013年,31個(gè)地區(qū),四、多元線性回歸模型的參數(shù)估計(jì)實(shí)例,數(shù)據(jù),,變量間關(guān)系,變量間關(guān)系,OLS估計(jì),OLS估計(jì)結(jié)果,,,§3.3 多元線性回歸模型的統(tǒng)計(jì)檢驗(yàn),一、擬合優(yōu)度檢驗(yàn) 二、方程的顯著性檢驗(yàn)(F檢驗(yàn)) 三、變量的顯著性檢驗(yàn)(t檢驗(yàn)) 四、參數(shù)的置信區(qū)間,一、擬合優(yōu)度檢驗(yàn),1、可決系數(shù)與調(diào)整的可決系數(shù),則,總離差平方和的分解,由于,=0,所以有:,注意:一個(gè)有

18、趣的現(xiàn)象,,可決系數(shù),該統(tǒng)計(jì)量越接近于1,模型的擬合優(yōu)度越高。,問題: 在應(yīng)用過程中發(fā)現(xiàn),如果在模型中增加一個(gè)解釋變量, R2往往增大。 這就給人一個(gè)錯(cuò)覺:要使得模型擬合得好,只要增加解釋變量即可。 但是,現(xiàn)實(shí)情況往往是,由增加解釋變量個(gè)數(shù)引起的R2的增大與擬合好壞無關(guān),R2需調(diào)整。,調(diào)整可決系數(shù)的原因,對(duì)于有k個(gè)解釋變量的多元回歸方程,可決系數(shù)的另一計(jì)算式如下:,其中,分母總離差平方和TSS是不變的,當(dāng)每增加一個(gè)解

19、釋變量時(shí),只要新增解釋變量前系數(shù)不為0,則殘差平方和會(huì)變?。环肿又忻恳豁?xiàng)的符號(hào)均為正(每一項(xiàng)中相乘的兩項(xiàng)同號(hào)),所以R2會(huì)隨解釋變量增加而增加,因此,應(yīng)該調(diào)整。,調(diào)整可決系數(shù)的原因,調(diào)整的可決系數(shù)(adjusted coefficient of determination),在樣本容量一定的情況下,增加解釋變量必定使得自由度減少,所以調(diào)整的思路是:將殘差平方和與總離差平方和分別除以各自的自由度,以剔除變量個(gè)數(shù)對(duì)擬合優(yōu)度的影響:,其中:n

20、-k-1為殘差平方和的自由度,n-1為總體平方和的自由度。,,*2、赤池信息準(zhǔn)則和施瓦茨準(zhǔn)則,為了比較所含解釋變量個(gè)數(shù)不同的多元回歸模型的擬合優(yōu)度,常用的標(biāo)準(zhǔn)還有: 赤池信息準(zhǔn)則(Akaike information criterion, AIC),施瓦茨準(zhǔn)則(Schwarz criterion,SC),這兩準(zhǔn)則均要求僅當(dāng)所增加的解釋變量能夠減少AIC值或AC值時(shí)才在原模型中增加該解釋變量。,地區(qū)城鎮(zhèn)居民消費(fèi)模型(k=2),,,,地區(qū)

21、城鎮(zhèn)居民消費(fèi)模型(k=1),二、方程總體線性的顯著性檢驗(yàn)(F檢驗(yàn)),方程的顯著性檢驗(yàn),旨在對(duì)模型中被解釋變量與解釋變量之間的線性關(guān)系在總體上是否顯著成立作出推斷。,1、方程顯著性的F檢驗(yàn),即檢驗(yàn)?zāi)P椭械膮?shù)?j是否顯著不為0。,可提出如下原假設(shè)與備擇假設(shè):,H0: ?1=?2= ? =?k=0 H1: ?j不全為零 (j=1,2, …k),F檢驗(yàn)的思想來自于總離差平方和的分解式:

22、 TSS=ESS+RSS,如果這個(gè)比值較大,則X的聯(lián)合體對(duì)Y的解釋程度高,可認(rèn)為總體存在線性關(guān)系,反之總體上可能不存在線性關(guān)系。 因此,可通過該比值的大小對(duì)總體線性關(guān)系進(jìn)行推斷。,根據(jù)數(shù)理統(tǒng)計(jì)學(xué)中的知識(shí),在原假設(shè)H0成立的條件下,統(tǒng)計(jì)量,服從自由度為(k , n-k-1)的F分布,給定顯著性水平?,可得到臨界值F?(k,n-k-1),由樣本求出統(tǒng)計(jì)量F的數(shù)值,通過 F? F?(k,n-k-1) 或

23、F?F?(k,n-k-1)來拒絕或接受原假設(shè)H0,以判定原方程總體上的線性關(guān)系是否顯著成立。,地區(qū)城鎮(zhèn)居民消費(fèi)模型,,,伴隨概率:拒絕0假設(shè),犯錯(cuò)誤的概率為0,2、關(guān)于擬合優(yōu)度檢驗(yàn)與方程顯著性檢驗(yàn)關(guān)系的討論,F與R2同向變化:當(dāng)R2=0時(shí),F(xiàn)=0; R2越大,F(xiàn)值也越大; 當(dāng)R2=1時(shí),F(xiàn)為無窮大。,對(duì)于一般

24、的實(shí)際問題,在5%的顯著性水平下,F(xiàn)統(tǒng)計(jì)量的臨界值所對(duì)應(yīng)的R2的水平是較低的(例3.2.2中,F(xiàn)0.05(2,28)=3.34,對(duì)應(yīng)的調(diào)整R2為0.1349)。所以,不宜過分注重調(diào)整R2值,應(yīng)注重模型的經(jīng)濟(jì)意義;在進(jìn)行總體顯著性檢驗(yàn)時(shí),顯著性水平應(yīng)該控制在5%以內(nèi)。,因此,F(xiàn)檢驗(yàn)是所估計(jì)回歸的總顯著性的一個(gè)度量,也是R2的一個(gè)顯著性檢驗(yàn)。亦即,三、變量的顯著性檢驗(yàn)(t檢驗(yàn)),方程的總體線性關(guān)系顯著不等于每個(gè)解釋變量對(duì)被解釋變量的影響都是

25、顯著的。,因此,必須對(duì)每個(gè)解釋變量進(jìn)行顯著性檢驗(yàn),以決定是否作為解釋變量被保留在模型中。 這一檢驗(yàn)是由對(duì)變量的 t 檢驗(yàn)完成的。,1、t統(tǒng)計(jì)量,以cii表示矩陣(X’X)-1 主對(duì)角線上的第i個(gè)元素,,,,,,2、t 檢驗(yàn),設(shè)計(jì)原假設(shè)與備擇假設(shè):,H1:?i?0,給定顯著性水平?,可得到臨界值t?/2(n-k-1),由樣本求出統(tǒng)計(jì)量t的數(shù)值,通過 |t|? t?/2(n-k-1) 或 |t|?t?/2(n-k-1)

26、來拒絕或接受原假設(shè)H0,從而判定對(duì)應(yīng)的解釋變量是否應(yīng)包括在模型中。,H0:?i=0 (i=1,2…k),地區(qū)城鎮(zhèn)居民消費(fèi)模型,,,注意:一元線性回歸中,t檢驗(yàn)與F檢驗(yàn)一致,一方面,t檢驗(yàn)與F檢驗(yàn)都是對(duì)相同的原假設(shè)H0:?1=0 進(jìn)行檢驗(yàn); 另一方面,兩個(gè)統(tǒng)計(jì)量之間有如下關(guān)系:,統(tǒng)計(jì)檢驗(yàn)方法總結(jié):,注: (1) ; (2)一元模型中 ;

27、(3),四、參數(shù)的置信區(qū)間,參數(shù)的置信區(qū)間用來考察:在一次抽樣中所估計(jì)的參數(shù)值離參數(shù)的真實(shí)值有多“近”。 在變量的顯著性檢驗(yàn)中已經(jīng)知道:,容易推出:在(1-?)的置信水平下?i的置信區(qū)間是,其中,t?/2為顯著性水平為? 、自由度為n-k-1的臨界值。,例題中,給定顯著性水平α=5%,參數(shù)β1和β2的置信區(qū)間分別為(0.3685, 0.6045 )和(0.3882, 0.8153) 。如何陳述模型估計(jì)結(jié)果?城鎮(zhèn)居民工資收入的邊際

28、消費(fèi)傾向?yàn)?.4865。錯(cuò)!城鎮(zhèn)居民工資收入的邊際消費(fèi)傾向以95%的概率處于(0.3685, 0.6045 )的區(qū)間中。正確!,如何才能縮小置信區(qū)間?,增大樣本容量n,因?yàn)樵谕瑯拥臉颖救萘肯拢琻越大,t分布表中的臨界值越小,同時(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減??;提高模型的擬合優(yōu)度,因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型優(yōu)度越高,殘差平方和應(yīng)越小。提高樣本觀測(cè)值的分散度,一般情況下,樣本觀測(cè)值越分散,(X

29、’X)-1的分母的|X’X|的值越大,致使區(qū)間縮小。,§3.4 多元線性回歸模型的預(yù)測(cè),一、E(Y0)的置信區(qū)間 二、Y0的置信區(qū)間,對(duì)于模型,給定樣本以外的解釋變量的觀測(cè)值X0=(1,X10,X20,…,Xk0),可以得到被解釋變量的預(yù)測(cè)值:,它可以是總體均值E(Y0)或個(gè)值Y0的預(yù)測(cè)。 但嚴(yán)格地說,這只是被解釋變量的預(yù)測(cè)值的估計(jì)值,而不是預(yù)測(cè)值。 為了進(jìn)行科學(xué)預(yù)測(cè),還需求出預(yù)測(cè)值的置信區(qū)間,包括E(Y0

30、)和Y0的置信區(qū)間。,一、E(Y0)的置信區(qū)間,易知,容易證明,于是,得到(1-?)的置信水平下E(Y0)的置信區(qū)間:,其中,t?/2為(1-?)的置信水平下的臨界值。,例題中,假設(shè)某城鎮(zhèn)居民2013年工資性收入為20000元,其他收入為10000元,則該居民2013年現(xiàn)金消費(fèi)支出的預(yù)測(cè)值為18346.1元。就全國(guó)平均情況看,2013年具有人均工資性收入20000元、其他來源收入10000元的城鎮(zhèn)居民,當(dāng)年平均的現(xiàn)金消費(fèi)支出預(yù)測(cè)值的置

31、信區(qū)間為(17870.0,18822.2) (在95%的置信度下) 。,二、Y0的置信區(qū)間,如果已經(jīng)知道實(shí)際的預(yù)測(cè)值Y0,那么預(yù)測(cè)誤差為:,容易證明,e0服從正態(tài)分布,即,構(gòu)造t統(tǒng)計(jì)量,可得給定(1-?)的置信水平下Y0的置信區(qū)間:,例題中,假設(shè)某城鎮(zhèn)居民2013年工資性收入為20000元,其他收入為10000元,則該居民2013年現(xiàn)金消費(fèi)支出的預(yù)測(cè)值為18346.1元。就該居民看,當(dāng)年平均的現(xiàn)金消費(fèi)支出預(yù)測(cè)值的置信區(qū)間為(15958

32、.3, 20733.9) (在95%的置信度下) 。,§3.6 含有虛擬變量的多元線性回歸模型,一、含有虛擬變量的模型二、虛擬變量的引入三、虛擬變量的設(shè)置原則,一、含有虛擬變量的模型,1、虛擬變量(dummy variables),許多經(jīng)濟(jì)變量是可以定量度量。一些影響經(jīng)濟(jì)變量的因素是無法定量度量。為了在模型中能夠反映這些因素的影響,并提高模型的精度,需要將它們“量化”。這種“量化”通常是通過引入“虛擬變量”來完成的

33、。根據(jù)這些因素的屬性類型,構(gòu)造只取“0”或“1”的人工變量,通常稱為虛擬變量,記為D。本章只討論:虛擬變量作為解釋變量的情形。,一般地,在虛擬變量的設(shè)置中: 基礎(chǔ)類型、肯定類型取值為1; 比較類型,否定類型取值為0。例如,反映文程度的虛擬變量可取為:虛擬變量能否取1、0以外的數(shù)值?,2、虛擬變量模型,同時(shí)含有一般解釋變量與虛擬變量的模型稱為虛擬變量模型或者方差分析(analysis-of variance: ANO

34、VA)模型。例如,一個(gè)以性別為虛擬變量考察企業(yè)職工薪金的模型:,其中:Yi為企業(yè)職工的薪金;Xi為工齡; Di=1,若是男性,Di=0,若是女性。,二、虛擬變量的引入,1、加法方式,虛擬變量作為解釋變量引入模型有兩種基本方式:加法方式和乘法方式。上述企業(yè)職工薪金模型中性別虛擬變量的引入采取了加法方式。在該模型中,如果仍假定E(?i)=0,則企業(yè)男、女職工的平均薪金為:,假定?2>0,則兩個(gè)函數(shù)有相同的斜率,但有不同的截距。意

35、即,男女職工平均薪金對(duì)工齡的變化率是一樣的,但兩者的平均薪金水平相差?2??梢酝ㄟ^對(duì)?2的統(tǒng)計(jì)顯著性進(jìn)行檢驗(yàn),以判斷企業(yè)男女職工的平均薪金水平是否有顯著差異。,,?0,,?2,幾何意義:,將上例中的性別換成教育水平,教育水平考慮三個(gè)層次:高中以下、高中、大學(xué)及其以上。,高中以下,高中,大學(xué)及以上,在上例中同時(shí)引入性別和教育水平:,女職工本科以下學(xué)歷的平均薪金:,女職工本科以上學(xué)歷的平均薪金:,男職工本科以下學(xué)歷的平均薪金:,男職工本科

36、以上學(xué)歷的平均薪金:,于是,不同性別、不同學(xué)歷職工的平均薪金分別為:,2、乘法方式,加法方式引入虛擬變量,考察:截距的不同。許多情況下,斜率發(fā)生變化,或斜率、截距同時(shí)發(fā)生變化。斜率的變化可通過以乘法的方式引入虛擬變量來測(cè)度。,例如,根據(jù)消費(fèi)理論,收入決定消費(fèi)。但是,農(nóng)村居民和城鎮(zhèn)居民的邊際消費(fèi)傾向往往是不同的。這種消費(fèi)傾向的不同可通過在消費(fèi)函數(shù)中引入虛擬變量來考察。,,,,農(nóng)村居民:,城鎮(zhèn)居民:,3、同時(shí)引入加法與乘法形式的虛擬變量

37、,當(dāng)截距與斜率發(fā)生變化時(shí),則需要同時(shí)引入加法與乘法形式的虛擬變量。以Y為人均消費(fèi),X為人均可支配收入,可令:農(nóng)村居民: Yi=?1+?2Xi+?1i i=1,2…,n1 城鎮(zhèn)居民: Yi=?1+?2Xi+?2i i=1,2…,n2 則有可能出現(xiàn)下述四種情況中的一種:,(1) ?1=?1 ,且?2=?2 ,即兩個(gè)回歸相同,稱為重合回歸(Coincident Regressions)

38、;(2) ?1??1 ,但?2=?2 ,即兩個(gè)回歸的差異僅在其截距,稱為平行回歸(Parallel Regressions);(3) ?1=?1 ,但?2??2 ,即兩個(gè)回歸的差異僅在其斜率,稱為匯合回歸(Concurrent Regressions);(4) ?1??1,且?2??2 ,即兩個(gè)回歸完全不同,稱為相異回歸(Dissimilar Regressions)。,4、例題,判斷中國(guó)農(nóng)村居民與城鎮(zhèn)居民的消費(fèi)行為是否有顯著差異

39、。被解釋變量:居民家庭人均生活消費(fèi)支出Y解釋變量:居民家庭人均工資收入X1、其他收入X2樣本:2013年31個(gè)地區(qū)農(nóng)村居民與城鎮(zhèn)居民人均數(shù)據(jù)虛擬變量Di:農(nóng)村居民取值1,城鎮(zhèn)居民取值0,總體回歸模型,引入虛擬變量后的回歸結(jié)果如下:,由變量顯著性檢驗(yàn)得到:在10%的顯著性水平下,Di和DiXi1是顯著的,而DiXi2不顯著。因此:農(nóng)村居民與城鎮(zhèn)居民在其他收入方面有相同的增加量時(shí),兩者增加的消費(fèi)支出沒有顯著差異。模型需要進(jìn)行調(diào)整

40、,去掉DiXi2之后再進(jìn)行回歸,得到最終的模型。,,在10%的顯著性水平下,最終回歸模型為:,由變量顯著性檢驗(yàn)得到:在10%的顯著性水平下,引入模型的變量均是顯著的,因此:2013年農(nóng)村居民的平均消費(fèi)支出要比城鎮(zhèn)居民少1597.0元;在其他條件不變的情況下,農(nóng)村居民與城鎮(zhèn)居民的工資收入都增加100元時(shí),農(nóng)村居民要比城鎮(zhèn)居民多支出18.8元用于生活消費(fèi)。,,三、虛擬變量的設(shè)置原則,每一定性變量(qualitative variable

41、)所需的虛擬變量個(gè)數(shù)要比該定性變量的狀態(tài)類別數(shù)(categories)少1。即如果有m種狀態(tài),只在模型中引入m-1個(gè)虛擬變量。例如,季節(jié)定性變量有春、夏、秋、冬4種狀態(tài),只需要設(shè)置3個(gè)虛變量:,如果設(shè)置第4個(gè)虛變量,則出現(xiàn)“虛擬變量陷井”(Dummy Variable Trap)。為什么?,例如:包含季節(jié)變量的正確模型:,,,,解釋變量完全共線性,錯(cuò)誤模型,如果在服裝需求函數(shù)模型中必須包含3個(gè)定性變量:季節(jié)(4種狀態(tài))、性別(2種狀態(tài)

42、)、職業(yè)(5種狀態(tài)),應(yīng)該設(shè)置多少虛變量?模型含常數(shù)項(xiàng)模型不含常數(shù)項(xiàng),討論:定序定性變量可否按照狀態(tài)賦值?,例如:表示居民對(duì)某種服務(wù)的滿意程度,分5種狀態(tài):非常不滿意、一般不滿意、無所謂、一般滿意、非常滿意。在模型中按照狀態(tài)分別賦值0、1、2、3、4或者-2、-1、0、1、2。被經(jīng)常采用,尤其在管理學(xué)、社會(huì)學(xué)研究領(lǐng)域。正確的方法:設(shè)置多個(gè)虛擬變量,理論上正確,帶來自由度損失。以定性變量為研究對(duì)象,構(gòu)造多元排序離散選擇模型,然

43、后以模型結(jié)果對(duì)定性變量的各種狀態(tài)賦值。但需要更多的信息支持。賦值的方法等于是對(duì)虛變量方法中的各個(gè)虛變量的參數(shù)施加了約束,而這種約束經(jīng)常被檢驗(yàn)為錯(cuò)誤的。,附錄:一、隨機(jī)誤差項(xiàng)?的方差?的無偏估計(jì),,,M為等冪矩陣,,,,附錄:二、最大似然估計(jì)(多元模型),1、最大似然法,最大似然法(Maximum Likelihood,ML),也稱最大或然法,是不同于最小二乘法的另一種參數(shù)估計(jì)方法,是從最大或然原理出發(fā)發(fā)展起來的其它估計(jì)方法的基礎(chǔ)?;?/p>

44、本原理:當(dāng)從模型總體隨機(jī)抽取n組樣本觀測(cè)值后,最合理的參數(shù)估計(jì)量應(yīng)該使得從模型中抽取該n組樣本觀測(cè)值的概率最大。ML必須已知隨機(jī)項(xiàng)的分布。,2、估計(jì)步驟:以一元模型為例,,,Yi的分布,Yi的概率函數(shù),Y的所有樣本觀測(cè)值的聯(lián)合概率—似然函數(shù),,,,,對(duì)數(shù)似然函數(shù),對(duì)數(shù)似然函數(shù)極大化的一階條件,結(jié)構(gòu)參數(shù)的ML估計(jì)量,,分布參數(shù)的ML估計(jì)量,3、似然函數(shù),,,4、ML估計(jì)量,由對(duì)數(shù)似然函數(shù)求極大,得到參數(shù)估計(jì)量,,,結(jié)果與參數(shù)的OLS估計(jì)

45、相同,分布參數(shù)估計(jì)結(jié)果與OLS不同,注意:ML估計(jì)必須已知Y的分布。只有在正態(tài)分布時(shí)ML和OLS的結(jié)構(gòu)參數(shù)估計(jì)結(jié)果相同。如果Y不服從正態(tài)分布,不能采用OLS。例如:選擇性樣本模型、計(jì)數(shù)數(shù)據(jù)模型等。,附錄:三、矩估計(jì)Moment Method, MM,1、參數(shù)的矩估計(jì),參數(shù)的矩估計(jì)就是用樣本矩去估計(jì)總體矩。 用樣本的一階原點(diǎn)矩作為期望的估計(jì)量。用樣本的二階中心矩作為方差的估計(jì)量。從樣本觀測(cè)值計(jì)算樣本一階(原點(diǎn))矩和二階(原點(diǎn)

46、)矩,然后去估計(jì)總體一階矩和總體二階矩,再進(jìn)一步計(jì)算總體參數(shù)(期望和方差)的估計(jì)量。,樣本的一階矩和二階矩,總體一階矩和總體二階矩的估計(jì)量,總體參數(shù)(期望和方差)的估計(jì)量,,,2、多元線性計(jì)量經(jīng)濟(jì)學(xué)模型的矩估計(jì),如果模型的設(shè)定是正確,則存在一些為0的條件矩。矩估計(jì)的基本思想是利用矩條件估計(jì)模型參數(shù)。,一組矩條件,等同于OLS估計(jì)的正規(guī)方程組。,3、矩估計(jì)法是工具變量方法和廣義矩估計(jì)法的基礎(chǔ),矩估計(jì)利用隨機(jī)干擾項(xiàng)與各解釋變量不相關(guān)特性構(gòu)造

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論