中級(jí)社會(huì)統(tǒng)計(jì)

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-01-06 格式：ppt 頁數(shù)：69 大?。?.77MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

已閱讀1頁，還剩68頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.1,中級(jí)社會(huì)統(tǒng)計(jì),第十五講二元依變項(xiàng)的迴歸分析：分對(duì)數(shù)模型（logit model or logistic model）,OLS無法處理的變數(shù),是否做慈善捐款？是否投票？家庭子女?dāng)?shù)是否尋求民俗醫(yī)療？什麼國(guó)家會(huì)有民主體制中國(guó)廣東省一年抗議事件發(fā)生次數(shù)他們有的是二元依變項(xiàng)，回答有是/非兩種可能，有的則是從0到某個(gè)有限整數(shù)的次數(shù)。有的則是有順序的質(zhì)性變數(shù)統(tǒng)稱為受限的

2、依變數(shù)Limited dependent variable, limdep,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.2,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.3,廣義線性模型GLM,我們之前所討論的「線性迴歸模型」（linear regression model，就是我們用OLS來求解的迴歸模型）其實(shí)屬於一個(gè)更大的統(tǒng)計(jì)模型家族，這就是廣義線性模型generalized linear model,

3、 GLM之前的線性迴歸模型方法只能處理連續(xù)的DV，而且有很多限制（homoscedasticity, 殘差與IV不相關(guān)等）GLM則可以處理DV不符合變異數(shù)齊一性假設(shè)或變異數(shù)常態(tài)分配的連續(xù)變數(shù)、處理間斷性DV。這些DV有時(shí)候也被稱為類別categorical或受限limited依變項(xiàng)可以參照鄭旭智等譯、J. Scott Long原著，類別與受限依變項(xiàng)的迴歸統(tǒng)計(jì)模式。（臺(tái)北：弘智1997）底下的討論主要基於Agresti的Stat

4、istical Methods for the Social Sciences, 3rd ed.,GLM的構(gòu)成,g(x)= α+β1X1+β2X2+…+βkXk所有的GLM都有三個(gè)部分隨機(jī)部分random component：對(duì)DV做其機(jī)率分佈的假設(shè)，在線性迴歸模型中我們假設(shè)為常態(tài)分配。系統(tǒng)部分systematic component：自變項(xiàng)連結(jié)函數(shù)link function：指定依變項(xiàng)Y的期望值（或稱均數(shù)）是如何可以線性地被自

5、變項(xiàng)預(yù)測(cè)的函數(shù)。,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.4,隨機(jī)部分,指定依變項(xiàng)Y以及其機(jī)率分配之前我們所討論的，包括ANOVA在內(nèi)，都預(yù)設(shè)了Y是連續(xù)變數(shù)Y是一個(gè)常態(tài)分配，且具有相同的變異數(shù)。換句話說，ANOVA和一般線性模型都是有著常態(tài)隨機(jī)部分的概化線性模型GLMs with normal random component除此之外，DV也可能是二元變數(shù)（成功/失?。憾?xiàng)分配binomial，適合分對(duì)數(shù)

6、logit模型來分析DV也可能是一個(gè)次數(shù)count：波耳松分配Poisson distributionDV雖然是連續(xù)變數(shù)，但只能取正值，分配會(huì)右偏，，而均數(shù)越大變異也越大，是一種gamma distribution,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.5,系統(tǒng)部分,迴歸方程式等號(hào)右邊的部分α+β1X1+β2X2+…+βkXk,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.6,連結(jié)函數(shù),指定μ=

7、E(Y)是如何關(guān)連到自變數(shù)g(μ)=α+β1X1+β2X2+…+βkXkg(μ)就是連結(jié)函數(shù)link function最簡(jiǎn)單的連結(jié)函數(shù)是g(μ)= μ，這是一個(gè)identity link恆等連結(jié)μ=α+β1X1+β2X2+…+βkXkOLS,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.7,常見的連結(jié)函數(shù),,對(duì)數(shù)連結(jié)log link,g(μ)=ln(μ)100=102=>log10100=2e3=20.

8、056(e≈2.718)=>ln20.056=3在社會(huì)科學(xué)裡，多半時(shí)候log其實(shí)就是指ln在這個(gè)式子裡，不管g(μ)為正或負(fù)， μ恆為正這是一個(gè)對(duì)數(shù)連結(jié)log link，適用於次數(shù)DV用log link的GLM往往被稱為loglinear model,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.9,分對(duì)數(shù)連結(jié)logit link,對(duì)於二元變數(shù)，我們往往指定連結(jié)函數(shù)g(μ)=log(μ/1- μ)在μ介於0

9、與1之間時(shí)適用當(dāng)DV為二元變數(shù)時(shí)，我們可以指定一個(gè)事件發(fā)生的機(jī)率為μ這種迴歸模型稱為logit model,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.10,GLM與最大概似法,GLM在兩個(gè)面向上概化了OLS隨機(jī)部分可以不是常態(tài)分配可以針對(duì)依變項(xiàng)做特定的函數(shù)OLS用最小平方法來估算迴歸係數(shù)，而GLM用一個(gè)不受常態(tài)分配假設(shè)限制的方法─最大概似法maximum likelihood來估算在SAS裡是用proc g

10、enmod這個(gè)指令proc genmod y=x / dist=norm link=identity;在Stata裡是用glm這個(gè)指令glm consum income, family(gamma) link(identity),©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.11,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.12,收入與消費(fèi)p.389,在data editor裡自行輸入資料,©

11、;Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.13,收入與消費(fèi)p.389,Stata沒有內(nèi)建White test的功能，有的是另一個(gè)檢定Cook-Weisberg。一樣是要先run過迴歸分析。,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.14,White Test,,所以拒絕虛無假設(shè)，也等於說變異數(shù)不齊一。,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.15,看圖形判斷,,,©Ming-ch

12、i Chen,社會(huì)統(tǒng)計(jì),Page.16,看圖形判斷,,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.17,看圖形判斷,X越大殘差值越大,Stata與Gamma GLM,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.18,,,Heteroscedasticity & Gamma GLM,依變項(xiàng)y的標(biāo)準(zhǔn)差並非像常態(tài)分配預(yù)設(shè)一般維持不變，而會(huì)隨著均數(shù)增大而增大，根據(jù)圖形以及White test發(fā)現(xiàn)有Hete

13、roscedasticity的問題。設(shè)依變項(xiàng)有著Gamma分配的特質(zhì)Gamma分配的特質(zhì)標(biāo)準(zhǔn)差和均數(shù)等比例增大縮?。ň鶖?shù)倍增標(biāo)準(zhǔn)差也倍增）恆為正、右偏?？ǚ椒峙渚褪且环NGamma分配,二元依變項(xiàng),誰會(huì)做慈善捐款？誰去投票？誰會(huì)去尋求民俗醫(yī)療？什麼廠商西進(jìn)大陸什麼國(guó)家會(huì)有民主體制誰移居到都市/外國(guó)？贊成婚前性行為以上都是社會(huì)科學(xué)關(guān)心的問題，他們都是二元依變項(xiàng)?；卮鹩惺?非兩種可能,©Ming-chi Che

14、n,社會(huì)統(tǒng)計(jì),Page.20,二元依變項(xiàng)的分析,依變項(xiàng)Y有兩種結(jié)果，用機(jī)率的術(shù)語來說就是成功/失敗。也就是Y有1或0兩個(gè)可能值π=E(Y)=P(y=1)表示成功的機(jī)率,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.21,二元依變項(xiàng)的分析,如何用迴歸方程式來預(yù)測(cè)成功的機(jī)率？用線性機(jī)率模型(linear probability model)：π = P(y=1) = α + βX ?問題何在？在自變項(xiàng)X相當(dāng)小時(shí)，機(jī)

15、率π ＜0；而在X很大的時(shí)候， π ＞1但是機(jī)率不可能小於0或大於1而且，自變項(xiàng)的機(jī)率分配是一個(gè)二項(xiàng)分配binomial distribution，用常態(tài)分配假設(shè)有其不適之處。怎麼辦？,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.22,線性機(jī)率模型,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.23,π,1,0,x,linear,勝算與羅吉斯轉(zhuǎn)換,可以把依變項(xiàng)做一些適當(dāng)?shù)霓D(zhuǎn)換π/(1- π)稱為勝算

16、odds，是賭徒常用的機(jī)率計(jì)算方式，就是成功/不成功的比。勝算介於0和∞之間。這樣的轉(zhuǎn)換只解決了一部份的問題再把勝算取自然對(duì)數(shù)log[π/(1- π)]，這個(gè)過程稱羅吉斯轉(zhuǎn)換logistic transformation又稱logit。這樣轉(zhuǎn)換之後， log[π/(1- π)]就會(huì)介於-∞和∞之間了(probit和complementary log-log轉(zhuǎn)換也有類似的效果),©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Pag

17、e.24,Odds勝算,今天下午新竹降雨機(jī)率為74％，折算成下雨的勝算為？Odds=0.74/(1-0.74)=2.846新興民主化國(guó)家在政權(quán)轉(zhuǎn)型後一年內(nèi)發(fā)生軍事政變的機(jī)率為15％，則發(fā)生政變的勝算為？Odds=0.15/(1-0.15)=0.176勝算這個(gè)概念雖然沒有機(jī)率來得符合我們的直覺，但應(yīng)該還不難理解。,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.25,Odds ratio勝算比,我們也常用勝算比（odd

18、s ratio）來表達(dá)兩個(gè)勝算之間的關(guān)係今天下午新竹下雨的機(jī)率是74％，而苗栗下雨的機(jī)率是65％。新竹下雨的勝算是2.846，苗栗則是1.444新竹和苗栗今天下午下雨的勝算比是2.846/1.444=1.971,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.26,Logistic Regression Model,當(dāng)π從0增加到1時(shí)，odds從0增加到∞，而分對(duì)數(shù)logit則從- ∞增加到∞。當(dāng)π=1/2時(shí)，odd

19、s=1，而logit=0當(dāng)π＞1/2時(shí)，logit＞0當(dāng)π＜1/2時(shí)，logit＜0,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.27,Logistic Regression Model,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.28,,,π,1,0,x,linear,Logistic, β > 0,Logistic, β < 0,Logistic Regression Model,當(dāng)β

20、>0，X變大，π也變大當(dāng)β<0，X變大，π變小| β |越大，logistic曲線越陡但是在logistic regression model裡，這不是斜率的意思。,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.29,Logistic曲線的切線斜率,斜率會(huì)隨著X不同而不同。如果π=0.5，則勝算odds π/(1- π)=1log[π/(1- π)]=0 0=α+βXX=-α/β當(dāng)X=-α/β，

21、 π=0.5,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.30,,β π(1- π)是logistic曲線在特定π值時(shí)的切線斜率若自變項(xiàng)X預(yù)測(cè)得知π=0.5則，在這個(gè)X值上切線的斜率是0.25 β當(dāng)π=1/2時(shí)，切線斜率最大，logit=0，也就是當(dāng)X=-α/ β時(shí)。,Stata與logit regression,用88q1的資料我們想要瞭解什麼樣的人會(huì)捐錢幫助別人？在Stata裡依變項(xiàng)失?。]有捐錢）要以0來表

22、示gen donation=v54這是為了不動(dòng)原資料方便轉(zhuǎn)換Tab donation看有無異常值Recode donation (2=0),©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.32,Stata與logit regression,gen h_inc=v47家戶月平均收入用do檔來方便作轉(zhuǎn)換,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.33,,Stata與logit regression,&#

23、169;Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.34,把這個(gè)do file個(gè)容易記得的地方和名字存起來。,Stata與logit regression,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.35,,找到你放do file的檔案夾執(zhí)行。,Stata與logit regression,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.36,,亦可用glm donation h_inc, family(

24、binomial) link(logit),State與線性機(jī)率模型,前面的係數(shù)太小，因?yàn)槭杖胧且栽獮閱挝?，試以萬元作為單位。gen demi_inc=h_inc/10000tab demi_inc看分佈狀況,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.37,?以上得出線性機(jī)率模型linear probability model,LPM捐款機(jī)率＝P(y=1)=0.7028+0.008554*以萬元計(jì)的家戶月收入,S

25、tata & Logit regression,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.38,logit regression,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.39,?也就是說，根據(jù)logistic迴歸模型的預(yù)測(cè)，受訪者的家庭月收入10萬元會(huì)有79.5％的機(jī)會(huì)捐款。,?若某個(gè)受訪者的家庭月收入為10萬元，則捐款的機(jī)率為,Stata與logit regression,©Mi

26、ng-chi Chen,社會(huì)統(tǒng)計(jì),Page.40,Stata logistic指令產(chǎn)生的係數(shù)不是logistic regression model的係數(shù)，而是odds ratio，也就是eβ，這也可以用計(jì)算機(jī)取反對(duì)數(shù)自行計(jì)算出來。,,詮釋連續(xù)自變數(shù)的logit迴歸係數(shù),©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.41,?針對(duì)連續(xù)自變數(shù)的logit迴歸係數(shù)，一般而言我們可以這樣了解，在控制了其他自變數(shù)以後，連續(xù)自變數(shù)X每增

27、加一個(gè)單位，一變數(shù)Y的勝算增加100＊（eβ-1）％,詮釋dummy variable logit迴歸係數(shù),先對(duì)迴歸係數(shù)作反對(duì)數(shù)轉(zhuǎn)換，求eβ這個(gè)數(shù)值乘上100％就是虛擬變數(shù)值為1的和虛擬變數(shù)值為0前對(duì)後的百分比差距,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.42,Logit迴歸模型與虛擬變數(shù),以前面的88q1這個(gè)資料為例，v1為受訪者性別，1為男，2是女。轉(zhuǎn)換成虛擬變數(shù)dummy variablegen sex=

28、1replace sex=0 if v1==2tab sex,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.43,Logit迴歸模型與虛擬變數(shù),©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.44,,男生比女生更傾向不捐款，e-0.1818416=0.8337，也就是說在控制了家庭收入之後，男生捐款的勝算（機(jī)會(huì)）是女生的83.37%,Stata與虛擬變數(shù)：xi指令,宗教與慈善捐款的關(guān)係v49:1"

29、;佛教" 2"道教" 3"民間信仰" 4"一貫道" 5"軒轅教" 6"回教” 7"天主教" 8"基督教" 9"沒有宗教信仰" 10"其他“gen relig=. If v49==6 | v49==10replace relig=1 if v49==1replac

30、e relig=2 if v49==2 | v49==3 | v49==4 | v49==5replace relig=3 if v49==7 | v49==8replace relig=4 if v49==9,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.45,Stata與虛擬變數(shù)：xi指令,expand interactions這個(gè)作法是讓Stata自動(dòng)針對(duì)類別自變項(xiàng)產(chǎn)生數(shù)個(gè)虛擬變數(shù)。xi, prefix(in

31、d) i.relig所有虛擬變數(shù)以ind做開頭，以relig的類別來做虛擬變數(shù)，產(chǎn)生indrelig_1, indrelig_2, indrelig_3, indrelig_4共四個(gè)虛擬變數(shù)另一個(gè)方法則是讓Stata自己設(shè)定虛擬變數(shù)xi i.religi.relig indrelig_1-4 (naturally coded; indrelig_1 omitted)分?jǐn)?shù)最小的那一組（佛教是1）被當(dāng)成對(duì)照,©Ming-c

32、hi Chen,社會(huì)統(tǒng)計(jì),Page.46,,我們可用char relig[omit]4指定relig第四組（無宗教信仰）為對(duì)照，虛擬變數(shù)組名稱為_I原變數(shù)名稱_*分別tab _Irelig_1、_Irelig_2、和_Irelig_3看是否合乎原來的宗教變數(shù),Stata與虛擬變數(shù)：xi指令,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.48,,,,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.49,,在其他

33、條件皆相等的情況下，佛教徒比無神論者捐款的勝率為289.6％；道教/民間信仰比無神論者捐款的勝率為231.26％；基督天主教比無神論捐款的勝率為233.07％,logistic regression model的統(tǒng)計(jì)推論,多半的統(tǒng)計(jì)軟體會(huì)報(bào)告?zhèn)€別自變項(xiàng)的Wald統(tǒng)計(jì)量，方便我們判斷係數(shù)是否到達(dá)顯著水準(zhǔn)H0:β=0Wald統(tǒng)計(jì)量是β除以其標(biāo)準(zhǔn)誤結(jié)果統(tǒng)計(jì)量Z的平方Wald statistics是一個(gè)依循卡方分配的統(tǒng)計(jì)量不過Stata

34、報(bào)告標(biāo)準(zhǔn)統(tǒng)計(jì)量Z，意思跟解讀都是相近的。,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.50,Logit迴歸係數(shù)的Z檢定,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.51,性別這個(gè)自變項(xiàng)沒有達(dá)到顯著水準(zhǔn)，無法拒絕這個(gè)變數(shù)對(duì)捐款沒有影響的虛無假設(shè)。而收入和所有的宗教虛擬變數(shù)都到達(dá)顯著水準(zhǔn)。,Logit迴歸係數(shù)的Wald檢定,透過將前表中的Z值取平方得到Wald檢測(cè)統(tǒng)計(jì)量，然後查卡方分配表。先進(jìn)行過logit

35、或logistic的Stata分析後，可以用test 自變數(shù)名稱這個(gè)指令產(chǎn)生Wald檢測(cè)統(tǒng)計(jì)量。例如：test sex的結(jié)果如下,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.52,?這個(gè)1.75正就是前面Z統(tǒng)計(jì)量-1.32的平方（─1.32是四捨五入過了，所以有誤差），檢測(cè)一個(gè)IV，所以自由度=1，結(jié)論是性別這個(gè)IV不顯著,,虛無假設(shè)H0:βsex=0,Logit迴歸係數(shù)信賴區(qū)間,前表中，我們看到_Irelig_1的9

36、5%的信賴區(qū)間是[0.7154, 1.4113]，如何解讀？首先取antilog， [e0.7154, e1.4113]=[2.0449, 4.1012]意思是佛教徒捐款的勝算有百分之九十五的機(jī)會(huì)是無神論者的2.0449到4.1012倍。Stata logistic指令直接給我們估計(jì)勝算的區(qū)間（看前面logistic迴歸的最後兩欄數(shù)值）,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.53,Likelihood-rat

37、io test,可以用來比較增加新的變項(xiàng)（組）前後 likelihood ratio的改變我們可以令L0為當(dāng)虛無假設(shè)為真的時(shí)候概似函數(shù)的最大值，而L1則為虛無假設(shè)為不真時(shí)概似函數(shù)的最大值。虛無假設(shè)是所有新增的自變數(shù)係數(shù)相等且等於0，例如在一個(gè)僅有單一IV的模型，我們的虛無假設(shè)是這個(gè)IV的係數(shù)為0Likelihood-ratio test統(tǒng)計(jì)量：,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.54,?log(L0/L1

38、)前面乘以-2是因?yàn)檫@樣在大樣本時(shí)才會(huì)符合卡方分配，使我們得以檢驗(yàn)檢定統(tǒng)計(jì)量。這個(gè)統(tǒng)計(jì)量的自由度就等於我們兩模型之間自變數(shù)個(gè)數(shù)的差異，比如說一個(gè)單一IV的模型和一個(gè)沒有任何IV的模型相比，其自由度為1。,Likelihood-ratio test: an example,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.55,,和沒有任何自變數(shù)的模型（log likelihood=-1004.2316）比較， (-2logL

39、0)-(-2logL1)的卡方值為68.31，在自由度=5（自變數(shù)個(gè)數(shù)）的情況下，犯型一錯(cuò)誤α<0.0001，這和一般迴歸分析中的F檢定類似,,Likelihood-ratio test & Wald test,針對(duì)logistic regression model裡個(gè)別自變項(xiàng)係數(shù)的統(tǒng)計(jì)檢定，除了Wald test和Z test以外，我們也可以用likelihood-ratio檢定，比較去除某個(gè)IV的模型和原來模型的log

40、 likelihood，來檢測(cè)其係數(shù)是否顯著（自由度＝1）大樣本時(shí)，Wald檢測(cè)和likelihood-ratio檢測(cè)有相似的結(jié)果。在中小型樣本時(shí)，最好選擇用likelihood-ratio,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.56,Logit迴歸係數(shù)的likelihood-ratio檢定,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.57,,如果不是要Stata自己對(duì)類別變項(xiàng)產(chǎn)生虛擬變項(xiàng)就不需

41、要加xi；quietly是要Stata不用產(chǎn)生表格，但相關(guān)數(shù)值還在記憶體裡。我們把相關(guān)數(shù)值用est store a記成a。接下來建立一個(gè)沒有性別的模型，相關(guān)數(shù)值記成b,,,,,用lrtest a b, stats來比較a、b兩模型的log likelihood,,Likelihood-ratio=1.76=(-2logL0)-(-2logL1)=[-2*(-970.9538)]-[-2*(-970.0759)]自由度=1，P值為0.1

42、852，結(jié)論是性別這個(gè)IV不顯著,,Likelihood-ratio test,Likelihood-ratio test可以用來檢測(cè)nested models變數(shù)多的模型和變數(shù)少的模型的log likelihood的差異乘以-2這趨近於卡方分配，其自由度為多出來的變項(xiàng)個(gè)數(shù)這就好像OLS裡在nested模型間來判斷新加入一組變項(xiàng)是否顯著的F檢定一般。全模型也可以看IV有無聯(lián)合解釋力，這就是Stata右上角的檢定數(shù)值的意義，和複線

43、性迴歸全模型的F檢定一樣。,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.58,Likelihood-ratio test: an example,我們加入了宗教信仰的一組三個(gè)虛擬變數(shù)以後，log likelihood=-970.07593沒有宗教信仰相關(guān)的虛擬變數(shù)的logit迴歸模型log likelihood=-993.36151(-2logL0)-(-2logL1)=[-2(-993.36151)]-[-2(-9

44、70.07593)]=46.57116自由度為3χ23, 0.01=11.34<46.57，意謂宗教這一組類別變數(shù)顯著，可以拒斥H0:β_Irelig_1= β _Irelig_2= β _Irelig_3=0,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.59,一組虛擬變數(shù)的LR檢定,xi: quietly logit donation demi_inc sex i.religest store aquie

45、tly logit donation demi_inc sex if relig!=.這是只跑那些宗教不是缺失值missing value的個(gè)案，以免發(fā)生模型間樣本量不同而不能比較的狀況。est store clrtest a c, stats,©Ming-chi Chen,社會(huì)統(tǒng)計(jì),Page.60,自由度=3，兩模型間有三個(gè)虛擬變項(xiàng)的差異，P值小於0.0001，拒絕虛無假設(shè)（三個(gè)係數(shù)都=0，也就是宗教對(duì)捐款有影響。,Or

46、dered Logit,前面的logit regression處理的依變項(xiàng)是二元變數(shù)（是/不是）。Logit regression也可以用來處理多元的順序尺度的依變數(shù)（非常不滿意、滿意、中立、不滿意、非常不滿意）稱之為ordered logit、ordinal logit、proportional odds model在Stata裡是用ologit這個(gè)指令來處理比如說我們要解釋個(gè)人的宗教參與度（幾乎沒有或從來沒有、每年至少一次、每

47、個(gè)月至少一次）這是一個(gè)順序尺度的變項(xiàng),累進(jìn)機(jī)率與Logit,我們?cè)诖颂幱美圻M(jìn)機(jī)率cumulative probabilities的概念作為基礎(chǔ)令P(y≦j)代表回答落在j這個(gè)類屬或以下的機(jī)率（1, 2, …,j）以宗教參與度為例P(y=1)P(y≦2)=P(y=1)+ P(y=2)P(y≦3)=1,累進(jìn)機(jī)率與Logit,每個(gè)類屬j或以下的勝算odds是P(y≦j)/ P(y＞j)每一個(gè)累進(jìn)機(jī)率都可以被轉(zhuǎn)換成「高於」

48、或「低於」的二元變數(shù)的勝算A popular logistic model for an ordinal response uses logits of the cumulative probabilities,cumulative logits,以宗教參與為例,Cumulative Logit Models for an Ordinal Response,A model can simultaneously describe the

49、 effect of an explanatory variable on all the cumulative probabilities for y.對(duì)於每個(gè)累積機(jī)率，這個(gè)模型就像是一般的羅吉斯模型，每一組自變項(xiàng)都可分成「高於」和「低於」特定的類屬j。這個(gè)模型是Logit[P(y≦j)]=αj+βx, j=1, 2, …,c-1.In this model, β does not have a j subscript.It

50、 has the same value for each cumulative logit. In other words, the model assumes that the effect of x is the same for each cumulative probility.This cumulative logit model with this common effect is often called the pr

51、oportional odds model比例勝算模型,Cumulative Logit Models for an Ordinal Response,For each j, the odds that y≦j multiply by eβ for each one-unit increase in x.Model fitting treats the observations as independent from a multin

52、omial distribution.This is a generalization of the binomial distribution from two to multiple outcome categories.Software estimates the parameters using all the cumulative probabilities at once. This provides a single

53、 estimate beta-hat for the effect of x, rather than the thress separate estimates we’d get by fitting the model seperately for each cumulative probability.,,92q2資料，討論宗教信仰與教育程度（年數(shù)）對(duì)宗教參與度的影響,Logistic Models for Nominal Res

眾賞文庫> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

中級(jí)社會(huì)統(tǒng)計(jì)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

中級(jí)社會(huì)統(tǒng)計(jì)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載