2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩52頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Logistic回歸分析,胡利人流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室,2024/3/21,2,回歸分析的分類(lèi),多個(gè)因變量(y1,y2,…yk),一個(gè)因變量 y,2024/3/21,3,,醫(yī)學(xué)研究中常碰到應(yīng)變量的可能取值僅有兩個(gè)(即二分類(lèi)變量),如發(fā)病與未發(fā)病、陽(yáng)性與陰性、死亡與生存、治愈與未治愈、暴露與未暴露等,顯然這類(lèi)資料不滿足多重線性回歸的條件,什么情況下采用Logistic回歸?,2024/3/21,4,logistic回歸(logist

2、ic regression)是研究因變量為二分類(lèi)或多分類(lèi)觀察結(jié)果與影響因素(自變量)之間關(guān)系的一種多變量分析方法,屬概率型非線性回歸。在分析疾病與各種危險(xiǎn)因素間的定量關(guān)系,同時(shí)為了能真實(shí)反映暴露因素與觀察結(jié)果間的關(guān)系,需要控制混雜因素的影響,已知主要控制混雜的方法包括:分層分析和多重回歸。,2024/3/21,5,控制混雜因素的方法,(1)Mantel-Haenszel分層分析:適用于樣本量大、分析因素較少的情況。 當(dāng)分層較多

3、時(shí),由于要求各格子中例數(shù)不能太少,所需樣本較大,往往難以做到; 當(dāng)混雜因素較多時(shí),分層數(shù)也呈幾何倍數(shù)增長(zhǎng),這將導(dǎo)致部分層中某個(gè)格子的頻數(shù)為零,無(wú)法利用其信息。,2024/3/21,6,2024/3/21,7,按飲酒與否分層計(jì)算OR值,2024/3/21,8,(2)線性回歸分析: 由于因變量是分類(lèi)變量,不能滿足其正態(tài)性要求;有些自變量對(duì)因變量的影響并非線性。,2024/3/21,9,logistic回歸:研究某個(gè)二分類(lèi)

4、(或無(wú)序及有序多分類(lèi))目標(biāo)變量與有關(guān)因素的關(guān)系,不僅適用于病因?qū)W分析,也可用于其他方面的研究 。 logistic回歸的分類(lèi): (1)二分類(lèi)資料logistic回歸 非條件logistic回歸 條件logistic回歸(配對(duì)或配比資料) (2)多分類(lèi)資料logistic回歸,2024/3/21,10,非條件logistic回歸,用途,探討二項(xiàng)分類(lèi)結(jié)果變量發(fā)生概率的主要影響因素, 臨床上常用于篩選與疾

5、病預(yù)后的主要影響因素,評(píng)價(jià)治療措施的效果,應(yīng)用條件,應(yīng)變量為二項(xiàng)分類(lèi)變量,自變量可以是定量變量 ,也可以是分類(lèi)變量,2024/3/21,11,2024/3/21,12,RR(相對(duì)危險(xiǎn)度relative risk):表示暴露組與非暴露組發(fā)病率(或死亡率)的比值。也稱為危險(xiǎn)比(risk ratio)。反映了暴露與疾病發(fā)生的關(guān)聯(lián)強(qiáng)度。RR表明暴露組發(fā)病或死亡的危險(xiǎn)是非暴露組的多少倍。,2024/3/21,13,2024/3/21,14,相對(duì)

6、危險(xiǎn)度RR的本質(zhì)是暴露組與非暴露組發(fā)病率之比或發(fā)病概率之比。但病例對(duì)照研究不能計(jì)算發(fā)病率,只能計(jì)算比值比OR值。 OR與RR的含義是相同的,也是指暴露組的疾病危險(xiǎn)性為非暴露組的多少倍。當(dāng)疾病發(fā)病率小于5%時(shí),OR是RR的極好近似值。,OR>1,說(shuō)明 該因素使疾病的危險(xiǎn)性增加,為危險(xiǎn)因素;OR<1,說(shuō)明 該因素使疾病的危險(xiǎn)性減小為保護(hù)因素.,2024/3/21,15,Logistic回歸模型的構(gòu)造,設(shè)x1, x2

7、 , … , xp為一組自變量,y為應(yīng)變量。當(dāng)y是陽(yáng)性反應(yīng)時(shí),記為y=1;當(dāng)y是陰性反應(yīng)時(shí),記為y=0。用P表示發(fā)生陽(yáng)性反應(yīng)的概率;用1-P就是發(fā)生陰性反應(yīng)的概率,2024/3/21,16,logistic回歸模型,,上式中, β0 為常數(shù)項(xiàng), βj為偏回歸系數(shù),2024/3/21,17,2024/3/21,18,優(yōu)勢(shì)(Odds): 優(yōu)勢(shì)比(Odds ratio) 表示一個(gè)暴露水平與另一個(gè)暴露水平相比,所引起某種結(jié)局的危險(xiǎn)

8、度之比 OR 與βj 之間的關(guān)系:,偏回歸系數(shù)βj 的流行病學(xué)意義,在其他自變量固定不變的情況下,自變量 xj 的暴露水平每改變一個(gè)測(cè)量單位時(shí),所引起的優(yōu)勢(shì)比OR 的自然對(duì)數(shù)改變量,2024/3/21,19,2024/3/21,20,,2024/3/21,21,對(duì)于發(fā)病率很低的慢性疾病如心腦血管病、惡性腫瘤等,優(yōu)勢(shì)比可作為相對(duì)危險(xiǎn)度(relative risk , RR)的近似估計(jì)。即:,,2024/3/21,22,參數(shù)估計(jì)

9、與假設(shè)檢驗(yàn),參數(shù)估計(jì):構(gòu)造似然函數(shù),采用極大似然函 數(shù)法求解假設(shè)檢驗(yàn),似然比法 Wald 檢驗(yàn)法,2024/3/21,23,,,,2024/3/21,24,觀察例數(shù),2024/3/21,25,,2024/3/21,26,2024/3/21,27,logistic回歸模型的假設(shè)檢驗(yàn),2024/3/21,28,2024/3/21,29,對(duì)所擬合模型的假設(shè)檢驗(yàn):,2024/3/21,30,變量篩選,2024/3/21

10、,31,實(shí)例分析,,2024/3/21,32,2024/3/21,33,2024/3/21,34,SAS程序,data a;input x1 x2 x3 x4 x5 x6 x7 y;cards;0015.652.343.611.9800006.233.892.110.9901015.142.732.881.020…………………0004.31.792.641.311

11、103.350.811.681.311104.781.42.150.9911105.231.123.691.0311102.891.21.951.391;proc logistic des;model y=x1-x7;run;,2024/3/21,35,,,,2024/3/21,36,,2024/3/21,37,逐步回歸分析,proc logistic des;mod

12、el y=x1-x7/stb selection=stepwise sle=0.1 sls=0.1;run;,用逐步回歸法擬合模型,變量選入和剔除水平均為0.10,2024/3/21,38,,,,2024/3/21,39,,,2024/3/21,40,2024/3/21,41,logistic逐步回歸分析篩選出三個(gè)有統(tǒng)計(jì)學(xué)意義的變量為x2、x4和x7,回歸系數(shù)分別為1.7324、-2.1630和4.2578。吸煙(x2)的優(yōu)勢(shì)比5.

13、645,表示在控制其他因素后吸煙者 (x2=1)發(fā)生該病的危險(xiǎn)性是不吸煙者(x2=0)的5.645倍膽固醇(x4)是保護(hù)因素,表示控制其他因素影響后,膽固醇每增加一個(gè)單位發(fā)生該病的危險(xiǎn)性是原來(lái)的0.115倍。,2024/3/21,42,結(jié)果中還給出了標(biāo)準(zhǔn)化偏回歸系數(shù),高密度脂蛋白(x7)引起腔隙性腦梗死多發(fā)的危險(xiǎn)性大于吸煙(x2),而膽固醇(x4)是保護(hù)因素。,,2024/3/21,43,,2024/3/21,44,logistic回歸

14、的應(yīng)用及其注意事項(xiàng),一、logistic回歸的應(yīng)用1. 流行病學(xué)危險(xiǎn)因素分析 logistic回歸分析參數(shù)的流行病學(xué)含義清楚,即得到某一危險(xiǎn)因素的回歸系數(shù) 后,可以方便的估計(jì)出該因素在不同水平下的OR值或近似RR值,非常適合于流行病學(xué)研究。 在流行病學(xué)危險(xiǎn)因素研究中,為了排除混雜因素的影響,可以通過(guò)擬合包含多變量的logistic回歸模型,得到調(diào)整后的優(yōu)勢(shì)比。,2024/3/21,45,2. 臨床試驗(yàn)數(shù)據(jù)分析

15、 臨床評(píng)價(jià)某種藥物或治療方法的效果,非處理因素在試驗(yàn)組和對(duì)照組間分布不均衡,就有可能夸大或掩蓋實(shí)驗(yàn)組的治療效果。 盡管在分組時(shí)要求按隨機(jī)化原則分配,但由于樣本含量有限,非處理因素在試驗(yàn)組和對(duì)照組間的分布仍可能不均衡,需要在分析階段對(duì)構(gòu)成混雜的因素進(jìn)行調(diào)整,當(dāng)評(píng)價(jià)指標(biāo)為兩分類(lèi)變量時(shí),可以利用logistic回歸分析得到調(diào)整后的藥物或某種治療方法的評(píng)價(jià)結(jié)果。,2024/3/21,46,3.預(yù)測(cè)與判別 Logi

16、stic回歸模型是一個(gè)概率型模型,對(duì)非條件Logistic回歸,在給定的條件下可通過(guò)logistic回歸模型計(jì)算某事件發(fā)生的概率。因此可以利用它預(yù)測(cè)某事件發(fā)生的概率。在臨床上也可以根據(jù)疾病與臨床檢查指標(biāo)資料,建立logistic回歸模型,對(duì)新的對(duì)象可根據(jù)其臨床檢查指標(biāo),計(jì)算其患某種疾病的概率的大小,進(jìn)行判別分析。,2024/3/21,47,,某患者吸煙(x2=1),膽固醇水平(x4=5.7) 高密度脂蛋白(x7=2.0

17、) ,則該患者多發(fā)腔隙性腦梗死的概率是P=?,2024/3/21,48,二、注意事項(xiàng) 1、數(shù)值變量資料的賦值 若自變量是數(shù)值變量,最好將其按變量值的大小分成幾組,按順序賦值為1,2,3…k,否則參數(shù)的實(shí)際意義可能不明確。 例如,對(duì)于年齡變量,如果利用實(shí)際數(shù)值則求出的OR值表示年齡每增加一歲時(shí)的優(yōu)勢(shì)比,實(shí)際意義不大。,2024/3/21,49,如果將年齡分成幾個(gè)不同的水平(年齡段),就比較容易解釋?zhuān)?/p>

18、處理上也比較靈活,分析時(shí)既可以按得分處理,也可以將其化作k-1個(gè)啞變量(dummy variable),啞變量法強(qiáng)調(diào)參數(shù)解釋?zhuān)渌魉降那橄鄬?duì)水平1的優(yōu)勢(shì)比;任意兩水平的優(yōu)勢(shì)比可以由相應(yīng)的回歸系數(shù)之差得到。,,,2024/3/21,50,年齡(歲)xage,2024/3/21,51,2、因變量賦值 與分類(lèi)變量賦值方法相同,但需注意“陽(yáng)性反應(yīng)”的賦值,如果因變量賦值的順序相反,回歸系數(shù)絕對(duì)值不變,但符號(hào)相反。在SAS軟件的lo

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論