兩變量關聯(lián)性分析介紹_第1頁
已閱讀1頁,還剩41頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第十一章 兩變量關聯(lián)性分析,,,,一般地,兩個連續(xù)隨機變量間的線性聯(lián)系稱為線性相關(linear correlation),也稱為簡單相關(simple correlation),兩個分類變量間的聯(lián)系則稱為關聯(lián)(association)。,散點圖,判斷兩個變量是否具有相關關系最直觀的辦法是繪制散點圖(scatter plot),在實際研究中也是首先要做的一步。將兩變量置于直角坐標軸上,把其中一變量取作X, 另一個取作Y,據(jù)此在直角坐

2、標系(X,Y ) 中標出對應的點來,這樣的圖形稱作散點圖。常見的散點圖如圖11-2所示。,相關的種類,1)正相關(positive correlation):一般地,在圖中若有隨增大而線性上升的趨勢,則稱為正相關。2)負相關(negative correlation):在圖中若有隨增大而線性下降的趨勢,則稱負相關。3)零相關(zero correlation):在圖中若或不隨另一變量的改變而改變 ,則稱零相關。4)非線性相關(no

3、nlinear correlation) :若散點呈曲線形狀,則變量間可能呈曲線關系,不宜做線性相關。,關聯(lián)強度指標--相關系數(shù),意義:相關系數(shù)(correlation coefficient)又稱Pearson積差相關系數(shù),用來說明具有直線關系的兩變量間相關的密切程度與相關方向。,2. 計算:樣本相關系數(shù)的計算公式為,(11-3),,相關系數(shù)的特點,1.相關系數(shù)r是一個無量綱的數(shù)值,且-10為正相關,r<0為負相關;3./

4、r/越接近于1,說明相關性越好./r/越接近于0,說明相關性越差.,例11-2 計算例11-1中凝血酶濃度X與凝血酶時間Y之間樣本相關系數(shù)。 由例11-1得 , , 由公式11-3得,,,,,,,,,相關系數(shù)的統(tǒng)計推斷,相關系數(shù)的假設檢驗直接查相關系數(shù)臨界值表;

5、 t檢驗 (11-5) (11-6),,,例11-3 繼例11-2中算得r=-0926后,試檢驗相關是否具有統(tǒng)計學意義,檢驗步驟,本例

6、n=15,r=-0.926,由公式(11-4)和公式(11-5)得,,本例 ,查 界值表得 ,故拒絕 接受 ,認為凝血酶濃度與凝血酶時間之間存在負相關。此結果與查表的結果是一致的。,線性相關中應注意的問題,1.樣本的相關系數(shù)接近零并不意味著兩變量間一定無相關性.兩個有聯(lián)系的變量并非都屬線性聯(lián)系。兩變量間無線性關系,但卻存在非線性的曲線聯(lián)系。例如,很高血壓和很低血

7、壓的人死亡率均較高, 而中等血壓的人死亡率較低, 于是, 死亡率和血壓之間有曲線性聯(lián)系。還有如血液濃度與時間之間的關系、某放射性污染物對環(huán)境的污染濃度與污染源距離之間的關系等,都有曲線性聯(lián)系,但它們的樣本相關系數(shù)卻都接近零。 故通常應先繪出樣本值的散點圖,利用散點圖可直觀地判斷兩變量之間是否具有線性聯(lián)系。,,2.一個變量的數(shù)值人為選定時莫作相關..一個變量的數(shù)值隨機變動,另一個變量的數(shù)值卻是人為選定的。例如, 為研究藥物的劑量-

8、反應關系,,3.出現(xiàn)異常值時甚用相關.,,4.相關未必真有內(nèi)在聯(lián)系.,,5.分層資料盲目合并易出假象,,第二節(jié) 秩相關(rank correlation),等級相關,適用條件:,①資料不服從雙變量正態(tài)分布而不宜作積差相關分析;②總體分布型未知,一端或兩端是不確定數(shù)值(如<10歲,≥65歲)的資料;③原始數(shù)據(jù)用等級表示的資料。,一、Spearman秩相關,1. 意義:等級相關系數(shù)rs用來說明兩個變量間直線相關關系的密切程度與

9、相關方向。2. 計算公式 d為p,q之差,例11-4 某地研究2~7歲急性白血病患兒的血小板數(shù)與出血癥狀程度之間的相關性,結果見表11-2,試用秩相關進行分析,表11-2 急性白血病患兒的血小板(109/L)和出血癥狀,利用表11-2中的數(shù)據(jù)容易算得 秩相關系數(shù)為負,說明兩變量間有負相關關系,同樣由樣本算得的秩相關系數(shù)是否有統(tǒng)計學意義,也應做檢驗,,,,,秩相關系數(shù)的統(tǒng)計推斷,檢驗步驟

10、假設檢驗 統(tǒng)計推斷 當 時,可查書后的 臨界值表,若秩相關系數(shù)超過臨界值,則拒絕 ;當 時,也可采用公式(11-5)或(11-6)式做 檢驗,,,,,,,,,,,,,,例11-5 對例1-4的秩相關系數(shù)作假設檢驗,例11-4中算得 查 臨界值表, ,按

11、 的水準,不能拒絕 ,可以認為急性白血病患兒的出血癥狀與血小板數(shù)之間無相關關系,,,,,,第三節(jié) 分類變量的關聯(lián)性分析,適用條件對定性變量之間的聯(lián)系通用的方法是根據(jù)兩個定性變量交叉分類基數(shù)所得的頻數(shù)資料(列聯(lián)表)作關聯(lián)性分析,即關于兩種屬性獨立性的卡方檢驗計算公式,,,,交叉分類2×2表的關聯(lián)分析,例11-6 為觀察嬰兒腹瀉是否與喂養(yǎng)方式有關,某醫(yī)院兒科隨機收集了消化不良的嬰兒82例,對每個個體分別觀察腹瀉

12、與否和喂養(yǎng)方式兩種屬性,2×2種結果分類記述如表11-3所示,試分析兩種屬性的關聯(lián)性。,表11-3嬰兒腹瀉與喂養(yǎng)方式的關系,假設檢驗 :喂養(yǎng)方式與嬰兒腹瀉之間相互獨立 :喂養(yǎng)方式與嬰兒腹瀉之間有關聯(lián)將表中各數(shù)據(jù)代入公式(7-7)得 , 拒絕原假設,說明嬰兒腹瀉與喂養(yǎng)方式之間存在關聯(lián)性.,,,,,,,表11-3 嬰兒腹瀉與喂養(yǎng)方

13、式的關系,兩個分類變量關聯(lián)的程度--Pearson列聯(lián)系數(shù) (contingency coefficient),二 2×2配對資料的關聯(lián)性分析,例11-7 有56份咽喉涂抹標本,把每份標本一分為二,依同樣的條件分別接種于甲乙兩種白喉桿菌培養(yǎng)基上,觀察白喉菌生長的情況,結果如表11-5,問兩種培養(yǎng)基的結果有無關聯(lián)?,表11-5 兩種白喉桿菌培養(yǎng)結果,假設檢驗 :兩種培養(yǎng)基的結果之間互相獨立

14、 :兩種培養(yǎng)基的結果之間有關聯(lián)將本例數(shù)據(jù)代入公式(7-7)得有理由拒絕零假設,可以認為甲、乙兩種培養(yǎng)基之間存在關聯(lián)性,,,,,,三 R×C表分類資料的關聯(lián)性分析,例11-8 某地居民主要有三種祖籍,均流行甲狀腺腫。為探索甲狀腺腫類型與祖籍是否有關聯(lián),現(xiàn)根據(jù)居民甲狀腺腫篩查結果,按甲狀腺腫類型與祖籍兩種屬性交叉分類,得表11-6的資料。問甲狀腺腫類型與祖籍見有否關聯(lián)?,表11-6 某地居民按甲

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論