版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、方差分析(ANOVA),,,,,,,例子:某研究者在某單位工作人員中進行了體重指數(shù)(BMI)抽樣調查,隨機抽取不同年齡組男性受試者各16名,測量了被調查者的身高和體重值,由此按照BMI=體重/身高2公式計算了體重指數(shù),請問,不同年齡組的體重指數(shù)有無差異。,,一、方差分析的基本思想,5,思想來源: 觀察值總變異可以分解為組間變異和組內變異,6,總變異(Total variation): 全部測量值Xij與總均數(shù) 間的差異
2、組間變異(between group variation ): 各組的均數(shù) 與總均數(shù) 間的差異組內變異(within group variation ):每組的每個測量值 與該組均數(shù) 的差異,可用離均差平方和反映變異的大小,,1. 總變異: 所有測量值之間總的變異程度,SS總,2.組間變異:各組均數(shù)與總均數(shù)的離均差平方和, SS組間,SS組間反映了各組均數(shù) 的變異程度組間變異=①隨機誤差+②
3、處理因素效應,3.組內變異:用各組內各測量值Xij與其所在組的均數(shù)差值的平方和來表示,SS組內,SS組內反映隨機誤差的影響(個體差異和測量誤差)。,,,,,,,,,均方差,均方(mean square,MS),VS,VS,組間均方與組內均方比值越小,樣本越可能來源于同一個總體,比值越大,樣本越可能不是來源于一個總體,,,,,,,,,二、F 值與F分布,,,如果各組樣本的總體均數(shù)相等(H0成立),即各處理組的樣本來自相同總體,無處理因素的
4、作用,則組間變異同組內變異一樣,只反映隨機誤差作用的大小。組間均方與組內均方的比值稱為F統(tǒng)計量 F值接近于1,就沒有理由拒絕H0;反之,F(xiàn)值越大,拒絕H0的理由越充分。數(shù)理統(tǒng)計的理論證明,當H0成立時,F(xiàn)統(tǒng)計量服從F分布。,…,,,,,F 分布曲線,,,,,,,回憶t分布和t檢驗,17,18,F 界值表,,,,,,,,,,,二、完全隨機設計方差分析(單因素方差分析),關于因素與水平,因素也稱為處理因素(facto
5、r)每一處理因素至少有兩個水平(level)(也稱“處理組”)。,,完全隨機設計: 將實驗對象隨機分配到不同處理組的單因素設計方法。針對一個處理因素,通過比較該因素不同水平組均值,推斷該處理因素不同水平組的均值是否存在統(tǒng)計學差異。,例 在評價某藥物耐受性及安全性的I期臨床試驗中,對符合納入標準的30名健康自愿者隨機分為3組每組10名,各組注射劑量分別為0.5U、1U、2U,觀察48小時部分凝血活酶時間(s)試問不同劑量的部分
6、凝血活酶時間有無不同?,方差分析步驟 : (1)提出檢驗假設,確定檢驗水準 H0:μ1=μ2=μ3 H1:μ1,μ2,μ3不全相同 a=0.05,(2)計算檢驗統(tǒng)計量F 值,(3)確定P值,做出推斷結論 F0.05(2,26) =2.52,F(xiàn)>F0.05(2,26) ,P<0.05,拒絕
7、H0。 三種不同劑量48小時部分凝血活酶時間 不全相同。,例子:某研究者在某單位工作人員中進行了體重指數(shù)(BMI)抽樣調查,隨機抽取不同年齡組男性受試者各16名,測量了被調查者的身高和體重值,由此按照BMI=體重/身高2公式計算了體重指數(shù),請問,不同年齡組的體重指數(shù)有無差異。,方差分析適合于任何多組獨立均衡可比的數(shù)據(jù),基本步驟,(1)建立假設,確定檢驗水準,H0:三個總體均數(shù)相等,即三組工作人員的體重指數(shù)總體均數(shù)相等H1:三個總
8、體均數(shù)不等或不全相等a=0.05,,(2)計算檢驗統(tǒng)計量F值,,(3)確定p值,作出統(tǒng)計推斷,P2,45=3.20-3.21<8.87,本次F值處于F界值之外,說明組間均方組內均方比值屬于小概率事件,因此拒絕H0,接受H1,三個總體均數(shù)不等或不全相等,,方差分析的關鍵條件,第一、各組服從正態(tài)分布!第二、各組符合方差齊性!第三、獨立性,,方差齊性檢驗Bartlett檢驗法Levene F 檢驗最大方差與最小方差之比<
9、;3,初步認為方差齊同。,,問題: 不符合條件怎么辦?,第一招:數(shù)據(jù)轉換 方差齊性轉換;正態(tài)性轉換,第二招:特別分析方法 非參數(shù)檢驗,,三、多個樣本均數(shù)的兩兩比較,方差分析能說明什么問題?,能否用t檢驗呢,,當有k個均數(shù)需作兩兩比較時,比較的次數(shù)共有c= = k!/(2!(k-2)!)=k(k-1)/2設每次檢驗所用Ⅰ類錯誤的概率水準為α,累積Ⅰ類錯誤的概率為α’
10、,則在對同一實驗資料進行c次檢驗時,在樣本彼此獨立的條件下,根據(jù)概率乘法原理,其累積Ⅰ類錯誤概率α’與c有下列關系: α’=1-(1-α)c 例如,設α=0.05,c=3(即k=3),其累積Ⅰ類錯誤的概率為α’=1-(1-0.05)3 =1-(0.95)3 = 0.143,,,多重比較的方法:SNK檢驗(q 檢驗):探索性研究,進行兩兩比較。LSD-t 檢驗:證實性檢驗,可認為LSD法是最靈敏的Turkey 檢驗方法,探
11、索性研究,要求樣本量相同。Duncan 檢驗方法,探索性研究Dunnet 檢驗方法,證實性檢驗,常用于多個試驗組與一個對照組間的比較。,例1 在腎缺血再灌注過程的研究中,將36只雄性大鼠隨機等分成三組,分別為正常對照組、腎缺血60分組和腎缺血60分再灌注組,測得各個體的NO數(shù)據(jù)見數(shù)據(jù)文件no.sav,試問各組的NO平均水平是否相同?,單因素方差分析,分析:對于單因素方差分析,其資料在SPSS中的數(shù)據(jù)結構應當由兩列數(shù)據(jù)構成,其中一列
12、是觀察指標的變量值,另一列是用以表示分組變量。實際上,幾乎所有的統(tǒng)計分析軟件,包括SAS,STATA等,都要求方差分析采用這種數(shù)據(jù)輸入形式,這一點也暗示了方差分析與線性模型間千絲萬縷的聯(lián)系。,單因素方差分析,預分析(重要):檢驗其應用條件,單因素方差分析,選擇data 中的split file,出現(xiàn)如下對話框:,,,單因素方差分析,,單因素方差分析,,,單因素方差分析,這里僅取其中一組結果,表明該資料符合分組正態(tài)性的條件。,單因素方差分
13、析,注意分組檢驗正態(tài)性后,要先回到data菜單下的split file ,如下操作取消拆分后才能進行后續(xù)的方差分析:,,,,單因素方差分析,,,單因素方差分析,選入分組變量,選入因變量,,給出各組間樣本均數(shù)的折線圖,指定進行方差齊性檢驗,,,,單因素方差分析,結果分析,單因素方差分析,(1) 方差齊性檢驗,Levene方法檢驗統(tǒng)計量為3.216,其P值為0.053,可認為樣本所來自的總體滿足方差齊性的要求。,單因素方差分析,結果分析,(
14、2) 方差分析表,第1列為變異來源,第2、3、4列分別為離均差平方和、自由度、均方,檢驗統(tǒng)計量F值為5.564,P=0.008,組間均數(shù)差別統(tǒng)計學意義,可認為各組的NO不同。,變異來源,單因素方差分析,結果分析,(3) 各組樣本均數(shù)折線圖,Means plots 選項給出,更直觀。注意:當分組變量體現(xiàn)出順序的趨勢時,繪制這種折線圖可以提示我們選擇正確的趨勢分析模型。,通過以上分析得到了拒絕H0的結論,但實際上單因素方差分析并不這樣簡單
15、。在解決實際問題時,往往仍需要回答多個均數(shù)間到底是哪些存在差異。雖然結論提示不同組別個體的NO量不同,但研究者并不知道到底是三者之間均有差別,還是某一組與其他兩組有差別。這就應當通過兩兩比較(多重比較)進行考察。,均數(shù)兩兩比較方法,直接校正檢驗水準?(相對粗糙)專用的兩兩比較方法:計劃好的多重比較(Planned Comparisons)非計劃的多重比較(Post-Hoc Comparisons),均數(shù)兩兩比較方法,Contras
16、ts按鈕,Post Hoc按鈕,點擊單因素方差分析主對話框中的Post Hoc按鈕,總共有14種兩兩比較的方法,如下:,,均數(shù)兩兩比較方法,LSD法:最靈敏,會犯假陽性錯誤;Sidak法:比LSD法保守;Bonferroni法:比Sidak法更為保守一些;Scheffe法:多用于進行比較的兩組間樣本含量不等時;Dunnet法:常用于多個試驗組與一個對照組的比較;S-N-K法:尋找同質亞組的方法;Turkey法:最遲鈍,要求各
17、組樣本含量相同;Duncan法:與Sidak法類似。,均數(shù)兩兩比較方法,仍以例1為例,LSD法的輸出格式:,均數(shù)兩兩比較方法,結果分析,仍以例1為例,SNK法的輸出格式:,結果分析,均數(shù)兩兩比較方法,該方法的目的是尋找同質子集,故各組在表格的縱向上,均數(shù)按大小排序,然后根據(jù)多重比較的結果將所有的組分為若干個子集,子集間有差別,子集內均數(shù)無差別。,當各組樣本含量不同,選擇Scheffe法,得結果:,均數(shù)兩兩比較方法,結果分析,假設在調查
18、的設計階段,就計劃好了第二組和第一組,以及第三組和第一組的比較,可以使用主對話框中的contrast 按鈕實現(xiàn)。,在coefficients后面的框中輸入1,-1,0,每次輸入后點擊add,就可以比較第一組和第二組的NO;再點擊next按鈕,繼續(xù)輸入下一個組合,即0,-1,1。,均數(shù)兩兩比較方法,,均數(shù)兩兩比較方法,結果分析,可見,第一個組合無統(tǒng)計學意義,而第二個組合有顯著性差異。,,,四、多因素方差分析,多因素方差分析,?一個因素(水
19、平間獨立)——單因素方差分析,?兩個因素(水平間獨立或相關)——多(兩)因素方差分析?一個個體多個測量值——重復測量資料的方差分析目的:用這類資料的樣本信息來推斷各處理組間多個總體均數(shù)的差別有無統(tǒng)計學意義。,(一)隨機區(qū)組方差分析(水平間獨立兩因素),隨機區(qū)組設計: 先將受試對象按條件相同或相近分成m個區(qū)組(或配伍組),每個區(qū)組有k個受試對象,再將其隨機地分配到k個處理組中,稱之為隨機區(qū)組設計,屬于兩因素方差分析。
20、,,總變異分解 SS總=SS組間+SS組內(完全隨機) SS總=SS組間+(SS區(qū)組+SS組內)(隨機區(qū)組),,在存在著區(qū)組的情況下,隨機區(qū)組設計的方差分析效率要高于單因素方差分析,計算公式,總變異: ,自由度N-1。處理組變異: ,自由度k-1區(qū)組變異: ,自由度ni-1組內:SS總-SS處理-SS區(qū)組,自由度N-
21、k-ni-1,,,,舉例 為探討Rgl對鎘誘導大鼠睪丸損傷的保護作用,某研究者將同一窩別的3只大鼠隨機地分到T1、T2、T3三組,進行不同處理, 共觀察了10個窩別大鼠的睪丸MT含量(μg/g)。試問不同處理對大鼠MT含量有無影響?,,方差分析,=3.55, ,P<0.05,三組大鼠 MT含量的總體均值不全相同。,,隨機區(qū)組設計方差分析前提條件:數(shù)據(jù)服從正態(tài)分布數(shù)據(jù)要求具有獨立性數(shù)據(jù)要
22、求具有方差齊性,舉例,對三組病人進行降血壓藥物治療,一組病人為安慰劑,一組病人為常規(guī)藥物,另外一組為新研制藥物。分別在服藥5、10、20天測量血糖這種例子看似隨機區(qū)組設計實則不然,數(shù)據(jù)之間存在相關性需采用重復測量方差分析,小結,完全隨機設計t檢驗:單因素兩樣本分析完全隨機設計方差分析:單因素多樣本分析隨機區(qū)組設計方差分析:兩因素多樣本分析,人有了知識,就會具備各種分析能力,明辨是非的能力。所以我們要勤懇讀書,廣泛閱讀,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論