版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、10.1 方差分析引論 10.2 單因素方差分析10.3 雙因素方差分析(不作要求),第10章 方差分析,學(xué)習(xí)目標(biāo),解釋方差分析的概念解釋方差分析的基本思想和原理掌握單因素方差分析的方法及應(yīng)用理解多重比較的意義了解雙因素方差分析的方法及應(yīng)用,重點(diǎn) 方差分析的基本思想和原理 難點(diǎn) 結(jié)合具體數(shù)據(jù)在計算機(jī)上實(shí)踐子方差分析,本章教學(xué)重點(diǎn)與難點(diǎn),10.1 方差分析引論,10.1.1
2、方差分析及其有關(guān)術(shù)語10.1.2 方差分析的基本思想和原理10.1.3 方差分析的基本假定10.1.4 問題的一般提法,方差分析及其有關(guān)術(shù)語,什么是方差分析(ANOVA)?(analysis of variance),檢驗(yàn)多個總體均值是否相等通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等研究分類型自變量對數(shù)值型因變量的影響 一個或多個分類型自變量兩個或多個 (k 個) 處理水平或分類一個數(shù)值型因變量有單因素方差分析和
3、雙因素方差分析單因素方差分析:涉及一個分類的自變量雙因素方差分析:涉及兩個分類的自變量,什么是方差分析?(例題分析),【 例 】為了對幾個行業(yè)的服務(wù)質(zhì)量進(jìn)行評價,消費(fèi)者協(xié)會在4個行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費(fèi)者對總共23家企業(yè)投訴的次數(shù)如下表,什么是方差分析? (例題分析),分析4個行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異,也就是要判斷“行業(yè)”對“投訴次數(shù)”是否有顯著影響作出這種判斷最終被歸結(jié)為檢驗(yàn)這四個行業(yè)被投訴次數(shù)的
4、均值是否相等若它們的均值相等,則意味著“行業(yè)”對投訴次數(shù)是沒有影響的,即它們之間的服務(wù)質(zhì)量沒有顯著差異;若均值不全相等,則意味著“行業(yè)”對投訴次數(shù)是有影響的,它們之間的服務(wù)質(zhì)量有顯著差異,方差分析中的有關(guān)術(shù)語,因素或因子(factor)所要檢驗(yàn)的對象分析行業(yè)對投訴次數(shù)的影響,行業(yè)是要檢驗(yàn)的因子水平或處理(treatment)因子的不同表現(xiàn)零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)觀察值在每個因素水平下得到的樣本數(shù)據(jù)每個行業(yè)被
5、投訴的次數(shù),方差分析中的有關(guān)術(shù)語,試驗(yàn)這里只涉及一個因素,因此稱為單因素4水平的試驗(yàn)總體因素的每一個水平可以看作是一個總體零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)是4個總體樣本數(shù)據(jù)被投訴次數(shù)可以看作是從這4個總體中抽取的樣本數(shù)據(jù),方差分析的基本思想和原理,,方差分析的基本思想和原理(圖形分析—散點(diǎn)圖),從散點(diǎn)圖上可以看出不同行業(yè)被投訴的次數(shù)有明顯差異同一個行業(yè),不同企業(yè)被投訴的次數(shù)也明顯不同家電制造被投訴的次數(shù)較高,航空
6、公司被投訴的次數(shù)較低行業(yè)與被投訴次數(shù)之間有一定的關(guān)系如果行業(yè)與被投訴次數(shù)之間沒有關(guān)系,那么它們被投訴的次數(shù)應(yīng)該差不多相同,在散點(diǎn)圖上所呈現(xiàn)的模式也就應(yīng)該很接近,方差分析的基本思想和原理(圖形分析),散點(diǎn)圖觀察不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯著差異這種差異可能是由于抽樣的隨機(jī)性所造成的需要有更準(zhǔn)確的方法來檢驗(yàn)這種差異是否顯著,也就是進(jìn)行方差分析所以叫方差分析,因?yàn)殡m然我們感興趣的是均值,但在判斷均值之間是否有
7、差異時則需要借助于方差這個名字也表示:它是通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。因此,進(jìn)行方差分析時,需要考察數(shù)據(jù)誤差的來源,方差分析的基本思想和原理,方差分析的基本思想和原理(兩類誤差),隨機(jī)誤差因素的同一水平(總體)下,樣本各觀察值之間的差異比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)之間的差異這種差異可以看成是隨機(jī)因素的影響,稱為隨機(jī)誤差 系統(tǒng)誤差因素的不同水平(不同總體)之間觀察值的差異比如,不同行業(yè)之間的被
8、投訴次數(shù)之間的差異這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差,方差分析的基本思想和原理(誤差平方和—SS),1.數(shù)據(jù)的誤差用平方和(sum of squares)表示2.組內(nèi)平方和(within groups)因素的同一水平下數(shù)據(jù)誤差的平方和比如,零售業(yè)被投訴次數(shù)的誤差平方和只包含隨機(jī)誤差3.組間平方和(between groups)3.因素的
9、不同水平之間數(shù)據(jù)誤差的平方和比如,4個行業(yè)被投訴次數(shù)之間的誤差平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差,方差分析的基本思想和原理(均方—MS),平方和除以相應(yīng)的自由度若原假設(shè)成立,組間均方與組內(nèi)均方的數(shù)值就應(yīng)該很接近,它們的比值就會接近1若原假設(shè)不成立,組間均方會大于組內(nèi)均方,它們之間的比值就會大于1當(dāng)這個比值大到某種程度時,就可以說不同水平之間存在著顯著差異,即自變量對因變量有影響判斷行業(yè)對投訴次數(shù)是否有顯著影響,也就是檢驗(yàn)
10、被投訴次數(shù)的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差,說明不同行業(yè)對投訴次數(shù)有顯著影響,方差分析的基本假定,方差分析的基本假定,每個總體都應(yīng)服從正態(tài)分布對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機(jī)樣本比如,每個行業(yè)被投訴的次數(shù)必須服從正態(tài)分布各個總體的方差必須相同各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的比如,4個行業(yè)被投訴次數(shù)的方差都相等觀察值是獨(dú)立的比如,每個行業(yè)被投訴的次數(shù)與其他行
11、業(yè)被投訴的次數(shù)獨(dú)立,方差分析中的基本假定,在上述假定條件下,判斷行業(yè)對投訴次數(shù)是否有顯著影響,實(shí)際上也就是檢驗(yàn)具有同方差的4個正態(tài)總體的均值是否相等如果4個總體的均值相等,可以期望4個樣本的均值也會很接近4個樣本的均值越接近,推斷4個總體均值相等的證據(jù)也就越充分樣本均值越不同,推斷總體均值不同的證據(jù)就越充分,方差分析中基本假定,? 如果原假設(shè)成立,即H0 : m1 = m2 = m3 = m44個行業(yè)被投訴次數(shù)的均值都相等意
12、味著每個樣本都來自均值為??、方差為? 2的同一正態(tài)總體,,X,f(X),?1 ? ?2 ? ?3 ? ?4,,方差分析中基本假定,?若備擇假設(shè)成立,即H1 : mi (i=1,2,3,4)不全相等至少有一個總體的均值是不同的4個樣本分別來自均值不同的4個正態(tài)總體,問題的一般提法,問題的一般提法,設(shè)因素有k個水平,每個水平的均值分別用?1 , ?2, ?, ?k 表示要檢驗(yàn)k個水平(總體)的均值是否相等,需要提出如下假設(shè): H
13、0 : ?1 ? ?2 ? …? ?k H1 : ?1 , ?2 , ?,?k 不全相等設(shè)?1為零售業(yè)被投訴次數(shù)的均值,?2為旅游業(yè)被投訴次數(shù)的均值,?3為航空公司被投訴次數(shù)的均值,?4為家電制造業(yè)被投訴次數(shù)的均值,提出的假設(shè)為H0 : ?1 ? ?2 ? ?3 ? ?4 H1 : ?1 , ?2 , ?3 , ?4 不全相等,,10.2 單因素方差分析,10.2.1 數(shù)據(jù)結(jié)構(gòu)10.2.2 分析步驟10.2.3
14、 關(guān)系強(qiáng)度的測量10.2.4 方差分析中的多重比較,單因素方差分析的數(shù)據(jù)結(jié)構(gòu)(one-way analysis of variance),分析步驟提出假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計量統(tǒng)計決策,提出假設(shè),一般提法H0 :m1 = m2 =…= mk 自變量對因變量沒有顯著影響 H1 :m1 ,m2 ,… ,mk不全相等自變量對因變量有顯著影響 注意:拒絕原假設(shè),只表明至少有兩個總體的均值不相等,并不意味著所有的均值都不
15、相等,構(gòu)造檢驗(yàn)的統(tǒng)計量,構(gòu)造統(tǒng)計量需要計算水平的均值全部觀察值的總均值誤差平方和均方(MS),構(gòu)造檢驗(yàn)的統(tǒng)計量(計算水平的均值),假定從第i個總體中抽取一個容量為ni的簡單隨機(jī)樣本,第i個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數(shù)計算公式為,式中: ni為第 i 個總體的樣本觀察值個數(shù) xij 為第 i 個總體的第 j 個觀察值,構(gòu)造檢驗(yàn)的統(tǒng)計量(計算全部觀察值的總均值),全部觀察值的
16、總和除以觀察值的總個數(shù)計算公式為,構(gòu)造檢驗(yàn)的統(tǒng)計量(例題分析),,構(gòu)造檢驗(yàn)的統(tǒng)計量(計算總誤差平方和 SST),全部觀察值 與總平均值 的離差平方和反映全部觀察值的離散狀況其計算公式為,前例的計算結(jié)果 SST = (57-47.869565)2+…+(58-47.869565)2 =115.9295,構(gòu)造檢驗(yàn)的統(tǒng)計量(計算組間平方和 SSA),各組平均值
17、 與總平均值 的離差平方和反映各總體的樣本均值之間的差異程度該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差計算公式為,前例的計算結(jié)果 SSA = 1456.608696,構(gòu)造檢驗(yàn)的統(tǒng)計量(計算組內(nèi)平方和 SSE ),每個水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個樣本各觀察值的離散狀況該平方和反映的是隨機(jī)誤差的大小計算公式為,前例的計算結(jié)果 SSE = 2708,構(gòu)造檢驗(yàn)的統(tǒng)計量(
18、三個平方和的關(guān)系),?總離差平方和(SST)、誤差項(xiàng)離差平方和(SSE)、水平項(xiàng)離差平方和 (SSA) 之間的關(guān)系,SST = SSA + SSE,,,,前例的計算結(jié)果 4164.608696=1456.608696+2708,,構(gòu)造檢驗(yàn)的統(tǒng)計量(計算均方MS),各誤差平方和的大小與觀察值的多少有關(guān),為消除觀察值多少對誤差平方和大小的影響,需要將其平均,這就是均方,也稱為方差由誤差平方和除以相應(yīng)的自由度求得三個平方和對應(yīng)的
19、自由度分別是SST 的自由度為n-1,其中n為全部觀察值的個數(shù)SSA的自由度為k-1,其中k為因素水平(總體)的個數(shù)SSE 的自由度為n-k,構(gòu)造檢驗(yàn)的統(tǒng)計量(計算均方 MS),組間方差:SSA的均方,記為MSA,計算公式為,組內(nèi)方差:SSE的均方,記為MSE,計算公式為,構(gòu)造檢驗(yàn)的統(tǒng)計量(計算檢驗(yàn)統(tǒng)計量 F ),將MSA和MSE進(jìn)行對比,即得到所需要的檢驗(yàn)統(tǒng)計量F當(dāng)H0為真時,二者的比值服從分子自由度為k-1、分母自由度為
20、n-k 的 F 分布,即,,構(gòu)造檢驗(yàn)的統(tǒng)計量(F分布與拒絕域),如果均值相等,F(xiàn)=MSA/MSE?1,統(tǒng)計決策,? 將統(tǒng)計量的值F與給定的顯著性水平?的臨界值F?進(jìn)行比較,作出對原假設(shè)H0的決策根據(jù)給定的顯著性水平?,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k 相應(yīng)的臨界值 F? 若F>F? ,則拒絕原假設(shè)H0 ,表明均值之間的差異是顯著的,所檢驗(yàn)的因素對觀察值有顯著影響若F<F? ,則不拒
21、絕原假設(shè)H0 ,無證據(jù)表明所檢驗(yàn)的因素對觀察值有顯著影響,,單因素方差分析表(基本結(jié)構(gòu)),,單因素方差分析(例題分析),,用Excel進(jìn)行方差分析 (Excel分析步驟),第1步:選擇“工具 ”下拉菜單第2步:選擇【數(shù)據(jù)分析】選項(xiàng)第3步:在分析工具中選擇【單因素方差分析】 ,然后選擇【確定】第4步:當(dāng)對話框出現(xiàn)時 在【輸入?yún)^(qū)域 】方框內(nèi)鍵入數(shù)據(jù)單元格區(qū)域 在【?】方框內(nèi)鍵入
22、0.05(可根據(jù)需要確定) 在【輸出選項(xiàng) 】中選擇輸出區(qū)域,關(guān)系強(qiáng)度的測量,關(guān)系強(qiáng)度的測量,拒絕原假設(shè)表明因素(自變量)與觀測值之間有顯著關(guān)系組間平方和(SSA)度量了自變量(行業(yè))對因變量(投訴次數(shù))的影響效應(yīng)只要組間平方和SSA不等于0,就表明兩個變量之間有關(guān)系(只是是否顯著的問題) 當(dāng)組間平方和比組內(nèi)平方和(SSE)大,而且大到一定程度時,就意味著兩個變量之間的關(guān)系顯著,大得越多,表明它們之間的
23、關(guān)系就越強(qiáng)。反之,就意味著兩個變量之間的關(guān)系不顯著,小得越多,表明它們之間的關(guān)系就越弱,關(guān)系強(qiáng)度的測量,變量間關(guān)系的強(qiáng)度用自變量平方和(SSA) 占總平方和(SST)的比例大小來反映自變量平方和占總平方和的比例記為R2 ,即其平方根R就可以用來測量兩個變量之間的關(guān)系強(qiáng)度,關(guān)系強(qiáng)度的測量(例題分析),R=0.591404結(jié)論行業(yè)(自變量)對投訴次數(shù)(因變量)的影響效應(yīng)占總效應(yīng)的34.9759%,而殘差效應(yīng)則占65.0241%。
24、即行業(yè)對投訴次數(shù)差異解釋的比例達(dá)到近35%,而其他因素(殘差變量)所解釋的比例近為65%以上 R=0.591404,表明行業(yè)與投訴次數(shù)之間有中等以上的關(guān)系,方差分析中的多重比較 (multiple comparison procedures),多重比較的意義,通過對總體均值之間的配對比較來進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異可采用Fisher提出的最小顯著差異方法,簡寫為LSDLSD方法是對檢驗(yàn)兩個總體均值是否相等的t檢驗(yàn)方法的
25、總體方差估計加以修正(用MSE來代替)而得到的,多重比較的步驟,提出假設(shè)H0: mi=mj (第i個總體的均值等于第j個總體的均值)H1: mi?mj (第i個總體的均值不等于第j個總體的均值)計算檢驗(yàn)的統(tǒng)計量: 計算LSD決策:若 ,拒絕H0;若 ,不拒絕H0,多重比較分析(例題分析),第1步:提出假設(shè)檢驗(yàn)1:檢驗(yàn)2:檢驗(yàn)3:檢驗(yàn)4:
26、檢驗(yàn)5:檢驗(yàn)6:,方差分析中的多重比較(例題分析),第2步:計算檢驗(yàn)統(tǒng)計量檢驗(yàn)1:檢驗(yàn)2:檢驗(yàn)3:檢驗(yàn)4:檢驗(yàn)5:檢驗(yàn)6:,方差分析中的多重比較(例題分析),第3步:計算LSD檢驗(yàn)1:檢驗(yàn)2:檢驗(yàn)3:檢驗(yàn)4:檢驗(yàn)5:檢驗(yàn)6:,方差分析中的多重比較(例題分析),第4步:作出決策,不能認(rèn)為零售業(yè)與旅游業(yè)均值之間有顯著差異,不能認(rèn)為零售業(yè)與航空公司均值之間有顯著差異,不能認(rèn)為零售業(yè)與家電業(yè)均值之間有顯著差異,不能認(rèn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 衛(wèi)生統(tǒng)計學(xué)--第十章-多個樣本均數(shù)比較的方差分析
- 醫(yī)學(xué)統(tǒng)計學(xué)第十章--統(tǒng)計表與統(tǒng)計圖
- 醫(yī)學(xué)統(tǒng)計學(xué)-方差分析
- 醫(yī)學(xué)統(tǒng)計學(xué)--方差分析
- 第十章 統(tǒng)計回歸模型
- 第十章
- 統(tǒng)計學(xué)課件第10章方差分析配套講義
- [教育]應(yīng)用統(tǒng)計學(xué):第七章:方差分析
- 第十章 指針
- 第十章排序
- 第十章 民法
- 第十章.doc
- 第十章.doc
- 管理統(tǒng)計學(xué)第10章-方差分析與試驗(yàn)設(shè)計
- 第十章排列、組合、概率與統(tǒng)計
- 醫(yī)學(xué)統(tǒng)計學(xué)方差分析練習(xí)題
- 第十章供電
- 第十章 控制
- 第十章代理
- 第十章軸承
評論
0/150
提交評論