版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1,應(yīng)用多元統(tǒng)計(jì)分析,第三章 多元正態(tài)總體 參數(shù)的假設(shè)檢驗(yàn)(二),2,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)?zāi)?錄(二),§3.3 多總體均值向量的檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)§3.5 獨(dú)立性檢驗(yàn)§3.6 正態(tài)性檢驗(yàn) 第三章所涉及的最大似然估計(jì)量小結(jié),3,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--兩個(gè)p元正態(tài)總體,當(dāng)p
2、=1時(shí),因,且相互獨(dú)立,故有,1. 兩總體協(xié)差陣相等(但未知)時(shí)均值向量的檢驗(yàn) 設(shè)X(α)(α=1,…,n)為來自總體X~Np(μ(1),Σ)的隨機(jī)樣本;Y(α)(α=1,…,m)為來自總體Y~ Np(μ(2),Σ)的隨機(jī)樣本,且相互獨(dú)立,Σ未知.檢驗(yàn),4,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--兩個(gè)p元正態(tài)總體,取檢驗(yàn)統(tǒng)計(jì)量為,~ t (n+m-2) (在H0成立時(shí)) ,
3、即,5,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--兩個(gè)p元正態(tài)總體,推廣到p元總體,檢驗(yàn)統(tǒng)計(jì)量的形式類似,可考慮以下檢驗(yàn)統(tǒng)計(jì)量T2:,其中A1和A2是兩總體的樣本離差陣.它們是一元統(tǒng)計(jì)中的偏差平方和∑(X(i)-X)2在p元情況下的推廣.以下來證明統(tǒng)計(jì)量T 2 ~T 2 (p,n+m-2).,,因,6,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--兩個(gè)p元正
4、態(tài)總體,由Wishart分布的可加性知 A1+ A2~Wp(n+m-2,Σ),由T2統(tǒng)計(jì)量的定義3.1.5可知,7,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--兩個(gè)p元正態(tài)總體,利用T2與F的關(guān)系,檢驗(yàn)統(tǒng)計(jì)量取為,可以證明T2 (或F)統(tǒng)計(jì)量是檢驗(yàn)以上假設(shè)H0的似然比統(tǒng)計(jì)量.(見習(xí)題3-10),8,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§
5、3.3 多總體均值向量的檢驗(yàn)--兩總體均值檢驗(yàn)例子,例3.3.1 為了研究日、美兩國在華投資企業(yè)對中國經(jīng)營環(huán)境的評價(jià)是否存在差異,今從兩國在華投資企業(yè)中各抽出10家,讓其對中國的政治、經(jīng)濟(jì)、法律、文化環(huán)境進(jìn)行打分,評分結(jié)果見表3.2(表中1至10號為美國在華投資企業(yè)的代號,11至20號為日本在華投資企業(yè)的代號.數(shù)據(jù)來源于:國務(wù)院發(fā)展研究中心APEC在華投資企業(yè)情況調(diào)查). 解 比較日、美兩國在華投資企業(yè)對中國多方面的經(jīng)
6、營環(huán)境的評價(jià)是否有差異問題,就是兩總體均值向量是否相等的檢驗(yàn)問題.,(見yydy331a.sas或yydy331b.sas),9,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--兩總體均值檢驗(yàn)例子,,10,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--兩總體均值檢驗(yàn)例子,記美國在華投資企業(yè)對中國4個(gè)方面的經(jīng)營環(huán)境的評價(jià)為4維總體X,并設(shè)X~N4(μ(1),Σ).日
7、本在華投資企業(yè)對中國經(jīng)營環(huán)境的評價(jià)為4維總體Y,并設(shè)Y~N4(μ(2),Σ). 來自兩總體的樣本容量n=m=10.檢驗(yàn),取檢驗(yàn)統(tǒng)計(jì)量為,由樣本值計(jì)算得:X=(64, 43, 30.5, 63)′, Y=(51.5, 51, 40, 70.5)′,,,,11,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--兩總體均值檢驗(yàn)例子,進(jìn)一步計(jì)
8、算可得:,12,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--兩總體均值檢驗(yàn)例子,對給定顯著性水平α=0.01,利用統(tǒng)計(jì)軟件進(jìn)行檢驗(yàn)時(shí),首先計(jì)算p值(此時(shí)檢驗(yàn)統(tǒng)計(jì)量F~F(4,15)): p=P{F≥6.2214}=0.0037 .因p值=0.0037<0.01=α,故否定H0,即日、美兩國在華投資企業(yè)對中國經(jīng)營環(huán)境的評價(jià)存在顯著性差異.在這種情況下,可能犯第
9、一類錯(cuò)誤,且犯第一類錯(cuò)誤的概率為0.01.,13,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--兩個(gè)p元正態(tài)總體,2. 兩總體協(xié)差陣不等時(shí)均值向量的檢驗(yàn) 在一元統(tǒng)計(jì)中(p=1時(shí)),當(dāng)σ12≠ σ22時(shí),檢驗(yàn)H0:μ(1)=μ(2)也沒有很好的方法,以下介紹實(shí)用中的幾種方法. ① 當(dāng)n=m時(shí),作為成對數(shù)據(jù)進(jìn)行處理.令Z(i)=X(i) -Y(i) (i=1,…,n),化為單個(gè)p元
10、總體Z的均值檢驗(yàn)問題 H0:μ(1)=μ(2) H0: μZ=0 利用前面介紹的方法進(jìn)行檢驗(yàn). 注意:在這里兩組樣本相互獨(dú)立的信息沒有利用.,14,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--兩個(gè)p元正態(tài)總體,② 當(dāng)n≠m時(shí)(不妨設(shè)n<m):想法也是化為單個(gè)p元新總體的均值檢驗(yàn)問題.若只取n對數(shù)據(jù)按方法①處理,又將損失一些信息.改進(jìn)的辦法是利用X(i
11、) (i=1,…,n)和Y(j) (j=1,…,m),構(gòu)造新總體Z的樣本Z(i) ,令,可以證明:,15,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--兩個(gè)p元正態(tài)總體,所以Z(i) ~N p(μ(1)-μ(2),ΣZ) (i=1,…,n),且相互獨(dú)立.利用前面介紹的單個(gè)正態(tài)總體均值向量的檢驗(yàn)方法進(jìn)行檢驗(yàn). ③ 當(dāng)Σ1 , Σ2相差甚大時(shí), 可構(gòu)造近似檢驗(yàn)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)(見參考文獻(xiàn)[1
12、]).,其中,16,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)—多元方差分析,多個(gè)正態(tài)總體均值向量的檢驗(yàn)問題也稱為多元方差分析 . 設(shè)有k個(gè)p元正態(tài)總體Np(μ(t),Σ) (t=1,…,k),樣品 (t=1,…,k,α=1,…,nt )是來自Np(μ(t),Σ)的隨機(jī)樣本,檢驗(yàn) H0:μ(1)=…=μ(k),H1:至少存在i≠j使得μ(i)≠μ(j)
13、 (即μ(1),…,μ(k)中至少有一對不等).,當(dāng)p=1時(shí),此檢驗(yàn)問題就是一元方差分析問題,比如比較k個(gè)不同品牌的同類產(chǎn)品中一個(gè)質(zhì)量指標(biāo)X(如耐磨度)有無顯著差異的問題,我們把不同品牌對應(yīng)不同總體(假定為正態(tài)總體),這種多組比較問題就是檢驗(yàn)問題.,17,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)—多元方差分析,,從第i個(gè)總體抽取容量為n
14、i的隨機(jī)樣本如下(i=1,…,k;記n=n1+n2+…+nk):,18,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)—多元方差分析(p=1),,當(dāng)p=1時(shí),利用一元方差分析的思想來構(gòu)造檢驗(yàn)統(tǒng)計(jì)量.記,則有平方和分解公式: SST=SSA+SSE,19,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)—多元方差分析
15、(p=1),,直觀考察,若H0成立(即k個(gè)總體均值無顯著差異),當(dāng)總偏差平方和SST固定不變時(shí),應(yīng)有組間偏差平方和 SSA小,而組內(nèi)偏差平方和 SSE大,因而比值SSA/SSE應(yīng)很小. 檢驗(yàn)統(tǒng)計(jì)量取為,給定顯著性水平α,按傳統(tǒng)檢驗(yàn)方法,查F分布臨界值表得Fα滿足: P{F>Fα}=α,否定域W={F>Fα }.,20,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)—多元方
16、差分析,,推廣到k個(gè)p元總體Np(μt,Σ) (假定k個(gè)總體的協(xié)差陣相等,且記為Σ),記第i個(gè)p元總體的數(shù)據(jù)陣為,對總離差陣進(jìn)行分解:,21,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)—多元方差分析,,其中,稱為組間離差陣.,故交叉項(xiàng)=O,,稱為組內(nèi)離差陣.,22,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)—多元方差分析,,根據(jù)直觀想法及用似然比原理得到檢
17、驗(yàn)H0的統(tǒng)計(jì)量為,由Wishart分布的定義容易得出: ① 因 Ai ~Wp(ni-1,Σ)且相互獨(dú)立(i=1,…,k),由可加性可得A=A1+…+Ak~Wp(n-k,Σ) (n=n1+…+nk). ② 在H0下,T~Wp (n-1,Σ). ③ 還可以證明在H0下,B~Wp(k-1,Σ),且B與A相互獨(dú)立.,23,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)—多元方差
18、分析,根據(jù)Λ分布的定義,可知,給定顯著性水平α,查Wilks分布臨界值表,可得λα,使 P{Λ<λα}=α,故否定域W={Λ<λα }. 當(dāng)手頭沒有Wilks臨界值表時(shí),可用χ2分布或F分布來近似,即由Λ的函數(shù)的近似分布進(jìn)行檢驗(yàn)(見參考文獻(xiàn)[1]或[2]).,24,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)—多元方差分析的例子,,例3.3.2
19、 為了研究某種疾病,對一批人同時(shí)測量了四個(gè)指標(biāo):β脂蛋白(X1),甘油三酯(X2),α脂蛋白(X3),前β脂蛋白(X4).按不同年齡、不同性別分為三組(20至35歲的女性、20至25歲的男性和35至50歲的男性),數(shù)據(jù)見書中表3.3.試問這三組的四項(xiàng)指標(biāo)間有無顯著性差異? 解 比較三個(gè)組(k=3)的4項(xiàng)指標(biāo)(p=4)間是否有差異問題,就是多總體均值向量是否相等的檢驗(yàn)問題.設(shè)第i組為4維總體N4(μ(i),Σ)(i=1,
20、2,3).來自3個(gè)總體的樣本容量n1=n2=n3=20.檢驗(yàn) H0: μ(1)=μ(2)=μ(3) H1:μ(1),μ(2),μ(3)至少有一對不相等.,( 見yydy332?.sas ),25,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--兩總體均值檢驗(yàn)例子,,26,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--多元方差分析的例子,因似然比統(tǒng)計(jì)量Λ
21、~Λ(p,n-k,k-1),此例中k-1=2,可以利用Λ統(tǒng)計(jì)量與F統(tǒng)計(jì)量的關(guān)系,取檢驗(yàn)統(tǒng)計(jì)量為F統(tǒng)計(jì)量:,由樣本值計(jì)算得:X=(259.08, 84.12, 32.37, 17.8)′,,,27,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--多元方差分析的例子,28,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--多元方差分析的例子,進(jìn)一步計(jì)算可得,對給定α
22、=0.01,利用統(tǒng)計(jì)軟件(如SAS系統(tǒng)),首先計(jì)算p值(此時(shí)檢驗(yàn)統(tǒng)計(jì)量F~F(8,108)): p=P{F≥3.09007}=0.003538.因p值=0.003538<0.01=α,故否定H0,這表明三個(gè)組的指標(biāo)之間有顯著的差異.在這種情況下,可能犯第一類錯(cuò)誤,且第一類錯(cuò)誤的概率為0.01.,29,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--多元方差分
23、析的例子,進(jìn)一步地若還想了解三個(gè)組指標(biāo)間的差異究竟是哪幾項(xiàng)指標(biāo)引起的,可以對4項(xiàng)指標(biāo)逐項(xiàng)用一元方差分析方法進(jìn)行檢驗(yàn),我們將發(fā)現(xiàn)三組指標(biāo)間只有第一項(xiàng)指標(biāo)X1有顯著差異. 事實(shí)上,用一元方差分析檢驗(yàn)第一項(xiàng)指標(biāo)X1在三個(gè)組中是否有顯著差異時(shí),因,30,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.3 多總體均值向量的檢驗(yàn)--多元方差分析的例子,其中t11和a11分別是T和A中的第一個(gè)對角元素.
24、 p1=P{F1≥8.8780}=0.0004401(檢驗(yàn)統(tǒng)計(jì)量F1~F(2,57))p值=0.0004401顯著地小于0.01,故第一項(xiàng)指標(biāo)X1在三個(gè)組中有顯著差異.,31,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)--單個(gè)p元正態(tài)總體,設(shè)X(α)(α=1,…,n)為來自p元正態(tài)總體Np(μ,Σ)(Σ>0未知)的隨機(jī)樣本,檢驗(yàn) H0:Σ= Σ0(Σ0>0為已知陣),H1:Σ≠Σ
25、0 1. 當(dāng)Σ0 =Ip時(shí)檢驗(yàn)H0:Σ=Ip,H1:Σ≠Ip 利用似然比原則來導(dǎo)出檢驗(yàn)統(tǒng)計(jì)量λ1,當(dāng)Σ=Ip成立時(shí),似然函數(shù)L(μ,Ip)在μ=X達(dá)最大值.,,32,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)--單個(gè)p元正態(tài)總體,所以似然比統(tǒng)計(jì)量,其中,33,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)--單個(gè)p元正態(tài)總體,利用定理3.2.1可知,當(dāng)n很大
26、且H0成立時(shí), ξ=-2lnλ1的近似分布為χ2(p(p+1)/2),參數(shù)空間?的維數(shù)為p+p(p+1)/2,而?0的維數(shù)為p,故卡方分布的自由度為p(p+1)/2. 取ξ作為檢驗(yàn)統(tǒng)計(jì)量,按傳統(tǒng)檢驗(yàn)方法,對給定顯著性水平α,否定域?yàn)?{ξ>χα2},其中χα2 滿足:P{ξ> χα2 }=α.,34,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)--單個(gè)p元
27、正態(tài)總體,2. 當(dāng)Σ0 ≠I p時(shí)檢驗(yàn)H0 :Σ=Σ0 ,H1 :Σ≠Σ0 因Σ0>0,存在p階非退化陣D,使DΣ0D′=I p, 令 Y(α)=DX (α)(α=1,…,n),則Y(α)~N p(Dμ,DΣD′)==N p(μ*,Σ*)檢驗(yàn)H 0 :Σ=Σ0 H0 :Σ*= I p 從新樣本Y(α)(α=1,…,n)出發(fā),檢驗(yàn)H0:Σ*=Ip的檢驗(yàn)統(tǒng)計(jì)量取為,記為,3
28、5,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)--單個(gè)p元正態(tài)總體,其中,若注意到DΣ0D′=I p ,即,,36,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)--單個(gè)p元正態(tài)總體,研究似然比統(tǒng)計(jì)量λ2的抽樣分布是很困難的.通常根據(jù)定理3.2.1由λ2的近似分布來構(gòu)造檢驗(yàn)法. 當(dāng)樣本容量n很大,在H0成立時(shí),-2lnλ2 的極限分布為χ2(p(p+1)/
29、2). 除此外在不同適用范圍下還有其它近似分布可用來構(gòu)造檢驗(yàn)法.,則似然比統(tǒng)計(jì)量λ2還可以表示為,37,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)--單個(gè)p元正態(tài)總體,3. 檢驗(yàn)H0:Σ=σ2Σ0 (σ2 未知) 當(dāng)Σ0 =Ip 時(shí)此檢驗(yàn)常稱為球性檢驗(yàn).利用似然比原則來導(dǎo)出檢驗(yàn)統(tǒng)計(jì)量λ3:,當(dāng)σ2給定時(shí),似然函數(shù)L(μ,σ2Σ0)在μ=X達(dá)最大值,且,,38,第三章 多元
30、正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)--單個(gè)p元正態(tài)總體,,可得出,39,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)--單個(gè)p元正態(tài)總體,所以似然比統(tǒng)計(jì)量,或等價(jià)于,當(dāng)樣本容量n很大,在H0為真時(shí)有以下近似分布:,40,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)--多個(gè)p元正態(tài)總體,設(shè)有k個(gè)總體Np(μ(t),Σt)(t=1,…,k),X(α)(
31、t)(t=1,…,k;α=1,…,n t)來自第t個(gè)總體Np(μ(t) ,Σt )的隨機(jī)樣本,記n=n1+n2+…+nk. 檢驗(yàn)H0 :Σ1=Σ2=…=Σk≡Σ,H1 : Σ1, Σ2,…,Σk不全相等. 樣本{ X(α)(t)}的似然函數(shù)為,似然比統(tǒng)計(jì)量λ4為,,41,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)--多個(gè)p元正態(tài)總體,42,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)
32、67;3.4 協(xié)差陣的檢驗(yàn)--多個(gè)p元正態(tài)總體,則似然比檢驗(yàn)統(tǒng)計(jì)量為,( 其中 A=A1+…+Ak),43,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)--多個(gè)p元正態(tài)總體,根據(jù)無偏性的要求進(jìn)行修正,將λ4中的ni用ni -1替代,n用n-k替代.然后對λ4取對數(shù),可得到統(tǒng)計(jì)量:,當(dāng)樣本容量n很大時(shí),在H0為真時(shí)M有以下近似分布: (1-d)M=-2(1-d)lnλ4*~χ2(f)
33、其中 f=p(p+1)(k-1) /2,,44,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)--多個(gè)p元正態(tài)總體(例),例3.4.1 對例3.3.2表3.3中給出的身體指標(biāo)化驗(yàn)數(shù)據(jù),試判斷三個(gè)組(即三個(gè)總體)的協(xié)差陣是否相等(α=0.10) 解 這是三個(gè)4維正態(tài)總體的協(xié)差陣是否相等的檢驗(yàn)問題.設(shè)第i組為4維總體N4(μ(i),Σi)(i=1,2,3).來自三個(gè)總體的樣本容量n1=n2=n
34、3=20.檢驗(yàn)H0:Σ1=Σ2=Σ3,H1:Σ1,Σ2,Σ3至少有一對不相等.在H0成立時(shí),取近似檢驗(yàn)統(tǒng)計(jì)量為χ2(f)統(tǒng)計(jì)量:,由樣本值計(jì)算三個(gè)總體的樣本協(xié)差陣:,45,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)--多個(gè)p元正態(tài)總體(例),,,46,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)--多個(gè)p元正態(tài)總體(例),47,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)
35、§3.4 協(xié)差陣的檢驗(yàn)--多個(gè)p元正態(tài)總體(例),進(jìn)一步計(jì)算可得,48,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 協(xié)差陣的檢驗(yàn)--多個(gè)p元正態(tài)總體(例),對給定α=0.10,利用統(tǒng)計(jì)軟件(如SAS系統(tǒng)),首先計(jì)算p值(設(shè)檢驗(yàn)統(tǒng)計(jì)量ξ~χ2(20)):p=P{ξ≥ 20.331621}=0.4373646.因p值=0.4373646>0.10=α,故H0相容,這表明三個(gè)組的協(xié)差陣之間沒
36、有顯著的差異.,49,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 --多個(gè)正態(tài)總體均值向量和協(xié)差陣的同時(shí)檢驗(yàn),設(shè)有k個(gè)總體Np(μ(t),Σt)(t=1,…,k), X(α)(t)(t=1,…,k; α=1,…,nt)來自第t個(gè)總體Np(μt ,Σt )的隨機(jī)樣本,記n=n1+n2+…+nk. 檢驗(yàn) H0 : μ(1) = μ(2) =… =μ(k) =μ, Σ1=Σ2=…=Σk = Σ, H1
37、 : μ(1) , μ(2) ,… ,μ(k) 或Σ1, Σ2,…,Σk不全相等.,記,50,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 --多個(gè)正態(tài)總體均值向量和協(xié)差陣的同時(shí)檢驗(yàn),似然比統(tǒng)計(jì)量λ5為,51,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 --多個(gè)正態(tài)總體均值向量和協(xié)差陣的同時(shí)檢驗(yàn),則檢驗(yàn)以上假設(shè)H0的樣本{ X(t)(α)} 似然函數(shù)為,52,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)&
38、#167;3.4 --多個(gè)正態(tài)總體均值向量和協(xié)差陣的同時(shí)檢驗(yàn),若用Λ表示當(dāng)協(xié)差陣均相同時(shí)檢驗(yàn)k個(gè)總體均值向量是否相等的似然比統(tǒng)計(jì)量,將發(fā)現(xiàn)這里的檢驗(yàn)統(tǒng)計(jì)量λ5=Λ·λ4 . 在實(shí)際應(yīng)用中我們采用類似的修正方法,在λ5中用nt-1替代nt,用n-k替代n.修正后的統(tǒng)計(jì)量記為λ5*:,53,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 --多個(gè)正態(tài)總體均值向量和協(xié)差陣的同時(shí)檢驗(yàn),當(dāng)樣本容量n很大,在H0為
39、真時(shí)λ5*有以下近似分布:,其中,54,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 --多個(gè)正態(tài)總體均值向量和協(xié)差陣的同時(shí)檢驗(yàn),例3.4.2 對例3.3.2表3.3給出的身體指標(biāo)化驗(yàn)數(shù)據(jù),試判斷三個(gè)組(即三個(gè)總體)的均值向量和協(xié)差陣是否全都相等(α=0.05)? 解 這是三個(gè)4維正態(tài)總體的均值向量和協(xié)差陣是否同時(shí)相等的檢驗(yàn)問題.取近似檢驗(yàn)統(tǒng)計(jì)量為近似χ2統(tǒng)計(jì)量: ξ==-2(1-
40、b)lnλ5* ~χ2( f ).由樣本值計(jì)算三個(gè)總體的樣本協(xié)差陣見例3.4.1,所有樣本的總離差陣T見例3.3.2.進(jìn)一步計(jì)算可得,55,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.4 --多個(gè)正態(tài)總體均值向量和協(xié)差陣的同時(shí)檢驗(yàn),對給定α=0.05,利用統(tǒng)計(jì)軟件(如SAS系統(tǒng)),首先計(jì)算p值(設(shè)檢驗(yàn)統(tǒng)計(jì)量ξ~ χ2(28)): p=P{ξ≥ 43.1408}= 0.03373.因p值=0.0337
41、3<0.05=α,故否定H0,這表明三個(gè)組的均值向量和協(xié)差陣之間有顯著的差異.在這種情況下,可能犯第一類錯(cuò)誤,且第一類錯(cuò)誤的概率0.05.,,56,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.5 獨(dú)立性檢驗(yàn),設(shè)總體X~Np(μ,Σ),將X剖分為k個(gè)子向量,而μ和Σ也相應(yīng)剖分為,其中p= p1+…+ pk,且知pt維子向量X(t)~Npt(μ(t),Σtt) (t=1,…,k). 若k個(gè)隨機(jī)子向量相互獨(dú)
42、立,把p維(高維)隨機(jī)向量的問題化為k個(gè)低維隨機(jī)向量的問題來處理,在處理多元統(tǒng)計(jì)分析的許多問題中將帶來極大的方便.,57,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.5 獨(dú)立性檢驗(yàn),在第二章我們已介紹過若X(1),…,X(k)相互獨(dú)立,則有Σij =O(對一切i≠j).因此檢驗(yàn)X(1),…,X(k)是否相互獨(dú)立的問題等價(jià)于檢驗(yàn)對任二個(gè)子向量,其協(xié)差陣Σij 是否等于O(對一切i≠j). 在正態(tài)總體下,獨(dú)立性
43、檢驗(yàn)可化為檢驗(yàn)H0: Σij =O(一切i≠j),H1: Σij ≠O,至少有一對i≠j. 設(shè)X(t)(t=1,…,n,n>p)為來自總體X的隨機(jī)樣本.將樣品X(t) ,樣本均值X和樣本離差陣A作相應(yīng)剖分為,,58,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.5 獨(dú)立性檢驗(yàn),用似然比原理,在H0成立時(shí), X(t)(α) ~ Npt(μ(t),Σtt )(t=1,…,k; α=1,…,n) 且相互獨(dú)立,故
44、樣本的似然函數(shù)為,所以似然比統(tǒng)計(jì)量的分子為,59,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.5 獨(dú)立性檢驗(yàn),似然比統(tǒng)計(jì)量為,Box證明了,在H0成立下當(dāng)n→∞時(shí),-blnV~χ2(f),其中,60,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.5 獨(dú)立性檢驗(yàn)--例,例3.4.1 試檢驗(yàn)例3.2.1女性汗液數(shù)據(jù)中隨機(jī)向量X的三個(gè)分量是否相互獨(dú)立(α=0.05). 解 記隨機(jī)向量X=(X1,X2
45、,X3)′,假定X~N3(μ,Σ),且記Σ=(σij).檢驗(yàn) H0:σ12=0,σ13=0,σ23=0, H1: σ12,σ13,σ23不全為0. 取檢驗(yàn)統(tǒng)計(jì)量為,當(dāng)X的三個(gè)分量相互獨(dú)立,且樣本容量n很大時(shí),ξ近似于χ2(f) .,61,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.5 獨(dú)立性檢驗(yàn)--例,由表3.1的樣本值計(jì)算樣本離差陣A,可得:,此例中n=20, p=3, p1=p2=p3=1, k=3.進(jìn)
46、一步計(jì)算可得: b=17.1667, f=3,,62,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.5 獨(dú)立性檢驗(yàn)--例,對給定顯著性水平α=0.05,用統(tǒng)計(jì)軟件SAS系統(tǒng)計(jì)算時(shí),通過計(jì)算p值進(jìn)行檢驗(yàn): p=P{ξ≥9.7555}=0.02076.因p值=0.02076<0.05=α,故否定H0,即隨機(jī)向量的三個(gè)分量不相互獨(dú)立.在這種情況下,可能犯第一類錯(cuò)誤,且第一類錯(cuò)誤的概
47、率為0.05.,63,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.6 正態(tài)性檢驗(yàn),,在均值和協(xié)差陣的檢驗(yàn)中,以及以后將介紹的一些統(tǒng)計(jì)方法中都是假定樣本來自p元正態(tài)總體.所作統(tǒng)計(jì)推斷的結(jié)論是否正確,在某種意義上取決于實(shí)際總體與正態(tài)總體接近的程度如何?因此建立一些方法來檢驗(yàn)多元觀測數(shù)據(jù)與多元正態(tài)數(shù)據(jù)的差異是否顯著是十分必要的. 設(shè)X(α)=(Xα1 , …, Xαp)′ (α=1,…,n)是來自p元總體X的樣本,試
48、問總體X是否服從Np(μ,Σ)分布? 若總體X=(X1,…,Xp)′~Np(μ,Σ),利用多元正態(tài)分布的一些性質(zhì)可知(記μ=(μ1,…,μp)′,Σ=(σij)p×p ): ,64,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.6 正態(tài)性檢驗(yàn),① 每個(gè)分量Xi~N(μi,σii) (i=1,…,p). ② 任二個(gè)分量(Xi , Xj )~二元正態(tài)分布. ③ 設(shè)l=(l1,…,
49、lp)′為任給的p維常向量,令ξ=l′X,則ξ~N1( l′μ,l′Σl ). ④ 令η=(X-μ)′Σ-1(X-μ),則η~χ2(p). ⑤ 正態(tài)隨機(jī)向量X的概率密度等高線為橢球.,若總體X為多元正態(tài)總體,必具有以上所列的幾條性質(zhì).如果X具有以上這些性質(zhì),也不一定能得出X為p元正態(tài)分布.但如果經(jīng)過檢驗(yàn),比如發(fā)現(xiàn)某個(gè)分量Xi與正態(tài)分布有顯著差異,即可得出p元總體X與p元正態(tài)分布也有顯著差異.利用以上性質(zhì),要來
50、構(gòu)造出好的滿意的多元正態(tài)的整體性檢驗(yàn)十分困難.,65,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.6正態(tài)性檢驗(yàn)--一維邊緣分布的正態(tài)性檢驗(yàn),在實(shí)際應(yīng)用中如果經(jīng)過從多方面得到的檢驗(yàn)結(jié)果與正態(tài)分布均無顯著性差異,也就認(rèn)為該總體X與p元正態(tài)無顯著差異. 設(shè)p維隨機(jī)向量X=(X1,…,Xp)′,檢驗(yàn)分量Xi~N(μi,σ2) (i=1,…,p) ,把p維正態(tài)性檢驗(yàn)化為p個(gè)一維數(shù)據(jù)的正態(tài)性檢驗(yàn).常用的檢驗(yàn)方法有以下幾種
51、. 1. χ2檢驗(yàn)法 這是適用于連續(xù)型或離散型隨機(jī)變量分布的擬合優(yōu)度檢驗(yàn)方法,也稱為Pearson χ2 檢驗(yàn)法. 2. 柯氏(Kolmogorov,A.N.)檢驗(yàn)法 這是適用于連續(xù)型分布的擬合優(yōu)度檢驗(yàn)方法.,66,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.6正態(tài)性檢驗(yàn)--一維邊緣分布的正態(tài)性檢驗(yàn),3. 偏峰檢驗(yàn)法 4. W (Wilks)檢驗(yàn)
52、和D檢驗(yàn) 5. Q-Q (QuantileQuantile)圖檢驗(yàn)法 6. P-P (ProbabilityProbability )圖檢驗(yàn)法 7. “3σ”原則檢驗(yàn)法 8. A2和W2統(tǒng)計(jì)量檢驗(yàn)法 方法3至方法8都是只適用于正態(tài)分布的檢驗(yàn)法.,67,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.6正態(tài)性檢驗(yàn)--二維數(shù)據(jù)的正態(tài)性檢驗(yàn),設(shè)X=(X1,…,Xp)′ 為
53、p維隨機(jī)向量,X的任二個(gè)分量的n次觀測數(shù)據(jù)記為X(i)=(Xi1,Xi2)′(i=1,…,n).下面介紹檢驗(yàn)二維觀測數(shù)據(jù)是否來自二元正態(tài)分布的方法. 1. 等概橢圓檢驗(yàn)法 若二維隨機(jī)向量X=(X1,X2)′~N2(μ,Σ),則X的概率密度函數(shù)等高線 f(x1,x2)=a ? (X-μ)′Σ-1(X-μ)=b2右邊是中心在(μ1,μ2)由(X-μ)′Σ-1(X-μ)=b2決定的橢圓.
54、由本章§3.1的介紹的知識可知 D2=(X-μ)′Σ-1(X-μ)~χ2 (2).對給定p0∈(0,1),則存在d0使 P{ D2 ≤d0}=p0 注:此檢驗(yàn)法較粗糙,詳見教材P99例3.6.1,68,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.6正態(tài)性檢驗(yàn)--二維數(shù)據(jù)的正態(tài)性檢驗(yàn),2. 二維數(shù)據(jù)的χ2圖檢驗(yàn)法 因二維數(shù)據(jù)的χ2圖檢驗(yàn)法與p
55、維數(shù)據(jù)的χ2圖檢驗(yàn)法原理完全相同.故關(guān)于二維數(shù)據(jù)的χ2 圖檢驗(yàn)方法請參閱下面p維數(shù)據(jù)的χ2圖檢驗(yàn)方法.,69,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.6正態(tài)性檢驗(yàn)--p維數(shù)據(jù)的正態(tài)性檢驗(yàn),設(shè)X(α)=(Xα1 , …, Xαp)′ (α=1,…,n)是來自p元總體X的樣本, 檢驗(yàn)H0: X~Np(μ,Σ),H1:X不服從Np (μ,Σ). 1. χ2統(tǒng)計(jì)量的Q-Q圖檢驗(yàn)法(或P-P圖檢驗(yàn)法) 這是由
56、正態(tài)分布的性質(zhì)④構(gòu)造的檢驗(yàn)法. 在H0下,樣品X到總體中心μ的廣義平方距離(或稱馬氏距離)D2(X,μ)記為D2 ,則有 D2 =(X-μ)′Σ-1(X-μ)~χ2(p)以下構(gòu)造的檢驗(yàn)方法就是檢驗(yàn)統(tǒng)計(jì)量D2是否~χ2(p).直觀的想法是:由樣品X(α)計(jì)算D2α(α=1,…,n),對D2α排序: ,70,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.6正態(tài)性檢驗(yàn)--p維數(shù)據(jù)的正態(tài)性檢驗(yàn),
57、 D2(1)≤ D2(2) ≤…≤ D2(n) . 統(tǒng)計(jì)量 D2 的經(jīng)驗(yàn)分布函數(shù)取為,其中H(D2(t) |p)表示χ2 (p)的分布函數(shù)在D2(t)的值. 設(shè)χ2 分布的pt分位數(shù)為χt2 ,顯然χt2滿足: H(χt 2 |p)= pt.即χ2 分布的pt 分位數(shù)χt2 =H-1(pt |p). 由經(jīng)驗(yàn)分布得到樣本的
58、pt 分位數(shù)D2(t)=Fn-1(pt ).若H(x|p) ≈Fn(x),應(yīng)有D2(t) ≈χt2 ,繪制點(diǎn)(D2(t) , χt2 )的散布圖,當(dāng)X為正態(tài)總體時(shí),這些點(diǎn)應(yīng)散布在一條直線上.,71,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.6正態(tài)性檢驗(yàn)--p維數(shù)據(jù)的正態(tài)性檢驗(yàn),這種檢驗(yàn)法其實(shí)就是卡方分布的Q-Q圖檢驗(yàn)法. 類似地也可以繪制點(diǎn)(pt , H(D2(t) |p))的散布圖,當(dāng)X為正態(tài)總體時(shí),這些點(diǎn)
59、也應(yīng)散布在一條直線上.這種檢驗(yàn)法其實(shí)就是卡方分布的P-P圖檢驗(yàn)法. 具體檢驗(yàn)步驟如下: ,,(1) 由n個(gè)p維樣本點(diǎn)X(α) (α=1,…,n)計(jì)算樣本均值X,樣本協(xié)差陣S:,72,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.6正態(tài)性檢驗(yàn)--p維數(shù)據(jù)的正態(tài)性檢驗(yàn),(2) 計(jì)算樣品點(diǎn)X(t)到X的廣義平方距離(即馬氏距離),(3) 對廣義平方距離D2t 按從小到大的次序排序,(4) 計(jì)算pt=(t-0.5)/n
60、 (t=1, 2,…,n) ,χt2 ,其中χt2滿足: H(χt2 |p)= pt (或計(jì)算H(D2(t)|p)的值).,73,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.6正態(tài)性檢驗(yàn)--p維數(shù)據(jù)的正態(tài)性檢驗(yàn),(5) 以平方距離為橫坐標(biāo),χ2 分位數(shù)為縱坐標(biāo)作為平面坐標(biāo)系,用n個(gè)點(diǎn)(D2(t) ,χt2 )繪制散點(diǎn)圖,即得到卡方分布的Q-Q圖;或者用另n個(gè)點(diǎn)(pt , H(D2(t) | p))繪制散點(diǎn)圖,即得卡
61、方分布的P-P圖. (6) 考察這n個(gè)點(diǎn)是否散布在一條通過原點(diǎn),斜率為1的直線上.若是,接受數(shù)據(jù)來自p維正態(tài)總體的假設(shè);否則拒絕正態(tài)性假設(shè).,74,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.6正態(tài)性檢驗(yàn)--p維數(shù)據(jù)的正態(tài)性檢驗(yàn),2. 主成分檢驗(yàn)法 設(shè)X(i)=(Xi1, Xi2,…, Xip)′(i=1,…,n)為來自p維總體X=(X1,…,Xp)′的觀測數(shù)據(jù)(樣本).檢驗(yàn)H0: X~Np(μ,
62、Σ),H1:X不服從Np(μ,Σ). 設(shè)樣本協(xié)差陣S的特征值為λ1≥λ2≥…≥λp>0,相應(yīng)的特征向量為l1,l2,…,lp.記lt=(l1t , l2t ,… , lpt)′.令 Zt= l1t X1+ l2t X2+…+ lptXp (t=1,2,…,p)即新變量Z1,…,Zp 是X1,…,Xp的線性組合.且可以證明: Z1,…,Zp 是相互獨(dú)立的.,75,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)§3.6正
63、態(tài)性檢驗(yàn)--p維數(shù)據(jù)的正態(tài)性檢驗(yàn),p維觀測數(shù)據(jù)提供的信息大部分可由前幾個(gè)新變量所提供.這時(shí)p維數(shù)據(jù)的正態(tài)性檢驗(yàn)可化為幾個(gè)相互獨(dú)立的新變量的一元數(shù)據(jù)的正態(tài)性檢驗(yàn).這些新變量在第七章主成分分析中被稱為主成分.故此檢驗(yàn)法稱為主成分檢驗(yàn)法. 如果正態(tài)性假設(shè)不能成立,一般應(yīng)考慮對數(shù)據(jù)進(jìn)行變換,使非正態(tài)數(shù)據(jù)更接近正態(tài),然后對變換后的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析.有關(guān)變換的方法請見參考文獻(xiàn)[5]、[6]或[7].,76,第三章 多元正態(tài)總體
64、參數(shù)的假設(shè)檢驗(yàn)所涉及的最大似然估計(jì)量—單個(gè)總體,單個(gè)p維正態(tài)總體Np(μ,Σ),設(shè)X(i)(i=1,…,n)為來自p維總體的隨機(jī)樣本.樣本的似然函數(shù)為,,77,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)所涉及的最大似然估計(jì)量—單個(gè)總體,,78,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)所涉及的最大似然估計(jì)量—單個(gè)總體,,79,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)所涉及的最大似然估計(jì)量—單個(gè)總體,,80,第三章 多元正態(tài)總體參數(shù)的假
65、設(shè)檢驗(yàn)所涉及的最大似然估計(jì)量—兩個(gè)總體,兩個(gè)p維正態(tài)總體Np(μ(1),Σ)和Np(μ(2),Σ),設(shè)X(t)(i)( t=1,2; i=1,…,nt)為來自p維總體的隨機(jī)樣本.樣本的似然函數(shù)為(n=n1 + n2 ),81,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)所涉及的最大似然估計(jì)量—兩個(gè)總體,82,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)所涉及的最大似然估計(jì)量—兩個(gè)總體,83,第三章 多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)所涉及的最大
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論