[學習]多元正態(tài)分布的假設(shè)檢驗_第1頁
已閱讀1頁,還剩80頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、多元正態(tài)分布的假設(shè)檢驗,§4.1 單個總體均值向量的推斷,,,,,proc iml; n=20; p=3; x={3.7 48.5 9.3 ,5.7 65.1 8.0 ,3.8 47.2 10.9 , 3.2 53.2 12.0 ,3.1 55.5 9.7 ,4.6 36.1 7.9 , 2.4 24.8 14.0 ,7.2 33.1 7.6 ,6.7 47.4 8.5 ,

2、 5.4 54.1 11.3 ,3.9 36.9 12.7 ,4.5 58.8 12.3 , 3.5 27.8 9.8 ,4.5 40.2 8.4 ,1.5 13.5 10.1 , 8.5 56.4 7.1 ,4.5 71.6 8.2 ,6.5 52.8 10.9 , 4.1 44.1 11.2 ,5.5 40.9 9.4 }; m0={4 50 10}; ln={[20

3、] 1} ; x0=(ln*x)/n; print x0; xm=x0-m0; print xm; mm=i(20)-j(20,20,1)/n; a=x`*mm*x; print a; ai=inv(a); print ai; dd=xm*ai*xm`; d2=(n-1)*dd; t2=n*d2; f=(n-p)*t2/((n-1)*p); print dd d2 t2 f;

4、p0=1-probf(f,p,n-p); print p0; fa=finv(0.95,p,n-p); beta=probf(fa,p,n-p,t2); print fa beta;quit;,The SAS System 08:48 Wednesday, March 10, 2008 4

5、X0 4.64 45.4 9.965 XM 0.64 -4.6 -0.035

6、 A 54.708 190.19 -34.372 190.19 3795.98 -107.16 -34.372 -107.16 68.

7、9255 AI 0.0308503 -0.001162 0.0135773 -0.001162 0.0003193 -0.000083

8、 0.0135773 -0.000083 0.0211498 DD D2 T2 F 0.0256283 0.4869386 9.7387729 2.9045463

9、 P0 0.0649283 FA BETA 3.1967768 0.3616381,二 單個總體均值分量間結(jié)構(gòu)關(guān)系的檢驗,

10、是取自該總體的樣本。檢驗:,1、問題引入,例 設(shè),與上面的假設(shè)等價的是,尋找常數(shù)矩陣,,,,注:矩陣C不是唯一的,,在例4.2.1中,假定人類的體形有這樣一個一般規(guī)律的身高、胸圍和上臂圍平均尺寸比例為6:4:1。檢驗比例是否符合這一規(guī)律。檢驗:,,則上面的假設(shè)可以表達為,2、統(tǒng)計量及方法,其中C為一已知的k×p階矩陣,k<p,rank(C)=K,φ為已知的K維向量。根據(jù)多元正態(tài)分布的性質(zhì)可知,,檢驗:,S為協(xié)方差矩陣,,

11、當 為真時,,故可以將霍特林分布的統(tǒng)計量換算成F統(tǒng)計量。,對給定的顯著性水平α,檢驗的規(guī)則,,,某地區(qū)農(nóng)村男嬰的體格測量數(shù)據(jù)如下,檢驗三個指標的均值是否有關(guān)系,,,,proc iml;s={ 31.600 8.040 0.500, 8.040 3.172 1.310, 0.500 1.310 1.900};mu={82.00 60.20 14.50};c={2 -3 0,

12、 1 0 -6};a=c*t(mu);d=c*s*t(c);g=inv(d);T=6#(t(a)*g*a);f=((6-2)/(2*(6-1)))*T;Print T, f ; p0=1-probf(f,2,6-2); print p0;fa=finv(0.95,2,6-2); print fa;Quit;,T=47.143,The SAS System 08:48 Wednesday, M

13、arch 10, 2008 18 T 47.143404 F

14、 18.857362 P0 0.0091948 FA

15、 6.9442719,§4.2 兩個總體均值的檢驗,一、兩個獨立樣本的情形,與一元隨機變量的情形相同,常常我們需要檢驗兩個總體的均值是否相等。,設(shè)從總體 ,中各自獨立地抽取樣本 和 , 。,考慮假設(shè),根據(jù)兩個樣本可得μ1和μ2的無偏估計量為,其中,,當原假

16、設(shè)為真的條件下,,,檢驗的規(guī)則為:,,,data d331; input type x1-x4; cards; 1 65 35 25 60 1 75 50 20 55 1 60 45 35 65 1 75 40 40 70 1 70 30 30

17、 50 1 55 40 35 65 1 60 45 30 60 1 65 40 25 60 1 60 50 30 70 1 55 55 35 75 2 55 55 40 65 2 50 60 45

18、 70 2 45 45 35 75 2 50 50 50 70 2 55 50 30 75 2 60 40 45 60 2 65 55 45 75 2 50 60 35 80 2 40 45

19、 30 65 2 45 50 45 70 ; proc iml; n=10;m=10; p=4; use d331(obs=10); xx={x1 x2 x3 x4}; read all var xx into x; print x; ln={[10] 1} ; x0=(ln*x)/n; print x0; mx=i(n)-j(n,n,1)

20、/n; a1=x`*mx*x; print a1;,use d331(firstobs=11); read all var xx into y; print y; lm={[10] 1} ; y0=(lm*y)/m; print y0; my=i(m)-j(m,m,1)/m; a2=y`*my*y; print a2; a=a1+a2; xy=x0-y0; ai=inv(a); prin

21、t a ai; dd=xy*ai*xy`; d2=(m+n-2)*dd; t2=n*m*d2/(n+m) ; f=(n+m-1-p)*t2/((n+m-2)*p); print d2 t2 f; pp=1-probf(f,p,m+n-p-1); print pp; quit;,The SAS System 08:48 Wednesday, March 10, 2008 20

22、 X 65 35 25 60 75 50 20 55

23、 60 45 35 65 75 40 40 70 70 30 30 50

24、 55 40 35 65 60 45 30 60 65 40 25 60 60

25、 50 30 70 55 55 35 75 X0 64 43 30.5

26、 63 A1 490 -170 -120 -245 -170 510 10 310

27、 -120 10 322.5 260 -245 310 260 510,Y 55 55 40 65

28、 50 60 45 70 45 45 35 75 50 50 50 70

29、 55 50 30 75 60 40 45 60 65 55 45 75

30、 50 60 35 80 40 45 30 65 45 50 45 70

31、 Y0 51.5 51 40 70.5 A2 502.5 60 175 -7.5

32、 60 390 50 195 175 50 450 -100 -7.5 195 -100 322.5,A

33、 AI 992.5 -110 55 -252.5 0.0011142 -0.000091 -0.00016 0.0004239 -110 900 60 505 -0.000091 0.0016972 0.0000975 -0.001076 55 60 772.5

34、 160 -0.00016 0.0000975 0.0013754 -0.000372-252.5 505 160 832.5 0.0004239 -0.001076 -0.000372 0.0020539 D2 T2 F

35、 5.9724991 29.862495 6.2213532 PP 0.0037058,二、成對試驗的T2統(tǒng)計量,前面我們討論的是兩個獨立樣本的檢驗問題,但是不少的實際問題中,兩個樣本的數(shù)據(jù)是成對出現(xiàn)的。例如當討論

36、男女職工的工資收入是否存在差異;一種新藥的療效等。,思考:兩獨立樣本和成對樣本的觀測值有何不同。,設(shè)(xi,yi),i=1,2,3,…,n,時成對的試驗數(shù)據(jù),由于總體X和Y均服從p維正態(tài)分布,且協(xié)方差相等。,假設(shè)檢驗,,檢驗的統(tǒng)計量為,其中,,,當原假設(shè)為真時,例1 一組學生共5人,采用兩種不同的方式進行教學, 然后對5個學生進行測驗,得如下得分數(shù):,分析不同的教學方式是否有差異。,data a;input x1 x2 y1 y2

37、@@;cards;89 90 82 85 98 88 80 83 75 69 61 70 76 70 6766 90 76 63 65;data d;set a;x12=x1-y1;y12=x2-y2;proc corr cov;var x12 y12;run;proc iml;s={ 63.50 21.000, 21.00 18.200};mu={ 15.00, 4.800};g=inv(s);r=t(

38、mu)*g*mu;print r;run;,§4.3 兩個總體均值分量間結(jié)構(gòu)關(guān)系的檢驗,一、問題提出,設(shè)從總體 ,中各自獨立地抽取樣本 和 , 。他們的均值向量差為:,例 在愛情和婚姻的調(diào)查中,對一個由若干名丈夫和妻子組成的樣本進行了問卷調(diào)查,請他們回答以下幾

39、個問題:(1)你對伴侶的愛情的“熱度”感覺如何?(2)伴侶對你的愛情的“熱度”感覺如何?(3)你對伴侶的愛情的“可結(jié)伴”水平感覺如何?(4)伴侶對你的愛情的“可結(jié)伴”水平感覺如何? 回答采用沒有、很小、有些、很大和非常大5個等級,得到結(jié)果如表。,現(xiàn)在我們關(guān)心均值分量間的差異是否滿足某種結(jié)構(gòu)關(guān)系。比如每個指標均值間的差異是否相等。 1、丈夫?qū)ζ拮右约捌拮訉φ煞虻幕卮鹪讦粒?.05顯著水平上沒有差異。

40、 2、在四個指標上他們是否會有相同的分數(shù)。即檢驗四個分數(shù)的平均值是否相等。,二、統(tǒng)計量與檢驗,檢驗,,在原假設(shè)為真的條件下,檢驗的統(tǒng)計量為:,,,data a;input x1 x2 x3 x4 class;cards;數(shù)據(jù)行省略;run;proc anova;class class;model x1-x4=class;manova h=class m=(1 -1 0 0 ,

41、 1 0 -1 0 , 1 0 0 -1);run;,H = Anova SSCP Matrix for class E = Error SSCP Matrix S=1 M=0.5 N=27 Statistic

42、 Value F Value Num DF Den DF Pr > F Wilks' Lambda 0.87857261 2.58 3 56 0.0626 Pillai's Trace 0.12142739

43、 2.58 3 56 0.0626 Hotelling-Lawley Trace 0.13820985 2.58 3 56 0.0626 Roy's Greatest Root 0.13820985 2.58 3 56 0.0626,pr

44、oc iml;sigma1={0.5758620690 0.3758620690 -.1034482759 -.1655172414, 0.3758620690 0.5850574713 -.0919540230 -.1586206897, -.1034482759 -.0919540230 0.4367816092 0.4137931034,

45、 -.1655172414 -.1586206897 0.4137931034 0.4551724138};mu1={ 3.90000, 3.96667, 4.33333, 4.40000}; sigma2={ 0.4885057471 -.0172413793 0.0402298851 0.0229885057, -.0172413793 0.4379310345

46、0.0724137931 0.1172413793, 0.0402298851 0.0724137931 0.2402298851 0.2022988506, 0.0229885057 0.1172413793 0.2022988506 0.2574712644}; mu2={ 3.83333, 4.10000, 4.63333, 4.53333};c={

47、1 -1 0 0 , 1 0 -1 0 , 1 0 0 -1};mu=(mu1+mu2)/2;a=c*mu;sigma=29#(sigma1+sigma2)/58;t2=60#t(a)*inv(c*sigma*t(c))*a;print t2;,第一節(jié) 單因素方差分析,問題的提出統(tǒng)計的模型及檢驗方法多重比較檢驗,問題的提出,某工廠實行早、中、晚三班工作制。工廠管理部門想了解不同班次工人勞動效率是否存在明顯的差異

48、。每個班次隨機抽出了7個工人,得工人的勞動效率(件/班)資料如表。分析不同班次工人的勞動效率是否有顯著性差異。 a=0.05,0.01。,為什么各值 會有差異?可能的原因有兩個。,一是,各個班次工人的勞動效率可能有差異,從而導(dǎo)致了不同水平下的觀察值之間差異,即存在條件誤差。,二是,隨機誤差的存在。,如何衡量兩種原因所引起的觀察值的差異?,總平均勞動效率為:,三個班次工人的平均勞動效率分別為:,總離差平方和ss,組間離差平

49、方和(條件誤差)ssA,組內(nèi)離差平方和(隨機誤差)sse,統(tǒng)計量F,把計算的F值與臨界值比較,當F > F?時,拒絕原假設(shè),不同水平下的效應(yīng)有顯著性差異;當F ≤F ?時,接受原假設(shè)。,NEXT,查F分布表得臨界值因為 故應(yīng)拒絕原假設(shè),即不同班次工人的勞動效率有顯著的差異。,方差分析:比較3個或3個以上的總體均值是否有顯著性

50、差異。用組間的方差與組內(nèi)方差相比,據(jù)以判別誤差主要源于組間的方差(不同組工人的產(chǎn)量,條件誤差),還是源于組內(nèi)方差(隨機誤差)。,NEXT,50家上市公司,按行業(yè)計算其1999年底的資產(chǎn)負債情況,如下:,,,,,,,多重比較檢驗,1、多重比較檢驗 前面的F檢驗只能說明在單一因素的影響下,不同水平是否存在顯著性的差異,但不能斷言哪些總體之間存在差異,在方差分析中否定了原假設(shè),并不意味著接受了假設(shè):,因而還應(yīng)該進一步討論

51、到底是哪些總體之間存在差異。,Scheffe檢驗,檢驗的結(jié)論:,第二節(jié) 多元方差分析,一、假設(shè),,,二、多元方差分析的離差平方和的分解,總離差平方和,,,,由于交叉乘積項為零,故組間叉積矩陣+組內(nèi)叉積矩陣=總叉積矩陣,,組內(nèi)叉積矩陣:主要由隨機因素構(gòu)成,,組間叉積矩陣:主要由系統(tǒng)因素構(gòu)成,SSE和SSA之和等于總離差平方和SST。當SSE在SST中占有較大的份額時,可以認為隨機因素影響過大,反之SSE所占份額小,SSA所占份額就

52、大,不同試驗間的觀測值會有顯著性差異。,,三、統(tǒng)計量,對給定的顯著性水平?,檢驗規(guī)則為:,,拒絕原假設(shè);,接受原假設(shè);,注:關(guān)于?統(tǒng)計量與F統(tǒng)計量的換算,參看附錄。,例4.6.1,有四種不同的商品x1,x2,x3和x4,按三種不同的方式銷售,有數(shù)據(jù)如程序數(shù)據(jù)行,檢驗三種消費方式是否有顯著性差異。,proc iml;csscp={49290.8500 8992.2500 -36444.0000 28906.8000, 89

53、92.2500 9666.5833 -4658.3333 4859.0000,36444.0000 -4658.3333 429509.3333 -58114.0000,28906.8000 4859.0000 -58114.0000 175644.4000}; mu1={90.80000 58.65000 404.50000 230.65000}; mu2={ 72.90000

54、 51.45000 417.75000 253.15000}; mu3={ 94.15000 55.15000 403.75000 292.00000}; mu={ 85.95000 55.08333 408.66667 258.60000}; bcsscp=20#(t(mu1-mu)*(mu1-mu)+t(mu2-mu)*(mu2-mu)+t(mu3-mu)*(mu3-mu));icsscp=css

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論