版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、<p> 編號 2010211919 </p><p><b> 畢業(yè)論文 </b></p><p><b> (2014屆本科)</b></p><p> 非參數(shù)假設(shè)檢驗的幾種檢驗方法及其簡單應(yīng)用</p><p> Several test methods of No
2、nparametric hypothesis test and its simple applications</p><p> 學(xué) 院: 數(shù)學(xué)與統(tǒng)計學(xué)院 </p><p> 專 業(yè): 數(shù)學(xué)與應(yīng)用數(shù)學(xué) </p><p> 作者姓名:
3、 </p><p> 指導(dǎo)教師: 職稱: 副教授 </p><p> 完成日期: 2014 年 5 月 20 日</p><p><b> 二○一四 年五 月</b></p&
4、gt;<p> 摘 要 本文主要介紹了非參數(shù)假設(shè)檢驗的概念和非參數(shù)假設(shè)檢驗的幾種檢驗方法,卡方檢驗、柯爾莫哥洛夫檢驗、秩和檢驗以及符號檢驗,并通過結(jié)合生產(chǎn)和生活中的實例給出了一些具體的應(yīng)用.</p><p> 關(guān)鍵詞 樣本;非參數(shù)假設(shè)檢驗;卡方檢驗;柯爾莫哥洛夫檢驗;秩和檢驗;符號檢驗</p><p> Abstract:This paper mainly int
5、roduces the concept of nonparametric hypothesis testing and several kinds of test methods,such as chi-square test, kolmogorov test, sum of ranks inspection test and symbols test, by using examples of production process a
6、nd living, some specific applications are given.</p><p> Keywords: Sample; Nonparametric hypothesis testing; Chi-square test; Kolmogorov test; sum of ranks inspection; Sign test </p><p><b&g
7、t; 1 引言 </b></p><p> 非參數(shù)檢驗是統(tǒng)計學(xué)的一個重要分支,它不依賴于總體的分布,僅需要一些一般(例如連續(xù)分布,對稱分布等)的假設(shè),進行統(tǒng)計推斷時,只利用樣本觀察值中一些非常直觀的信息.非參數(shù)檢驗常用于以下四種情況:(1)待分析資料不滿足參數(shù)檢驗所要求的假定,因而無法應(yīng)用參數(shù)檢驗.(2)資料僅由一些等級構(gòu)成,因而無法應(yīng)用參數(shù)檢驗.(3)所提的問題中并不包含總體參數(shù),這時也適宜采
8、用非參數(shù)方法.(4)要迅速得出結(jié)果時采用的簡單方法.非參數(shù)檢驗與參數(shù)檢驗相對應(yīng),含有豐富的統(tǒng)計思想,并在社會學(xué)、醫(yī)學(xué)、心理學(xué)、教育學(xué)等領(lǐng)域都有廣泛應(yīng)用.</p><p><b> 2 卡方檢驗</b></p><p> 定義1[1] 非參數(shù)檢驗是指不需要對總體分布做任何事先的假定,也不以檢驗總體的參數(shù)為目的的假設(shè)檢驗. </p><p>
9、; 定理1[2](皮爾遜定理) 當(dāng)隨機樣本容量充分大()時,將樣本分成互斥的類,每類實際出現(xiàn)的頻數(shù)為,而根據(jù)對總體的假設(shè),每類應(yīng)出現(xiàn)的理論頻數(shù)(或稱期望頻數(shù))為,則統(tǒng)計量</p><p> 近似服從自由度為的分布.</p><p> 皮爾遜定理表明,檢驗就是檢驗觀察值與理論值之間的緊密程度.根據(jù)皮爾遜定理,檢驗步驟如下:</p><p><b>
10、(1)提出假設(shè)</b></p><p> 原假設(shè):總體服從某一理論分布;</p><p> 備擇假設(shè):總體不服從某一理論分布;</p><p> (2)隨機抽取容量為的樣本,將樣本分成類;</p><p> (3)根據(jù)分類結(jié)果確定每類的實際頻數(shù);</p><p> (4)假定原假設(shè)為真,算出每類的
11、理論頻數(shù),若,則將相鄰幾類的頻數(shù)合并;</p><p> (5)建立檢驗統(tǒng)計量</p><p> 它近似服從自由度為的分布,為指定分布中被估計的參數(shù)的個數(shù); </p><p> (6)計算檢驗統(tǒng)計量的值,根據(jù)給定的顯著性水平做出決策.</p><p> 若,則拒絕;反之接受.</p><p> 例1 在對I
12、T行業(yè)的工作滿意度調(diào)查中,7%的信息系統(tǒng)管理者認(rèn)為“非常滿意”,58%認(rèn)為“基本滿意”,24%認(rèn)為“不太滿意”,4%認(rèn)為“根本不滿意”,7%認(rèn)為“不確定”.而計算機程序員工作滿意度樣本數(shù)據(jù)由表1給出.</p><p> 表1 計算機程序員工作滿意度評價實際頻數(shù)表</p><p> 試判斷計算機程序員工作滿意度和信息系統(tǒng)管理者工作滿意度是否相同?取.</p><p&
13、gt; 解 如果計算機程序員工作滿意度和信息系統(tǒng)管理者工作滿意度相同,那么計算機程序員工作滿意度的概率分布就應(yīng)與信息系統(tǒng)管理者工作滿意度的分布相同.因此可提出如下假設(shè):</p><p> 原假設(shè):總體服從分布;</p><p> 備擇假設(shè):總體不服從分布;</p><p> 在原假設(shè)成立的條件下可計算出計算機程序員工作滿意度評價的理論頻數(shù),見表2.<
14、/p><p><b> 計算檢驗統(tǒng)計量</b></p><p><b> ,</b></p><p> 因為,,而,所以拒絕原假設(shè),即可以得出結(jié)論,計算機程序員的工作滿意度和信息系統(tǒng)管理者的不相同.</p><p> 表2 計算機程序員的工作滿意度評價理論頻數(shù)計算表</p>&l
15、t;p> 定理2[3] 設(shè)為總體的理論分布,理論頻率為,則當(dāng)成立時,不論F是什么分布,統(tǒng)計量</p><p> 當(dāng)時的極限分布為,其中是分組的組數(shù).</p><p> 注1:(1)定義各項中,是反映了頻率與概率的偏差,如果偏大應(yīng)拒絕;若偏小可接受,系數(shù)是為了使有一個理想的極限分布;</p><p> (2)統(tǒng)計量的定義與樣本空間的劃分有關(guān),只有當(dāng)樣本
16、空</p><p> 間的劃分取得合適時,構(gòu)造的離散分布才能較好地近似,這其實也是檢驗法的一個缺陷所在;</p><p> (3)實際中遇到最多的是分布族的檢驗,也就是檢驗總體是否屬于某種分布族.</p><p> 例2 將一顆骰子擲了120次,結(jié)果如下:</p><p> 點數(shù):1,2,3,4,5,6;</p>&l
17、t;p> 頻數(shù):21,28,19,24,16,12;</p><p> 試在顯著性水平下檢驗骰子是否均勻?</p><p> 解 檢驗骰子是否均勻,就是要檢驗假設(shè)</p><p><b> 計算得:</b></p><p><b> .</b></p><p&g
18、t; 對,,,故接受假設(shè),即認(rèn)為這顆骰子是均勻.</p><p> 注2:在用定理2計算統(tǒng)計量時,必須滿足: </p><p> (1)一定要夠大,最好達到;</p><p> (2)每不能太小,最好達到,否則應(yīng)適當(dāng)合并以滿足要求.</p><p><b> 3 符號檢驗</b></p><
19、p> 符號檢驗是利用正、負(fù)號的數(shù)目對某種假設(shè)作出判斷的方法.它直觀、簡單,不需要知道被檢驗量的分布規(guī)律,用途十分廣泛.在實際應(yīng)用中,它分為單樣本和兩個樣本的符號檢驗.在這里,只介紹兩個相關(guān)樣本的符號檢驗.</p><p> 兩個相關(guān)樣本的符號檢驗是通過對比樣本的成對數(shù)據(jù)來確定正負(fù)號,根據(jù)正負(fù)號的數(shù)目的對比來判斷兩個樣本有無顯著差異.</p><p> 定理3[4] 設(shè)是正號出
20、現(xiàn)的概率,是負(fù)號出現(xiàn)的概率;若兩樣本無顯著差異,則正負(fù)號出現(xiàn)的概率應(yīng)該相等.</p><p><b> 原假設(shè);備擇假設(shè).</b></p><p> 兩個樣本數(shù)據(jù)分別和,比較成對數(shù)據(jù),首先去掉觀察值相同的樣本對;若,差值為正記為“+”,若,差值為負(fù)記為“-”,正號和負(fù)號的數(shù)量分別為和,正負(fù)號之和是樣本容量,即.</p><p> 在小樣本
21、情況下統(tǒng)計量為 </p><p> , (1)</p><p> 在大樣本情況下,若原假設(shè)為真,則二項分布可近似服從于正態(tài)分布,檢驗統(tǒng)計量為</p><p><b> (2)</b></p><p> 在小樣本情況下,若值,則拒絕原假設(shè);</p><p&
22、gt; 在大樣本情況下,若,則拒絕原假設(shè).</p><p> 符號檢驗僅利用了符號的信息,并沒有考慮數(shù)據(jù)大小,因而精確度不高.</p><p> 例3 某公司目前招聘一名廣告市場分析的研究員,共有20名應(yīng)聘者前來應(yīng)聘,客戶部經(jīng)理和市場部經(jīng)理給這20名應(yīng)聘者的面試分?jǐn)?shù)由表3給出,試分析客戶部經(jīng)理和市場部經(jīng)理的評價標(biāo)準(zhǔn)是否一致.</p><p> 解 該問題
23、可以用符號檢驗的方法進行處理,根據(jù)題意提出假設(shè):</p><p> 原假設(shè),即客戶部經(jīng)理和市場部經(jīng)理的評價標(biāo)準(zhǔn)一致;</p><p> 備擇假設(shè),即客戶部經(jīng)理和市場部經(jīng)理的評價標(biāo)準(zhǔn)不一致.</p><p> 根據(jù)已知表的數(shù)據(jù),計算樣本對差值的符號,結(jié)果由表4給出. 根據(jù)表4中的樣本數(shù)據(jù)得,,,.由于,所以屬于小樣本情況,根據(jù)公式(1)得</p>
24、<p><b> ,</b></p><p><b> .</b></p><p> 顯著性水平,,故接受原假設(shè),即認(rèn)為兩個經(jīng)理的評價標(biāo)</p><p><b> 準(zhǔn)一致.</b></p><p> 表3 應(yīng)聘者得分統(tǒng)計表</p><p
25、> 表4 樣本對觀察值的差值的符號</p><p> 例4 某公司采用廣告銷售,隨即選取30個城市,得到廣告促銷前后的銷售額的樣本數(shù)據(jù),如表5所示(單位:萬元).</p><p> 試用符號檢驗分析促銷活動的效果.</p><p> 解 根據(jù)題意提出假設(shè)為:</p><p> 原假設(shè),即認(rèn)為廣告前后銷售額無顯著差異;&l
26、t;/p><p> 備擇假設(shè),即認(rèn)為廣告前后銷售額有顯著差異.</p><p> 根據(jù)表5中的數(shù)據(jù)得,,,.</p><p><b> ,</b></p><p><b> 統(tǒng)計量的觀察值</b></p><p><b> .</b></p&
27、gt;<p> 顯著水平,查表得到,而,所以拒絕原假設(shè),即認(rèn)為廣告前后銷售額有顯著差異,廣告有助于促銷.</p><p> 表5 廣告促銷前后銷售額的比較表</p><p> 4 柯爾莫哥洛夫檢驗</p><p> 與檢驗中的情況一樣,假設(shè)有,,在總體中取個樣本并將其樣本值按大小排成的順序,記為不大于的樣本值出現(xiàn)的概率,則</p>
28、<p><b> 稱為樣本分布函數(shù).</b></p><p> 定理4[7](格列汶科定理) 設(shè)總體分布函數(shù)為,樣本分布函數(shù)為,則</p><p><b> .</b></p><p> 即當(dāng)時,以概率1關(guān)于均勻收斂于.它表明,當(dāng)很大時,可以用近似代替,</p><p> 即
29、 </p><p> 這是能用樣本推斷總體的理論根據(jù).</p><p> 柯爾莫哥洛夫檢驗方法如下:</p><p><b> (1)提出假設(shè)</b></p><p><b> 原假設(shè):;</b></p><p&g
30、t;<b> 備擇假設(shè):.</b></p><p><b> 利用對進行檢驗.</b></p><p><b> (2)取統(tǒng)計量</b></p><p> 并稱為與的差異度. 是一個隨機變量,它有自己的分布.柯爾莫哥洛夫證明了:若是連續(xù)型隨機變量,對任意常數(shù),記,則</p>&l
31、t;p> 的值已被列成數(shù)表,可供查用,由此得出,當(dāng)充分大時</p><p><b> ,即;</b></p><p> (3)對給定的,寫出小概率事件的概率表達式</p><p><b> ;</b></p><p> (4)查數(shù)表,能求得,方法如下:因為</p>&l
32、t;p><b> 所以,是對應(yīng)于的.</b></p><p> 根據(jù)樣本值和,,求出;</p><p> (5)判斷:若,則拒絕,若,則接受.</p><p> 例5 為確定總體的分布,取容量的樣本測得樣本值如下</p><p> 0.54, 0.21,0.31,0.40,0.46,0.17, 0.14
33、,0.12, 0.51,0.50試判斷總體在區(qū)間上是否服從均勻分布?</p><p> 解 若在上服從均勻分布,則有理論分布</p><p> 現(xiàn)在樣本值按由小到大的順序列于表6中.</p><p> 由樣本的經(jīng)驗分布函數(shù)為</p><p> ,的數(shù)值以及它們的差值都在表6中.</p><p><b>
34、; 表6</b></p><p><b> 現(xiàn)對進行檢驗.</b></p><p><b> (1)原假設(shè):;</b></p><p> (2)在成立的條件下,取統(tǒng)計量</p><p><b> ;</b></p><p><
35、b> (3)對給定的,;</b></p><p> (4)查表,,,從表6中看出</p><p><b> ;</b></p><p> (5)判斷:,所以接受,即在上服從均勻分布.</p><p><b> 5 秩和檢驗</b></p><p>
36、 定義2[8] 設(shè)兩個總體的分布函數(shù)分別為和,分別在兩個總體中抽取容量為和的樣本,將兩個樣本的觀測數(shù)據(jù)按大小順序排列,并統(tǒng)一編號,規(guī)定每個數(shù)據(jù)在排列中所對應(yīng)的序號稱為該數(shù)的秩,對于相同的數(shù)值則用它們序數(shù)的平均值作為秩.把容量為的樣本的秩加起來得秩和,把容量為的樣本的秩加起來得秩和.</p><p><b> 秩和檢驗方法如下:</b></p><p><b
37、> (1)提出假設(shè)</b></p><p><b> 原假設(shè):;</b></p><p><b> 備擇假設(shè):.</b></p><p><b> (2)取統(tǒng)計量為</b></p><p> 容量為的樣本所對應(yīng)的秩和</p><p
38、><b> 即當(dāng)時,當(dāng)時;</b></p><p> (3)對給定的,查秩和檢驗表,可得出對應(yīng)于的下限和上限;</p><p> (4)判斷:當(dāng)時,接受,即認(rèn)為兩總體差異不顯著;反之則拒絕,即認(rèn)為兩總體差異顯著.</p><p> 例6 用兩種不同材料的燈絲制造燈泡,現(xiàn)分別隨機抽取若干個燈泡進行壽命試驗,得數(shù)據(jù)如下(單位:h)&
39、lt;/p><p> 問兩種材料的燈泡壽命有無明顯差異().</p><p> 解 將數(shù)據(jù)按大小次序排列成表7.</p><p> 這里1700h甲乙兩種材料均有,它們的秩取平均數(shù).材料2的容量最小,于是統(tǒng)計量應(yīng)取材料2的秩和,即.</p><p> 在秩和檢驗表的,,的欄內(nèi),查的秩和下限,秩和上限.</p><p&
40、gt; 現(xiàn)在,故拒絕原假設(shè),認(rèn)為兩種材料對燈泡壽命的影響有顯著差異.</p><p><b> 表7</b></p><p> 注3:秩和檢驗表中對應(yīng)于和中的較小者,對應(yīng)于和中的較大者.在表中只列到的情況,當(dāng)其中有一個大于10時,我們可以利用的極限分布來檢驗.可以證明,當(dāng)較大時,近似地服從正態(tài)分布:</p><p> ?。ㄆ渲惺桥c中的較小
41、者,對應(yīng)于與中的較大者).這時可用檢驗法,統(tǒng)計量</p><p> 服從,從而對水平,查正態(tài)分布表即可.</p><p><b> 致謝 </b></p><p> 感謝魏老師的悉心指導(dǎo).</p><p> 參 考 文 獻</p><p> [1]范金城,梅長林.數(shù)據(jù)分析[M].北
42、京:科學(xué)出版社.2002</p><p> [2]孫建軍.應(yīng)用數(shù)理統(tǒng)計[M].南京:東南大學(xué)出版社.2007</p><p> [3]史道濟,張玉環(huán).應(yīng)用數(shù)理統(tǒng)計[M].天津:天津大學(xué)出版社.2008</p><p> [4]張德培,羅蘊玲.應(yīng)用概率統(tǒng)計[M].北京:高等教育出版社.2000</p><p> [5]李永樂,胡慶軍.應(yīng)
43、用數(shù)理統(tǒng)計[M].北京:國防科技大學(xué)出版社.1995</p><p> [6]宋占杰,胡飛.應(yīng)用概率統(tǒng)計[M].天津:天津大學(xué)出版社.2012</p><p> [7]陳魁.應(yīng)用概率統(tǒng)計[M].北京:清華大學(xué)出版社.2004</p><p> [8]繆銓生.概率與統(tǒng)計[M].上海:華東師范大學(xué)出版社.2007</p><p> [9]
44、葉鋼,李重文,余丹,馬世龍.基于非參數(shù)假設(shè)檢驗的程序缺陷定位方法[J].北京航空航天大學(xué).2012,10(8):56-63</p><p> [10]葛元沖,林正大.一種非參數(shù)假設(shè)檢驗法的討論[J].廣西師院(自然科學(xué)版).1991,16(2):21-27</p><p> [11] 王金玉,李霞,潘德惠.非參數(shù)假設(shè)檢驗的在證劵投資分析中的應(yīng)用[J].數(shù)學(xué)的實踐與認(rèn)識.2005,24(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 非參數(shù)假設(shè)檢驗的幾種檢驗方法及其簡單應(yīng)用
- 預(yù)防醫(yī)學(xué)基于秩次的假設(shè)檢驗方法
- 25335.應(yīng)用序貫檢驗方法解決一類假設(shè)檢驗問題
- 參數(shù)估計和假設(shè)檢驗
- 比例參數(shù)模糊假設(shè)檢驗的bayes方法
- 假設(shè)檢驗t檢驗
- 參數(shù)估計和假設(shè)檢驗
- 參數(shù)估計與假設(shè)檢驗
- 假設(shè)檢驗48924
- 《醫(yī)學(xué)假設(shè)檢驗》
- 比例參數(shù)模糊假設(shè)檢驗的Bayes方法.pdf
- 假設(shè)檢驗匯總
- 參數(shù)估計和假設(shè)檢驗案例
- 假設(shè)檢驗亦稱
- 數(shù)據(jù)分析方法假設(shè)檢驗
- 12894.多重假設(shè)檢驗的方法及其參數(shù)估計的研究
- 管理統(tǒng)計學(xué)第3章--非參數(shù)假設(shè)檢驗
- 論假設(shè)檢驗中的檢驗矛盾
- 概率論畢業(yè)論文外文翻譯--統(tǒng)計假設(shè)檢驗
- 假設(shè)檢驗-例題講解
評論
0/150
提交評論