版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、1第六章第六章假設檢驗假設檢驗參數(shù)估計和假設檢驗是推斷統(tǒng)計的兩個組成部分,都是利用樣本信息對總體進行某種推斷,只是推斷的角度不同。它們廣泛地應用于教育學、心理學、經(jīng)濟學以及醫(yī)學等領域。本章將對假設檢驗的原理、步驟以及常見的假設檢驗方法進行介紹。第一節(jié)第一節(jié)假設檢驗的一般問題假設檢驗的一般問題一、假設檢驗的基本思想一、假設檢驗的基本思想所謂假設檢驗(hypothesistesting),就是先對總體的某些數(shù)量特征作出假設,然后利用樣本的信
2、息,通過統(tǒng)計推斷的方法對假設進行判斷,以決策能否拒絕假設的一種統(tǒng)計分析方法。一般來說,我們進行假設檢驗是檢驗總體之間是否有顯著差異。如果我們能夠準確知道總體的全部信息,這種判斷非常容易得出。比如,一個總體的均值為50,另一個總體的均值為55,則我們只需要從數(shù)學的角度比較兩個數(shù)字,50顯然不等于55,從而得出兩個總體均值是有差異的。但是實際情況是,總體的信息我們并不能完全獲取,我們只是通過樣本信息來對總體進行推斷,因此我們需要借助統(tǒng)計推斷
3、的原理,用概率的方法來判斷兩個樣本各自所代表的總體之間有無差異。由于抽樣的隨機性導致抽樣誤差是肯定存在的,因此我們認為這種差異需要達到一定程度才可以判斷總體之間確實存在顯著性差異。在進行假設檢驗之前,由于我們通常難以完全知道所關(guān)心的總體的某些數(shù)量特征及其變化情況,因此常常需要對總體的目前狀況作出某種假設。例如我們考慮目前股票市場上的價格指數(shù)的走勢是否正常,我們可以根據(jù)過去長期觀察的平均水平和變異情況,作出當前股票價格水平可能正常或不正常
4、的假設。又如工廠生產(chǎn)某種產(chǎn)品,經(jīng)過工藝改革,使用新材料、新配方,企業(yè)管理者十分關(guān)心產(chǎn)品質(zhì)量是否有所提高,因此可以假設經(jīng)過改革以后產(chǎn)品質(zhì)量可能提高或者并沒有提高。我們可以通過一個例子來說明假設檢驗的基本思想。【例61】假定某可樂公司裝灌一瓶可樂飲料的標準含量是250毫升,只有在最佳狀態(tài)下所有的可樂飲料的含量才正好是250毫升,所以公司希望飲料的平均含量是這個數(shù)。但質(zhì)檢員擔心設備出現(xiàn)故障,想進行一次假設檢驗以幫助確定是否出現(xiàn)故障以造成飲料的
5、多裝或少裝。假定總體為正態(tài)總體,總體標準差為5毫升,質(zhì)檢員隨機抽取了16瓶可樂飲料,測得其平均含量為253毫升,那么在0.05的顯著性水平下能否判斷設備是否出現(xiàn)故障。質(zhì)檢員希望設備正常運轉(zhuǎn),但的確想知道設備是否出現(xiàn)故障以造成飲料的多裝或少裝。可以先假定設備未出現(xiàn)故障,也就是不同批次生產(chǎn)的可口可樂平均含量沒有顯著差異。現(xiàn)在從不同批次生產(chǎn)的可口可樂中抽取一部分作為樣本,并根據(jù)實際觀察的樣本資料計算統(tǒng)計量的取值,來判斷其與假設的總體參數(shù)是否一
6、致。當然,要求兩者完全一致的可能性是極小的,那么差異達到多大才算是顯著呢?所謂顯著性是指差異程度而言的,程度不同說明引起差異的原因也有不同。一般來說,存在著兩種不同性質(zhì)的差異,系統(tǒng)差異和隨機差異。系統(tǒng)差異由總體的本質(zhì)差別引起,而隨機差異則由抽樣的隨機性而導致。從這個例子來說,系統(tǒng)差異就是由于設備的確發(fā)生了故障,導致不同批次生產(chǎn)的可口可樂平均含量發(fā)3第二步:選擇合適的統(tǒng)計量,并計算出統(tǒng)計量的具體取值。不同的假設檢驗問題需要選擇不同的檢驗統(tǒng)
7、計量。其實假設檢驗和參數(shù)估計在統(tǒng)計量的選擇上是一致的。我們一般是對總體的均值、比例和方差進行假設檢驗,在不同的已知條件下分別采用Z統(tǒng)計量、t統(tǒng)計量和統(tǒng)計量作為檢驗統(tǒng)計量,我們將在后面的內(nèi)容中2?詳細介紹。在【例61】中,因為假定總體是正態(tài)分布,且方差已知,則可采用Z統(tǒng)計量,即:nxZ??0??在為真時,Z統(tǒng)計量服從標準正態(tài)分布,即Z~N(01)。0H根據(jù)【例61】給出的具體數(shù)據(jù),我們可以計算出Z統(tǒng)計量的值為:2.4?????165250
8、2530nxZ??第三步:根據(jù)給定的顯著性水平,查表得到臨界值,并進行統(tǒng)計決策。當檢驗統(tǒng)計量被確定以后,我們可以根據(jù)其分布狀況以及給定的顯著性水平的值查?正態(tài)分布表可得臨界值1,即接受區(qū)域和拒絕區(qū)域的分界點。然后我們可以按照以下標2?Z準進行決策:當時,落入拒絕域,則拒絕原假設;?Z2?Z0H當,落入接受域,則接受原假設。2?ZZ?0H對于【例61】給定的顯著性水平=0.05,查正態(tài)分布表可得臨界值=1.96。?2?Z可知,則可以拒絕原
9、假設,即樣本均值與總體均值有顯著差異,也就是說設備?Z2?Z出現(xiàn)了故障。三、假設檢驗的兩類錯誤三、假設檢驗的兩類錯誤對于原假設提出的命題,我們需要作出判斷,這種判斷可以用“原假設正確”或“原假設錯誤”來表述。但是由于假設檢驗是根據(jù)有限的樣本信息來推斷總體特征,由于樣本的隨機性可能致使判斷有可能出錯,也就是說我們面臨著犯錯誤的可能性。通常我們所犯的錯誤有兩種類型,我們稱為第一類錯誤和第二類錯誤。第一類錯誤:第一類錯誤:當原假設為真時,由于
10、樣本的隨機性使樣本統(tǒng)計量落入了拒絕域,0H所作的判斷是拒絕原假設。這時所犯的錯誤稱為第一類錯誤第一類錯誤,亦稱棄真錯誤棄真錯誤。由于這時我們認為“一次抽樣中小概率事件發(fā)生了”是不合理的,從而作出了拒絕原假設的結(jié)論。但事實上,小概率事件只是發(fā)生概率非常小而已,并非絕對不發(fā)生。犯第一類錯誤的概率亦稱棄真概率,它實質(zhì)上就是顯著性水平,所以我們也把第一類錯誤稱為錯誤錯誤。??1由于假設檢驗分為單側(cè)檢驗和雙側(cè)檢驗,其臨界值和決策的標準有所不同,這
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論