![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-8/13/14/198e46f5-cefa-43c1-9ad8-26a42c9e5e1d/198e46f5-cefa-43c1-9ad8-26a42c9e5e1dpic.jpg)
![應用統(tǒng)計學第七章_第1頁](https://static.zsdocx.com/FlexPaper/FileRoot/2019-8/13/14/198e46f5-cefa-43c1-9ad8-26a42c9e5e1d/198e46f5-cefa-43c1-9ad8-26a42c9e5e1d1.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、應用統(tǒng)計學,制作:安徽大學管理學院 洪文,2,應用統(tǒng)計學,版權所有,未經(jīng)準許,不得翻制,3,第七章 假設檢驗,第一節(jié) 假設檢驗的一般問題題 第二節(jié) 總體均值的假設檢驗 第三節(jié) 總體比例的假設檢驗 附錄7 用SPSS進行假設檢驗,4,第一節(jié) 假設檢驗的一般問題,一、假設檢驗的基本原理 假設檢驗是推斷統(tǒng)計的重要內(nèi)容,所謂假設檢驗(Hypothesis Test)就是事先
2、作出一個關于總體參數(shù)的假設,然后利用樣本信息來判斷原假設是否合理,即判斷樣本信息與原假設是否有顯著差異,從而決定應接受或否定原假設的推斷統(tǒng)計方法。假設檢驗也稱為顯著性檢驗。,,5,第一節(jié) 假設檢驗的一般問題,假設檢驗不同于參數(shù)估計,參數(shù)估計是直接利用樣本的數(shù)據(jù)對未知的總體參數(shù)形成認識,而假設檢驗則是首先提出對總體參數(shù)的假設,然后根據(jù)樣本數(shù)據(jù)所反映的信息對原假設進行分析和判斷。 下面舉例說明假設檢驗的基本原理。
3、,,6,第一節(jié) 假設檢驗的一般問題,[例7.1] 某保險公司部門經(jīng)理估計某險種的投保人的平均年齡是40歲,研究人員從實際投保該險種的人員中隨機抽取38人,調查得到他們投保時的年齡數(shù)據(jù)如下: 24 50 31 35 43 48 36 51 35 37 44 46 29 39 38 23 34 28 42 3
4、9 33 44 36 46 42 17 38 29 47 26 32 48 39 27 34 42 34 40,,7,第一節(jié) 假設檢驗的一般問題,試依據(jù)調查結果判斷部門經(jīng)理的估計是否可靠? 這是關于總體投保人的平均年齡是否等于40歲的假設檢驗問題。題中隨機抽取38人構成樣本,由樣本數(shù)據(jù)計算得:
5、=37歲,這是否說明總體投保人的平均年齡不等于40歲呢?,,8,第一節(jié) 假設檢驗的一般問題,大家知道,由于抽樣的隨機性,樣本均值與總體均值之間總是存在一定的抽樣誤差,即使總體投保人的平均年齡如同那位經(jīng)理所估計的40歲(即?=40歲),樣本的平均年齡仍有可能大于或小于40歲。,,9,第一節(jié) 假設檢驗的一般問題,上一章介紹了抽樣誤差范圍與置信度的關系,即在95%的置信水平下,樣本均值與總體均值的誤差范圍不超過1.96倍的抽樣平均誤差
6、,即,,也可以說|-?|≥1.96?/n0.5的概率只有5%,通常認為這是一個很小的概率,據(jù)此可以將 “|-?|≥1.96?/n0.5”視為小概率事件,這種事件在100次抽樣中只發(fā)生5次,相對于一次抽樣而言,可以認為小概率事件幾乎是不可能發(fā)生的。,10,第一節(jié) 假設檢驗的一般問題,在本例中,已知n=38,假設?=40,經(jīng)計算得=37,s=8.07,計算統(tǒng)計量:,,結果表明,在一次抽樣中小概率事件發(fā)生了,這似乎不近
7、合理,所以可以認為經(jīng)理估計的平均年齡為40歲的情況不可靠。,11,第一節(jié) 假設檢驗的一般問題,綜上可見,假設檢驗是根據(jù)“小概率事件在一次抽樣試驗中幾乎是不可能發(fā)生的”這一原理,先對總體參數(shù)做出某種假設,然后依樣本統(tǒng)計量的估計值判斷假設是否合理,從而做出是否接受原假設的抉擇。,,12,第一節(jié) 假設檢驗的一般問題,二、假設檢驗的步驟 假設檢驗通常包括以下幾個步驟: (一)提出假設和備擇假
8、設 對每個假設檢驗問題,一般可同時提出兩個相反的假設,即原假設和備擇假設。 原假設(Null Hypothesis)又稱零假設,是待檢驗的假設,記為H0;備擇假設(Alternative Hypothesis)是拒絕原假設后可供選擇的假設,記為 H1。,,13,第一節(jié) 假設檢驗的一般問題,原假設和備擇假設是對立的,檢驗結果二者必取其一?;蛘呓邮蹾0而拒絕H1;或者拒
9、絕H0而接受H1。 原假設和備擇假設不是隨意提出的,應根據(jù)所檢驗問題的具體背景而定。常常是采取“不輕易拒絕原假設”的原則,即把沒有充分理由不能輕易否定的命題作為原假設,而相應地把沒有足夠把握就不能輕易肯定的命題作為備擇假設。,,14,第一節(jié) 假設檢驗的一般問題,一般的,假設有三種形式: 1、H0:?= ?0;H1:?≠ ?0 或H0:p= ?;H1:p
10、≠?。 當我們關心的問題是樣本估計值與假設的總體參數(shù)有沒有顯著性的差異,而不問其差異的方向時,應當采用這種形式的假設。把這種假設形式的檢驗稱為雙側檢驗(Two-Tailed Test)。例如例7.1中可提出假設:H0:?= 40;H1:?≠40。,,15,第一節(jié) 假設檢驗的一般問題,2、H0:? ≥ ?0;H1:? <?0 H0:?≥?0;H1:? <?0。
11、 當我們關心的問題是樣本估計值是否顯著的低于假設的總體參數(shù)時,應當采用這種形式的假設。把這種假設形式的檢驗稱為左單側檢驗。例如對某種電池使用壽命提出假設: H0:? ≥ 1000小時;H1:? <1000小時,,16,第一節(jié) 假設檢驗的一般問題,3、H0:? ≤ ?0;H1:? > ?0 或H0:? ≤?0;H1:? >
12、;?0。 當我們關心的問題是樣本估計值是否顯著地高于假設的總體參數(shù)時,應當采用這種形式的假設。把這種假設形式的檢驗稱為右單側檢驗。例如對某種產(chǎn)品不合格率提出假設: H0:? ≤ 3%;H1:? > 3%,,17,第一節(jié) 假設檢驗的一般問題,左側檢驗和右側檢驗統(tǒng)稱為單側檢驗(One- Tailed Test)。采用哪種假設形式,要根據(jù)所研究的實際問題而定。如果對研究問題
13、只需判斷有無顯著差異的情況,則采用雙側檢驗。如果所關心的是總體參數(shù)是否比某個值偏大(或偏小),則宜采用單側檢驗。另外,在假設檢驗中,原假設總是與等號相聯(lián)系的(原假設最終還是取等號)。,,18,第一節(jié) 假設檢驗的一般問題,(二)選擇適當?shù)慕y(tǒng)計量,并確定其分布形式 不同的假設檢驗問題需要選擇不同的統(tǒng)計量作為檢驗統(tǒng)計量。 在例7.1中,由于n=38 > 30是大樣本,所以樣本均值近似服
14、從正態(tài)分布,以樣本標準差代替總體標準差,所用的統(tǒng)計量是:,,19,第一節(jié) 假設檢驗的一般問題,在H0為真時,z ~ N(0,1)。 (三)選擇顯著性水平?,確定原假設H0的接受區(qū)域和拒絕區(qū)域 顯著性水平(Level of Significance)即表示原假設H0為真時拒絕H1的概率,即拒絕原假設所冒的風險,用?表示。假設檢驗應用小概率事件實際不可能發(fā)生的原理,這里的小概率就是指?。但是要小到什么
15、程度才算小概率?對此并沒有統(tǒng)一的標準。通常取?=0.1、0.05或0.01等。,,20,第一節(jié) 假設檢驗的一般問題,在實際應用中,一般是先給定了顯著性水平?,這樣就可以由有關的概率分布表查得臨界值(Critical Value)z?,從而確定H0的接受區(qū)域和拒絕區(qū)域。臨界值z?就是接受區(qū)域和拒絕區(qū)域的分界點。 對于不同形式的假設,H0的接受區(qū)域和拒絕區(qū)域也有所不同。,,21,第一節(jié) 假設檢驗的一般問題,雙
16、側檢驗的拒絕區(qū)域位于統(tǒng)計量分布曲線的兩側,如圖7.1(a)所示;左單側檢驗的拒絕區(qū)域位于統(tǒng)計量分布曲線的左側,如圖7.1(b)所示;右單側檢驗的拒絕區(qū)域位于統(tǒng)計量分布曲線的右側,如圖7.1(c)所示。 在例7.1中,若取?=0.05,由于是雙側檢驗,所以z?/2 = ?1.96。接受區(qū)域:- 1.96≤z≤1.96;拒絕區(qū)域:z > 1.96或z < - 1.96。,,22,第一節(jié) 假設檢驗的一般
17、問題,圖7.1 假設檢驗的接收域和拒絕域示意圖,,23,第一節(jié) 假設檢驗的一般問題,(四)做出結論 根據(jù)樣本資料計算出檢驗統(tǒng)計量z的具體值,如果檢驗統(tǒng)計量的值落在拒絕區(qū)域內(nèi),說明樣本所描述的情況與原假設有顯著性差異,應拒絕原假設;反之,則接受原假設。 對于例7.1,由于z = - 2.29落在拒絕區(qū)域內(nèi),所以拒絕原假設H0??梢缘贸鼋Y論:在?=0.05的顯著性水平下,抽樣結果的平均年齡顯著低于經(jīng)
18、理的估計值,有理由認為經(jīng)理的估計不可靠。,,24,第一節(jié) 假設檢驗的一般問題,三、假設檢驗中的兩類錯誤 在做出接受或拒絕原假設H0的結論時,是基于樣本信息來判斷的。由于樣圖7.1假設檢驗的接受域與拒絕域示意圖本的隨機性,使假設檢驗有可能出現(xiàn)兩類錯誤,具體情況如下。 (一)第一類錯誤 當原假設H0為真,但由于樣本的隨機性使樣本統(tǒng)計量落人了拒絕區(qū)域,這時所做的判斷是
19、拒絕原假設。,,25,第一節(jié) 假設檢驗的一般問題,這類錯誤稱為第一類錯誤,亦稱拒真錯誤。假設檢驗通常認為“一次抽樣中小概率事件發(fā)生了”是不合理的,從而根據(jù)抽樣結果做出了拒絕原假設的結論。但事實上,小概率事件只是發(fā)生概率很小而已,并非絕對不發(fā)生。假如例7.1中真實情況是總體平均年齡的確為40歲,但是抽查到的樣本平均年齡是37歲,屬于小概率事件發(fā)生了,按照檢驗的規(guī)則應當拒絕原假設廳H0:?=40,從而認為經(jīng)理的估計不可靠,這就犯了第一類
20、錯誤。,,26,第一節(jié) 假設檢驗的一般問題,犯第一類錯誤的概率,亦稱拒真概率,它實質上就是前面提到的顯著性水平?, 即P(拒絕H0|[H0為真]= ?。 (二)第二類錯誤 當原假設H0為不真,但由于樣本的隨機性使樣本統(tǒng)計量落人接受區(qū)域,這時的判斷是接受原假設。這類錯誤稱為第二類錯誤,亦稱取偽錯誤。,,27,第一節(jié) 假設檢驗的一般問題,假如例7.1中真實情況
21、是總體平均年齡為42歲,但是所抽查樣本的平均年齡是38歲,卻正好落在(40?2.57)歲的范圍內(nèi),這時按檢驗規(guī)則應當接受原假設玎H0:?=40,這就犯了第二類錯誤。犯第二類錯誤的概率亦稱取偽概率,用?表示,即P(接受H0|[H0不真]= ?。 由上述分析可見,接受原假設時,只是因為沒有發(fā)生小概率事件,還沒有充足的理由拒絕它(即還沒有足夠的把握拒絕它)。,,28,第一節(jié) 假設檢驗的一般問題,因此,所謂“接受原假
22、設”,并非肯定原假設就是正確的。 假設檢驗中,原假設H0可能為真也可能不真,我們的判斷(決策)有接受和拒絕兩種。因此,檢驗的結果共有四種可能情況,可概括為 表7.1。,,29,第一節(jié) 假設檢驗的一般問題,表7.1 假設檢驗的四種可能情況,,30,第一節(jié) 假設檢驗的一般問題,四、假設檢驗中的各種決策規(guī)則 上面介紹了假設檢驗的一般程序,給出了一般的檢驗決策規(guī)則,但在實際工作中還有其他較為
23、實用的檢驗決策規(guī)則,概括來講包括z值(或t值)檢驗法、置信區(qū)間檢驗法和p值檢驗法三種方法,下面以總體均值的假設檢驗為例說明各種檢驗情況下的決策規(guī)則。,,31,第一節(jié) 假設檢驗的一般問題,(一)z值(或t值)檢驗法 利用服從正態(tài)分布的統(tǒng)計量z進行的假設檢驗稱為z值檢驗法。 按照z值檢驗法檢驗的程序是:根據(jù)總體標準差、樣本容量n和樣本均值計算出檢驗統(tǒng)計量z的值,即,,32,第一節(jié) 假
24、設檢驗的一般問題,對于給定的檢驗水平?,查正態(tài)分布表可得臨界值z?/2,將所計算的z值與臨界值比較,便可得出檢驗結論。具體應用有以下三種情況: 1、若采用雙側檢驗,H0:? = ?0; H1:?≠ ?0,則臨界值為 - z?/2和z?/2。 決策規(guī)則:- z?/2≤z≤z?/2時,接受原假設;反之,則拒絕原假設。 對于例7.1,由于z = -2
25、.29< -1.96,所以拒絕原假設H0。,,33,第一節(jié) 假設檢驗的一般問題,2、若采用左側檢驗,H0:? ≥ ?0; H1:? ?0,則臨界值為z?。 決策規(guī)則:當z > z?時,拒絕原假設;反之,則接受原假設。,,34,第一節(jié) 假設檢驗的一般問題,若利用服從t分布的統(tǒng)計量去檢驗總體均值的方法稱為t檢驗法,其檢驗的決策規(guī)則與z值檢驗法類似,具體的應用將在下一節(jié)中介
26、紹。 (二)置信區(qū)間檢驗法 利用總體參數(shù)的置信區(qū)間進行假設檢驗的方法稱為置信區(qū)間檢驗法。,,35,第一節(jié) 假設檢驗的一般問題,按照置信區(qū)間檢驗法檢驗的程序是:在原假設為真時,根據(jù)給定的檢驗水平?確定樣本均值落在總體均值?0兩側(或一側)最大的允許范圍,再根據(jù)抽樣的結果觀察樣本均值是否落在這一允許范圍內(nèi),做出檢驗結論。具體應用情況有: 1、若采用雙側檢驗,則置
27、信區(qū)間為:,,36,第一節(jié) 假設檢驗的一般問題,決策規(guī)則:當樣本均值落在區(qū)間內(nèi),則接受原假設;反之,拒絕原假設。 對于例7.1,由于,,即置信區(qū)間為(37.43,42.57),而=37,落在拒絕域,可以認為樣本均值與假設的總體均值存在顯著差異,所以拒絕原假設H0。,37,第一節(jié) 假設檢驗的一般問題,2、若采用左側檢驗,則置信區(qū)間為:,,決策規(guī)則:當樣本均值落在區(qū)間內(nèi),則接受原假設;反之,拒絕原假設。
28、 3、若采用右側檢驗,則置信區(qū)間為,38,第一節(jié) 假設檢驗的一般問題,決策規(guī)則:當樣本均值落在區(qū)間內(nèi),則接受原假設;反之,拒絕原假設。 (三)P值檢驗法 p值(p-value)是指在原假設為真時,樣本統(tǒng)計量落在觀察值以外(抽樣分布尾部區(qū)域)的概率,也稱為觀察到的顯著性水平。,,39,第一節(jié) 假設檢驗的一般問題,按照p值檢驗法檢驗的程序是:根據(jù)總體標準差、樣
29、本容量n和樣本平均數(shù),計算出檢驗統(tǒng)計量z的值。查正態(tài)分布表確定樣本均值落在z以外(抽樣分布尾部區(qū)域)的概率p值,將所計算的p值與?比較,便可得出檢驗結論。 P值的計算同樣分以下三種情況: (1)若采用雙側檢驗,,,40,第一節(jié) 假設檢驗的一般問題,(2)若采用左側檢驗,,,(3)若采用右側檢驗,,41,第一節(jié) 假設檢驗的一般問題,p值檢驗法決策規(guī)則:
30、若p值 ?,則接受原假設H0。 顯然,p值是假設檢驗中可以導致拒絕原假設的概率值。p值越小,就越容易拒絕原假設;p值越大,就越不容易拒絕原假設。對于例7.1有:,,42,第一節(jié) 假設檢驗的一般問題,由于p值=0.022 < ?=0.05,所以應該拒絕原假設H0,可以認為部門經(jīng)理的估計不可靠。 通過上述檢驗規(guī)則的介紹,可以看到三種檢驗方法存在著密切的關系,表現(xiàn)在:雙側檢驗時,若z值
31、(或t值)檢驗法的檢驗結果是在顯著性水平?下接受授H0,則意味著在置信水平1-?下置信區(qū)間必包括,這同樣意味著p值一定大于?值;,,43,第一節(jié) 假設檢驗的一般問題,相反,若z值(或t值)檢驗法的檢驗結果是在顯著性水平?下拒絕H0,則意味著在置信水平1-?下的置信區(qū)間不包括,同樣意味著p值一定小于?值。無論采用哪種檢驗方法,其檢驗的結論是一致的。單側檢驗時,其各種檢驗方法檢驗的結果也存在同樣的關系。 為了
32、便于理解,我們運用例7.1,將假設檢驗中的各種決策規(guī)則表示為圖7.2。,,44,第一節(jié) 假設檢驗的一般問題,圖7.2 例7.1中各種檢驗方法決策規(guī)劃示意圖,,45,第二節(jié) 總體均值的假設檢驗,本節(jié)主要通過實例介紹對總體均值進行假設檢驗的方法。在實際檢驗時,與進行區(qū)間估計一樣,通常要依據(jù)研究問題的不同或資料條件的不同而采用不同的處理方法,包括大樣本情況下對單一總體均值的假設檢驗、小樣本情況下對單一總體均值的假設檢驗以及獨立樣本情
33、況下對兩個總體均值之差的假設檢驗、配對樣本情況下對兩個總體均值之差的假設檢驗等幾種情況,下面分別予以介紹。,,46,第二節(jié) 總體均值的假設檢驗,一、單一總體均值的假設檢驗(大樣本) 由第五章介紹的抽樣分布定理可知:當正態(tài)總體方差已知時,無論樣本容量大小,樣本均值都服從正態(tài)分布;若是非正態(tài)總體方差已知,只要是大樣本抽樣,樣本均值仍然近似服從正態(tài)分布,即樣本均值服從N (?,?2/n)。
34、 構造檢驗統(tǒng)計量為:,,47,第二節(jié) 總體均值的假設檢驗,當?=?0時,統(tǒng)計量服從N(0,1)。 如果非正態(tài)總體方差未知,大樣本時,實際應用中是將樣本標準差s代替總體標準差?,構造檢驗統(tǒng)計量為:,,48,第二節(jié) 總體均值的假設檢驗,在對實際問題的假設檢驗中,z檢驗法較為常用,但近年來,隨著計算機技術的普及應用,像SPSS等,許多計算機軟件的統(tǒng)計功能中都可以報告P值,因此p值檢驗法不失為一種簡便易行的檢驗方
35、法。下面介紹各種檢驗方法的應用。,,,49,第二節(jié) 總體均值的假設檢驗,[例7.2] 某橡膠廠生產(chǎn)汽車輪胎,根據(jù)歷史資料統(tǒng)計結果,平均里程為25 000公里,標準差為 1 900公里?,F(xiàn)在從近期生產(chǎn)的輪胎中隨機抽取 400個做試驗,測得樣本平均里程=25 300公里。試按5%的顯著性水平判斷新的輪胎平均耐用里程與以往輪胎的耐用里程有沒有顯著的差異。 解:由于問題是判斷新、舊輪胎平均耐用里程有沒有顯
36、著的差異,并沒有問及差異的方向,因此,此題屬于雙側檢驗。檢驗過程如下:,,50,第二節(jié) 總體均值的假設檢驗,z檢驗法: (1)提出假設:H0:?=25 000;H1:? ?25 000。 (2)由于是大樣本抽樣,且總體標準差?已知,所以使用式(7.1)的檢驗統(tǒng)計量。 (3)顯著性水平?取0.05,由于是雙側檢驗,由1-?=0.95查正態(tài)分布概率表得z?=
37、7;1.96,決策規(guī)則為: 若z > 1.96或z< - 1.96,則拒絕H0; 若-1.96≤z≤1.96,則接受H0。,,51,第二節(jié) 總體均值的假設檢驗,(4)根據(jù)抽樣結果,計算統(tǒng)計量z的實際值:,,(5)檢驗判斷:由于實際z=3.16>1.96,落在拒絕域,所以拒絕H0。 結論:以5%的顯著性水平可以認為新的輪胎平均耐用里程比以往有顯著
38、的差異,即有明顯的提高。,52,第二節(jié) 總體均值的假設檢驗,置信區(qū)間檢驗法: (1)提出假設:H0:?=25 000;H1:? ?25 000。 (2)由于是大樣本抽樣,且總體標準差?已知,所以使用式(7.1)的檢驗統(tǒng)計量。 (3)顯著性水平?取0.05,由于是雙側檢驗,則置信區(qū)間為:,,53,第二節(jié) 總體均值的假設檢驗,即(24 813.8,25 186.
39、2)。決策規(guī)則為: 若24 813.8≤≤25 186.2,則接受H0; 若25 186.2,則拒絕H0。 (4)根據(jù)抽樣結果: 樣本均值=25 300>25186.2,所以拒絕H0。 結論:以5%的顯著性水平可以認為新的輪胎平均耐用里程有明顯的提高。,,54,第二節(jié) 總體均值的假設檢驗,p值檢驗法:
40、 (1)提出假設:H0:?=25 000;H1:? ?25 000。 (2)由于是大樣本抽樣,且總體標準差?已知,所以使用式(7.1)的檢驗統(tǒng)計量。 (3)顯著性水平?取0.05,由于是雙側檢驗,則有:,,55,第二節(jié) 總體均值的假設檢驗,(4)由于P值近似為0,為極小概率,所以拒絕H0。 結論:有把握認為新的輪胎平均耐用里程有明顯的提高。
41、 通過此題的解題過程說明,利用三種檢驗方法,得到的統(tǒng)計結論是一致的。,,56,第二節(jié) 總體均值的假設檢驗,[例7.3] 根據(jù)過去大量資料,某工廠生產(chǎn)的產(chǎn)品的使用壽命服從正態(tài)分布,其平均壽命為1 020小時,標準差為100小時?,F(xiàn)從最近生產(chǎn)的一批產(chǎn)品中隨機抽取16件,測得樣本平均壽命為1 080小時。試在0.05的顯著性水平下判斷這批產(chǎn)品的使用壽命是否有顯著提高,并報告p值。 解:問題
42、是判斷新產(chǎn)品壽命有沒有顯著的提高,問及到差異的方向,本著把不能輕易肯定的命題作為備擇假設的原則,此題屬于右單側檢驗。,,57,第二節(jié) 總體均值的假設檢驗,根據(jù)題意,提出假設:H0:?≤1020; H1: ?>1020。 由于是正態(tài)總體,且標準差已知,因此使用式(7.1)的檢驗統(tǒng)計量。依?=0.05查表得臨界值 z?=z0.05=1.645。 計算檢驗
43、統(tǒng)計量:,,58,第二節(jié) 總體均值的假設檢驗,由于z =2.4 > z?=1.645,所以應該拒絕H0。而接受H1。即有把握認為這批產(chǎn)品的使用壽命確有提高。 由于是右單側檢驗,所以:,,因為p值=0.0082<?=0.05,所以拒絕原假設。結論與上述z檢驗法相同。,59,第二節(jié) 總體均值的假設檢驗,[例7.4] 某電池廠生產(chǎn)的某種電池,歷史資料表明平均發(fā)光時間為1 000小時,在最近生產(chǎn)的產(chǎn)
44、品中抽取100個電池,測得平均發(fā)光時間為990小時,標準差為80小時,給定顯著性水平為0.05,問新生產(chǎn)的電池發(fā)光時間是否有明顯的降低。 解:由于問題是判斷新電池發(fā)光時間有沒有顯著的降低,問及差異的方向,因此,此題屬于左單側檢驗。,,60,第二節(jié) 總體均值的假設檢驗,依題意提出假設:H0:?≥1000;H1:? -z?= -1.645, 所以不應拒絕H0,即有理由認為現(xiàn)在生產(chǎn)的
45、電池發(fā)光時間與原有的相比沒有顯著降低。,,61,第二節(jié) 總體均值的假設檢驗,若采用P值檢驗法,過程如下:,,因為p值=0.106>?=0.05,所以不能拒絕原假設。結論與上述z檢驗法一致。,62,第二節(jié) 總體均值的假設檢驗,二、單一總體均值的假設檢驗(小樣本) 設總體服從正態(tài)分布X=N(?,?2),但總體標準差?未知,此時對總體均值的檢驗不能用上述z檢驗法,因為此時的檢驗統(tǒng)計量z中包含了未知參數(shù)? 。
46、 為了得到一個不含未知參數(shù)的檢驗統(tǒng)計量,很自然會用樣本標準差s來代替?,于是得到t統(tǒng)計量。由第五章第二節(jié)內(nèi)容可知,在小樣本抽樣情況下,若?=?0成立時,檢驗統(tǒng)計量及其分布為:,,63,第二節(jié) 總體均值的假設檢驗,利用服從t分布的統(tǒng)計量去檢驗總體均值的方法稱為t檢驗法。其具體做法是:根據(jù)題意提出假設(與z檢驗法中的假設形式相同);構造檢驗統(tǒng)計量t并根據(jù)樣本信息計算其具體值;對于給定的檢驗水平?,由t分布表查得臨
47、界值;將所計算的t值與臨界值比較,做出檢驗結論。決策規(guī)則如下:,,64,第二節(jié) 總體均值的假設檢驗,1、若采用雙側檢驗,H0:?= ?0; H1:?≠ ?0,則臨界值為 - t?/2和t?/2。 決策規(guī)則:- t?/2≤t≤t?/2時,接受原假設;反之,則拒絕原假設。 2、若采用左側檢驗,H0:? ≥ ?0; H1:? < ?0,
48、則臨界值為 - t?。 決策規(guī)則:當t < -t?時,拒絕原假設;反之,則接受原假設。,,65,第二節(jié) 總體均值的假設檢驗,3、若采用右側檢驗,H0:? ≤ ?0; H1:? > ?0,則臨界值為t?。 決策規(guī)則:當t > t?時,拒絕原假設;反之,則接受原假設。,,66,第二節(jié) 總體均值的假設檢驗,[例7.5] 某工廠采用自動包裝
49、機分裝產(chǎn)品,假定每包產(chǎn)品的重量服從正態(tài)分布,每包標準重量為800克。某日隨機抽查10包,測得每包凈重數(shù)據(jù)(單位:克)如下:789、780、794、762、802、 813、770、785、810、806。試在0.05的顯著性水平下,檢驗當天包裝機工作是否正常,并報告p值。 解:根據(jù)題意,檢驗目的是觀察產(chǎn)品的平均每包重量是否與標準重量一致,屬于雙側檢驗問題。因此,可建立如下假設:,,67,第二節(jié) 總體均值的假
50、設檢驗,H0:?= 800;H1:? ≠ 800, 由于是正態(tài)總體且標準差未知,小樣本抽樣,可使用式(7.3)的t檢驗統(tǒng)計量,依?=0.05查表得臨界值t(?,n-1)=t(0.05,9)=2.262。 根據(jù)樣本數(shù)據(jù)計算得:=791.1,s=17.136,n=10。檢驗統(tǒng)計量:,,68,第二節(jié) 總體均值的假設檢驗,由于|t|=1.64<t(?,n-1)=t(0.05,9)=2.
51、262,所以可以接受H0,即可認為這天自動包裝機工作正常。,,顯然p值=0.10>?=0.05,所以接受原假設。結論與上述t檢驗法一致。,69,第二節(jié) 總體均值的假設檢驗,t檢驗法適用于小樣本情況下總體方差未知時對正態(tài)總體均值的假設檢驗。隨著樣本容量n的增大,t分布趨近于標準正態(tài)分布。所以大樣本情況下(n>30),總體方差未知時對正態(tài)總體均值的假設檢驗仍可用z檢驗法。,,70,第二節(jié) 總體均值的假設檢驗,三、兩個總體
52、均值差異的假設檢驗 在實際推斷統(tǒng)計中,有時涉及對兩個總體均值之差的檢驗,如比較兩種產(chǎn)品的平均使用壽命、兩種方法的平均結果,這就需要利用相應兩個樣本的觀察值,對兩個總體均值的差異作出檢驗和判斷,其檢驗方法與步驟與上面我們所介紹的單一總體均值的假設檢驗方法與步驟完全類似。,,71,第二節(jié) 總體均值的假設檢驗,首先提出假設,假設的基本形式為: 雙側檢驗:H0:?1 - ?2=0;H1:?1 -
53、 ?2≠0 右單側檢驗:H0:?1 - ?2≦0;H1:?1 - ?2> 0 左單側檢驗:H0:?1 - ?2≧0;H1:?1 - ?2<0 利用不同方式獲取的樣本,在檢驗時的情況又有所不同,檢驗通常分為獨立樣本和配對樣本兩種情形,下面分別予以說明。,,72,第二節(jié) 總體均值的假設檢驗,(一)兩個總體均值差異的假設檢驗(獨立樣本) 若比較兩
54、個總體均值之間的差異,可直接根據(jù)來自兩個不同總體獨立抽取的樣本信息,做出檢驗和判斷。由于樣本容量不同、對總體標準差掌握的情況不同,因此檢驗的過程有所不同,具體分述如下。,,73,第二節(jié) 總體均值的假設檢驗,1、兩正態(tài)總體標準差已知或大樣本 由第六章第二節(jié)介紹的內(nèi)容可知,如果兩個總體都服從正態(tài)分布、標準差都已知,或兩個總體均不服從正態(tài)分布、標準差都未知,但兩個獨立樣本的容量n1和n2都足夠大時,樣本均值之差1-2的抽樣
55、分布服從或近似服從正態(tài)分布,可采用的檢驗統(tǒng)計量:,,74,第二節(jié) 總體均值的假設檢驗,[例7.6] 某汽車公司經(jīng)理要比較A種與B種兩種汽油的性能。選用同類型汽車,分兩組各30輛,試開一周,甲隊使用A種汽油,乙隊使用B種汽油,記錄下海輛汽車每加侖汽油行駛的平均里程,數(shù)據(jù)如下(公里/加侖)。試按顯著性水平 ?=0.05,判斷兩種汽油的公里/加侖指標有無明顯差別。,,75,第二節(jié) 總體均值的假設檢驗,A汽油
56、16 18 16 21 19 15 18 21 27 2615 20 20 22 23 19 14 13 28 21 19 17 19 23 20 25 20 14 26 23 B汽油 18 16 19 20
57、21 20 13 21 12 20 14 17 18 16 17 14 18 20 19 25 17 16 19 23 24 20 25 24 16 13,,76,第二節(jié) 總體均值的假設檢驗,解:依題意,若判斷兩種汽油的公里/加侖指標有無明顯差別,應用雙側檢驗。
58、 提出原假設和備擇假設:(設?1 , ?2分別代表A型汽油、B型汽油的平均里程) H0:?1 - ?2 = 0;H1:?1 - ?2≠0 此題中兩個樣本均為大樣本,且兩個總體的標準差未知,按式(7.5)計算統(tǒng)計量:,,77,第二節(jié) 總體均值的假設檢驗,由?=0.05,得z?/2=±1.96。 根據(jù)樣本數(shù)據(jù)及計算得:
59、 A型:1=19.93,s12=16; B型:2=18.57,、s22 =12;n1=n2=30,,由于z=0.58< |z?/2|=1.96,所以接受原假設,可以認為兩種汽油的公里/加侖指標沒有明顯差別。,78,第二節(jié) 總體均值的假設檢驗,2、兩正態(tài)總體方差未知但相等且小樣本 若總體都服從正態(tài)分布,當兩個總體方差未知時,需要用樣本的方差來估計,但小樣本估計的方法與大樣本情
60、況不同,此時由于?1=?2,可通過兩個樣本方差合并求得總體方差的合并估計值,采用的檢驗統(tǒng)計量為:,,79,第二節(jié) 總體均值的假設檢驗,統(tǒng)計量t分布的自由度為n1+n2-2。其中:,,80,第二節(jié) 總體均值的假設檢驗,[例7.7] 某生產(chǎn)車間為了比較改進生產(chǎn)工藝前后,工人組裝產(chǎn)品的平均用時是否縮短,在改進生產(chǎn)工藝前后各抽取12名工人,調查得到他們某次組裝產(chǎn)品的時間數(shù)據(jù)(單位:秒)如下: 改前x1: 3
61、00 344 372 288 376 301 280 385 360 321 290 283 改后x2: 276 310 200 317 320 334 222 338 302 260 312 265 263,,81,第二節(jié) 總體均值的假設檢驗,假設改進生產(chǎn)工藝前后工人組裝產(chǎn)品的時間均服從正態(tài)分布,且方差相等,試在0.05的顯著性水平下檢驗
62、改進生產(chǎn)工藝后工人的平均組裝產(chǎn)品的時間是否比以前顯著縮短。 解:依題意,巖判斷工入的平均組裝時問是否比以前顯著縮短,應用左單側檢驗。 提出原假設和備擇假設:(設?1 , ?2分別代表改進前、后的平均組裝時間),,82,第二節(jié) 總體均值的假設檢驗,H0:?1 - ?2≧0 (沒有縮短時間),H1:?1 - ?2< 0 (縮短時間) 此題為小樣本,且兩個總體均
63、服從正態(tài)分布、方差未知但相等,按式(7.6)計算統(tǒng)計量。 根據(jù)樣本數(shù)據(jù)計算得: 改前:1=325,s12=1 600; 改后:2=288,s22=1 936;nl=n2=12,,83,第二節(jié) 總體均值的假設檢驗,由?=0.05,查t分布表得t(0.10,12+12-2)= - 1.717 接受域為:t > - 1.717;拒絕域為:y < - 1.71
64、7。 由于t = -2.155 < t?= -1.717,所以拒絕原假設,可以認為改進生產(chǎn)工藝后工人的平均組裝產(chǎn)品的時間比以前顯著縮短了。,,84,第二節(jié) 總體均值的假設檢驗,(二)兩個總體均值差異的假設檢驗(配對樣本) 在比較兩個總體均值之間的差異時,有時需要對比兩種不同處理效果有無顯著差別,如對比患者服用某種藥物前后的療效、工人經(jīng)過技術培訓前后的工作效率等,這就需要在相同條件
65、下,調查取得一組成對的觀察值,進行對比,作出檢驗和判斷,也就是根據(jù)配對樣本對兩個總體均值差異的檢驗。,,85,第二節(jié) 總體均值的假設檢驗,對于例7.6,樣本是在改進工藝前后的工人總體中分別抽取的,據(jù)此計算的抽樣誤差可能會包含來自工人個體技能方面的差異,為了減少這種差異對檢驗判斷的影響,我們可以抽樣觀察同一工人在兩種工藝下的組裝時間,從而判斷改進工藝前后的工人組裝時間差。這就是根據(jù)配對樣本對兩個總體均值差異的檢驗。,,86,第二節(jié)
66、 總體均值的假設檢驗,檢驗的方法是:首先求出每對觀察值的差值 di以及差值的均值d和標準差sd,其中:,,假定兩個總體均服從正態(tài)分布,則差值di也服從正態(tài)分布,當總體標準差未知且小樣本時,可以用自由度為(n-1)的t分布來檢驗總體均值差異?d的原假設。 檢驗的統(tǒng)計量為:,87,第二節(jié) 總體均值的假設檢驗,下面舉例說明根據(jù)配對樣本對兩個總體均值差異檢驗方法的應用。 [例7.8] 某生產(chǎn)
67、車間為了比較改進生產(chǎn)工藝前后,工人組裝產(chǎn)品的平均用時是否縮短,隨機抽取6名工人,調查得到他們在改進生產(chǎn)工藝前后組裝產(chǎn)品的時間數(shù)據(jù)(單位:分鐘)如下:,,88,第二節(jié) 總體均值的假設檢驗,,89,第二節(jié) 總體均值的假設檢驗,假設改進生產(chǎn)工藝前后工人的組裝產(chǎn)品時間均服從正態(tài)分布,試在0.05的顯著性水平下檢驗改進生產(chǎn)工藝后工人的平均組裝產(chǎn)品的時間是否比以前顯著縮短。 解:雖然觀察樣本數(shù)據(jù)的差值多數(shù)為負數(shù),但
68、不能簡單認為總體上改進后的組裝時間比以前顯著縮短了,所以提出以下假設:,,90,第二節(jié) 總體均值的假設檢驗,H0:?d≥0(沒有縮短時間),H1:?d <0(縮短時間) 依題意:由于得到的是配對樣本的數(shù)據(jù),差值d服從正態(tài)分布,?未知且小樣本,所以按式(7.7)計算統(tǒng)計量。 根據(jù)樣本數(shù)據(jù)計算得:,,91,第二節(jié) 總體均值的假設檢驗,由?=0.05,查雙尾合計概率為0.10的t分布表得
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 統(tǒng)計學答案第七章
- [教育]應用統(tǒng)計學:第七章:方差分析
- 統(tǒng)計學第七章--卡方檢驗
- 大學統(tǒng)計學第七章練習題及答案
- 統(tǒng)計學原理第七章習題河南電大賈天騏
- 大學統(tǒng)計學第七章練習題及答案概要
- 統(tǒng)計學原理第七章習題 河南電大 賈天騏
- 《統(tǒng)計學原理》第七章習題河南電大賈天騏
- 祝曉明醫(yī)學統(tǒng)計學醫(yī)統(tǒng)-第七章t檢驗
- 第七章統(tǒng)計熱力學
- 地圖學第七章
- 第七章
- 流變學第七章
- 概率統(tǒng)計第七章參考答案
- 教育學第七章教學
- 石油地質學-第七章
- 第七章補充
- 第七章教案
- 第七章保險
- 第七章-索引
評論
0/150
提交評論