區(qū)間估計和假設檢驗_第1頁
已閱讀1頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、區(qū)間估計和假設檢驗,趙耐青復旦大學衛(wèi)生統(tǒng)計教研室,2,內容,3,統(tǒng)計推斷,點值估計 參數估計 區(qū)間估計統(tǒng)計推斷 假設檢驗:均數間的比較 比例、率的比較

2、 ……,,,4,點估計和區(qū)間估計,參數估計可以分為點估計和區(qū)間估計點估計就是估計某個參數為某個數值(如樣本均數,樣本率等)由于隨機抽樣存在抽樣誤差,由于點估計無法評價抽樣誤差的大小,而區(qū)間估計可以在95%可信度的尺度上估計參數的范圍,范圍越小,說明參數估計的抽樣誤差就越小。,5,總體均數的區(qū)間估計,假定資料 近似服從正態(tài)分布

3、 。對于隨機抽樣而言,計算統(tǒng)計量 因此基于隨機抽樣而言和 成立的概率為0.95前提下總體均數的區(qū)間估計 這個區(qū)間稱為總體均數的95%可信區(qū)間,總體均數的區(qū)間估計,總體均數的區(qū)間估計,總體均數的區(qū)間估計,總體均數的區(qū)間估計,總體均數的區(qū)間估計,總體

4、均數的區(qū)間估計,總體均數的區(qū)間估計,6,總體均數的95%可信區(qū)間舉例,例如:在某地區(qū)7歲男孩的人群中隨機抽樣,抽取200人,測量其身高,得到樣本均數為121cm,樣本標準差為5.4cm,估計該地區(qū)7歲男孩人群的平均身高在什么范圍內。,7,(1-?)?100%可信區(qū)間及其意義,更一般而言,可以計算(1-?) ?100%可信區(qū)間,稱(1-?)為可信度??尚哦鹊囊饬x:在同一正態(tài)總體中隨機抽100個樣本,每個樣本可以計算一個95%可信區(qū)

5、間,平均有95個可信區(qū)間包含該總體的總體均數。,8,(1-?)?100%可信區(qū)間及其意義,可信度1-?越大,計算可信區(qū)間包含總體均數的正確率就越高,但可信區(qū)間的寬度就越大,也就是估計總體均數的精度就越差。一般而言,95%可信區(qū)間是兼顧了正確性和估計精度,對于特殊情況,可以計算90%可信區(qū)間或99%可信區(qū)間。對于隨機抽樣前而言,隨機抽取一個樣本量為n的樣本,計算95%可信區(qū)間,則該區(qū)間將包含總體均數的概率為95%,不包含其總體均數的概

6、率為0.05,這是一個小概率事件,對于一次隨機抽樣而言,一般是不會發(fā)生的,所以95%可信區(qū)間一般被認為就是總體均數的范圍。,9,假設檢驗(hypothesis testing),樣本均數與總體均數不等或兩樣本均數不等,有兩種可能: 由抽樣誤差所致 兩者來自不同的總體,假設檢驗是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統(tǒng)計推斷方法,10,,,總體μ,隨機抽樣,不是抽樣誤差?即:???0?,樣本

7、,,總體μ0,?=?0?即:抽樣誤差?,假設檢驗問題,,,總體,總體,總體,總體μ0,,,總體,不是抽樣誤差?即:???0?,總體μ0,,,總體,11,,,總體2?2,,,樣本2,隨機抽樣,樣本均數不等的原因統(tǒng)計推斷,抽樣誤差即:?1=?2 ?,,樣本1,,假設檢驗問題,總體1 ?1,不是抽樣誤差即:?1??2 ?,12,假設檢驗一般思想,小概率思想是指小概率事件(P<0.01或P<0.05)在一次試

8、驗中基本上不會發(fā)生。假設檢驗的反證法思想:先根據檢驗假設H0,建立適當的統(tǒng)計量,確定假設H0成立情況下服從某個概率分布,定一個范圍。H0成立時,統(tǒng)計量進入這個范圍,是一個小概率事件(P?0.05或更小),H0不成立時,統(tǒng)計量進入這個范圍的概率較大。如果實際的抽樣樣本統(tǒng)計量進入這個范圍,對H0成立情況下是一個小概率事件,一般不會發(fā)生,由此推斷假設H0不成立。這就是小概率反證法思想。,13,例如:拋硬幣,通常假設: 原假設H0:正反

9、面出現的機會均等備擇假設H1:正反面出現機會不均等。如果拋20次只有1次是正面的,你就有理由懷疑原來假設“正反面出現的機會均等”是錯的(因為H0為真時出現這種情況的概率太小了,而H1為真時,出現這種情況的概率較大)。,假設檢驗基本思想,14,假設檢驗的基本步驟,第一步:提出檢驗假設(又稱無效假設(原假設)null hypothesis, H0)和備擇假設(alternative hypothesis, H1)。預先設定

10、的檢驗水準(size of test )α為0.05。選擇單雙側檢驗,H0:假設兩總體均數相等,即樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的。,H1:假設兩總體均數不相等,即兩樣本與總體或樣本與樣本間存在本質差異。,15,第二步:選定統(tǒng)計方法,計算出統(tǒng)計量的大小。根據資料的類型和特點,可選用t檢驗,則計算t值或其他檢驗方法:秩和檢驗和卡方檢驗等。,假設檢驗的基本步驟,16,第三步:根據?和統(tǒng)計量在原假設成立的分布情況

11、把統(tǒng)計量可能的取值范圍分為拒絕范圍和不拒絕范圍根據統(tǒng)計量計算值位于拒絕范圍內還是非拒絕范圍內進行統(tǒng)計推斷,也可以根據統(tǒng)計量取值的大小及其分布確定檢驗假設成立的可能性P的大小并判斷結果。,假設檢驗的基本步驟,p值指:在由H0所規(guī)定的總體中做隨機抽樣時,獲得等于及大于(或等于及小于)現有統(tǒng)計量的概率,17,t檢驗對資料的要求,t檢驗的應用條件: 樣本來自正態(tài)總體兩樣本均數比較時還要求兩個總體方差相等,18,樣本均數與總體均數比較,樣

12、本均數與總體均數比較的t檢驗實際上是推斷該樣本來自的總體均數µ與已知的某一總體均數µ0(常為理論值或標準值) 有無差別。在未知總體中進行抽樣,用樣本均數與已知總體均數比較中,需要建立一個檢驗統(tǒng)計量,根據樣本是否屬于已知總體,該檢驗統(tǒng)計量的分布也不同,由此作出相應的統(tǒng)計推斷。,19,樣本均數與總體均數比較舉例說明,例:研究目的:山區(qū)健康男性的脈搏均數是否大于城市成年男性。根據大量調查,已知城市健康成年男性的脈搏均數

13、為72次/分,某醫(yī)生在一山區(qū)隨即抽查了25名健康男性,求得其脈搏均數為76.2次/分,標準差為6.0次/分,問:是否能據此認為該山區(qū)成年男性的脈搏均數高于一般成年男性?,20,,樣本均數與總體均數比較,21,樣本均數與總體均數比較,上述樣本均數與總體均數不等既可能是抽樣誤差所致,也有可能真是環(huán)境差異的影響,做假設檢驗。 因為σ未知,根據研究目的:山區(qū)健康男性的脈搏均數是否大于城市男性,可用t檢驗的單側檢驗,檢驗過程如下:

14、60;1. 建立假設  H0:µ=µ0 (本例µ0=72次/分), H1:µ≠µ0 2. 設置檢驗水準α為0.05。,22,檢驗統(tǒng)計量,2. 設樣本所在總體為 樣本為 則,檢驗統(tǒng)計量分布情況和假設檢驗基本思想,23,陰影面積為檢驗統(tǒng)計量超出界值 的概率,H0為真時,t檢驗統(tǒng)計量服從自由度為n-1的t分布,檢驗統(tǒng)計量|t|大于界

15、值t?/2的概率為?,H1為真時,t檢驗統(tǒng)計量|t|大于界值t?/2的概率為1-?(較大或很大),24,樣本均數與總體均數比較,2. 計算統(tǒng)計量進行樣本均數與總體均數比較的t檢驗,計算t值,25,樣本均數與總體均數比較,3.確定臨界值,判斷是否應該拒絕 當H0:µ=µ0=72次/分為真時,在大多數情況下, 應該在72附近,因此 應該在0附近隨機擺動。

16、 當H1:µ>µ0=72為真,在大多數情況下, 應該遠離72,     應該比較大。 注意:X的總體均數不一定為72,只有H0為真時,X的總體均數為72,,26,樣本均數與總體均數比較,可以證明:當H0為真時,檢驗統(tǒng)計量服從自由度為24 的t分布(即:df=24) ,查t分布表,臨界值t0.025=2.

17、064,檢驗統(tǒng)計量t=3.5>2.064是小概率事件,對于一次隨機抽樣而言,一般是不會發(fā)生的,因此拒絕H0,并且可以認為該山區(qū)成年男性的脈搏均數高于一般成年男性。,27,定義P值和應用,以下以單側檢驗為例:即:在H0為真的情況下,檢驗統(tǒng)計量大于樣本計算的統(tǒng)計量數值的概率。也就是P值=樣本統(tǒng)計量數值開始的尾部面積(示意見圖)。意義:如果t檢驗統(tǒng)計量樣本值t=t0.05,則P= t0.05尾部的面積,故P=0.05。,P值=P(

18、檢驗統(tǒng)計量>檢驗統(tǒng)計量樣本值|H0),28,定義P值和應用,如果檢驗統(tǒng)計量樣本值t>t0.05(u值比U0.05 更右側),則P=t尾部的面積t0.05尾部的面積,則P>0.05。 綜合上述,P>? ?檢驗統(tǒng)計量值臨界值,拒絕H0。,29,P值示意圖,在實際研究中,只需計算P值并判斷是否P< ? 決定是否拒絕H0。,,30,假設檢驗的基本步驟,若P值小于預先設定的檢驗水準α ,則H0成立的可能性小,

19、即拒絕H0 。若P值不小于預先設定的檢驗水準α ,則H0成立的可能性還不小,還不能拒絕H0 。P值的大小一般可通過查閱相應的界值表得到。,31,定義P值和應用,確定概率P,作出判斷以自由度v=n-1查t界值表,0.025<P<0.05拒絕H0,接受H1,可認為該山區(qū)成年健康男性的脈搏均數高于城市成年健康男性。,32,單側t檢驗,H0:?=?0 H1:?>?1 ?=0.05計算t

20、檢驗統(tǒng)計量查t檢驗的單側界值 ,如果檢驗統(tǒng)計量則拒絕H0,反之不能拒絕H0。單側的P值=t分布中大于t的右側尾部面積,33,兩類錯誤,34,兩類錯誤示意圖,,35,檢驗效能,,H1是真的,實際拒絕H0的概率= 1-? 稱為Power,又稱為檢驗效能,36,進行假設檢驗應注意的問題,做假設檢驗之前,應注意資料本身是否有可比性。當差別有統(tǒng)計學意義時應注意這樣的差別在實際應用中有無意義。根據資料類型和

21、特點選用正確的假設檢驗方法。根據專業(yè)及經驗確定是選用單側檢驗還是雙側檢驗。,37,進行假設檢驗應注意的問題,當檢驗結果為拒絕無效假設時,應注意有發(fā)生I類錯誤的可能性,即錯誤地拒絕了本身成立的H0,發(fā)生這種錯誤的概率預先是知道的,即檢驗水準那么大;當檢驗結果為不拒絕無效假設時,應注意有發(fā)生II類錯誤的可能性,即仍有可能錯誤地接受了本身就不成立的H0,發(fā)生這種錯誤的可能性預先是不知道的,但與樣本含量和I類錯誤的大小有關系。當第一類錯誤

22、?增大時,第二類錯誤減小。,38,進行假設檢驗應注意的問題,判斷結論時不能絕對化,應注意無論接受或拒絕檢驗假設,都有判斷錯誤的可能性。 報告結論時是應注意說明所用的統(tǒng)計量,檢驗的單雙側及P值的確切范圍。,39,進行假設檢驗應注意的問題,t檢驗和u檢驗就是統(tǒng)計量為t,u的假設檢驗,兩者均是常見的假設檢驗方法。當樣本含量n較大時,樣本均數符合正態(tài)分布,故可用u檢驗進行分析。當樣本含量n小時,若觀察值x符合正態(tài)分布,則用t檢

23、驗(因此時樣本均數符合t分布)當x為未知分布時應采用秩和檢驗。,40,可信區(qū)間與假設檢驗的關系,不同: 可信區(qū)間——量的問題 假設檢驗——質的問題,可信區(qū)間亦可用于回答假設檢驗的問題,可信區(qū)間比假設檢驗提供更多的信息可以回答有無統(tǒng)計學意義,還可回答有無實際意義,41,可信區(qū)間與假設檢驗的關系,42,STATA命令,正態(tài)分布總體均數的95%可信區(qū)間命令為:cii 樣本量 樣本均數 樣本標準差例4.1 c

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論