版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、102,1,第三章 總體均數的估計與假設檢驗,寧夏醫(yī)學院公共衛(wèi)生學院流行病學與衛(wèi)生統(tǒng)計學教研室喬慧,102,2,教學目標:1 .掌握 (1) 均數的抽樣誤差與標準誤的概念 (2) 總體均數可信區(qū)間的計算及其適用條件 (3) t 檢驗的應用條件和計算 (4) 假設檢驗的的基本步驟及第一類錯誤、第二類錯誤的概念,102,3,熟悉: (1) 標準差與均數標準誤的區(qū)別 (2) 參考值范圍和總體均數可信區(qū)間的區(qū)別 (3) 假
2、設檢驗的基本原理(4) t 分布的特征了解: (1) t ‘ 檢驗的方法(2) 正態(tài)性檢驗(3) 兩樣本方差比較的F檢驗 (4) 變量變換,102,4,例如欲了解某地2000年正常成年女性血清總膽固醇的平均水平,隨機抽取該地101名正常成年女性作為樣本觀測對象,計算得血清總膽固醇的樣本均數,并以此樣本均數估計該地正常成年女性血清總膽固醇總體的水平。,102,5,統(tǒng)計推斷,統(tǒng)計推斷 statistical inf
3、erence,如:樣本均數 樣本標準差S 樣本率 P,如:總體均數 總體標準差 總體率,內容:參數估計(estimation of parameters) 包括:點估計與區(qū)間估計2. 假設檢驗(test of hypothesis),102,6,抽樣誤差的定義,假如事先知道某地18歲男生的平均身高為167.7cm。為了估計18歲男生的平均身高(總體均數),研究
4、者從所有符合要求的18歲男生中每次抽取100人,共計抽取了三次。,=169.62cmS= 4.81cm,,,,=167.75cmS= 5.27cm,=165.19cmS= 4.41cm,102,7,如果沒有個體變異……,,No Variation!No Sampling Error!,102,8,如果沒有抽樣研究……,No Random sampling!No Sampling Error!,,102,9,抽樣誤差的定義
5、,三次抽樣得到了不同的結果,原因何在?,,,,102,10,【定義】由于個體變異的存在,因隨機抽樣而產生的樣本統(tǒng)計量和總體參數之間以及樣本統(tǒng)計量和樣本統(tǒng)計量之間的差異,稱為抽樣誤差(sampling error)。各種參數都有抽樣誤差,計量資料中我們以均數為研究對象。,抽樣誤差的定義,102,11,抽樣誤差的規(guī)律性,在抽樣研究中,抽樣誤差是不可避免的,但它有一定的分布規(guī)律。 既然抽樣誤差是有規(guī)律的,那么到底它的分布規(guī)律到底是怎樣的
6、?,用模擬實驗來詮釋,102,12,,例3-1 某市1999年18歲男生身高服從N(167.7,5.32),從該總體中進行隨機抽樣,每次樣本含量為10人,樣本數為100個。見表3-1,第一節(jié) 均數的抽樣誤差與標準誤,102,13,見P34~36表3-1,從同一總體中隨機抽取樣本例數相等的多個樣本,每個樣本都可算得一個樣本均數,由于抽樣誤差的存在,樣本均數是不相等的,但樣本均數的分布呈現一定特點。,102,14,將此100個樣本均數看成新
7、變量值,則這100個樣本均數構成一新分布,繪制直方圖。,圖3-2 從正態(tài)分布總體N(167.7, 5.32)隨機抽樣所得樣本均數分布,102,15,① ,各樣本均數 未必恰好等于總體均數② 各樣本均數間存在差異;③ 樣本均數的分布為中間多,兩邊少,左右基本對稱。 ④ 樣本均數的變異范圍較之原變量的變異范圍大大縮小。可算得這100個樣本均數的均數為167.69cm、標準差為1.69cm。,樣本均數的抽樣分布具有
8、如下特點:,102,16,從正態(tài)總體中隨機抽樣,其樣本均數服從正態(tài)分布;從任意總體中隨機抽樣,當樣本含量足夠大時,其樣本均數的分布逐漸逼近正態(tài)分布;樣本均數之均數的位置始終在總體均數的附近;隨著樣本含量的增加,樣本均數的離散程度越來越小,表現為樣本均數的分布范圍越來越窄,其高峰越來越尖。,102,17,,102,18,數理統(tǒng)計推理和中心極限定理,從均數為μ,標準差為σ的正態(tài)總體中隨機抽樣,樣本均數服從均數為μ,標準差為
9、 的正態(tài)分布。從均數為μ,標準差為σ的任意總體中隨機抽樣,當樣本含量足夠大時,樣本均數近似服從均數為μ,標準差為 的正態(tài)分布。,102,19,標準誤的定義,標準誤是描述抽樣誤差大小的指標;與描述個體值離散趨勢的指標類似,樣本均數的標準差就反映了從某個總體中隨機抽樣所得樣本之均數分布的離散程度。用樣本均數的標準差來反映抽樣誤差的大小。又稱標準誤(standard error)。,102,
10、20,標準誤的計算,計算公式為其中,σ為總體標準差,n為抽樣的樣本例數在研究工作時,由于總體標準差常常未知,可以利用樣本標準差近似估計,102,21,標準誤的意義,反映了樣本統(tǒng)計量(樣本均數,樣本率)分布的離散程度,體現了抽樣誤差的大小。標準誤越大,說明樣本統(tǒng)計量(樣本均數,樣本率)的離散程度越大,即用樣本統(tǒng)計量來直接估計總體參數越不可靠。反之亦然。標準誤的大小與標準差有關,在例數n一定時,從標準差大的總體中抽樣,標準誤較大
11、;而當總體一定時,樣本例數越多,標準誤越小。說明我們可以通過增加樣本含量來減少抽樣誤差的大小。,,102,22,第二節(jié) t 分布 (t-distribution),102,23,一、t 分布的概念,102,24,102,25,,式中 為自由度(degree of freedom, df),3.實際工作中,由于 未知,用 代替,則 不再服從標準正態(tài)分布,而服從t 分布。,102,26,t分布
12、的演化,由于總體標準差往往是未知的,此時往往用樣本標準差代替總體標準差,這里,ν為自由度,取值為n-1由W.S. Gosset提出,102,27,二、t 分布的圖形與特征,分布只有一個參數,即自由度,102,28,,圖3-3 不同自由度下的t 分布圖,102,29,1.特征:,102,30,2 t界值表:詳見附表2,可反映t分布曲線下的面積。單側概率或單尾概率:用 表示;雙側概率或雙尾概率:用 表
13、示。,102,31,102,32,舉例:,102,33,第三節(jié) 總體均數的估計,102,34,一、參數估計 用樣本統(tǒng)計量推斷總體參數。總體均數估計:用樣本均數(和標準差)推斷總體均數。,102,35,102,36,按預先給定的概率(1??)所確定的包含未知總體參數的一個范圍。 總體均數的區(qū)間估計:按預先給定的概率(1??)所確定的包含未知總體均數的一個范圍。 如給定?=0.05,該范圍稱為參數的95%可信區(qū)間
14、或置信區(qū)間; 如給定?=0.01,該范圍稱為參數的99%可信區(qū)間或置信區(qū)間。,2.區(qū)間估計(interval estimation):,102,37,二、總體均數可信區(qū)間的計算,102,38,二、總體均數可信區(qū)間的估計,,(一) 總體均數的點估計(point estimation)與區(qū)間估計,參數的估計,,,,,點估計:由樣本統(tǒng)計量 直接估計 總體參數,區(qū)間估計:在一定可信度(Confidence le
15、vel) 下,同時考慮抽樣誤差,102,39,第三節(jié) 總體均數的估計,點估計(point estimation):是用相應樣本統(tǒng)計量直接作為其總體參數的估計值。如 ,但未考慮抽樣誤差的大小。,區(qū)間估計(interval estimation):是按預先給定的概率(1-α)所確定的包含未知總體參數的一個范圍。該范圍稱為參數的可信區(qū)間或置信區(qū)間(confidence interval,CI),(1-α)稱為可
16、信度或置信度(confidence level),用開區(qū)間表示的可信區(qū)間中兩個數值稱為可信限或置信限(confidence limit,CL),102,40,,總體均數可信區(qū)間的計算需考慮:(1)總體標準差?是否已知, (2)樣本含量n的大小通常有兩類方法:(1)t分布法 (2)u分布法,102,41,第三節(jié) 總體均數的估計,(1)σ已知:按U 分布總體均數雙側1-α可信區(qū)間為,二.總體均數可信區(qū)間的計算,1.單
17、一總體均數可信區(qū)間,總體均數單側1-α可信區(qū)間為,102,42,第三節(jié) 總體均數的估計,(2)σ未知,但n足夠大:按U分布(近似正態(tài)分布)總體均數雙側1-α可信區(qū)間為,二.總體均數可信區(qū)間的計算,1.單一總體均數可信區(qū)間,總體均數單側1-α可信區(qū)間為,102,43,例3-3 某地抽取正常成人200名,測得其血清膽固醇的均數為 ,標準差S=1.20mmol/L ,估計該地正常成年人血清膽固醇均數的95%
18、和99%置信區(qū)間。,第三節(jié) 總體均數的估計,95%CI:,99%CI:,102,44,第三節(jié) 總體均數的估計,(3)σ未知,但n較小 :按t 分布總體均數雙側1-α可信區(qū)間為,二.總體均數可信區(qū)間的計算,1.單一總體均數可信區(qū)間,總體均數單側1-α可信區(qū)間為,102,45,例3-2 已知某地27例健康成年男性血紅蛋白量的均數為 ,標準差S=15g/L ,試問該地健康成年男性血紅蛋白量的95%和99%置信區(qū)
19、間。本例n=27,S=15,第三節(jié) 總體均數的估計,95%CI:,99%CI:,102,46,第三節(jié) 總體均數的估計,從總體標準差相等,但總體均數不等的兩個正態(tài)總體N(μ1,σ2)和 N(μ2,σ2)進行隨機抽樣。則兩總體均數(μ1- μ2)之差的雙側1-α可信區(qū)間為,二.總體均數可信區(qū)間的計算,2.兩總體均數之差的可信區(qū)間,自由度:ν=n1+n2-2,102,47,第三節(jié) 總體均數的估計,兩總體均數(μ1- μ
20、2)之差的單側1-α可信區(qū)間為,當兩樣本的樣本含量均較大時,102,48,例3-4 為了解氨甲喋呤(MTX)對外周血IL-2水平的影響,某醫(yī)生將61名哮喘患者隨機分為兩組。其中對照組29例( ),采用安慰劑;實驗組32例( ),采用小劑量氨甲喋呤(MTX)進行治療。測得對照組治療前IL-2的均數為20.10 IU/ml ( ),標準差為7.02 IU/ml ( );試驗組治療前IL-2的均數為16.89 IU/ml
21、 ( ),標準差為8.46 IU/ml ( )。問兩組治療前基線的IL-2總體均數相差有多大?,,102,49,第三節(jié) 總體均數的估計,,102,50,三、可信區(qū)間的確切涵義,102,51,,1. 95%的可信區(qū)間的理解:(1)所要估計的總體參數有95%的可能在我們所估計的可信區(qū)間內。(2)從正態(tài)總體中隨機抽取100個樣本,可算得100個樣本均數和標準差,也可算得100個均數的可信區(qū)間,平均約有95個可信區(qū)間包
22、含了總體均數 ,估計錯誤的概率是5%,為小概率事件。(3)但在實際工作中,只能根據一次試驗結果估計可信區(qū)間,我們就認為該區(qū)間包含了總體均數?。,102,52,,2.可信區(qū)間的兩個要素(1)準確度:用可信度(1??)表示:即區(qū)間包含總體均數?的理論概率大小 。當然它愈接近1愈好,如99%的可信區(qū)間比95%的可信區(qū)間要好 。(2)精確度:即區(qū)間的寬度 區(qū)間愈窄愈好,如95%的可信區(qū)間比99%的可信區(qū)間要好 。,102,53,,當
23、n確定時,上述兩者互相矛盾。提高準確度(可信度),則精確度降低(可信區(qū)間會變寬),勢必降低可信區(qū)間的實際應用價值,故不能簡單認為99%可信區(qū)間比95%可信區(qū)間要好。相反,在實際應用中,95%可信區(qū)間更為常用。在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度,提高精確度。,102,54,四、總體均數可信區(qū)間與參考值范圍的區(qū)別,102,55,第三節(jié) 總體均數的估計,表3-2 總體均數的可信區(qū)間與參考值范圍的區(qū)別,四. 可信區(qū)
24、間與參考值范圍的區(qū)別,,正態(tài)分布偏態(tài)分布 PX~P100-X,102,56,注意:標準差與標準誤的區(qū)別。 1)概念不同:標準差是描述樣本中個體值間的變異程度的指標,標準差越小,表示變量值圍繞均數的波動越小。標準誤是描述樣本均數間變異程度的指標,標準誤越小,表示樣本均數圍繞總體均數的波動越小。,2) 用途不同:標準差常用于表示變量值對均數波動的大小,當資料呈正態(tài)分布時,與均數結合可估計正常值范圍;標
25、準誤常用于表示樣本統(tǒng)計量(樣本均數、樣本率)對總體參數(總體均數、總體率)的波動情況,可估計參數的可信區(qū)間、進行假設檢驗。,102,57,3)與例數的關系不同:當樣本含量足夠大時,標準差趨向穩(wěn)定。而標準誤隨例數的增大而減小,甚至趨向于0。若樣本含量趨向于總例數,則標準誤接近于0。,聯系;二者均為變異指標,如果把總體中各樣本均數看成一個變量,則標準誤可稱為樣本均數的標準差。兩者均可與均數結合運用,但描述的內容各不相同。,102,
26、58,第四節(jié) t 檢驗,102,59,第四節(jié) t 檢驗和u 檢驗,在實際應用中,常常遇到這樣的問題:某一樣本均數是否來自于已知均數總體?兩個不同樣本均數是否來自同一總體等等?回答這類問題,除可用前面介紹的參數估計方法外,更多采用統(tǒng)計推斷的另一方面——假設檢驗來解決。,假設檢驗的概念,一般科研程序: 假說----驗證----對假說作出結論,102,60,假設檢驗過去稱顯著性檢驗。它是利用小概率反證法思想,從問題的
27、對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計算檢驗統(tǒng)計量,最后獲得P值來判斷。,假設檢驗基本思想及步驟,102,61,第四節(jié) t 檢驗和u 檢驗,假設檢驗的步驟,例3-5 某醫(yī)生測量了36名從事鉛作業(yè)的男性工人的血紅蛋白含量,算得其均數為130.83g/L,標準差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L?,以單樣本t 檢驗為例,102,62,,從資料
28、提供的信息來看,樣本均數130.83g/L與總體均數140g/L不相等,其原因可有以下兩個方面: ①樣本估計的總體均數等于140,差別僅僅是由于抽樣誤差所致;(偶然的、隨機的、較小的) 統(tǒng)計學上稱為差異無顯著性。 ②除抽樣誤差外,鉛作業(yè)工人與正常成年男性的血紅蛋白含量存在本質上的差異。(必然的、大于隨機誤差)。統(tǒng)計學上稱為差異有顯著性。兩種情況只有一個是正確的,且二者必居其一,需要我們作出推斷。,102,63
29、,第四節(jié) t 檢驗和u 檢驗,,造成兩者不等的原因: ①同一總體,即 ,但有抽樣誤差存在;,②非同一總體,即 存在本質上的差別,同時有抽樣誤差存在。,,102,64,分析:研究者可能有兩種目的,1)推斷兩總體有無差別,不管鉛作業(yè)工人的血紅蛋白含量高于正常人群值還是低于正常值,兩種可能性都存在,研究者都同樣關心,應當用雙側檢驗。2)根據專業(yè)知識,已知鉛作業(yè)工人的血紅蛋白含量不會高于
30、正常人群值或是研究者只關心鉛作業(yè)工人的血紅蛋白含量是否低于正常人群值,應當用單側檢驗。一般認為雙側檢驗較為穩(wěn)妥,故較為常用。,,102,65,102,66,對于檢驗假設,須注意: ① 檢驗假設是針對總體而言,而不是針對樣本; ② H0和H1是相互聯系,對立的假設,后面的結論是根據H0和H1作出的,因此兩者不是可有可無,而是缺一不可;③ H1的內容直接反映了檢驗單雙側。若H1中只是? ??0 或 ? <?0,則此檢驗
31、為單側檢驗。它不僅考慮有無差異,而且還考慮差異的方向。④ 單雙側檢驗的確定,首先根據專業(yè)知識,其次根據所要解決的問題來確定。若從專業(yè)上看一種方法結果不可能低于或高于另一種方法結果,此時應該用單側檢驗。一般認為雙側檢驗較保守和穩(wěn)妥。,102,67,102,68,P的含義是指從H0規(guī)定的總體隨機抽樣,抽得等于及大于(或/和等于及小于)現有樣本獲得的檢驗統(tǒng)計量(如t、u等)值的概率。 當求得檢驗統(tǒng)計量的值后,一般可通過特制的統(tǒng)計用表直
32、接查出P值。,3. 確定P值,102,69,4.作出推斷結論 ①如果P≤a時,結論為按所取檢驗水準α拒絕H0,接受H1,差異有統(tǒng)計學顯著性意義,即存在本質差異。 ②如果P>a ,結論為按所取檢驗水準α不拒絕H0,差異無統(tǒng)計學顯著性意義。即差異是由抽樣誤差引起的。,102,70,102,71,第四節(jié) t 檢驗和u 檢驗,當樣本含量n較小時,理論上要求t 檢驗的樣本隨機地取自正態(tài)總體,兩小樣本均數比較時還要求兩樣本所對
33、應的總體方差相等,即方差齊性。但實際應用時,與上述條件略有偏離,對結果亦影響不大。 而u 檢驗則要求樣本含量 n 較大,或 n 雖小但總體標準差已知。,t 檢驗(t-test)和u 檢驗(u-test)是計量資料中最常用且較為簡單的兩種假設檢驗方法。,102,72,第四節(jié) t 檢驗和u 檢驗,,例3-5 某醫(yī)生測量了36名從事鉛作業(yè)的男性工人的血紅蛋白含量,算得其均數為130.83g/L,標準差為25.74g/L
34、。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L?,一、單樣本t 檢驗(樣本均數與總體均數的比較),目的:推斷該樣本所代表的未知總體均數與已知總體均數是否相等,102,73,第四節(jié) t 檢驗和u 檢驗,1. 建立檢驗假設、確定檢驗水準并確定單、雙側檢驗。,102,74,第四節(jié) t 檢驗和u 檢驗,計算統(tǒng)計量(statistic):不同的檢驗方法和類型選用相應的統(tǒng)計量。,102,75,第四節(jié) t 檢
35、驗和u 檢驗,確定P值 P值的意義:H0成立的可能性(概率)有多大。查 t 值表:,102,76,第四節(jié) t 檢驗和u 檢驗,做推斷結論: (包括統(tǒng)計結論和專業(yè)結論),假設檢驗的推斷結論是對“H0是否真實”作出判斷。這種判斷是通過比較P值與檢驗水準α的大小來進行的。,按α=0.05水準,拒絕H0,接受H1,差別有統(tǒng)計學意義。可認為從事鉛作業(yè)的男性工人平均血紅蛋白含量低于正常成年男性。,102,77,配對t 檢驗適用
36、于配對設計的計量資料。配對設計是將受試對象按照某些重要特征(可疑混雜因素)配成對子,每對的兩個受試對象隨機分配到兩處理組。配對設計類型:①兩同質受試對象分別接受兩種不同的處理;②同一受試對象分別接受兩種不同處理;③同一受試對象(一種)處理前后的數據。,二、配對t 檢驗 (paired / matched t-test),102,78,表3-3 兩種方法對乳酸飲料中脂肪含量的測定結果(%),102,79,(1)建立檢驗假設,確定檢驗水
37、準H0:?d=0,即兩種方法的測定結果相同H1:?d≠0,即兩種方法的測定結果不同?=0.05 (2)計算檢驗統(tǒng)計量本例n=10,?d=2.724,?d2=0.8483,,,,102,80,按公式(3-16) (3)確定P值,作出推斷結論 查附表2的t界值表得P<0.001。按?=0.05水準,拒絕H0,接受H1,有統(tǒng)計學意義??烧J為兩種方法對脂肪含量的測定結果不同,哥特里-羅紫
38、法測定結果較高。,102,81,第四節(jié) t 檢驗和u 檢驗,適用于完全隨機設計兩樣本均數的比較,通過樣本信息推斷所屬的兩總體均數是否不等。,三、兩樣本t 檢驗(成組t 檢驗)(two-sample/group t-test),兩組完全隨機設計是將同質的受試對象完全隨機分配到兩個不同處理組。,當兩樣本含量較小時,且均來自正態(tài)總體時,要根據兩總體方差是否相等而采用不同的檢驗方法。,102,82,,102,83,,計算公式為,102,8
39、4,第四節(jié) t 檢驗和u 檢驗,例3-7 為研究國產四類新藥阿卡波糖膠囊的降血糖效果,某醫(yī)院用40名Ⅱ型糖尿病病人進行同期隨機對照實驗。實驗者將這些病人隨機等分到試驗組(用阿卡波糖膠囊和對照組(用拜唐蘋膠囊),分別測得試驗開始前和8周后的空腹血糖,算得空腹血糖下降值見表,能否認為該國產四類新藥阿卡波糖膠囊與拜唐蘋膠囊對血糖的降糖效果不同。,102,85,第四節(jié) t 檢驗和u 檢驗,檢驗步驟:,102,86,第四節(jié) t
40、檢驗和u 檢驗,查t 臨界值表:t0.05/2,38=2.204 t 0.05 按α=0.05水準不拒絕H0,差別無統(tǒng)計學意義。故還不能認為阿卡波糖膠囊與拜唐蘋膠囊對空腹血糖的降糖效果不同。,102,87,例6-4 某口腔科測得長春市13—16歲居民男性20人的恒牙初期腭弓深度均值為17.15mm,標準差為1.59mm;女性34人的均值為16.92mm,標準差為1.42mm。根據這份數據可否認為該市13—16歲
41、居民腭弓深度有性別差異?,102,88,檢驗步驟:,102,89,查t 臨界值表:t0.5/2,50=0.679 t 0.5 按α=0.05水準不拒絕H0,差別無統(tǒng)計學意義。故還不能認為該市13—16歲居民腭弓深度有性別差異。,102,90,u檢驗 適用于兩樣本含量較大的資料(如都>60)。目的仍然是推斷兩總體均數有無差別。,,代表兩樣本均數之差的標準誤,,102,91,例 某地對抽樣調查了部分健康成
42、人的紅細胞數,其中男性360人,均數為 ,標準差為 ,女性255人,均數為 ,標準差為 , 試問該地男女紅細胞數的均數有無差別?,,1)建立假設,確定檢驗水準 H0:該地男女紅細胞數的均數相等,即μ1= μ2 H1:該地男女紅
43、細胞數的均數不等,即μ1≠ μ2,α=0.05,雙側,102,92,(2)選定檢驗方法并計算檢驗統(tǒng)計量,(3)確定P值,作出推斷結論查u界值表(即t界值表中ν為∞一欄),13.63 > u0.05,雙尾=1.96 ,故雙尾概率P < 0.05。 按α=0.05水準,拒絕H0,接受H1,差異有統(tǒng)計學意義。可認為該地男女紅細胞數的均數不等,男高于女。,102,93,兩樣本均數比較方法的選擇,102,94,第四節(jié) t 檢驗和u 檢
44、驗,例3-8 在上例國產新藥阿卡波糖膠囊的降血糖效果研究中,測得用拜唐蘋膠囊的對照組20例病人和用阿卡波膠囊的試驗組20例病人,其8周時糖化血紅蛋白HbA1c(%)下降值如下表。問用兩種不同藥物的病人其HbA1c下降值是否不同?,表3-5 對照組和試驗組HbA1c下降值(%),,102,95,第四節(jié) t 檢驗和u 檢驗,(1) Cochran & Cox近似t 檢驗(對臨界值校正),2.總體方差不等的 t’ 檢驗,10
45、2,96,故當兩個小樣本比較時,若樣本例數相等,直接用t檢驗法較為方便,只是由t界值表查P值時,自由度用n-1,而不用,102,97,第四節(jié) t 檢驗和u 檢驗,,2.計算檢驗統(tǒng)計量,1.建立檢驗假設,確定檢驗水準,102,98,,(3)確定P值,作出推斷結論。查t界值表t0.05/2,19=2.093。,由t?=0.9650.05。按?=0.05水準,不拒絕H0,無統(tǒng)計學意義。還不能認為用兩種不同藥物的病人其HbA1c下降值不
46、同。,102,99,,2. Satterthwaite近似t檢驗 : Cochran & Cox法是對臨界值校正 而Satterthwaite法則是對自由度校正。,102,100,,以?=28.4?28、t=0.965查附表2的t界值表得0.20<P<0.40。結論同前。,按Satterthwaite法對例3-8做檢驗,得,102,101,,3.Welch法近似t檢驗 Welch法也是對自由度進行校正
47、。校正公式為,102,102,對例3-8,如按Welch法,則,以?=29.4?29、t =0.965查附表2的t界值表得0.20<P<0.40。結論同前。,102,103,進行兩小樣本均數比較,若兩總體正態(tài)分布且總體方差不等,可采用:①數據變換;②近似t 檢驗——t’檢驗;③秩轉換的非參數檢驗。,進行兩小樣本均數比較,若兩總體非正態(tài)分布且總體方差不等,可采用:①數據變換;②秩轉換的非參數檢驗。,進行兩小樣本均數比較,若
48、兩總體滿足正態(tài)分布且總體方差齊,可直接采用:t 檢驗,102,104,,I型錯誤和II型錯誤檢驗水準的選擇雙側檢驗與單側檢驗結論的概率性,需注意的幾個問題,102,105,I 型錯誤和 II 型錯誤,假設檢驗是利用小概率反證法思想,根據P值判斷結果,此推斷結論具有概率性,因而無論拒絕還是不拒絕H0,都可能犯錯誤。拒絕了實際上是成立的H0,這類棄真的錯誤稱為第一類錯誤(Type I Error)。不拒絕實際上是不成立的H0,這類
49、存?zhèn)蔚腻e誤稱為第二類錯誤(Type II Error)當P ≤? 而拒絕H0,要注意第一類錯誤出現;當P >? 而不拒絕H0,要注意第二類錯誤的出現。,102,106,I 型錯誤和 II 型錯誤,102,107,I 型錯誤:“實際無差別,但下了有差別的結論”,假陽性錯誤。犯這種錯誤的概率是?(其值等于檢驗水準) II型錯誤:“實際有差別,但下了無差別的結論”,假陰性錯誤。犯這種錯誤的概率是?(取單側,其值未知) 。 但 n 一
50、定時, ? 增大,? 則減少 。,102,108,第六節(jié) 假設檢驗的基本步驟及其注意事項,1-β稱為檢驗的效能 當所研究的總體與H0確有差別時,按檢驗水準α能夠發(fā)現該差異的能力。 一般情況下對同一檢驗水準α,功效大的檢驗方法更可取。 在醫(yī)學科研設計中,檢驗效能(1-β)不宜低于0.75,否則檢驗結果很可能反映不出總體的真實差異,出現非真實的陰性結果。,102,109,減少I型錯誤的主要方法:假設檢驗時設定
51、? 值。,減少II型錯誤的主要方法:提高檢驗效能。,提高檢驗效能的最有效方法:增加樣本量。,如何選擇合適的樣本量:實驗設計。,102,110,,I 型錯誤和 II 型錯誤圖示,,,,界值,1-?,拒絕H0,不拒絕H0,?,102,111,結論的概率性,無論做出何種推斷結論,總是有風險的!拒絕H0時可能犯I類錯誤;不拒絕H0時可能犯II類錯誤;尤其是檢驗統(tǒng)計量位于檢驗界值的附近時,下結論更應慎重;,?,102,112,第五節(jié)
52、 假設檢驗中的注意事項,1.要有嚴密的研究設計 這是假設檢驗的前提。組間應均衡,具有可比性,也就是除對比的主要因素(如臨床試驗用新藥和對照藥)外,其它可能影響結果的因素(如年齡、性別、病程、病情輕重等)在對比組間應相同或相近。保證均衡性的方法主要是從同質總體中隨機抽取樣本,或隨機分配樣本。,102,113,2.不同的資料應選用不同檢驗方法 應根據分析目的、資料類型以及分布、設計方案的種類、樣本含量大小等選用適當的檢驗方
53、法。如:配對設計的計量資料采用配對t檢驗。而完全隨機設計的兩樣本計量資料,若為小樣本(即任一ni 60)且方差齊,則選用兩樣本t檢驗;若方差不齊,則選用近似t?檢驗(Cochran & Cox法或Satterthwaite法)。若為大樣本(所有ni>60),則可選用大樣本u檢驗。,102,114,3.正確理解“顯著性”一詞的含義,這里的“顯著”和“不顯著”是統(tǒng)計學術語。不應把“顯著”誤解為差別很大,甚至理解為醫(yī)
54、學實踐中有重要的價值;同理,也不能把“不顯著”誤解為差別不大,或一定相等?,F在采用“有無統(tǒng)計學意義”表達。,102,115,4.結論不能絕對化 因統(tǒng)計結論具有概率性質,故“肯定”、“一定”、“必定”等詞不要使用。在報告結論時,最好列出檢驗統(tǒng)計量的值,注明檢驗水準,以便讀者與同類研究進行比較或進行循證醫(yī)學時采用Meta分析。 另外,是否拒絕H0 ,不僅決定于被研究事物本身有無本質差異,還決定于抽樣誤差的大小、檢驗水準α的高
55、低以及單側、雙側檢驗。,102,116,5.假設檢驗是為專業(yè)服務的,統(tǒng)計結論必須和專業(yè)結論有機地相結合,才能得出恰如其分、符合客觀實際的最終結論。若統(tǒng)計結論和專業(yè)結論一致,則最終結論就和這兩者均一致(即均有或均無意義);若統(tǒng)計結論和專業(yè)結論不一致,則最終結論需根據實際情況加以考慮。若統(tǒng)計結論有意義,而專業(yè)結論無意義,則可能由于樣本含量過小或設計存在問題,那么最終結論就沒有意義。,102,117,第六節(jié) 假設檢驗的基本步驟及其注意事項,
56、置信區(qū)間與假設檢驗的區(qū)別和聯系,區(qū)間估計與假設檢驗是統(tǒng)計推斷的兩種方法。置信區(qū)間用于說明量的大小即推斷總體均數的范圍,而假設檢驗用于推斷質的不同即判斷兩總體均數是否不同。它們之間既相互聯系,又有區(qū)別。,102,118,6.可信區(qū)間與假設檢驗各自不同的作用,要結合使用。,一方面,可信區(qū)間亦可回答假設檢驗的問題,算得的可信區(qū)間若包含了H0,則按?水準,不拒絕H0;若不包含H0,則按?水準,拒絕H0,接受H1。,鉛作業(yè)工人血紅蛋白含量的95%
57、可信區(qū)間為(122.12-139.54)g/l,未包含已知總體均數140 g/l,因此拒絕H0的假設。,102,119,另一方面,可信區(qū)間不但能回答差別有無統(tǒng)計學意義,而且還能比假設檢驗提供更多的信息,即提示差別有無實際的專業(yè)意義。,102,120,圖3-7 可信區(qū)間在統(tǒng)計推斷上提供的信息,102,121,雖然可信區(qū)間亦可回答假設檢驗的問題,并能提供更多的信息,但并不意味著可信區(qū)間能夠完全代替假設檢驗??尚艆^(qū)間只能在預先規(guī)定的概率 ?
58、檢驗水準?的前提下進行計算,而假設檢驗能夠獲得一較為確切的概率P值。,102,122,根據以上的結論,置信區(qū)間與相應的假設檢驗既能提供相互等價的信息,又有各自不同的功能。把置信區(qū)間與假設檢驗結合起來,可以提供更全面、完整的信息。因此,國際上規(guī)定,在報告假設檢驗結論的同時,必須報告相應的區(qū)間估計結果。,102,123,第六節(jié),正態(tài)性檢驗 和兩樣本方差比較的F檢驗,102,124,t 檢驗的應用條件是正態(tài)總體且方差齊性;配對t 檢驗則要求
59、每對數據差值的總體為正態(tài)總體。 進行兩小樣本t檢驗時,一般應對資料進行方差齊性檢驗,尤其兩樣本方差懸殊時。 若方差齊,采用一般的t 檢驗;若方差不齊,則采用t’檢驗。,102,125,第七節(jié) 正態(tài)性檢驗和兩樣本方差齊性檢驗,一、正態(tài)性檢驗,正態(tài)性檢驗方法有兩大類:圖示法和計算法,一).圖示法:1. 概率圖(probability-probability plot,P-P plot) 是以實際或觀察的累積頻率(X)對被檢驗
60、分布(如正態(tài)分布)的理論或期望累積頻率(Y)作圖。2. 百分位數圖(quantile-quantile plot ,Q-Q plot) 是以實際或觀察的分位數(X)對被檢驗分布的理論或期望分位數(Y)作圖。而Q-Q圖的效率較高。,102,126,,圖3-8 例3-1中100個樣本均數的P-P圖,102,127,102,128,,,圖3-9 例3-1中100個樣本均數的Q-Q圖,102,129,第七節(jié) 正態(tài)性檢驗和兩樣本方差齊
61、性檢驗,一、正態(tài)性檢驗,正態(tài)性檢驗方法有兩大類:圖示法和計算法,二)計算法:1. 矩法(method of moment ,又稱動差法)效率最高。分別對偏度(skewness)和峰度(kurtosis)做檢驗。,偏度系數(coefficient of skewness)偏度——指分布不對稱的程度和方向。樣本偏度系數用g1表示,總體偏度系數用γ1表示。理論上γ1=0為對稱,γ1>0為正偏態(tài),γ1<0為負偏態(tài);,102,1
62、30,第七節(jié) 正態(tài)性檢驗和兩樣本方差齊性檢驗,一、正態(tài)性檢驗,峰度系數(coefficient of kurtosis)峰度——指分布與正態(tài)分布曲線相比的冒尖程度或平坦程度。樣本峰度系數用g2表示,總體峰度系數用γ2表示。理論上γ2=0為正態(tài)峰,γ2>0為尖峭峰,γ2<0為平闊峰。 當同時滿足對稱和正態(tài)峰兩個條件時,才能認為該資料服從正態(tài)分布。,102,131,第七節(jié) 正態(tài)性檢驗和兩樣本方差齊性檢驗,一
63、、正態(tài)性檢驗,例3-10 試用矩法對表3-1中計算機模擬抽樣所得100個樣本均數進行正態(tài)性檢驗。,1)建立檢驗假設,確定檢驗水準,102,132,第七節(jié) 正態(tài)性檢驗和兩樣本方差齊性檢驗,一、正態(tài)性檢驗,2)計算統(tǒng)計量,102,133,第七節(jié) 正態(tài)性檢驗和兩樣本方差齊性檢驗,102,134,第七節(jié) 正態(tài)性檢驗和兩樣本方差齊性檢驗,3)確定P值,做出推斷結論查t 界值表ν → ∞,t0.50/2, ∞=0.6745偏度P>
64、0.50,峰度P>0.50按α=0.10水準,不拒絕H0,差別無統(tǒng)計學意義。尚不能認為這些樣本均數的總體均數不服從正態(tài)分布。,102,135,第七節(jié) 正態(tài)性檢驗和兩樣本方差齊性檢驗,兩總體方差齊性檢驗的推斷過去多采用F檢驗,由于該檢驗理論上要求資料服從正態(tài)分布,而許多資料方差不齊時,往往偏離正態(tài)性。因此,今年來,多采用更為穩(wěn)健、不以來總體分布具體形式的Levene檢驗。,本節(jié)僅介紹F 檢驗,關于Levene檢驗將在第四章第七節(jié)
65、中介紹。,102,136,二、兩樣本方差比較的F檢驗 兩小樣本t 檢驗時,檢查兩樣本方差代表的總體方差是否相等(決定t 檢驗的方法)。,1. Levene檢驗 2. F檢驗,,102,137,,102,138,,,圖3-10 不同自由度時F分布的圖形,102,139,,102,140,方差齊性檢驗的基本思想:即使兩個總體方差相等,即方差齊,樣本方差也會有抽樣波動,樣本方差不等是否是由于抽樣誤差所致?F值是兩
66、個方差之比,如果僅僅是由于抽樣誤差的影響,F 值不會偏離1太遠。,102,141,(2) 計算檢驗統(tǒng)計量,例3-10 對例3-8,用F 檢驗判斷兩總體糖化血紅蛋白的方差是否不等。,(1) 建立檢驗假設,確定檢驗水準,102,142,(3) 確定P值,作出推斷結論,102,143,1.由于方差齊性F檢驗在樣本含量較小時不敏感,而在樣本含量較大時太敏感,因此統(tǒng)計學家對兩樣本均數比較是否進行方差齊性檢驗持有不同的看法。有人提出當一個樣本的方
67、差是另一個樣本方差的3倍以上時,可認為方差不齊。2.當樣本含量較大時(如n1和n2均大于60),可不必做方差齊性檢驗。,注意!,102,144,三、變量變換,常用的變量變換有對數變換、平方根變換、倒數變換、平方根反正弦變換等,應根據資料性質選擇適當的變量變換方法。,102,145,變量變換的目的:1.使各組達到方差齊性2.使資料轉換為正態(tài)分布,以滿足方差分析和t檢驗的應用條件3.直線化,常用于曲線擬和。,102,146,102
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 統(tǒng)計學第三章習題
- 統(tǒng)計學第三章new
- 統(tǒng)計學第三章統(tǒng)計整理
- 《統(tǒng)計學》-第三章-統(tǒng)計整理
- 統(tǒng)計學原理第三章-統(tǒng)計整理
- 統(tǒng)計學第三章,統(tǒng)計分組
- 應用統(tǒng)計學講義第三章
- 統(tǒng)計學第三章選擇題
- 統(tǒng)計學資料第三章統(tǒng)計整理編輯
- 應用統(tǒng)計學-第三章圖表法
- 統(tǒng)計學第三章練習題附答案
- 《統(tǒng)計學》第三章課后作業(yè)題
- 統(tǒng)計學第三章課后習題畫圖作業(yè)
- 統(tǒng)計學原理第三章(統(tǒng)計資料整理)習題答案
- 疲勞與斷裂第三章疲勞應用統(tǒng)計學基礎
- 統(tǒng)計學第三章-數據分布特征的描述
- 生物統(tǒng)計第三章
- 統(tǒng)計學第五版第三章課后習題答案
- [學習]統(tǒng)計學--第三章平均數與標準差
- 統(tǒng)計學第五版第三章課后習題答案
評論
0/150
提交評論