版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、生物統(tǒng)計學(xué),第七章 擬合優(yōu)度檢驗- ?2檢驗,擬合優(yōu)度檢驗的意義 判斷實際觀察的屬性類別分配是否符合已知屬性類別分配理論或?qū)W說的假設(shè)檢驗。 簡單的說:*用于檢驗總體是否服從某個指定分布。 Ⅰ.檢測觀察數(shù)與理論數(shù)之間的一致性;Ⅱ.通過檢測觀察數(shù)與理論數(shù)之間的一致性來判定事物之間的獨立性。,§7.1、擬合優(yōu)度檢驗的一般原理,7.1.1 什么是擬合優(yōu)度檢驗(P92),一、 ?2統(tǒng)計量的意義
2、 為了便于理解,現(xiàn)結(jié)合一實例說明?2 (讀作卡方) 統(tǒng)計量的意義。根據(jù)遺傳學(xué)理論,動物的性別比例是1:1。統(tǒng)計某一年所產(chǎn)的876只實驗動物,有雄性428只,雌性448只。按1:1的性別比例計算,雌雄均應(yīng)為438只。以O(shè)i表示實際觀察次數(shù),Ti 表 示 理 論次數(shù),可將上述情況列成下表。,7.1.2 擬合優(yōu)度檢驗的統(tǒng)計量(P92),表 動物性別實際觀察次數(shù)與理論次數(shù),從上表可以看到 ,實際觀察次數(shù)與理論次數(shù)存在一定的差異
3、。 這個差異是屬于抽樣誤差、還是其性別比例發(fā)生了實質(zhì)性的變化? 要回答這個問題:①首先需要確定一個統(tǒng)計量用以表示實際觀察次數(shù)與理論次數(shù)偏離的程度;②然后判斷這一偏離程度是否屬于抽樣誤差,即進(jìn)行顯著性檢驗。,為了度量實際觀察次數(shù)與理論次數(shù)偏離程度:A:最簡單的辦法是求出實際觀察次數(shù)與理論次數(shù)的差數(shù)。如上表:O1-T1 =-10,O2-T2=10,由于這兩個差數(shù)之和為0,顯然此方法不可行;B:計算∑(O-T)2,其值越大
4、,實際觀察次數(shù)與理論次數(shù)相差亦越大,反之則越小。但尚有不足。例如某一 組 實 際 觀 察 次 數(shù)為505、理論次數(shù)為500,相差5;而另一組實際觀察次數(shù)為26、 理論次數(shù)為21,相差亦為5。,為了彌補(bǔ)B這一不足,將各差數(shù)平方除以相應(yīng)的理論次數(shù)后再相加,并記之為?2 ,即,也就是說?2是度量實際觀察次數(shù)與理論次數(shù)偏離程度的一個統(tǒng)計量, ?2越小,表明實際觀察次數(shù)與理論次數(shù)越接近; ?2 =0,表示兩者完全吻合; ?2越大,表示兩者相差越大
5、。,二、?2分布 上面引入了統(tǒng)計量?2, 它近似地服從統(tǒng)計學(xué)中一種連續(xù)型隨機(jī)變量的概率分布???2分布。下面對統(tǒng)計學(xué)中的?2分布作一簡略介紹。 設(shè)有一平均數(shù)為μ、方差為 的正態(tài)總體?,F(xiàn)從此總體中獨立隨機(jī)抽取n個隨機(jī)變量:x1、x2、…、xn,并求出其標(biāo)準(zhǔn)正態(tài)離差:,,,,,記這n個相互獨立的標(biāo)準(zhǔn)正態(tài)離差的平方和為?2 :
6、 它服從自由度為n的?2分布,記為 ~ ?2 (n);,,,,若用樣本平均數(shù) 代替總體平均數(shù)μ,則隨機(jī)變量 服從自由度為n-1的?2分布,記為 ~,,,,顯 然 ,?2≥0
7、, 即 ?2 的 取 值 范 圍 是[0,+∞?;?2分布密度曲線是隨自由度不同而改變的一組曲線。隨自由度的增大, 曲線由偏斜漸趨于對稱;df≥30時, 接近正態(tài)分布。下面給出了幾個不同自由度的?2概率分布密度曲線。,,,的連續(xù)性矯正 由公式計算的?2只是近似地服從連續(xù)型隨機(jī)變量?2分布。在對次數(shù)資料進(jìn)行?2檢驗利用連續(xù)型隨機(jī)變量?2分布計算概率時,常常偏低,特別是當(dāng)自由度為1時偏差較大。 Yates(1934
8、)提出了一個矯正公式,矯正后的?2值記為 : = (7-2),,,當(dāng)自由度大于1時,原公式的?2分布與連續(xù)型隨機(jī)變量?2分布相近似,這時,可不作連續(xù)性矯正,但要求各組內(nèi)的理論次數(shù)不小于5。若某組的理論次數(shù)小于5,則應(yīng)把它與其相鄰的一組或幾組合并,直到理論次數(shù)大 于5 為止。,統(tǒng)計量: 使用條件:各理論
9、值均大于5。 若自由度為1,則應(yīng)作連續(xù)性矯正:,,,,方法為:把x的值域分為r個不相重合的區(qū)間,再計算在指定的分布下,x落入每一區(qū)間的概率pi 統(tǒng)計樣本含量為n的抽樣中,觀察值落入各區(qū)間的次數(shù)Oi用統(tǒng)計量進(jìn)行檢驗,步驟如下:,§7.2、擬合優(yōu)度檢驗,7.2.1 一般程序(P93),*檢驗步驟如下:(一)提出無效假設(shè)與備擇假設(shè)(二)選擇計算公式(三)計算理論次數(shù)(四)計算?2值 (五) 查臨界?2值,作出
10、統(tǒng)計推斷,說明: (一) H0:實際觀察的屬性類別分配符合已知屬性類別分配的理論或?qū)W說;HA:實際觀察的屬性類別分配不符合已知屬性類別分配的理論或?qū)W說。(二)選擇計算出?2還是?2c。(三)在無效假設(shè)成立的條件下,按已知屬性類別分配的理論或?qū)W說計算 各屬性類別的理論次數(shù)。,(四)計算出?2或?2c。(五)根據(jù)自由度k-1(若屬性類別分類數(shù)為 k ,則適合性檢驗的自由度為 k-1)查?2值表(附表)所得的臨界?2值:?20.05、
11、?20.01,將所計算得的?2或?2c值與其比較,作出統(tǒng)計推斷: 若?2 (或?2c)<?20.05,P>0.05,表明實際觀察次數(shù)與理論次數(shù)差異不顯著,可以認(rèn)為實際觀察的屬性類別分配符合已知屬性類別分配的理論或?qū)W說; 若?20.05≤?2 (或?2c)<?20.01, 若?2 ( 或?2c)≥?20.01,,下面結(jié)合實例說明適合性檢驗方法。(總體參數(shù)已知 )【例】 在研究牛的毛色和角
12、的有無兩對相對性狀分離現(xiàn)象時 ,用黑色無角牛和紅色有角牛雜交 ,子二代出現(xiàn)黑色無角牛192頭,黑色有角牛78頭,紅色無角牛72頭,紅色有角牛18頭,共360頭。試 問這兩對性狀是否符合孟德爾遺傳規(guī)律中9∶3∶3∶1的遺傳比例?,7.2.2 對二項分布的檢驗(P93),檢驗步驟: (一)提出無效假設(shè)與備擇假設(shè) H0:實際觀察次數(shù)之比符合9∶3∶3∶1的理論比例。 HA:實際觀察次數(shù)之比不符合9∶3∶3∶1的理論比
13、例。 (二)選擇計算公式 由于本例的屬性類別分類數(shù) k=4:自由 度df=k-1=4-1=3>1,故計算?2。 (三)計算理論次數(shù) 依據(jù)各理論比例9:3:3:1計算理論次數(shù):,黑色無角牛的理論次數(shù)T1:360×9/16=202.5; 黑色有角牛的理論次數(shù)T2:360×3/16=67.5; 紅色無角牛的理論次數(shù)T3:360×3/16=67.5;
14、紅色有角牛的理論次數(shù)T4:360×1/16=22.5。 或 T4=360-202.5-67.5-67.5=22.5 (四)列表計算?2,表 ?2計算表,=0.5444+1.6333+1.6333+0.9 =4.711 (五)查臨界?2值,作出統(tǒng)計推斷 當(dāng)df=3時,?20.05(3)=7.81,因 ?20.05,不能否定H0 ,表
15、明實際觀察次數(shù)與理論次數(shù)差異不顯著, 可以認(rèn)為毛色與角的有無兩對性狀雜 交 二 代 的 分 離 現(xiàn) 象 符 合 孟 德 爾遺傳規(guī)律中9∶3∶3∶1的遺傳比例。,,例7.1;7.2(P93;94),總體參數(shù)未知 例P95,表7-1不同之處:要由樣本估計出總體參數(shù)。,7.2.3 對正態(tài)分布的檢驗(P96),7.2.4 其他類型問題的檢驗(P97),一、獨立性檢驗的意義 對次數(shù)資料,除進(jìn)行擬合優(yōu)度檢驗外,有時需
16、要分析兩類因子是相互獨立還是彼此相關(guān)。如研究兩類藥物對實驗動物某種疾病治療效果的好壞,先將動物分為兩組,一組用第一種藥物治療,另一組用第二種藥物治療,然后統(tǒng)計每種藥物的治愈頭數(shù)和未治愈頭數(shù)。,§7.3、獨立性檢驗,7.3.1 列聯(lián)表?2 檢驗(P97),這時需要分析藥物種類與療效是否相關(guān),若兩者彼此相關(guān),表明療效因藥物不同而異,即兩種藥物療效不相同;若兩者相互獨立,表明兩種藥物療效相同。這種根據(jù)次數(shù)資料判斷兩類因子彼此相關(guān)或相
17、互獨立的假設(shè)檢驗就是獨立性檢驗。*獨立性檢驗實際上是基于次數(shù)資料對因子間相關(guān)性的研究。,獨立性檢驗與擬合優(yōu)度檢驗是兩種不同的檢驗方法,除了研究目的不同外,還有以下區(qū)別: (一) 獨立性檢驗的次數(shù)資料是按兩因子屬性類別進(jìn)行歸組。根據(jù)兩因子屬性類別數(shù)的不同而構(gòu)成2×2、2×c、r×c列聯(lián)表(r 為行因子的屬性類別數(shù), c 為 列 因子的屬性類別數(shù))。而適合性檢驗只按某一因子的屬性類別將如性別、表現(xiàn)型等
18、次數(shù)資料歸組。,(二)擬合優(yōu)度檢驗按已知的屬性分類理論或?qū)W說,計算理論次數(shù)。獨立性檢驗在計算理論次數(shù)時沒有現(xiàn)成的理論或?qū)W說可資利用,理論次數(shù)是在兩因子相互獨立的假設(shè)下進(jìn)行計算。 (三)在擬合優(yōu)度檢驗中確定自由度時,只有一個約束條件:各理論次數(shù)之和等于各實際次數(shù)之和,自由度為屬性類別數(shù)減1。而在r×c列聯(lián)表的獨立性檢驗中,共有rc個理論次數(shù),但受到以下條件的約束:,1、rc個理論次數(shù)的總和等于rc個實際次數(shù)的總和;
19、 2、r個橫行中的每一個橫行理論次數(shù)總和等于該行實際次數(shù)的總和 。 獨立的行約束條件只有r-1個; 3、類似地,獨立的列約束條件有c-1個。 因而在進(jìn)行獨立性檢驗時,自由度為rc-1-(r-1)-(c-1)=(r-1)(c-1),即等于(橫行屬性類別數(shù)-1)×(直列屬性類別數(shù)-1)。,二、獨立性檢驗的方法 (一)2×2列聯(lián)表的獨立性檢驗 2×2列聯(lián)表
20、的一般形式如下表所示,其自由度 df=( c -1) (r-1)=(2-1) (2-1)=1,在進(jìn)行?2檢驗時,需作連續(xù)性矯正,應(yīng)計算 值。,,表 2×2列聯(lián)表的一般形式,其中Aij為實際觀察次數(shù),Tij為理論次數(shù)。,其理論數(shù)的計算為:,例 7.3 下表是不同給藥方式與給藥效果表 給藥方式與給藥效果的2×2列聯(lián)表,上表稱為2×2列聯(lián)表(2×2 contingency table)。
21、 2×2列聯(lián)表的 c2 檢驗一般需經(jīng)以下各步:,(1)提出零假設(shè):認(rèn)為有效或無效與給藥方式并無關(guān)聯(lián)。實際觀察的結(jié)果與在兩者之間并無關(guān)聯(lián)的前提下,從理論上推導(dǎo)出的理論數(shù)之間無差異。即H0:O-T=0?! 。?)根據(jù)概率乘法法則,若事件A和事件B是相互獨立的,或者說它們之間并無關(guān)聯(lián),這時事件A和事件B同時出現(xiàn)的概率等于它們分別出現(xiàn)的概率乘積。,反過來,若事件A和事件B同時出現(xiàn)的概率等于它們分別出現(xiàn)的概率的乘積,那么事件A 和事
22、件B是獨立的兩者無關(guān)聯(lián)。若事件A和事件B 同時出現(xiàn)的概率不等于它們分布出現(xiàn)的概率的乘積,則這兩個事件間是有關(guān)聯(lián)的。,例 7.3 的零假設(shè)是給藥方式與給藥效果之間無關(guān)聯(lián),則口服與有效同時出現(xiàn)的理論頻率應(yīng)為口服的頻率與有效的頻率的乘積,P(BA)=P(B)P(A)=(98/193)(122/193)。其理論數(shù)T1應(yīng)當(dāng)用理論頻率乘以總數(shù)得出,T1=(98/193)(122/193)(193)=(98)(122)/193=61.15。同樣可以計
23、算出另外三種情況的理論數(shù)。 (3)如吻合度檢驗?zāi)菢佑嬎鉩2值。若c2<c2α,則觀察數(shù)與理論數(shù)是一致的, 給藥方式與給藥效果間無關(guān)聯(lián)的假設(shè)可以成立。若c2>c2α,則觀察數(shù)與理論數(shù)不一致,說明給藥方式與給藥效果間是有關(guān)聯(lián)的,不同的給藥方式產(chǎn)生不同的效果。,,(4)確定自由度,2×2列聯(lián)表的自由度不再是4-1=3,而是(r-1)(c-1)或者寫為(行-1)(列-1)。因為每一行的各理論數(shù)受該行總數(shù)的約束, 每一列
24、的各理論數(shù)受該列總數(shù)的約束,所以總的自由度只有(r-1)(c-1)。 下面計算例 1.11的c2并做推斷。首先計算各格的理論數(shù),從下表中可以看出, 任何一格的理論數(shù)等于這格所在的行總數(shù)乘以這格所在的列總數(shù),再除以總數(shù)。在實際計算時,算出T1以后,可以用列總數(shù)減去T1得T3,用行總數(shù)減去T1得T2,列總數(shù)減去T2得T4。,結(jié)論是用口服方式與注射方式給藥的效果沒有顯著不同。因為已經(jīng)接受H0,不必再矯正。,【例】 某研究用80頭實驗動物檢
25、驗?zāi)撤N疫苗是否有預(yù)防效果。結(jié)果是注射疫苗的44頭中有 12 頭發(fā)病,32頭未發(fā)??;未注射的36頭中有22頭發(fā)病,14頭未發(fā)病,問該疫苗是否有預(yù)防效果? 1、 先將資料整理成列聯(lián)表( 2×2列聯(lián)表 ),2、 提出無效假設(shè)與備擇假設(shè) H0:發(fā)病與否和注射疫苗無關(guān),即二因子相互獨立。 HA:發(fā)病與否和注射疫苗有關(guān),即二因子彼此相關(guān)。 3、 計算理論次數(shù) 根據(jù)二因
26、子相互獨立的假設(shè),由樣本數(shù)據(jù)計算出各個理論次數(shù)。二因子相互獨立,就是說注射疫苗與否不影響發(fā)病率。也就是說注射組與未注射組的理論發(fā)病率應(yīng)當(dāng)相同,均應(yīng)等于總發(fā)病率34/80=0.425=42.5%。依 此計算出各個理論次數(shù)如下:,注射組的理論發(fā)病數(shù): T11=44×34/80=18.7 注射組的理論未發(fā)病數(shù): T12=44×
27、46/80=25.3, 或 T12=44-18.7=25.3;,未注射組的理論發(fā)病數(shù): T21=36×34/80=15.3, 或 T21=34-18.7=15.3; 未注射組的理論未發(fā)病數(shù): T22=36×46/80=20.7, 或 T22=36-15
28、.3=20.7。,從上述各理論次數(shù)Tij的計算可以看到,理論次數(shù)的計算利用了行、列總和, 總總和,4個理論次數(shù)僅有一個是獨立的。(括號內(nèi)的數(shù)據(jù)為相應(yīng)的理論次數(shù))。 4、 計算 值 將表7-11中的實際次數(shù)、理論次數(shù)代入公式得:,,,,5、 由自由度df=1查臨界?2值,作出統(tǒng)計推斷 因為 ?20.01(1) = 6 . 6 3 , 而 =7.944>
29、?20.01(1),P<0.01,否定H0,接受HA,表明發(fā)病率與是否注射疫苗極顯著相關(guān),這里表現(xiàn)為注射組發(fā)病率極顯著低于未注射組,說明該疫苗是有預(yù)防效果的。,(二)2×c列聯(lián)表的獨立性檢驗 2×c列聯(lián)表是行因子的屬性類別數(shù)為2,列因子的屬性類別數(shù)為c(c?3)的列聯(lián)表。其自由度d f = (2-1) (c -1) = (c-1),因為c?3,所以自由度大于2,在進(jìn)行?2檢驗時,不需作連續(xù)性矯正。
30、2×c表的一般形式見表:,例見P99例7.4,此外,在畜牧、水產(chǎn)科學(xué)研究中,有時需將數(shù)量性狀資料以等級分類,如剪毛量分為特等、 一等、二等,產(chǎn)奶量分為高產(chǎn)與低產(chǎn)等,這些由數(shù)量性狀資料轉(zhuǎn)化為質(zhì)量性狀的次數(shù)資料檢驗,也可用?2檢驗。,A、B兩個品種產(chǎn)仔數(shù)的分類統(tǒng)計,(三)r×c列聯(lián)表的獨立性檢驗 r×c表是指行因子的屬性類別數(shù)為r(r>2),列因子的屬性類別數(shù)為c( c>2)的列聯(lián)
31、表。其一般形式見表7-17。,其中Aij(i=1,2,…r;j=1,2,…c)為實際觀察次數(shù)。 r×c 列 聯(lián) 表各個理論次數(shù)的計算方法與上述(2×2)、(2×c)表適合性檢驗類似。 【例】 對三組實驗動物(每組39頭)分別喂給不同的飼料,各組發(fā)病次數(shù)統(tǒng)計如下表,問發(fā)病次數(shù)的構(gòu)成比與所喂飼料是否有關(guān)?,,表 三組動物的發(fā)病次數(shù)資料,檢驗步驟如下: 1、提出無效假設(shè)與
32、備擇假設(shè) H0:發(fā)病次數(shù)的構(gòu)成比與飼料種類無關(guān),即二者相互獨立。 HA:發(fā)病次數(shù)的構(gòu)成比與飼料種類有關(guān),即二者彼此獨立。 2、計算理論次數(shù) 對于理論次數(shù)小于5者,將相鄰幾個組加以合并(見表7—19),合并后的各組的理論次數(shù)均大于5。,表 資料合并結(jié)果(注:括號內(nèi)為理論次數(shù)),3、計算?2值 利用公式計算?2值,得:,4、查臨界?2值,進(jìn)行統(tǒng)
33、計推斷 由自由度df=(4-1)(3-1)=6,查臨界?2值得: ?20..05(6)=12.59 因為計算所得的?20.05,不能否定HO , 可以認(rèn)為發(fā)病次數(shù)的構(gòu)成比與飼料種類相互獨立,即用三種不同的飼料飼喂動物,各組動物發(fā)病次數(shù)的構(gòu)成比相同。,,7.3.2 2×2列聯(lián)表的精確檢驗(P99),2×2列聯(lián)表的中的任何一格的理論數(shù)都不得小于5,當(dāng)小于
34、5時,需要用精確檢驗。,,N≤40或T≤1,2×2列聯(lián)表概率的計算方法:設(shè)4個格的取值分別為:a,b,c,d。令N=a+b+c+d,事件E為保持各行,列總數(shù)不變,事件F為各格取值為a,b,c,d,則有:,,尾區(qū)建立方法:若a,b,c,d中任何一個為0,則可用上式算出的P值與α或α/2比較。 若各格取值均不為0,按離散分布建立尾區(qū),進(jìn)行統(tǒng)計檢驗。*離散分布尾區(qū)建立原則:從實際觀察值開始,把對H0成立不利的方向上的概率全加起
35、來,作為尾區(qū)的概率。,例7.5 例7.6 P100-101,例見表7-5 P101用不同實驗方法得到結(jié)果,一般不可以累加,但可以將其概率進(jìn)行混合,以便累加得到各方面信息。 例見P102,§7.4、 ?2 的可加性,7.4.1 ?2的齊性檢驗(P101),7.4.2 概率的混合(P102),題,圓粒豌豆與皺粒豌豆雜交,第二代的分離比例為:336粒圓粒對101粒皺粒, 問這種分離比例是否符合孟德爾的3:1分離率?,課后
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 多元分布擬合優(yōu)度檢驗及其應(yīng)用.pdf
- 中小樣本的擬合優(yōu)度檢驗.pdf
- 非參數(shù)似然比擬合優(yōu)度檢驗.pdf
- 基于擬合優(yōu)度檢驗的多元EWMA控制圖.pdf
- 最小非參似然比擬合優(yōu)度檢驗.pdf
- 線性回歸模型誤差分布的擬合優(yōu)度檢驗.pdf
- Logistic總體的參數(shù)估計與擬合優(yōu)度檢驗.pdf
- 擬合優(yōu)度檢驗與統(tǒng)計模型有效性研究.pdf
- 相協(xié)樣本下的似然比檢驗和擬合優(yōu)度檢驗.pdf
- 基于擬合優(yōu)度檢驗的通信信號檢測與識別技術(shù).pdf
- 加權(quán)的ECF型檢驗及其在擬合優(yōu)度中的應(yīng)用.pdf
- 位置-尺度分布族基于逐次定數(shù)截尾樣本的擬合優(yōu)度檢驗.pdf
- 基于Anderson Darling擬合優(yōu)度檢驗的雜波模型辨識技術(shù)研究.pdf
- 多元擬合優(yōu)度檢驗與復(fù)發(fā)事件數(shù)據(jù)統(tǒng)計分析.pdf
- 認(rèn)知無線電中基于擬合優(yōu)度檢驗的頻譜感知技術(shù)研究.pdf
- 基于指數(shù)分布的AD擬合優(yōu)度檢驗頻譜感知技術(shù)研究.pdf
- x2檢驗或卡方檢驗和校正卡方檢驗的計算
- 基于擬合優(yōu)度的股票定價模型及實證研究
- 卡方檢驗結(jié)果分析
- 卡方檢驗 ppt課件
評論
0/150
提交評論