數(shù)理統(tǒng)計課件全集_第1頁
已閱讀1頁,還剩354頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、對隨機現(xiàn)象進(jìn)行觀測、試驗,以取得有代表性的觀測值,對已取得的觀測值進(jìn)行整理、分析,作出推斷、決策,從而找出所研究的對象的規(guī)律性,第一節(jié) 基本概念,一、總體和個體,二、樣本 簡單隨機樣本,一、總體和個體,一個統(tǒng)計問題總有它明確的研究對象.,研究對象的全體稱為總體(母體),,組成總體的每個元素稱為個體.,總體,然而在統(tǒng)計研究中,人們關(guān)心總體僅僅是關(guān)心其每個個體的一項(或幾項)數(shù)量指標(biāo)和該數(shù)量指標(biāo)在總體中的分布情況. 這時,每個個

2、體具有的數(shù)量指標(biāo)的全體就是總體.,所研究的對象的某個(或某些)數(shù)量指標(biāo)的全體稱為總體,它是一個隨機變量(或多維隨機變量),記為X .,X 的分布函數(shù)和數(shù)字特征稱為總體分布函數(shù)和總體數(shù)字特征.,總體:,例如:研究某批燈泡的壽命時,總體X是這批燈泡的壽命,而其中每個燈泡的壽命就是個體。,每個燈泡的壽命,個體,又如:研究某批國產(chǎn)轎車每公里的耗油量時,總體X是這批轎車每公里的耗油量,而其中每輛轎車的耗油量就是個體。,類似地,在研究某地區(qū)中學(xué)生

3、的營養(yǎng)狀況時,若關(guān)心的數(shù)量指標(biāo)是身高和體重,我們用X和Y分別表示身高和體重,那么此總體就可用二維隨機變量(X,Y) 來表示,而每個學(xué)生的身高和體重就是個體.,為推斷總體分布及各種特征,按一定規(guī)則從總體中抽取若干個體進(jìn)行觀察試驗,以獲得有關(guān)總體的信息,這一抽取過程稱為 “抽樣”,所抽取的部分個體稱為樣本. 樣本中所包含的個體數(shù)目稱為樣本容量.,二、樣本 簡單隨機樣本,1)抽樣和樣本,樣本的抽取是隨機的,每個個體是一個隨機變量.容量

4、為n的樣本可以看作n維隨機變量,用X1,X2,…,Xn表示.,而一旦取定一組樣本,得到的是n個具體的數(shù) (x1,x2,…,xn),稱其為樣本的一個觀察值,簡稱樣本值 .,2.X1,X2,…,Xn相互獨立.,由于抽樣的目的是為了對總體進(jìn)行統(tǒng)計推斷,為了使抽取的樣本能很好地反映總體的信息,必須考慮抽樣方法.最常用的一種抽樣方法叫作“簡單隨機抽樣”,它要求抽取的樣本滿足下面兩點:,1. 樣本X1,X2,…,Xn中每一個Xi與所考察的總體X有相

5、同的分布.,2)簡單隨機樣本,由簡單隨機抽樣得到的樣本稱為簡單隨機樣本,它可以用與總體獨立同分布的n個相互獨立的隨機變量X1,X2,…,Xn表示.,簡單隨機樣本是應(yīng)用中最常見的情形,今后,當(dāng)說到“X1,X2,…,Xn是取自某總體的樣本”時,若不特別說明,就指簡單隨機樣本.,設(shè)X1,X2,…,Xn 是總體X的一個簡單隨機樣本,,1)若X為離散型總體,其分布律是p(x),則X1,X2,…,Xn的聯(lián)合分布律為,p(x1) p (x2) … p

6、 (xn),2)若X為連續(xù)型總體,其概率密度是f(x),則X1,X2,…,Xn的聯(lián)合分布律為,f (x1) f (x2) … f (xn),事實上我們抽樣后得到的資料都是具體的、確定的值. 如我們從某班大學(xué)生中抽取10人測量身高,得到10個數(shù),它們是樣本取到的值而不是樣本. 我們只能觀察到隨機變量取的值而見不到隨機變量.,3)總體、樣本、樣本值的關(guān)系,統(tǒng)計是從手中已有的資料 — 樣本值,去推斷總體的情況 — 總體分布F(x)的性

7、質(zhì).,總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷總體.,樣本是聯(lián)系二者的橋梁,4)經(jīng)驗分布函數(shù),設(shè)X1,X2,…,Xn為取自總體X的樣本, x1,x2,…,xn為其觀察值.對于每個固定的x,設(shè)事件{X≤x}在n次觀察中出現(xiàn)的次數(shù)為vn(x),于是事件{X≤x}發(fā)生的頻率為:,顯然Fn(x)為不減右連續(xù)函數(shù),且,稱 Fn(x) 為樣本分布函數(shù)或經(jīng)驗分布函數(shù).,定理(格列文科)當(dāng)n→∞時,經(jīng)驗分布函

8、數(shù) Fn(x) 依概率1關(guān)于x一致收斂與總體分布函數(shù),即,定理表明:當(dāng)樣本容量n充分大時,經(jīng)驗分布函數(shù) Fn(x) 幾乎一定會充分趨近總體分布函數(shù)F(x),這是用樣本來推斷總體的理論依據(jù).,第二節(jié) 統(tǒng)計量與抽樣分布,一、統(tǒng)計量,二、統(tǒng)計學(xué)中三個常用分布和上α分位點,三、抽樣分布定理,一、統(tǒng)計量,由樣本值去推斷總體情況,需要對樣本值進(jìn)行“加工”,這就要構(gòu)造一些樣本的函數(shù),它把樣本中所含的(某一方面)信息集中起來.,定義,若 ? ,?

9、 2 已知, 則,是統(tǒng)計量,而,例如:,不是統(tǒng)計量.,也是統(tǒng)計量.,是未知參數(shù),,幾個常用的統(tǒng)計量,樣本均值,樣本方差,它反映了總體均值的信息,它反映了總體方差的信息,樣本k階原點矩,樣本k階中心矩,k=1,2,…,它反映了總體 k 階矩的信息,它反映了總體 k 階中心矩的信息,它們的觀察值分別為:,由大數(shù)定律可知:,依概率收斂于,例1. 從一批相同的電子元件中隨機地抽出8個,測得使用壽命(單位:小時)分別為:2300,243

10、0,2580,2400,2280,1960,2460,2000,試計算樣本均值、樣本方差及樣本二階矩.,解:,抽樣分布,統(tǒng)計量是樣本的函數(shù),而樣本是隨機變量,故統(tǒng)計量也是隨機變量,因而就有一定的分布,它的分布稱為“抽樣分布” .,二、統(tǒng)計學(xué)中三個常用分布和上α分位點,下面介紹三個來自正態(tài)總體的抽樣分布.,,,定義: 設(shè) 相互獨立,都服從標(biāo)準(zhǔn)正態(tài)分布,N(0,1), 則稱隨機變量:,所服從的分布為自由度為 n 的

11、 分布,記為,分布的概率密度為,,,處的值.,有所改變.,分布的概率密度圖形如下:,,性質(zhì)1.,證 明:,設(shè),相互獨立,則,分布的性質(zhì):,,,這個性質(zhì)稱為 分布的可加性.,性質(zhì)2.,設(shè),且,與,相互獨立,則,t 的概率密度為:,,,定義: 設(shè)X~N( 0 , 1 ) , Y~,所服從的分布為自由度為 n 的 t 分布.記為t~t (n).,2、t 分布,,且 X 與 Y 相互,獨立,則稱變量,,,,n=4,n=10,n=1,,

12、,,,,,,t分布的概率密度函數(shù)關(guān)于t=0對稱,且當(dāng)n充分大時(n≥30),其圖形與標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)的圖形非常接近.但對于較小的n,t 分布與N (0,1)分布相差很大.,,,由定義可見,,,3、F分布,則稱統(tǒng)計量,服從自由度為n1及 n2 的F分布,n1稱為第一自由度,,,~F(n2,n1),定義: 設(shè),X 與 Y 相互獨立,,n2稱為第二自由度,記作 F~F(n1,n2) .,,,,,,若X~F(n1,n2),則

13、X的概率密度為,,,,,,,注意:統(tǒng)計的三大分布的定義、基本性質(zhì)在后面的學(xué)習(xí)中經(jīng)常用到,要牢記??!,4、上α分位點,定義:設(shè)隨機變量X的概率密度為 f(x),對于,任意給定的α(0<α<1),若存在實數(shù)xα,使得:,則稱點xα為該概率分布的上α分位點,正態(tài)分布的上α分位點,對標(biāo)準(zhǔn)正態(tài)分布變量Z~N(0, 1)和給定的?,上?分位數(shù)是由:,P{Z≥z?} =,即 P{Z<z?} =1-?,?(z?) =1-?,確定點z

14、?.,如圖:,例如, ?=0.05,而,P{Z≥1.645} =0.05,所以, z0.05 =1.645.,說明:,1) 除標(biāo)準(zhǔn)正態(tài)分布外, 分布、t分布、F分布的上? 分位點都有表可查.,,2)對于 分布,當(dāng)n充分大時(n>45),,其中Zα是標(biāo)準(zhǔn)正態(tài)分布的上α分位點,3)對于 t 分布,,a)由其對稱性,有:,,b) 當(dāng)n充分大時(n>45),,,4)對于F分布,有:,例2. 查表求下列值:,,,解:

15、,,,,例3.設(shè)總體X和Y相互獨立,同服從,分布,而 X1,X2,…, X9 和 Y1,Y2,…, Y9,的分布.,分別是來自X和Y的簡單隨機樣本,求統(tǒng)計量,解:,,X1,X2,…,X15是來自X的簡單隨機樣本,求,解:,試確定常數(shù) c ,使,解:,故,因此,當(dāng)總體為正態(tài)分布時,教材上給出了幾個重要的抽樣分布定理.這里我們不加證明地敘述.,三、抽樣分布定理,(1)樣本均值,(2)樣本均值 與樣本方差 相互獨立。,(3)隨機變量,

16、定理 2 設(shè)X1,X2,…,Xn是取自正態(tài)總體,則有,定理 3 (兩個總體樣本均值差的分布),且X與Y獨立,,分別是這兩個樣本的樣本方差,則有,定理 4 (兩個總體樣本方差比的分布),且X與Y獨立,,分別是這兩個樣本的樣本方差,則有,上述4個抽樣分布定理很重要,要牢固掌握.,,,,的概率不小于90%,則樣本容量至少取多少?,解:設(shè)樣本容量為 n , 則,令,得,即,所以至少取,n = 20的樣本,解: (1),即,故,(2),故,3 掌

17、握給出的四個抽樣分布定理。,第六章 小 結(jié),1.給出了總體、個體、樣本和統(tǒng)計量的概念,要掌,2.給出了 分布、t分布、F分布的定義和性質(zhì),要會,查表求其上α分位點。,握樣本均值和樣本方差的計算及基本性質(zhì)。,附: 幾種重要隨機變量的數(shù)學(xué)期望和方差,一.二點分布,二.二項分布,三.泊松分布,四.均勻分布,五.正態(tài)分布,六.指數(shù)分布,一.二點分布,若隨機變量X服從二點分布,其分布律為:,二.二項分布,隨機變量X~B(n,p),其分布

18、律為:,由二項分布定義可知,X是n重貝努利試驗中事件A發(fā)生的次數(shù),且在每次試驗中A發(fā)生的概率為p,設(shè),則Xk服從二點分布,其分布律為:,若隨機變量X~B( n , p ),則,即:,三.泊松分布,隨機變量 ,其分布律為:,即:,若隨機變量X~π(λ),則,四.均勻分布,設(shè)隨機變量X在區(qū)間(a,b)上服從均勻分布,其概率密度為,即,若隨機變量X~U( a , b ),則,五.正態(tài)分布,隨機變量 ,其

19、概率密度為:,(令 ),(令 ),即,若隨機變量X~N(μ,σ2 ), 則,六.指數(shù)分布,隨機變量X服從參數(shù)為λ的指數(shù)分布,其概率密度為:,若隨機變量X服從參數(shù)為λ的指數(shù)分布,則,即,例1.已知 求,解:,則,解:,X在區(qū)間(1,5)上服從均勻分布,,例2.已知X和Y相互獨立,且X在區(qū)間(1,5)上服從均勻分布, 求(1) (X,Y)的概率密度;

20、(2),由X和Y相互獨立得:,概率論中用來闡明大量隨機現(xiàn)象平均結(jié)果的穩(wěn)定性的一系列定理,稱為大數(shù)定律,第一節(jié) 大數(shù)定律,一個常數(shù),若對于任給的正數(shù)?>0, 總成立,隨機變量序列依概率收斂于常數(shù),定義,設(shè),是一個隨機變量序列, a 是,則稱 隨機變量 序列,依概率收斂于a,,記為,性質(zhì),設(shè)n重貝努里試驗中事件A發(fā)生的次數(shù)為μn,A在每次試驗中發(fā)生的概率為 p ,則對任給的ε>0,總成立,定理1(貝努利大數(shù)定律),即:,三個常

21、見的大數(shù)定律,貝努里大數(shù)定律的意義,貝努里大數(shù)定律提供了通過試驗來確定事件概率的方法.,定理2(契比雪夫大數(shù)定律的特殊情形),設(shè)隨機變量序列X1,X2, …相互獨立,并且具有相同的數(shù)學(xué)期望和方差,E(Xi)=μ,D(Xi)=σ2,i=1,2, …,則對任給的ε>0,總成立,即,定理2的意義,具有相同數(shù)學(xué)期望和方差的獨立隨機變量序列的算術(shù)平均值依概率收斂于數(shù)學(xué)期望.當(dāng) n 足夠大時, 實驗結(jié)果的算術(shù)平均幾乎是一常數(shù).,因此,在實際應(yīng)

22、用中,當(dāng)試驗次數(shù)足夠大時,可用獨立重復(fù)試驗結(jié)果的算術(shù)平均數(shù)來估計隨機變量的數(shù)學(xué)期望.,定理3(契比雪夫大數(shù)定律的一般情形),設(shè)隨機變量序列X1,X2, …相互獨立,它們都具有數(shù)學(xué)期望:E(Xi)=μi,并且都具有被同一常數(shù)C所限制的方差:D(Xi)= 0,總成立,即,定理3的意義,設(shè)隨機變量序列X1,X2, …相互獨立,服從同一分布,具有相同的數(shù)學(xué)期 望E(Xi)=μ, i=1,2,…, 則對于任給正數(shù)ε >0 ,總成立

23、,定理4 (辛欽大數(shù)定律),即,即,這一節(jié)我們介紹了大數(shù)定律,大數(shù)定律以嚴(yán)格的數(shù)學(xué)形式表達(dá)了隨機現(xiàn)象最根本的性質(zhì)之一:,它是隨機現(xiàn)象統(tǒng)計規(guī)律的具體表現(xiàn).在理論和實際中都有廣泛的應(yīng)用.,平均結(jié)果的穩(wěn)定性,第二節(jié) 中心極限定理,客觀背景:客觀實際中,許多隨機變量是由大量相互獨立的偶然因素的綜合影響所形成,每一個微小因素,在總的影響中所起的作用是很小的,但總起來,卻對總和有顯著影響,這種隨機變量往往近似地服從正態(tài)分布。,概率論中有關(guān)

24、論證獨立隨機變量的和的極限分布是正態(tài)分布的一系列定理稱為中心極限定理。,由于無窮個隨機變量之和可能趨于∞,故我們不研究n個隨機變量之和本身而考慮它的標(biāo)準(zhǔn)化的隨機變量,的極限分布.,下面介紹常用的三個中心極限定理。,定理1(獨立同分布下的中心極限定理),設(shè)X1,X2, …是獨立同分布的隨機變量序列,且E(Xi)=μ,D(Xi)=σ2,i=1,2,…,則,定理表明:當(dāng)n充分大時,標(biāo)準(zhǔn)化隨機變量,近似服從標(biāo)準(zhǔn)正態(tài)分布.,由此可知:對于獨立的隨

25、機變量序列 ,不管 服從什么分布,只要它們是同分布,且有有限的數(shù)學(xué)期望和方差,那么,當(dāng)n充分大時,這些隨機變量之和 近似地服從正態(tài)分布,解:設(shè) X k 表示第 k 次轟擊命中的炮彈數(shù),,設(shè) X 表示100次轟擊命中的炮彈數(shù),則,由獨立同分布中心極限定理, 有,則,(1),(2),例2.一食品店有三種蛋糕出售,由于售出哪一種蛋糕是隨機的,因而售出一只蛋糕的價格是一個隨機變量,它取1(元),1.2

26、 (元),1.5(元)各值的概率分別為0.3,0.2,0.5.某天售出300只蛋糕.求這天的收入至少達(dá)400 (元)的概率,解:設(shè)第i只蛋糕的價格為Xi,i=1,2,…,300,則Xi的分布律為,由獨立同分布中心極限定理知:,即,定理2(德莫佛-拉普拉斯中心極限定理),設(shè)n重貝努利試驗中事件A發(fā)生的次數(shù)為μn,事件A在每次試驗中發(fā)生的概率為p,則對于任給實數(shù)x,總成立,定理表明:若 服從二項分布,當(dāng)n很大時,,由此可知:當(dāng)n很大,0

27、<p<1是一個定值時(或者說,np(1-p)也不太小時),服從二項分布B(n,p)的隨機變量 近似服從正態(tài)分布 N(np,np(1-p)).,分布.,例3 某次課堂測驗,有200道選擇題,每一題有4個答案.試問一位完全不會的學(xué)生,想憑著猜測的方法回答此200題中的80題,而答對25題至30題的概率是多少?,設(shè)答對的題數(shù)為X,則,解:,X~B(80,0.25),,例4 某電視機廠每周生產(chǎn)10000臺電視機,但它的顯像管車

28、間的正品率為0.8,為了能以0.997的概率保證出廠的電視機都裝上正品顯像管,該車間每周應(yīng)生產(chǎn)多少只顯像管?,解:設(shè)該車間每周生產(chǎn)n只顯像管,其中正品的個數(shù)為X,則,X~B(n,0.8),,即:,查表,知,從而得:,即該車間每周至少應(yīng)生產(chǎn)12655只顯像管,才能以0.997的概率保證出廠的電視機都裝上正品顯像管.,定理3 (李雅普諾夫中心極限定理),,則,第一節(jié) 參數(shù)估計的意義和種類,一、參數(shù)估計問題,二、未知參數(shù)的估計量和估計值

29、,三、參數(shù)估計的種類,數(shù)理統(tǒng)計的基本問題是根據(jù)樣本提供的信息,對總體的分布以及分布的某些數(shù)字特征作出推斷。這個問題中的一類是總體分布的類型為已知,而它的某些參數(shù)為未知,根據(jù)所得樣本對這些參數(shù)作出推斷,這類問題稱為參數(shù)估計。如:,一、 參數(shù)估計問題,已知顯象管的使用壽命服從指數(shù)分布,但參數(shù)θ未知,現(xiàn)抽樣得樣本X1 , X2 , … , Xn ,依據(jù)某理論(后述)用樣本來估計參數(shù)θ.這就是參數(shù)估計問題.,二、 未知參數(shù)的估計量和估計值,樣本

30、X1 , X2 , … , Xn ,樣本值x1 , x2 , … , xn .,設(shè)有一個總體X,其分布函數(shù)為 F(x,θ),其中θ為,未知參數(shù) (θ也可以是未知向量).現(xiàn)從該總體抽樣,得,g(X1,X2,…Xn)為θ的估計量, 將樣本值x1 , x2 , … , xn,若構(gòu)造出適當(dāng)?shù)慕y(tǒng)計量 g(X1,X2,…Xn) 來估計θ,則稱,代入,則稱g(x1,x2,…xn)為θ的估計值.,估計未知參數(shù)的值,估計未知參數(shù)的取值范圍,并使此范圍包

31、含未知參數(shù)真值的概率為給定的值.,三、 參數(shù)估計的種類,設(shè)這5個數(shù)是:,1.65 1.67 1.68 1.78 1.69,若估計μ為1.68,,這是點估計.,這是區(qū)間估計.,若估計μ在區(qū)間(1.57, 1.84)內(nèi),,現(xiàn)從該總體選取容量為5的樣本,我們的任務(wù)是要,例如:我們要估計某隊男生的平均身高.,且假定身高服從正態(tài)分布,根據(jù)選出的樣本值(5個數(shù))求出總體均值μ的估計值.,而全部信息就由這5個數(shù)組成 .,一、矩估計法,第

32、二節(jié) 點估計的求法,二、極大似然估計法,一. 矩估計法,理論依據(jù):,記總體k階矩為,樣本k階矩為,(辛欽大數(shù)定律及其推論),則樣本 k 階矩 依概率收斂于總體 k 階矩 .,方法:,出待估參數(shù).,建立含有待估參數(shù)的方程, 從而解,樣本 X1, X2,…, Xn的前 k 階矩記為,步驟:,設(shè)總體的分布函數(shù)的形式已知,待估參數(shù)為,總體的前 k 階矩存在.,(1)求出總體的前 k 階矩,一般是這 k 個參數(shù)的函,函

33、數(shù),記為:,7-12,(3)解此方程組 , 得 k 個統(tǒng)計量:,稱為未知參數(shù) ?1, ?,?k 的矩估計量,,這是含未知參數(shù) ?1,?2, ?,?k 的k個方程構(gòu)成的方程組,,(2)令,7-12,代入樣本值,得 k 個數(shù):,,稱為未知參數(shù) ?1, ?,?k 的矩估計值,例1.設(shè)總體 X ~ B( m, p), 其中p 未知, X1, X2,…, Xn為總體的樣本, 求p 的矩估計量.,解:,令,7-13,得,總體矩,樣本矩,例2

34、.設(shè)總體X的概率密度為,解:,X1, … , Xn為樣本,求參數(shù)? 的矩估計.,令,得,總體矩,樣本矩,例3.設(shè)X1,X2,…Xn是取自總體X的一個樣本,其中θ>0, 求θ,μ的矩估計.,解:,,令,,,解得,用樣本矩估計總體矩,,,由課文本節(jié)例1知:,例4.設(shè)從某燈泡廠某天生產(chǎn)的燈泡中隨機抽取10只燈泡,測得其壽命為(單位:小時)1050, 1100, 1080, 1120, 1200,1250, 10

35、40, 1130, 1300, 1200,試用矩法估計該廠這天生產(chǎn)的燈泡的平均壽命及壽命分布的方差.,解:,7-14,二、 極大似然估計法,即:在一次試驗中,概率最大的事件最有可能發(fā)生.,引例: 有兩個外形相同的箱子,各裝100個球,一箱中,取得的球是白球.問: 所取的球來自哪一箱?,答: 第一箱.,中有99個白球1個紅球,一箱中有1個白球99個紅球。,現(xiàn)從兩箱中任取一箱, 并從箱中任取一球,結(jié)果所,一般說,若事件A發(fā)生的概

36、率與參數(shù)???有關(guān),? 取值不同,P(A)也不同。則應(yīng)記事件A發(fā)生的概率為P(A|? ).若一次試驗,事件A發(fā)生了,可認(rèn)為此時的? 值應(yīng)是在?中使P(A|? ) 達(dá)到最大的那一個。這就是極大似然原理.,(極大似然原理),極大似然估計法的理論依據(jù):,X1,X2,…Xn是取自總體X的樣本,x1 , x2 , … xn是樣本值.,則樣本的聯(lián)合分布律為:,似然函數(shù):,1. X是離散型總體,其分布律為:,記,2. X是連續(xù)型總體,其概率密度為,為

37、其樣本的似然函數(shù).,則稱,該樣本值出現(xiàn)的可能性大小.,極大似然估計的方法:,對于給定的樣本值x1 , x2 , … ,xn ,選取,使得,7-22,稱為未知參數(shù) ?1, ?,?k 的極大似然估計值,,這樣得到的估計值,對應(yīng)的統(tǒng)計量,稱為未知參數(shù)?1,?,?k 的 極大似然估計量,,(1) 由總體分布和所給樣本,求得似然函數(shù),步驟:,同時取得最大值),(3) 解方程組,7-12,(4) 得未知參數(shù)?1, ?,?k的極大似然估計值,

38、,及其對應(yīng)的極大似然估計量,,7-12,若待估參數(shù)只有一個,則似然函數(shù)是一元函數(shù)L(θ),此時,只須將上述步驟中求偏導(dǎo)改為求導(dǎo)即可。,說明:,布,求參數(shù)λ的極大似然估計量,解:,的樣本,樣本觀察值為,,,,由X 服從泊松分布,得X的分布律為,似然函數(shù)為,,,,兩邊取對數(shù),得,=0,得,對λ求導(dǎo),并令其為0,,所以參數(shù)λ的極大似然估計量為:,,其中λ> 0,總體X 的樣本值,求參數(shù)λ的極大似然估計值.,例6. 設(shè)總體X的概率密度為,

39、解:,兩邊取對數(shù),得,對λ求導(dǎo),并令其為0,,得,這就是λ的極大似然估計值.,解:,兩邊取對數(shù),得,對θ求導(dǎo),并令其為0,,=0,所以θ的極大似然估計值為,1.可證明極大似然估計具有下述性質(zhì):,設(shè)θ的函數(shù)g=g(θ)是 上的實值函數(shù),且有唯一反函數(shù) . 如果 是θ的極大似然估計,則g( )也是g(θ )的極大似然估計.,關(guān)于極大似然估計的兩點說明:,此性質(zhì)稱為極大似然估計的不變性,例8. 設(shè)X1 X2 ,… ,Xn為取

40、自參數(shù)為θ的指數(shù)分布總體的樣本,a>0為一給定實數(shù)。求p=P{X<a}的極大似然估計,解:,概率密度和分布函數(shù)分別為,由總體X服從參數(shù)為θ的指數(shù)分布知, X 的,兩邊取對數(shù),得,對θ求導(dǎo),并令其為0,,得θ的極大似然估計值為,因為,所以,p=P{X<a}的極大似然估計值為,2、當(dāng)似然函數(shù)不是可微函數(shù)時,須用極大似然原理來求待估參數(shù)的極大似然估計.,例9. 設(shè) X ~ U (a,b), x1, x2,…, xn 是 X

41、 的一個樣本值, 求 a , b 的極大似然估計值與極大似然估計量.,解:,由X ~ U (a,b)知,X 的密度函數(shù)為,似然函數(shù)為,似然函數(shù)只有當(dāng) a < xi < b, i = 1,2,…, n 時才能獲得最大值, 且 a 越大, b 越小, L(a,b) 越大.,令,xmin = min {x1, x2,…, xn}xmax = max {x1, x2,…, xn},取,都有,故,是 a , b 的極大似然估計值.

42、,分別是 a , b 的極大似然估計量.,,其中,例10. 設(shè)總體X的概率密度為,解:,令,得θ的矩估計值:,(1)矩估計,兩邊取對數(shù),得,(2)極大似然估計,得θ的極大似然估計值:,對θ求導(dǎo),并令其為0,,通過例10可見,對同一個待估參數(shù),用不同的方法進(jìn)行點估計,可能得到不同的估計量.這樣就有必要判斷哪一個估計量更好,這就是下一節(jié)要講的內(nèi)容:,評價估計量優(yōu)良性的標(biāo)準(zhǔn),一、無偏性,二、有效性,三、一致性,第三節(jié) 估計量的評選標(biāo)準(zhǔn)

43、,一、無偏性,隨機變量,每次抽樣后得到的θ的估計值不一定與,提出了無偏性的衡量標(biāo)準(zhǔn)。,定義:,是? 的無偏估計量.,總體X服從什么分布,樣本的 k 階矩,是總體X的 一個樣本,試證明:不論,證明:,由于X1,X2,…,Xn和總體X同分布,因而,的無偏估計,例2.設(shè)總體X的期望與方差存在,X 的樣本為,(1) 不是 D( X )的無偏估量;,(2)

44、 是 D( X )的無偏估計量.,證明:,先證明,所以,因而,所以 不是 D( X )的無偏估計量;,,所以 是 D( X )的無偏估計量.,是λ的無偏估計,并對于任一值α,也是λ的無偏估計.,證明:,由上例可知:,又,則,由上例我們可知,一個未知參數(shù)有時會有多個無偏估計,這就

45、又產(chǎn)生了一個問題:哪一個無偏估計量更優(yōu)呢?,設(shè) 和 都是θ的無偏估計量,即兩個估計量,小的那一個,這就有了有效性的衡量標(biāo)準(zhǔn).,都是總體參數(shù)? 的無偏估計量, 且,則稱 比 更有效.,設(shè),二、有效性,定義,(2)試判斷g1和g2哪一個更有效?,,,,例4.已知總體的數(shù)學(xué)期望 和方差 都存在, X1,X2,X3是總體的樣本.設(shè),(1)證明g1和g2都是 的無偏估計,,,,解:,(1),所以,

46、g1 和g2 都是 的無偏估計,,,,(2),因為,所以g1較g2更有效.,,,,(2)求常數(shù) k1和 k2,使得它在所有形如的無偏估計量中方差最小.,(1)常數(shù)k1和k2為何值時, 也是θ的無偏估計量.,例5.設(shè) 和 是參數(shù)θ的兩個相互獨立的無偏估計量,且 的方差為 的方差的兩倍.,解:,由題意知:,(1),令,得,(2),羅—克拉美(Rao

47、 – Cramer)不等式,其中 p ( x , ? ) 是 總體 X 的分布律或概率密度,稱,計量, 此時稱 為最有效的估計量, 簡稱有效估計量.,為方差的下界.,當(dāng) 時, 稱 為? 的達(dá)到方差下界的無偏估,證明: 因為總體X是(0-1)分布,即:,而,且,又,,,參數(shù)? 的估計量是樣本的函數(shù),與樣本容量n 有關(guān),我們當(dāng)然希望,樣本容量n 越大,估計量與參數(shù)? 的真值的偏差

48、越小.這就有了一致性的衡量標(biāo)準(zhǔn).,三、一致性,設(shè) 是總體參數(shù)? 的估計量.,定義,即對于任意正數(shù)ε,有,一致性是對一個估計量的基本要求,若估計量不具有一致性,那么不論將樣本容量 n 取得多么大,都不能將θ估計得足夠準(zhǔn)確,這樣的估計量是不可取的.,證明:,由總體X服從參數(shù)為 的指數(shù)分布可知:,而,故 是 的有效無偏估計量.,又由辛欽大數(shù)定律可知:,所以

49、 是? 的無偏、有效、一致估計量.,關(guān)于一致性的兩個常用結(jié)論,1. 樣本 k 階矩是總體 k 階矩的一致估計量.,一般,矩估計法得到的估計量為一致估計量.,我們已講了參數(shù)的點估計以及評價估計量優(yōu)良性的標(biāo)準(zhǔn),參數(shù)的點估計是用一個確定的值去估計未知的參數(shù). 但是,估計值與參數(shù)真值的誤差有多大?估計值的可靠性有多大?這些問題在點估計中是無法回答的。這就需要引入?yún)^(qū)間估計. 也就是下一節(jié)要講的內(nèi)容 .,,,,一、假設(shè)檢驗問題的提出,二、顯著性檢

50、驗的推理方法和基本步驟,三、兩類錯誤,第一節(jié) 假設(shè)檢驗的基本概念,,假設(shè)檢驗是統(tǒng)計推斷中另一類重要內(nèi)容。它是在總體分布未知或雖知其分布類型但含有未知參數(shù)的時候,提出有關(guān)總體分布或分布中某些未知參數(shù)的假設(shè)。然后根據(jù)樣本所提供的信息,推斷假設(shè)是否合理,并作出接受或拒絕所提出假設(shè)的決定。,為了具體了解假設(shè)檢驗解決哪些類型的問題,下面看幾個例子:,一、假設(shè)檢驗問題的提出,產(chǎn)記錄中隨機地抽取 n=25 的樣本,算得平均含硅,例1. 某煉鐵廠生產(chǎn)的

51、生鐵含硅量X服從正態(tài)分布,N(0.005,0.032)?,F(xiàn)改變原料,并從改變原料后的生,后生鐵含硅量的均值有無顯著變化?,量 ,均方差σ沒有改變,問改變原料,此實例的問題是:根據(jù)抽樣的結(jié)果推斷假設(shè)“ ”是否為真。,此實例的問題是:根據(jù)抽樣的結(jié)果來推斷假設(shè)“總體服從泊松分布”是否為真。,實例2.某電話交換臺在一分鐘內(nèi)得到的呼喚次數(shù),統(tǒng)計的記錄如下:,試檢驗電話呼喚次數(shù) X 是

52、否服從泊松分布?,總體分布已知,對未知參數(shù)提出的假設(shè)進(jìn)行檢驗.,總體分布未知,對總體分布形式或類型的假設(shè)進(jìn)行檢驗.,參數(shù)假設(shè)檢驗:,非參數(shù)假設(shè)檢驗:,假設(shè)檢驗的種類,,,在假設(shè)檢驗問題中,把要檢驗的假設(shè)稱為原假設(shè)(零假設(shè)或基本假設(shè)),記為H0,把原假設(shè)的對立面稱為備擇假設(shè)或?qū)α⒓僭O(shè),記為H1 。原假設(shè) H0和備擇假設(shè) H1兩者中必有且僅有一個為真。,,,二、顯著性檢驗的推理方法和基本步驟,實例.某廠生產(chǎn)的螺釘,按標(biāo)準(zhǔn),平均強度應(yīng)為68m

53、m, 實際生產(chǎn)的強度X 服從N(?,3.62 ),現(xiàn)從整批螺釘中取容量為 n=36的樣本,其均值為 ,問這批螺釘是否符合要求?,若?=68,則認(rèn)為這批螺釘符合要求,否則認(rèn)為不符合要求.為此提出如下假設(shè):,原假設(shè),備擇假設(shè),若原假設(shè)H0正確, 則,因而,應(yīng)是小概率事件.,應(yīng)較集中在零的周圍.即,取較大值,標(biāo)準(zhǔn)化后,,偏離68不應(yīng)該太遠(yuǎn),,乎不發(fā)生的.,根據(jù)小概率原理,小概率事件在一次試驗中是幾,那么,概率小到

54、什么程度才能算作“小概率事件”呢?,此小概率記為α,一般取為0.1,0.05,0.01等.,為此,可以確定一個常數(shù)c 使得,然后,計算,若,即一次試驗小概率事件就發(fā)生了,可以認(rèn)為,原假設(shè)不合理,拒絕原假設(shè)H0而接受備擇假設(shè)H1.否,則,接受原假設(shè)H0而拒絕備擇假設(shè)H1.此時,稱區(qū)間,為的H0的拒絕域.,,,,現(xiàn)取 ,,原假設(shè)為真時,,因為小概率事件沒發(fā)生,無理由認(rèn)為原假設(shè)不合理,,所以,接受原假設(shè)H0,認(rèn)為這批螺釘是符合要

55、求的.,所以,(稱U為檢驗統(tǒng)計量),由此例可見:,1.假設(shè)檢驗的理論依據(jù):,實際推斷原理(小概率原理),小概率事件在一次試驗中幾乎是不可能發(fā)生的,2. 假設(shè)檢驗是概率意義下的反證法.即:,首先假定原假設(shè)H0成立,依照事先給定的概率α(稱為顯著性水平),構(gòu)造一個小概率事件。然后根據(jù)抽樣的結(jié)果,觀察此小概率事件是否發(fā)生。若此小概率事件發(fā)生了,則認(rèn)為原假設(shè)是不真的,從而作出拒絕H0的判斷。否則,就接受H0。,由此可見:,拒絕原假設(shè)是有說服力的

56、, 而接受原假設(shè)是沒有說服力的.,3.不否定H0并不是肯定H0一定對,而只是說差異還不夠顯著,還沒有達(dá)到足以否定H0的程度.,因此應(yīng)把希望否定的假設(shè)作為原假設(shè).,假設(shè)檢驗的一般步驟:,(1) 根據(jù)實際問題的要求,充分考慮和利用已知的背景知識,提出原假設(shè)H0及備擇假設(shè)H1 ;,(2) 給定顯著性水平α,選取檢驗統(tǒng)計量,并確定其分布;,(3) 由P{拒絕H0 | H0為真}=α確定H0的拒絕域的形式;,(4) 由樣本值求得檢驗統(tǒng)計量的觀察值

57、,若觀察值在拒絕域內(nèi),則拒絕原假設(shè)H0 ,否則接受原假設(shè)H0 .,第一類錯誤(棄真錯誤):,第二類錯誤(取偽錯誤):,三、兩類錯誤,原假設(shè)H0為真,但拒絕了原假設(shè)H0 .,原假設(shè)H0不真,但接受了原假設(shè)H0 .,P{拒絕H0|H0為真}=α,,P{接受H0|H0不真}= β.,顯然,顯著性水平α為犯第一類錯誤的概率.,記,處理原則:,任何檢驗方法都不能完全排除犯錯誤的可能性.理想的檢驗方法應(yīng)使犯兩類錯誤的概率都很小,但在樣本容量固定時,

58、一類錯誤概率的減少必會導(dǎo)致另一類錯誤概率的增加.,控制犯第一類錯誤的概率?,然后,若有必要,通過增大樣本容量的方法來減少犯第二類錯誤的概率? .,關(guān)于原假設(shè)與備擇假設(shè)的選取,H0與H1地位應(yīng)平等,但在控制犯第一類錯誤的概率 ? 的原則下,使得采取拒絕H0 的決策變得較慎重,即H0 得到特別的保護(hù).因而通常把有把握的、有經(jīng)驗的結(jié)論作為原假設(shè),或者盡可能使后果嚴(yán)重的錯誤成為第一類錯誤.,注:,一、單一正態(tài)總體均值μ的假設(shè)檢驗,二、單一正態(tài)總

59、體方差σ2的假設(shè)檢驗,三、兩個正態(tài)總體均值的假設(shè)檢驗,四、兩個正態(tài)總體方差的假設(shè)檢驗,第二節(jié) 正態(tài)總體的假設(shè)檢驗,,,,,,,,,,,,,,,,一、單一正態(tài)總體均值μ的假設(shè)檢驗,1.已知 時,總體均值μ 的假設(shè)檢驗,(1) μ的雙邊檢驗:,設(shè)總體X~N (?, ? 2). X1 , X2 , … , Xn是取自X的樣本,,樣本均值 樣本方差S2,原假設(shè),備擇假設(shè),取檢驗統(tǒng)計量:,則拒絕域為:,,,,,,,,,,

60、,,,,,,~N(0, 1),當(dāng)H0為真時,,此時,因為 是μ0的無偏估計量, 不應(yīng)太大.,P{拒絕H0|H0為真},所以,即:,由此知,拒絕域為:,推導(dǎo):,,,,,,,,,,,,,,,,(2) μ的單邊檢驗:,原假設(shè),備擇假設(shè),檢驗統(tǒng)計量:,拒絕域為:,統(tǒng)計中把拒絕域在某個區(qū)間的兩側(cè)的檢驗稱為雙邊檢驗(這里是區(qū)間 的兩側(cè)),(a),(證明略),,,,

61、,,,,,,,,,,,,原假設(shè),備擇假設(shè),檢驗統(tǒng)計量:,拒絕域為:,統(tǒng)計中把拒絕域在某個區(qū)間的某一側(cè)的檢驗稱為單邊檢驗(這里是區(qū)間 的某一側(cè)),(b),這里由于使用的是服從正態(tài)分布的 U 統(tǒng)計量來進(jìn)行檢驗,也稱為U 檢驗法(或正態(tài)檢驗法)。,? ? ?0,? ??0,? ? ?0,? ? ?0,? < ?0,? > ?0,U 檢驗法 (?02已知),,雙邊檢驗,單邊檢驗,?

62、 ? ?0,? ??0,? ? ?0,? ? ?0,? < ?0,? > ?0,T 檢驗法 (? 2 未知),,雙邊檢驗,單邊檢驗,2. 未知時,總體均值 μ 的假設(shè)檢驗,,,,例1. 設(shè)某次考試的考生的成績服從正態(tài)分布,從中隨機地抽取36位考生的成績,算得平均成績?yōu)?6.5分,標(biāo)準(zhǔn)差為15分,問在顯著性水平0.05下,是否可以認(rèn)為在這次考試中全體考生的平均成績?yōu)?0分?,解:,原假設(shè),備擇假設(shè),檢驗統(tǒng)計量:,拒絕域:,

63、,,,n=36, α=0.05,,所以接受H0,,在顯著性水平0.05下,可以認(rèn)為在這次考試中全體考生的平均成績?yōu)?0分。,因為,解:,,,,原假設(shè),備擇假設(shè),由σ2 =0.022知,檢驗統(tǒng)計量為,拒絕域:,例2.一臺機床加工軸的橢圓度 X 服從正態(tài)分布N(0.095,0.022)(單位:mm)。機床經(jīng)調(diào)整后隨機取20根測量其橢圓度,算得 mm 。已知總體方差不變,問調(diào)整后機床加工軸的橢圓度的均

64、值有無顯著降低?,,,,n=20,α=0.05,,所以接受H0,,在顯著性水平0.05下,認(rèn)為調(diào)整后機床加工軸的橢圓度的均值無顯著降低.,因為,例3.某種電子元件,要求使用壽命不得低于1000 小時。現(xiàn)從一批這種元件中隨機抽取25 件,測其壽命,算得其平均壽命950小時,設(shè)該元件的壽命X~N(μ,1002),在顯著性水平0.05下,確定這批元件是否合格?,解:,,,,原假設(shè),備擇假設(shè),由σ2 =1002知,檢驗統(tǒng)計量為,拒絕域:,,,,

65、n=25 , α=0.05,,所以拒絕H0,,在顯著性水平0.05下,認(rèn)為這批元件不合格.,因為,χ2 檢驗法,,雙邊檢驗,單邊檢驗,1.已知 時,總體方差σ2的假設(shè)檢驗,二、單一正態(tài)總體方差σ2的假設(shè)檢驗,,,,,,,,,,,,,,,,當(dāng)H0為真時,,P{拒絕H0|H0為真},所以拒絕域為:,推導(dǎo)(雙邊檢驗情形) :,此時,因為 是σ2的無偏估計量,,拒絕域

66、應(yīng)表現(xiàn)為 偏小或偏大,,χ2 檢驗法,,雙邊檢驗,單邊檢驗,2. μ未知時,總體方差σ2的假設(shè)檢驗,例4. 在生產(chǎn)線上隨機地取10只電阻測得電阻值(單位:歐姆)如下:114.2,91.9,107.5,89.1,87.2,87.6,95.8 ,98.4,94.6,85.4設(shè)電阻的電阻值總體服從正態(tài)分布,問在顯著性水平α=0.1下方差與60是否有顯著差異?,解:,原假設(shè),備擇

67、假設(shè),檢驗統(tǒng)計量:,拒絕域:,n=10 ,α=0.1,,所以接受H0,,因為,即在顯著性水平α=0.1下,認(rèn)為方差與60無顯著差異.,例5. 某種導(dǎo)線,要求其電阻的標(biāo)準(zhǔn)差不得超過0.005歐姆,今在生產(chǎn)的一批導(dǎo)線中取樣本9根,測得s=0.007歐姆.設(shè)總體服從正態(tài)分布,參數(shù)均未知,問在顯著性水平α=0.05下,能否認(rèn)為這批導(dǎo)線的標(biāo)準(zhǔn)差顯著地偏大?,解:,原假設(shè),備擇假設(shè),檢驗統(tǒng)計量:,拒絕域:,n=9 ,α=0.05,,所以拒絕H0,,

68、因為,即在顯著性水平α=0.05下,認(rèn)為這批導(dǎo)線的標(biāo)準(zhǔn)差顯著地偏大.,,,,,,,,,,,,,,,,三、兩個正態(tài)總體均值的假設(shè)檢驗,為取自總體 N ( ?1? ? 12 ) 的樣本,,為取自總體 N ( ?2? ? 22 ) 的樣本,,分別表示兩樣本的樣本均值與樣本方差,且兩總體相互獨立。,? 1? ?2,?1 ??2,? 1? ?2,?1 ? ?2,?1 < ?2,?1 > ?2,U 檢驗法,,雙邊檢驗,單邊檢驗,1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論