版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、數(shù)理統(tǒng)計的基本概念與抽樣分布 例:某鋼筋廠每天可以生產(chǎn)某型號鋼筋10000根,鋼筋廠每天需要對生產(chǎn)過程進(jìn)行控制,對產(chǎn)品的質(zhì)量進(jìn)行檢驗。如果把鋼筋的強(qiáng)度作為鋼筋質(zhì)量的重有指標(biāo),于是質(zhì)量管理人員需要做如下方面的工作 第一,對生產(chǎn)出來的鋼筋的強(qiáng)度進(jìn)行檢測,獲得必要的數(shù)據(jù)。 第二,對通過抽樣獲取的部分?jǐn)?shù)據(jù)進(jìn)行整理、分析并推斷出這10000根鋼筋的質(zhì)量是否合乎要求。,§1.2 總體、個體、樣本,1.
2、2.1 總體與個體 我們把所研究對象的全體稱為總體或母體。組成總體的每個單元稱為個體 總體X可看作一個隨機(jī)變量 ,稱X的概率分布為總體分布,稱X的數(shù)字特征為總體的數(shù)字特征 ,對總體進(jìn)行研究就是對總體的分布或?qū)傮w的數(shù)字特征進(jìn)行研究 .1.2.2 樣本 從總體中抽取的一部分個體稱為樣本或者子樣,其中所含個體的個數(shù)稱為樣本容量 . 樣本具有二重性:
3、隨機(jī)性和確定性,定義1.1 設(shè)總體X的樣本滿足⑴ 獨(dú)立性:每次觀測結(jié)果既不影響其它結(jié)果,也不受其它結(jié)果的影響;即相互獨(dú)立;⑵ 代表性:樣本中每一個個體都與總體X有相同分布。則稱此樣本為簡單隨機(jī)樣本。 進(jìn)行有放回抽樣就是簡單隨機(jī)樣本 ,無放回抽樣就不是簡單隨機(jī)樣本。但N很大,n相對較小時無放回抽樣得到的樣本可以近似看作簡單隨機(jī)樣本. 稱樣本的分布為樣本分布。如果
4、 為簡單隨機(jī)樣本, 為總體X的分布函數(shù),則樣本分布有比較簡單的形式 它完全由總體X的分布函數(shù)確定,,,,,,,,它完全由總體X的分布函數(shù)確定,,,,,,,,,,兩種形式例1.1 設(shè)有一批產(chǎn)品,其次品率為p,如果記“ ”表示抽取一件產(chǎn)品是次品;“ ” 表示抽取一件產(chǎn)品是正品;那么,產(chǎn)品的質(zhì)量就可以用X的分布來衡量。
5、X服從0-1分布,參數(shù)就是次品率p。如果為簡單隨機(jī)樣本,求樣本分布. 解:總體X的概率分布為,,,,,,,,,,,,,,,例1.2 設(shè)總體X服從參數(shù)為 的正態(tài)分布,求樣本 的分布密度。 解:總體X的分布密度為所以 的概率
6、分布為,,,,,,,統(tǒng)計量 統(tǒng)計量的定義 定義1.2 設(shè) 為總體X的一個樣本, 為 的連續(xù)函數(shù),且不含有任何未知參數(shù),則稱T為一個統(tǒng)計量。 注:1.統(tǒng)計量是完全由樣本確定的一個量,即樣本有一個觀測值時,統(tǒng)計量就有一個唯一確定的值 ; 2.統(tǒng)計量是一個隨機(jī)變量,它將高維隨機(jī)
7、變量問題轉(zhuǎn)化為一維隨機(jī)變量來處理 ,但不會損失所討論問題的信息量.,,,,常見的統(tǒng)計量 1.樣本均值 2.樣本方差 3.k 階原點(diǎn)矩4.k 階中心矩 5.順序統(tǒng)計量6.樣本極差 與中位數(shù),,例1.3 設(shè)總體X為連續(xù)型的,求最大順序統(tǒng)計量與最小順序統(tǒng)計量的分布密度 . 解: 最大順序統(tǒng)計量 的分布函數(shù)為,,,,,最小順序統(tǒng)計量 的分布函數(shù)為,,,,如果總體中服從均勻分布則,,,其分布密度為,,,充
8、分統(tǒng)計量例:某廠要了解其產(chǎn)品的不合格率p,檢驗員檢查了10件產(chǎn)品,檢查結(jié)果是,除前二件是不合格品(記為 )外,其它都是合格品(記為 )。當(dāng)廠長問及檢查結(jié)果時檢驗員可作如下兩種回答: (1) 10件中有兩件不合格; (2) 前兩件不合格。 這兩種回答反映了檢驗員對樣本的兩種不同的加工方法。其所用的統(tǒng)計量
9、分別為,,,顯然,第二種回答是不能令人滿意的,因為統(tǒng)計量不包含樣本中有關(guān)p的全部信息。而第一種回答是綜合了樣本中有關(guān)p的全部信息。因為樣本 提供了兩種信息: (1) 10次檢驗中不合格品出現(xiàn)了幾次; (2) 不合格品出現(xiàn)在哪幾次試驗上。,,,,第二種信息(試驗編號信息)對了解不合格品率p是沒有什么幫助的 . 充分統(tǒng)計量就是能把含在樣本中有關(guān)總體或者參數(shù)的信息一點(diǎn)都不損
10、失地提取出來?;蛘哒f充分統(tǒng)計量包含了有關(guān)總體或有關(guān)參數(shù)的全部信息. 考慮樣本 的分布,,,由于 且 是服從二項分布故,,,,它與 無關(guān),,,定義1.3 設(shè)總體X的分布為一個含未知參數(shù)的分布族 , 是X的一個樣本。 是一個統(tǒng)計量,對給定的t
11、 ,樣本 在的條件 下的條件分布與參數(shù) 無關(guān),則稱統(tǒng)計量T是參數(shù) 的充分統(tǒng)計量。,,,,,,,,,,,,,上例的一般情況是 設(shè) 是來自0-1分布 的一個簡單隨機(jī)樣本,其中 ,則 是 參數(shù)的充分統(tǒng)計量。,
12、,,,,,,由定義可得定理1.1 設(shè) 是參數(shù) 的充分統(tǒng)計量, 是單值可逆函數(shù),則 也是參數(shù) 的充分統(tǒng)計量。,,,,,,,當(dāng)總體為連續(xù)型總體時,充分統(tǒng)計量要用條件分布密度來描述。奈曼(J.Neyman)和哈爾斯(P.R.Halmos)在20世紀(jì)40年代提出并嚴(yán)格證明了一個判別充分統(tǒng)計量的方法:因子分解定理。,,,,,,
13、,定理1.2 (因子分解定理)設(shè)樣本的聯(lián)合分布為一個含未知參數(shù)的分布族 ,則 是一個充分統(tǒng)計量當(dāng)且僅當(dāng)存在這樣的兩個函數(shù): (1)與 無關(guān)的非負(fù)函數(shù) ; (2)與 有關(guān),且僅與統(tǒng)計量T的值有關(guān)的非負(fù)函數(shù)
14、 使得 其中 在離散總體的情況下表示樣本的分布列,在連續(xù)總體的情況下表示樣本的分布密度。,,,,,,,,,,,,,,,例 設(shè) 是來自 分布,即它的分布密度為 的一個簡單隨機(jī)樣本,其中
15、 則 分別是參數(shù) 的充分統(tǒng)計量,,,,,,,,解:樣本 的聯(lián)合分布密度為如果令由因子分解定理知 是 的充分統(tǒng)計量。,,,,,,,,,,,,,,,,,,例 設(shè)總體X的分布密度為
16、 是X的一個簡單隨機(jī)樣本,試證明最小順序統(tǒng)計量 的充分統(tǒng)計量。,,,,,,,,,,,,證:樣本 的聯(lián)合分布密度為如果令由因子分解定理知 是 的充分統(tǒng)計量。,,,,,,,,,,,,,,,,,,§1.4抽樣分布 我們稱統(tǒng)計量的分布為抽樣分布 ,不同的統(tǒng)計量其分布不一定相同.常見的分布
17、類型有: 正態(tài)分布 伽瑪分布 卡方分布 t 分布 F分布,,,,,,,伽瑪分布定義1.4 如果連續(xù)型隨機(jī)變量X的密度函數(shù)為其中 為 函數(shù),則稱X為服從參數(shù)是 的伽瑪分布,記為,,,,,,,,,,,,,伽瑪分布的性質(zhì)(1)由此可得,,,,,,,,,(2) 如果 ,并且X和Y
18、相互獨(dú)立,容易求得 這個性質(zhì)稱為可加性,即伽瑪分布具有可加性.,,,,,,,,,卡方分布用構(gòu)造性的方式定義是 定義1.5 設(shè) 為相互獨(dú)立的隨機(jī)變量,且均服從 ,則它們的平方和 也是一個隨機(jī)變量,它所服從的分布稱為自由度為n的 分布,記為,,,,,,,,,,,,它的密
19、度函數(shù)為 其密度函數(shù)與參數(shù)n有關(guān),它的圖形也有一定差異.,,,,,,,,卡方分布的性質(zhì) 若 ,則 即卡方分布是一種伽瑪分布,因此具有伽瑪分布的性質(zhì) ?。ǎ保 。ǎ玻?如果 ,并且X和Y相互獨(dú)立,有 卡方分布也具有可加性,,,,,,,,,,,,,例 是來自參數(shù)為 的指數(shù)分布X總體,試證明:,,,,,,,,,總體X的密度為當(dāng) 時,我們有 密度
20、為說明,,,,,,,,,,,假定子樣是簡單隨機(jī)子樣,則且它們之間相互獨(dú)立,故有,,,,,,,,,t 分布 構(gòu)造性的方式定義 定義1.6 設(shè) , ,且X與Y相互獨(dú)立,記 則T也是一個隨機(jī)變量,它所服從的分布稱為自由度為n的t分布,記為,,,,,,,,,,,它的密度函數(shù)為與參數(shù)n有關(guān),不同的n其圖形也
21、有差異.,,,,,,,,,性質(zhì)若 則(1)當(dāng) 時,t分布是柯西分布,柯西分布不存在數(shù)學(xué)期望和方差.參數(shù)為2的t分布也不存在數(shù)學(xué)期望和方差.(2) 時,,,,,,,,,,,(3)可以證明 這是標(biāo)準(zhǔn)正態(tài)分布的分布密度,即當(dāng)n充分大時,T近似服從標(biāo)準(zhǔn)正態(tài)分布,,,,,,,,F分布 構(gòu)造性的方式定義 定義1.7 設(shè) , ,且X與Y相互獨(dú)立,記
22、 則F也是一個隨機(jī)變量,它所服從的分布稱為自由度為(m,n)的F分布,記為,,,,,,,,,,,它的密度函數(shù)為它與m,n有關(guān),其圖形也有一定差異.,,,,,,,,容易得到 若 ,則,,,,,,,,,例 設(shè) 試證明: 證明:由t分布的構(gòu)造性定義知,存在相互獨(dú)立的變量X和Y,使得于是, 仍相互獨(dú)立,由F分布的定義知結(jié)論成立.,,,,,,,,,
23、,,分位數(shù):定義1.6 設(shè)X為連續(xù)型隨機(jī)變量,其分布函數(shù)為 ,對 ,如果存在數(shù) 滿足 則稱 為此分布的 分位數(shù) 分位數(shù)的幾何意義 可用圖形表示,它的值可查表得到,不同的分布有不同的分位數(shù),有不同的表可查.,,,,,,,,,,,,常見的分位數(shù)有它們的值可以通過附表1、附表2、附表3、附表4 查得,,,,,,,,,,,,分位數(shù)具有性質(zhì)
24、(1)(2)(3)當(dāng)n 足夠大時(一般n > 45)有近似公式,,,,,,,,,,,,,,例:查表求下列分位數(shù)的值,,,,,,,,,,,抽樣分布定理 定理1.1 設(shè)總體 , 為X的一個簡單隨機(jī)樣本, 為樣本均值與樣本方差,則有: (1) (2),,,,,,,,,,,,(3)
25、 相互獨(dú)立; (4),,,,,,,,定理1.2 設(shè)有兩個總體X與Y, ,從兩個總體X與Y中分別獨(dú)立抽取容量為m,n的簡單隨機(jī)樣本 記 為樣本 的樣本均值與方差, 為樣本 的樣本均值與方差,則?。ǎ保?,,,,,,,,,,,,,,,(2)(3)若 則 其中,,,,,,,,,,,定理1.3 設(shè)總體X為任意總體,存
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)學(xué)統(tǒng)計學(xué)基本概念
- 醫(yī)學(xué)統(tǒng)計中的基本概念
- 3.1統(tǒng)計力學(xué)基本概念-38
- 2統(tǒng)計學(xué)的基本概念
- 統(tǒng)計自然語言處理基本概念
- 第1節(jié)-統(tǒng)計的基本概念與頻率、頻數(shù)
- 《社會統(tǒng)計學(xué)》基本概念與思考題
- 統(tǒng)計學(xué)--抽樣與抽樣分布
- 生物統(tǒng)計學(xué)基本概念及公式
- 統(tǒng)計學(xué)若干基本概念及解釋
- vlan基本概念
- vlan基本概念
- pfc基本概念
- [教育]應(yīng)用統(tǒng)計方法第一章數(shù)理統(tǒng)計基本概念
- 基本概念解釋
- 存儲基本概念
- 幾個基本概念
- 法律基本概念
- 1基本概念
- 旅游統(tǒng)計基本概念和主要指標(biāo)解釋
評論
0/150
提交評論