[學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)課件(第3-5章)_第1頁(yè)
已閱讀1頁(yè),還剩214頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、二維隨機(jī)變量及其分布,第三章,二維隨機(jī)變量及其聯(lián)合分布,邊緣分布與獨(dú)立性,兩個(gè)隨機(jī)變量的函數(shù)的分布,例如 E:抽樣調(diào)查15-18歲青少年的身高 X與體重 Y,以研究當(dāng)前該年齡段青少年的身體發(fā)育情況。,前面我們討論的是隨機(jī)實(shí)驗(yàn)中單獨(dú)的一個(gè)隨機(jī)變量,又稱為一維隨機(jī)變量;然而在許多實(shí)際問(wèn)題中,常常需要同時(shí)研究一個(gè)試驗(yàn)中的兩個(gè)甚至更多個(gè)隨機(jī)變量。,不過(guò)此時(shí)我們需要研究的不僅僅是X及Y各自的性質(zhì), 更需要了解這兩個(gè)隨機(jī)變量的相互依賴和制約

2、關(guān)系。因此, 我們將二者作為一個(gè)整體來(lái)進(jìn)行研究,記為(X, Y),稱為二維隨機(jī)變(向)量。,設(shè)X、Y 為定義在同一樣本空間Ω上的隨機(jī)變量,則稱向量( X,Y )為Ω上的一個(gè)二維隨機(jī)變量。,定義,二維隨機(jī)變量,二維隨機(jī)變量(X, Y)的取值可看作平面上的點(diǎn),二維隨機(jī)變量的聯(lián)合分布函數(shù),若(X,Y)是隨機(jī)變量,對(duì)于任意的實(shí)數(shù)x,y.,定義,,稱為二維隨機(jī)變量的聯(lián)合分布函數(shù),性質(zhì),(3),,P(x1? X ?x2,y1? Y ?y2)

3、= F(x2,y2)- F(x2,y1)- F(x1,y2) + F(x1,y1),聯(lián)合分布函數(shù)表示矩形域概率,P(x1 ? X ? x2,y1 ? Y ? y2),F(x2,y2),-F(x2,y1),-F(x1,y2),+F(x1,y1),二維離散型隨機(jī)變量,若二維 隨機(jī)變量 (X,Y)的所有可能取值只有限對(duì)或可列對(duì),則稱(X,Y)為二維離散型隨機(jī)變量。,如何反映(X,Y)的取值規(guī)律呢?,定義,研究問(wèn)題,聯(lián)想一維離散型隨機(jī)變量的分布

4、律。,(X,Y)的聯(lián)合概率分布(分布律),表達(dá)式形式,,,,,,,,,,,,,,,,,,表格形式(常見(jiàn)形式),性質(zhì),,的可能取值為(1, 2), (2, 1), (2, 2).,P{X=1,Y=2}=(1/3) × (2/2)=1/3, P{X=2,Y=1}=(2/3) ×(1/2)=1/3, P{X=2,Y=2}= (2/3) ×(1/2)=1/3,,例,解,見(jiàn)書P

5、69,習(xí)題1,,的可能取值為,例,解,(0, 0), (-1, 1), (-1, 1/3),(2,0),(X,Y)的聯(lián)合分布律為,若存在非負(fù)函數(shù) f(x,y),使對(duì)任意實(shí)數(shù)x,y,二元隨機(jī)變量(X,Y)的分布函數(shù) 可表示成如下形式,則稱(X,Y)是二元連續(xù)型隨機(jī)變量。f(x,y)稱為二元隨機(jī)變量(X,Y)的聯(lián)合概率密度函數(shù).,二維連續(xù)型隨機(jī)變量的聯(lián)合概率密度,定義,聯(lián)合概率密度函數(shù)的性質(zhì),非負(fù)性,幾何解釋,.,.,隨機(jī)事件的概率=

6、曲頂柱體的體積,設(shè)二維隨機(jī)變量,的概率密度為,(1) 確定常數(shù) k;,;,.,(4) 求,例,(1),所以,解,(2),當(dāng) 時(shí),,當(dāng) 時(shí),,所以,,(3),或解,(4),解,續(xù)解 ……….,x+y=3,,1,,解答,二維均勻分布,,,,思考 已知二維隨機(jī)變量(X,Y)服從區(qū)域D上的均勻分布,D為x軸,y軸及直線y=2x

7、+1所圍成的三角形區(qū)域。求(1)分布函數(shù);(2),解 (X,Y)的密度函數(shù)為,(1)當(dāng) 時(shí),,分布函數(shù)為,(2)當(dāng) 時(shí),,,,,,(3)當(dāng) 時(shí),,,,,,所以,所求的分布函數(shù)為,-1/2,二維正態(tài)分布,,,,,,邊緣分布,隨機(jī)變量的相互獨(dú)立性,邊緣分布 marginal distribution,二維隨機(jī)變量 ,是兩個(gè)

8、隨機(jī)變量視為一個(gè)整體,來(lái)討論其取值規(guī)律的,我們可用分布函數(shù)來(lái)描述其取值規(guī)律。,,,,問(wèn)題:能否由二維隨機(jī)變量的分布來(lái)確定兩個(gè)一維隨機(jī)變量的取值規(guī)律呢?如何確定呢?,——邊緣分布問(wèn)題,邊緣分布 marginal distribution,設(shè)二維隨機(jī)變量 的分布函數(shù)為 ,,,,,二維離散型R.v.的邊緣分布,,如果二維離散型隨機(jī)變量(X,Y)的聯(lián)合分布律為,即,二維離散型R.v.的邊緣

9、分布,關(guān)于X的邊緣分布,關(guān)于Y的邊緣分布,,二維離散型R.v.的邊緣分布,關(guān)于X的邊緣分布,關(guān)于Y的邊緣分布,,第j列之和,第i行之和,二維離散型R.v.的邊緣分布,,例1 設(shè)二維離散型隨機(jī)變量(X,Y)的聯(lián)合分布律為,求關(guān)于X、Y的邊緣分布,關(guān)于Y的邊緣分布,,解 關(guān)于X的邊緣分布為,(X,Y)的聯(lián)合分布列,二維連續(xù)型隨機(jī)變量的邊緣分布,關(guān)于X的邊緣概率密度為,關(guān)于Y的邊緣概率密度為,例2 設(shè)(X, Y)的聯(lián)合密度為,求k值

10、和兩個(gè)邊緣分布密度函數(shù),解,由,得,,當(dāng) 時(shí),關(guān)于X的邊緣分布密度為,,,解,所以,關(guān)于X的邊緣分布密度為,所以,關(guān)于Y的邊緣分布密度為,當(dāng) 時(shí),當(dāng) 時(shí),當(dāng) 時(shí),關(guān)于Y的邊緣分布密度為,邊緣分布密度和概率的計(jì)算,例3,設(shè)(X, Y) 的聯(lián)合分布密度為,(1)求k值,(2) 求關(guān)于X和Y的邊緣密度,(3)

11、求概率P(X+Y1/2),,(2),均勻分布,解,得,,當(dāng) 時(shí),,當(dāng) 時(shí),所以,關(guān)于X的邊緣分布密度函數(shù)為,,續(xù)解 ………..,,,解,當(dāng) 時(shí),當(dāng) 時(shí),所以,關(guān)于Y的邊緣分布密度函數(shù)為,,,解 (3),見(jiàn)課本P59例3,如果二維隨機(jī)變量(X,Y)服從正態(tài)分布,則兩個(gè)邊緣分布分別服從正態(tài)分布,與

12、相關(guān)系數(shù) 無(wú)關(guān),可見(jiàn),聯(lián)合分布可以確定邊緣分布,但邊緣分布不能確定聯(lián)合分布,解 關(guān)于X的分布密度函數(shù)為,所以,,同理可得,不同的聯(lián)合分布,可有相同的邊緣分布。,可見(jiàn),聯(lián)合分布可以確定邊緣分布,但邊緣分布不能確定聯(lián)合分布,隨機(jī)變量的相互獨(dú)立性,特別,對(duì)于離散型和連續(xù)型的隨機(jī)變量,該定義分別等價(jià)于,★,★,定義 設(shè)(X,Y)的聯(lián)合分布函數(shù)為F(x,y),兩個(gè)邊緣分布函數(shù)分別為FX(x),FY(y),如果對(duì)于任意的x,

13、y都有F(x,y)= FX(x) FY(y),則稱隨機(jī)變量X,Y相互獨(dú)立。,對(duì)任意i,j,對(duì)任意x,y,,在實(shí)際問(wèn)題或應(yīng)用中,當(dāng)X的取值與Y的取值互不影響時(shí),我們就認(rèn)為X與Y是相互獨(dú)立的,進(jìn)而把上述定義式當(dāng)公式運(yùn)用.,,? 在X與Y是相互獨(dú)立的前提下,,邊緣分布可確定聯(lián)合分布!,實(shí)際意義,補(bǔ)充說(shuō)明,設(shè)(X,Y)的概率分布(律)為,證明:X、Y相互獨(dú)立。,例1,逐個(gè)驗(yàn)證等式,證 ∵X與Y的邊緣分布律分別為,∴X、Y相互獨(dú)立,例2

14、 設(shè)(X,Y)的概率密度為,求 (1) P(0≤X≤1 ,0≤Y≤1) (2) (X,Y)的邊緣密度, (3)判斷X、Y是否獨(dú)立。,解 ① 設(shè)A={(x,y):0≤x≤1 ,0≤y≤1)},② 邊緣密度函數(shù)分別為,當(dāng) 時(shí),當(dāng) 時(shí),所以,,同理可得,③,所以 X 與 Y 相互獨(dú)立。,例3 已知二維隨機(jī)變量(X,Y)服從區(qū)域D上的均勻分 布,D為x軸

15、,y軸及直線y=2x+1所圍成的三角形區(qū) 域。判斷X,Y是否獨(dú)立。,解 (X,Y)的密度函數(shù)為,當(dāng) 時(shí),,,所以,關(guān)于X的邊緣分布密度為,關(guān)于X的邊緣分布密度為,當(dāng) 或 時(shí),當(dāng) 時(shí),,,所以,關(guān)于Y的邊緣分布密度為,關(guān)于Y的邊緣分布密度為,當(dāng) 或

16、 時(shí),所以,所以,X與Y不獨(dú)立。,例4,時(shí),解,于是,同理,所以,即 X 與 Y 獨(dú)立。,時(shí),二維隨機(jī)變量的函數(shù)的分布,二維隨機(jī)變量的函數(shù)的分布,的分布函數(shù),問(wèn)題:如何確定隨機(jī)變量Z的分布呢?,二維離散型隨機(jī)變量的函數(shù)的分布,則 是一維的離散型隨機(jī)變量,其分布列為,例 設(shè) 的聯(lián)合分布列為,分別求出(1)X+Y;(2)X-Y;(3)X2+Y-2的分布列,解 由(X,Y)

17、的聯(lián)合分布列可得如下表格,解 得所求的各分布列為,二維連續(xù)型隨機(jī)變量的函數(shù)的分布,則 是一維的連續(xù)型隨機(jī)變量,其分布函數(shù)為,是二元連續(xù)函數(shù),,其分布密度函數(shù)為,解,解 ……………,所求分布函數(shù)為,分布密度函數(shù)為,兩個(gè)隨機(jī)變量的和的分布,見(jiàn)課本P67例1,如果(X,Y)的聯(lián)合分布密度函數(shù)為 f(x,y),則Z=X+Y的分布密度函數(shù)為,或,特別,當(dāng)X,Y相互獨(dú)立時(shí),有卷積公式,或

18、,記 住 結(jié) 論!,兩個(gè)獨(dú)立隨機(jī)變量的和的分布,如果X與Y相互獨(dú)立,例 證明:如果X與Y相互獨(dú)立,且X~B(n,p), Y~B(m,p),則X+Y~B(n+m,p),證明 X+Y所有可能取值為 0,1,…,m+n.,證畢,第四章 隨機(jī)變量的數(shù)字特征,數(shù)學(xué)期望,方差,* 協(xié)方差與相關(guān)系數(shù),大數(shù)定律與中心極限定理,數(shù)學(xué)期望的引例,Mathematical Expectation,例如:某7人的高數(shù)成績(jī)?yōu)?

19、0,85,85,80,80, 75,60,則他們的平均成績(jī)?yōu)?以頻率為權(quán)重的加權(quán)平均,,數(shù)學(xué)期望E(X),Mathematical Expectation,定義 設(shè)離散型隨機(jī)變量的概率分布為,離散型隨機(jī)變量,隨機(jī)變量X的數(shù)學(xué)期望,記作E(X),即,數(shù)學(xué)期望的計(jì)算,已知隨機(jī)變量X的分布律:,例,求數(shù)學(xué)期望E(X),解,連續(xù)型隨機(jī)變量的數(shù)學(xué)期望E(X),連續(xù)型隨機(jī)變量,定義,設(shè)連續(xù)型隨機(jī)變量X的概率密度為 f (x),

20、則,即,數(shù)學(xué)期望的計(jì)算,已知隨機(jī)變量X的密度函數(shù)為,例,求數(shù)學(xué)期望。,解,數(shù)學(xué)期望的意義,試驗(yàn)次數(shù)較大時(shí),X的觀測(cè)值的算術(shù)平均值 在E(X)附近擺動(dòng),數(shù)學(xué)期望又可以稱為期望值(Expected Value),均值(Mean),,,E(X)反映了隨機(jī)變量X取值的“概率平均”,是X的可能值以其相應(yīng)概率的加權(quán)平均。,二維隨機(jī)變量的數(shù)學(xué)期望及邊緣分布的數(shù)學(xué)期望,(X,Y)為二維離散型隨機(jī)變量,(X,Y)為二維連續(xù)型隨機(jī)變量,(1) 求

21、k,(2) 求X和Y的邊緣密度,(3) 求E(X), E(Y).,(1)由,解,所以,所以,得,(3),時(shí),,(3)另解,無(wú)需求邊緣分布密度函數(shù),,隨機(jī)變量的函數(shù)的數(shù)學(xué)期望,定理 1:一維情形,離散型,連續(xù)型,概率密度為,因?yàn)?所以,例,解,隨機(jī)變量的函數(shù)的數(shù)學(xué)期望,定理 2:二維情形,聯(lián)合概率密度為,,連續(xù)型,離散型,例 設(shè)相互獨(dú)立的隨機(jī)變量X,Y的密度函數(shù)分別為,求E(XY),解,,數(shù)學(xué)期望的性質(zhì),,.,.,,設(shè)(X,Y)在

22、由4個(gè)點(diǎn)(0,0)(3,0),(3,2),(0,2)決定的矩形域內(nèi)服從均勻分布,求E(X+Y),E(X2)E(Y2),E(XY).,練一練,答案:,0-1分布的數(shù)學(xué)期望,X服從0-1分布,其概率分布為,P(X=1)=p,P(X=0)=1- p,若X 服從參數(shù)為 p 的0-1分布, 則E(X) = p,分布律,數(shù)學(xué)期望,If X~B( n, p ), then E(X)= np,二項(xiàng)分布的數(shù)學(xué)期望,分布律,X服從二項(xiàng)分布,其概率

23、分布為,數(shù)學(xué)期望,,其中,則,泊松分布的數(shù)學(xué)期望,If , then,分布律,數(shù)學(xué)期望,,均勻分布的期望,分布密度,數(shù)學(xué)期望,,X~ N (μ,σ2),正態(tài)分布的期望,分布密度,,數(shù)學(xué)期望,,指數(shù)分布的期望,分布密度,數(shù)學(xué)期望,數(shù)學(xué)期望在醫(yī)學(xué)上的一個(gè)應(yīng)用,An application of Expected Value in Medicine,考慮用驗(yàn)血的方法在人群中普查某種疾病。集

24、體做法是每10個(gè)人一組,把這10個(gè)人的血液樣本混合起來(lái)進(jìn)行化驗(yàn)。如果結(jié)果為陰性,則10個(gè)人只需化驗(yàn)1次;若結(jié)果為陽(yáng)性,則需對(duì)10個(gè)人在逐個(gè)化驗(yàn),總計(jì)化驗(yàn)11次。假定人群中這種病的患病率是10%,且每人患病與否是相互獨(dú)立的。試問(wèn):這種分組化驗(yàn)的方法與通常的逐一化驗(yàn)方法相比,是否能減少化驗(yàn)次數(shù)?,分析:,設(shè)隨機(jī)抽取的10人組所需的化驗(yàn)次數(shù)為X,我們需要計(jì)算X的數(shù)學(xué)期望,然后與10比較,,化驗(yàn)次數(shù)X的可能取值為1,11,先求出化驗(yàn)次數(shù)X的分布

25、律。,(X=1)=“10人都是陰性”,(X=11)=“至少1人陽(yáng)性”,結(jié)論:,分組化驗(yàn)法的次數(shù)少于逐一化驗(yàn)法的次數(shù),注意求 X期望值的步驟!,1、概率p對(duì)是否分組的影響,問(wèn)題的進(jìn)一步討論,若p=0.2,則,當(dāng)p>0.2057時(shí),E(X)>10,2、概率p對(duì)每組人數(shù)n的影響,,當(dāng)p=0.2時(shí),可得出n<10.32,才能保證EX<10.,當(dāng)p=0.1時(shí),為使,例 獨(dú)立地操作兩臺(tái)儀器,他們發(fā)生故障的概率分別為p1和

26、p2.證明:產(chǎn)生故障的儀器數(shù)目的數(shù)學(xué)期望為 p1 + p2,設(shè)產(chǎn)生故障的儀器數(shù)目為X,則X的所有可能取值為0,1,,解,,所以,方差大數(shù)定律中心極限定理,方 差 的 引 入,E( X1 )=5,E( X2 )=5,設(shè)有兩種球形產(chǎn)品,其直徑的取值規(guī)律如下:,兩種產(chǎn)品的直徑均值是相同的,但產(chǎn)品2的偏差大,如果需要使用直徑為5的產(chǎn)品,則產(chǎn)品1較產(chǎn)品2理想。,方差(Variance)的定義,定義,均方差(標(biāo)準(zhǔn)差),設(shè) 是一隨機(jī)變量,

27、如果 存在,則稱為 的方差,記作 或,即,方差的計(jì)算公式,Proof.,,一維隨機(jī)變量的方差,設(shè)離散型隨機(jī)變量X的概率分布為,離散型,連續(xù)型,設(shè)連續(xù)型隨機(jī)變量X的分布密度為 f (x),其中,方 差 的 計(jì)算,E( X1 )=5,E( X2 )=5,例 設(shè)有兩種球形產(chǎn)品,其直徑的取值規(guī)律如下:,求D(X1) ,D(X2),解,0-1分布的方差,分布律,方差,其

28、中,二項(xiàng)分布的方差,If X ~ B ( n, p ) , then D ( X ) = n p ( 1- p ),分布律,方差,X ~ B ( n, p ),其中,推導(dǎo)?,泊松分布的方差,分布律,方差,推導(dǎo)?,均勻分布的方差,分布密度,方差,,,正態(tài)分布的方差,分布密度,方差,,,,指數(shù)分布的方差,分布密度,方差,,,常見(jiàn)分布及其期望和方差列表P84,分布名稱 數(shù)學(xué)期望E(X) 方差D(X),0-

29、1分布,二項(xiàng)分布,泊松分布,均勻分布,正態(tài)分布,指數(shù)分布,方差的計(jì)算步驟,Step 1: 計(jì)算期望 E(X),Step 2: 計(jì)算 E(X2),Step 3: 計(jì)算 D(X),離散型,連續(xù)型,離散型,連續(xù)型,方差的性質(zhì),證明,二維隨機(jī)變量的方差,(X,Y)為二維離散型隨機(jī)變量,,,二維隨機(jī)變量的方差,,,(X,Y)為二維連續(xù)型隨機(jī)變量,,,,求,.,練一練,解 因?yàn)?相互獨(dú)立,所以,而,所以,例 某地出產(chǎn)的某品種的

30、蘋果的總量X服從正態(tài)分布。若E(X)=148, D(X)=162.寫出X的分布律和概率密度,并用積分表示,解,若隨機(jī)變量X服從均值為2,方差為σ2的正態(tài)分布,且P{2<X<4}=0.3,求P{X<0}。,練一練,所以,解,若隨機(jī)變量X服從均值為2,方差為σ2的正態(tài)分布,且P{2<X<4}=0.3,求P{X<0}。,練一練,所以,得,所以,例 已知一批玉米種子的發(fā)芽率是75%,播種時(shí)每穴種三粒,求

31、每穴發(fā)芽種子粒數(shù)的數(shù)學(xué)期望、方差及均方差.,,,,,,.,設(shè)發(fā)芽種子數(shù)為 X,則 X 服從二項(xiàng)分布,且,解,設(shè)X表示10次獨(dú)立重復(fù)射擊命中目標(biāo)的次數(shù),每次射擊命中的概率為0.4,求 X 的數(shù)學(xué)期望。,練一練,所以,所以這種動(dòng)物的平均壽命為10年,標(biāo)準(zhǔn)差為10年.,解,練一練,設(shè)隨機(jī)變量X服從參數(shù)為1的指數(shù)分布,求,解 X的密度函數(shù)為,練一練,設(shè)隨機(jī)變量X服從參數(shù)為1的指數(shù)分布,求,所以,而,所以,解 X的密度函數(shù)為,練一練,設(shè)隨機(jī)

32、變量X服從參數(shù)為1的指數(shù)分布,求,所以,證畢,證明,,,證畢,證明,大數(shù)定律中心極限定理,大 數(shù) 定 律,在大量的隨機(jī)現(xiàn)象中,隨機(jī)事件的頻率具有穩(wěn)定性,大量的隨機(jī)現(xiàn)象的平均結(jié)果具有穩(wěn)定性,概率論中用來(lái)闡明大量隨機(jī)現(xiàn)象平均結(jié)果的穩(wěn)定性的一系列定理,稱為大數(shù)定律(law of large number),切比雪夫(Chebyshev)不等式,設(shè)隨機(jī)變量X具有有限數(shù)學(xué)期望EX和方差DX,則對(duì)于任意正數(shù) ,如下不等式成立。

33、,——切比雪夫不等式,證明 設(shè)X為連續(xù)型隨機(jī)變量,其密度函數(shù)為,則,證畢,切比雪夫(Chebyshev)不等式的應(yīng)用,在隨機(jī)變量X的分布未知的情況下,只利用X的期望和方差,即可對(duì)X的概率分布進(jìn)行估值。,例 已知正常男性成人血液中,每毫升白細(xì)胞數(shù)的平均值是7300,均方差是700,利用切比雪夫不等式估計(jì)每毫升血液含白細(xì)胞數(shù)在5200~9400之間的概率。,解 設(shè)X表示每毫升血液中含白細(xì)胞個(gè)數(shù),則,則,而,所以,練一練,設(shè)隨機(jī)變

34、量X的方差為2.5,利用切比雪夫不等式估計(jì)概率,,練習(xí) 設(shè)隨機(jī)變量X的方差為2.5,利用切比雪夫不等式估計(jì)概率,解,樣本平均數(shù)穩(wěn)定性定理,定理 設(shè)隨機(jī)變量X1,X2,…,Xn,…相互獨(dú)立,且服從同一分布,并具有數(shù)學(xué)期望 及方差 ,則對(duì)于任意正數(shù) ,恒有,觀測(cè)量X在相同的條件下重復(fù)觀測(cè)n次,當(dāng)n充分大時(shí),“觀測(cè)值的算術(shù)平均值接近于期望”是一大概率事件。,即,依概率收斂于,即n充分大時(shí),,——辛欽大

35、數(shù)定理,伯努利大數(shù)定理(頻率的穩(wěn)定性),定理 設(shè) 是n次獨(dú)立試驗(yàn)中事件A發(fā)生的次數(shù),p是事件A在每次試驗(yàn)中發(fā)生的概率,則對(duì)于任意正數(shù)恒有,定理的應(yīng)用:可通過(guò)多次重復(fù)一個(gè)試驗(yàn),確定事件A在每次試驗(yàn)中出現(xiàn)的概率,中心極限定理(Central limit theoem),客觀背景:客觀實(shí)際中,許多隨機(jī)變量是由大量相互獨(dú)立的偶然因素的綜合影響所形成,每一個(gè)微小因素,在總的影響中所起的作用是很小的,但總起來(lái),卻對(duì)總和有顯著影

36、響,這種隨機(jī)變量往往近似地服從正態(tài)分布。,概率論中有關(guān)論證獨(dú)立隨機(jī)變量的和的極限分布是正態(tài)分布的一系列定理稱為中心極限定理。,獨(dú)立同分布的中心極限定理,設(shè)隨機(jī)變量X1,X2,…,Xn相互獨(dú)立,服從同一分布,且有有限的數(shù)學(xué)期望 和方差 ,則隨機(jī)變量 的分布函數(shù) 滿足如下極限式,定理的應(yīng)用:對(duì)于獨(dú)立的隨機(jī)變量序列 ,不管

37、 服從什么分布,只要它們是同分布,且有有限的數(shù)學(xué)期望和方差,那么,當(dāng)n充分大時(shí),這些隨機(jī)變量之和 近似地服從正態(tài)分布,例 一部件包括10部分,每部分的長(zhǎng)度是一個(gè)隨機(jī)變量,相互獨(dú)立,且具有同一分布。其數(shù)學(xué)期望是2mm,均方差是0.05mm,規(guī)定總長(zhǎng)度為20±0.1mm時(shí)產(chǎn)品合格,試求產(chǎn)品合格的概率。,解 設(shè)部件的總長(zhǎng)度為X,每部分的長(zhǎng)度為

38、 Xi(i=1,2,…,10),則,由定理4.5可知:X近似地服從正態(tài)分布,即,續(xù)解 則產(chǎn)品合格的概率為,棣莫弗—拉普拉斯中心極限定理,(De Moivre-Laplace),定理 設(shè)隨機(jī)變量 服從二項(xiàng)分布 ,則對(duì)于任意區(qū)間 ,恒有,二項(xiàng)分布的極限分布是正態(tài)分布,例 現(xiàn)有一大批種子,其中良種占1/6,今在其中任選6000粒,試問(wèn)在這些種子中良種所占的比例與

39、1/6之差小于1%的概率是多少?,解 設(shè)取出的種子中的良種粒數(shù)為X,則,所求概率為,續(xù)例 種子中良種占1/6,我們有99%的把握斷定在6000粒種子中良種所占的比例與1/6之差是多少?這時(shí)相應(yīng)的良種數(shù)落在哪個(gè)范圍?,解 設(shè)良種數(shù)為X,則,設(shè)良種所占比例與1/6的差值為 ,則依題意有,查表得,,此時(shí)有,即,,解 設(shè)100根木材中長(zhǎng)度不短于3米的根數(shù)為X,則,有一大批建筑房屋用的木柱,其中80%的長(zhǎng)度不小于3米,現(xiàn)從

40、這批木材中任取100根,試求其中至少有30根短于3米的概率。,練習(xí),所求概率為,作業(yè) 習(xí)題四 21、29、30預(yù)習(xí) 第五章之1、2節(jié),數(shù) 理 統(tǒng) 計(jì) 部分,第五章,樣本與統(tǒng)計(jì)量,引 言,隨機(jī)變量及其所伴隨的概率分布全面描述了隨機(jī)現(xiàn)象的統(tǒng)計(jì)性規(guī)律。,概率論的許多問(wèn)題中,隨機(jī)變量的概率分布通常是已知的,或者假設(shè)是已知的,而一切計(jì)算與推理都

41、是在這已知是基礎(chǔ)上得出來(lái)的。,但實(shí)際中,情況往往并非如此,一個(gè)隨機(jī)現(xiàn)象所服從的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些參數(shù)是未知的。,引 言,例如:,某公路上行駛車輛的速度服從什么分布是未知的;,電視機(jī)的使用壽命服從什么分布是未知的;,產(chǎn)品是否合格服從兩點(diǎn)分布,但參數(shù)——合格率p是未知的;,數(shù)理統(tǒng)計(jì)的任務(wù)則是以概率論為基礎(chǔ),根據(jù)試驗(yàn)所得到的數(shù)據(jù),對(duì)研究對(duì)象的客觀統(tǒng)計(jì)規(guī)律性做出合理的推斷。,從第五

42、章開(kāi)始,我們學(xué)習(xí)數(shù)理統(tǒng)計(jì)的基礎(chǔ)知識(shí)。數(shù)理統(tǒng)計(jì)的任務(wù)是以概率論為基礎(chǔ),根據(jù)試驗(yàn)所得到的數(shù)據(jù),對(duì)研究對(duì)象的客觀統(tǒng)計(jì)規(guī)律性作出合理的推斷.數(shù)理統(tǒng)計(jì)所包含的內(nèi)容十分豐富,本書介紹其中的參數(shù)估計(jì)、假設(shè)檢驗(yàn)、方差分析、回歸分析等內(nèi)容.第五章主要介紹數(shù)理統(tǒng)計(jì)的一些基本術(shù)語(yǔ)、基本概念、重要的統(tǒng)計(jì)量及其分布,它們是后面各章的基礎(chǔ)。,學(xué)習(xí)的基本內(nèi)容,樣本與統(tǒng)計(jì)量,總體與樣本,在數(shù)理統(tǒng)計(jì)中,把研究對(duì)象的全體稱為總體(population)或母體,而把組成總

43、體的每個(gè)單元稱為個(gè)體。,抽樣,要了解總體的分布規(guī)律,在統(tǒng)計(jì)分析工作中,往往是從總體中抽取一部分個(gè)體進(jìn)行觀測(cè),這個(gè)過(guò)程稱為抽樣。,樣本與統(tǒng)計(jì)量,子樣,子樣 是n個(gè)隨機(jī)變量,抽取之后的觀測(cè)數(shù)據(jù) 稱為樣本值或子樣觀察值。,在抽取過(guò)程中,每抽取一個(gè)個(gè)體,就是對(duì)總體X進(jìn)行一次隨機(jī)試驗(yàn),每次抽取的n個(gè)個(gè)體

44、 ,稱為總體X的一個(gè)容量為n的樣本(sample)或子樣;其中樣本中所包含的個(gè)體數(shù)量稱為樣本容量。,隨機(jī)抽樣方法的基本要求,獨(dú)立性——即每次抽樣的結(jié)果既不影響其余各次抽樣的 結(jié)果,也不受其它各次抽樣結(jié)果的影響。,滿足上述兩點(diǎn)要求的子樣稱為簡(jiǎn)單隨機(jī)子樣.獲得簡(jiǎn)單隨機(jī)子樣的抽樣方法叫簡(jiǎn)單隨機(jī)抽樣.,代表性——即子樣( )的每個(gè)分量 與總體

45、 具有相同的概率分布。,從簡(jiǎn)單隨機(jī)子樣的含義可知,樣本 是來(lái)自總體 、與總體 具有相同分布的隨機(jī)變量.,簡(jiǎn)單隨機(jī)抽樣,例如:要通過(guò)隨機(jī)抽樣了解一批產(chǎn)品的次品率,如果每次抽取一件產(chǎn)品觀測(cè)后放回原來(lái)的總量中,則這是一個(gè)簡(jiǎn)單隨機(jī)抽樣。,但實(shí)際抽樣中,往往是不再放回產(chǎn)品,則這不是一個(gè)簡(jiǎn)單隨機(jī)抽樣。但當(dāng)總量N很大時(shí),可近似看成是簡(jiǎn)單隨機(jī)抽樣。,統(tǒng)

46、計(jì)量,定義 設(shè)( )為總體X的一個(gè)樣本, 為不含任何未知參數(shù)的連續(xù)函數(shù),則稱 為樣本( )的一個(gè)統(tǒng)計(jì)量。,則,例如: 設(shè) 是從正態(tài)總體 中抽取的一個(gè)樣本,其中 為已知參數(shù)

47、, 為未知參數(shù),,是統(tǒng)計(jì)量,不是統(tǒng)計(jì)量,幾個(gè)常用的統(tǒng)計(jì)量,樣本均值(sample mean),設(shè) 是總體 的一個(gè)樣本,,樣本方差(sample variance),樣本均方差或標(biāo)準(zhǔn)差,它們的觀測(cè)值用相應(yīng)的小寫字母表示.反映總體X取值的平均,或反映總體X取值的離散程度。,幾個(gè)常用的統(tǒng)計(jì)量,設(shè) 是總體 的一個(gè)樣本

48、,,子樣的K階(原點(diǎn))矩,幾個(gè)常用的統(tǒng)計(jì)量,設(shè) 是總體 的一個(gè)樣本,,子樣的K階中心矩,它包括兩個(gè)方面——數(shù)據(jù)整理 計(jì)算樣本特征數(shù),數(shù)據(jù)的簡(jiǎn)單處理,為了研究隨機(jī)現(xiàn)象,首要的工作是收集原始數(shù)據(jù).一般通過(guò)抽樣調(diào)查或試驗(yàn)得到的數(shù)據(jù)往往是雜亂無(wú)章的,需要通過(guò)整理后才能顯示出它們的分布狀況。,數(shù)據(jù)的簡(jiǎn)單處理是以一種直觀明

49、了方式加工數(shù)據(jù)。,計(jì)算樣本特征數(shù):,數(shù)據(jù)的簡(jiǎn)單處理,(1)反映趨勢(shì)的特征數(shù),樣本均值,中位數(shù):數(shù)據(jù)按大小順序排列后,位置居中的那個(gè)數(shù) 或居中的兩個(gè)數(shù)的平均數(shù)。,眾數(shù):樣本中出現(xiàn)最多的那個(gè)數(shù)。,數(shù)據(jù)的簡(jiǎn)單處理,(2)反映分散程度的特征數(shù):極差、四分位差,極差——樣本數(shù)據(jù)中最大值與最小值之差,,四分位數(shù)——將樣本數(shù)據(jù)依概率分為四等份的3個(gè)數(shù)椐, 依次稱為第一、第二、第三四

50、分位數(shù)。,第一四分位數(shù)Q1:,第二四分位數(shù)Q2:,第三四分位數(shù)Q3:,例1 為對(duì)某小麥雜交組合F2代的株高X進(jìn)行研究,抽取容量為100的樣本,測(cè)試的原始數(shù)據(jù)記錄如下(單位:厘米),試根據(jù)以上數(shù)據(jù),畫出它的頻率直方圖,求隨機(jī)變量X的分布狀況。 87 88111 91 73 70 92 98105 94 99 91 98110 98 97 90 83 92 88 86 94102 99

51、 89104 94 94 92 96 87 94 92 86102 88 75 90 90 80 84 91 82 94 99102 91 96 94 94 85 88 80 83 81 69 95 80 97 92 96109 91 80 80 94102 80 86 91 90 83 84 91 87 95 76 90 91

52、 77103 89 88 85 95 92104 92 95 83 86 81 86 91 89 83 96 86 75 92,第一.整理原始數(shù)據(jù),加工為分組資料,作出頻率分布表,畫直方圖,提取樣本分布特征的信息.步驟如下:,1.找出數(shù)據(jù)中最小值m=69,最大值M=111,極差為 M-m=42,2.數(shù)據(jù)分組,根據(jù)樣本容量n的大小,決定分組數(shù)k。,一般規(guī)律 30≤n≤40

53、 5≤k≤6 40≤n≤60 6≤k≤8 60≤n≤100 8≤k≤10 100≤n≤500 10≤k≤20,數(shù)據(jù)分組數(shù)參考表,一般采取等距分組(也可以不等距分組),組距等于比極差除以組數(shù)略大的測(cè)量單位的整數(shù)倍。,本例取k=9.,本例測(cè)量單位為

54、1厘米,組距為,3.確定組限和組中點(diǎn)值。,注意:組的上限與下限應(yīng)比數(shù)據(jù)多一位小數(shù)。,當(dāng)取a=67.5,b=112.49(a略小于m,b略大于M,且a和b都比數(shù)據(jù)多一位小數(shù)),分組如下:,一般根據(jù)算式: 各組中點(diǎn)值 組距=組的上限或下限,[67.5,72.5) [72.5,77.5) [77.5,82.5) [82.5,87.5) [87.5,92.5)

55、 [92.5,97.5) [97.5,102.5) [102.5,107.5) [107.5,112.5),組中值分別為:70 75 80 85 90 95 100 105 110,4.將數(shù)據(jù)分組,計(jì)算出各組頻數(shù),作頻數(shù)、頻率分布表,作頻率直方圖,5.作出頻率直方圖,以樣本值為橫坐標(biāo),頻率/組距為縱坐標(biāo);,以分組區(qū)間為底,以 為高,

56、,從頻率直方圖可看到:靠近兩個(gè)極端的數(shù)據(jù)出現(xiàn)比較少,而中間附近的數(shù)據(jù)比較多,即中間大兩頭小的分布趨勢(shì),——隨機(jī)變量分布狀況的最粗略的信息。,在頻率直方圖中, 每個(gè)矩形面積恰好等于樣本值落在該矩形對(duì)應(yīng)的分組區(qū)間內(nèi)的頻率,即,頻率直方圖中的小矩形的面積近似地反映了樣本數(shù)據(jù)落在某個(gè)區(qū)間內(nèi)的可能性大小,故它可近似描述X的分布狀況。,樣本方差 樣本標(biāo)準(zhǔn)差 Q1 Q3 極差 四分位差 68.6909 8.288

57、 85.25 95 42 4.875,第二.計(jì)算樣本特征數(shù),1.反映集中趨勢(shì)的特征數(shù):樣本均值、中位數(shù)、眾數(shù)等,樣本均值MEAN 中位數(shù)MEDIAN 眾數(shù),2.反映分散程度的特征數(shù):樣本方差、樣本標(biāo)準(zhǔn)差、 極差、四分位差等,上述差異特征統(tǒng)計(jì)量的值越小,表示離散程度越小.,MTB > set c1DATA> 87 88 111 91 73 70

58、 92 98 105 94 99 91 98 DATA> 110 98 97 83 90 83 92 88 86 94 102 99 89 104 DATA> 94 94 92 96 87 94 92 86 102 88 75 90 90 80 DATA> 84 91 82 94 99 102 91 96 94 94

59、 85 88 80 83 DATA> 81 69 95 80 97 92 96 109 91 80 80 94 102 DATA> 80 86 91 90 83 84 91 87 95 76 90 91 77 103DATA> 89 88 85 95 92 104 92 95 83 86 81 86 91 89 83 DA

60、TA> 96 86 75 92MTB > endMTB > describe c1,例1 DOS狀態(tài)下的MINITAB操作,顯示: N MEAN MEDIAN TRMEAN STDEV C1 100 90.300 91.000 90.322 8.288 SEMEAN MIN

61、 MAX Q1 Q3 C1 0.829 69.000 111.000 85.250 95.000,中位數(shù),第一四分位數(shù),第三四分位數(shù),MTB>CODE (67.5:72.49)70 (72.5:77.49)75 (77.5:82.49)80 (82.5:87.49)85

62、 (87.5:92.49)90 (92.5:97.49)95 (97.5:102.49)100 (102.5:107.49)105 (107.5:112.49)110 C1 C2MTB>TALLY C2;SUBC>ALL.,,將C1數(shù)據(jù)列重新編碼,并保存到C2數(shù)據(jù)列,,顯示各列數(shù)據(jù)的頻數(shù)、累計(jì)頻數(shù)、頻率、累計(jì)頻率

63、,C2 COUNTS CUMCNTS PERCENTS CUMPCENTS (頻數(shù)) (累計(jì)頻數(shù)) (頻率) (累計(jì)頻率) 1 2 0.02 0.02 5 7 0.05

64、 0.07 10 17 0.10 0.17 18 35 0.18 0.35 30 65 0.30

65、 0.65 18 83 0.18 0.83 10 93 0.10 0.93 4 97 0.04

66、 0.97 3 100 0.03 1.00,顯示結(jié)果,作業(yè) 習(xí)題五 P111 2;3;4預(yù)習(xí) 第三節(jié) 統(tǒng)計(jì)量的分布,統(tǒng)計(jì)量的分布,統(tǒng)計(jì)量 是樣本 的不含任何未知數(shù)的函數(shù),它是一個(gè)隨機(jī)變量,統(tǒng)計(jì)量的分布稱為抽樣分布。,由于正態(tài)總體是最

67、常見(jiàn)的總體,因此這里主要討論正態(tài)總體下的抽樣分布.,由于這些抽樣分布的論證要用到較多的數(shù)學(xué)知識(shí),故在本節(jié)中,我們主要給出有關(guān)結(jié)論,以供應(yīng)用.,正態(tài)總體樣本均值的分布,設(shè)總體 , 是 的一個(gè)樣本, 則樣本均值服從正態(tài)分布,U—分布,概率分布的分位數(shù)(分位點(diǎn)),如圖.,P{X≥x?} =?,,,雙側(cè)? 分位數(shù)或雙側(cè)臨界值的特例,當(dāng)X的分布關(guān)于y軸對(duì)稱時(shí),,則稱 為X分布的雙

68、側(cè)?分位數(shù)或雙側(cè)臨界值.,如圖.,若存在 使,U—分布的上側(cè)分位數(shù),對(duì)標(biāo)準(zhǔn)正態(tài)分布變量U~N(0, 1)和給定?的,上側(cè)?分位數(shù)是由:,P{U≥u?} =,即,P{U<u?} =1-?,?(u?) =1-?,確定的點(diǎn)u?.,如圖.,例如, ?=0.05,而,P{U≥1.645} =0.05,所以, u0.05 =1.645.,U—分布的雙側(cè)分位數(shù),的點(diǎn)u?/2為標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)?分位數(shù)或雙側(cè)臨界值.,如圖

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論