版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、概率論與數(shù)理統(tǒng)計輔導(dǎo),王曉謙wxqmath@263.net,引言 數(shù)學是刻畫自然規(guī)律和社會規(guī)律的科學語言和有效工具。在自然科學、技術(shù)科學、經(jīng)濟科學、社會科學的應(yīng)用不斷深入。與計算機的結(jié)合,使以前只有理論而無法計算的內(nèi)容找到了廣闊的應(yīng)用領(lǐng)域。 概率和統(tǒng)計具有不同于其他數(shù)學分支的思維方式。我們在教學實踐中既要體會概率和統(tǒng)計思想與其他數(shù)學思想的不同,但也必須注意到它們與其他數(shù)學分支之間的密切關(guān)系。要培養(yǎng)利用概率、
2、統(tǒng)計的思想思考、處理問題的能力。,第一部分 概率第一節(jié) 隨機事件及其概率A. 隨機現(xiàn)象與隨機事件,,概率論就是研究隨機現(xiàn)象的數(shù)學分支。,研究隨機現(xiàn)象的第一步:定義事件 在給定條件下,可能發(fā)生這樣的結(jié)果,也可能發(fā)生那樣的結(jié)果,這就是隨機現(xiàn)象。 特點:一個隨機現(xiàn)象,我們知道所有可能的結(jié)果有哪些,但是在條件沒有實現(xiàn)之前,無法判斷會出現(xiàn)哪個結(jié)果。隨機事件:我們把在給定條件實
3、現(xiàn)之后,可以判斷是否發(fā)生的結(jié)果叫做隨機事件,用大些英文字母表示。,例如,研究某個射擊運動員的射擊水平。 在正常條件下,他射出一發(fā)子彈,落點會是隨機的,都有哪些隨機事件呢?無窮多個隨機事件:A:十環(huán) B:九環(huán),……,E:沒有脫靶,F(xiàn):脫靶,……,等等等等,這些都是可能發(fā)生的結(jié)果,都是隨機事件。 只要實現(xiàn)一次條件,即在正常條件下,他射出一發(fā)子彈,哪個事件發(fā)生,哪個
4、沒有發(fā)生,一目了然。,兩個特例: 不可能事件:用字母Φ表示。 例如上面例子里,“既沒有脫靶,也沒有上靶”這個事件就是不可能事件。 必然事件:用字母Ω表示。 例如上面例子里,“脫靶或沒有脫靶”就是一個必然事件。,,B. 事件的概率 事件的概率就是刻劃該事件在一次試驗中發(fā)生的可能性大小的數(shù)量指標。設(shè)A是一個事件,用P(A)表示這個事件的
5、概率。 概率的第一個基本性質(zhì):對于任意事件A,,,這是一種要求!,例:七個有變異的豌豆特征(P89) 子的形狀,子的顏色,豆莢的形狀,豆莢外衣的顏色,未成熟豆莢的顏色,花的位置,豆梗的長度 孟德爾把綠色豌豆與黃色豌豆雜交,結(jié)果下一代都是黃色豌豆。 對其他六個特征做試驗,也有類似的結(jié)果。 我們把這一代叫做雜交第一子代,簡稱為子一代。問題是,用它們作為種子,
6、下一代會怎樣呢?這是中學教師孟德爾的問題,這個問題的解決讓他名崔青史。(1822~1884),孟德爾把雜交黃色豌豆作為第一子代F1,培育出第二子代F2。在第二子代中豌豆會是什么顏色的呢?他提出了一種遺傳學理論,用這個理論來預(yù)測第二子代的顏色。他的預(yù)言是: 75%的黃色豌豆 25%綠色豌豆即兩者比例為3:1。,【用G代表綠色基因,Y代表黃色基因,則第一子代F1可表示為YG。 這
7、樣的豌豆自由雜交,在第二子代F2中會出現(xiàn)四種情況:YY,YG,GY,GG。每種情況出現(xiàn)的機會均等。其中 黃色:YY,YG,GY; 綠色:GG所以黃色豌豆與綠色豌豆數(shù)量的比例應(yīng)該是3:1?!?課本上89頁表7-1-1的數(shù)據(jù)就是試驗觀測結(jié)果。這里用的是頻率估計概率的思想。,我們不知道當初老孟是先有的數(shù)據(jù)還是先做的理論分析。不過大多數(shù)人相信是 1、先做的試驗, 2、然后
8、利用觀測到的現(xiàn)象(概率統(tǒng)計思想)提 出大膽的理論, 3、利用提出的理論對觀測結(jié)果作出解釋, 4、再利用理論作預(yù)測, 5、然后通過試驗驗證理論預(yù)測的可靠性。這是科學研究的一種基本方法。,為了估計事件A發(fā)生的概率,我們在相同條件下進行重復(fù)試驗,記錄試驗次數(shù)n和事件A發(fā)生的次數(shù)m,然后用事件A在這n次試驗中發(fā)生的頻率作為事件A發(fā)生的概率的估計值,求概率之基本方法——試驗
9、法。有誤差。,,概率的第二個基本性質(zhì) :,這不是公式,是一種規(guī)范化要求。,第二節(jié) 古典概型 試驗或觀測只有有限多種可能的基本結(jié)果,這些結(jié)果具有以下特點: (1)、這些可能結(jié)果有限多個;(2)、每次試驗,這些結(jié)果中必有一個會發(fā)生,而且 只有一個會發(fā)生;(3)、每個結(jié)果的發(fā)生是等可能的。 滿足前兩條的結(jié)果叫基本事件。假設(shè)共有n個
10、基本事件。如果還滿足第三條的話,這樣的隨機現(xiàn)象的概率計算模型就叫做古典概型。,古典概型里,每個基本事件的概率都是,,.,如果事件A的發(fā)生等價于m個基本事件之一發(fā)生,那么事件A發(fā)生的概率就是,第三節(jié) 幾何概型 試驗或觀測有無限多種可能的基本結(jié)果,這些結(jié)果具有以下特點:(1)、這些可能結(jié)果有無限多個;(2)、每次試驗,這些結(jié)果中必有一個會發(fā)生,而且 只有一個
11、會發(fā)生;(3)、每個結(jié)果的發(fā)生是等可能的。這樣的隨機現(xiàn)象的概率計算模型就叫做幾何概型。,方程有實根的概率是多少?,例一、方程,,中的系數(shù),分別在,區(qū)間隨機取值,那么這個,解:我們把,放到一起考慮,,那么任取,中的,兩個值作為,,矩形區(qū)域 S 中任取一個點,把橫坐標作為,,可以看作是在平面直角坐標系中,,,縱坐,。,坐標作為,,方程有實根等價于,這等價于要求點必須取在區(qū)域A中。所以,,例二、怎樣求一個不規(guī)則圖形的面積?
12、 做正方形S,隨機向圖中投點,計算落在A中的點的頻率,A的面積的近似值就是該頻率與S的面積的乘積。,例三 貝特朗奇論 在圓內(nèi)任取一弦,問其長度超過內(nèi)接等邊三角形 邊長的概率是多少? 貝特朗給出了三中求解方法。,設(shè)該圓半徑為,則內(nèi)接等邊三角形邊長為,記弦的長度為,,(1)、由于弦長只跟它與圓心的距離有關(guān),而與方向無關(guān),因而可假定弦垂直于某直徑EF。如圖所示:,當且僅當弦AB與圓形的距離小于,時,
13、有,所以所求概率為,(2)、弦長由其中點唯一確定。當且僅當弦的中點落到半徑為,的同心圓內(nèi)時,弦長,所以,如圖所示,,所求概率為,(3)、因為任何弦都交圓于兩點,并且具有對稱性,所以不妨固定弦的一端A于圓周上,另一端在圓周上任意取。如圖,考慮等邊三角形ADE,如B落在角A所對應(yīng)的弧,上,則弦長,所以所求概率為,第四節(jié) 互斥事件與概率兩個事件互斥 一組事件是互斥的 設(shè)是A,B是兩個互斥事件,我們用 A+B表
14、示一個新的事件,即“A,B中至少有一件發(fā)生”這個事件。,,,,是一組互斥事件,那么,中至少有一個發(fā)生這個事件。,表示,概率的第三個基本性質(zhì)要求,例如,,表示某射擊運動員打中k環(huán)這個事件,k=1,2,…,10. 那么它們是10個互斥事件。如果知道每個事件的概率,我們就可以算出許多其它事件的概率。例如打到8環(huán)以內(nèi)這樣的事件的概率。,,例如,,對立事件:如果兩個事件互斥,而且每次試驗或觀測兩個事件中必有一個發(fā)生,那么這
15、兩個事件就叫做一對對立事件。如果用A表示其中的一個事件,另一個就用,來表示。顯然,所以,或等價地,例、求500人中至少有一人生日在今天的概率。解法一、用A表示“500人中至少有一人生日在今天”,用,表示“500人中恰有k人生日在今天”,k=0,1,…,500。,互斥,而且,所以,則不難發(fā)現(xiàn)這501個事件,由于,所以,解法二、顯然,表示,所以,“500人中沒有一人在今天過生日”,,我們可以求出,比較這兩個結(jié)果你可以發(fā)現(xiàn)一個公式
16、,即,事實上,,第五節(jié) 獨立性概念 積事件:設(shè)A,B是兩個隨機事件,稱“事件A與B同時發(fā)生”這個事件為事件A與事件B的積事件,記作AB。類似地,用,表示一個新事件,該事件的發(fā)生等價于,這n個事件同時發(fā)生。,例如:,表示第k次投擲硬幣出現(xiàn)正面,k=1,2,……,,就表示“連續(xù)投擲硬幣n次都出現(xiàn)正面”這個隨機事件。,那么,定義:稱事件A,B相互獨立,如果,一般地,稱一組事件相互獨立,如果其中任意有限個同時發(fā)生的概率等于它們
17、每一個發(fā)生的概率的乘積。 所以,如果知道事件相互獨立,那么事件同時發(fā)生的概率就等于每一個發(fā)生的概率的積。,例、求500人中至少有一人生日在今天的概率。,表示,不難理解,也是相互獨立的一組事件,而且,,方法三、用,第k個人在今天過生日,k=1,2,……,500。,則我們一般認為這500個事件相互獨立。顯然,所以,,連續(xù)投擲一枚硬幣n次,計算其中恰好出現(xiàn) k次正面的概率,,這個問題有如下三點要注意: (1).每次試驗(或觀測
18、)只有兩種可能的結(jié)果,其 一記為 A,另一個就是,(2).每次試驗(或觀測)結(jié)果不受其它試驗(或觀 測)結(jié)果的影響。即各次試驗或觀測相互獨立。,(3).每次A發(fā)生的概率都相同,記為,這個問題的答案就是二項概率公式:,這種隨機試驗或觀測我們叫做獨立試驗序列。在研究獨立試驗序列時,一個基本問題就是,n次試驗中事件A恰好發(fā)生k次的概率是多少?,,特別地,所以,每個人是否在今天過生日相互獨立。所以500人中恰有
19、k人在今天過生日的概率為,方法四、每個人在今天過生日的概率都是,例、求500人中至少有一人生日在今天的概率。,某車間有十臺機床,彼此獨立工作。據(jù)統(tǒng)計每臺機床每小時有12分鐘在工作,工作時需8千瓦的電力。供電部門供多少電給該車間合適呢?,該車間恰好有k臺機床在同時工作的概率為,解:用A表示一臺機床在工作,則,我們把恰好有0,1,2,……,10臺機床在同時工作的概率都計算出來,列在下表里:,,從表中數(shù)據(jù)可以看出,,所以,供給,千瓦電力就可以
20、保證有0.9936的,概率不會誤事。完全沒有必要供給80千瓦的電力。,第五節(jié) 隨機變量簡介 隨機變量是這樣的一種“函數(shù)”,它把隨機試驗的每一個基本結(jié)果對應(yīng)成一個實數(shù)。 例如,擲一枚硬幣有兩個基本結(jié)果,正面和反面。我們?nèi)是這樣的一種對應(yīng)法則: 如果擲出正面,取X=1,如果擲出反面,取X=-1.則X就是一個隨機變量,取-1和1兩個值,到底取哪個在實驗沒有結(jié)束之前不能確定,即取值是隨機的。,所有可能取值的概率
21、總和必為1。,,我們關(guān)心的是隨機變量的取某個值或取值落在某個范圍里的概率。怎樣計算,依不同情況而定。 隨機變量有兩種類型,一種是它的所有可能的取值可以一一列舉出來。例如上面提到的。這樣的隨機變量叫做離散型隨機變量。對于這樣的隨機變量,我們要搞清楚它可能取的每一個值,而且要求出取每一個值的概率。 例如,投擲一個硬幣100次,用X表示其中出現(xiàn)的正面次數(shù),則所有可能的取值是0,1,2,……,100,且,所有可能取值的概率總和
22、必為1。,,對于隨機變量,我們常常會求它的取值的平均值,還要考慮它的取值的分散程度。,那么這個運動員的水平該怎樣評價呢?我們計算一下他打一槍平均來說可能的環(huán)數(shù):,這個數(shù)叫隨機變量X的數(shù)學期望。,例如,X表示一個射擊運動員命中的環(huán)數(shù),則它是一個隨機變量。假設(shè)我們已經(jīng)知道X取每一個值的概率,如下表所示:,相對于數(shù)學期望,隨機變量的取值有時偏大,有時偏小,那么平均偏差該怎樣計算呢?先把這些偏差做平方,然后再平均??紤]到每一個偏差出現(xiàn)的可能性實
23、際上就是原先的取值對應(yīng)的概率,所以也要用求數(shù)學期望那樣的方法來求偏差平方的平均值。例如,上面的X,,由上表可見,偏差平方的平均值為,這個數(shù)叫隨機變量X的方差。,,,隨機變量的數(shù)學期望反映了它取值的平均大小,是一個平均值; 隨機變量的方差反映了它相對于平均值而言的分散程度。方差越小,取值的分散程度越小。如果方差為0,那這個隨機變量就幾乎是一個常數(shù)。,例: 據(jù)氣象預(yù)報,某地區(qū)下月有小洪水的概率為0.25,有大洪水的概率為0
24、.01。設(shè)工地上有一臺大型設(shè)備,為保護設(shè)備,有以下三種方案: 1、運走設(shè)備,需花費3800元; 2、建一保護墻,需花費2000元。但無法抵御大洪水,大洪水來臨的話,設(shè)備受損,損失60000元; 3、不采取任何措施,祈禱不發(fā)生洪水。大洪水來臨損失60000元,小洪水來臨損失10000元。試比較哪種方案好。,解:分別用X,Y,Z表示三種方案下可能帶來的費用,則都是隨機變量。我們把各個隨機變量的分布列在
25、下表里:,則E(X)=3800E(Y)=2600E(Z)=3100平均來說,方案二比較好。,第二部分 統(tǒng)計統(tǒng)計在我們國家有兩種意義:社會統(tǒng)計 數(shù)理統(tǒng)計我們要討論的是數(shù)理統(tǒng)計。,引言 你要研究什么?研究對象——總體 由全體成員構(gòu)成。例如 1、某地區(qū)高中學生的身高發(fā)育情況 2、袁隆平新水稻品種的畝產(chǎn)量 3、某班學生的數(shù)學學習成
26、績 4、某個學生的數(shù)學學習成績 5、姚明的技術(shù)水平(投籃,三分球,命中 率, 籃板等) 6、學習成績與性別的關(guān)系 7、紅樓夢前80回與后40回的用字、用詞的 差異,為什么要學習統(tǒng)計?1、當我們要對總體進行研究時,由于種種原因,不
27、 可把每個個體的特征都記錄研究;2、不可能收集到所有數(shù)據(jù);3、可能收集到所有數(shù)據(jù),但是要花費大量的財力物 力;4、即使收集到了所有的數(shù)據(jù)資料,面對大量的雜亂 無章的數(shù)據(jù),不用科學的方法處理,我們也無法 得到想要得到的信息。,統(tǒng)計正是處理上面遇到的窘境的理想手段:1、怎樣收集數(shù)據(jù)資料;2、怎樣對收集到的數(shù)據(jù)資料進行科學的分析處理;3、合理解釋處理結(jié)果。,樣本
28、 從總體中抽取一部分個體出來,測量其相應(yīng)的數(shù)量指標和特征并記錄。這一部分個體放到一起就叫做一個樣本。 一般來說,我們總是把測得的數(shù)據(jù)全體叫做樣本。 樣本中所考慮的個體的數(shù)目叫樣本容量。,例如:1、隨機抽查某地區(qū)100名高中二年級學生測量身高得到的200個數(shù)據(jù); 2、將水稻新品種種植在其他條件相同的10塊試驗田里,收割后測得的10個畝產(chǎn)量數(shù)據(jù);,第一節(jié) 抽樣方法 A、簡單隨機抽樣法
29、 從有N個個體的總體中不重復(fù)地取出n個個體,n<N,每個個體都有相同的機會被抽到。抽簽法: 編號、制簽、攪勻、隨機抽簽k次隨機數(shù)表:省掉制簽、攪勻、隨機抽簽過程,隨機數(shù)表是一個重要工具。 它是一張由數(shù)字0到9構(gòu)成的數(shù)表,可能三個三個地由三位數(shù)構(gòu)成。也可能由四位數(shù)構(gòu)成 。 我們可以用某種編程語言產(chǎn)生隨機數(shù)表。 用Excel就可以方便地產(chǎn)生隨機數(shù)表:,1、在單
30、元格C1里輸入 =RAND() 產(chǎn)生一個0到1之間的隨機數(shù),拖拽C1的填充柄就可以產(chǎn)生不同的隨機數(shù)。65536行,可產(chǎn)生大量隨機數(shù)。(0,1之間隨機數(shù)) 2、輸入 =INT(100*RAND())產(chǎn)生0到99之間的整隨機數(shù)。 (兩位隨機數(shù))3、隨機數(shù)發(fā)生器 選擇 工具——數(shù)據(jù)分析——隨機數(shù)發(fā)生器(隨機數(shù)) 4、 計算器可能會有不同的方法,要參考有關(guān)說明書。,B、系統(tǒng)抽樣 分成相同的n組,每
31、組隨機抽取一個。C、分層抽樣 總體由差異明顯的幾個部分組成,各部分稱為層。根據(jù)比例在各層進行抽樣。,第二節(jié) 總體分布的估計統(tǒng)計的任務(wù): 在統(tǒng)計里我們感興趣的是:如果從總體中任取一個個體,這個個體的某個或幾個數(shù)量指標會有什么特征?我們不知道其指標會是多少。統(tǒng)計的任務(wù)就是希望搞清楚,任取一個個體,其指標會遵循什么規(guī)律。 當然不會是一個確定性的規(guī)律,而是一個“統(tǒng)計規(guī)律”
32、,就是一個具有概率意義的規(guī)律。例如某地某段時間里高溫出現(xiàn)概率;某校高一年級男生的身高在某個范圍里的概率。,從總體中任取一個個體,其指標不知道會是多少,就把它作為一個隨機變量對待。 對總體的研究,就是要達到搞清楚這個隨機變量的分布的目的。這就是統(tǒng)計的基本目的。 在概率論里,我們研究各種分布。在統(tǒng)計里,我們要利用樣本數(shù)據(jù)確定表示總體指標的那個隨機變量到底應(yīng)該是什么分布。如果分布完全是已知的,那統(tǒng)計就沒有任何意義了。,
33、參數(shù)問題:對總體指標的數(shù)字特征,比如數(shù)學期望,方差,中為數(shù)等的估算、刻畫。 非參數(shù)問題多個隨機變量之間的關(guān)系問題,所以,要知道我們會遇到的問題:刻劃總體分布刻劃總體數(shù)字特征刻劃各種關(guān)系 在所有的問題中,歸根結(jié)底是估計概率的問題,而估計概率最基本的方法,就是利用頻率。要計算頻率,就要抽樣——做實驗獲取數(shù)據(jù)。,由于我們是從樣本出發(fā)做出的結(jié)論,結(jié)論勢必會有出錯的可能。 數(shù)理統(tǒng)計的結(jié)論不同于
34、其他的結(jié)論,其精華就在于:在給出結(jié)論的同時,還會告訴你,這個結(jié)論出錯的概率有多大。,總體分布的估計方法頻率分布表全距 組距 頻數(shù) 頻率 頻率/組距 頻率分布直方圖與折線圖 頻率直方圖,第三節(jié) 總體特征數(shù)的估計 總體分布的特征數(shù)有各種各樣,我們在概率論里叫它們作數(shù)字特征。例如數(shù)學期望,方差,中位數(shù),眾數(shù),等等。 在統(tǒng)計里這些往往都是不知道的。統(tǒng)計的任務(wù)之一就是利用樣本數(shù)
35、據(jù)來估計這些數(shù)字特征。在這里就是要向?qū)W生介紹其中最基本的幾種估計量。,A、平均數(shù)的估計 平均數(shù)指總體X平均數(shù),即數(shù)學期望E(X),一般用希臘字母μ表示。怎樣用樣本值來估計這個數(shù)呢? 設(shè)我們得到的樣本為,,那么我們就用,來做為μ的估計值,有時記為,這個公式叫做樣本均值或樣本平均數(shù)。,在統(tǒng)計研究中我們正是要討論這種公式的意義和價值,而不會對具體的計算結(jié)果說它的優(yōu)劣。 為什么?因為再好的公式也會有計算出
36、糟糕結(jié)果的時候。例如抽樣的時候碰巧樣本取的不好,這是有可能的。,樣本均值的最大優(yōu)點有兩個,無偏性和最小方差性:,總體X的方差是,描述了總體取值相對于其平均值μ的離散程度。我們要估計方差,就要先算出μ的估計來,然后看看樣本值相對于這個估計值的離散程度有多大。所以就用,,作為總體方差的估計值。這就是樣本方差。對其開方,就得到樣本標準差。,例如,要對一種新的水稻品種和一種老的品種做比較,看看新品種到底好不好,怎樣比?我們需要進行抽樣,得到
37、樣本: 對每個品種種植試驗,例如,新品種種m塊試驗田,得到m個畝產(chǎn)數(shù)據(jù),老品種種n塊試驗田,得到n個畝產(chǎn)數(shù)據(jù)。我們就有了兩個樣本。 分別計算相應(yīng)的樣本均值和樣本方差。樣本均值越大越好,樣本方差則越小越好。,MODE鍵 +3鍵:進入統(tǒng)計模式SHIFT鍵+KAC鍵:開始輸入數(shù)據(jù)每輸入一個數(shù)據(jù)按一次 DATA鍵輸完后,KOUT鍵+n鍵,顯示數(shù)據(jù)個數(shù)SHIFT+1鍵:顯示樣本均值SHIFT+2鍵:顯示
38、樣本標準差,再按平方鍵可得樣本方差。 KOUT+2鍵可計算樣本值的總和,叫回歸方程。,,第四節(jié) 線性回歸方程 有兩個量 x 和 y,x 的變化會導(dǎo)致 y 發(fā)生變化。但是,并不是每一個x值唯一地對應(yīng)一個y值,即使已知x的取值,也無法完全確定y的取值,它有隨機性。y與x之間不是我們以前學過的函數(shù)關(guān)系,這種關(guān)系我們叫相關(guān)關(guān)系。對于具有相關(guān)關(guān)系的 y 和 x ,我們怎樣利用數(shù)學知識比較準確地刻畫它們之間的關(guān)系呢?
39、我們希望能夠搞清楚,如果不考慮隨機因素,y與x之間的確定性關(guān)系是什么?,.,叫回歸方程。,這就是傳說中的回歸模型。相應(yīng)的函數(shù)叫回歸函數(shù),而把,設(shè)這個確定性關(guān)系可以用函數(shù)f(x)表示。那么y與x之間的相關(guān)關(guān)系應(yīng)該用下式來刻畫:,回歸分析的基本理論任務(wù)有三個:1、確定到底有沒有這種回歸關(guān)系?2、如果有,回歸函數(shù)是什么樣子的?3、誤差項作為隨機變量服從什么分布?至少應(yīng)該估 計出它的數(shù)學期望和方差。至于它的
40、應(yīng)用,非常廣泛。,為了解決以上問題,必須有樣本!作n次觀測,每次觀測一個x值和它相應(yīng)的y值,依次記為,這就是樣本。在這一章我們假設(shè)已經(jīng)得到了樣本,下面解決相應(yīng)的問題。樣本一般用一張表列出。,,的形式。這樣的回歸分析叫線性回歸分析,相應(yīng)的關(guān)系叫線性回歸關(guān)系。,我們要先考慮選擇一個適當?shù)暮瘮?shù),然后看看這個函數(shù)是不是合適。在中學課本里,我們選擇線性函數(shù),就是取,如果y與x之間完全沒有任何線性依賴關(guān)系,那么給定x對計算y沒有任何意義。這時b自然
41、應(yīng)該是0。所以在線性回歸里如果b幾乎是0,那么線性回歸就沒有什么意義了。,我們也正是通過數(shù)據(jù)計算這兩個系數(shù)的,而且也是通過判斷 b與 0的接近程度來判斷 y 與 x 之間有沒有線性回歸關(guān)系的。,散點圖,回歸系數(shù)的計算選用怎樣的直線最好呢?假如我們選定了一條直線是,那么如果不考慮隨機因素,把x帶入這個方程計算出來的,應(yīng)該與觀測到的y值越接近越好。如果把樣本里的所有x的取值依次帶入,就可以計算得到相應(yīng)的,好的直線應(yīng)該使得這里計算出來的值
42、與相應(yīng)的觀測值,相差不大。,把所有的誤差的平方累積起來就是,我們要取這樣的,,使得,達到最小。,最小二乘思想,,,,其中,不難看出,為使,達到最小,只要取,就可以了。而且這時,達到最小值,。,我們得到的回歸直線為,,帶入到此方程,即可得到一個相應(yīng)的,此值可以看作是,的計算值。,把樣本中的,,,我們把,叫做殘差平方和。回歸直線就是使殘差平方和達到最小的那條直線。,越小,說明直線回歸越好。這就部分地解決了我們判斷線性回歸好不好的問題。,,這
43、里還得到一個副產(chǎn)品:,從而,,,所以,相關(guān)系數(shù),,,可見,|r|越接近于1,直線回歸越好。,如果|r|接近于1,F(xiàn)值就會比較大。但是如果沒有線性相關(guān)關(guān)系,F(xiàn)值較大的可能性很小。所以據(jù)此判斷有線性相關(guān)關(guān)系。,事實上,如果沒有線性相關(guān)關(guān)系,那么,例:教材73頁例一的數(shù)據(jù)。用 Excel計算:1、輸入數(shù)據(jù)2、作散點圖:插入—圖表—散點圖3、作回歸方程:激活散點圖—點一個散點—右鍵—添加趨勢線—線性—選項卡—顯示公式,R平方值回歸,也可
44、以用計算器:MODE+2 進入回歸狀態(tài)1、輸入數(shù)據(jù):SHIFT+KAC(即開關(guān)鍵)開始輸入數(shù)據(jù):95+(xD,yD)(四排一鍵)+6.2+DATA鍵(最后一鍵)這樣就完成一對數(shù)的輸入。重復(fù)地輸入所有數(shù)據(jù);2、SHIFT+A (即7鍵) 給出 a,SHIFT+B (即8鍵)給出b;3、SHIFT+r(即9鍵)給出相關(guān)系數(shù);4、輸入一個x值+y^鍵(四排二鍵)給出對應(yīng)的y的預(yù)測值;5、輸入一個y值+SHIFT+x^鍵(四排二鍵
45、)給出對應(yīng)的x的控制值。,第五節(jié) 獨立性檢驗,美國在殺人犯的死刑判決中存在種族差異?一位叫Radelet的研究人員對此進行了研究。 怎樣研究? 總體:美國殺人犯 問題:A表示殺人犯是白人, B表示被判處死刑。A,B這兩個隨機事件是否獨立?,A,B如果獨立,則,這些式子用一句話說就是: 殺人犯是白人還是黑人和判不判死刑沒有關(guān)系我們怎樣來判斷這個言論的對錯呢?,用統(tǒng)計
46、的方法,估計上面涉及到的每一個概率,看看估計的結(jié)果和上面的等式之間會不會發(fā)生沖突。 所以,首先要抽樣。,在殺人犯中任取326人,其中白人160名,黑人166名。結(jié)果發(fā)現(xiàn):160名白人中有19人被判死刑,141人未判死刑; 166名黑人中有17人被判死刑,149人未判死刑。 為了便于說明,我們把這些數(shù)據(jù)總結(jié)在如下的表格中:,我們先列出上面提到的所有概率的估
47、計值:,,,,,,,,,如果A,B相互獨立,那么下面各數(shù)都不應(yīng)該太大:,,,,如果A,B相互獨立,則當n比較大時,有,,,,,,,,,都是小概率事件,所以,如果我們把表里的數(shù)據(jù)代到公式里求出的,大于其中的某個數(shù),我們就有理由做出,A,B不相互獨立,的結(jié)論。,在死刑問題里,小概率事件沒有發(fā)生。所以我們沒有理由否定 A,B相互獨立的結(jié)論,認為數(shù)據(jù)不能充分說明在死刑判決中存在種族
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 18秋地大《概率論與數(shù)理統(tǒng)計》在線作業(yè)二輔導(dǎo)資料
- 18秋北交《概率論與數(shù)理統(tǒng)計》在線作業(yè)一輔導(dǎo)資料
- 蘭大概率論與數(shù)理統(tǒng)計18春平時作業(yè)1輔導(dǎo)資料
- 經(jīng)濟數(shù)學概率論與數(shù)理統(tǒng)計
- 概率論與數(shù)理統(tǒng)計
- 18秋地大《概率論與數(shù)理統(tǒng)計》在線作業(yè)一-3輔導(dǎo)資料
- 蘭大概率論與數(shù)理統(tǒng)計18春平時作業(yè)2輔導(dǎo)資料
- 蘭大概率論與數(shù)理統(tǒng)計18春平時作業(yè)3輔導(dǎo)資料
- 吉大18春學期《概率論與數(shù)理統(tǒng)計》在線作業(yè)一輔導(dǎo)資料
- 概率論與數(shù)理統(tǒng)計復(fù)習資料
- 概率論與數(shù)理統(tǒng)計[0001]
- 概率論與數(shù)理統(tǒng)計習題
- 18秋北交《概率論與數(shù)理統(tǒng)計》在線作業(yè)一-1輔導(dǎo)資料
- 18秋北交《概率論與數(shù)理統(tǒng)計》在線作業(yè)一-2輔導(dǎo)資料
- 概率論與數(shù)理統(tǒng)計教材
- 《概率論與數(shù)理統(tǒng)計》論文
- 概率論與數(shù)理統(tǒng)計試題
- 概率論與數(shù)理統(tǒng)計試題
- 概率論與數(shù)理統(tǒng)計答案
- 概率論與數(shù)理統(tǒng)計題庫
評論
0/150
提交評論