大學(xué)文科數(shù)學(xué)之線性代數(shù)與概率統(tǒng)計(jì)_第1頁
已閱讀1頁,還剩55頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、大學(xué)文科數(shù)學(xué)之線性代數(shù)與概率統(tǒng)計(jì),北京師范大學(xué)珠海分校國際特許經(jīng)營學(xué)院與不動產(chǎn)學(xué)院2004-2005學(xué)年第二學(xué)期歐陽順湘 2005.6.10,統(tǒng)計(jì)概述What is Statistics?Mathematical Statistics,數(shù)理統(tǒng)計(jì)學(xué),統(tǒng)計(jì)學(xué),還是,統(tǒng)計(jì)的含義,統(tǒng)計(jì)工作: 收集數(shù)據(jù)的活動統(tǒng)計(jì)數(shù)據(jù): 統(tǒng)計(jì)活動的結(jié)果 統(tǒng)計(jì)學(xué): 分析統(tǒng)計(jì)數(shù)據(jù)的方法和科學(xué),從歷史的典籍中,人們不難發(fā)現(xiàn)許多關(guān)于錢糧、戶口、

2、地震、水災(zāi)等等的記載,說明人們很早就開始了統(tǒng)計(jì)的工作 . 但是當(dāng)時(shí)的統(tǒng)計(jì),只是對有關(guān)事實(shí)的簡單記錄和整理,而沒有在一定理論的指導(dǎo)下,作出超越這些數(shù)據(jù)范圍之外的推斷.,What is Statistics?,最早的含義: 國情學(xué) stat?? state 《大不列顛百科全書》收集、分析數(shù)據(jù)的科學(xué)和藝術(shù)Statistics is a collection of procedures and principles for gaini

3、ng and processing information in order to make decisions when faced with uncertainty.,(數(shù)理)統(tǒng)計(jì)學(xué)是一門應(yīng)用性很強(qiáng)的學(xué)科. 它是研究怎樣以有效的方式收集、 整理和分析帶有隨機(jī)性的數(shù)據(jù),以便對所考察的問題作出推斷和預(yù)測,直至為采取一定的決策和行動提供依據(jù)和建議.,數(shù)理統(tǒng)計(jì)的特點(diǎn)是應(yīng)用面廣,分支較多. 社會的發(fā)展不斷向統(tǒng)計(jì)提出新的問題.,計(jì)算機(jī)的

4、誕生與發(fā)展,為數(shù)據(jù)處理提供了強(qiáng)有力的技術(shù)支持,數(shù)理統(tǒng)計(jì)與計(jì)算機(jī)的結(jié)合是必然的發(fā)展趨勢.,,統(tǒng)計(jì)學(xué)習(xí),把時(shí)間用在基本概念、方法原理的正確理解上. 學(xué)會用計(jì)算機(jī)處理數(shù)據(jù) Excel 著名的統(tǒng)計(jì)軟件包: SAS,SPSS,STAT,Minitab Statistica等,,學(xué)習(xí)內(nèi)容,重要概念總體樣本統(tǒng)計(jì)量典型的統(tǒng)計(jì)方法,描述統(tǒng)計(jì)推斷統(tǒng)計(jì),描述統(tǒng)計(jì)(descriptive statistics),使用 Excel 展

5、示上學(xué)期學(xué)生成績的處理,推斷統(tǒng)計(jì)(inference statistics),,數(shù)理統(tǒng)計(jì)不同于一般的資料統(tǒng)計(jì),它更側(cè)重于應(yīng)用隨機(jī)現(xiàn)象本身的規(guī)律性進(jìn)行資料的收集、整理和分析.,由于大量隨機(jī)現(xiàn)象必然呈現(xiàn)出它的規(guī)律性,因而從理論上講,只要對隨機(jī)現(xiàn)象進(jìn)行足夠多次觀察,被研究的隨機(jī)現(xiàn)象的規(guī)律性一定能清楚地呈現(xiàn)出來.,數(shù)理統(tǒng)計(jì)的任務(wù)就是研究怎樣有效地收集、整理、分析所獲得的有限的資料,對所研究的問題, 盡可能地作出精確而可靠的結(jié)論.,,由于推斷是

6、基于抽樣數(shù)據(jù),抽樣數(shù)據(jù)又不能包括研究對象的全部信息. 因而由此獲得的結(jié)論必然包含不肯定性.,在數(shù)理統(tǒng)計(jì)中,不是對所研究的對象全體(稱為總體)進(jìn)行觀察,而是抽取其中的部分(稱為樣本)進(jìn)行觀察獲得數(shù)據(jù)(抽樣),并通過這些數(shù)據(jù)對總體進(jìn)行推斷.,例,例 用Excel 抽樣 對學(xué)生成績進(jìn)行估計(jì),統(tǒng)計(jì)學(xué)基本概念,總體樣本樣本值統(tǒng)計(jì)量,由樣本值去推斷總體情況,需要對樣本值進(jìn)行“加工”,這就要構(gòu)造一些樣本的函數(shù),它把樣本中所含的(某一方面)的

7、信息集中起來.,二、統(tǒng)計(jì)量和抽樣分布,1. 統(tǒng)計(jì)量,這種不含任何未知參數(shù)的樣本的函數(shù)稱為統(tǒng)計(jì)量. 它是完全由樣本決定的量.,,總體,樣本,統(tǒng)計(jì)量,,,描述,,作出推斷,研究統(tǒng)計(jì)量的性質(zhì)和評價(jià)一個統(tǒng)計(jì)推斷的優(yōu)良性,完全取決于其抽樣分布的性質(zhì).,,隨機(jī)抽樣,幾個常見統(tǒng)計(jì)量,樣本均值,樣本方差,它反映了總體均值的信息,它反映了總體方差的信息,有差別(注意不同的定義),樣本k階原點(diǎn)矩,樣本k階中心矩,k=1,2,…,它反映了總體k 階

8、矩的信息,它反映了總體k 階中心矩的信息,定義 1,設(shè) ? 為總體,,若,則稱,則稱,若,矩估計(jì)原則:用樣本矩估計(jì)總體矩,定理 1 (樣本均值的分布),設(shè)X1,X2,…,Xn是取自 ? 的樣本,且有,則有,2. 經(jīng)驗(yàn)分布函數(shù),3. 抽樣分布,統(tǒng)計(jì)量既然是依賴于樣本的,而后者又是隨機(jī)變量,故統(tǒng)計(jì)量也是隨機(jī)變量,因而就有一定的分布,這個分布叫做統(tǒng)計(jì)量的“抽樣分布” .,抽樣分布就是通常的隨機(jī)變量函數(shù)的分布. 只是強(qiáng)調(diào)這一分布是由

9、一個統(tǒng)計(jì)量所產(chǎn)生的. 研究統(tǒng)計(jì)量的性質(zhì)和評價(jià)一個統(tǒng)計(jì)推斷的優(yōu)良性,完全取決于其抽樣分布的性質(zhì).,抽樣分布,精確抽樣分布,漸近分布,(小樣本問題中使用),(大樣本問題中使用),三. 統(tǒng)計(jì)三大分布,,,記為,定義: 設(shè) 相互獨(dú)立, 都服從正態(tài)分布N(0,1), 則稱隨機(jī)變量:

10、 所服從的分布為自由度為 n 的 分布.,分布是由正態(tài)分布派生出來的一種分布.,分布的密度函數(shù)為,,,請看演示,分布,,由 分布的定義,不難得到:,,2. 設(shè) 且X1,X2相互獨(dú)立,則,這個性質(zhì)叫 分布的可加性.,,,應(yīng)用中心極限定理可得,若,的分布近似正態(tài)分布N(0,1).,則可以求得

11、, E(X)=n, D(X)=2n,若,T的密度函數(shù)為:,,,記為T~t(n).,2、t 分布,具有自由度為n的t分布的隨機(jī)變量T的數(shù)學(xué)期望和方差為: E(T)=0; D(T)=n / (n-2) , 對n >2,,當(dāng)n充分大時(shí),其圖形類似于標(biāo)準(zhǔn)正態(tài)分布密度函數(shù)的圖形.,t分布的密度函數(shù)關(guān)于x=0對稱,且,不難看到,當(dāng)n充分大時(shí),t 分布近似N (0,1)分布. 但對于較小的n,t分布與N (0,1)分布相差很大.

12、,請看演示,t 分布,,,由定義可見,,,3、F分布,,~F(n2,n1),,,即它的數(shù)學(xué)期望并不依賴于第一自由度n1.,,,X的數(shù)學(xué)期望為:,,若n2>2,若X~F(n1,n2), X的概率密度為,請看演示,F分布,統(tǒng)計(jì)三大分布的定義、基本性質(zhì)在后面的學(xué)習(xí)中經(jīng)常用到,要牢記??!,四、幾個重要的抽樣分布定理,定理 1 (樣本均值的分布),n取不同值時(shí)樣本均值 的分布,定理 2 (樣本方差的分布),n取不同值時(shí)

13、 的分布,定理 3,,定理 4 (兩總體樣本均值差的分布),,定理 5 (兩總體樣本方差比的分布),,上述5個抽樣分布定理很重要, 要牢固掌握.,,,,,概率論是數(shù)理統(tǒng)計(jì)的基礎(chǔ),而數(shù)理統(tǒng)計(jì)是概率論的重要應(yīng)用. 但它們是并列的兩個學(xué)科,并無從屬關(guān)系 .,可見,在數(shù)理統(tǒng)計(jì)中必然要用到概率論的理論和方法. 因?yàn)殡S機(jī)抽樣的結(jié)果帶有隨機(jī)性,不能不把它當(dāng)作隨機(jī)現(xiàn)象來處理 .,由此也可以說

14、,,統(tǒng)計(jì)方法具有“部分推斷整體”的特征 .,在結(jié)束本節(jié)之前,我們需要強(qiáng)調(diào)說明一點(diǎn):,因?yàn)槲覀兪菑囊恍〔糠謽颖居^察值去推斷該全體對象(總體)情況,即由部分推斷全體. 這里使用的推理方法是“歸納推理”.,這種歸納推理不同于數(shù)學(xué)中的“演繹推理”,,它在作出結(jié)論時(shí),是根據(jù)所觀察到的大量個別情況,“歸納”起來所得,而不是從一些假設(shè)、命題、已知的事實(shí)等出發(fā),按一定的邏輯推理去得出來的.,例如,在幾何學(xué)中要證明“等腰三角形底角相等”只須從“等腰”

15、這個前提出發(fā),運(yùn)用幾何公理,一步一步推出這個結(jié)論.,而一個習(xí)慣于統(tǒng)計(jì)思想的人,就可能想出這樣的方法:做很多大小形狀不一的等腰三角形,實(shí)地測量其底角,看差距如何,根據(jù)所得資料看看可否作出“底角相等”的結(jié)論. 這樣做就是歸納式的方法.,現(xiàn)在要問:從局部觀察要對總體下結(jié)論有沒有片面性呢?結(jié)論是否可靠?,顯然這里不僅依賴于進(jìn)行局部觀察的“樣本”是否具有總體的代表性,也依賴于對從這些樣本得到數(shù)據(jù)的合理加工、分析并得出論斷.,我們說,如果這一切都

16、建立在可靠的科學(xué)基礎(chǔ)上,則對總體下結(jié)論是可能的也是可靠的. 因?yàn)檫@里存在著樣品(隨機(jī)抽取的一個個體)個性 (特殊性) 和總體共性(普遍性)之間的一種內(nèi)在的、對立統(tǒng)一的辯證關(guān)系 .,我們對每個經(jīng)過合理手續(xù)選取的一個樣品也應(yīng)看到它所具有的兩重性:,一方面它具有特殊性,因?yàn)樗吘故莻€別觀察值,不能反映總體的全面性質(zhì),有片面性.,因而統(tǒng)計(jì)上往往不采用由一次抽取的樣品來下結(jié)論.,在這個基礎(chǔ)上再加上科學(xué)的推斷方法,對總體下的結(jié)論同樣也是可靠的.,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論