商務(wù)統(tǒng)計學(xué)_第1頁
已閱讀1頁,還剩245頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、商務(wù)統(tǒng)計學(xué)習(xí)講座,雷欽禮,前言,一、商務(wù)統(tǒng)計課程的性質(zhì)二、商務(wù)統(tǒng)計學(xué)習(xí)的方法,一、商務(wù)統(tǒng)計課程的性質(zhì),1、商務(wù)統(tǒng)計是全面系統(tǒng)論述商務(wù)與經(jīng)濟統(tǒng)計活動全過程中所用統(tǒng)計理論與方法的綜合性課程,在調(diào)查分析師證書系列課程中是具有提綱挈領(lǐng)作用的一門課程。2、商務(wù)統(tǒng)計課程的內(nèi)容都是碩士研究生入學(xué)考試必考的內(nèi)容,是任何一個統(tǒng)計人員和調(diào)查分析人員都必須掌握的統(tǒng)計學(xué)的核心知識。,二、商務(wù)統(tǒng)計學(xué)習(xí)的方法,1、商務(wù)統(tǒng)計是一門應(yīng)用性統(tǒng)計學(xué)課程,在學(xué)習(xí)過程中應(yīng)

2、注重各種基本概念的含義和各種方法的基本原理與應(yīng)用,要掌握每種方法的使用條件、計算步驟、以及結(jié)果的意義與解釋。2、要在理解和領(lǐng)會中記憶和掌握課程的內(nèi)容。如對于各種統(tǒng)計分布的復(fù)雜的密度函數(shù)公式就不需記憶,但卻需要熟練掌握其概念定義以及分布函數(shù)表的使用方法。,第一章 緒論,一、統(tǒng)計學(xué)的性質(zhì)二、統(tǒng)計學(xué)的作用三、統(tǒng)計學(xué)的基本概念四、統(tǒng)計指標(biāo)體系的設(shè)計,一、統(tǒng)計學(xué)的性質(zhì),(一)統(tǒng)計活動的內(nèi)容與階段 對各種數(shù)據(jù)資料的搜集、整理、分

3、析和推斷的活動過程稱為統(tǒng)計活動,一項完整的統(tǒng)計活動過程可分為統(tǒng)計資料的搜集整理和統(tǒng)計資料的分析推斷兩大階段。(二)統(tǒng)計學(xué)的定義與分科 統(tǒng)計學(xué)就是關(guān)于數(shù)據(jù)資料的搜集、整理、分析和推斷的科學(xué)。關(guān)于統(tǒng)計資料的搜集整理和分析推斷的理論與方法構(gòu)成了統(tǒng)計學(xué)的全部內(nèi)容。 (1)理論統(tǒng)計學(xué)與應(yīng)用統(tǒng)計學(xué) (2)描述統(tǒng)計學(xué)與推斷統(tǒng)計學(xué),二、統(tǒng)計學(xué)的作用,(一)統(tǒng)計學(xué)在科學(xué)研究中的作用——提出假說并判定假說的正確與否(二)

4、統(tǒng)計學(xué)在生產(chǎn)中的作用——通過試驗分析找出最佳工藝,并對生產(chǎn)過程進行統(tǒng)計質(zhì)量控制。(三)統(tǒng)計學(xué)在管理中的作用——抽樣調(diào)查了解社會與市場,為決策提供依據(jù);并可建立各種社會與經(jīng)濟發(fā)展模型,定量地模擬社會與經(jīng)濟的運行,既可分析社會與經(jīng)濟的發(fā)展及其結(jié)構(gòu)變化,又可進行政策效果的評價。,三、統(tǒng)計學(xué)的基本概念,(一)總體和個體 組成統(tǒng)計活動研究對象的全部事物的全體集合,就稱為統(tǒng)計總體,簡稱總體或母體;而總體中的各個事物則稱為個體,總體中個體

5、的數(shù)量稱為總體容量。 1、自然物體總體與人為劃定個體的總體; 2、有限總體與無限總體; 3、具體總體與設(shè)想總體(抽象總體)。,三、統(tǒng)計學(xué)的基本概念,(二)統(tǒng)計指標(biāo)及其測度 用來測度統(tǒng)計活動研究對象某種特征數(shù)量的概念稱為統(tǒng)計指標(biāo),簡稱指標(biāo)。其中,測度總體特征數(shù)量的概念稱為總體指標(biāo),而測度個體特征數(shù)量的概念則稱為個體指標(biāo)。 指標(biāo)的測度計量尺度有(1)定類尺度,(2)定序尺度,(3)定距尺度,(4)

6、定比尺度 。,三、統(tǒng)計學(xué)的基本概念,(三)樣本和統(tǒng)計推斷 1、樣本——從總體中隨機抽出的部分個體所組成的集合稱為樣本或子樣,樣本中所含個體的數(shù)目稱為樣本容量。 2、統(tǒng)計推斷——根據(jù)樣本觀測資料來對總體的分布狀況和分布特征進行推斷。 3、樣本數(shù)據(jù)的分類——(1)橫截面數(shù)據(jù),(2)時間序列數(shù)據(jù)。,四、 統(tǒng)計指標(biāo)體系及其設(shè)計,(一)統(tǒng)計指標(biāo)體系的定義 反映總體及其所含個體的各個方

7、面特征數(shù)量的一系列相互聯(lián)系、相互補充的統(tǒng)計指標(biāo)所形成的體系,稱為統(tǒng)計指標(biāo)體系。 (二)構(gòu)建統(tǒng)計指標(biāo)體系的意義,(三)指標(biāo)體系中指標(biāo)的分類,1、水平指標(biāo)——(1)存量指標(biāo)與流量指標(biāo),(2)實物指標(biāo)與價值指標(biāo)。 2、比率指標(biāo)——(1)比例相對指標(biāo),(2)比值相對指標(biāo),(3)動態(tài)相對指標(biāo),(4)彈性相對指標(biāo),(5)強度相對指標(biāo)。,(四)指標(biāo)體系設(shè)計的內(nèi)容,1、確定統(tǒng)計指標(biāo)體系的框架;2、確定每一個指標(biāo)的內(nèi)涵和外延;3、確定每個統(tǒng)計

8、指標(biāo)的計量單位; 4、確定每個統(tǒng)計指標(biāo)的計算方法。,(五)指標(biāo)體系設(shè)計的原則,1、目的性原則2、科學(xué)性原則3、可行性原則4、聯(lián)系性原則,第二章 數(shù)據(jù)采集與整理,一、數(shù)據(jù)采集的方式與程序二、現(xiàn)場調(diào)查三、試驗觀測四、數(shù)據(jù)的整理顯示,一、數(shù)據(jù)采集的方式與程序,(一)數(shù)據(jù)采集——根據(jù)統(tǒng)計指標(biāo)體系的要求,對所研究總體中個體的相應(yīng)指標(biāo)進行觀測記錄取得數(shù)據(jù)的活動過程。(二)數(shù)據(jù)采集活動的基本要求——采集到的數(shù)據(jù)資料要具有代表性和真實性

9、。所謂代表性,是要求所觀測到的樣本必須對所研究總體具有代表性;而所謂真實性,則是要求所采集到的數(shù)據(jù)必須是真實的實際數(shù)據(jù)。(三)數(shù)據(jù)采集方式的分類——現(xiàn)場調(diào)查和試驗觀測,一、數(shù)據(jù)采集的方式與程序,(四)數(shù)據(jù)采集的程序 1、制定數(shù)據(jù)采集方案——包括(1)采集數(shù)據(jù)的目的,(2)采集總體和觀測單位,(3)觀測指標(biāo)數(shù)值登記表,(4)采集方式和組織,(5)采集時間和期限。 2、現(xiàn)場觀測登記 3、數(shù)據(jù)整理顯示,二、現(xiàn)場調(diào)查,(一)調(diào)查的取

10、樣方式 1、隨機抽樣調(diào)查 (1)簡單隨機抽樣,(2)系統(tǒng)抽樣, (3)分層抽樣,(4)整群抽樣。 2、非隨機抽樣調(diào)查 (1)任意抽樣,(2)立意抽樣, (3)配額抽樣。 3、概率抽樣和非概率抽樣的特點比較,二、現(xiàn)場調(diào)查,(二)現(xiàn)場調(diào)查的觀測方式 1、訪問法 (1)口頭訪問——當(dāng)面訪問或電話訪問 (

11、2)書面訪問——郵局或互聯(lián)網(wǎng)郵件傳遞,以及登門送收 2、觀察法,二、現(xiàn)場調(diào)查,(三)現(xiàn)場調(diào)查的問卷設(shè)計 1、提問方式 (1)封閉型提問 (2)開放型提問 2、提問次序,三、 試驗觀測,(一)試驗觀測設(shè)計的原則 1、均衡分散性原則 2、整齊可比性原則(二)試驗觀測的方法 1、完全隨機試驗觀測 2、隨機區(qū)組試驗觀測 3、

12、拉丁方試驗觀測 4、正交試驗觀測,四、數(shù)據(jù)整理與顯示,(一)構(gòu)建觀測資料數(shù)據(jù)庫的意義與方法(二)觀測數(shù)據(jù)的分類顯示 1、觀測個體的分類 (1)分類的功能與原則 (2)分類的方法 2、統(tǒng)計表的編制 (1)統(tǒng)計表的構(gòu)成 (2)統(tǒng)計表的編制規(guī)則——內(nèi)容安排科學(xué)合理,形式設(shè)計簡練美觀。,第三章 次數(shù)分布,一、次數(shù)分布的概念 二、次數(shù)分布表及其編制

13、 三、次數(shù)分布圖 四、次數(shù)分布的理論模型及其表示方法 五、離散變量概率分布模型 六、連續(xù)變量概率分布模型,一、次數(shù)分布的概念,(一)次數(shù)分布:觀測變量的各個不同取值及其出現(xiàn)次數(shù)的順序排列,稱為變量的次數(shù)分布。(二)總體次數(shù)分布和樣本次數(shù)分布(三)次數(shù)分布的作用——觀測變量的次數(shù)分布包含了觀測變量取值的全部信息。根據(jù)觀測變量的次數(shù)分布,可以對觀測變量的各種分布特征進行描述和分析。,二、次數(shù)分布表及其編制,(一)次數(shù)分布表

14、的種類 1、單值分組次數(shù)分布表 2、組距分組次數(shù)分布表(二)組距分組次數(shù)分布表的編制方法 1、確定組數(shù) 等距分組的斯特吉斯公式:m=1+3.322lgN 2、確定組距 等距分組的參考組距: 3、確定組限 4、計數(shù)各組的次數(shù) 5、列出次數(shù)分布表,三、次數(shù)分布圖,用線和面等形狀來顯示觀測變量次數(shù)分布狀況的幾

15、何圖形,稱為次數(shù)分布圖。常用的次數(shù)分布圖主要有柱狀圖、直方圖和折線圖等幾種。,四、 次數(shù)分布的理論模型,(一)理論分布模型的概念與意義 隨機變量取某個數(shù)值或在某個區(qū)間取值是一個隨機事件,使用概率理論計算的隨機變量在各個數(shù)值上或在各個區(qū)間內(nèi)取值的概率分布,就是隨機變量的理論分布,計算此理論分布的概率理論模型就是其理論分布模型。 在現(xiàn)實生活中,各種觀測變量的概率分布都可以用某個理論概論分布模型去近似描述。因此就可

16、據(jù)此理論分布模型進行分析推斷。,四、次數(shù)分布的理論模型,(二)理論分布模型的表示方法 1、概率分布表 2、概率分布圖 3、概率分布函數(shù)式,五、離散變量概率分布模型,記所考察的離散變量為x,假設(shè)該隨機變量共可取m個不同的值,它取值為xi的概率為pi,并記隨機事件x=xi的概率為P(x=xi),則離散隨機變量的概率分布可表示為: P(x=xi)=pi ; i=1,2…,m.

17、 在統(tǒng)計分析推斷中,常用的離散變量概率分布模型主要有兩點分布、二項分布、超幾何分布和泊松分布等幾種。,(一)兩點分布,假設(shè)總體中有兩類共N個個體,其中取值為“是”的有N1個,取值為“非”的有N0個,則有:,(二)二項分布,假設(shè)在0-1分布總體中,取“是”值的個體比例為p,取“非”值的比例為q,現(xiàn)從中有放回地隨機抽取n個個體,記X為取“是”值的個體數(shù)目,則其中恰有n1個個體取“是”值、且有n0=n-n1個個體取“非”值的概率

18、為:,(三)超幾何分布,假設(shè)0-1總體中共有N個個體,其中取“是”值的個體有N1個,取“非”值的個體有N0個?,F(xiàn)從不放回地隨機抽取n個個體,記x為取“是”值的個體數(shù)目,則其中恰有n1個個體取“是”值、且有n0=n-n1個個體取“非”值的概率為:,(四)泊松分布,泊松分布是稀有事件出現(xiàn)次數(shù)的理論分布模型,如自然災(zāi)害、意外事故、機器故障等事件出現(xiàn)的次數(shù)都近似地服從泊松分布。泊松分布概率模型為:,六、連續(xù)變量概率分布模型,連續(xù)型隨機變量的取值

19、范圍可以是數(shù)軸上的某個區(qū)間,也可以是整個數(shù)軸。由于它可以取無窮多個不同的數(shù)值,所以描述其概率分布的最完善方法是概率函數(shù)式。在理論分析中,描述連續(xù)變量概率分布的最常用的概率函數(shù)式是概率分布密度函數(shù)。 在統(tǒng)計分析推斷中,常用的連續(xù)隨機變量概率分布模型主要有均勻分布、正態(tài)分布、χ2分布、t分布和F分布等幾種。,(一)均勻分布,若隨機變量x在區(qū)間[a,b] 上服從均勻分布,則該隨機變量的概率密度函數(shù)為:,(二)正態(tài)分布,若隨機變量x服從

20、正態(tài)分布,則其概率密度函數(shù)就為:,(三)χ2分布,若隨機變量z1、z2、…、zn都服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),且兩兩之間相互獨立,則這些標(biāo)準(zhǔn)正態(tài)變量的平方和x就服從χ2分布,其概率密度函數(shù)為:,(四)t分布,若隨機變量z ~N(0,1),x~χ2(n),且二者相互獨立,則: 服從學(xué)生氏t分布,概率密度函數(shù)為:,(五)F分布,若隨機變量xm~χ2(m),xn~χ2(n),旦二者相互獨立,則:

21、 服從F分布,其概率密度函數(shù)為:,第四章 分布特征測度,一、分布中心二、離散程度三、偏度與峰度四、相關(guān)程度,一、分布中心測度的意義,(一)分布中心的概念——所謂分布中心,就是指隨機變量的一切取值的散布中心。(二)測度分布中心的意義 1、隨機變量的分布中心是隨機變量一切取值的一個代表,可以用來反映其數(shù)值的一般水平。 2、隨機變量的分布中

22、心可以揭示隨機變量一切取值的次數(shù)分布在直角坐標(biāo)系內(nèi)的集中位置,可以用來反映隨機變量分布密度曲線的中心位置,即對稱中心或尖峰位置。,二、分布中心測度指標(biāo),用來測度隨機變量次數(shù)分布中心的指標(biāo)可以有多種,其中在統(tǒng)計分析推斷中常用的主要有算術(shù)平均數(shù)、中位數(shù)和眾數(shù)等幾種。,(一)算術(shù)平均數(shù),1、定義——算術(shù)平均數(shù)又稱算術(shù)均值,是隨機變量的所有觀測值總和與觀測值個數(shù)的比值。2、計算方法(1)簡單算術(shù)平均數(shù)——適用于未分組整理的各個單個觀測數(shù)值,

23、其計算公式為:,(一)算術(shù)平均數(shù),(2)加權(quán)算術(shù)平均數(shù)——適用于已分組整理的次數(shù)分布數(shù)據(jù),其計算公式為:,(一)算術(shù)平均數(shù),(3)算術(shù)平均數(shù)的變形——調(diào)和平均數(shù)。對于由觀測變量的各個分組和各組變量總值順序排列所形成的分組數(shù)據(jù)。算術(shù)平均數(shù)的公式需變換成調(diào)和平均數(shù)的形式:,當(dāng)各組的變量總值mi相等時,就可簡化為:,(一)算術(shù)平均數(shù),3、理論分布的算術(shù)平均數(shù)——數(shù)學(xué)期望 (1)定義 對于離散型隨機變量,假設(shè)有n個不

24、同的取值,其中取某個數(shù)值xi的概率為pi,則該隨機變量的數(shù)學(xué)期望可用算術(shù)平均數(shù)公式定義為:,對于連續(xù)型隨機變量,仍可用算術(shù)平均數(shù)定義其數(shù)學(xué)期望,不過因為連續(xù)變量求和要用定積分,所以定義中需要用定積分符號代替總和符號,即:,(一)算術(shù)平均數(shù),3、理論分布的算術(shù)平均數(shù)——數(shù)學(xué)期望 (2)例子 例如,對于服從兩點分布的隨機變量x,其不同的取值只有1和0,其中取1的概率為p,取0的概率為q=1-p,則其數(shù)學(xué)期望為:,又如,對于服

25、從位置參數(shù)為μ且尺度參數(shù)為σ2的正態(tài)分布的隨機變量x,由其概率密度函數(shù)可計算出其數(shù)學(xué)期望就是其位置參數(shù)μ。標(biāo)準(zhǔn)正態(tài)分布隨機變量的數(shù)學(xué)期望為0。,(一)算術(shù)平均數(shù),(3)數(shù)學(xué)期望的性質(zhì) ①若c為常數(shù),則必有:E(c)=c ②若c為任意常數(shù),x為隨機變量,則必有: E(cx)=cE(x) ③若x1、x2、…、xm均為隨機變量,則必有: E(x1+x2+…+xm)=E(x1)+E(x

26、2)+…+E(xm) ④若x1、x2、…、xm均為隨機變量,且相互獨立,則: E(x1x2…xm)=E(x1)E(x2)…E(xm) ⑤若x是隨機變量,則必有: E(∣x∣)≥∣E(x)∣,,(二)中位數(shù),1、定義 中位數(shù)是在按觀測變量值的大小順序排列所形成的變量值數(shù)列中點位置上的變量值。對于觀測變量x,假設(shè)共取得n個觀測值,各個觀測值按大小順序排列為x(1)、x(2)

27、、…、x(n),則其中位數(shù)可定義為:,(二)中位數(shù),2、組距分組次數(shù)分布數(shù)據(jù) 的中位數(shù)計算,(三)眾數(shù),1、定義:眾數(shù)是隨機變量的觀測值中出現(xiàn)次數(shù)或密度最大的變量觀測值 。2、組距分組次數(shù)分布數(shù)據(jù)計算眾數(shù),,三、均值、中位數(shù)和眾數(shù)三者之間的關(guān)系,對于對稱分布,有:對于右偏分布,有:對于左偏分布,有:經(jīng)驗關(guān)系式:,四、離散程度測度的意義,(一)離散程度的概念——所謂離散程度,即觀測變量各個取值之間的差異程度。(二)離散程度

28、測度的意義 1、通過對隨機變量取值之間離散程度的測定,可以反映各個觀測個體之間的差異大小,從而也就可以反映分布中心指標(biāo)對各個觀測變量值代表性的高低。 2、通過對隨機變量取值之間離散程度的測定,可以反映隨機變量次數(shù)分布密度曲線的瘦俏或矮胖程度。,五、離散程度測度指標(biāo),可用來測度觀測變量值之間差異程度的指標(biāo)有很多,在統(tǒng)計分析推斷中最常用的主要有極差、平均差和標(biāo)準(zhǔn)差等幾種。,(一)極差,極差又稱全距,是觀測變量的最大取值與最小取值之間

29、的離差,也就是觀測變量的最大觀測值與最小觀測值之間的區(qū)間跨度。極差的計算公式為: R=Max(xi)-Min(xi),(二)平均差,平均差是隨機變量各個取值偏差絕對值的算術(shù)平均數(shù)。由于所掌握數(shù)據(jù)形式的不同,平均差的計算有簡單平均差和加權(quán)平均差兩種不同的方式。,(三)標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差是隨機變量各個取值偏差平方的平均數(shù)的算術(shù)平方根,是最常用的反映隨機變量分布離散程度的指標(biāo)。標(biāo)準(zhǔn)差既可以根據(jù)樣本數(shù)據(jù)計算,

30、也可以根據(jù)觀測變量的理論分布計算,分別稱為樣本標(biāo)準(zhǔn)差和總體標(biāo)準(zhǔn)差。,1、樣本標(biāo)準(zhǔn)差的計算,(1)對于未分組整理的各個觀測變量值數(shù)據(jù),計算標(biāo)準(zhǔn)差應(yīng)采用簡單平均的方法。,(2)對于已分組整理的分組次數(shù)分布數(shù)據(jù),計算標(biāo)準(zhǔn)差應(yīng)采用加權(quán)平均的方法 。,2、理論分布的標(biāo)準(zhǔn)差與方差,(1)定義 標(biāo)準(zhǔn)差是最常用的理論分布模型正態(tài)分布的參數(shù)之一,在理論分析中最常用來描述隨機變量分布的離散程度。標(biāo)準(zhǔn)差的平方稱為方差,與標(biāo)準(zhǔn)差有

31、著同樣的作用。隨機變量x的理論分布的方差常記為Var(x)或σ2,其定義為: σ2=Var(x)=E[x-E(x)]2,2、理論分布的標(biāo)準(zhǔn)差與方差,(2)離散隨機變量的方差 對于離散隨機變量x,假設(shè)共有n個不同取值,取值xi的概率為pi,i =1、2、…、n,則方差為: 例如,對于服從兩點分布的隨機變量x,其取值為1

32、的概率為p,取值為0的概率為q=1-p,數(shù)學(xué)期望為E(x)=p,則其方差為: Var(x)=(1-p)2p+(0-p)2q=pq,2、理論分布的標(biāo)準(zhǔn)差與方差,(3)連續(xù)隨機變量的方差 對于連續(xù)型隨機變量x,假設(shè)其分布密度函數(shù)f(x),則其方差的計算公式為: 例如,對于服從位置參數(shù)為μ且尺度參數(shù)為σ2的正態(tài)分布的隨機變量x,其數(shù)學(xué)期望等于其位置參數(shù)μ,其方差就是其尺度

33、參數(shù)σ2,標(biāo)準(zhǔn)正態(tài)分布的方差為1。,2、理論分布的標(biāo)準(zhǔn)差與方差,(4)方差的性質(zhì) ①任何隨機變量的方差均非負(fù)。Var(x)≥0 ②若c為常數(shù),x為隨機變量,則有: Var(cx)=c2Var(x) ③若隨機變量x1、x2、…、xm均相互獨立,則有: Var(x1+x2+…+xm)=Var(x1)+Var(x2)+…+Var(xm) ④若x為

34、隨機變量,c為任一常數(shù),則有: E(x-c)2=E[x-E(x)]2+[c-E(x)]2 ⑤對于任意隨機變量x,均有: Var(x)=E(x2)-[E(x)]2,(四)離散系數(shù),1、離散系數(shù)的概念——各個衡量隨機變量取值之間絕對差異的指標(biāo)與算術(shù)平均數(shù)的比率,通稱為離散系數(shù)。2、計算離散系數(shù)的意義——消除量綱和數(shù)量級的差異,便于不同觀測

35、變量之間的比較。,3、計算公式,六、測度偏度和峰度的意義,(一)概念——所謂偏度,就是觀測變量取值分布的非對稱程度;所謂峰度,就是觀測變量取值分布密度曲線頂部的平坦程度或尖峭程度。(二)意義 1、加深人們對觀測變量取值的散布狀況的認(rèn)識; 2、將觀測變量的偏度和峰度指標(biāo)值與某種理論分布的偏度和峰度指標(biāo)值進行比較,以判斷觀測變量的分布與某種理論分布的近似程度。,七、偏度的測度,(一)直觀偏度系數(shù)1、皮爾遜偏度系數(shù) 2、

36、鮑萊偏度系數(shù),七、偏度的測度,(二)矩偏度系數(shù) 1、矩的定義——原點矩和中心矩 2、矩偏度系數(shù),八、峰度的測度,矩峰度系數(shù)——隨機變量的四階中心矩與其標(biāo)準(zhǔn)差的四次方相除,所得比率就稱為峰度系數(shù),其計算公式為:,九、相關(guān)程度測度的意義,(一)相關(guān)關(guān)系的概念 對于兩個觀測變量,若一個變量的取值除了受另一個變量取值的影響外,還受各種隨機因素的影響,則變量間的這種非確定性關(guān)系就稱為相關(guān)關(guān)系。(二)

37、相關(guān)關(guān)系測度的意義 1、了解兩個觀測變量之間相關(guān)關(guān)系的方向;2、了解兩個觀測變量之間相互依賴關(guān)系的程度,為構(gòu)建觀測變量之間相互關(guān)系模型奠定基礎(chǔ)。,十、相關(guān)程度測度的指標(biāo),對兩隨機變量之間的相關(guān)關(guān)系及其密切程度進行測度,需要根據(jù)兩變量觀測值的復(fù)合分組次數(shù)分布進行,或在理論上根據(jù)兩變量的聯(lián)合概率分布模型進行。測度觀測變量之間相關(guān)關(guān)系的指標(biāo)主要有協(xié)方差和相關(guān)系數(shù)兩個。,(一)協(xié)方差,1、定義——協(xié)方差是兩個隨機變量成對觀測值偏差乘積的算

38、術(shù)平均數(shù) 。2、樣本協(xié)方差,(一)協(xié)方差,3、總體協(xié)方差——對于兩隨機變量的理論分布,也可類似地定義其協(xié)方差。兩隨機變量x和y的理論分布的協(xié)方差常記作Cov(x,y)或σxy,其定義公式為: σxy=Cov(x,y)=E[x-E(x)][y-E(y)] 例如,對于聯(lián)合分布為二元正態(tài)分布的隨機變量x和y,可得二變量的協(xié)方差為:,(一)協(xié)方差,4、協(xié)方差的性質(zhì) ①隨機變量x與y的協(xié)方差和y與x的協(xié)方差相等。

39、 Cov(x, y)=Cov(y, x) ②若隨機變量x和y相互獨立,則有:Cov(x, y)=0 ③若λ1和λ2為任意常數(shù),則有: Cov(λ1x, λ2y)=λ1λ2Cov(x, y) ④對于任意三個隨機變量,均有: Cov(x1+x2, y)=Cov(x1, y )+Cov(x2, y) Cov(x, y1+y2)=Cov(x, y1

40、)+Cov(x, y2) ⑤對于任意兩隨機變量,均有: Cov(x, y)=E(xy)-[E(x)E(y)],(二)相關(guān)系數(shù),1、定義——相關(guān)系數(shù)是兩個隨機變量的協(xié)方差對其兩標(biāo)準(zhǔn)差之積的比率 。2、總體相關(guān)系數(shù)3、樣本相關(guān)系數(shù),(二)相關(guān)系數(shù),4、相關(guān)系數(shù)的取值范圍相關(guān)系數(shù)r的數(shù)值介于-1和+1之間,其絕對值介于0和1之間。即有: -1≤r≤+15、相關(guān)系數(shù)的作用

41、(1)相關(guān)系數(shù)的符號可反映兩隨機變量相互依存關(guān)系的方向。相關(guān)系數(shù)為正,稱為正相關(guān);相關(guān)系數(shù)為負(fù),稱為負(fù)相關(guān)。(2)相關(guān)系數(shù)的絕對值的大小則可反映兩隨機變量線性相關(guān)關(guān)系的密切程度。,第五章 參數(shù)估計,一、總體參數(shù)及其估計量二、構(gòu)造估計量的方法——矩法估計三、判斷估計量優(yōu)劣的標(biāo)準(zhǔn)四、估計量的標(biāo)準(zhǔn)誤五、抽樣分布的概念六、基本的抽樣分布七、區(qū)間估計的概念 八、區(qū)間估計的方法九、樣本容量的確定,一、總體參數(shù)及其估計量,總體指標(biāo)

42、又稱為總體參數(shù),根據(jù)樣本數(shù)據(jù)來推斷總體指標(biāo)數(shù)值就稱為參數(shù)估計。集中了樣本中有關(guān)總體參數(shù)信息的樣本指標(biāo)稱為統(tǒng)計量,該統(tǒng)計量就可用來估計所求的總體指標(biāo)的數(shù)值。用來估計總體指標(biāo)數(shù)值的統(tǒng)計量又稱為該總體指標(biāo)的估計量,該估計量的數(shù)值就稱為該總體指標(biāo)的估計值??傮w參數(shù)值是確定的,但是未知的;樣本估計量是隨機變量,其估計值是某個給定樣本的計算值。,二、構(gòu)造估計量的方法—矩法估計,(一)矩法估計的概念——所謂矩法估計,概括來說就是用樣本矩作為總體同

43、一矩的估計量,用樣本矩的函數(shù)作為總體相應(yīng)矩同一函數(shù)的估計量。(二)常用的總體參數(shù)及其矩法估計量,三、判斷估計量優(yōu)劣的標(biāo)準(zhǔn),為了保證用于估計總體指標(biāo)的估計量準(zhǔn)確可靠,就必須要求所使用的估計量具備一些優(yōu)良的性質(zhì),這些性質(zhì)就構(gòu)成了判斷一個估計量優(yōu)劣的標(biāo)準(zhǔn)。常用的標(biāo)準(zhǔn)主要有一致性、無偏性、有效性、充分性和穩(wěn)健性等。,(一)一致性,對于總體指標(biāo)的一個估計量,若其取值隨著樣本容量的增大越來越接近于總體指標(biāo)的真值,即估計誤差越來越小的可能性越來越

44、大直至100%,則該估計量就稱為總體指標(biāo)的一致估計量,或稱為相合估計量??梢宰C明,由矩估計法所構(gòu)造出的估計量都是所估計總體指標(biāo)的一致估計量。如樣本均值是總體均值的一致估計量,樣本比例p是總體比例P的一致估計量,樣本方差s2也是總體方差σ2的一致估計量。,(二)無偏性,對于總體指標(biāo)的一個估計量,若其估計值的數(shù)學(xué)期望等于該總體指標(biāo)的真值,即其估計誤差的數(shù)學(xué)期望為0,則該估計量就稱為是總體指標(biāo)的無偏估計量。可以證明,樣本均值是總體均值的無

45、偏估計量,而常規(guī)樣本方差卻并不是總體方差σ2的無偏估計量,修正樣本方差s2是總體方差σ2的無偏估計量。修正樣本方差即無偏樣本方差為:,(三)有效性,對于任一總體指標(biāo),若存在兩個無偏估計量,其中一個估計量的估計誤差平均來說小于另一個估計量的估計誤差,則稱前一個估計量比后一個估計量有效。無偏估計量的估計誤差大小可用其方差衡量,所以兩個無偏估計量比較,方差較小者較為有效。對于一個總體指標(biāo)來說,若在其所有無偏估計量中能夠找到一個估計量,其方

46、差最小,則該估計量就稱為是該總體指標(biāo)的最佳無偏估計量??梢宰C明,樣本均值是總體均值的最佳無偏估計量。對于有偏估計量,衡量其有效性可用均方誤差代替方差。估計量的均方誤差為:,(四)充分性,對于一個總體指標(biāo),若其估計量提取了樣本中包含的有關(guān)該總體指標(biāo)的全部信息,則此估計量就稱為該總體指標(biāo)的充分估計量。在多數(shù)情形下,矩法估計給出的總體指標(biāo)的估計量均是充分的。如在正態(tài)分布總體之下,樣本均值是總體均值的充分估計量,樣本方差s2也是總體方差σ2

47、的充分估計量。,(五)穩(wěn)健性,如果用來估計總體指標(biāo)的樣本估計量對樣本數(shù)據(jù)的污染不敏感,也就是說估計量的數(shù)值不受被污染數(shù)據(jù)的干擾或受其干擾不大,那么該估計量就是總體指標(biāo)的一個穩(wěn)健估計量。 實踐中常用的一種估計總體均值的穩(wěn)健估計量是切尾均值,切尾均值的計算公式為:,四、估計量的標(biāo)準(zhǔn)誤,(一)標(biāo)準(zhǔn)誤的概念 樣本估計量的標(biāo)準(zhǔn)差通常稱為該估計量的標(biāo)準(zhǔn)誤差,簡稱標(biāo)準(zhǔn)誤。即: 標(biāo)準(zhǔn)誤是衡量

48、一個估計量抽樣估計誤差大小的一個尺度。,(二)標(biāo)準(zhǔn)誤的計算,1、樣本均值的標(biāo)準(zhǔn)誤 (1)放回抽樣 (2)不放回抽樣,,(二)標(biāo)準(zhǔn)誤的計算,2、樣本比例的標(biāo)準(zhǔn)誤 (1)放回抽樣 (2)不放回抽樣,(三)影響標(biāo)準(zhǔn)誤的因素,1、總體中各個體之間的差異程度??傮w中各個體取值之間的差異程度大即σ2也大,各總體指標(biāo)估計量的標(biāo)準(zhǔn)誤的數(shù)值也就大,抽樣估計誤差也就大。2、樣本容量的大小。樣本容量大,總體指標(biāo)估計量的標(biāo)準(zhǔn)誤則小,抽樣估計

49、誤差也就越?。环粗?,樣本容量越小,抽樣估計誤差及其標(biāo)準(zhǔn)誤也就越大。3、抽取樣本的方式方法。抽樣方式方法不同,總體指標(biāo)估計量的標(biāo)準(zhǔn)誤就會不同,抽樣估計誤差的大小也就不同。,五、抽樣分布的概念,對于給定的總體和抽樣方式以及樣本容量,樣本指標(biāo)取值的概率分布就稱為抽樣分布。確定樣本容量下的抽樣分布稱為樣本統(tǒng)計量的精確分布,而樣本容量趨于無窮大時的抽樣分布則稱為樣本統(tǒng)計量的極限分布。,六、基本的抽樣分布,(一)樣本均值的抽樣分布1、任意總體

50、大樣本2、正態(tài)總體小樣本,六、基本的抽樣分布,(二)樣本比例的抽樣分布——大樣本,,六、基本的抽樣分布,(三)樣本方差的抽樣分布——正態(tài)總體,七、區(qū)間估計的概念,記總體指標(biāo)為θ,樣本估計量為 ,事先給定概率為1-α,若根據(jù)樣本估計量的概率分布可計算出一個區(qū)間 ,使得該區(qū)間包含總體參數(shù)θ的概率等于事先給定的概率1-α,即有: 成立,則該區(qū)間 就稱為總

51、體參數(shù)θ的置信區(qū)間,而概率1-α就稱為是置信概率或置信度。,八、區(qū)間估計的方法,(一)均值的區(qū)間估計 1、大樣本下均值的區(qū)間估計由中心極限定理可知,對于大樣本而言,樣本均值的概率分布總可近似地看作是正態(tài)分布。若事先給定置信概率為1-α,則查標(biāo)準(zhǔn)正態(tài)分布概率數(shù)值表,可得標(biāo)準(zhǔn)正態(tài)分布的上側(cè)分位數(shù)zα/2,就可得出總體均值μ的置信區(qū)間為:,(一)均值的區(qū)間估計,2、小樣本下正態(tài)總體均值的區(qū)間估計對于來自正態(tài)總體的一個小樣本,在給定的

52、置信概率1-α之下,查自由度為(n-1)的t分布表,可得t分布的上側(cè)分位數(shù)tα/2, 可得總體均值μ的置信區(qū)間為:,(二)比例的區(qū)間估計,總體比例是兩點分布總體的均值,其估計量樣本比例則是來自該總體的隨機樣本的均值。因此,在大樣本條件下,可根據(jù)中心極限定理用類似于大樣本情形下總體均值區(qū)間估計的方法來對總體比例進行區(qū)間估計。有:,(三)方差的區(qū)間估計,由抽樣分布理論可知,對于來自正態(tài)總體的一個簡單隨機樣本,其修正樣本方差s2與總體方差σ2

53、比值的(n-1)倍服從自由度為(n-1)的χ2分布。若給定置信概率1-α,查自由度為(n-1)的χ2分布表可得兩個分位數(shù)χ1-α/2和χα/2,則可得正態(tài)總體方差σ2的置信區(qū)間為:,(四)單側(cè)置信區(qū)間,所謂單側(cè)置信區(qū)間,是將待估總體指標(biāo)的上置信限或下置信限指定在其上界或下界值上,并根據(jù)給定的置信概率求出另一置信限而得到的置信區(qū)間。記待估計總體指標(biāo)為θ,其取值上界為 ,取值下界為 ,樣本估計量為 ,對于給定的置信概率1-α,若有:

54、 或者,有: 則稱區(qū)間 和 為總體指標(biāo)θ的單側(cè)置信區(qū)間。,九、樣本容量的確定,若在給定1-α的置信概率之下,要求用樣本均值估計總體均值的抽樣估計誤差不超過δ,則由總體均值的抽樣估計誤差限的計算公式,可計算出必需最小樣本容量。(一)放回抽樣(二)不放回抽樣,第六章 假設(shè)檢驗,一、假設(shè)檢驗的原理二、總體指標(biāo)假設(shè)檢驗三

55、、分布假設(shè)檢驗四、假設(shè)檢驗的兩類錯誤及功效,一、假設(shè)檢驗的原理,(一)統(tǒng)計假設(shè)和檢驗統(tǒng)計量所謂統(tǒng)計假設(shè),就是關(guān)于總體分布特征的某種論斷。關(guān)于總體參數(shù)假設(shè)的檢驗,是假設(shè)檢驗的核心內(nèi)容。記總體參數(shù)為θ,若要判斷θ是否等于某已知數(shù)值θ0,則該參數(shù)假設(shè)可表示為: H0:θ=θ0, H1:θ≠θ0其中,假設(shè)H0:θ=θ0就是所要檢驗的假設(shè),稱為原假設(shè)或零假設(shè);而假設(shè)H1:θ≠θ0則稱為對立假設(shè)或備擇假設(shè)。要檢驗?zāi)硞€

56、假設(shè)是否正確,需根據(jù)樣本所提供的信息來進行。包含總體分布特征的全部樣本信息的樣本指標(biāo),是進行假設(shè)檢驗的依據(jù),稱為檢驗統(tǒng)計量。,(二)顯著性水平和拒絕域,進行假設(shè)檢驗,概率論中關(guān)于小概率事件在一次試驗中是不可能事件的原則是其所遵循的基本原則。通常取小概率事件的概率臨界值為0.05或0.01,用α表示,稱為假設(shè)檢驗的顯著性水平。在原假設(shè)成立的條件下,由檢驗統(tǒng)計量的概率分布,對于給定的顯著性水平,就可確定出由抽樣誤差引起的樣本估計值對總體參

57、數(shù)原假設(shè)值的可能的最大偏離值,作為判斷原假設(shè)正確與否的臨界值。樣本估計量偏離總體參數(shù)原假設(shè)值過大的區(qū)域,就是否定原假設(shè)的區(qū)域,稱為否定域或拒絕域,而否定域以外的區(qū)域則稱為接受域。,(二)顯著性水平和拒絕域,1、雙側(cè)檢驗若要檢驗的假設(shè)為: H0:θ=θ0, H1:θ≠θ0 則否定域應(yīng)建立在與原假設(shè)值的正負(fù)偏離超出給定臨界值的兩邊,這種檢驗方法稱為雙側(cè)檢驗。,(二)顯著性水平和拒絕域,2、左側(cè)檢驗若要檢驗的假設(shè)為:

58、 H0:θ≥θ0, H1:θ<θ0 則否定域應(yīng)建立在與原假設(shè)值的負(fù)偏離超出給定臨界值的一邊,這種檢驗方法稱為左側(cè)檢驗。,(二)顯著性水平和拒絕域,3、右側(cè)檢驗若要檢驗的假設(shè)為: H0:θ≤θ0, H1:θ>θ0 則否定域應(yīng)建立在與原假設(shè)值的正偏離超出給定臨界值的一邊,這種檢驗方法稱為右側(cè)檢驗。,(三)假設(shè)檢驗的p值,檢驗統(tǒng)計量的取值落在其實際樣本值之外的概率,就稱為假設(shè)檢驗的p值。,(四

59、)假設(shè)檢驗的程序,(1)提出原假設(shè)H0和備擇假設(shè)H1;(2)規(guī)定檢驗的顯著性水平α;(3)構(gòu)造用于檢驗的樣本指標(biāo),即檢驗統(tǒng)計量;(4)在原假設(shè)為真的假定下,根據(jù)檢驗統(tǒng)計量的概率分布,確定出檢驗統(tǒng)計量的臨界值,并由此臨界值構(gòu)造出檢驗的拒絕域和接受域;或者計算出假設(shè)檢驗的p值;(5)比較檢驗統(tǒng)計量的實際樣本值與其臨界值,或者比較檢驗的p值與顯著性水平α,并根據(jù)比較的結(jié)果做出拒絕或不能拒絕原假設(shè)的決策。,二、總體指標(biāo)假設(shè)檢驗,(一)均

60、值的檢驗 1、單一總體均值的檢驗 H0:μ=μ0,H1:μ≠μ0或μ<μ0或μ>μ0 (1)大樣本情形——正態(tài)分布z檢驗 (2)小樣本情形(正態(tài)總體)——t檢驗,(一)均值的檢驗,2、兩總體均值的比較 H0:μ1=μ2,H1:μ1≠μ2或μ1>μ2或μ1<μ2 (1)大樣本情形——正態(tài)分布z檢驗 (2)小樣本情形(正態(tài)總體)——t檢驗 其中s

61、2為用自由度加權(quán)的兩樣本方差的平均數(shù)。,(二)比例的檢驗,1、單一總體比例的檢驗 ——大樣本 (1)假設(shè) H0: P=P0 , H1: P≠P0 或P>P0 或P<P0 (2)檢驗統(tǒng)計量——正態(tài)分布z檢驗,(二)比例的檢驗,2、兩總體比例的比較 (1)假設(shè) H0: P1=P2 , H1: P1≠P2 或P1>P2 或P1<P2 (2)檢驗統(tǒng)計量

62、——正態(tài)分布z檢驗 其中p為兩樣本比例的加權(quán)平均數(shù):,(三)方差的檢驗,1、單一總體方差的檢驗 (正態(tài)總體) (1)假設(shè) 或 或 (2)檢驗統(tǒng)計量——χ2檢驗,(三)方差的檢驗,2、兩總體方差的比較 (正態(tài)總體) (1)假設(shè)

63、或 或 (2)檢驗統(tǒng)計量——F檢驗,(四)相關(guān)系數(shù)的檢驗,1、假設(shè)H0: ρ=0, H1: ρ≠02、檢驗統(tǒng)計量——t檢驗,三、分布假設(shè)檢驗,(一)擬合適度檢驗 1、擬合適度檢驗的概念 檢驗所考察總體是否服從某種特定的分布,稱為擬合適度檢驗。 2、擬合適度檢驗的假設(shè) H0:總體服從某分布,H1:總體不服從某分布 3、檢驗方法——χ2 檢驗,(二)列聯(lián)表檢驗,1、檢驗的假

64、設(shè) H0:變量A和B獨立,H1:變量A和B不獨立 2、檢驗方法——χ2 檢驗,四、假設(shè)檢驗的兩類錯誤與功效,(一)兩類錯誤的概念,(二)兩類錯誤的概率,第一類錯誤的概率α ,第二類錯誤的概率β,(三)假設(shè)檢驗的功效,1、功效的概念——備擇假設(shè)正確并接受了它的概率為(1-β),此概率就稱為假設(shè)檢驗的功效。 2、功效曲線,(四)必要樣本容量的確定,1、兩類錯誤發(fā)生概率的關(guān)系 假設(shè)檢驗中犯第二類錯誤的概率與犯第一類錯誤的

65、概率成反方向關(guān)系,如果既要提高檢驗的功效而又不想使犯第一類錯誤的風(fēng)險增大,那么只能是增加樣本容量。 2、必要樣本容量的確定 對于總體均值假設(shè)H0:μ=μ0,H1:μ=μ1>μ0,使用z檢驗法,可得:,第七章 方差分析,一、方差分析的概念 二、方差分析的意義 三、單因子數(shù)據(jù)結(jié)構(gòu)模型 四、模型參數(shù)的估計 五、單因子方差分析表 六、各水平效應(yīng)的多重比較 七、隨機區(qū)組試驗與多因素方差分析的特點,一、方

66、差分析的概念,在科學(xué)實驗和生產(chǎn)經(jīng)營活動中,人們常常需要對影響所觀測變量的各種主要因素進行分析,以便找出各個因素在什么狀態(tài)下可使所觀測的變量取得最佳數(shù)值。為此,首先需要在各種主要影響因素的不同狀態(tài)下對所研究變量的取值進行觀測,然后再對觀測所得數(shù)據(jù)進行比較分析。方差分析就是分析推斷各種因素狀態(tài)對所觀測變量的影響效應(yīng)的一種統(tǒng)計分析方法。,二、方差分析的意義,首先,需要確定的是一個因子的各個水平的作用是否相同。如果相同,說明這個因子不管取哪種水

67、平對觀測變量無不同影響,那么這個因子實際上無關(guān)緊要,可納入平均效應(yīng)中去,這時稱這個因子是不顯著的。自然,如果一個因子的各個水平的作用不同,那么這時就稱此因子是顯著的。其次,如果所考察的因子是顯著的,那么就要找出該因子的最佳水平或者各個顯著因子的各種水平的最佳配合,以指導(dǎo)生產(chǎn)經(jīng)營的實踐活動。,三、單因子數(shù)據(jù)結(jié)構(gòu)模型,假設(shè)所考察的因子為A,有m個不同的水平A1,A2,…,Am。在各個水平下分別進行了n1,n2,…,nm次獨立實驗觀測,得到

68、變量觀測值為yij,i=1,2,…,m,j=1,2,…,ni,則有數(shù)據(jù)結(jié)構(gòu)模型為: yij=μ+αi+εij;i=1,2,…,m;j=1,2,…,ni. 或者寫為: yij=μi+εij ;i=1,2,…,m;j=1,2,…,ni. 其中μ為平均效應(yīng),αi為因子A的第i個水平Ai對觀測變量的作用,稱為水平Ai的效應(yīng),μi=μ+αi為在水平Ai下觀測變量的總體平均值,εij

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論