統(tǒng)計學(xué)2014-ch10-ch122016.11_第1頁
已閱讀1頁,還剩129頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第10章,非參數(shù)統(tǒng)計,返回總目錄,1,參數(shù)統(tǒng)計:總體分布已知或?qū)Ψ植甲鞒瞿撤N假定為前提。非參數(shù)統(tǒng)計:對總體分布的具體形式不必做任何限制性假定和不以總體參數(shù)具體數(shù)值估計為目的的推斷統(tǒng)計。這種統(tǒng)計主要用于對某種判斷或假設(shè)進(jìn)行檢驗。,非參數(shù)統(tǒng)計的概念和特點(diǎn),1. 非參數(shù)統(tǒng)計的概念,返回本章,返回總目錄,2,(1)非參數(shù)統(tǒng)計方法既能適用于定名測定數(shù)據(jù)(滿意與不滿意; 好與壞)或定序測定數(shù)據(jù)(如商品等級,ABCD…等級)?!糠治鲅芯?2.

2、非參數(shù)統(tǒng)計的特點(diǎn),(2)非參數(shù)統(tǒng)計方法是一種經(jīng)濟(jì)而有效的方法。數(shù)據(jù)容易收集,方法容易理解,計算簡便?!鷻z驗:確定某一種結(jié)果比另一種結(jié)果好(符號檢驗:不必考慮數(shù)據(jù)的排列順序)。,(3)非參數(shù)統(tǒng)計方法不需要總體服從正態(tài)分布的假定,也不需要檢驗總體的參數(shù),因此,結(jié)論也更具有普遍性。,返回本章,返回總目錄,3,檢驗,,1. 檢驗的概念,,,式中 為自由度。,返回本章,返回總目錄,4,檢驗在非參數(shù)統(tǒng)計中有廣泛的

3、用途,因為:(1)有很多非參數(shù)的假設(shè)檢驗問題都可以轉(zhuǎn)化為檢驗觀察次數(shù)與其期望次數(shù)之間的緊密程度問題,這里的檢驗統(tǒng)計量并不依賴于總體的分布形式,而是作為檢驗總體分布是否為某種特定的概率分布的一種方法;(2)用這種方法搜集的數(shù)據(jù),可以是間距測定數(shù)據(jù),也可是定名測定數(shù)據(jù)。 檢驗主要用于擬合優(yōu)度檢驗和獨(dú)立性檢驗。,,返回本章,返回總目錄,5,2. 擬合優(yōu)度檢驗,擬合優(yōu)度檢驗是利用樣本信息對總體分布作出推斷,檢驗總體是否服從理論分布。其

4、方法是把樣本分成 個互斥的類,然后根據(jù)要檢驗的理論分布算出每一類的理論頻數(shù),與實際的觀察頻數(shù)進(jìn)行比較。,,擬合優(yōu)度檢驗的步驟為:,(1)確定原假設(shè)與備擇假設(shè),原假設(shè) 表示總體服從設(shè)定的分布;備擇假設(shè) 表示總體不服從設(shè)定的分布。同時,確定顯著性水平 。,,,,(2)從要研究的總體中,隨機(jī)抽取一個觀察值樣本。,返回本章,返回總目錄,6,(3)按照“原假設(shè)為真”這一假定,匯出一組期望頻數(shù)或者理論頻數(shù)。通常這就

5、是假定某概率分布適合于所研究的總體。,(4)對觀察頻數(shù)與理論頻數(shù)進(jìn)行比較,如果它們的差異很大,以致在確定的顯著水平下不能把它歸之于隨機(jī)波動,就拒絕原假設(shè)。,返回本章,返回總目錄,7,3. 獨(dú)立性檢驗,檢驗也常用于判斷兩組或多組資料是否彼此關(guān)聯(lián)的問題。若各組數(shù)據(jù)彼此不關(guān)聯(lián),就稱為獨(dú)立,所以這類問題也稱為獨(dú)立性檢驗。獨(dú)立性檢驗的特點(diǎn)在于其理論頻數(shù)不是預(yù)先設(shè)定的,而需要從樣本數(shù)據(jù)中獲得。 的公式可寫為:,,,的自由度為:,,返回本章,

6、返回總目錄,8,成對比較檢驗,1. 符號檢驗,符號檢驗是用差異的正負(fù)號而忽略具體量的差異來進(jìn)行判斷的一種檢驗方法,也稱正負(fù)號檢驗,適用于對無法用數(shù)字計量的情況進(jìn)行比較。如果從樣本得到的正號同負(fù)號的數(shù)目相差較大,則有理由拒絕原假設(shè)。,符號檢驗的優(yōu)點(diǎn)在于:,(1)兩個樣本可以是相關(guān)的,也可以是獨(dú)立的;,(2)對于分布的形狀、方差均一性等等都不做限定;,(3)只考慮差數(shù)的正負(fù)方向而不計具體數(shù)值。,返回本章,返回總目錄,9,符號檢驗的缺點(diǎn)在于:

7、,忽略數(shù)值差別,失去了可資利用的信息。,符號檢驗的步驟為:,返回本章,返回總目錄,10,2. 威爾科克森帶符號的等級檢驗,威爾科克森帶符號的等級檢驗不但考慮了正負(fù)號,還采用了其差別大小的信息 。,威爾科克森帶符號等級檢驗的步驟為:,返回本章,返回總目錄,11,返回本章,返回總目錄,12,曼—惠特尼U檢驗,1. 曼—惠特尼U檢驗的基本原理,曼—惠特尼U檢驗的思路與威爾科克森帶符號等級檢驗基本一致。這種方法稱為等級和檢驗,可用于檢驗兩個獨(dú)立

8、樣本是否來自相同均值的總體,或用于檢驗兩個總體的相對次數(shù)分布是否相同。這種方法的特點(diǎn)是用順序數(shù)據(jù),而不是用正負(fù)號,因此它比符號檢驗對數(shù)據(jù)的運(yùn)用更為充分。,返回本章,返回總目錄,13,曼—惠特尼U檢驗的步驟為:,返回本章,返回總目錄,14,游程檢驗,1. 游程和游程檢驗的概念,游程檢驗(亦稱連貫檢驗)是根據(jù)樣本標(biāo)志表現(xiàn)排列所形成的游程的多少進(jìn)行判斷的檢驗方法。它既可用于檢驗樣本的隨機(jī)性,又可用于檢驗兩個樣本是否具有相同的分布。,返回本章,

9、返回總目錄,15,2. 游程檢驗的基本原理和方法,游程檢驗可分為兩種情況:一是如果兩個樣本來自兩個不同的總體,可采用混合有序樣本的方法,根據(jù)實際游程的個數(shù),檢驗這兩個樣本總體分布是否相同;二是如果樣本觀察值來自同一總體,可以先將觀察值按從小到大順序排列,然后按中位數(shù)將觀察值分為大于或小于中位數(shù)的兩部分,再根據(jù)上、下兩部分相互交錯形成的游程個數(shù)檢驗樣本的隨機(jī)性。,返回本章,返回總目錄,16,等級相關(guān)檢驗,1. 等級相關(guān)檢驗的基本原理,返回

10、本章,返回總目錄,17,等級相關(guān)系數(shù)的計算公式,這一公式稱為斯皮爾曼等級相關(guān)系數(shù)。等級相關(guān)系數(shù)與相關(guān)系數(shù)一樣,取值-1到+1之間,區(qū)別是它是建立在等級的基礎(chǔ)上計算的,較適用于反映序列變量的相關(guān)。,返回本章,返回總目錄,18,2. 等級相關(guān)檢驗的應(yīng)用,斯皮爾曼等級相關(guān)系數(shù)可用于以下假設(shè)檢驗:,返回本章,返回總目錄,19,多個樣本的檢驗,1. 克魯斯卡爾—沃利斯單向方差秩檢驗,克魯斯卡爾—沃利斯(Kruskal-Wallis)單向方差秩檢

11、驗是檢驗k個獨(dú)立樣本是否來自同分布總體的最常用的非參數(shù)假設(shè)檢驗方法。,該方法只要求樣本是獨(dú)立的,而不受總體分布的性質(zhì)和方差是否相等的限制。,k =2時,該方法就是曼—惠特尼U檢驗方法。,返回本章,返回總目錄,20,克魯斯卡爾—沃利斯單向方差秩檢驗步驟,建立假設(shè)H0:k 個總體無顯著差異H1:k 個總體有顯著差異,確定檢驗統(tǒng)計量,作出檢驗判斷,,,1. 將所有樣本觀察值排序求秩,最小觀察值秩為1,最大觀察值秩為n (

12、 ) ,如果觀察值相同,則用觀察值的平均秩代替;2. 第i個樣本觀察值的秩求和,記為Ri ;3. 計算檢驗統(tǒng)計量(若有相同觀察值,需要對H修正),在ni >5的情況下,H 近似服從自由度為k-1的 分布。 若 ,則接受H0; 若 ,則拒絕H0.(2) 在ni 5,且 k=3的情

13、況下,根據(jù) 數(shù)值直接查表得到概率P,P ,則拒絕H0; P ,則拒絕H0 。,返回本章,返回總目錄,21,2. 費(fèi)利德曼雙向方差分析,費(fèi)利德曼雙向方差分析,是檢驗k個相關(guān)樣本是否來自同分布總體的非參數(shù)假設(shè)檢驗方法。這種方法要求觀察值至少是定序變量。,該方法將全部數(shù)據(jù)列成一個雙向表,行對應(yīng)各個樣本,列對應(yīng)各種處理。目的是檢驗各個樣本是否來自同分布總體,即各種處理方法的效果是否相同。,返回本章,返

14、回總目錄,22,費(fèi)利德曼雙向方差分析方法雙向表形式,,返回本章,返回總目錄,23,費(fèi)利德曼檢驗步驟,建立假設(shè)H0:k 種處理方法的效果無顯著差異H1:k 種處理方法的效果有顯著差異,確定檢驗統(tǒng)計量,作出檢驗判斷,,,1. 對每一個樣本下的k個觀察值排序求秩;2. 每種處理方法下n個樣本觀察值的秩求和,記為Rj ;3. 計算檢驗統(tǒng)計量,在n, k不是特別小的情況下, 近似服從自由度為k-1的 分布。

15、 若 ,則接受H0; 若 ,則拒絕H0.(2) 在n, k特別小的情況下,根據(jù) 數(shù)值直接查表,根據(jù)該表做出判斷。,返回本章,返回總目錄,24,第11章,相關(guān)分析與回歸分析,返回總目錄,25,相關(guān)分析,1. 相關(guān)關(guān)系的概念及分類,(1)相關(guān)關(guān)系的概念,變量之間的依存關(guān)系可以分為函數(shù)關(guān)系和相關(guān)關(guān)系函數(shù)關(guān)系:變量之間保持著嚴(yán)格的

16、依存關(guān)系,呈現(xiàn)一一對應(yīng)的特征,如周長與半徑。相關(guān)關(guān)系:變量之間保持著不確定(不嚴(yán)格)的依存關(guān)系,如身高與體重。,返回本章,返回總目錄,26,(2)相關(guān)關(guān)系的分類,變量間的相關(guān)關(guān)系可以按照不同的標(biāo)志進(jìn)行分類:,①按相關(guān)的程度可分為完全相關(guān)、不完全相關(guān)和不相關(guān)當(dāng)一個變數(shù)的變化完全由另一個變量所決定時,稱變量間的這種關(guān)系為完全相關(guān)當(dāng)變量之間存在不嚴(yán)格的依存關(guān)系時,稱為不完全相關(guān)當(dāng)兩個變量的變化相互獨(dú)立、互不影響時,稱兩個變量不相關(guān)(或

17、零相關(guān)),返回本章,返回總目錄,27,(2)相關(guān)關(guān)系的分類,②按相關(guān)的方向可分為正相關(guān)和負(fù)相關(guān)當(dāng)一個變數(shù)隨著另一個變數(shù)的增加(減少)而增加(減少),即兩者同向變化時,稱為正相關(guān)當(dāng)一個變量隨著另一個變量的增加(減少)而減少(增加),即兩者反向變化,稱為負(fù)相關(guān)③按相關(guān)的形式可分為線性相關(guān)和非線性相關(guān)兩種當(dāng)變量間的依存關(guān)系大致呈現(xiàn)線性形式,即當(dāng)一個變量變動一個單位時,另一個變量也按一個大致固定的增(減)量變動,稱為線性相關(guān)當(dāng)變量間的

18、關(guān)系不按固定比例變化時,稱為非線性相關(guān)。,返回本章,返回總目錄,28,④按研究變量的多少可分為單相關(guān)、偏向關(guān)和復(fù)相關(guān)三種兩個變量之間的相關(guān)稱為單相關(guān)一個變量與兩個或兩個以上其他變量之間的相關(guān)稱為復(fù)相關(guān)在多個變量的相關(guān)研究中,假定其他變量不變,專門研究其中兩個變量之間的相關(guān)關(guān)系,稱為偏相關(guān),并非所有的變量之間都存在相關(guān)關(guān)系,因此需要用相關(guān)分析方法來識別和判斷。借助于圖形和若干分析指標(biāo)(如相關(guān)系數(shù)、相關(guān)指數(shù)等)對變量之間的依存關(guān)系的

19、密切度進(jìn)行測定的過程。,返回本章,返回總目錄,29,2. 相關(guān)關(guān)系的識別,(1)散點(diǎn)圖,識別變量間相關(guān)關(guān)系最簡單的方法就是圖形法。圖形法就是將所研究變量的觀測值以散點(diǎn)的形式繪制在相應(yīng)的坐標(biāo)系中,通過它們呈現(xiàn)出的特征,來判斷變量之間是否存在相關(guān)關(guān)系,以及相關(guān)的形式、相關(guān)的方向和相關(guān)的程度等。(例11-1),(2)相關(guān)系數(shù),單相關(guān)系數(shù)(簡稱相關(guān)系數(shù)),是衡量兩個變量之間線性相關(guān)關(guān)系的重要指標(biāo),返回本章,返回總目錄,30,31,相關(guān)系數(shù)的計

20、算公式:,總體相關(guān)系數(shù)(一般記為 ):,,式中:,——是變數(shù)X和Y的協(xié)方差,——是變數(shù)X的標(biāo)準(zhǔn)偏差,——是變數(shù)Y的標(biāo)準(zhǔn)偏差,樣本相關(guān)系數(shù):,,樣本相關(guān)系數(shù)是根據(jù)樣本觀測值計算的,隨著取樣的不同,相關(guān)系數(shù)的值也會有所變化。樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的一致估計量。,返回本章,返回總目錄,32,相關(guān)系數(shù)的特點(diǎn):,①相關(guān)系數(shù)的符號代表著變量間的相關(guān)方向,r>0:兩個變量之間正相關(guān)r<0:兩個變量之間負(fù)相關(guān)。②相關(guān)關(guān)系的

21、取值介于-1和1之間,它的絕對值越接近于1,變 量之間的線性相關(guān)程度越強(qiáng)。r=1或r=-1:兩個變量之間完全線性相關(guān),r=0:兩個變量之間不存在線性相關(guān),0<∣r∣<1:兩個變量之間存在一定程度的線性相關(guān)。,返回本章,返回總目錄,33,相關(guān)系數(shù)的檢驗:,提出假設(shè):,t 檢驗統(tǒng)計量:,,返回本章,返回總目錄,(例P.267),34,一元線性回歸分析,1. 回歸分析概述,(1)回歸分析的概念,在相關(guān)分析確定了

22、變量之間相關(guān)關(guān)系的基礎(chǔ)上,采用一定的計算方法,建立起變量間變動關(guān)系的公式,并根據(jù)一個變量的變化來估計或預(yù)測另一個變量發(fā)展變化的研究方法,就是回歸分析。,返回本章,返回總目錄,35,回歸分析和相關(guān)關(guān)系的區(qū)別與聯(lián)系:,回歸分析和相關(guān)分析都是對變量之間不嚴(yán)格依存關(guān)系的分 析,在理論基礎(chǔ)和方法上具有一致性。只有存在相關(guān)關(guān)系的變量才能進(jìn)行回歸分析,相關(guān)程度越 高,回歸分析結(jié)果越可靠。兩者差別:相關(guān)分析:變量之間的依存關(guān)系

23、,這些變量地位對等,不區(qū)分為 主從因素或因果關(guān)系?;貧w分析:在控制或給定一個(或多個)變量條件下來觀察對應(yīng) 的某一變量的變化,給定的變量為自變量,不是隨機(jī)變量,被 觀察的變量稱為因變量,是隨機(jī)變量,因此回歸分析中必須根 據(jù)研究的目的來確定自變量和因變量。,返回本章,返回總目錄,36,(2)回歸分析的種類,按研究中使用的自變量的多少可分為一元回歸和多元回歸;按變量之間變動關(guān)系的形式分為

24、線性回歸和非線性回歸。,相關(guān)關(guān)系主要測定的是變量之間關(guān)系的密切程度?;貧w分析則著重于變量之間的具體變動關(guān)系,通過建立回歸模型,控制或給定自變量對因變量及進(jìn)行估計和預(yù)測。,返回本章,返回總目錄,37,2. 一元線性回歸模型的建立,(1)一元線性回歸模型,當(dāng)兩個變量之間存在顯著的線性相關(guān)關(guān)系時,可以建立一元線性回歸模型來表述這種關(guān)系。總體一元線性回歸模型為:,,式中:,——代表因變量的第i個觀測值,——代表自變量的第i個觀測值,——是模型

25、的參數(shù)(又稱回歸系數(shù)),分別 為回歸直線的截距和斜率,——是隨機(jī)誤差項(或稱隨機(jī)擾動項),返回本章,返回總目錄,38,(2)參數(shù)估計,現(xiàn)實問題的研究中往往難以掌握研究對象的全部數(shù)據(jù),從而在回歸分析中需要通過樣本數(shù)據(jù)來估計總體模型的參數(shù)。根據(jù)樣本數(shù)據(jù)建立的回歸模型稱為樣本回歸模型,一般表述為:,,其中 是 的估計值(或稱理論值), 分別是 的估計值,代表樣本回歸直線的截距和斜率。

26、,返回本章,返回總目錄,(圖11-2),39,線性回歸模型參數(shù)的估計方法通常有兩種:普通最小二乘法和最大似然估計法。最常用的是普通最小二乘法。,最小二乘法的意義在于使,達(dá)到最小。,得到的,的兩個公式為:,返回本章,返回總目錄,(表11-2),40,3. 一元線性回歸模型的檢驗,在回歸模型估計出來以后,首先要對其進(jìn)行一系列的檢驗,只有通過了檢驗的模型才能用于對全局變量的估計或預(yù)測。,(一)擬合優(yōu)度的檢驗,可決系數(shù):,總離差

27、 :因變量的樣本觀測值與其均值的離差 ??傠x差可以分解為兩個部分:回歸離差 :因變量的回歸值與其樣本均值之間的離差。能夠由回歸方程所解釋的部分。剩余離差(殘差) :樣本觀測值與回歸值之間的離差。 不能由回歸方程解釋的部分。(11-14)(11-15),返回本章,返回總目錄,41,可決系數(shù)是衡量自變量對因變量變動的解釋程度的指標(biāo),它取決于回歸方程所解釋的 y 的總離差的百分比。可決系數(shù)

28、的公式定義為:,,的取值介于0和1之間。在實踐中, 常用與模型的比較,往往采用 最高的模型,因為 高,就意味著該模型把 y 的變動解釋得好。,返回本章,返回總目錄,42,B. 估計標(biāo)準(zhǔn)誤差(SE),估計標(biāo)準(zhǔn)誤差是回歸模型(即估計值)與因變量(y)觀測值之間得平均平方誤差。這個誤差的值越小,說明估計值越接近真實值,回歸模型的擬合度越好。估計標(biāo)準(zhǔn)誤差的計算公式為:,,作為回歸模型擬合優(yōu)度的評價指標(biāo),估計標(biāo)準(zhǔn)誤差顯然

29、不如可決系數(shù)。因為可決系數(shù)是無量綱的系數(shù),并且有確定的取值范圍(0~1),便于對不同數(shù)據(jù)回歸模型擬合優(yōu)度的比較。,返回本章,返回總目錄,43,(二)顯著性檢驗,通?;貧w模型的顯著性檢驗包括系數(shù)的檢驗和方程整體的檢驗兩個部分。,回歸系數(shù)的顯著性檢驗是指根據(jù)樣本計算結(jié)果對總體回歸系數(shù)有關(guān)假設(shè)所進(jìn)行的檢驗,它的主要目的是了解總體自變量與因變量之間是否真正存在樣本回歸模型所表述的相關(guān)關(guān)系。 的檢驗方法是相同的,以 為例來說

30、明回歸系數(shù)顯著性檢驗的基本內(nèi)容。,回歸系數(shù)的檢驗,返回本章,返回總目錄,44,提出假設(shè)(雙側(cè)檢驗):,計算檢驗統(tǒng)計量:,回歸系數(shù)的檢驗統(tǒng)計量為:,其中,,確定臨界值:,設(shè)定顯著水平之后,就可以確定顯著性檢驗的相應(yīng)臨界值 。,得出檢驗結(jié)論:,如果 ,就否定原假設(shè),表明總體回歸系數(shù) 是不為零的;反之,就不能否定原假設(shè)。,返回本章,返回總目錄,45,2. 方程整體的檢驗——F檢驗,除了逐個檢驗回歸系數(shù)的顯著性以

31、外,還要檢驗回歸模型整體的顯著性。其基本步驟如下:,提出假設(shè)(雙側(cè)檢驗):,計算檢驗統(tǒng)計量:,其中,F(xiàn)服從F(1,n-2)分布,確定臨界值:,根據(jù)顯著性水平和自由度就可以確定臨界值F。,得出檢驗結(jié)論:,如果 ,就否定原假設(shè),表明回歸模型是顯著的;反之,就不能否定原假設(shè)。,返回本章,返回總目錄,46,一元線性回歸方差分析表,值得注意的是,在一元線性回歸分析中,回歸系數(shù)的顯著性檢驗與回歸模型

32、的顯著性檢驗是等價的,因此 t 檢驗和F 檢驗的結(jié)論是一致的。但在多元回歸分析中,它們是不等價的,t 檢驗只檢驗方程中各個系數(shù)的顯著性,而 F 檢驗則檢驗的是整個方程的顯著性。,返回本章,返回總目錄,47,3. P值檢驗,P值檢驗通過比較P值與給定的顯著性水平 的大小,來決定是否否定原假設(shè)。P值檢驗的判斷準(zhǔn)則是:若P值小于給定的 ,則否定原假設(shè);若P值大于給定的 ,則接受原假設(shè)。,,(3)德賓—沃森統(tǒng)計量(D

33、-W)檢驗,德賓—沃森統(tǒng)計量(D-W)是檢驗?zāi)P褪欠翊嬖谧韵嚓P(guān)的一種有效方法。其公式為:,,將上式計算的D-W值與德賓—沃森給出的不同顯著水平 D-W值的上限 和下限 進(jìn)行比較判別。,返回本章,返回總目錄,(例P275),48,D-W值在0~4之間,DW檢驗法則:(1)DW值dU,μi無自我相關(guān); dL2時: 4?DWdU,μi無自我相關(guān); dL<4?D-W&l

34、t;dU,不能確定μi是否有自我相關(guān)。,(圖11-3),49,4. 用一元線性回歸模型進(jìn)行估計,(1)點(diǎn)估計,只要將給定的自變量值帶入所建立的一元線性回歸模型,便可以得到因變量的一個對應(yīng)的估計值。(例277),(2)區(qū)間估計,估計因變量的平均水平的 的置信區(qū)間:,大樣本:,小樣本:,返回本章,返回總目錄,50,估計特定的因變量,的預(yù)測區(qū)間:,大樣本:,小樣本:,,其中:,返回本章,返回總目錄,(例P.277~278),51,多

35、元線性回歸分析,在線性相關(guān)的基礎(chǔ)上,研究兩個或兩個以上自變量的回歸分析稱為多元線性回歸。,1. 多元線性回歸模型的建立,多元線性回歸模型,,參數(shù)的估計,以二元回歸模型為例,返回本章,返回總目錄,52,估計參數(shù)采用最小二乘法,可以通過解如下聯(lián)立方程得出:,,2. 多元線性回歸模型的檢驗,(1)擬合優(yōu)度的檢驗,度量簡單一元線性回歸模型的精確度指針,也適用于多元線性回歸模型。,可決系數(shù):,修正的可決系數(shù)

36、 ,,,n為樣本容量,k為自變量的個數(shù),返回本章,返回總目錄,(例P280),53,估計標(biāo)準(zhǔn)誤 越小,說明估計值越接近真實值。,估計標(biāo)準(zhǔn)誤差(SE),(2)顯著性檢驗,回歸系數(shù)的顯著性檢驗,回歸模型的顯著性檢驗,返回本章,返回總目錄,(例P282),(例P282),54,(3)德賓—沃森統(tǒng)計量(D-W)檢驗,(4)多重共線性檢驗,多重共線性是多元回歸分

37、析中特有的問題,簡單回歸不存在此問題。用于檢驗各個自變量之間是否是無關(guān)的。任意兩個自變量 和 之間的相關(guān)系數(shù)為:,,返回本章,返回總目錄,55,3. 用多元線性回歸模型進(jìn)行估計,(1)點(diǎn)估計,(2)區(qū)間估計,返回本章,返回總目錄,,56,4. 復(fù)相關(guān)系數(shù)與偏相關(guān)系數(shù),(1)復(fù)相關(guān)系數(shù),在多變量情況下,復(fù)相關(guān)系數(shù)是用來測定因變量 與一組自變量 之間相關(guān)程度的指標(biāo)。其計算公式為:,,,,復(fù)

38、相關(guān)系數(shù)的值域在0到1之間值為1: 與 之間存在嚴(yán)密的線性關(guān)系;值為0: 與 之間不存在任何線性相關(guān)關(guān)系;值在0和1之間:變量之間存在一定的線性相關(guān)關(guān)系。,返回本章,返回總目錄,57,(2)偏相關(guān)系數(shù),在多變量情況下,偏相關(guān)系數(shù)是用來測定當(dāng)其他變量保持不變的情況下,任意兩個變量之間相關(guān)程度的指標(biāo)。它主要考察兩個變量之間的凈相關(guān)關(guān)系,從而反映現(xiàn)象之間的

39、真實聯(lián)系。以兩個自變量的情形為例,,返回本章,返回總目錄,58,非線性回歸分析,1. 適配曲線問題,選配曲線通常可以分為下列兩個步驟:,(1)確定變量間的依存關(guān)系,根據(jù)實際資料做散點(diǎn)圖,按照 圖形的分布形狀選擇合適的模型。(2)確定回歸模型中的未知參數(shù)(最小二乘法)。,2. 相關(guān)指數(shù),非線性回歸分析中,變量之間的相關(guān)關(guān)系難以用單相關(guān)系數(shù)來測定。在這種情況下,通常使用相關(guān)指數(shù),即對非線性回歸模型進(jìn)行擬合時所得到的

40、可決系數(shù),作為判斷變量之間是否存在某種非線性關(guān)系的尺度。,返回本章,返回總目錄,(例11-2),59,3. 一些常見的函數(shù),返回本章,返回總目錄,(圖11-5),(圖11-6),(圖11-7),(圖11-8),(圖11-9),60,應(yīng)用回歸預(yù)測時應(yīng)注意的問題,1. 關(guān)于定性分析的問題,進(jìn)行回歸分析時,應(yīng)當(dāng)重視相應(yīng)的理論分析,來確定變量之間的相關(guān)關(guān)系及其影響程度。有關(guān)聯(lián)的其他因素應(yīng)該考慮假定條件是否符合實際情況,2. 關(guān)于回歸預(yù)測不能

41、任意外推的問題,3. 關(guān)于對數(shù)據(jù)數(shù)據(jù)的要求問題,(1)數(shù)據(jù)資料的準(zhǔn)確性,(2)數(shù)據(jù)資料的可比性(單位)和獨(dú)立性,(3)社會經(jīng)濟(jì)現(xiàn)象基本穩(wěn)定的問題,返回本章,返回總目錄,(圖11-10),61,第12章時間序列分析和預(yù)測,返回總目錄,62,(1)時間序列的基本概念: 時間序列是社會經(jīng)濟(jì)指標(biāo)按時間順序排列而成的一種數(shù)列。它反映社會經(jīng)濟(jì)現(xiàn)象發(fā)展變化的過程和特點(diǎn),是研究現(xiàn)象發(fā)展變化趨勢、規(guī)律和對未來狀態(tài)進(jìn)行預(yù)測的重要依據(jù)。,

42、1.時間序列的基本概念和構(gòu)成要素,(2)時間序列的兩個基本要素:統(tǒng)計指標(biāo)所屬的時間;統(tǒng)計指標(biāo)在特定時間的具體指標(biāo)值。,時間序列分解法,返回本章,返回總目錄,(例表12-1),63,2.時間序列的因素分解,(1)長期趨勢因素(T)長期趨勢因素(T)反映了經(jīng)濟(jì)現(xiàn)象在一個較長時間內(nèi)的發(fā)展方向,可以在一個相當(dāng)長的時間內(nèi)表現(xiàn)為一種近似直線的持續(xù)向上或持續(xù)向下或平穩(wěn)的趨勢;在某種情況下,它也可以表現(xiàn)為某種類似指數(shù)或者其他曲線的形式。經(jīng)濟(jì)現(xiàn)象的

43、長期趨勢一旦形成,總能延續(xù)一段相當(dāng)長的時期。,經(jīng)濟(jì)時間序列的變化受到長期趨勢、季節(jié)變動、周期變動和不規(guī)則變動這四個因素的影響。其中:,(2)季節(jié)變動因素(S)季節(jié)變動因素(S)是經(jīng)濟(jì)現(xiàn)象受季節(jié)變動影響所形成的一種長度和幅度固定的周期波動。季節(jié)變動因素既包括受自然季節(jié)影響所形成的波動,也包括受工作時間規(guī)律如每周5天工作制度所形成的波動。,返回本章,返回總目錄,64,(3)周期變動因素周期變動因素(C)也稱循環(huán)變動因素,它是受各種經(jīng)濟(jì)因

44、素影響形成的上下起伏不定的波動。季節(jié)變動和周期變動的區(qū)別在于季節(jié)變動的波動長度固定,而周期變動的長度則一般是不一樣的。,(4) 不規(guī)則變動因素(I)不規(guī)則變動又稱隨機(jī)變動,它是受各種偶然因素影響所形成的不規(guī)則變動。,返回本章,返回總目錄,65,3.時間序列的分解模型,時間序列分解的方法有很多,較常用的模型有加法模型和乘法模型。,將時間序列分解成長期趨勢、季節(jié)變動、周期變動和不規(guī)則變動四個因素后,可以認(rèn)為時間序列是Y是這四個因素的函數(shù)

45、,,加法模型為:乘法模型為:,,,,返回本章,返回總目錄,66,4.時間序列的分解方法,(1)季節(jié)指數(shù) 的計算(例12-1)季節(jié)指數(shù) 的計算是先運(yùn)用移動平均法剔除長期趨勢和周期變化,得到序列 ,然后再用按月(季)平均法求出季節(jié)指數(shù) 。移動平均的項數(shù)取決于周期變動的時間長度。但是按偶數(shù)項計算的平均數(shù)對應(yīng)的是原序列移動平均期的兩項中間,所以需做兩次移動。由此得到了不含季節(jié)因素和不規(guī)則因素的序列(移動平均也消

46、除了不規(guī)則變動),它可以大致地體現(xiàn)現(xiàn)象發(fā)展的長期趨勢。將Y除以 ,得到的是只含季節(jié)因素和不規(guī)則變動因素的序列,在此基礎(chǔ)上采用按季平均法可求出各年的同季節(jié)平均數(shù)。,時間序列的分解分析中,一般先計算季節(jié)指數(shù),然后計算長期趨勢和周期變動。以乘法模型為例,,,返回本章,返回總目錄,67,(2)長期趨勢 T 的計算可以用回歸模型來描述,做散點(diǎn)圖,選擇適合的趨勢模型擬合序列的長期趨勢,得到長期趨勢 T 。,(4)不規(guī)則變動I 的計算將

47、時間序列的T, S, C分解出來后,剩余的即為不規(guī)則變動,即:I = Y/(TSC),(3)周期變動因素C的計算用序列TC除以 T ,即可得周期變動因素C。,,,返回本章,返回總目錄,(例P302),68,5.用時間序列分解法進(jìn)行預(yù)測,(1)建立預(yù)測模型以乘法模型為例,在時間序列分解中,一般無法預(yù)測不規(guī)則變動因素I,因此,它的預(yù)測模型可以表達(dá)為:,在求解出時間序列各個因素之后,便可以建立模型進(jìn)行預(yù)測。,(2)預(yù)測長期趨勢(3)

48、計算季節(jié)因素和周期因素對預(yù)測值的影響,,,,返回本章,返回總目錄,(例P.303),(表12-4),69,1.趨勢外推法,當(dāng)研究對象依時間變化呈現(xiàn)某種上升或下降趨勢,沒有明顯的季節(jié)波動,且能找到一個合適的函數(shù)曲線反映這種變化趨勢時,就可以用時間為自變量,時間序列數(shù)值為因變量,建立趨勢模型: .如果有理由認(rèn)為這種趨勢能夠延伸到未來時,賦予變量 t 所需要的值,就能得到相應(yīng)的時間序列未來值,這就是趨勢外推法。,趨勢

49、外推法的兩個假定:,,,,,(1)假設(shè)事物發(fā)展過程沒有跳躍式變化;(2)假定事物的發(fā)展因素也決定事物未來的發(fā)展,其條件是 不變或變化不大。,時間序列趨勢外推法,返回本章,返回總目錄,70,(一)多項式曲線模型一次(線性)預(yù)測模型:二次(二次拋物線)預(yù)測模型:三次(三次拋物線)預(yù)測模型:n次(n次拋物線)預(yù)測模型:,趨勢外推法的實質(zhì)就是利用某種函數(shù)方程來分析研究對象的發(fā)展趨勢。以時間作為自變量,

50、有下列四種趨勢模型最為常用:,,,,,,,2.趨勢外推分析法的模型,返回本章,返回總目錄,71,(二)指數(shù)曲線模型:,(三)對數(shù)曲線模型:,指數(shù)曲線模型:修正的指數(shù)曲線模型:,,,,,,返回本章,返回總目錄,72,(4)生長曲線模型:,皮爾曲線模型:式中: 為變數(shù) 的極限值;a,b為常數(shù)。,龔珀茲曲線模型:,,,,,,,返回本章,返回總目錄,73,(一)圖形識別法:,這種方法又稱為直接觀察法,是通過

51、繪制散點(diǎn)圖來進(jìn)行的,即將時間序列的數(shù)據(jù)繪制成以時間為橫軸,時序觀察值為縱軸的圖形,觀察散點(diǎn)的分布并將其變化曲線與各類函數(shù)曲線模型的圖形進(jìn)行比較,以便選擇較為合適的模型。在實際中,有可能同時有幾種模型都較為接近而無法通過圖形直觀確認(rèn)為某種模型,這就必須同時對幾種模型進(jìn)行試算,最后選擇標(biāo)準(zhǔn)誤差最小的模型作為研究對象的趨勢模型。,,,,3.趨勢外推模型的選擇,返回本章,返回總目錄,74,(二)差分法,二階向后差分的定義為:k階向后差

52、分的定義為:,由于模型種類很多,為了根據(jù)歷史數(shù)據(jù)正確選擇模型,常常利用差分法把數(shù)據(jù)修勻,使非平穩(wěn)序列達(dá)到平穩(wěn)序列。其中最常用的是一階向后差分。其定義為:,,,,把所計算的時間序列的差分與各類模型的差分特點(diǎn)比較,就可以找到適宜的模型。,,,,返回本章,返回總目錄,75,一次(線性)模型差分計算表,,,,,,,,,,,,由上表可知,當(dāng)時間序列各期數(shù)值的一階差分相等或大致相等,就可以適用一次(線性)模型。,返回本章,返回總目錄,76,二次(拋

53、物線)模型差分計算表,,,,,,,,,,,,由上表可知,當(dāng)時間序列各期數(shù)值的二階差分相等或大致相等,就可以適用二次(拋物線)模型。,返回本章,返回總目錄,77,指數(shù)曲線模型差分計算表,,,,,,,,,,,,由上表可知,當(dāng)時間序列各期數(shù)值的一階比率相等或大致相等,就可以適用指數(shù)曲線模型。,返回本章,返回總目錄,78,修正指數(shù)曲線模型差分計算表,,,,,,,,,,,,由上表可知,當(dāng)時間序列各期數(shù)值的一階差的一階比率相等或大致相等,就可以適用

54、修正指數(shù)曲線模型。,返回本章,返回總目錄,79,四.用趨勢外推法進(jìn)行預(yù)測,(一)多項式曲線模型的趨勢外推預(yù)測法,多項式曲線模型的一般形式為:當(dāng) 時,為直線模型;當(dāng) 時,為二次多項式模型;當(dāng) 時,為n 次多項式模型。,,,,,,返回本章,返回總目錄,(例12-2),80,(2)指數(shù)曲線模型的趨勢外推預(yù)測法,指數(shù)曲線預(yù)測模型:,對函數(shù)模型 作線性變換得出:

55、令, 則,這樣指數(shù)曲線模型轉(zhuǎn)化為直線模型。,,,,,,,,,,,返回本章,返回總目錄,(例12-3),81,(3)修正的指數(shù)曲線模型的趨勢外推預(yù)測,修正的指數(shù)曲線模型:式中a、b和c為待定參數(shù)。,求解方法是:將時間序列分成相等項數(shù)的三個組,以三個組的變數(shù)總數(shù)聯(lián)系起來求導(dǎo)??砂磿r間先后把資料分為三組:Ⅰ,Ⅱ,Ⅲ,各組序列項數(shù)為n,則:,,,,,,,很多新產(chǎn)品投入市場后,需求量常常呈現(xiàn)出初期迅速增加,一段時間后逐

56、漸降低增加的速度,而增長量的環(huán)比速度又大體上各期相等,最后發(fā)展水平趨向于某一個正的常數(shù)極限。修正指數(shù)曲線模型正式用來描述這種發(fā)展趨勢的理想工具。,,返回本章,返回總目錄,(例12-4),82,(4)龔珀茲曲線模型的趨勢外推預(yù)測法,龔珀茲曲線模型:,,,,,,,用分組法求解龔珀茲曲線中的參數(shù)的步驟為:,,做對數(shù)變換:,,,① 所搜集的歷史統(tǒng)計資料,要能夠被3整除,即是以3n為時序的數(shù),n為一組的數(shù)據(jù)點(diǎn)個數(shù)。② y 值代表預(yù)測對象所對應(yīng)于

57、各時序的數(shù)值,并將各y值變換成對數(shù)。③ 將第一組n個數(shù)據(jù)點(diǎn)的各 相加,求得 ;第二組n個數(shù)據(jù)點(diǎn)的 相加,求得 ;最后一組n個數(shù)據(jù)點(diǎn)的 相加,求得 。,,,,,返回本章,返回總目錄,(圖12-5),83,④式中的t代表時序的順序,取,⑤將有關(guān)資料帶入下列公式:

58、 或,⑥查反對數(shù)表,求出參數(shù)k, a, b的值,便得到了龔珀茲預(yù)測模型。多用于新產(chǎn)品的研制、發(fā)展、成熟和衰退分析。工業(yè)產(chǎn)品壽命一般可分為四個時期:萌芽期、暢銷期、飽和期、衰退期。龔珀茲曲線特別使用于對處在成熟期的商品進(jìn)行預(yù)測,以掌握市場需求和銷售的飽和量。,,,,,,,,,返回本章,返回總目錄,84,(5)皮爾曲線模型趨勢外推預(yù)測法,皮爾曲線模型:式中:L為變數(shù) 的極限值;a, b為常數(shù)。,,,,,,

59、,,求解參數(shù)的方法:可采用時間序列相鄰兩項倒數(shù)之差建立方程序(羅茲方程式)。,,,皮爾曲線多用于生物繁殖、人口發(fā)展統(tǒng)計,也適用于對產(chǎn)品生命周期作出分析,尤其適用于處在成熟期的商品的市場需求飽和量(即市場最大潛力)的分析和預(yù)測。,,,,,,,,返回本章,返回總目錄,85,1.時間序列的自相關(guān)性,時間序列的指標(biāo)值隨著時間變化而變化,后期水平是在前期水平的基礎(chǔ)上發(fā)展而來的,因此前后期水平之間存在一定程度的依存關(guān)系,稱為時間序列的自相關(guān)性。自相

60、關(guān)性強(qiáng)度一般由自相關(guān)系數(shù)來測定。,時滯為k 的自相關(guān)系數(shù) 的計算公式為: ,且 。,,,,,,,,,2.時間序列的自回歸模型,一個 階的樣本自回歸模型可以表述為:,返回本章,返回總目錄,時間序列自回歸預(yù)測法,(例12-7),86,第13章,統(tǒng)計決策,返回總目錄,87,統(tǒng)計決策的一般問題,1. 決策的概念和種類,(1)決策的概念,決策就是為了實現(xiàn)

61、特定的目標(biāo),根據(jù)客觀的可能性,在占有一定信息和經(jīng)驗的基礎(chǔ)上,借助一定的工具、技巧和方法,對影響未來目標(biāo)實現(xiàn)的諸因素進(jìn)行準(zhǔn)確的計算和判斷選優(yōu)后,對未來行動做出決定。統(tǒng)計決策有廣義和狹義之分,凡是使用統(tǒng)計方法進(jìn)行決策的方法稱為廣義的統(tǒng)計決策;狹義的統(tǒng)計決策是指在不確定條件下的決策。,返回本章,返回總目錄,88,不確定情況下的決策需要具備以下幾個條件:,(1)決策人要求達(dá)到的一定目的(2)存在兩個或兩個以上可供選擇的方案(3)存在著不以決

62、策人主觀意志為轉(zhuǎn)移的客觀狀態(tài),即自然狀態(tài)(4)在不同情況下采取不同方案所產(chǎn)生的結(jié)果是可以計量的,所有的結(jié)果構(gòu)成一個結(jié)果空間。,(2)決策的種類,按決策問題所處的條件不同,可分為確定型決策、不確定型決策和對抗型決策三種。,返回本章,返回總目錄,89,確定型決策:,確定型決策是指可供選擇方案的條件已確定。,不確定型決策:,不確定型決策是指決策時的條件是不確定的,細(xì)分起來又可以分成兩種。一種是已知各種可能情況出現(xiàn)的概率,因此可以結(jié)合概率來作

63、出判斷,選擇方案,稱為風(fēng)險型決策。另一種是未知任何信息的決策,稱為完全不確定情況下的決策。,對抗型決策:,對抗性決策的特點(diǎn)是包含了兩個或幾個人之間的競爭,并且不是所有的決策都在決策人的直接控制下,而要考慮到對方的策略。,返回本章,返回總目錄,90,2. 決策的作用和步驟,(1)決策的作用,決策的作用體現(xiàn)在:科學(xué)的統(tǒng)計決策起著由決策目標(biāo)到結(jié)果的中間媒介作用;科學(xué)的統(tǒng)計決策提供有事實根據(jù)的最優(yōu)行動方案,起著避免盲目性、減少風(fēng)險性的導(dǎo)向效應(yīng);

64、統(tǒng)計決策在市場、經(jīng)濟(jì)、管理等諸多領(lǐng)域中有廣泛的用途。,(2)決策的步驟,一個完整的決策包括以下步驟,①確定目標(biāo)和搜集數(shù)據(jù),包括必要的調(diào)整計算,②辨認(rèn)自然狀態(tài)和可能采取的行動,返回本章,返回總目錄,91,③計算全部損益值,④對全部行動進(jìn)行篩選,淘汰不可接受的行動,保留可以接受的行動,⑤用適當(dāng)?shù)姆椒ù_定先驗概率,進(jìn)行必要的概率計算,⑥用先驗概率和各種行動方案種的損益值,計算期望損益值,據(jù)以評價各種行動的可能結(jié)果,⑦進(jìn)行擇優(yōu)決策分析,選出最優(yōu)

65、行動方案,若要做后驗決策,還要繼續(xù)進(jìn)行以下步驟:,⑧搜集補(bǔ)充材料,包括抽樣的或非抽樣的,計算所需要的條件概率和聯(lián)合概率,利用先驗概率和聯(lián)合概率,按貝葉斯公式計算后驗概率,返回本章,返回總目錄,92,⑨用后驗概率和各種行動中的損益值,計算期望損益值,據(jù)以評價各種行動的可能結(jié)果,⑩進(jìn)行擇優(yōu)決策,選出最優(yōu)行動方案,3. 決策的公理和原則,(1)決策的公理,決策的公理是所有理智健全的決策者都能接受或承認(rèn)的基本原理,是許許多多決策者長期決策實踐經(jīng)

66、驗的總結(jié)。,返回本章,返回總目錄,93,決策的公理有兩個基本點(diǎn):,(1)決策者通常對自然狀態(tài)出現(xiàn)的可能性有一個大致的估計,即存在“主觀概率”;(2)決策者對于每一行動方案的結(jié)果根據(jù)自己的興趣、愛好等價值標(biāo)準(zhǔn)有自己的評價,這個評價叫做行動方案的“效用”。,返回本章,返回總目錄,94,(2)決策的原則,做出正確的決策應(yīng)遵循的三條原則:可行性原則;經(jīng)濟(jì)性原則;合理性原則。,統(tǒng)計決策的6條公理:,①方案的優(yōu)劣是可比較和判別的;②方案必須具有

67、獨(dú)立存在的價值;③在分析方案時只有不同的結(jié)果才需要加以比較;④主觀概率和方案結(jié)果之間不存在聯(lián)系;⑤效用的等同性;⑥效用的替換性。,返回本章,返回總目錄,95,風(fēng)險型決策方法,1. 風(fēng)險型決策的基本問題,(1)風(fēng)險型決策的概念,風(fēng)險型決策,是根據(jù)預(yù)測各種事件可能發(fā)生的先驗概率,然后再采用期望效果最好的方案作為最優(yōu)決策方案。因此,這種決策具有一定的風(fēng)險。,先驗概率就是根據(jù)過去、經(jīng)驗或主觀判斷而形成的對各自然狀態(tài)的風(fēng)險程度的測算值。

68、簡而言之,原始的概率就是先驗概率。,返回本章,返回總目錄,96,(2)損益矩陣,可行方案,自然狀態(tài)及其發(fā)生的概率,各種行動方案的可能結(jié)果,,損益矩陣包括三部分內(nèi)容,可行方案是由各方面專家根據(jù)決策目的,綜合考慮資源條件及實現(xiàn)的可能性,經(jīng)充分討論研究制定出來的。,自然狀態(tài)是指各種可行方案可能遇到的客觀情況和狀態(tài)。這些情況和狀態(tài)來自系統(tǒng)的外部環(huán)境,一般決策者不能控制。,各種自然狀態(tài)發(fā)生的概率有主觀概率和客觀概率之分,滿足

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論