統(tǒng)計學(xué)第十一章_第1頁
已閱讀1頁,還剩37頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第十一章 相關(guān)與回歸分析,變量間關(guān)系的度量一元線性回歸分析,第一節(jié) 變量間關(guān)系的度量,變量間的關(guān)系相關(guān)關(guān)系的描述與測度,一、變量間的關(guān)系,在生產(chǎn)經(jīng)營活動中,我們經(jīng)常要對變量之間的關(guān)系進(jìn)行分析。比如,在企業(yè)生產(chǎn)中,我們要對影響生產(chǎn)成本的各種因素進(jìn)行分析,以達(dá)到控制成本的目的;在農(nóng)業(yè)生產(chǎn)中,我們需要研究農(nóng)作物產(chǎn)量與施肥量的關(guān)系,以便分析施肥量對產(chǎn)量的影響,進(jìn)而確定合理的施肥量;商業(yè)活動中,我們需要分析廣告費(fèi)支出與銷售量之間的關(guān)系,進(jìn)而

2、通過廣告費(fèi)支出來預(yù)測銷售量等。變量之間的關(guān)系形態(tài)可分為兩種類型:函數(shù)關(guān)系和相關(guān)關(guān)系。,,我們比較熟悉的,一、變量間的關(guān)系,例1:某種產(chǎn)品的銷售額和銷售量之間的關(guān)系。設(shè)銷售額為y,銷售量為x,銷售價格為p,則x與y之間的關(guān)系可表示為y=px。這就是說,在銷售價格不變的情況下,對于該商品的某一銷售量,總有一個銷售額與之對應(yīng),即銷售額完全由銷售量所確定,二者之間為線性函數(shù)關(guān)系。,例2:企業(yè)的原材料消耗額(y)與產(chǎn)量(x1),單位產(chǎn)品消耗(x

3、2),原材料價格(x3)之間的關(guān)系可表示為y=x1x2x3。這里的y與x1、x2、x3之間是一種確定的函數(shù)關(guān)系,但它們不是線性函數(shù)關(guān)系。,函數(shù)關(guān)系是一一對應(yīng)的確定關(guān)系。,但實際問題中,變量之間的關(guān)系往往不那么簡單?!   ±纾何覀兛疾旒彝π钆c家庭收入這兩個變量,它們之間不存在完全確定的關(guān)系。,定義1:我們把變量之間存在的不確定的數(shù)量關(guān)系稱為相關(guān)關(guān)系。,例3:從遺傳學(xué)角度看,子女的身高(y)與其父母的身高(x)有很大關(guān)系?!   ?/p>

4、一般來說,父母身高較高時,其子女的身高通常也高,父母身高較低時,其子女的身高通常也較低。但實際情況并不完全如此,因為它們之間不是完全確定的關(guān)系。顯然,子女的身高并不完全由父母身高一個因素所決定,還受其他許多因素的影響,因此二者之間屬于相關(guān)關(guān)系。,總結(jié):從上面的例子可以看出,相關(guān)關(guān)系的特點是:一個變量的取值不能由另一個變量唯一確定,當(dāng)變量x取某個值時,變量y的取值可能有幾個。對這種關(guān)系不確定的變量顯然不能用函數(shù)關(guān)系進(jìn)行描述,但也不是無規(guī)律

5、可循。,通過大量數(shù)據(jù)的觀察與研究,我們會發(fā)現(xiàn)許多變量之間確定存在著一定的客觀規(guī)律。如:平均來說,父母身高較高時,其子女的身高一般也較高;收入水平高的家庭,其家庭儲蓄一般也較多。,相關(guān)與回歸分析正是描述與探索這類變量之間關(guān)系及其規(guī)律的統(tǒng)計方法。,二、相關(guān)關(guān)系的描述與測度,(一)散點圖(二)相關(guān)系數(shù),(一)散點圖,相關(guān)分析就是對兩個變量之間線性關(guān)系的描述與度量。對于兩個變量x和y,通過觀察或試驗我們可以得到若干組數(shù)據(jù),記為(xi,yi)(

6、i=1,2,3…)。相關(guān)分析所要解決的問題是,根據(jù)這些數(shù)據(jù)確定變量之間是否存在相關(guān)關(guān)系,如果存在的話,如何描述出它們之間的關(guān)系并對其關(guān)系強(qiáng)度進(jìn)行測度。,定義2:用坐標(biāo)的水平軸代表變量x,縱軸代表因變量y,每組數(shù)據(jù)( xi,yi)在坐標(biāo)系中用一個點表示,n組數(shù)據(jù)在坐標(biāo)系中形成的n個點稱為散點,由坐標(biāo)及散點形成的二維數(shù)據(jù)圖稱為散點圖。,(e)非線性相關(guān),(f )不相關(guān),不同形態(tài)的散點圖,例:一家大型商業(yè)銀行在多個地區(qū)設(shè)有分行,其業(yè)務(wù)主要是

7、進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國家重點項目建設(shè)、固定資產(chǎn)投資等項目的貸款。近年來,該銀行的貸款額平穩(wěn)增長,但不良貸款額也有較大比例提高,這給銀行業(yè)務(wù)的發(fā)展帶來壓力。為弄清楚不良貸款形成的原因,研究人員希望利用銀行業(yè)務(wù)的有關(guān)的有關(guān)數(shù)據(jù)作些定量分析,以便找出控制不良貸款的辦法。下表是該銀行所屬25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)。,某商業(yè)銀行2002年的主要業(yè)務(wù)數(shù)據(jù),,研究人員想知道,不良貸款是否與與貸款余額、應(yīng)收貸款,貸款項目的多少、固定資產(chǎn)投資等因素

8、有關(guān)?是什么樣的關(guān)系?關(guān)系強(qiáng)度如何?,由散點圖可以看出:不良貸款與貸款余額、應(yīng)收貸款、貸款項目個數(shù)、固定資產(chǎn)投資額之間都具有一定的線性關(guān)系,但從各散點的分布情況看,與貸款余額線性關(guān)系比較密切,而與固定資產(chǎn)投資額關(guān)系最不密切。,(二)相關(guān)系數(shù),通過散點圖可以判斷兩個變量之間有無相關(guān)關(guān)系,并對變量間的關(guān)系形態(tài)作出大致描述,但散點圖不能準(zhǔn)確反映變量之間的關(guān)系密切程度。因此,為準(zhǔn)確度量兩個變量之間的關(guān)系密切程度,需要計算相關(guān)系數(shù)。,定義3:根據(jù)

9、樣本數(shù)據(jù)計算的對兩個變量之間線性關(guān)系強(qiáng)度的度量值,稱為相關(guān)系數(shù)。若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,稱為總體相關(guān)系數(shù),記為ρ;若是根據(jù)樣本數(shù)據(jù)計算的,則稱為樣本相關(guān)系數(shù),記為r。樣本相關(guān)系數(shù)的計算公式為:,簡化公式為:,例:根據(jù)表中數(shù)據(jù),計算不良貸與貸款余額之間的相關(guān)系數(shù)。,各相關(guān)系數(shù)的各數(shù)值說明了什么?,可以證明:相關(guān)系數(shù)的取值范圍在+1~-1之間,即-1≤r≤1。若0<r≤1,x與y之間存在正線性相關(guān)關(guān)系;-1≤r<0,x與y

10、之間存在負(fù)線性相關(guān)關(guān)系;r=+1,表明x與y之間為完全正線性相關(guān)關(guān)系;r=-1,表明x與y之間為完全負(fù)線性相關(guān)關(guān)系;r=0時,表示兩個變量不存在線性相關(guān)關(guān)系。,注:r=0只表示兩個變量之間不存在線性相關(guān)關(guān)系,并不說明變量之間沒有任何關(guān)系,比如它們之間可能存在非線性相關(guān)關(guān)系。|r| 1,說明變量之間線性關(guān)系越密切。,,|r|≥0.8時,可視為高度相關(guān),0.5≤|r|<0.8時,可視為中度相關(guān); 0.3≤|r|<0.5時,視為

11、低度相關(guān); |r|<0.3時,說明兩個變量之間的相關(guān)程度極弱,可視為不相關(guān)。,三、相關(guān)關(guān)系的顯著性檢驗,一般情況下,總體相關(guān)系數(shù)ρ是未知的,通常是根據(jù)樣本相關(guān)系數(shù)r作為ρ的近似估計值。由于r是根據(jù)樣本數(shù)據(jù)計算出來的,它受到抽樣波動的影響,由于抽取的樣本不同,r取值不同,因此r是一個隨機(jī)變量。,注:能否根據(jù)樣本相關(guān)系數(shù)說明總體的相關(guān)程度呢?這就需要考察樣本相關(guān)系數(shù)的可靠性,也就是需要考察樣本相關(guān)系數(shù)的可靠性,也就是顯著性檢驗。,第二節(jié)

12、一元線性回歸分析,相關(guān)分析 的目的在于測度變量之間的關(guān)系密切程度,它所使用的測度工具就是相關(guān)系數(shù)?;貧w分析側(cè)重于考察變量之間的數(shù)量伴隨關(guān)系,并通過一定的數(shù)學(xué)表達(dá)式將這種關(guān)系描述出來,進(jìn)而確定一個或幾個變量(自變量)的變化對另一個特定變量(因變量)的影響程度。,一、一元線性回歸模型二、參數(shù)的最小二乘估計,一、一元線性回歸模型,(一)回歸模型(二)回歸方程,(一)回歸模型,定義4:在回歸分析中,被預(yù)測或被解釋的變量,稱為因變量,用y表

13、示。定義5:在回歸分析中,用來預(yù)測或用來解釋因變量的一個或多個變量,稱為自變量,用x表示。,例如:在分析貸款余額對不良貸款的影響時,我們的目的是預(yù)測一定的貸款余額條件下的不良貸款是多少。因此不良貸款是被預(yù)測的變量,稱為因變量,而用來預(yù)測不良貸款的貸款余額就是自變量。,定義6:在回歸分析中,只涉及一個自變量的回歸,稱為一元回歸,若因變量y與自變量x之間為線性關(guān)系時稱為一元線性回歸。定義7:描述因變量y如何依賴于自變量x和誤差項ε的方程

14、,稱為回歸模型。,對于只涉及一個自變量的一元線性回歸模型可表示為:y=β0+β1x+ ε,,反映了由于x的變化而引起的y 的線性變化;,,稱為誤差項,是一個隨機(jī)變量,它反映了除x和y之間的線性關(guān)系之外的隨機(jī)因素對y的影響,是不能由x與y之間的線性關(guān)系所解釋的變異性,,β0、β1稱為模型的參數(shù),,以上模型有三個假定: (1)誤差項是一個期望值為零的正態(tài)分布隨機(jī)變量,并且ε相互獨(dú)立。 (2)當(dāng)x固定為某一值xi時,y為正態(tài)分布的隨

15、機(jī)變量,即y~N(β0+β1xi, σ2)(3)y的方差σ2是一個不變的常量; (4)每一對觀察數(shù)據(jù)(xi, yi )和另一對觀察數(shù)據(jù)( xi, yi )都是相互獨(dú)立地進(jìn)行觀察所得到的。,,獨(dú)立性意味著對于一個特定的x值,它所對應(yīng)的ε與其他x值對應(yīng)的ε不相關(guān)。,(二)回歸方程,根據(jù)回歸方程中的假定,ε的期望值等于零,因此y的期望值E(y)= β0+β1x,也就是說y的期望值是x的線性函數(shù)。,定義8:描述因變量y的期望值如何依賴于自

16、變量x的方程,稱為回歸方程。一元線性回歸方程的形式為: E(y)= β0+β1x一元線性回歸方程的圖示是一條直線,因此也稱為直線回歸方程。,,β0為回歸直線在y軸上的截距, 當(dāng)x=0時y的期望值,,β1為直線的斜率,它表示當(dāng)x每變動一個單位時,y的平均變動值。,(三)估計的回歸方程,如果回歸方程中的參數(shù)β0和β1已知,對于一個給定的x值,利用式E(y)= β0+β1x可以計算出y的期望值。但回歸參數(shù)β0和β1是未

17、知的,我們必須利用樣本數(shù)據(jù)去估計它們。用樣本統(tǒng)計量 β0和β1代替回歸方程中的未知參數(shù)β0和β1 ,這時我們就得到了估計的回歸方程。,,,,,定義9:利用最小二乘法,根據(jù)樣本數(shù)據(jù)求出的回歸方程的估計,稱為估計的回歸方程。對于一元線性回歸,估計的回歸方程形式如下: y= β0+β1x,,,,,,,,β0為估計的回歸直線在y 軸上的截距,,β1為直線的斜率,它表示對于一個給定的x值,y是y的估計值,,,,,,,二、參數(shù)的最小二乘估計,對于

18、x和y的n對觀察值,用于描述其關(guān)系的直線有多條,究竟用哪直線來代表兩個變量之間的關(guān)系,需要有一個明確的原則。我們采用距離各觀察點最近的一條直線來代表x與y之間的關(guān)系。最小二乘法是使因變量的觀察值yi與估計值yi之間的離差平方和達(dá)到最小來求得β0和β1的方法。即,,,,,,,定義10:使因變量的觀察值與估計值之間的離差平方和達(dá)到最小來求得β0和β1的方法,稱為最小二乘法。,令Q= ,求使

19、用權(quán)Q最小的β0和β1值,,例:根據(jù)數(shù)據(jù),求不良貸款對貸款余額的估計方程。 解:根據(jù)公式: 即不良貸款對貸款余額的估計方程為: y=-0.8295+0.037895x。 回歸系數(shù)β1=0.037895, 表示貸款余額每增加1億元,不良貸款平均增加0.037895億元。將xi的各個取值代入上述估計方程,可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論