大學(xué)統(tǒng)計(jì)學(xué)-ch8相關(guān)與回歸分析_第1頁(yè)
已閱讀1頁(yè),還剩62頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第八章 相關(guān)與回歸分析,變量間的相關(guān)關(guān)系 一元線性回歸模型 多元線性回歸模型 非線性回歸模型,第一節(jié) 變量間的相關(guān)關(guān)系,一、相關(guān)關(guān)系的概念 相關(guān)關(guān)系是指客觀現(xiàn)象間確實(shí)存在的數(shù)量上不是嚴(yán)格對(duì)應(yīng)的依存關(guān)系。,⒈按涉及變量的多少分為,⒉按照表現(xiàn)形式不同分為,⒊按照變化方向不同分為,一元相關(guān)(單相關(guān)),多元相關(guān)(復(fù)相關(guān)),,直線相關(guān)(線性相關(guān)),曲線相關(guān)(非線性相關(guān)),,二、相關(guān)關(guān)系的類(lèi)型,三 相關(guān)分析的基

2、本內(nèi)容,1、判斷現(xiàn)象之間是否存在相關(guān)關(guān)系、關(guān)系的類(lèi)型及密切程度;  ?。病橄嚓P(guān)關(guān)系建立回歸方程或經(jīng)驗(yàn)公式;  ?。?、測(cè)定估計(jì)誤差。,第二節(jié) 相關(guān)圖(散點(diǎn)圖)和相關(guān)系數(shù),一、相關(guān)圖,相關(guān)關(guān)系的判斷方法,二、相關(guān)表  1、簡(jiǎn)單相關(guān)表,小麥畝產(chǎn)量與施肥量相關(guān)表,2、分組相關(guān)表,產(chǎn)量和單位成本相關(guān)表,三、 簡(jiǎn)單相關(guān)系數(shù),1概念  用以反映兩變量間線性相關(guān)密切程度的統(tǒng)計(jì)指標(biāo)。   總體相關(guān)系數(shù)記為?,樣

3、本相關(guān)系數(shù)記為 r?!。灿?jì)算公式  未分組資料,(8-5),樣本相關(guān)系數(shù)的定義公式實(shí)質(zhì),(8-8),(8-6),相關(guān)系數(shù)r的取值范圍:-1≤r≤1,3相關(guān)系數(shù)的取值及其意義,r,,0.3,,0.3,0.8,,微弱相關(guān),,低度相關(guān),,顯著相關(guān),,高度相關(guān),,【例1】在研究我國(guó)人均消費(fèi)水平的問(wèn)題中,把全國(guó)人均消費(fèi)額記為y,把人均國(guó)民收入記為x。我們收集到1981~1993年的樣本數(shù)據(jù)(xi ,yi),i =1,2,…,13,數(shù)據(jù)見(jiàn)下表,

4、計(jì)算相關(guān)系數(shù)。,P62,P33,P19,解:根據(jù)樣本相關(guān)系數(shù)的計(jì)算公式有 人均國(guó)民收入與人均消費(fèi)金額之間的相關(guān)系數(shù)為 0.9987。,例2,P32,P44,P46,解:,計(jì)算結(jié)果說(shuō)明VC含量與儲(chǔ)存時(shí)間存在高度的負(fù)相關(guān)關(guān)系。 上例用推導(dǎo)后的公式 可以得出同樣的結(jié)論,相關(guān)系數(shù)計(jì)算表,計(jì)算結(jié)果與前面一致。,某公司下屬6個(gè)同類(lèi)企業(yè)的有關(guān)資料如下,練習(xí),要求:a.計(jì)算相關(guān)系數(shù),解: (1)

5、 (兩者為高度正相關(guān)),4 相關(guān)系數(shù)的顯著性檢驗(yàn) 檢驗(yàn)兩個(gè)變量之間是否存在線性相關(guān)關(guān)系,等價(jià)于對(duì)回歸系數(shù)b的檢驗(yàn)。 步驟:提出假設(shè):H0:? ? ? ;H1: ? ? 0計(jì)算檢驗(yàn)統(tǒng)計(jì)量:確定顯著性水平?,并作出決策 若?t?>t?/2,拒絕

6、H0,相關(guān)關(guān)系顯著; 若?t?<t?/2,接受H0,相關(guān)關(guān)系不顯著。,,【例3】對(duì)前例計(jì)算的相關(guān)系數(shù)進(jìn)行顯著性檢(??0.05)解:(1)提出假設(shè):H0:? ? ? ;H1: ? ? 0 (2)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量,由于?t?=64.9809>t?/2(13-2)=2.201,拒絕H0,人均消費(fèi)金額與人均國(guó)民收入之間的相關(guān)關(guān)系顯著,不能否認(rèn)總體兩變量存在線性相關(guān)。,第二節(jié) 一元線性回歸模型,一 回歸分

7、析的概念1 概念 運(yùn)用數(shù)學(xué)方法測(cè)定相關(guān)變量間的一般關(guān)系的分析過(guò)程。,回歸分析方法就是通過(guò)對(duì)占有相關(guān)資料的分析,找出其變化規(guī)律性,建立適宜的數(shù)學(xué)模型或經(jīng)驗(yàn)公式,使現(xiàn)象間數(shù)量上的不確定、不嚴(yán)格的相互依存關(guān)系變?yōu)榇_定性的、嚴(yán)格依存的函數(shù)關(guān)系,即將這種數(shù)量關(guān)系一般化、平均化。,2 回歸分析與相關(guān)分析的聯(lián)系與區(qū)別,二 一元線性回歸模型,1 總體一元線性回歸模型的一般形式,,,x對(duì)y的線性影響而形成的系統(tǒng)部分,反映兩變量的平均變動(dòng)

8、關(guān)系,即本質(zhì)特征。,隨機(jī)誤差:各種偶然因素,觀察誤差和其他被忽視因素的影響。,,未知參數(shù),,3 總體一元線性回歸方程,樣本(或估計(jì)的)一元線性回歸方程,截距,斜率(回歸系數(shù)),,,,b表明自變量x每變動(dòng)一個(gè)單位時(shí),變量y的平均變動(dòng)值。,b與r的關(guān)系:,r>0 r<0 r=0b>0 b<0 b=0,(8-24),4 ·一元線性回歸模型的確定(用未分組資料)y倚x的回歸方程,根據(jù)實(shí)際數(shù)據(jù),用最

9、小平方法,即使 分別對(duì)a、b求偏導(dǎo)并令其為零,求得兩個(gè)標(biāo)準(zhǔn)方程。,,,令,,則,,,解聯(lián)立方程,得到,解聯(lián)立方程,得到,,8-14,8-15,5 回歸直線的特點(diǎn)(1)回歸直線的走向,是由回歸系數(shù)b決定的。(2)回歸直線滿足 , ,,即,,是一條最適線。,(4) 回歸直線是一條平均數(shù)線。,(3) 回歸直線一定通過(guò)點(diǎn)( ),【例4】根據(jù)例1中的數(shù)

10、據(jù),配合人均消費(fèi)金額對(duì)人均國(guó)民收入的回歸方程,解:根據(jù)a和b的求解公式得,P13,例5 接例2求回歸方程,解:將以上數(shù)據(jù)代入公式,所以水果中Vc 含量與儲(chǔ)存時(shí)間關(guān)系的回歸方程為:,方程表明,水果中維生素C的含量的理論起點(diǎn)值為19.70%,當(dāng)儲(chǔ)存時(shí)間每延長(zhǎng)1小時(shí),維生素C的含量平均降低1.51%。,例6:某公司下屬6個(gè)同類(lèi)企業(yè)的有關(guān)資料如下,要求: a.計(jì)算相關(guān)系數(shù); b.用最小平方法建立直線回歸方程并估計(jì)當(dāng)工業(yè)生產(chǎn)

11、用固定資產(chǎn)為800萬(wàn)元時(shí),工業(yè)總產(chǎn)值將為多少?,解: (1) (兩者為高度正相關(guān)),,(2),經(jīng)濟(jì)含義: 表明工業(yè)生產(chǎn)用固定資產(chǎn)每增加一百萬(wàn)元,工業(yè)總產(chǎn)值平均上升2.2317百萬(wàn)元,當(dāng),(百萬(wàn)元),yc=0.0733+2.2317x,練習(xí)1,(1)配合直線方程

12、①計(jì)算 b, a,回歸方程為: yc =a+bx = 77.37-1.82x,答案:,(2)產(chǎn)量每增加1000件時(shí),單位成本平均變動(dòng),因?yàn)閎=-1.82<0,且產(chǎn)量x的計(jì)量單位是千件,根據(jù)回歸系數(shù)b的意義有: 產(chǎn)量每增加一個(gè)單位即1000件時(shí),單位成本平均減少1.82元。,(3)產(chǎn)量為6000件時(shí)的單位成本當(dāng)產(chǎn)量為6000件時(shí),即x=6,代入回歸方程: yc=77.37-1.82×

13、6 =66.45(元)當(dāng)產(chǎn)量為6000件時(shí),單位成本為66.45元。,三、判定系數(shù)(r2)和估計(jì)標(biāo)準(zhǔn)誤(Sxy) (一)判定系數(shù) 1 離差平方和的分解,,,,,x,y,,,,,,總偏差= 回歸偏差+ 剩余偏差,總偏差 反映因變量的n個(gè)觀察值與其均值的總離差?;貧w偏差(被回歸解釋的偏差) 反映由于x與y之間的線性關(guān)系引起的y的取值變化剩余偏差(未被解釋的偏差) 反映除x以外的

14、其他因素對(duì)y取值的影響。,?,2 判定系數(shù) (1) 概念 回歸平方和占總離差平方和的比例,用r2表示 取值范圍: 是對(duì)回歸模型擬合優(yōu)度的評(píng)價(jià)。 等于相關(guān)系數(shù)的平方,即r2=(r)2 注意:判定系數(shù)無(wú)方向性,相關(guān)系數(shù)則有方向,其方向與樣本回歸系數(shù) b 相同。,(2) 常用公式,計(jì)算得r2=0.994 說(shuō)明我們擬合回歸模型產(chǎn)生的偏差中,99.4%的偏差是由儲(chǔ)存時(shí)間和Vc

15、的依存關(guān)系來(lái)解釋的,其余0.6%是隨機(jī)誤差。,例7:根據(jù)例2計(jì)算判定系數(shù)。,(二)估計(jì)標(biāo)準(zhǔn)誤(Sy),1 概念 Sy是二元正態(tài)分布中因變量實(shí)際值(yj)對(duì)估計(jì)值( )離散程度的量度。 反映實(shí)際觀察值在回歸直線周?chē)姆稚顩r; 從另一個(gè)角度說(shuō)明了回歸直線的擬合程度。 Sy 越小, 擬合越好; Sy 越大, 擬合越差。,2 公式,(8-26),在95%的概率保證程度下,可以估計(jì)儲(chǔ)存時(shí)

16、間為8小時(shí)時(shí),水果中Vc含量的區(qū)間為:,在(7.2672,7.9728)之間,在一定的把握程度下進(jìn)行區(qū)間估計(jì)。,預(yù)測(cè)及應(yīng)用1 點(diǎn)估計(jì),(1)y 的平均值的點(diǎn)估計(jì) 利用估計(jì)的回歸方程,對(duì)于自變量 x 的一個(gè)給定值 x0 ,求出因變量 y 的平均值的一個(gè)估計(jì)值E(y0) ,就是平均值的點(diǎn)估計(jì)。 在例1中,假如我們要估計(jì)人均國(guó)民收入為2000元時(shí),所有年份人均消費(fèi)金額的平均值,就是平均值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得

17、,(2)y 的個(gè)別值的點(diǎn)估計(jì),利用估計(jì)的回歸方程,對(duì)于自變量 x 的一個(gè)給定值 x0 ,求出因變量y的一個(gè)個(gè)別值的估計(jì)值E(y0) ,就是個(gè)別值的點(diǎn)估計(jì)。,如果只是想知道1990年人均國(guó)民收入為1250.7元時(shí)的人均消費(fèi)金額是多少,則屬于個(gè)別值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得,(1) 大樣本條件下(n?30),2 區(qū)間估計(jì),(2) 小樣本條件下(n?30) 1)y的平均值的置信區(qū)間,,【例】根據(jù)例1,求出人均國(guó)民收入為125

18、0.7元時(shí),人均消費(fèi)金額95%的置信區(qū)間。 解:根據(jù)前面的計(jì)算結(jié)果 =712.57,Sy=14.95,t???(13-2)=2.20,n=13,置信區(qū)間為,=712.57?10.265,人均消費(fèi)金額95%的置信區(qū)間為702.305元~722.835元之間。,包括:回歸系數(shù)b的檢驗(yàn)方程整體的F檢驗(yàn),四 一元線性回歸模型的顯著性檢驗(yàn),第四節(jié) 非線性回歸模型,,曲線模型的確定方法:,通常用變量

19、代換法將曲線轉(zhuǎn)換為直線。按線性模型求解參數(shù),而后再變換為曲線模型。,非線性回歸分析必須著重解決以下兩個(gè)問(wèn)題: 一是如何確定非線性函數(shù)的具體形式; 二是如何估計(jì)非線性函數(shù)中的參數(shù),雙曲線,基本形式:線性化方法令:,x'= 1/x, 則有y = a + b x'圖像,【例】一種商品的需求量與其價(jià)格有一定的關(guān)系?,F(xiàn)對(duì)一定時(shí)期內(nèi)的商品價(jià)格x與需求量y進(jìn)行觀察,取得的樣本數(shù)據(jù)如下表。試判

20、斷商品價(jià)格與需求量之間回歸函數(shù)的類(lèi)型,并求需求量對(duì)價(jià)格的回歸方程。,用雙曲線模型:按線性回歸的方法求解a和b ,得,【例】為研究生產(chǎn)率與廢品率之間的關(guān)系,記錄數(shù)據(jù)如下表。試擬合適當(dāng)?shù)哪P汀?用線性模型:y =?0??1x+? ,有 y = 2.671+0.0018x用指數(shù)模型:y = ?? x ,有 y =4.05?(1.0002)x比較 直線的殘差

21、平方和=5.3371<指數(shù)模型的殘差平方和=6.11。直線模型略好于指數(shù)模型。,一 多元線性回歸模型及其確定,二元線性回歸模型:,1 總體多元線性回歸模型的一般形式,,,Y的數(shù)學(xué)期望E(Y),隨機(jī)誤差,表明自變量 共同變動(dòng)引起的Y 的平均變動(dòng)。也稱(chēng)總體的二元線性回歸方程。,第五節(jié) 多元線性回歸模型,,常數(shù)項(xiàng),,和Y構(gòu)成的平面與Y軸的截距,,偏回歸系數(shù),表示在 固定時(shí) 每變化一個(gè)單位引起的Y的平均變

22、動(dòng);,,偏回歸系數(shù),表示在 固定時(shí) 每變化一個(gè)單位引起的Y的平均變動(dòng);,,隨機(jī)誤差,其理論假定與一元線性回歸模型中的 一樣。,在多元回歸模型中,還要求各自變量之間不存在顯著相關(guān),或高度相關(guān)。,2 樣本多元線性回歸模型的一般形式,二元線性回歸模型為:,其數(shù)學(xué)期望,也稱(chēng)樣本(或估計(jì)的)二元線性回歸方程。,3 二元線性回歸方程的確定,根據(jù)實(shí)際資料,用最小平方法,即使 ,分別對(duì)a、b1、b2求編導(dǎo)并令其為零,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論