版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、1,第六章 相關(guān)分析與回歸分析,本章內(nèi)容 第一節(jié) 相關(guān)分析 第二節(jié) 一元線性回歸分析,2,第一節(jié) 相關(guān)分析,本節(jié)內(nèi)容一、相關(guān)關(guān)系的概念二、相關(guān)關(guān)系的種類三、相關(guān)關(guān)系的測定四、相關(guān)分析中應(yīng)注意的問題,3,1.函數(shù)關(guān)系,當(dāng)一個或幾個變量取一定的值時,另一個變量有確定值與之相對應(yīng),我們稱這種關(guān)系為確定性的函數(shù)關(guān)系。,例:某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為: y = p
2、 x (p 為單價)圓的面積(S)與半徑之間的關(guān)系可表示為:S = ? r2 企業(yè)的原材料消耗額(y)與產(chǎn)量(x1) 、單位產(chǎn)量消耗(x2) 、原材料價格(x3)之間的關(guān)系可表示為: y = x1 x2 x3,一、相關(guān)關(guān)系的概念,4,(1)變量之間是一一對應(yīng)的確定關(guān)系;(2)設(shè)有兩個變量x 和 y ,變量 y 隨變量 x 一起變化,并完全依賴于 x ,當(dāng)變量 x 取某個數(shù)值時,y 依確定的關(guān)系取相應(yīng)的值,則稱y 是 x
3、 的函數(shù),記為y = f (x),其中x 稱為自變量,y 稱為因變量;(3)各觀測點落在一條線上 .,函數(shù)關(guān)系的特點:,5,2.相關(guān)關(guān)系,指變量之間保持著不確定的數(shù)量依存關(guān)系。即變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá),一個變量的取值不能由另一個變量唯一確定,當(dāng)變量x取某個值時,變量y的取值可能有幾個。,例:商品的消費量(y)與居民收入(x)之間的關(guān)系; 商品的消費量(y)與物價(x)之間的關(guān)系; 商品銷售額(y)與廣告費支出(x)之間的
4、關(guān)系; 糧食畝產(chǎn)量(y)與施肥量(x1) 、降雨量(x2) 、溫度(x3)之間的關(guān)系; 收入水平(y)與受教育程度(x)之間的關(guān)系。,6,相關(guān)關(guān)系的特點:,(1)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá);(2)一個變量的取值不能由另一個變量唯一確定;(3)當(dāng)變量 x 取某個值時,變量 y 的取值可能有幾個;(4)各觀測點分布在直線周圍。,7,具有相關(guān)關(guān)系的某些現(xiàn)象可表現(xiàn)為因果關(guān)系。自變量:是引起某種結(jié)果變化的原因,它是可以控制、給定
5、的值,常用x表示;因變量:是自變量變化的引起結(jié)果量,它是不確定的值,常用y表示。,它們的表現(xiàn)形式有多種:一種原因引起一種結(jié)果;多種原因引起一種結(jié)果;還有變量之間是互為因果的關(guān)系。相關(guān)分析時,一般不區(qū)分原因和結(jié)果。,8,二、相關(guān)關(guān)系的種類,1. 按相關(guān)的程度可分為完全相關(guān)、不完全相關(guān)和不相關(guān)完全相關(guān):當(dāng)一個變量的變化完全由另一個變量所決定時,稱變量間的這種關(guān)系為為完全相關(guān)關(guān)系,這種嚴(yán)格的依存關(guān)系實際上就是函數(shù)關(guān)系。不相關(guān):當(dāng)兩個變量
6、的變化相互獨立、互不影響時,稱這兩個變量不相關(guān)(或零相關(guān))。不完全相關(guān):當(dāng)變量之間存在不嚴(yán)格的依存關(guān)系時,稱為不完全相關(guān)。不完全相關(guān)關(guān)系是現(xiàn)實當(dāng)中相關(guān)關(guān)系的主要表現(xiàn)形式,是相關(guān)分析的主要研究對象。,9,,2. 按相關(guān)的方向可分為正相關(guān)和負(fù)相關(guān)正相關(guān):當(dāng)一個變量隨著另一個變量的增加(減少)而增加(減少),即兩者同向變化時,稱為正相關(guān)。 如家庭收入與家庭支出之間的關(guān)系。負(fù)相關(guān):當(dāng)一個變量隨著另一個變量的增加(減少)而減少(增加)
7、,即兩者反向變化時,稱為負(fù)相關(guān)。 如產(chǎn)品產(chǎn)量與單位成本之間的關(guān)系,單位成本會隨著產(chǎn)量的增加而減少。,10,,3、 按相關(guān)的形式可分為線性相關(guān)和非線性相關(guān)線性相關(guān):當(dāng)變量之間的依存關(guān)系大致呈現(xiàn)為線性形式,即當(dāng)一個變量變動一個單位時,另一個變量也按一個大致固定的增(減)量變動,就稱為線性相關(guān)。非線性相關(guān):當(dāng)變量間的關(guān)系不按固定比例變化時,就稱之為非線性相關(guān)。,11,4. 按研究變量的多少可分為單相關(guān)、偏相關(guān)和復(fù)相關(guān)單
8、相關(guān):兩個變量之間的相關(guān),稱為單相關(guān)。復(fù)相關(guān):一個變量與兩個或兩個以上其他變量之間的相關(guān),稱為復(fù)相關(guān)。偏相關(guān):在復(fù)相關(guān)的研究中,假定其他變量不變,專門研究其中兩個變量之間的相關(guān)關(guān)系時稱其為偏相關(guān)。,12,三、相關(guān)關(guān)系的測定,注意:并非所有的變量之間都存在相關(guān)關(guān)系,因此需要用相關(guān)分析方法來識別和判斷。相關(guān)分析就是借助于圖表和分析指標(biāo)對變量之間的依存關(guān)系的密切程度進(jìn)行測定的過程。,定性分析,是依據(jù)研究者的理論知識和實踐經(jīng)驗,對客觀現(xiàn)象
9、之間是否存在相關(guān)關(guān)系,以及何種關(guān)系作出判斷。,定量分析,在定性分析的基礎(chǔ)上,通過編制相關(guān)表、繪制相關(guān)圖、計算相關(guān)系數(shù)等方法,來判斷現(xiàn)象之間相關(guān)的方向、形態(tài)及密切程度。,13,(一)相關(guān)表:將自變量x的數(shù)值按照從小到大的順序,并配合因變量y的數(shù)值一一對應(yīng)而平行排列的表。(二)相關(guān)圖(散點圖) 識別變量間相關(guān)關(guān)系最簡單的方法是散點圖法。 所謂散點圖法,就是將所研究變量的觀察值以散點的形式繪制在相應(yīng)的坐標(biāo)系中,通過它們呈現(xiàn)出的特征,來判
10、斷變量之間是否存在相關(guān)關(guān)系,以及相關(guān)的形式、相關(guān)的方向和相關(guān)的程度等。,14,【例】在研究我國人均消費水平的問題時,把全國人均消費記為y,把人均國內(nèi)生產(chǎn)總值(人均GDP)記為x。 我國人均國內(nèi)生產(chǎn)總值與人均消費金額數(shù)據(jù) 單位:元,從上表可以看出X和Y這兩個變量之間存在什么樣的相關(guān)關(guān)系?將上表資料繪制散點圖如下:,15,所繪制的散點圖呈現(xiàn)出從左至右的上升趨勢,它表明x與y之間存在著一定的正相關(guān)關(guān)系,即
11、隨著人均GDP的上升,人均消費金額也會增加。有時也可通過表格來直接觀察變量之間是否存大相關(guān)關(guān)系。,將上表資料繪制散點圖如下:,16,x與y關(guān)系散點圖的主要類型,17,,(d)負(fù)相關(guān)\曲線關(guān)系,(e)負(fù)相關(guān)直線相關(guān)(相關(guān)程度較小),(f )不相關(guān),18,(二)相關(guān)系數(shù)相關(guān)圖表可反映兩個變量之間的相互關(guān)系及其相關(guān)方向,但無法確切地表明兩個變量之間相關(guān)的程度。統(tǒng)計學(xué)家卡爾·皮爾遜設(shè)計了統(tǒng)計指標(biāo) ––– 相關(guān)系數(shù)。簡單相關(guān)系數(shù):
12、在線性條件下說明兩個變量之間相關(guān)關(guān)系密切程度的統(tǒng)計分析指標(biāo),簡稱相關(guān)系數(shù)。根據(jù)總體全部數(shù)據(jù)計算的,稱為總體相關(guān)系數(shù),記為?; 根據(jù)樣本數(shù)據(jù)計算的,則稱為樣本相關(guān)系數(shù),記為 r。將反映兩變量間曲線相關(guān)關(guān)系的統(tǒng)計指標(biāo)稱為非線性相關(guān)系數(shù)、非線性判定系數(shù);將反映多元線性相關(guān)關(guān)系的統(tǒng)計指標(biāo)稱為復(fù)相關(guān)系數(shù)、復(fù)判定系數(shù)等。,19,1、由未分組資料計算相關(guān)系數(shù)公式:,上述公式還可以變換為其它形式,如:,20,21,22,,【例】根據(jù)上述資料,計算人
13、均消費與人均國內(nèi)生產(chǎn)總值的直線相關(guān)系數(shù)。,23,將上表計算結(jié)果代入公式為:,相關(guān)系數(shù)較大,這說明人均消費額與人均國內(nèi)生產(chǎn)總值高度相關(guān)。,2、由分組資料計算相關(guān)系數(shù)的公式為:,24,r,,3、相關(guān)系數(shù)取值及其意義相關(guān)系數(shù)的值介于–1與+1之間,即–1≤r≤+1。,25,(1)當(dāng)r>0時,表示兩變量正相關(guān),r<0時,兩變量為負(fù)相關(guān)。(2)當(dāng)|r|=1時,表示兩變量為完全線性相關(guān),即為函數(shù)關(guān)系。(3)當(dāng)r=0時,表示兩變量間
14、無線性相關(guān)關(guān)系,它并不意味著X與Y之間不存在其他類型的關(guān)系。 。(4)當(dāng)0<|r|<1時,表示兩變量存在一定程度的線性相關(guān)。且|r|越接近1,兩變量間線性關(guān)系越密切;|r|越接近于0,表示兩變量的線性相關(guān)越弱。(5)通常判斷的標(biāo)準(zhǔn)是: |r|<0.3稱為微弱相關(guān); 0.3≤ |r|<0.5稱為低度相關(guān); 0.5≤ |r|<0.8稱為顯著相關(guān) ; 0.8≤ |r|<
15、1稱為高度相關(guān)或強(qiáng)相關(guān)。,26,4、相關(guān)系數(shù)取正值或是負(fù)值,與分子 有直接的關(guān)系.它可能出現(xiàn)以下情況:1)所有相關(guān)點都為正相關(guān),則 >0 ,說明兩變量之間正線性相關(guān);2)所有相關(guān)點都為負(fù)相關(guān),則 <0 ,說明兩變量之間負(fù)線性相關(guān);3)在全部相關(guān)點中,既有正相關(guān)、又有負(fù)相關(guān)和零相關(guān),這時計算協(xié)方差時就會出現(xiàn)正負(fù)抵消。抵消的結(jié)果為正數(shù),為正相關(guān);為負(fù)數(shù)就是負(fù)相關(guān).,,27,四、相關(guān)分析中
16、應(yīng)注意的問題,(一)相關(guān)系數(shù)是說明線性聯(lián)系程度的,相關(guān)系數(shù)很小的變量間可能存在非線性聯(lián)系。(二)相關(guān)系數(shù)不能解釋兩變量間的因果關(guān)系,警惕虛假相關(guān)導(dǎo)致的錯誤結(jié)論。有人曾對教師工資提高和酒價上漲的數(shù)據(jù)計算相關(guān)系數(shù),得到的數(shù)值比較大,這是否表明教師工資提高導(dǎo)致酒的消費量增加,從而導(dǎo)致酒價上漲呢?經(jīng)定性分析,事實是由于經(jīng)濟(jì)繁榮導(dǎo)致政府普遍增加工資,其中教師工資也隨之增加,同時人們收入提高增加了酒的消費導(dǎo)致酒價的上漲,而教師工資增長和酒價之間
17、并沒有什么直接關(guān)系。(三)不要在相關(guān)關(guān)系據(jù)以成立的數(shù)據(jù)范圍以外,推論這種相關(guān)關(guān)系仍然保持。,28,第二節(jié) 一元線性回歸分析,本節(jié)內(nèi)容:一、回歸分析的概念及種類二、一元線性回歸模型三、回歸估計標(biāo)標(biāo)準(zhǔn)誤差四、可線性化的常用曲線類型,29,一、回歸分析的概念,1、什么是回歸分析“回歸”一詞是由英國生物學(xué)家F.Galton在研究人體身高的遺傳問題時首先提出的。,回歸分析通過一個變量或一些變量的變化解釋另一變量的變化,即從一組樣本
18、數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式。,30,2、相關(guān)分析與回歸分析的關(guān)系,相關(guān)分析是回歸分析的基礎(chǔ)和前提,回歸分析則是相關(guān)分析的深入和繼續(xù)。相關(guān)分析需要依靠回歸分析來表現(xiàn)變量之間數(shù)量相關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來表現(xiàn)變量之間數(shù)量變化的相關(guān)程度。只有當(dāng)變量之間存在高度相關(guān)時,進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義。,31,二者的區(qū)別: (1) 相關(guān)分析中變量之間的關(guān)系是對等的;回歸分析中,變量之間的關(guān)系是不對
19、等的,將變量劃分自變量和因變量。 (2) 相關(guān)分析中變量都必須是隨機(jī)變量;回歸分析中,自變量是給定的,因變量是隨機(jī)的。 (3)相關(guān)分析主要是通過一個指標(biāo)即相關(guān)系數(shù)來反映變量之間相關(guān)程度的大小,相關(guān)系數(shù)是惟一的。而在回歸分析中,對于互為因果的兩個變量 ,則有可能存在兩個或多個回歸方程。,32,3、回歸分析的種類,33,4、回歸分析步驟:首先對變量之間的關(guān)系進(jìn)行相關(guān)分析,并將變量分為自變量和因變量;其次,找出合適的回歸模
20、型(即數(shù)學(xué)方程式),描述變量間的關(guān)系;再次,對回歸模型進(jìn)行統(tǒng)計檢驗;最后,統(tǒng)計檢驗通過后,利用回歸模型,根據(jù)自變量去估計、預(yù)測因變量。本節(jié)僅討論一元線性回歸分析。,34,,二、一元線性回歸模型,如果變量x和y相關(guān),并且從相關(guān)圖表中可以看出它們之間大致形成一種直線關(guān)系,我們就可在相關(guān)圖上求出一條與各點最相配合的直線。,式中x為自變量,通常由研究者事先選定數(shù)值。 a為樣本回歸直線在y軸上的截距; b為樣本回歸直線的斜率(又稱回歸系數(shù)
21、),它表示當(dāng)x增加一個單位時y的平均增加數(shù)量;?為誤差項。,35,當(dāng)只涉及一個自變量時稱為一元回歸,若因變量 y與自變量x之間為線性關(guān)系時稱為一元線性回歸。對于具有線性關(guān)系的兩個變量,可以用一條直線方程來表示它們之間的關(guān)系。描述因變量y如何依賴于自變量x和誤差項?的方程稱為回歸模型。,一元線性回歸概念要點,36,在回歸分析中,欲使所求回歸直線 y=a+bx最適合于實際資料,必須使每個xi對應(yīng)的指標(biāo)實測值yi與回歸直線確定的估計值yi
22、的離差平方之和為最小。這樣便把尋找適當(dāng)直線問題轉(zhuǎn)化為使 Q(a, b)達(dá)到最小條件下求出a、b的問題。,如何確定回歸直線方程呢?(怎樣確定參數(shù)a、b),最小值,37,滿足上述條件的a、b即為所求的未知參數(shù)。,由,化簡得,?(y?a?bx)=0,?(y?a?bx)x=0,,即:,?y=na+b?x,?xy=a?x+b?x2,,因為Q(a, b)是a、b的非負(fù)二元函數(shù),所以其最小值無疑是存在的。根據(jù)數(shù)學(xué)中的極值原理,令:,38,上述方程組
23、稱為標(biāo)準(zhǔn)方程組。解之,得:,39,將上述結(jié)果代入即可確定回歸方程式為:,這個方程稱為在給定樣本條件下的一元線性回歸方程,對應(yīng)的直線稱為樣本回歸直線?;貧w方程對于不同的樣本是有差別的,因而,它具有經(jīng)驗的特征,所以在實用上,也將它叫做經(jīng)驗公式。,40,要求:(1)建立教育經(jīng)費x與高校學(xué)生人數(shù)回歸直線方程;(2)估計教育經(jīng)費為500萬元時的在校學(xué)生數(shù)。,例:某地高校教育經(jīng)費x與高校學(xué)生人數(shù)y連續(xù)6年的統(tǒng)計資料如下表。,41,回 歸 分 析
24、計 算 表,x2,y2,42,(1)建立回歸直線方程,所以回歸方程為:Y=-17.91+0.0955x(2)當(dāng)教育經(jīng)費為500萬元時,在校學(xué)生數(shù)可以為: Y=-17.91+0.0955×500=29.84(萬人),43,為了簡化上述回歸系數(shù)b的表達(dá)形式,引入如下離差乘積的和式:,于是,回歸系數(shù)可簡化為,為了相關(guān)性檢驗的需要,順便引入關(guān)于 y 的離差平方和:,44,三、回歸估計標(biāo)準(zhǔn)誤差,回歸方程的一個重要作用在于
25、根據(jù)自變量的已知值估計因變量的理論值(估計值)。而理論值yc與實際值y存在著差距,這就產(chǎn)生了推算結(jié)果的準(zhǔn)確性問題。如果差距小,說明推算結(jié)果的準(zhǔn)確性高;反之,則低。為了度量y的實際水平和估計值離差的一般水平,可計算估計標(biāo)準(zhǔn)誤差。估計標(biāo)準(zhǔn)誤差是衡量回歸直線代表性大小的統(tǒng)計分析指標(biāo),它說明觀察值圍繞著回歸直線的變化程度或分散程度。,45,為了度量回歸方程的可靠性,通常計算估計標(biāo)準(zhǔn)誤差。它度量觀察值回繞著回歸直線的變化程度或分散程度。通常用
26、Sy代表估計平均誤差,其計算公式為:,注意,公式中根號內(nèi)的分母是n?2, 而不是n。這是由于Q=?(y?y)2有兩個線性關(guān)系的約束,一是 , 一是 , 因而, Q=?(y?y)2的自由度為n?2。,(一)估計標(biāo)準(zhǔn)誤差的計算,46,上述公式可以簡化為下列公式,計算步驟,所得計算結(jié)果也相一致。,估計標(biāo)準(zhǔn)誤差愈大,則數(shù)據(jù)點圍繞回歸直線的分散程度就愈大,回歸方程的代表性愈小。估計標(biāo)準(zhǔn)誤差愈小,則數(shù)據(jù)點
27、圍繞回歸直線的分散程度愈小,回歸方程的代表愈大,其可靠性愈高。,47,根據(jù)上例資料,計算估計標(biāo)準(zhǔn)誤差為:,48,(二)回歸估計標(biāo)準(zhǔn)差與一般標(biāo)準(zhǔn)差回歸估計標(biāo)準(zhǔn)差與第五章介紹的標(biāo)準(zhǔn)差的計算原理是一致的,兩者都是反映平均差異程度和表明代表性的指標(biāo)。一般標(biāo)準(zhǔn)差反映的是各變量值與其平均數(shù)的平均差異程度,表明其平均數(shù)對各變量值的代表性強(qiáng)弱;回歸標(biāo)準(zhǔn)誤差反映的是因變量各實際值與其估計值之間的平均差異程度,表明其估計值對各實際值的代表性強(qiáng)弱,其值
28、越小,估計值yc(或回歸方程)的代表性越強(qiáng),用回歸方程估計或預(yù)測的結(jié)果越準(zhǔn)確。,49,估計標(biāo)準(zhǔn)誤差小,相關(guān)系數(shù)的絕對值就越大,表明現(xiàn)象之間相關(guān)關(guān)系越密切,如果估計標(biāo)準(zhǔn)誤差的值等于0,相關(guān)系數(shù)的絕對值等于1,表明完全相關(guān)。這兩個指標(biāo)在數(shù)量上有如下的關(guān)系:,50,四、可線性化的常用曲線類型(略),(一)指數(shù)函數(shù) (二)冪函數(shù) (三)雙曲線函數(shù) (四)對數(shù)函數(shù) (五)S形曲線,51,本章小結(jié):1、相關(guān)關(guān)系的概念、種類與測定2、回歸
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 統(tǒng)計學(xué)a第9章--相關(guān)與回歸分析
- 8-應(yīng)用統(tǒng)計學(xué)(教案)相關(guān)與回歸分析
- 應(yīng)用統(tǒng)計學(xué)--第8章-相關(guān)分析與回歸分析
- 醫(yī)學(xué)統(tǒng)計學(xué)一元相關(guān)與回歸
- 大學(xué)統(tǒng)計學(xué)-ch8相關(guān)與回歸分析
- 管理統(tǒng)計學(xué)-現(xiàn)代回歸分析方法
- 醫(yī)學(xué)統(tǒng)計學(xué)相關(guān)分析
- 醫(yī)學(xué)統(tǒng)計學(xué)logistic回歸
- 統(tǒng)計學(xué)--第九章直線回歸與相關(guān)
- 《統(tǒng)計學(xué)》線性回歸模型
- 醫(yī)學(xué)統(tǒng)計學(xué)-logistic回歸
- 統(tǒng)計學(xué)數(shù)據(jù)分析 統(tǒng)計學(xué)
- 醫(yī)學(xué)統(tǒng)計學(xué)16-logistic回歸
- [學(xué)習(xí)]統(tǒng)計學(xué)教學(xué)資料派斯相關(guān)與回歸幻燈片-7章
- 統(tǒng)計學(xué)一元線性回歸課后習(xí)題答案
- 解剖統(tǒng)計學(xué)滲透統(tǒng)計學(xué)玩轉(zhuǎn)統(tǒng)計學(xué)培訓(xùn)班
- 心理統(tǒng)計學(xué)重點分析
- 統(tǒng)計學(xué)專業(yè)畢業(yè)論文多元線性回歸模型
- 統(tǒng)計學(xué)
- 衛(wèi)生統(tǒng)計學(xué) 醫(yī)學(xué)統(tǒng)計學(xué) 習(xí)題
評論
0/150
提交評論