版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第八章 相關(guān)分析和線性回歸分析,,,SPSS的相關(guān)分析與回歸分析,8.1 相關(guān)分析和回歸分析概述8.2 相關(guān)分析8.3 偏相關(guān)分析8.4 線性回歸分析 (重點)8.5 曲線估計,8.1 相關(guān)分析和回歸分析概述,客觀事物之間的關(guān)系大致可歸納為兩大類:函數(shù)關(guān)系(確定性關(guān)系) :指兩事物之間的一種一一對應(yīng)的關(guān)系,如商品的銷售額和銷售量之間的關(guān)系。統(tǒng)計關(guān)系(非確定性關(guān)系):指兩事物之間的一種非一一對應(yīng)的關(guān)系,例如家庭收入和支出、子
2、女身高和父母身高之間的關(guān)系等。統(tǒng)計關(guān)系又分為相關(guān)關(guān)系和回歸關(guān)系兩種。相關(guān)分析和回歸分析都是分析客觀事物之間統(tǒng)計關(guān)系的數(shù)量分析方法。,相關(guān)分析與回歸分析的區(qū)別,8.2 相關(guān)分析,8.2.1 散點圖8.2.2 相關(guān)系數(shù)8.2.3 基本操作8.2.4 應(yīng)用舉例,相關(guān)分析通過圖形和數(shù)值兩種方式,有效地揭示事物之間相關(guān)關(guān)系的強(qiáng)弱程度和形式。8.2.1 散點圖 它將數(shù)據(jù)以點的的形式畫在直角坐標(biāo)系上,通過觀察散點圖能夠直觀的
3、發(fā)現(xiàn)變量間的相關(guān)關(guān)系及他們的強(qiáng)弱程度和方向。,散點圖的繪制,單擊圖形?舊對話框?散點/點狀,打開窗口,簡單分布(Simple Scatter),只能在圖上顯示一對相關(guān)變量矩陣分布(Matrix Scatter),在矩陣中顯示多個相關(guān)變量重疊分布(Overlay Scatter),在圖上顯示多對相關(guān)變量3-D分布(3-D Scatter),顯示三個相關(guān)變量簡單點,堆積散點圖,1、簡單散點圖 選中簡單分布,單擊定義Define按
4、鈕,打開窗口,相關(guān)回歸分析(高??蒲醒芯浚?sav,Y軸Y Axis:選擇Y軸要繪制的變量X軸X Axis:選擇X軸要繪制的變量設(shè)置標(biāo)記Set Markers by:選擇分組變量,SPSS根據(jù)該變量的值將觀測量分成幾組,每組采用不同的符號標(biāo)注標(biāo)注個案Label Cases by:觀測量標(biāo)簽變量,2、矩陣散點圖在矩陣散點圖中,將圖形分成多個方格,在每個方格中單獨(dú)繪制某兩個變量的數(shù)據(jù)。在散點圖窗口中選擇矩陣散點圖,單擊定義Defi
5、ne,在出現(xiàn)的窗口中,依次選擇投入高級職稱人數(shù)、課題總數(shù)、論文數(shù)和獲獎數(shù)進(jìn)入矩陣變量Matrix框中,選擇是否為直轄市進(jìn)入設(shè)置標(biāo)記Set Markers框中。,相關(guān)回歸分析(高??蒲醒芯浚?sav,3、重疊散點圖 在重疊散點圖中,在一個坐標(biāo)系中繪制多個不同的變量對。 在散點圖窗口中選擇重疊散點圖,單擊定義Define,在出現(xiàn)的窗口中,選擇變量投入人年數(shù)--論文數(shù)對和投入高級職稱的人年數(shù)--專著數(shù)對進(jìn)入Y-X
6、Pairs框中。,相關(guān)回歸分析(高??蒲醒芯浚?sav,4、三維散點圖 三維散點圖在三維坐標(biāo)系中繪制三個變量的數(shù)據(jù)。 在散點圖窗口中選擇三維散點圖,單擊Define,在出現(xiàn)的窗口中,分別選擇論文數(shù)、投入人年數(shù)和獲獎數(shù)為Y軸變量、X軸變量、Z軸變量。,相關(guān)回歸分析(高校科研研究).sav,5、堆積散點圖-簡單點圖,選中簡單點,單擊定義Define按鈕,打開窗口,相關(guān)回歸分析(高??蒲醒芯浚?sav,對于其它圖形的S
7、PSS繪制,可閱讀參考書,杜強(qiáng)、賈麗艷,《SPSS統(tǒng)計分析從入門到精通》,人民郵電出版社,2011年書中的第19章,統(tǒng)計圖形.,8.2.2 相關(guān)系數(shù),利用相關(guān)系數(shù)進(jìn)行變量間線性關(guān)系的分析通常需要完成以下兩個步驟:第一,計算樣本相關(guān)系數(shù)r;相關(guān)系數(shù)r的取值在-1~+1之間r>0,正的線性相關(guān)關(guān)系;r0.8,較強(qiáng)的線性關(guān)系; |r|<0.3,線性關(guān)系較弱第二,對樣本來自的兩總體是否存在顯著的線性關(guān)系進(jìn)行推斷。,雙變
8、量關(guān)系強(qiáng)度測量的主要指標(biāo),對不同類型的變量應(yīng)采用不同的相關(guān)系數(shù)來度量,適用于兩分類變量的分析,適用于一分類變量一定距變量的分析,適用于兩順序變量的分析,更多指標(biāo)-交叉列聯(lián)表,1. Pearson簡單相關(guān)系數(shù),適用于兩個變量都是數(shù)值型的數(shù)據(jù)Pearson簡單相關(guān)系數(shù)的檢驗統(tǒng)計量為:,2. Spearman等級相關(guān)系數(shù),用來度量兩定序變量間的線性相關(guān)關(guān)系,計算時并不直接采用原始數(shù)據(jù) ,而是利用數(shù)據(jù)的秩,用兩變
9、量的秩 代替 代入Pearson簡單相關(guān)系數(shù)計算公式中,于是其中的 和 的取值范圍被限制在1和n之間,且可被簡化為:,如果兩變量的正相關(guān)性較強(qiáng),它們秩的變化具有同步性,于是 的值較小,r趨向于1;如果兩變量的正相關(guān)性較弱,它們秩的變化不具有同步性,于是 的值較大,r趨向于0;在小樣
10、本下,在零假設(shè)成立時, Spearman等級相關(guān)系數(shù)服從Spearman分布;在大樣本下, Spearman等級相關(guān)系數(shù)的檢驗統(tǒng)計量為Z統(tǒng)計量,定義為: Z統(tǒng)計量近似服從標(biāo)準(zhǔn)正態(tài)分布。,,3. Kendall 相關(guān)系數(shù),用非參數(shù)檢驗方法來度量兩定序變量間的線性相關(guān)關(guān)系, 利用變量秩數(shù)據(jù)計算一致對數(shù)目(U)和非一致對數(shù)目(V)。U較大,V較小,較強(qiáng)正相關(guān);U較小,V較大,較強(qiáng)負(fù)相關(guān);U和V大致相當(dāng),各占樣本數(shù)
11、的1/2,相關(guān)性較弱.,. Kendall 統(tǒng)計量的數(shù)學(xué)定義小樣本下服從Kendall分布, 大樣本下采用的檢驗統(tǒng)計量為,8.2.3 基本操作,相關(guān)分析用于描述兩個變量間 關(guān)系的密切程度,其特點是 變量不分主次,被置于同等的地位。在分析Analyze的下拉菜單相關(guān)Correlate命令項中有三個相關(guān)分析功能子命令雙變量Bivariate、偏相關(guān)Partial、 距離Distances,分別對應(yīng)著相關(guān)分析、
12、偏相關(guān)分析和相似性測度(距離)的三個SPSS過程。,Bivariate過程用于進(jìn)行兩個或多個變量間的相關(guān)分析,如為多個變量,給出兩兩相關(guān)的分析結(jié)果。Partial過程,當(dāng)進(jìn)行相關(guān)分析的兩個變量的取值都受到其他變量的影響時,就可以利用偏相關(guān)分析對其他變量進(jìn)行控制,輸出控制其他變量影響后的偏相關(guān)系數(shù)。Distances過程用于對各樣本點之間或各個變量之間進(jìn)行相似性分析,一般不單獨(dú)使用,而作為聚類分析和因子分析等的預(yù)分析。,Bivaria
13、te相關(guān)分析步驟,1) 選擇菜單Analyze ?Correlate ?Bivariate,出現(xiàn)窗口:,2) 把要分析的變量選到變量Variables框。3) 在相關(guān)系數(shù)Correlation Coefficents框中選擇計算哪種相關(guān)系數(shù)。4) 在顯著性檢驗Test of Significance框中選擇輸出相關(guān)系數(shù)檢驗的雙邊(Two-Tailed)概率p值或單邊(One-Tailed)概率p值。5)選中標(biāo)記顯著性相關(guān)Flag
14、significance correlation選項表示分析結(jié)果中除顯示p值外,還輸出星號標(biāo)記,以標(biāo)明變量間的相關(guān)性是否顯著;不選中則不輸出星號標(biāo)記。,6) 在選項Option按鈕中的統(tǒng)計Statistics選項中,選中Cross-product deviations and covariances表示輸出兩變量的離差平方和協(xié)方差。,8.2.4 應(yīng)用舉例,為研究高等院校人文社會科學(xué)研究中立項課題數(shù)會受哪些因素的影響,收集1999年31個
15、省市自治區(qū)部分高校有關(guān)社科研究方面的數(shù)據(jù),研究立項課題數(shù)(當(dāng)年)與投入的具有高級職稱的人年數(shù)(當(dāng)年)、發(fā)表的論文數(shù)(上年)之間是否具有較強(qiáng)的線性關(guān)系。 對該問題的研究可以采用相關(guān)分析的方法,首先可繪制矩陣散點圖;其次可以計算Pearson簡單相關(guān)系數(shù)。,相關(guān)回歸分析(高??蒲醒芯浚?sav,輸出結(jié)果,8.3 偏相關(guān)分析,8.3.1 偏相關(guān)分析和偏相關(guān)系數(shù)8.3.2 基本操作8.3.3 應(yīng)用舉例,8.3.1 偏相關(guān)分
16、析和偏相關(guān)系數(shù),上節(jié)中的相關(guān)系數(shù)是研究兩變量間線性相關(guān)性的,若還存在其他因素影響,就相關(guān)系數(shù)本身來講,它未必是兩變量間線性相關(guān)強(qiáng)弱的真實體現(xiàn),往往有夸大的趨勢。例如,在研究商品的需求量和價格、消費(fèi)者收入之間的線性關(guān)系時,需求量和價格之間的相關(guān)關(guān)系實際還包含了消費(fèi)者收入對價格和商品需求量的影響。,偏相關(guān)分析也稱凈相關(guān)分析,它在控制其他變量的線性影響的條件下分析兩變量間的線性關(guān)系,所采用的工具是偏相關(guān)系數(shù)??刂谱兞總€數(shù)為1時,偏相關(guān)系數(shù)
17、稱一階偏相關(guān);當(dāng)控制兩個變量時,偏相關(guān)系數(shù)稱為二階偏相關(guān);當(dāng)控制變量的個數(shù)為0時,偏相關(guān)系數(shù)稱為零階偏相關(guān),也就是簡單相關(guān)系數(shù)。,利用偏相關(guān)系數(shù)進(jìn)行分析的步驟,第一,計算樣本的偏相關(guān)系數(shù)假設(shè)有三個變量y、x1和x2,在分析x1和y之間的凈相關(guān)時,當(dāng)控制了x2的線性作用后,x1和y之間的一階偏相關(guān)定義為:偏相關(guān)系數(shù)的取值范圍及大小含義與相關(guān)系數(shù)相同.,第二,對樣本來自的兩總體是否存在顯著的凈相關(guān)進(jìn)行推斷檢驗統(tǒng)計量為:其
18、中,r為偏相關(guān)系數(shù),n為樣本數(shù),q為階數(shù)。T統(tǒng)計量服從n-q-2個自由度的t分布。,8.3.2 基本操作,1) 選擇菜單Analyze ?Correlate ?Partial,相關(guān)回歸分析(高校科研研究).sav,2) 把參與分析的變量選擇到Variables框中。3) 選擇一個或多個控制變量到Controlling for框中。4) 在Test of Significance框中選擇輸出偏相關(guān)檢驗的雙尾概率p值或單尾概率p值。5
19、) 在Option按鈕中的Statistics選項中,選中Zero-order Correlations表示輸出零階偏相關(guān)系數(shù)。至此,SPSS將自動進(jìn)行偏相關(guān)分析和統(tǒng)計檢驗,并將結(jié)果顯示到輸出窗口。,8.3.3 應(yīng)用舉例,上節(jié)中研究高校立項課題總數(shù)影響因素的相關(guān)分析中發(fā)現(xiàn),發(fā)現(xiàn)立項課題數(shù)與論文數(shù)之間有較強(qiáng)正線性相關(guān)關(guān)系,但應(yīng)看到這種關(guān)系中可能摻入了投入高級職稱的人年數(shù)的影響,因此,為研究立項課題總數(shù)和發(fā)表論文數(shù)之間的凈相關(guān)系數(shù),可以將
20、投入高級職稱的人年數(shù)加以控制,進(jìn)行偏相關(guān)分析。,相關(guān)回歸分析(高校科研研究).sav,輸出結(jié)果,相關(guān)分析輸出結(jié)果;正強(qiáng)相關(guān),偏相關(guān)分析輸出結(jié)果;負(fù)的弱相關(guān),8.4 回歸分析,8.4.1 回歸分析概述8.4.2 線性回歸模型8.4.3 回歸方程的統(tǒng)計檢驗8.4.4 基本操作8.4.5 其它操作8.4.6 應(yīng)用舉例,8.4.1 線性回歸分析概述,線性回歸分析的內(nèi)容能否找到一個線性組合來說明一組自變量和因變量的關(guān)系如果能的話,
21、這種關(guān)系的強(qiáng)度有多大,也就是利用自變量的線性組合來預(yù)測因變量的能力有多強(qiáng)整體解釋能力是否具有統(tǒng)計上的顯著性在整體解釋能力顯著的情況下,哪些自變量有顯著意義,回歸分析的一般步驟確定回歸方程中的解釋變量(自變量)和被解釋變量(因變量)確定回歸方程對回歸方程進(jìn)行各種檢驗利用回歸方程進(jìn)行預(yù)測,8.4.2 線性回歸模型,一元線性回歸模型的數(shù)學(xué)模型: 其中x為自變量;y為因變量; 為截距,即常量; 為回歸系數(shù)
22、,表明自變量對因變量的影響程度。,用最小二乘法求解方程中的兩個參數(shù),得到,多元線性回歸模型,多元線性回歸方程: y=β0+β1x1+β2x2+...+βkxkβ1、β2、βk為偏回歸系數(shù)。β1表示在其他自變量保持不變的情況下,自變量x1變動一個單位所引起的因變量y的平均變動。,多元線性回歸的估計,1. 回歸方程的擬合優(yōu)度回歸直線與各觀測點的接近程度稱為回歸方程的擬合優(yōu)度,即樣本觀測值聚集在回歸線周圍的緊密程度 。1)離
23、差平方和的分解: 建立直線回歸方程可知:y的觀測值的總變動可由 來反映,稱為總變差。引起總變差的原因有兩個:(a)由于x的取值不同,使得與x有線性關(guān)系的y值不同;(b)隨機(jī)因素的影響。,8.4.3 線性回歸方程的統(tǒng)計檢驗,總離差平方和可分解為,即:總離差平方和(SST)=剩余離差平方和(SSE) +回歸離差平方和(SSR) 其中;SSR
24、是由x和y的直線回歸關(guān)系引起的,可以由回歸直線做出解釋;SSE是除了x對y的線性影響之外的隨機(jī)因素所引起的Y的變動,是回歸直線所不能解釋的。,2、可決系數(shù)(判定系數(shù)、決定系數(shù)),回歸平方和在總離差平方和中所占的比例可以作為一個統(tǒng)計指標(biāo),用來衡量X與Y 的關(guān)系密切程度以及回歸直線的代表性好壞,稱為可決系數(shù)。對于一元線性回歸方程:,對于多元線性回歸方程:在多元線性回歸分析中,引起判定系數(shù)增加的原因有兩個:一個是方程中的解釋變量個數(shù)
25、增多,另一個是方程中引入了對被解釋變量有重要影響的解釋變量。在多元線性回歸分析中,調(diào)整的判定系數(shù)比判定系數(shù)更能準(zhǔn)確的反映回歸方程的擬合優(yōu)度。,2. 回歸方程的顯著性檢驗(方差分析F檢驗),回歸方程的顯著性檢驗是要檢驗被解釋變量與所有的解釋變量之間的線性關(guān)系是否顯著。對于一元線性回歸方程,檢驗統(tǒng)計量為:對于多元線性回歸方程,檢驗統(tǒng)計量為:,3. 回歸系數(shù)的顯著性檢驗(t檢驗),回歸系數(shù)的顯著性檢驗是要檢驗回歸方程中被解釋變量與每
26、一個解釋變量之間的線性關(guān)系是否顯著。對于一元線性回歸方程,檢驗統(tǒng)計量為:,對于多元線性回歸方程,檢驗統(tǒng)計量為:,線性回歸模型的假設(shè)條件,滿足Gauss-Markov條件(即等方差與不相關(guān)假定):正態(tài)分布假定條件:各自變量序列之間不相關(guān):,,,,,,多重共線性,自相關(guān),異方差,4. 殘差分析,殘差是指由回歸方程計算得到的預(yù)測值與實際樣本值之間的差距,定義為: 對于線性回歸分析來講,如果方程能夠較好的反映被解釋變
27、量的特征和規(guī)律性,那么殘差序列中應(yīng)不包含明顯的規(guī)律性。殘差分析包括以下內(nèi)容:殘差服從正態(tài)分布,其平均值等于0;殘差取值與X的取值無關(guān);殘差不存在自相關(guān);殘差方差相等。,異方差的檢驗與處理,1) 對于殘差均值和方差齊性檢驗可以利用殘差圖進(jìn)行分析。如果殘差均值為零,殘差圖的點應(yīng)該在縱坐標(biāo)為0的中心的帶狀區(qū)域中隨機(jī)散落。如果殘差的方差隨著解釋變量值(或被解釋變量值)的增加呈有規(guī)律的變化趨勢,則出現(xiàn)了異方差現(xiàn)象。,2) Spearman(斯皮爾
28、曼)檢驗,即等級相關(guān)系數(shù)檢驗建模時不能消除數(shù)據(jù)的異方差,只能消除異方差帶來的不良影響。最常用的方法是加權(quán)最小二乘法(Weighted Least Squares, WLS)。,,,自相關(guān)的檢驗,DW檢驗用來檢驗殘差的自相關(guān)。檢驗統(tǒng)計量為: DW=2表示無自相關(guān),在0-2之間說明存在正自相關(guān),在2-4之間說明存在負(fù)的自相關(guān)。一般情況下,DW值在1.5-2.5之間即可說明無自相關(guān)現(xiàn)象。,異方差和自相關(guān)的處理方法,5. 多重共
29、線性分析 多重共線性是指解釋變量之間存在線性相關(guān)關(guān)系的現(xiàn)象。測度多重共線性一般有以下方式:1) 容忍度:其中, 是第i個解釋變量與方程中其他解釋變量間的復(fù)相關(guān)系數(shù)的平方,表示解釋變量之間的線性相關(guān)程度。容忍度的取值范圍在0-1之間,越接近0表示多重共線性越強(qiáng),越接近1表示多重共線性越弱。2) 方差膨脹因子VIF。方差膨脹因子是容忍度的倒數(shù)。VIF越大多重共線性越強(qiáng),當(dāng)VIF大于等于10時,說明存在嚴(yán)重的多重共線性。,3)
30、 特征根和方差比。根據(jù)解釋變量的相關(guān)系數(shù)矩陣求得的特征根中,如果最大的特征根遠(yuǎn)遠(yuǎn)大于其他特征根,則說明這些解釋變量間具有相當(dāng)多的重復(fù)信息。如果某個特征根既能夠刻畫某解釋變量方差的較大部分比例(0.7以上),又能刻畫另一解釋變量方差的較大部分比例,則表明這兩個解釋變量間存在較強(qiáng)的線性相關(guān)關(guān)系。4) 條件指數(shù)。指最大特征根與第i個特征根比的平方根。通常,當(dāng)條件指數(shù)在0-10之間時說明多重共線性較弱;當(dāng)條件指數(shù)在10-100之間說明多重共線
31、性較強(qiáng);當(dāng)條件指數(shù)大于100時說明存在嚴(yán)重的多重共線性。,從有共線性問題的變量中刪除不重要的變量;增加樣本量或重新抽取樣本;采用其它方法擬合模型:如逐步回歸、嶺估計、主成分分析法等。,,多重共線性分析的處理方法,8.4.3 基本操作,1) 選擇菜單Analyze ?Regression ?Linear,出現(xiàn)窗口:,相關(guān)回歸分析(高??蒲醒芯浚?sav,2) 選擇被解釋變量進(jìn)入Dependent框。3)選擇一個或多個解釋變量進(jìn)入
32、 Independent(s)框。4) 在Method框中選擇回歸分析中解釋變量的篩選策略。其中Enter表示所選變量強(qiáng)行進(jìn)入回歸方程,是SPSS默認(rèn)的策略,通常用在一元線性回歸分析中;Remove表示從回歸方程中剔除所選變量;Stepwise表示逐步篩選策略;Backward表示向后篩選策略;Forward表示向前篩選策略。,注:多元回歸分析中,變量的篩選一般有向前篩選、向后篩選、逐步篩選三種基本策略。(重點)向前篩選( Fo
33、rward )策略:解釋變量不斷進(jìn)入回歸方程的過程。首先,選擇與被解釋變量具有最高線性相關(guān)系數(shù)的變量進(jìn)入方程,并進(jìn)行回歸方程的各種檢驗;然后,在剩余的變量中尋找與被解釋變量偏相關(guān)系數(shù)最高且通過檢驗的變量進(jìn)入回歸方程,并對新建立的回歸方程進(jìn)行各種檢驗;這個過程一直重復(fù),直到再也沒有可進(jìn)入方程的變量為止。向后篩選( Backward )策略:變量不斷剔除出回歸方程的過程。首先,所有變量全部引入回歸方程,并對回歸方程進(jìn)行各種檢驗;然后,在回
34、歸系數(shù)顯著性檢驗不顯著的一個或多個變量中,,剔除t檢驗值最小的變量,并重新建立回歸方程和進(jìn)行各種檢驗;如果新建回歸方程中所有變量的回歸系數(shù)檢驗都顯著,則回歸方程建立結(jié)束。否則按上述方法再一次剔除最不顯著的變量,直到再也沒有可剔除的變量為止。逐步篩選( Stepwise )策略:在向前篩選策略的基礎(chǔ)上結(jié)合向后篩選策略,在每個變量進(jìn)入方程后再次判斷是否存在應(yīng)該剔除出方程的變量。因此,逐步篩選策略在引入變量的每一個階段都提供了再剔除不顯著變
35、量的機(jī)會。,5) 第三和第四步中確定的解釋變量及變量篩選策略可放置在不同的塊(Block)中。通常在回歸分析中不止一組待進(jìn)入方程的解釋變量和相應(yīng)的篩選策略,可以單擊Next和Previous按鈕設(shè)置多組解釋變量和變量篩選策略并放置在不同的塊中。6) 選擇一個變量作為條件變量放到Selection Variable框中,并單擊Rule按鈕給定一個判斷條件。只有變量值滿足判定條件的樣本才參與線性回歸分析.7) 在Case Labels框
36、中指定哪個變量作為樣本數(shù)據(jù)點的標(biāo)志變量,該變量的值將標(biāo)在回歸分析的輸出圖形中。,剔除t檢驗值最小的變量,并重新建立回歸方程和進(jìn)行各種檢驗;如果新建回歸方程中所有變量的回歸系數(shù)檢驗都顯著,則回歸方程建立結(jié)束。否則按上述方法再一次剔除最不顯著的變量,直到再也沒有可剔除的變量為止。逐步篩選( Stepwise )策略:在向前篩選策略的基礎(chǔ)上結(jié)合向后篩選策略,在每個變量進(jìn)入方程后再次判斷是否存在應(yīng)該剔除出方程的變量。因此,逐步篩選策略在引入變
37、量的每一個階段都提供了再剔除不顯著變量的機(jī)會。,5) 第三和第四步中確定的解釋變量及變量篩選策略可放置在不同的塊(Block)中。通常在回歸分析中不止一組待進(jìn)入方程的解釋變量和相應(yīng)的篩選策略,可以單擊Next和Previous按鈕設(shè)置多組解釋變量和變量篩選策略并放置在不同的塊中。6) 選擇一個變量作為條件變量放到Selection Variable框中,并單擊Rule按鈕給定一個判斷條件。只有變量值滿足判定條件的樣本才參與線性回歸分析
38、.7) 在Case Labels框中指定哪個變量作為樣本數(shù)據(jù)點的標(biāo)志變量,該變量的值將標(biāo)在回歸分析的輸出圖形中。,8.4.4 線性回歸分析的其他操作,1、Statistics按鈕,出現(xiàn)的窗口可供用戶選擇更多的輸出統(tǒng)計量。,統(tǒng)計量對話框,1) Estimates:SPSS默認(rèn)輸出項,輸出與回歸系數(shù)相關(guān)的統(tǒng)計量。包括回歸系數(shù)(偏回歸系數(shù))、回歸系數(shù)標(biāo)準(zhǔn)誤差、標(biāo)準(zhǔn)化回歸系數(shù)、回歸系數(shù)顯著性檢驗的t統(tǒng)計量和概率p值,各解釋變量的容忍度。2)
39、 Confidence Intervals:輸出每個非標(biāo)準(zhǔn)化回歸系數(shù)95%的置信區(qū)間。3) Descriptive:輸出各解釋變量和被解釋變量的均值、標(biāo)準(zhǔn)差、相關(guān)系數(shù)矩陣及單側(cè)檢驗概率p值。7) Covariance matrix:輸出方程中各解釋變量間的相關(guān)系數(shù)、協(xié)方差及各回歸系數(shù)的方差.,4) Model fit:SPSS默認(rèn)輸出項,輸出判定系數(shù)、調(diào)整的判定系數(shù)、回歸方程的標(biāo)準(zhǔn)誤差、回歸方程顯著F檢驗的方程分析表。5) R s
40、quared change:輸出每個解釋變量進(jìn)入方程后引起的判定系數(shù)的變化量和F值的變化量。6) Part and partial correlation:輸出方程中各解釋變量與被解釋變量之間的簡單相關(guān)、偏相關(guān)系數(shù)。,8) Collinearity Diagnostics:多重共線性分析,輸出各個解釋變量的容忍度、方差膨脹因子、特征值、條件指標(biāo)、方差比例等。9) 在Residual框中:Durbin-waston表示輸出DW檢驗值;
41、Casewise Diagnostic表示輸出標(biāo)準(zhǔn)化殘差絕對值大于等于3(SPSS默認(rèn)值)的樣本數(shù)據(jù)的相關(guān)信息,包括預(yù)測值、殘差、杠桿值等。,2、Options選項,出現(xiàn)的窗口可供用戶設(shè)置多元線性回歸分析中解釋變量篩選的標(biāo)準(zhǔn)以及缺失值的處理方式。,選項對話框,3、Plot選項,出現(xiàn)的窗口用于對殘差序列的分析。,繪制對話框,1) 窗口左邊框中各變量名的含義是:DEPENDNT表示被解釋變量,*ZPRED表示標(biāo)準(zhǔn)化預(yù)測值,*ZRESID表示
42、標(biāo)準(zhǔn)化殘差,*DRESID表示剔除殘差,*ADJPRED表示調(diào)整的預(yù)測值,*SRESID表示學(xué)生化殘差,*SDRESID表示剔除學(xué)生化殘差.2) 繪制多對變量的散點圖,可根據(jù)需要在scatter框中定義散點圖的縱坐標(biāo)和橫坐標(biāo)變量。3) 在Standardized Residual Plots框中選擇Histogram選項繪制標(biāo)準(zhǔn)化殘差序列的直方圖;選擇Normal probability plot繪制標(biāo)準(zhǔn)化殘差序列的正態(tài)分布累計概率
43、圖。選擇Produce all partial plots選項表示依次繪制被解釋變量和各個解釋變量的散點圖。,保存對話框,4、Save選項,該窗口將回歸分析的某些結(jié)果以SPSS變量的形式保存到數(shù)據(jù)編輯窗口中,并可同時生成XML格式的文件,便于分析結(jié)果的網(wǎng)絡(luò)發(fā)布。1) Predicted Values框中:保存非標(biāo)準(zhǔn)化預(yù)測值、標(biāo)準(zhǔn)化預(yù)測值、調(diào)整的預(yù)測值和預(yù)測值的均值標(biāo)準(zhǔn)誤差.2) Predicted Interval框中:保存均值或個
44、體預(yù)測值95%(默認(rèn))置信區(qū)間的下限值和上限值。3) Residual框中:保存非標(biāo)準(zhǔn)化殘差、標(biāo)準(zhǔn)化殘差等。4) Influence Statistics框中:保存剔除第i個樣本后統(tǒng)計量的變化量。5、WSL選項,采用加權(quán)最小二乘法替代普通最小二乘法估計回歸參數(shù),并指定一個變量作為權(quán)重變量。,8.4.5 應(yīng)用舉例,以高??蒲醒芯繑?shù)據(jù)為例,建立回歸方程研究1、課題總數(shù)受論文數(shù)的影響2、以課題總數(shù)X5為被解釋變量,解釋變量為投入人年
45、數(shù)X2、投入高級職稱的人年數(shù)X3、投入科研事業(yè)費(fèi)X4、專著數(shù)X6、論文數(shù)X7、獲獎數(shù)X8。1) 解釋變量采用強(qiáng)制進(jìn)入策略(Enter),并做多重共線性檢測。2) 解釋變量采用向后篩選策略讓SPSS自動完成解釋變量的選擇。3) 解釋變量采用逐步篩選策略讓SPSS自動完成解釋變量的選擇。,相關(guān)回歸分析(高校科研研究).sav,強(qiáng)制進(jìn)入策略-操作,回歸方程的擬合優(yōu)度檢驗(判定系數(shù)),回歸方程的顯著性檢驗,強(qiáng)制進(jìn)入策略-結(jié)果,回歸
46、系數(shù)的顯著性檢驗,回歸參數(shù)的估計值,變量的多重共線性檢驗,接近0說明共線性強(qiáng),>10說明共線性強(qiáng),總之,有多個影響變量不顯著,且變量間共線性強(qiáng),強(qiáng)制進(jìn)入策略-結(jié)果,變量的多重共線性檢驗?特征根和方差比.第7個特征根可解釋多個變量的大部分方差,強(qiáng)制進(jìn)入策略-結(jié)果,向后篩選策略-操作,向后篩選策略-操作,,回歸方程的擬合優(yōu)度檢驗(判定系數(shù)),向后篩選策略-結(jié)果,DW值在1.5-2.5之間,可以說明沒有自相關(guān)現(xiàn)象,回
47、歸方程的顯著性檢驗,向后篩選策略-結(jié)果,向后篩選策略-結(jié)果,回歸參數(shù)的估計+回歸系數(shù)的顯著性檢驗,向后篩選策略-結(jié)果,每步排除的變量,向后篩選策略-結(jié)果,殘差累計概率圖,從圖中可知?dú)埐罱品臉?biāo)準(zhǔn)正態(tài)分布,向后篩選策略-結(jié)果,殘差圖,從圖中可知,數(shù)據(jù)點無明顯規(guī)律,殘差序列是獨(dú)立,且都在±3個標(biāo)準(zhǔn)差范圍內(nèi),無異常點,向后篩選策略-結(jié)果,標(biāo)準(zhǔn)化殘差和標(biāo)準(zhǔn)化預(yù)測值的Spearman等級相關(guān)分析-操作,標(biāo)
48、準(zhǔn)化殘差和標(biāo)準(zhǔn)化預(yù)測值的Spearman等級相關(guān)分析結(jié)果,計算殘差與預(yù)測值的相關(guān)性弱,認(rèn)為異方差現(xiàn)象不明顯,標(biāo)準(zhǔn)化殘差的非參數(shù)檢驗-操作,標(biāo)準(zhǔn)化殘差的非參數(shù)檢驗結(jié)果,可認(rèn)為標(biāo)準(zhǔn)化殘差服從標(biāo)準(zhǔn)正態(tài)分布,練習(xí),1、為研究收入和支出的關(guān)系,收集1978-2002年我國的年人均可支配收入和年人均消費(fèi)性支出數(shù)據(jù),研究收入與支出之間是否具有較強(qiáng)的線性關(guān)系。2、以年人均支出和教育數(shù)據(jù)為例,建立回歸方程研究年人均消費(fèi)支出、恩格爾系數(shù)、在外就餐、教
49、育支出、住房人均使用面積受年人均可支配收入的影響。,相關(guān)回歸分析(年人均消費(fèi)支出和教育).sav,1、分析?回歸?權(quán)重估計。,加權(quán)回歸的舉例,mallcost.sav,輸出結(jié)果,1、分析?回歸?兩階最小二乘法。,兩階最小二乘法 (自學(xué)),cross_sell.sav,兩階最小二乘法的SPSS實現(xiàn),可進(jìn)一步閱讀參考書,杜強(qiáng)、賈麗艷,《SPSS統(tǒng)計分析從入門到精通》,人民郵電出版社,2011年該書中的第8.9章節(jié),兩階最小二乘回歸.,Th
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- [教育]應(yīng)用統(tǒng)計學(xué):第八章:相關(guān)分析
- 《第八章回歸分析》word版
- 《統(tǒng)計分析軟件spss應(yīng)用》教學(xué)人大薛微
- 《宏觀經(jīng)濟(jì)統(tǒng)計分析》-習(xí)題解答-第八章-陳正偉
- spss統(tǒng)計分析軟件
- spss統(tǒng)計分析案例
- spss實用統(tǒng)計分析
- 統(tǒng)計分析與spss應(yīng)用論文
- 統(tǒng)計分析與spss的應(yīng)用
- 統(tǒng)計分析與spss應(yīng)用論文
- 第八章 時間序列分析
- 黨課第八章習(xí)題及答案分析
- spss統(tǒng)計分析軟件簡介
- [教育]營銷研究第八章相關(guān)性分析
- 第八章選址規(guī)劃與分析
- 第八章 非線性控制系統(tǒng)分析
- 第八章 層次分析法
- 統(tǒng)計第八章習(xí)題
- spss統(tǒng)計分析基礎(chǔ)教程
- spss統(tǒng)計分析考查課試題
評論
0/150
提交評論