農(nóng)村發(fā)展研究方法-第12章-農(nóng)村發(fā)展研究評價(jià)方法_第1頁
已閱讀1頁,還剩191頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第十二章 農(nóng)村發(fā)展研究評價(jià)方法,,主要內(nèi)容,第一節(jié) 農(nóng)村發(fā)展研究評價(jià)的一般過程和分類第二節(jié) 農(nóng)村發(fā)展研究常用的評價(jià)方法,第一節(jié) 農(nóng)村發(fā)展研究評價(jià)的一般過程和分類,一、評價(jià)概述二、農(nóng)村發(fā)展研究評價(jià)的一般過程三、評價(jià)方法分類,一、評價(jià)概述,評價(jià)就是參照一定標(biāo)準(zhǔn)對客體的價(jià)值或優(yōu)劣進(jìn)行評判比較的一種認(rèn)知過程,同時(shí)也是一種決策過程。評價(jià)分綜合評價(jià)和單項(xiàng)評價(jià)單項(xiàng)評價(jià):評價(jià)標(biāo)準(zhǔn)單一、明確(單指標(biāo)評價(jià))綜合評價(jià):評價(jià)標(biāo)準(zhǔn)復(fù)雜、抽象(多指標(biāo)評

2、價(jià)),二、農(nóng)村發(fā)展研究評價(jià)的一般過程,評價(jià)的目的是通過對評價(jià)對象屬性的定量化測定,實(shí)現(xiàn)對評價(jià)對象整體水平或功能的量化描述,從而揭示事物的價(jià)值或發(fā)展規(guī)律。,二、農(nóng)村發(fā)展研究評價(jià)的一般過程,完整的評價(jià)可以分為如下幾個(gè)階段:(1)確定評價(jià)目的,選取評價(jià)對象(2)建立評價(jià)指標(biāo)體系具體包括評價(jià)目標(biāo)的細(xì)分與結(jié)構(gòu)化,指標(biāo)體系的初步確定,指標(biāo)體系的整體檢驗(yàn)與初步檢驗(yàn),指標(biāo)體系結(jié)構(gòu)的優(yōu)化,定性變量的數(shù)量化等環(huán)節(jié)。(3)選擇評價(jià)方法與模型具體包括

3、評價(jià)方法選擇,權(quán)數(shù)構(gòu)造,評價(jià)指標(biāo)體系的標(biāo)準(zhǔn)值與評價(jià)規(guī)則的確定。,二、農(nóng)村發(fā)展研究評價(jià)的一般過程,完整的評價(jià)可以分為如下幾個(gè)階段:(4)綜合評價(jià)實(shí)施包括指標(biāo)體系數(shù)據(jù)搜集、數(shù)據(jù)評估、必要的數(shù)據(jù)推算模型參數(shù)求解等。(5)對評價(jià)結(jié)果進(jìn)行評估與檢驗(yàn),以判別所選評價(jià)模型、有關(guān)標(biāo)準(zhǔn)、有關(guān)權(quán)值、甚至指標(biāo)體系合理與否。若不符合要求,則需要進(jìn)行一些修改,甚至返回到前述的某一環(huán)節(jié)。(6)評價(jià)結(jié)果分析與報(bào)告具體包括評價(jià)結(jié)果的書面分析,撰寫評價(jià)報(bào)告,

4、提供與發(fā)布評價(jià)結(jié)果,資料的儲備與后續(xù)開發(fā)利用。,三、評價(jià)方法分類,評價(jià)方法可以分為定性評價(jià)方法和定量評價(jià)方法兩類。按其評價(jià)思想不同,可以分為加權(quán)評價(jià)方法和非加權(quán)評價(jià)方法兩類。按各評價(jià)方法的理論基礎(chǔ)不同,可以分為六大類定量評價(jià)方法。,三、評價(jià)方法分類,定性評價(jià)方法:專家會議法、德爾菲法常規(guī)定量評價(jià)方法:功效系數(shù)法、綜合指數(shù)法多元統(tǒng)計(jì)評價(jià)方法:主成分分析法、因子分析法、聚類分析法、判別分析法、理想點(diǎn)法運(yùn)籌學(xué)評價(jià)方法:層次分析法

5、、DEA法(數(shù)據(jù)包絡(luò)分析)模糊評價(jià)方法:模糊綜合評價(jià)、模糊聚類、模糊識別、模糊物元、模糊積分,第二節(jié) 農(nóng)村發(fā)展研究常用的評價(jià)方法,一、綜合指數(shù)法二、功效系數(shù)法三、主成分分析四、因子分析五、聚類分析六、判別分析七、層次分析法,一、綜合指數(shù)法,綜合指數(shù)法是指在確定一套合理的經(jīng)濟(jì)效益指標(biāo)體系的基礎(chǔ)上,對各項(xiàng)經(jīng)濟(jì)效益指標(biāo)個(gè)體指數(shù)加權(quán)平均,計(jì)算出經(jīng)濟(jì)效益綜合值,用以綜合評價(jià)經(jīng)濟(jì)效益的一種方法。即將一組相同或不同指數(shù)值通過統(tǒng)計(jì)學(xué)處理

6、,使不同計(jì)量單位、性質(zhì)的指標(biāo)值標(biāo)準(zhǔn)化,最后轉(zhuǎn)化成一個(gè)綜合指數(shù),以準(zhǔn)確地評價(jià)工作的綜合水平。,一、綜合指數(shù)法,各項(xiàng)指標(biāo)的權(quán)數(shù)是根據(jù)其重要程度決定的,體現(xiàn)了各項(xiàng)指標(biāo)在經(jīng)濟(jì)效益綜合值中作用的大小。綜合指數(shù)法的基本思路則是利用層次分析法計(jì)算的權(quán)重和模糊評判法取得的數(shù)值進(jìn)行累乘,然后相加,最后計(jì)算出經(jīng)濟(jì)效益指標(biāo)的綜合評價(jià)指數(shù)。,綜合指數(shù)法的基本步驟,(1)選擇適當(dāng)?shù)闹笜?biāo)(2)確定權(quán)重(3)根據(jù)實(shí)測數(shù)據(jù)及其規(guī)定標(biāo)準(zhǔn),綜合考察各評價(jià)指標(biāo),探求綜

7、合指數(shù)的計(jì)算模式。(4)合理劃分評價(jià)等級(5)檢驗(yàn)評價(jià)模式的可靠性,應(yīng)用實(shí)例,引用甲、乙兩地區(qū)2000年農(nóng)業(yè)經(jīng)濟(jì)效益資料,說明綜合指數(shù)法在分析評價(jià)農(nóng)業(yè)經(jīng)濟(jì)效益方面的具體應(yīng)用。甲乙兩地區(qū)2000年農(nóng)業(yè)經(jīng)濟(jì)效益相關(guān)資料見表1:,以農(nóng)業(yè)物耗與產(chǎn)值比表示資金產(chǎn)出率;以畝均產(chǎn)量和畝均收入表示土地生產(chǎn)率;以勞均產(chǎn)值、勞均收入等表示勞動生產(chǎn)率。,,在構(gòu)建指標(biāo)體系的基礎(chǔ)上,通過德爾菲咨詢,進(jìn)行層次分析來確定各指標(biāo)的權(quán)數(shù),以初值化消除量綱,計(jì)算農(nóng)業(yè)

8、經(jīng)濟(jì)效益綜合指數(shù)。其計(jì)算公式為:,由計(jì)算結(jié)果可知,2000年兩地區(qū)經(jīng)濟(jì)效益綜合指數(shù)分別為110.28%和115.52%,均大于100%,說明兩地區(qū)農(nóng)業(yè)經(jīng)濟(jì)效益較好,且乙地區(qū)農(nóng)業(yè)經(jīng)濟(jì)效益優(yōu)于甲地區(qū)農(nóng)業(yè)經(jīng)濟(jì)效益。,二、功效系數(shù)法,功效系數(shù)法是根據(jù)多目標(biāo)規(guī)劃原理而建立的一種評價(jià)方法。其含義是:在評價(jià)某一整體的綜合效益時(shí),一般有多種指標(biāo),而這些指標(biāo)的性質(zhì)和度量單位往往不同,不能直接相加或綜合,需要通過一定形式的函數(shù)關(guān)系將其轉(zhuǎn)化為同度量指標(biāo),

9、再將這些同度量指標(biāo)加權(quán)綜合,使之形成一個(gè)綜合指標(biāo),稱之為總功效系數(shù),以此評價(jià)整體的綜合效益。,,在以往功效系數(shù)法的應(yīng)用中,最后功效系數(shù)值使用加權(quán)算術(shù)平均的方法確定,為了更準(zhǔn)確地評價(jià)整體效益狀況,統(tǒng)計(jì)學(xué)家設(shè)計(jì)出改進(jìn)功效系數(shù),對每一評價(jià)指標(biāo)分別確定一個(gè)滿意值與不允許值,以滿意值為標(biāo)準(zhǔn)上限,不允許值為標(biāo)準(zhǔn)下限,按線性正相關(guān)的方法將不同的評價(jià)指標(biāo)無量綱化轉(zhuǎn)為相應(yīng)的評價(jià)分?jǐn)?shù),經(jīng)加權(quán)幾何平均得出綜合評價(jià)分?jǐn)?shù),對評價(jià)對象的綜合狀況作出評估。綜合功效

10、系數(shù)越大,表明評價(jià)對象綜合狀況越佳。,其數(shù)學(xué)模型為:,應(yīng)用實(shí)例:,基于功效系數(shù)法的城市土地利用效益評價(jià)———以武漢市為例城市土地利用可從經(jīng)濟(jì)效益、社會效益、生態(tài)效益三個(gè)方面對其進(jìn)行評價(jià),但其涉及的指標(biāo)繁雜,且性質(zhì)與度量單位也存在較大差異,因此可以使用功效系數(shù)法對其進(jìn)行評價(jià)。,,,,,,三、主成分分析,主成分分析(Principal Component Analysis,PCA)在實(shí)際課題中,為了全面分析問題,往往提出很多與此有關(guān)的變

11、量(或因素),因?yàn)槊總€(gè)變量都在不同程度上反映這個(gè)課題的某些信息。在用統(tǒng)計(jì)分析方法研究多變量的課題時(shí),變量個(gè)數(shù)太多就會增加課題的復(fù)雜性。人們希望變量個(gè)數(shù)較少而得到的信息較多。當(dāng)兩個(gè)變量之間有一定相關(guān)關(guān)系時(shí),可以解釋為這兩個(gè)變量反映此課題的信息有一定的重疊。主成分分析是對于原先提出的所有變量,建立盡可能少的新變量,使得這些新變量是兩兩不相關(guān)的,而且這些新變量在反映課題的信息方面盡可能保持原有的信息。,主成分分析方法的原理,設(shè)法將原來變

12、量重新組合成一組新的互相無關(guān)的幾個(gè)綜合變量,同時(shí)根據(jù)實(shí)際需要從中可以取出幾個(gè)較少的綜合變量盡可能多地反映原來變量的信息的統(tǒng)計(jì)方法叫做主成分分析或稱主分量分析,也是數(shù)學(xué)上降維處理的一種方法。,主成分分析的具體步驟,1、確定指標(biāo)體系在各項(xiàng)具體指標(biāo)的設(shè)置和選擇過程中,要注意指標(biāo)的全面性、代表性、可得性、簡潔性和整合性。2、建立原始信息矩陣Xn×p3、對矩陣X中的數(shù)據(jù)實(shí)行標(biāo)準(zhǔn)化處理,統(tǒng)一指標(biāo)之間的量綱,使其具有可比性4、求標(biāo)準(zhǔn)

13、化矩陣Z的相關(guān)矩陣R,利用標(biāo)準(zhǔn)化后的數(shù)據(jù)計(jì)算P個(gè)指標(biāo)間的相關(guān)系數(shù)5、求相關(guān)矩陣R的特征值和特征向量6、確定主成分的個(gè)數(shù)k累計(jì)貢獻(xiàn)率大于等于85%的k值7、給出主成分Yi, i=1, 2,…, p的表達(dá)式。8、計(jì)算綜合評價(jià)指標(biāo)綜合評價(jià)指標(biāo)其實(shí)就是前K個(gè)主成分的線性加權(quán)值9、計(jì)算評價(jià)分值并排序,應(yīng)用實(shí)例:,主成分分析及其應(yīng)用探討——以山西省農(nóng)村居民消費(fèi)結(jié)構(gòu)為例,山西省農(nóng)村居民家庭平均每人全年消費(fèi)性支出構(gòu)成(1980~2002)

14、,SPSS操作,1、Analyze---Data Reduction----Factor,2、選擇后彈出現(xiàn)下面的對話框,3、把數(shù)據(jù)都選進(jìn)Variables 去,3、把數(shù)據(jù)都選進(jìn)Variables 去,4、點(diǎn)擊,,5、彈出現(xiàn)下面的對話框,6、在對話框的空白處填0,記得上面的圖中要選中前面的點(diǎn),,,7、點(diǎn)擊continue 鈕8、返回上個(gè)對話框9、如需要得到相關(guān)系數(shù)矩陣,點(diǎn)擊在Coefficients 前的方框打上鉤,,,,10、然后

15、點(diǎn)擊continue 鈕11、返回上個(gè)對話框,點(diǎn)擊“OK”,分析結(jié)果——表格,相關(guān)系數(shù)矩陣,可以看出變量之間的相關(guān)性,證明變量之間存在信息重疊。,分析結(jié)果——表格,方差分解主成分提取分析表,,特征值,主成分貢獻(xiàn)率,累積貢獻(xiàn)率,,,,初始因子載荷矩陣,每一個(gè)載荷量表示主成分與對應(yīng)變量的相關(guān)系數(shù)。,,,,,,將前三個(gè)因子載荷矩陣輸入(可用復(fù)制粘貼的方法)到數(shù)據(jù)編輯窗口(為變量B1 、B2 、B3 ) , 然后利用“ Transform c

16、ompute ” , 在對話框中輸入“A1=B1/SQR(5.137)”即可得到特征向量A1。[注:第二主成分SQR 后的括號中填1.365,第三主成分SQR 后的括號中填1.092],同理,可得到A2、A3。然后就可以得出主成分表達(dá)式。,,Transform -----compute,,得出主成分表達(dá)式,主成分表達(dá)式,主成分得分表,主成分得分表,第一主成分代表的意義為消費(fèi)結(jié)構(gòu)針對發(fā)展、享受需求和生存需求的差異,得分越高,表明人們對

17、于發(fā)展和享受的需求越大。,計(jì)算評價(jià)分值并排序,以每個(gè)主成分所對應(yīng)的特征值占所提取主成分總的特征值之和的比例作為權(quán)重計(jì)算主成分綜合模型。根據(jù)主成分綜合模型可以計(jì)算綜合主成分值,并對其按綜合主成分值進(jìn)行排序。,四、因子分析,因子分析就是將大量的彼此可能存在相關(guān)關(guān)系的變量轉(zhuǎn)換成較少的,彼此不相關(guān)的綜合指標(biāo)的一種多元統(tǒng)計(jì)方法。這樣既可減輕收集信息的工作量,且各綜合指標(biāo)代表的信息比重疊,便于分析。,因子分析的步驟,第一步:主因子分析是通

18、過原始變量的相關(guān)系數(shù)矩陣內(nèi)部結(jié)構(gòu)的研究,導(dǎo)出能控制所有變量的少數(shù)幾個(gè)綜合變量,通過這少數(shù)幾個(gè)綜合變量去描述原始的多個(gè)變量之間的相關(guān)關(guān)系。第二步:對因子的解釋和命名從因子分析導(dǎo)出的負(fù)荷矩陣的結(jié)構(gòu)出發(fā),把變量按與公共因子相關(guān)性大小的程度分組,使同組內(nèi)變量間的相關(guān)性較高,不同組的變量的相關(guān)性較低,按公因子包含變量的特點(diǎn)(即公因子內(nèi)涵)對因子作解釋命名。,應(yīng)用實(shí)例,農(nóng)民工培訓(xùn)驅(qū)動機(jī)理研究——以重慶市璧山縣為例在對2個(gè)街道辦事處3個(gè)鎮(zhèn)150

19、余農(nóng)戶(主要是外出務(wù)工)及150余名外出農(nóng)民工抽樣調(diào)查的基礎(chǔ)上,分析了該縣農(nóng)民工培訓(xùn)的特點(diǎn),并運(yùn)用因子分析法對影響農(nóng)民工培訓(xùn)的因素(如就業(yè)概率、市場風(fēng)險(xiǎn)率、政府支持度等)做了定量的分析,得出相關(guān)結(jié)論。,通過對璧山縣2個(gè)街道辦事處3個(gè)鎮(zhèn)的外出農(nóng)民工進(jìn)行抽樣調(diào)查、走訪以及與當(dāng)?shù)匾恍┱块T的座談,從影響農(nóng)民工培訓(xùn)的因素中選取了8個(gè)具體變量進(jìn)行分析,并根據(jù)當(dāng)?shù)剞r(nóng)民工培訓(xùn)的具體情況對公式進(jìn)行了相關(guān)轉(zhuǎn)換,即:,,各因子數(shù)據(jù)具體計(jì)算方法為:農(nóng)民工

20、愿意培訓(xùn)度=(愿意培訓(xùn)農(nóng)民工數(shù)/農(nóng)民工總?cè)藬?shù))×100%;企業(yè)愿意培訓(xùn)度=(企業(yè)愿意培訓(xùn)數(shù)/企業(yè)總數(shù))×100%;就業(yè)概率=(培訓(xùn)后找到工作人數(shù)/培訓(xùn)總?cè)藬?shù))×100%;接受知識限度為培訓(xùn)后進(jìn)行相關(guān)考試,總分為一百分;政府支持度=(政府實(shí)際投入培訓(xùn)資金/政府預(yù)計(jì)投入資金)×100%;市場風(fēng)險(xiǎn)率=(1-培訓(xùn)后各企事業(yè)實(shí)際招收人數(shù)/培訓(xùn)前市場預(yù)計(jì)所需相關(guān)專業(yè)人數(shù))×100%.應(yīng)用

21、以上相關(guān)方法得出各因子所需數(shù)據(jù),而后運(yùn)用SPSS中的因子分析模型進(jìn)行運(yùn)算,結(jié)果如下:,Spss操作,1、Analyze---Data Reduction----Factor,點(diǎn)擊Descriptives,彈出Factor Analysis:Descriptives對話框選Univariate descriptives項(xiàng)要求輸出各變量的均數(shù)與標(biāo)準(zhǔn)差,選Coefficients項(xiàng)要求計(jì)算相關(guān)系數(shù)矩陣,并選KMO and

22、 Bartlett’s test of sphericity項(xiàng),要求對相關(guān)系數(shù)矩陣進(jìn)行統(tǒng)計(jì)學(xué)檢驗(yàn)。點(diǎn)擊Continue鈕返回。,點(diǎn)擊Extraction,彈出Factor Analysis:Extraction對話框,系統(tǒng)提供如下因子提取方法:,Principal components:主成分分析法;    Unweighted least squares:未加權(quán)最小平方法;  &

23、#160; Generalized least squares:綜合最小平方法;    Maximum likelihood:極大似然估計(jì)法;    Principal axis factoring:主軸因子法;    Alpha factoring:α因子法;    Image factoring:多元回歸法

24、。,,點(diǎn)擊Rotation,彈出Factor Analysis:Rotation對話框,系統(tǒng)有5種因子旋轉(zhuǎn)方法可選:None:不作因子旋轉(zhuǎn);Varimax:正交旋轉(zhuǎn);Equamax:全體旋轉(zhuǎn),對變量和因子均作旋轉(zhuǎn);Quartimax:四分旋轉(zhuǎn),對變量作旋轉(zhuǎn);Direct Oblimin:斜交旋轉(zhuǎn)。旋轉(zhuǎn)的目的是為了獲得簡單結(jié)構(gòu),以幫助我們解釋因子。之后點(diǎn)擊Continue鈕返回。,點(diǎn)擊Scores,彈出彈出Fact

25、or Analysis:Scores對話框,系統(tǒng)提供3種估計(jì)因子得分系數(shù)的方法:之后點(diǎn)擊Continue鈕返回再點(diǎn)擊OK鈕即完成分析。,Correlation Matrix,,初始因子載荷陣,,,初始因子載荷,提取因子載荷,旋轉(zhuǎn)提取因子載荷,,Component Matrix,,,,,,,,,主成分分析和因子分析的區(qū)別,因子分析是主成分分析的推廣和發(fā)展。在算法上,主成分分析和因子分析很類似 。 (1)因子分析中是把變量

26、表示成各因子的線性組合,而主成分分析中則是把主成分表示成各變量的線性組合。(2)和主成分分析相比,由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫助解釋因子,在解釋方面更加有優(yōu)勢。大致說來,當(dāng)需要尋找潛在的因子,并對這些因子進(jìn)行解釋的時(shí)候,更加傾向于使用因子分析,并且借助旋轉(zhuǎn)技術(shù)幫助更好解釋。而如果想把現(xiàn)有的變量變成少數(shù)幾個(gè)新的變量(新的變量幾乎帶有原來所有變量的信息)來進(jìn)入后續(xù)的分析,則可以使用主成分分析。,五、聚類分析,聚類分析又稱群分析、點(diǎn)群

27、分析,指將物理或抽象對象的集合分組成為由類似的對象組成的多個(gè)類的多元統(tǒng)計(jì)評價(jià)過程。是定量研究分類問題的一種多元統(tǒng)計(jì)方法。,聚類分析的概念,聚類分析的概念,人類認(rèn)識世界往往首先將被認(rèn)識的對象進(jìn)行分類,因此分類學(xué)便成為人類認(rèn)識世界的基礎(chǔ)科學(xué)。在社會生活的眾多領(lǐng)域中都存在著大量的分類問題。以前人們主要靠經(jīng)驗(yàn)和專業(yè)知識做定性分類處理,致使許多分類帶有主觀性和任意性,不能很好地揭示客觀事物內(nèi)在的本質(zhì)差別與聯(lián)系,特別是對于多因素、多指標(biāo)的分類問題

28、,定性分類更難以實(shí)現(xiàn)準(zhǔn)確分類。,為了克服定性分類存在的不足,于是把數(shù)學(xué)方法引進(jìn)分類學(xué)中,形成了數(shù)值分類學(xué),后來隨著多元分析的引進(jìn),聚類分析又逐漸從數(shù)值分類學(xué)中分離出來,形成一個(gè)相對獨(dú)立的分支。在多元統(tǒng)計(jì)分析中,聚類分析在許多領(lǐng)域中都得到了廣泛的應(yīng)用,取得了許多令人滿意的成果。,聚類分析的基本思想,認(rèn)為所研究的樣品或指標(biāo)之間存在著程度不同的相似性,于是根據(jù)一批樣品的多個(gè)觀測指標(biāo),找出能夠度量樣品或變量之間相似程度的統(tǒng)計(jì)量,并以此為依據(jù),

29、采用某種聚類法,將所有的樣品或變量分別聚合到不同的類中,使同一類中的個(gè)體有較大的相似性,不同類中的個(gè)體差異較大。,聚類分析的內(nèi)容,聚類分析包括很多種方法,系統(tǒng)聚類法是最基本、最常用的一種,此外還有有序樣品聚類法、動態(tài)聚類法、模糊聚類法、圖論聚類法、有重疊聚類等,不同的方法適合解決不同類型的問題。,聚類分析的對象類型,Q型聚類采用距離統(tǒng)計(jì)量,是對樣品進(jìn)行分類處理 。根據(jù)觀測有關(guān)變量的特征,將特征相似的樣品歸為一類。它是聚類分析中用的最多

30、的一種,具有以下優(yōu)點(diǎn):1、可綜合利用多個(gè)變量的信息對樣品進(jìn)行分類;2、分類結(jié)果直觀,聚類譜系圖非常清楚地表現(xiàn)分類結(jié)果;3、所得結(jié)果比傳統(tǒng)分類方法更細(xì)致、全面、合理。,R型聚類采用相似系數(shù)統(tǒng)計(jì)量,是對變量進(jìn)行分類處理。一般來說,可以反映研究對象特點(diǎn)的變量有許多,由于對客觀事物的認(rèn)識有限,往往難以找出彼此獨(dú)立且有代表性的變量,影響對問題進(jìn)一步的認(rèn)識和研究,因此往往需要先進(jìn)行變量聚類,找出相互獨(dú)立又有代表性的變量,而又不丟失大部分信息

31、。,R型聚類分析的主要作用:1、可了解個(gè)別變量之間及變量組合之間的親疏程度;2、根據(jù)變量的分類結(jié)果以及它們之間的關(guān)系,可以選擇主要變量進(jìn)行回歸分析或Q型聚類分析。,事物之間的相似性測度,聚類分析用于系統(tǒng)類群相似性的研究,其實(shí)質(zhì)上是尋找一種能客觀反映樣品或變量之間親疏關(guān)系的統(tǒng)計(jì)量,然后根據(jù)這種統(tǒng)計(jì)量把樣品或變量分成若干類。常用的統(tǒng)計(jì)量有距離和相似系數(shù)。,用相似系數(shù)度量,是兩個(gè)事物離得多近的度量。性質(zhì)越接近的元素其相似系數(shù)的絕對值越接近

32、于1;彼此無關(guān)的元素其相似系數(shù)的絕對值越接近于0。 相似的元素歸為一類,不相似的元素歸為不同的類。,用距離來度量,是兩個(gè)事物離得多遠(yuǎn)的度量。將一個(gè)樣品看作空間的一個(gè)點(diǎn),在空間定義距離,距離近的點(diǎn)歸為一類,距離遠(yuǎn)的點(diǎn)歸為不同的類。,變量類型的劃分,1、間隔尺度: 是用連續(xù)的實(shí)值變量來表示的,是由測量或計(jì)數(shù)、統(tǒng)計(jì)所得到的量。如:經(jīng)濟(jì)統(tǒng)計(jì)數(shù)字、抽樣調(diào)查數(shù)據(jù)、身高、體重、年齡、速度、壓力等。,2、有序尺度: 沒有明確的數(shù)

33、量表示,而是劃分一些等級,等級之間有次序關(guān)系。如:畢業(yè)論文成績有:優(yōu)、良、中、及格、不及格之分;體質(zhì)狀況有好、中、差三個(gè)等級;某產(chǎn)品質(zhì)量可分為一等品、二等品、三等品等。,變量類型的劃分,3、名義尺度: 既沒有數(shù)量表示,也沒有次序關(guān)系,而是表現(xiàn)為某種狀態(tài),其值通常是非數(shù)值數(shù)據(jù)。如:性別有男、女;顏色有紅、黃、藍(lán)、綠等;醫(yī)療診斷中的陰性、陽性等。,變量類型的劃分,不同類型的變量,其距離和相似系數(shù)的定義方法有很大差異。用得較多的是間

34、隔尺度,因此只介紹間隔尺度的距離和相似系數(shù)的定義。,n個(gè)樣品p項(xiàng)指標(biāo)形成的原始數(shù)據(jù)資料矩陣中,每一行表示一個(gè)樣品,每一列表示一個(gè)變量。因此,兩個(gè)樣品的相似性可用矩陣中兩行的相似程度來刻劃;兩個(gè)變量的相似性可用矩陣中兩列的相似程度來刻劃。,1、距離定義:將n個(gè)樣品看成p維空間中的n個(gè)點(diǎn),兩個(gè)樣品間相似程度可用p維空間中兩點(diǎn)的距離來度量。 (1)絕對距離 (2)歐氏距離 (3)馬氏距離 (4)切比雪夫距離 計(jì)算出任何兩

35、個(gè)樣品之間的距離排成距離陣D,根據(jù)D可對n個(gè)點(diǎn)進(jìn)行分類,距離近的點(diǎn)歸為一類,距離遠(yuǎn)的點(diǎn)歸為不同的類。,2、相似系數(shù):將n個(gè)樣品看成p維空間中的n個(gè)向量。(1)    夾角余弦(2)    相關(guān)系數(shù)以上是樣品分類常用的距離和相似系數(shù)定義,它是在p維空間中來研究n個(gè)樣品間的相似;而對變量分類是在n維空間中來研究p列變量間的相似,其相似性也用距離和相似系數(shù)

36、來度量。,系統(tǒng)聚類分析方法,系統(tǒng)聚類分析也叫分層聚類分析,是目前國內(nèi)外使用得最多的一種方法,有關(guān)它的研究極為豐富,聚類分析的方法也最多。,系統(tǒng)聚類的步驟,(1)計(jì)算n個(gè)樣品兩兩之間的距離記為矩陣D;(2)首先構(gòu)造n個(gè)類,每一類中只包含一個(gè)樣品;(3)合并距離最近的兩類為新類;(4)繼續(xù)合并,直到所有的樣本合并為一類為止;(5)畫譜系圖;(6)決定類的個(gè)數(shù)和類。系統(tǒng)聚類允許一類整個(gè)地包含在另一類內(nèi),但在這兩類間不能有其他類與之重

37、疊。,系統(tǒng)聚類方法,樣品之間可以用不同的方法定義距離,類與類之間的距離也有多種定義。用不同的方法定義類與類之間的距離,就產(chǎn)生了不同的系統(tǒng)聚類方法。,(1)最短距離法:定義類與類之間距離為兩類最近樣品的距離,使空間濃縮,形成鏈狀,分類效果不好; (2)最長距離法:定義類與類之間距離為兩類最遠(yuǎn)樣品的距離,受奇異值的影響大;,(3)重心法:以兩類重心之間的距離作為兩類間的距離。重心即該類樣品的均值。每合并一次類,都要重新計(jì)算新類的重心

38、。不具單調(diào)性,圖形逆轉(zhuǎn),限制了其應(yīng)用,可能引起局部最優(yōu),但在處理異常值方面較穩(wěn)健。,(4)類平均法: 以兩類元素兩兩之間距離平方的平均作為類間距離的平方。(5)離差平方和法:又稱Ward法,其基本思想是認(rèn)為同類樣品的離差平方和應(yīng)當(dāng)較小,類與類的離差平方和應(yīng)當(dāng)較大。首先n個(gè)樣品各自成一類,然后每次縮小一類,每縮小一類離差平方和就要增大,選擇使離差平方和增加最小的兩類合并,直到所有樣品歸為一類。它分類效果較好,應(yīng)用較廣泛,對異常值較敏感

39、。,離差平方和是各項(xiàng)與平均項(xiàng)之差的平方的總和,以上幾種聚類方法,只有兩點(diǎn)區(qū)別:(1) 類與類之間距離定義不同;(2)計(jì)算新類與其他類的距離所用的公式不同,因而并類距離不同;各種方法并類步驟完全一樣。,在一般情況下,用不同的方法聚類的結(jié)果是不會完全一致的,怎樣比較各種方法的優(yōu)劣呢?至今還沒有合適的衡量標(biāo)準(zhǔn),因?yàn)椴淮嬖谝环N總是最優(yōu)的聚類方法。類的結(jié)構(gòu)(規(guī)模、形狀、個(gè)數(shù))、奇異值、相似測度選擇都會影響結(jié)果。在實(shí)際應(yīng)用中,

40、一般采用以下兩種處理方法:(1)根據(jù)分類問題本身的專業(yè)知識結(jié)合實(shí)際需要來選擇分類方法,并確定分類個(gè)數(shù);(2)多用幾種分類方法去作,把結(jié)果中的共性提出來,對有爭議的樣品用判別分析去歸類。,應(yīng)注意的問題,(1)在聚類分析中,應(yīng)根據(jù)不同的目的選用不同的指標(biāo)。一般來說,選擇哪些變量應(yīng)該具有一定的理論支持,但在實(shí)踐中往往缺乏這樣強(qiáng)有力的理論基礎(chǔ),一般根據(jù)實(shí)際工作經(jīng)驗(yàn)和所研究問題的特征人為的選擇變量,這些變量應(yīng)該和分析的目標(biāo)密切相關(guān),反映分類

41、對象的特征,在不同研究對象上的值具有明顯差異,變量之間不應(yīng)該高度相關(guān)。選變量時(shí)并不是加入的變量越多,得到的結(jié)果越客觀。有時(shí),加入一兩個(gè)不合適的變量就會使分類結(jié)果大相徑庭。,變量之間高度相關(guān)相當(dāng)于加權(quán),此時(shí),有兩種處理方法:(1)首先進(jìn)行變量聚類,從每類中選一代表性變量,再進(jìn)行樣品聚類;(2)進(jìn)行主成分分析或因子分析,降維,使之成為不相關(guān)的新變量,再進(jìn)行樣品聚類。,(2)標(biāo)準(zhǔn)化問題指標(biāo)選用的度量單位將直接影響聚類分析的結(jié)果。為了避

42、免對變量單位選擇的依賴,數(shù)據(jù)應(yīng)當(dāng)標(biāo)準(zhǔn)化。數(shù)據(jù)量綱不同時(shí),必須進(jìn)行標(biāo)準(zhǔn)化;但如果量綱相同,可數(shù)量級相差很大,這時(shí)也應(yīng)該進(jìn)行標(biāo)準(zhǔn)化。,應(yīng)注意的問題,? 研究問題 對一個(gè)班同學(xué)的數(shù)學(xué)水平進(jìn)行聚類。聚類的依據(jù)是第一次數(shù)學(xué)考試的成績和入學(xué)考試的成績。,SPSS中實(shí)現(xiàn)過程,表 學(xué)生的數(shù)學(xué)成績,數(shù)據(jù)如下表所示:,? 實(shí)現(xiàn)步驟,在SPSS中如何選擇標(biāo)準(zhǔn)化方法:→Analyze →Classify →Hierachical Cluste

43、r Analysis 然后從對話框中進(jìn)行如下選擇,“Hierarchical Cluster Analysis”對話框(一),“Hierarchical Cluster Analysis:Method”對話框(一),從Transform Values框中點(diǎn)擊向下箭頭,將出現(xiàn)如下可選項(xiàng),從中選一即可:,1、數(shù)據(jù)標(biāo)準(zhǔn)化,常用標(biāo)準(zhǔn)化方法(選項(xiàng)說明):,None:不進(jìn)行標(biāo)準(zhǔn)化,這是系統(tǒng)默認(rèn)值,為了便于后面的說明,作如下假設(shè):,均值表示為,標(biāo)準(zhǔn)差

44、表示為,所有樣本表示為,極差表示為,Z Scores:標(biāo)準(zhǔn)化變換,作用:變換后的數(shù)據(jù)均值為0,標(biāo)準(zhǔn)差為1,消去了量綱的影響;當(dāng)抽樣樣本改變時(shí),它仍能保持相對穩(wěn)定性。,Range –1 to 1:極差標(biāo)準(zhǔn)化變換,作用:變換后的數(shù)據(jù)均值為0,極差為1,且|xij*|<1,消去了量綱的影響;在以后的分析計(jì)算中可以減少誤差的產(chǎn)生。,Maximum magnitude of 1,作用:變換后的數(shù)據(jù)最大值為1。,Range 0 to 1(極差

45、正規(guī)化變換 / 規(guī)格化變換),作用:變換后的數(shù)據(jù)最小為0,最大為1,其余在區(qū)間[0,1]內(nèi),極差為1,無量綱。,Mean of 1,作用:變換后的數(shù)據(jù)均值為1。,Standard deviation of 1,作用:變換后的數(shù)據(jù)標(biāo)準(zhǔn)差為1。,在SPSS中如何選擇測度:→Analyze →Classify →Hierachical Cluster Analysis →Method 然后從對話框中進(jìn)行如下選擇,2、構(gòu)造關(guān)系矩陣,描述

46、變量或樣本的親疏程度的數(shù)量指標(biāo)有兩種:相關(guān)系數(shù)距離,從Measure框中點(diǎn)擊Interval項(xiàng)的向下箭頭,將出現(xiàn)如左可選項(xiàng),從中選一即可。,,常用測度(選項(xiàng)說明):,Euclidean distance:歐氏距離(二階Minkowski距離),用途:聚類分析中用得最廣泛的距離但與各變量的量綱有關(guān),未考慮指標(biāo)間的相關(guān)性,也未考慮各變量方差的不同,Squared Euclidean distance:平方歐氏距離,用途:聚類分

47、析中用得最廣泛的距離,Cosine:夾角余弦(相似性測度),用途:計(jì)算兩個(gè)向量在原點(diǎn)處的夾角余弦。當(dāng)兩夾角為0o時(shí),取值為1,說明極相似;當(dāng)夾角為90o時(shí),取值為0,說明兩者不相關(guān)。取值范圍:0~1,Pearson correlation:皮爾遜相關(guān)系數(shù),用途:計(jì)算兩個(gè)向量的皮爾遜相關(guān)系數(shù),Chebychev:切比雪夫距離,用途:計(jì)算兩個(gè)向量的切比雪夫距離,Block:絕對值距離(一階Minkowski度量)(又稱Manh

48、attan度量或網(wǎng)格度量),用途:計(jì)算兩個(gè)向量的絕對值距離,Minkowski:明科夫斯基距離,用途:計(jì)算兩個(gè)向量的明科夫斯基距離,Customized:自定義距離,用途:計(jì)算兩個(gè)向量的自定義距離,SPSS中如何選擇系統(tǒng)聚類方法,從Cluster Method框中點(diǎn)擊向下箭頭,將出現(xiàn)如左可選項(xiàng),從中選一即可。,Between-groups linkage 組間平均距離連接法,特點(diǎn):非最大距離,也非最小距離,方法簡述:合并兩類的結(jié)果使所有

49、的兩兩項(xiàng)對之間的平均距離最小。(項(xiàng)對的兩成員分屬不同類),Within-groups linkage 組內(nèi)平均連接法,方法簡述:兩類合并為一類后,合并后的類中所有項(xiàng)之間的平均距離最小,常用系統(tǒng)聚類方法介紹,Nearest neighbor 最近鄰法(最短距離法),特點(diǎn):樣品有鏈接聚合的趨勢,這是其缺點(diǎn),不適合一般數(shù)據(jù)的分類處理,除去特殊數(shù)據(jù)外,不提倡用這種方法。,方法簡述:首先合并最近或最相似的兩項(xiàng),Furthest neighbor

50、最遠(yuǎn)鄰法(最長距離法),方法簡述:用兩類之間最遠(yuǎn)點(diǎn)的距離代表兩類之間的距離,也稱之為完全連接法,Centroid clustering 重心聚類法,特點(diǎn):該距離隨聚類地進(jìn)行不斷縮小。該法的譜系樹狀圖很難跟蹤,且符號改變頻繁,計(jì)算較煩。,方法簡述:兩類間的距離定義為兩類重心之間的距離,對樣品分類而言,每一類中心就是屬于該類樣品的均值,Median clustering 中位數(shù)法,特點(diǎn):圖形將出現(xiàn)遞轉(zhuǎn),譜系樹狀圖很難跟蹤,因而這個(gè)方法幾乎不

51、被人們采用。,方法簡述:兩類間的距離既不采用兩類間的最近距離,也不采用最遠(yuǎn)距離,而采用介于兩者間的距離,Ward’s method 離差平方和法,特點(diǎn):實(shí)際應(yīng)用中分類效果較好,應(yīng)用較廣;要求樣品間的距離必須是歐氏距離。,方法簡述:基于方差分析思想,如果分類合理,則同類樣品間離差平方和應(yīng)當(dāng)較小,類與類間離差平方和應(yīng)當(dāng)較大,,生成樹形圖,,生成冰柱圖,,,,凝聚狀態(tài)表,顯示聚類過程,,各項(xiàng)間的距離矩陣,,類成員欄,“Hierarchical

52、 Cluster Analysis:Plots”,“Hierarchical Cluster Analysis:Statistics”對話框(一),由于本例中選中的選項(xiàng)較多,這里按照各個(gè)結(jié)果分別解釋。 (1)首先是層次聚類分析的概要結(jié)果,該結(jié)果是SPSS輸出結(jié)果文件中的第一個(gè)表格,如下表所示。,結(jié)果和討論,(2)輸出的結(jié)果文件中第二個(gè)表格如下表所示。,歐氏距離,(3)輸出的結(jié)果文件中第三個(gè)表格為層次聚類分析的凝聚狀態(tài)表,包括:,

53、(4)輸出的結(jié)果文件中第四個(gè)表格如下表所示。,(5)輸出的結(jié)果文件中第五個(gè)表格如下表所示。,反映樣品聚類的情況圖,(6)輸出的結(jié)果文件中第六部分如圖所示。,樹形圖,(7)由于對“Hierarchical Cluster Analysis: Save New Var”對話框進(jìn)行了設(shè)置,將聚類成三類時(shí),各個(gè)樣本的類歸屬情況保存為一個(gè)變量,因此在SPSS數(shù)據(jù)編輯窗口中就新增了一個(gè)變量的值,如圖所示。,,前面講述了不同種聚類分析的方法,不論是哪

54、種方法,聚類分析都是直接比較各事物之間的性質(zhì),將性質(zhì)相近的歸為一類,將性質(zhì)差別較大的歸入不同的類。,六、判 別 分 析,判別分析,也是一種比較常用的分類分析方法。,定義:判別分析先根據(jù)已知類別的事物的性質(zhì)(自變量),建立函數(shù)式(自變量的線性組合,即判別函數(shù)),然后對未知類別的新事物進(jìn)行判斷以將之歸入已知的類別中。,統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式,? 研究問題 調(diào)查了15個(gè)公司的組織文化、領(lǐng)導(dǎo)角色和員工發(fā)展3個(gè)方面內(nèi)容作為預(yù)測變量,因

55、變量為公司對員工的吸引力。為符合研究問題,將公司對員工的吸引力根據(jù)被測的實(shí)際填答情形,劃分為高吸引力組(group=1)、中吸引力組(group=2)和低吸引力組(group=3)。,表 不同類的不同公司特點(diǎn),數(shù)據(jù)如表所示。,判別分析有如下的假定:? 預(yù)測變量服從正態(tài)分布。? 預(yù)測變量之間沒有顯著的相關(guān)。? 預(yù)測變量的平均值和方差不相關(guān)。? 預(yù)測變量應(yīng)是連續(xù)變量,因變量(類別或組別)是間斷變量。? 兩個(gè)預(yù)測變量之間

56、的相關(guān)性在不同類中是一樣的。,在分析的各個(gè)階段應(yīng)把握如下的原則:? 事前組別(類)的分類標(biāo)準(zhǔn)(作為判別分析的因變量)要盡可能準(zhǔn)確和可靠,否則會影響判別函數(shù)的準(zhǔn)確性,從而影響判別分析的效果。? 所分析的自變量應(yīng)是因變量的重要影響因素,應(yīng)該挑選既有重要特性又有區(qū)別能力的變量,達(dá)到以最少變量而有高辨別能力的目標(biāo)。? 初始分析的數(shù)目不能太少。,這些判別函數(shù)是各個(gè)獨(dú)立預(yù)測變量的線性組合。程序自動選擇第一個(gè)判別函數(shù),以盡可能多地區(qū)別各

57、個(gè)類,然后再選擇和第一個(gè)判別函數(shù)獨(dú)立的第二個(gè)判別函數(shù),盡可能多地提供判別能力。程序?qū)凑者@種方式,提供剩下的判別函數(shù)。判別函數(shù)的個(gè)數(shù)為k。,,判別分析的示意圖,? 研究問題 調(diào)查了15個(gè)公司的組織文化、領(lǐng)導(dǎo)角色和員工發(fā)展3個(gè)方面內(nèi)容作為預(yù)測變量,因變量為公司對員工的吸引力。為符合研究問題,將公司對員工的吸引力根據(jù)被測的實(shí)際填答情形,劃分為高吸引力組(group=1)、中吸引力組(group=2)和低吸引力組(group=3

58、)。,SPSS中實(shí)現(xiàn)過程,表 不同類的不同公司特點(diǎn),數(shù)據(jù)如表所示。,? 實(shí)現(xiàn)步驟,圖 在菜單中選擇“Discriminant”命令,,指定判別分析的自變量,,,在"Minimum:"后面的矩形框中輸入該分類變量的最小值;在"Maximurn:"后面的矩形框中輸入該分類變量的最大值。,選擇分類變量及其范圍,選擇判別分析方法,在主對話框中,自變量列表框下側(cè)顯示兩個(gè)單選框,用于指定選擇判別分析的方法

59、。,,選擇判別分析方法,Enter independents together 默認(rèn)選項(xiàng)。 當(dāng)認(rèn)為所有自變量都能對觀測特性提供豐富的信息時(shí),使用該選項(xiàng),選擇該項(xiàng)將不加選擇地使用所有自變量進(jìn)行判別分析,建立全模型,且不需要進(jìn)一步選擇。,Use stepwise method 逐步分析方法。 當(dāng)認(rèn)為不是所有自變量都能對觀測量特性提供豐的信息時(shí),選擇該項(xiàng),因此需要判別貢獻(xiàn)的大小再進(jìn)行選擇。選中該單選按鈕時(shí),“Method”按鈕被

60、激活,可以進(jìn)一步選擇判別分析方法。,“Method”按鈕,選擇判別分析方法在Method組的矩形框中進(jìn)行??晒┻x擇的判別分析方法有:  ●Wilks‘lambda 使Wilk的統(tǒng)計(jì)量最小化法?!  馯nexplained variance。使各類不可解釋的方差和最小化法?!  馦ahalanobis’distance。使最近兩類間的 Mahalanobis距離最大化法?!  馭mallest F ratio。使任何兩類間的最小的

61、F值最大化法?!  馬ao‘s V。使 RaoV統(tǒng)計(jì)量最大化??梢詫σ粋€(gè)要加入到模型中的變量的V值指定一個(gè)最小增量。選擇此種方法后,應(yīng)該在該項(xiàng)下面的"V-to-enter'"后的矩形框中輸這個(gè)增量的指定值。,選擇逐步判別停止的判據(jù)在criteria組的矩形框中進(jìn)行??晒┻x擇的判據(jù)有:Use F value:使用F值,是系統(tǒng)默認(rèn)的判據(jù),默認(rèn)值是:Entry:3.84;removal:2.71。即當(dāng)被加入的

62、變量F值>=3.84時(shí)才把該變量加入到模型中,否則變量不能進(jìn)入模型;或者,當(dāng)要從模型中移出的變量F值<=2.71時(shí),該變量才被移出模型,否則模型中的變量不會被移出。應(yīng)該使Entry值(加入變量的F值)>removal值(移出變量的F值)Use probability of F:使用F值的概率。加入變量的F值概率的默認(rèn)值是0.05(5%);移出變量的q值概率是0.10(10%)。removal值(移出變量的正值概率)>Entry值(

63、加入變量的F值概率)。,,顯示內(nèi)容的選擇,對于逐步選擇變量的過程和最后結(jié)果的顯示可以通過Method對話框最下面的“Display”矩形框中的兩項(xiàng)進(jìn)行選擇:   Summary of step要求在逐步選擇變量過程中的每一步之后顯示每個(gè)變量的統(tǒng)計(jì)量。 F for pairwise distances要求顯示兩兩類之間的兩兩F值矩陣。,,Statistics選項(xiàng),在主對話框中單擊“statistics”按鈕,打開“Discrim

64、inant Anlysis:statistics”(判別分析:統(tǒng)計(jì)量)對話框,如圖所示。,“Discriminant Anlysis:statistics” 對話框,在“descriptive”(描述性)選項(xiàng)組中選擇對原始數(shù)據(jù)的描述統(tǒng)計(jì)量的輸出。Means 均值。選擇該項(xiàng),可以輸出各類中各自變量的均值、標(biāo)準(zhǔn)差以及各自變量總樣本的均值和標(biāo)準(zhǔn)差。Univariate ANOVAs 單變量方差分析。選擇該項(xiàng),表示對每一類同一自變量均值都相

65、等的假設(shè)進(jìn)行檢驗(yàn),輸出單變量的方差分析結(jié)果。Box’s M 選擇該項(xiàng),表示對各類的協(xié)方差矩陣相等的假設(shè)進(jìn)行檢驗(yàn)。,,“Function Coefficients”(判別分析的系數(shù))選項(xiàng)組中給出選擇判別函數(shù)系數(shù)的輸出形式的選項(xiàng),有兩個(gè)復(fù)選項(xiàng):Fisher’s 選擇該項(xiàng),表示可以用于對新樣本進(jìn)行判別分類的fisher系數(shù),對每一類給出一組系數(shù),并給出該組中判別分?jǐn)?shù)最大的觀測量。Unstandardized 選擇該項(xiàng),表示未經(jīng)標(biāo)

66、準(zhǔn)化處理的判別系數(shù)。,,在“matrices”(矩陣)選項(xiàng)組中選擇自變量的系數(shù)矩陣,有4個(gè)復(fù)選項(xiàng):Within-group correlation類內(nèi)相關(guān)矩陣。它計(jì)算相關(guān)矩陣之前將各組協(xié)方差矩陣平均后,計(jì)算類內(nèi)相關(guān)矩陣。Within-group covariance合并類內(nèi)協(xié)方差矩陣,是將各組(類)協(xié)方差矩陣平均后計(jì)算的,區(qū)別與總協(xié)方差矩陣。Separate-groups covariance 協(xié)方差矩陣。Total covar

67、iance 總樣本的協(xié)方差矩陣。,,Classification 選項(xiàng),在主對話框中單擊“classify”按鈕,顯示“Discriminant Analysis:Classification”(判別分析:分類)子對話框,如圖所示。,“Discriminant Analysis:Classification” 對話框,在“prior probabilities”選項(xiàng)組中選擇先驗(yàn)概率,有兩個(gè)單選項(xiàng)供選擇:All groups equal

68、 表示各類先驗(yàn)概率相等。Compute from groups sizes 表示由各類的樣本量計(jì)算決定,即各類的先驗(yàn)概率與其樣本量成正比。,,在“use covariance matrix”(利用協(xié)方差矩陣)選項(xiàng)組中選擇分類使用的協(xié)方差矩陣,有兩個(gè)單選項(xiàng):Within-groups選擇該項(xiàng),表示指定使用合并組內(nèi)協(xié)方差矩陣進(jìn)行分類。Separate-groups選擇該項(xiàng),表示指定使用各組協(xié)方差矩陣進(jìn)行分類,由于分類是根據(jù)判別函數(shù)而不

69、是根據(jù)原始變量,因此該選擇項(xiàng)不是總等價(jià)于二次判別。,,在“plots”選項(xiàng)組中選擇要求輸入的統(tǒng)計(jì)圖形,給出3個(gè)復(fù)選項(xiàng):Combined-groups選擇該項(xiàng),生成一張包括各類的散點(diǎn)圖,該散點(diǎn)圖是根據(jù)前兩個(gè)判別函數(shù)值做的散點(diǎn)圖;如果只有一個(gè)判別函數(shù),就輸出直方圖。Separate-groups選擇該項(xiàng),根據(jù)前兩個(gè)判別函數(shù)值對每一類生成一張散點(diǎn)圖,共分為幾類就生成幾張散點(diǎn)圖;如果只有一個(gè)判別函數(shù)就生成一張直方圖。Territorial

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論