版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第一章多元正態(tài)分布1.在數(shù)據(jù)處理時(shí),為什么通常要進(jìn)行標(biāo)準(zhǔn)化處理?數(shù)據(jù)的標(biāo)準(zhǔn)化(nmalization)是將數(shù)據(jù)按比例縮放,使之落入一個(gè)小的特定區(qū)間。在某些比較和評(píng)價(jià)的指標(biāo)處理中經(jīng)常會(huì)用到,去除數(shù)據(jù)的單位限制,將其轉(zhuǎn)化為無(wú)量綱的純數(shù)值,便于不同單位或量級(jí)的指標(biāo)能夠進(jìn)行比較和加權(quán)。其中最典型的就是01標(biāo)準(zhǔn)化和Z標(biāo)準(zhǔn)化。(1)01標(biāo)準(zhǔn)化(01nmalization)也叫離差標(biāo)準(zhǔn)化,是對(duì)原始數(shù)據(jù)的線(xiàn)性變換,使結(jié)果落到[01]區(qū)間,轉(zhuǎn)換函數(shù)如下:
2、其中max為樣本數(shù)據(jù)的最大值,min為樣本數(shù)據(jù)的最小值。這種方法有一個(gè)缺陷就是當(dāng)有新數(shù)據(jù)加入時(shí),可能導(dǎo)致max和min的變化,需要重新定義。(2)Zsce標(biāo)準(zhǔn)化(zeromeannmalization)也叫標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化,經(jīng)過(guò)處理的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,即均值為0,標(biāo)準(zhǔn)差為1,也是SPSS中最為常用的標(biāo)準(zhǔn)化方法,其轉(zhuǎn)化函數(shù)為:其中μ為所有樣本數(shù)據(jù)的均值,σ為所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差。2、歐氏距離與馬氏距離的優(yōu)缺點(diǎn)是什么?歐氏距離(Euclid
3、eandistance)也稱(chēng)歐幾里得度量、歐幾里得度量,是一個(gè)通常采用的距離定義,它是在m維空間中兩個(gè)點(diǎn)之間的真實(shí)距離。在二維和三維空間中的歐氏距離的就是兩點(diǎn)之間的距離。缺點(diǎn):就大部分統(tǒng)計(jì)問(wèn)題而言,歐氏距離是不能令人滿(mǎn)意的。(每個(gè)坐標(biāo)對(duì)歐氏距離的貢獻(xiàn)是同等的。當(dāng)坐標(biāo)表示測(cè)量值時(shí),它們往往帶有大小不等的隨機(jī)波動(dòng),在這種情況下,合理的方法是對(duì)坐標(biāo)加權(quán),使變化較大的坐標(biāo)比變化較小的坐標(biāo)有較小的權(quán)系數(shù),這就產(chǎn)生了各種距離。當(dāng)各個(gè)分量為不同性質(zhì)的
4、量時(shí),“距離”的大小與指標(biāo)的單位有關(guān)。它將樣品的不同屬性(即各指標(biāo)或各變量)之間的差別等同看待,這一點(diǎn)有時(shí)不能滿(mǎn)足實(shí)際要求。沒(méi)有考慮到總體變異對(duì)距離遠(yuǎn)近的影響。馬氏距離(Mahalanobisdistance)是由印度統(tǒng)計(jì)學(xué)家馬哈拉諾比斯提出的,表示數(shù)據(jù)的協(xié)方差距離。為兩個(gè)服從同一分布并且其協(xié)方差矩陣為Σ的隨機(jī)變量與的差異程度:如果協(xié)方差矩陣為單位矩陣那么馬氏距離就簡(jiǎn)化為歐氏距離如果協(xié)方差矩陣為對(duì)角陣則其也可稱(chēng)為正規(guī)化的歐氏距離。它是一
5、種有效的計(jì)算兩個(gè)未知樣本集的相似度的方法。對(duì)于一個(gè)均值為μ,協(xié)方差矩陣為Σ的多變量向量,樣本與總體的馬氏距離為(dm)^2=(xμ)Σ^(1)(xμ)。在絕大多數(shù)情況下,馬氏距離是可以順利計(jì)算的,但是馬氏距離的計(jì)算是不穩(wěn)定的,不穩(wěn)定的來(lái)源是協(xié)方差矩陣,這也是馬氏距離與歐式距離的最大差異之處。優(yōu)點(diǎn):它不受量綱的影響,兩點(diǎn)之間的馬氏距離與原始數(shù)據(jù)的測(cè)量單位無(wú)關(guān)。人均消費(fèi)(元)331693.531105.464125364.321213.63
6、43130.038人口增長(zhǎng)(%)599.7846.625213.6346.09925.410文盲半文盲(%)6356.32543.6973130.03825.410196.884協(xié)方差的逆矩陣1.88034E050.0004403686.09781E050.002799210.0006258930.000440370.2070239490.0002103740.02370440.060449816.0978E050.0002103740
7、.000227330.01050190.0030474740.0027992080.0237043520.0105018810.852889270.181399810.000625890.060449810.0030474740.18139980.070148804計(jì)算:邊遠(yuǎn)及少數(shù)民族聚居區(qū)社會(huì)經(jīng)濟(jì)發(fā)展水平的指標(biāo)數(shù)據(jù).xls=9(2003.232.251006.112.7112.01)s^1(2003.232.252T1006.112.
8、7112.01)’=950.11793817=45106144353F統(tǒng)計(jì)量=45.26.2拒絕零假設(shè),邊緣及少數(shù)民族聚居區(qū)的社會(huì)經(jīng)濟(jì)發(fā)展水平與全國(guó)平均水平有顯著差異。第三章聚類(lèi)分析1.聚類(lèi)分析的基本思想和功能是什么?研究的樣品或指標(biāo)之間存著程度不同的相似性,于是根據(jù)一批樣品的多個(gè)觀測(cè)指標(biāo),具體找出一些能夠度量樣品或指標(biāo)之間的相似程度的統(tǒng)計(jì)量,以這些統(tǒng)計(jì)量作為劃分類(lèi)型的依據(jù),把一些相似程度較大的樣品聚合為一類(lèi),把另外一些彼此之間相似程度
9、較大的樣品又聚合為另外一類(lèi),直到把所有的樣品聚合完畢,形成一個(gè)有小到大的分類(lèi)系統(tǒng),最后再把整個(gè)分類(lèi)系統(tǒng)畫(huà)成一張分群圖,用它把所有樣品間的親疏關(guān)系表示出來(lái)。作用是把相似的研究對(duì)象歸類(lèi)。2.試述系統(tǒng)聚類(lèi)法的原理和具體步驟。首先將n個(gè)樣品看成n類(lèi)(一類(lèi)包含一個(gè)樣品)然后將性質(zhì)最接近的兩類(lèi)合并成一個(gè)新類(lèi),得到n1類(lèi),再?gòu)闹姓页鲎罱咏膬深?lèi)加以合并變成n2類(lèi),如此下去,最后所有的樣品均在一類(lèi),將上述并類(lèi)過(guò)程畫(huà)成一張圖便可決定分多少類(lèi),每類(lèi)各有哪些
10、樣品。3.試述K均值聚類(lèi)的方法原理K均值法是一種非譜系聚類(lèi)法,把每個(gè)樣品聚集到其最近形心(均值)類(lèi)中,它是把樣品聚集成K個(gè)類(lèi)的集合,類(lèi)的個(gè)數(shù)k可以預(yù)先給定或者在聚類(lèi)過(guò)程中確定,該方法應(yīng)用于比系統(tǒng)聚類(lèi)法大得多的數(shù)據(jù)組。把樣品分為K個(gè)初始類(lèi),進(jìn)行修改,逐個(gè)分派樣品到期最近均值的類(lèi)中(通常采用標(biāo)準(zhǔn)化數(shù)據(jù)或非標(biāo)準(zhǔn)化數(shù)據(jù)計(jì)算歐氏距離)重新計(jì)算接受新樣品的類(lèi)和失去樣品的類(lèi)的形心。重復(fù)這一步直到各類(lèi)無(wú)元素進(jìn)出。第四章判別分析1.應(yīng)用判別分析應(yīng)該具備什
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 何曉群版多元統(tǒng)計(jì)分析數(shù)據(jù)
- blackmail課后作業(yè)答案
- 工廠供電課后作業(yè)答案
- 美術(shù)鑒賞課后作業(yè)答案
- 創(chuàng)新學(xué)課后作業(yè)答案
- 《勸學(xué)》課后作業(yè)含答案
- 李春喜《生物統(tǒng)計(jì)學(xué)》第三版課后作業(yè)答案
- 管理會(huì)計(jì)課后作業(yè)答案
- 美學(xué)原理課后作業(yè)和答案
- 大趨勢(shì)作業(yè)答案章節(jié)測(cè)試答案課后作業(yè)
- 應(yīng)用回歸分析第四版課后習(xí)題答案全何曉群劉文卿
- 李春喜《生物統(tǒng)計(jì)學(xué)》第三版--課后作業(yè)答案
- 先秦君子風(fēng)范課后作業(yè)答案
- 傳熱學(xué)課后作業(yè)答案
- 土力學(xué)原理課后作業(yè)答案
- 軟件需求工程課后作業(yè)答案
- 綠色康復(fù)課后作業(yè)答案
- 《鄉(xiāng)愁》隨堂課后作業(yè)含答案
- 液氣壓傳動(dòng)課后作業(yè)答案
- 課后作業(yè)18
評(píng)論
0/150
提交評(píng)論