畢業(yè)論文(設(shè)計(jì))聚類分析在證券市場(chǎng)分析中的應(yīng)用_第1頁
已閱讀1頁,還剩41頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p><b>  山東交通學(xué)院</b></p><p>  畢業(yè)生畢業(yè)論文(設(shè)計(jì))</p><p>  題目:聚類分析在證券市場(chǎng)分析中的應(yīng)用</p><p><b>  摘 要</b></p><p>  本文隨機(jī)選取了40家在滬深上市的山東省的公司企業(yè),選擇每股收益、每股凈資產(chǎn)、主營(yíng)收

2、入增長(zhǎng)率、主營(yíng)利潤(rùn)增長(zhǎng)率和凈資產(chǎn)收益率5項(xiàng)指標(biāo)評(píng)價(jià)體系。通過系統(tǒng)聚類分析方法對(duì)這40家公司企業(yè)的股票進(jìn)行聚類分析,以此對(duì)股票的收益性、成長(zhǎng)性等方面進(jìn)行分析,幫助投資者準(zhǔn)確地把握股票的總體特性以及預(yù)測(cè)股票的成長(zhǎng)能力,使投資者及時(shí)做出最佳的投資決策,進(jìn)而獲得可觀的投資回報(bào)。最后在聚類分析的基礎(chǔ)上,對(duì)聚類分析結(jié)果采用方法進(jìn)行檢驗(yàn),以此來進(jìn)一步驗(yàn)證分析結(jié)果的可靠性和可信性。此研究表明聚類分析方法在證券市場(chǎng)投資分析中具有有效性和實(shí)用性。</

3、p><p>  關(guān)鍵詞:聚類分析,證券市場(chǎng)投資,方法,投資回報(bào)</p><p><b>  Abstract</b></p><p>  In this paper, we randomly selected 40 companies in Shandong province which were listed in Shanghai and Sh

4、enzhen stock market, and we choice the five indicators evaluation system that are the earnings of per share, the net assets of per share, the growth rate of the main business revenue, the growth rate of the main business

5、 profit and the yield of the net assets. In order to help investors to accurately grasp the overall features of the stock and the growth ability of the stock, we effectively </p><p>  Key words: Clustering a

6、nalysis, Stock market investment, Means method, Return on investment </p><p><b>  目 錄</b></p><p><b>  1.緒論1</b></p><p>  1.1論文研究的背景及意義1</p><p>

7、;  1.2 聚類分析在證券市場(chǎng)分析中的應(yīng)用價(jià)值2</p><p>  1.3 聚類分析在證券市場(chǎng)分析中應(yīng)用的優(yōu)點(diǎn)2</p><p>  1.4 聚類分析在證券市場(chǎng)分析中應(yīng)用的當(dāng)前狀況2</p><p>  1.5本文的研究?jī)?nèi)容及內(nèi)容結(jié)構(gòu)3</p><p>  1.5.1 研究?jī)?nèi)容3</p><p>  1

8、.5.2 內(nèi)容結(jié)構(gòu)3</p><p><b>  2.聚類分析4</b></p><p>  2.1聚類分析的基本思想4</p><p>  2.2聚類分析的方法4</p><p>  2.3系統(tǒng)聚類法的基本思想和基本步驟5</p><p>  2.3.1樣本間距離的度量6</

9、p><p>  2.3.2類間距離的度量8</p><p>  2.4 系統(tǒng)聚類分析方法的比較9</p><p>  2.5系統(tǒng)聚類法中類個(gè)數(shù)的確定問題10</p><p>  3.聚類分析在證券市場(chǎng)分析中的應(yīng)用12</p><p>  3.1 聚類分析在證券市場(chǎng)分析中應(yīng)用時(shí)的指標(biāo)評(píng)價(jià)體系的選擇12</p&

10、gt;<p>  3.1.1盈利能力指標(biāo)12</p><p>  3.1.2成長(zhǎng)能力指標(biāo)12</p><p>  3.1.3擴(kuò)張能力指標(biāo)13</p><p>  3.2實(shí)證研究14</p><p>  3.2.1原始樣本數(shù)據(jù)標(biāo)準(zhǔn)化15</p><p>  3.2.2用軟件對(duì)樣本公司股票進(jìn)行聚類分

11、析17</p><p>  3.2.3分類個(gè)數(shù)的確定22</p><p>  3.2.4聚類結(jié)果24</p><p>  3.2.5對(duì)聚類結(jié)果進(jìn)行檢驗(yàn)25</p><p>  3.2.6結(jié)果分析26</p><p>  4.總結(jié)和展望29</p><p><b>  總結(jié)

12、30</b></p><p><b>  1.緒論</b></p><p>  1.1論文研究的背景及意義</p><p>  改革開放以來,隨著我國(guó)市場(chǎng)經(jīng)濟(jì)的迅速、健康發(fā)展,國(guó)民的金融意識(shí)和投資意愿日益增強(qiáng),而作為市場(chǎng)經(jīng)濟(jì)的重要組成部分——證券市場(chǎng),正漸漸地走向成熟,越來越多的投資者把目光投向了股票,歷史已經(jīng)證明,股票不僅在過去是

13、一種已經(jīng)給投資者提供了可觀的長(zhǎng)期收益,并且在將來也會(huì)是提供良好機(jī)遇的投資媒介。一直在賓夕法尼亞大學(xué)沃頓商學(xué)院擔(dān)任金融學(xué)教授的杰里米西格爾,他在其名著《長(zhǎng)期股票投資》中就曾經(jīng)說到:“盡管未來回報(bào)率可能比過去低,但是仍然存在強(qiáng)有力的證據(jù)讓我們相信,對(duì)于所有追求經(jīng)濟(jì)平穩(wěn)和長(zhǎng)期收益的投資者而言,股票還是最好的投資方式。”然而,正如日常生活中那樣,股市變幻莫測(cè)、股價(jià)漲跌無常,投資者要想在股市投資中贏取可觀的投資回報(bào),就需要認(rèn)真研究上市公司的業(yè)績(jī)和

14、發(fā)展前景,找出真正具有投資價(jià)值的股票,從而作出投資決策,進(jìn)而進(jìn)行投資。</p><p>  俗話說:“物以類聚,人以群分”,在自然科學(xué)和社會(huì)科學(xué)中,存在著形形色色的分類問題。所謂的類,通俗地講,就是指由相似元素組成的集合。聚類分析,它是研究(樣品或指標(biāo))分類問題的一種統(tǒng)計(jì)分析方法。聚類分析起源于分類學(xué),在古老的分類學(xué)中,人們主要依靠經(jīng)驗(yàn)和專業(yè)知識(shí)來實(shí)現(xiàn)分類,很少利用數(shù)學(xué)工具進(jìn)行定量的分類。隨著人類科學(xué)技術(shù)的發(fā)展,

15、對(duì)分類的要求也越來越高,以致有時(shí)僅憑經(jīng)驗(yàn)和專業(yè)知識(shí)難以確切地進(jìn)行分類,于是人們逐漸地把數(shù)學(xué)工具引用到了分類學(xué)中,形成了數(shù)值分類學(xué),之后又將多元分析的技術(shù)引入到數(shù)值分類學(xué)中形成了聚類分析。聚類分析的比較典型應(yīng)用是在商務(wù)上,聚類能幫助市場(chǎng)分析人員從客戶基本庫中發(fā)現(xiàn)不同的客戶群體,并且用相應(yīng)適當(dāng)?shù)哪J絹砜坍嫴煌蛻羧旱奶卣?。比如,在?jīng)濟(jì)學(xué)中,為了了解不同地區(qū)城鎮(zhèn)居民的收入及消費(fèi)情況,往往需要?jiǎng)澐譃椴煌念愋停辉谏飳W(xué)中,聚類分析能用于推導(dǎo)植物

16、和動(dòng)物的分類,對(duì)基因進(jìn)行分類,從而獲得對(duì)種群中固有結(jié)構(gòu)的認(rèn)識(shí);在產(chǎn)品質(zhì)量管理中,聚類分析可以根據(jù)各產(chǎn)品的某些重要指標(biāo)而將其分為一等品、二等品等。又如,在Web上的文檔中,聚類分析也能用于對(duì)Web上的文檔進(jìn)行分類,從而發(fā)現(xiàn)信息。聚類分析即</p><p>  1.2 聚類分析在證券市場(chǎng)分析中的應(yīng)用價(jià)值</p><p>  聚類分析建立在基礎(chǔ)分析之上,立足于對(duì)股票的基本層面進(jìn)行量化分析。鑒于基

17、礎(chǔ)分析對(duì)影響股票價(jià)格的諸多因素這一定性分析的不足,聚類分析則很好地彌補(bǔ)了這一缺陷。作為進(jìn)行長(zhǎng)期投資的理性投資者的參考依據(jù),其目的在于從股票基本層面決定的內(nèi)在價(jià)值中發(fā)現(xiàn)股票的真正投資價(jià)值。另外,在聚類分析模型的建立過程中,我們進(jìn)一步考慮了公司的成長(zhǎng)能力,它對(duì)股票的投資價(jià)值有著重要影響。成長(zhǎng)能力是一個(gè)不斷變化的趨勢(shì),因此我們選取了較能反映公司成長(zhǎng)能力的客觀指標(biāo),如主營(yíng)收入增長(zhǎng)率、主營(yíng)利潤(rùn)增長(zhǎng)率,以便更好地探究股票的成長(zhǎng)能力,進(jìn)而使投資者能夠

18、更好地、正確地預(yù)測(cè)股票的發(fā)展前景和發(fā)展?jié)摿Α?lt;/p><p>  1.3 聚類分析在證券市場(chǎng)分析中應(yīng)用的優(yōu)點(diǎn)</p><p>  與現(xiàn)代投資組合理論相比,聚類分析方法顯得更加直觀、實(shí)用,并且在應(yīng)用時(shí)所受的局限性小、操作性強(qiáng),具有一定的優(yōu)越性,適合于廣大投資者采用。聚類分析建立的是一種長(zhǎng)期投資理念,因此,在全球金融一體化、自由化浪潮下,并且在我國(guó)的證券市場(chǎng)逐步走向成熟的過程中,提倡運(yùn)用這種理

19、性的投資分析方法,理性的作出投資決策,這樣不但可以降低投資風(fēng)險(xiǎn)、規(guī)范投資行為,而且有利于促進(jìn)上市公司更好地參與市場(chǎng)競(jìng)爭(zhēng),促進(jìn)我國(guó)證券市場(chǎng)的穩(wěn)定、健康發(fā)展,從而建立一個(gè)良好的國(guó)內(nèi)金融市場(chǎng)秩序。</p><p>  另外,單純從聚類分析這一方法來講,聚類分析通過對(duì)樣品或指標(biāo)(變量)之間存在的相似程度進(jìn)行度量,將“相似”的歸并成類。體現(xiàn)出以下三大顯著的優(yōu)點(diǎn):(1)能綜合利用多個(gè)變量對(duì)樣本進(jìn)行分類;(2)分類結(jié)果更加直觀

20、,具體體現(xiàn)是聚類譜系圖,從聚類譜系圖中,我們可以很清楚地觀察其分類結(jié)果;(3)聚類分析所得到的結(jié)果比傳統(tǒng)分類方法更細(xì)致、全面、合理。這些優(yōu)點(diǎn)足以更加有利于我們將聚類分析方法應(yīng)用在證券市場(chǎng)分析中。</p><p>  1.4 聚類分析在證券市場(chǎng)分析中應(yīng)用的當(dāng)前狀況</p><p>  聚類分析是一種行之有效的指導(dǎo)證券投資的方法。聚類分析首先對(duì)各類股票的公司因素、收益性、成長(zhǎng)性、擴(kuò)張性等基本層

21、面進(jìn)行考察,然后再利用綜合指標(biāo)評(píng)價(jià)體系來衡量樣本股票的“相似程度”。利用聚類分析模型能夠幫助投資者準(zhǔn)確地了解和把握股票的總體特性,以便及時(shí)地作出投資決策,進(jìn)行投資。</p><p>  在證券投資方面,聚類分析還有很大的發(fā)掘空間和研究?jī)r(jià)值。目前,國(guó)內(nèi)頗具有代表性的研究大多僅僅局限于板塊分析,選用的指標(biāo)也僅僅反映了上市公司的盈利水平,尚不能全面反映股票的總體特性。在現(xiàn)有的研究基礎(chǔ)上,本文深入探討了聚類分析在證券投資

22、中的應(yīng)用價(jià)值,豐富和完善了在證券市場(chǎng)分析中應(yīng)用聚類分析時(shí)的指標(biāo)體系。</p><p>  1.5本文的研究?jī)?nèi)容及內(nèi)容結(jié)構(gòu)</p><p>  1.5.1 研究?jī)?nèi)容</p><p>  本文闡述了聚類分析的理論背景,主要研究了用系統(tǒng)聚類分析方法對(duì)樣本數(shù)據(jù)進(jìn)行分組,但是,我們并不知道樣本數(shù)據(jù)的分組是否合理,因此再利用方法對(duì)其進(jìn)行檢驗(yàn),從而使得聚類精度有所提高,進(jìn)而增加

23、分析結(jié)果的可靠性和可信性。</p><p>  1.5.2 內(nèi)容結(jié)構(gòu)</p><p>  本論文共分四章,具體的內(nèi)容結(jié)構(gòu)如下:</p><p>  第一章是緒論,介紹了論文研究的背景及意義。第二章詳細(xì)介紹了聚類分析的基礎(chǔ)理論,系統(tǒng)聚類法的基本思想、基本步驟、距離度量和類個(gè)數(shù)的確定問題。第三章給出了聚類分析方法在證券投資市場(chǎng)中的具體應(yīng)用,并采用方法對(duì)分析結(jié)果進(jìn)行檢驗(yàn)

24、,證明其有效性。第四章是對(duì)聚類分析方法在證券投資市場(chǎng)中的應(yīng)用進(jìn)行總結(jié)和展望。</p><p><b>  2.聚類分析</b></p><p>  聚類分析是把數(shù)據(jù)集分解或劃分成多個(gè)類或組,使同一組中的數(shù)據(jù)比較相似,不同組的數(shù)據(jù)差別較大。通過聚類,可以識(shí)別數(shù)據(jù)之間的相似程度,從而發(fā)現(xiàn)數(shù)據(jù)集的分布模式和數(shù)據(jù)的屬性之間的相互關(guān)系。</p><p>

25、  2.1聚類分析的基本思想</p><p>  聚類分析的基本思想是認(rèn)為研究的數(shù)據(jù)集中的數(shù)據(jù)之間存在不同程度的相似性,根據(jù)數(shù)據(jù)的幾個(gè)屬性,找到能夠度量它們之間相似程度的量,把一些相似程度較大量的歸為一類,另一些相似程度較大的量歸為另一類,即同一組內(nèi)的數(shù)據(jù)對(duì)象之間具有較高的相似程度,而不同組中的數(shù)據(jù)對(duì)象之間是不相似的。而對(duì)這種數(shù)據(jù)對(duì)象之間的相似或不相似程度的描述又是由數(shù)據(jù)屬性的取值來確定的,通常就是利用各數(shù)據(jù)對(duì)象

26、之間的距離來表示的。</p><p>  2.2聚類分析的方法</p><p>  聚類分析的內(nèi)容非常豐富,從其聚類的方法來看,可分為以下幾類:</p><p>  譜系聚類法:譜系聚類法又稱系統(tǒng)聚類法,它是在給出樣品間的距離和類與類間的距離定義的基礎(chǔ)上,先將每個(gè)樣品各自當(dāng)作一類,計(jì)算出各類(即各樣品)之間的距離,再將最近的兩類合并聚為小類,將已聚合的小類按其相似程

27、度(用類間距度量)再聚合,,依此類推,每次減少一類,隨著相似程度的減弱,直到最后將全部樣品合成一類,并類的全部過程可以用聚類譜系圖來描述。</p><p>  快速聚類法:快速聚類法又稱動(dòng)態(tài)聚類法,它的基本思想是,先確定若干個(gè)中心,然后將樣本逐個(gè)輸入,看看樣品能否歸屬哪類,如果可以歸屬已有的某個(gè)類,則歸之,且對(duì)該中心稍作調(diào)整;否則可以建立新類,并調(diào)整原有的歸屬及重新計(jì)算新的各類的中心;如此繼續(xù)下去,,直到每個(gè)樣品

28、皆有歸屬為止。這種方法可以大大地提高計(jì)算速度,但由于初始中心的個(gè)數(shù)及位置的選取、樣品輸入的順序都可能對(duì)最后結(jié)果產(chǎn)生某些影響,所以在實(shí)際運(yùn)用時(shí)要慎重。</p><p>  最優(yōu)分割法:最優(yōu)分割法又稱有序樣品聚類法,它是先將全部樣品當(dāng)成一類,然后根據(jù)某種最優(yōu)準(zhǔn)則適當(dāng)?shù)貙⑵浞指顬閮深?,再分為三類,,直到最后將樣品分割為所需的類為止?lt;/p><p>  模糊聚類法:模糊聚類法是利用模糊集理論來處

29、理分類問題,它對(duì)經(jīng)濟(jì)領(lǐng)域中具有模糊特征的兩態(tài)數(shù)據(jù)或多態(tài)數(shù)據(jù)具有明顯的分類效果。</p><p>  圖論聚類法:圖論聚類法是利用圖論中最小支撐樹的概念來處理分類問題,由此也創(chuàng)造了頗具風(fēng)格的一種方法。</p><p>  聚類預(yù)報(bào)法:聚類預(yù)報(bào)法是利用聚類方法來處理預(yù)報(bào)問題。我們知道,在多元統(tǒng)計(jì)分析中,如回歸分析和判別分析都可以用來作為預(yù)報(bào)的方法,但是對(duì)于那些存在異常數(shù)據(jù),例如在災(zāi)害性氣候的氣

30、象預(yù)報(bào)中,此時(shí)若還利用回歸分析或判別分析的方法來處理,其效果都不好,而聚類預(yù)報(bào)彌補(bǔ)了這一不足缺陷。</p><p>  另外,聚類分析根據(jù)分類對(duì)象的不同,分為型和型兩大類:</p><p>  型聚類分析是對(duì)變量(或指標(biāo))進(jìn)行分類處理,其作用在于:</p><p>  可以了解變量間及變量組合間的親疏關(guān)系;</p><p>  可以根據(jù)變量的

31、聚類結(jié)果及它們之間的關(guān)系,選擇主要變量進(jìn)行回歸分析或Q型聚類分析等。</p><p>  型聚類分析是對(duì)樣本進(jìn)行分類處理,其作用在于:</p><p>  能利用多個(gè)變量對(duì)樣本進(jìn)行分類;</p><p>  分類結(jié)果直觀,聚類譜系圖能明確、清楚地表達(dá)其分類結(jié)果;</p><p>  所得的結(jié)果比傳統(tǒng)的分類方法更細(xì)致、全面、合理。</p&

32、gt;<p>  當(dāng)使用不同的分類方法時(shí),往往會(huì)得到不同的分類結(jié)果,更何況對(duì)于任何觀測(cè)數(shù)據(jù)都不會(huì)存在唯一“正確”的分類方法。在實(shí)際工作中,仍以系統(tǒng)聚類法使用的最多,系統(tǒng)聚類法是目前在實(shí)際應(yīng)用中使用最多的一類方法。因此,在本論文中就使用系統(tǒng)聚類法,即譜系聚類法,并且是進(jìn)行型的聚類分析。</p><p>  2.3系統(tǒng)聚類法的基本思想和基本步驟</p><p>  設(shè)有個(gè)樣本,并

33、且每個(gè)樣本都有個(gè)變量(或指標(biāo))。系統(tǒng)聚類法的基本思想是:首先定義樣品間的距離和類與類之間的距離,開始時(shí)先將每個(gè)樣品各自當(dāng)作一類,此時(shí)樣本間距離與類間距離是等價(jià)的,再將最近的兩類合并聚為小類,將已聚合的小類按其相似程度(用類間距度量)再聚合,,依此類推,每次減少一類,隨著相似程度的減弱,直到最后將全部樣品合成一類,并類的全部過程可以用聚類譜系圖形象地表達(dá)出來。</p><p>  由上述系統(tǒng)聚類法的基本思想,可以得

34、出利用系統(tǒng)聚類法進(jìn)行聚類分析的基本步驟:</p><p> ?、贁?shù)據(jù)標(biāo)準(zhǔn)化:我們所考察的樣本數(shù)據(jù)有不同變量(或指標(biāo))時(shí),這些變量(或指標(biāo))一般都有不同的量綱、不同的數(shù)量級(jí)單位、不同的取值范圍。為了使不同量綱、不同取值范圍的數(shù)據(jù)能夠放在一起進(jìn)行比較,通常需要對(duì)數(shù)據(jù)進(jìn)行歸一化或標(biāo)準(zhǔn)化處理。并且,還要選擇樣本之間和類之間距離度量的方法;</p><p>  ②計(jì)算個(gè)樣本兩兩之間的距離,得到樣本間

35、的距離矩陣;</p><p> ?、蹌傞_始第一步時(shí),將個(gè)樣本各自看成一類,此時(shí)類的個(gè)數(shù),樣本間的距離就是類間的距離,然后對(duì)步驟執(zhí)行聚類的步驟④和⑤;</p><p> ?、苊看魏喜㈩愰g距離最小的兩類為一新類,即此時(shí)類的總數(shù)減少了1,此時(shí)類的總數(shù)為;</p><p> ?、堇^續(xù)計(jì)算新類與其它類之間的距離,得到新的距離矩陣。如果合并后類的個(gè)數(shù)仍然大于1,則重復(fù)步驟④和⑤

36、,直到類的總個(gè)數(shù)是1時(shí)為止;</p><p><b> ?、蕻嫵鼍垲愖V系圖;</b></p><p> ?、邲Q定分類的個(gè)數(shù)以及各類的成員。</p><p>  2.3.1樣本間距離的度量</p><p>  聚類問題中有個(gè)數(shù)據(jù),每個(gè)數(shù)據(jù)有個(gè)變量(即屬性),表示數(shù)據(jù)的第個(gè)屬性,則數(shù)據(jù)集的所有變量可用如下矩陣表示:</

37、p><p><b> ?。?.1)</b></p><p>  由于變量的多樣性,其取值可能是連續(xù)值的區(qū)間變量、二元變量、序數(shù)變量、名義變量等,它們的處理方法是不同的,如工資水平、股票價(jià)格、利率、匯率等可以用連續(xù)值表示的稱為連續(xù)變量,由于使用的變量單位不同等諸多因素,它們的值可能相差比較懸殊,為使各變量在聚類分析中地位相同,就需要對(duì)數(shù)據(jù)進(jìn)行歸一化即標(biāo)準(zhǔn)化處理。</p

38、><p>  兩個(gè)數(shù)據(jù)的接近程度用距離表示,樣品之間的距離,一般要求它滿足下列條件:</p><p> ?。?)且當(dāng)且僅當(dāng); </p><p><b> ?。?);</b></p><p><b>  (3)。</b></p><p>  在聚類分析中,有些“距離”不滿足(3),

39、我們?cè)趶V義的角度上仍稱它為“距離”。</p><p>  常用的距離有:歐式距離、明科夫斯基距離、馬氏距離等。下面就簡(jiǎn)要介紹幾種聚類分析中的常用距離:</p><p>  設(shè)是我們所關(guān)心的個(gè)指標(biāo),對(duì)此指標(biāo)進(jìn)行次觀測(cè),從而得到組觀測(cè)值:,稱這組觀測(cè)數(shù)據(jù)為個(gè)樣品。這時(shí),每個(gè)樣品可看成維空間的一個(gè)點(diǎn),個(gè)樣品組成維空間的個(gè)點(diǎn),我們自然就可以用各個(gè)樣本點(diǎn)之間的距離來衡量各樣品之間的相似程度。<

40、/p><p><b>  (1)歐氏距離</b></p><p><b>  (2.2)</b></p><p>  (2)Minkowski距離(明科夫斯基距離)</p><p><b> ?。?.3)</b></p><p>  其中。Minkowski

41、距離又稱距離,距離即歐氏距離。</p><p><b>  (3)馬氏距離</b></p><p><b> ?。?.4)</b></p><p>  其中是由樣品算得的樣本協(xié)方差矩陣:</p><p><b>  ,其中</b></p><p>  馬

42、氏距離適用于作為隨機(jī)變量的樣本點(diǎn),并且馬氏距離用于已知類別的模式情況,而我們所選定的家公司股票的類別是未知的,因此該距離不能用;明科夫斯基距離是一種范式,也就是說歐氏距離是明科夫斯基距離的一種特殊形式,即在式中時(shí),此時(shí)的明科夫斯基距離即歐氏距離。因此,在此處我們選擇歐氏距離來度量樣本間的距離,歐氏距離是聚類分析中用得最廣泛的距離。但是,鑒于本論文中選取的5項(xiàng)指標(biāo):每股收益、每股凈資產(chǎn)、主營(yíng)收入增長(zhǎng)率、主營(yíng)利潤(rùn)增長(zhǎng)率和凈資產(chǎn)收益率,正如在

43、本節(jié)“2.3.1樣本間距離的度量”中提到的,它們皆為連續(xù)變量,而歐氏距離平方最適合對(duì)連續(xù)變量進(jìn)行數(shù)據(jù)處理,因此,在本論文中,對(duì)于樣本間距離的選擇問題,我們選擇歐氏距離平方,軟件中對(duì)應(yīng)選擇,由式很容易得到歐氏距離平方:</p><p><b>  (2.5)</b></p><p>  2.3.2類間距離的度量</p><p>  距離作為對(duì)樣品

44、之間的相似程度的度量是聚類分析的基礎(chǔ)。為了研究問題的方便,分別以表示樣品,簡(jiǎn)記是樣品之間的距離, 設(shè)和為兩個(gè)類,含樣品數(shù)和。</p><p>  ———類的重心。類與類之間的距離記為.</p><p>  類間距離的常用定義方法如下:</p><p><b>  最短距離</b></p><p>  ,即兩類中樣品

45、之間距離最短者作為類間距離;</p><p>  最短距離法的特點(diǎn)是樣品有鏈接聚合的趨勢(shì),這是其缺點(diǎn),不適合一般數(shù)據(jù)的分類處理,除去特殊數(shù)據(jù)外,不提倡用這種方法。</p><p><b>  最長(zhǎng)距離</b></p><p>  ,即兩類中樣品之間距離最長(zhǎng)者作為類間距離;</p><p><b>  重心距離&

46、lt;/b></p><p>  ,即兩類的重心之間的距離作為類間距離;</p><p>  該距離隨聚類地進(jìn)行不斷縮小。該重心距離法的譜系聚類圖很難跟蹤,且符號(hào)改變頻繁,計(jì)算較煩。</p><p><b>  類平均距離</b></p><p>  ,即兩類中所有兩兩樣品之間的平方距離的平均作為類間距離;<

47、/p><p>  類平均距離法是一種使用比較廣泛、聚類結(jié)果較好的方法,而類平均距離法又有兩種形式:組間聯(lián)結(jié)法和組內(nèi)聯(lián)結(jié)法。</p><p>  這兩種方法相對(duì)而言,組間聯(lián)結(jié)法更能充分的使用樣本數(shù)據(jù)材料,因此,本論文中采用類平均距離法中的組間聯(lián)結(jié)法來度量類間距離。</p><p><b>  離差平方和</b></p><p>

48、;  在實(shí)際應(yīng)用中,離差平方和方法應(yīng)用比較廣泛,分類效果較好,但它要求樣本間距離的度量必須采用歐氏距離。</p><p>  2.4 系統(tǒng)聚類分析方法的比較</p><p>  系統(tǒng)聚類法的聚類原則決定于樣本間的距離和類間距離的定義,類間距離定義的不同就會(huì)產(chǎn)生不同的聚類分析方法,系統(tǒng)聚類法具有以下簡(jiǎn)單的性質(zhì):</p><p>  單調(diào)性:在利用系統(tǒng)聚類法進(jìn)行并類過程

49、中,并類距離具有單調(diào)性符合系統(tǒng)聚類法的基本思想,可知,最短距離法、最長(zhǎng)距離法、類平均距離法和離差平方和法都具有單調(diào)性,但重心距離法不具有單調(diào)性;</p><p><b>  空間的濃縮與擴(kuò)張</b></p><p>  以最短距離法和最長(zhǎng)距離法的并類過程為例,對(duì)于其相應(yīng)的距離,每一步都有以下性質(zhì):,對(duì)于一切的,這種性質(zhì)稱為最長(zhǎng)距離法比最短距離法擴(kuò)張,或稱最短距離法比最

50、長(zhǎng)距離法濃縮;</p><p>  由以上可對(duì)系統(tǒng)聚類法有以下結(jié)論:類平均距離法比最短距離法擴(kuò)張,且比最長(zhǎng)距離法濃縮;類平均距離法比重心距離法擴(kuò)張,且比離差平方和方法濃縮。而我們知道,太擴(kuò)張的方法當(dāng)樣本數(shù)量較大時(shí)容易失真,太濃縮的方法又不夠靈敏。類平均距離法相對(duì)比較適中,相對(duì)其它方法既不太擴(kuò)張也不太濃縮,而且具有單調(diào)性,因而類平均距離法是一種應(yīng)用廣泛、聚類結(jié)果較好地方法。</p><p>

51、  根據(jù)這一節(jié)和上一小節(jié)“2.3.2類間距離的度量”的分析和比較,可以更加讓我們相信,選擇類平均距離法中的組間聯(lián)結(jié)法來度量類間距離是比較合理的。</p><p>  2.5系統(tǒng)聚類法中類個(gè)數(shù)的確定問題</p><p>  在聚類分析方法中,樣本到底該分為幾類,究竟哪些樣品將歸于一類,分析前是不知道的。在進(jìn)行聚類分析時(shí),如何確定類的個(gè)數(shù)是個(gè)較難的問題,雖然有一些統(tǒng)計(jì)方法試圖給出判斷準(zhǔn)則,但是

52、人們至今仍未找到令人滿意的方法,但在聚類分析中這又是一個(gè)無法回避的問題。</p><p>  那么,我們?nèi)绾未_定較為合理的分類個(gè)數(shù)呢?以下就簡(jiǎn)要得介紹幾種確定類個(gè)數(shù)的常用方法:</p><p>  根據(jù)數(shù)據(jù)點(diǎn)的散布圖直觀地確定分類個(gè)數(shù)</p><p>  如果考察的指標(biāo)只有個(gè)即,則可通過數(shù)據(jù)點(diǎn)的散點(diǎn)分布圖來直觀地確定類的個(gè)數(shù)。如果有個(gè)變量,可以繪制三維空間的散點(diǎn)分布

53、圖,并且通過旋轉(zhuǎn)三維坐標(biāo)軸由數(shù)據(jù)點(diǎn)的分布來確定應(yīng)該分為幾類。當(dāng)然,如果考察的指標(biāo)多于個(gè)時(shí),可以先通過降維的方法把這些指標(biāo)進(jìn)行綜合,綜合出個(gè)或個(gè)指標(biāo),從而轉(zhuǎn)化為個(gè)變量或個(gè)變量情況,再繪制二維或三維的數(shù)據(jù)點(diǎn)的散布圖來確定合適的分類個(gè)數(shù)。但是,該方法從其降維過程來看,比較繁瑣。</p><p>  根據(jù)聚類譜系圖確定分類個(gè)數(shù)</p><p>  經(jīng)過系統(tǒng)聚類法處理后,會(huì)得到相應(yīng)的聚類譜系圖,那么

54、,如何根據(jù)聚類譜系圖確定分類個(gè)數(shù)呢?提出了應(yīng)根據(jù)研究的目的來確定適當(dāng)?shù)姆诸悅€(gè)數(shù),并提出了一些根據(jù)譜系圖來分類的準(zhǔn)則,準(zhǔn)則如下:</p><p>  任何類都必須在臨近各類中是突出的,即各類重心間距離必須要大;</p><p>  確定的類中,各類所包含的元素都不要過分的多;</p><p>  分類的數(shù)目必須符合實(shí)用目的;</p><p> 

55、 若采用幾種不同的聚類方法處理,則在各自的聚類圖中應(yīng)發(fā)現(xiàn)相同的類。</p><p>  根據(jù)聚類分析的“碎石圖”確定分類個(gè)數(shù)</p><p>  在系統(tǒng)聚類過程中,首先把離得近的類進(jìn)行合并,所以在并類過程中的聚合系數(shù)會(huì)呈現(xiàn)出增加趨勢(shì),聚合系數(shù)小表示合并的兩類的相似程度較大,而兩個(gè)差異很大的類并在一起時(shí),會(huì)使聚合系數(shù)很大。因此,如果以軸表示聚合系數(shù),軸表示分類數(shù),畫出聚合系數(shù)隨著分類數(shù)變化的

56、曲線圖(或散點(diǎn)圖),這樣就會(huì)得到類似于因子分析中的碎石圖,從而,我們可以在曲線開始變得平緩時(shí)的點(diǎn)處,選擇較為合適的分類數(shù)。</p><p>  可見,該方法較前兩種方法而言,顯得更加簡(jiǎn)潔、直觀,因此,本論文中采用“碎石圖”來確定比較合適的分類個(gè)數(shù)。</p><p>  3.聚類分析在證券市場(chǎng)分析中的應(yīng)用</p><p>  本文中,選取了每種股票的每股收益、每股凈資

57、產(chǎn)、主營(yíng)收入增長(zhǎng)率、主營(yíng)利潤(rùn)增長(zhǎng)率和凈資產(chǎn)收益率5項(xiàng)指標(biāo)評(píng)價(jià)體系,首先利用聚類分析方法對(duì)各類股票的基本層面進(jìn)行考察,然后再利用綜合指標(biāo)評(píng)價(jià)體系,如收益性、成長(zhǎng)性、擴(kuò)張性等來衡量樣本股票的“相似程度”。以此能夠更好地幫助投資者準(zhǔn)確地了解和把握股票的總體特性,以便及時(shí)地作出投資決策、進(jìn)行投資。</p><p>  鑒于聚類分析在證券投資方面還有很大的發(fā)掘空間和研究?jī)r(jià)值。本文在現(xiàn)有的研究基礎(chǔ)上,深入探討了聚類分析在證券

58、投資中的應(yīng)用價(jià)值,豐富和完善了在證券市場(chǎng)分析中應(yīng)用聚類分析時(shí)的指標(biāo)體系。</p><p>  3.1 聚類分析在證券市場(chǎng)分析中應(yīng)用時(shí)的指標(biāo)評(píng)價(jià)體系的選擇</p><p>  3.1.1盈利能力指標(biāo)</p><p>  每股收益越高,反映出公司或行業(yè)的投資收益就越高,每股的獲利能力就越強(qiáng);</p><p>  凈資產(chǎn)收益率反映了股東權(quán)益的收益水

59、平,用以衡量公司運(yùn)用自有資本的效率。凈資產(chǎn)收益率越高,說明投資帶來的收益就越高。</p><p>  3.1.2成長(zhǎng)能力指標(biāo)</p><p>  主營(yíng)收入增長(zhǎng)率用來衡量和判斷公司發(fā)展所處的階段,以使投資者較為準(zhǔn)確地判斷該公司或行業(yè)正處于成長(zhǎng)期、穩(wěn)定期或衰退期,進(jìn)而作出較為合理的投資決策;</p><p>  經(jīng)營(yíng)業(yè)績(jī)良好的上市公司會(huì)表現(xiàn)出較高的成長(zhǎng)性,成長(zhǎng)性好的上市

60、公司的盈利也會(huì)相應(yīng)增強(qiáng)。主營(yíng)收入增長(zhǎng)率和主營(yíng)利潤(rùn)增長(zhǎng)率都反映了公司擴(kuò)大市場(chǎng)規(guī)模的能力,表明公司重點(diǎn)的發(fā)展方向。一般來說,主營(yíng)利潤(rùn)穩(wěn)定增長(zhǎng)且占利潤(rùn)總額的比例呈增長(zhǎng)趨勢(shì)的公司正處在成長(zhǎng)期。一些公司盡管年度內(nèi)的利潤(rùn)總額有較大幅度的增加,但主營(yíng)業(yè)務(wù)利潤(rùn)卻未相應(yīng)增加,甚至?xí)霈F(xiàn)大幅下降,這樣的公司質(zhì)量其實(shí)并不高,可能存在著資產(chǎn)管理的費(fèi)用即成本居高不下的問題,也可能存在著著巨大的風(fēng)險(xiǎn)。因此投資者對(duì)于投資這樣的公司,要提高警惕。</p>

61、<p>  3.1.3擴(kuò)張能力指標(biāo)</p><p>  每股凈資產(chǎn)是每股所代表的股東權(quán)益額,它反映了每股最低限度的內(nèi)在價(jià)值。</p><p>  以上建立的指標(biāo)評(píng)價(jià)體系可用以下框圖表示:</p><p><b>  指標(biāo)評(píng)價(jià)體系框圖</b></p><p><b>  3.2實(shí)證研究</b&g

62、t;</p><p>  利用本文隨機(jī)選取的在滬深上市的40家山東省的公司企業(yè),選擇每股收益、每股凈資產(chǎn)、主營(yíng)收入增長(zhǎng)率、主營(yíng)利潤(rùn)增長(zhǎng)率和凈資產(chǎn)收益率5項(xiàng)指標(biāo)評(píng)價(jià)體系,隨機(jī)選取的樣本指標(biāo)數(shù)據(jù)來自證券之星數(shù)據(jù)中心的財(cái)務(wù)指標(biāo)。本文利用的是軟件,通過系統(tǒng)聚類分析方法對(duì)這40家公司企業(yè)的股票進(jìn)行聚類分析,分別將它們歸類,為之后投資者提供決策依據(jù)。詳細(xì)樣本數(shù)據(jù)見表3.1:</p><p>  表3.

63、1 選取的40家上市公司企業(yè)的樣本數(shù)據(jù)</p><p>  由表3.1可知,該實(shí)際問題中有家公司,即總共有個(gè)樣本數(shù)據(jù),每個(gè)樣本數(shù)據(jù)又有個(gè)指標(biāo)變量(即屬性),則由第二章的樣本數(shù)據(jù)矩陣可知,表3.1數(shù)據(jù)集中的所有數(shù)據(jù)可用如下矩陣表示: </p><p>  3.2.1原始樣本數(shù)據(jù)標(biāo)準(zhǔn)化</p><p>  由于選取不同的指標(biāo),并且不同的指標(biāo)具有不同的量綱,為了使所有

64、的樣本指標(biāo)數(shù)據(jù)能夠放到一起加以比較,以便更好地進(jìn)行聚類分析,就需要我們對(duì)原始樣本數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,以消除由于各指標(biāo)變量的量綱不同或數(shù)量級(jí)相差很大對(duì)分析帶來的影響。</p><p>  常用的數(shù)據(jù)標(biāo)準(zhǔn)化方法主要有:極差正規(guī)化變換、極差標(biāo)準(zhǔn)化變換和標(biāo)準(zhǔn)化變換。</p><p>  為了便于后面的說明,在此作出如下設(shè)定:</p><p>  所有樣本表示為:,均值表示為

65、:,</p><p>  標(biāo)準(zhǔn)差表示為:,極差表示為:</p><p> ?。?)極差正規(guī)化變換:</p><p><b> ?。?.1)</b></p><p>  此方法變換后的數(shù)據(jù)最小為0,最大為1,其余在區(qū)間[0,1]內(nèi),極差為1,無量綱。</p><p>  (2)極差標(biāo)準(zhǔn)化變換:<

66、;/p><p><b> ?。?. 2)</b></p><p>  此方法變換后的數(shù)據(jù)均值為0,極差為1,且 ,消去了量綱的影響。 </p><p>  由以上兩種方法可知,這兩種方法都采用極值化法對(duì)數(shù)據(jù)進(jìn)行無量綱化,都是通過利用變量取值的最大值和最小值將原始數(shù)據(jù)轉(zhuǎn)換為界于某一特定范圍的數(shù)據(jù),從而消除量綱和數(shù)量級(jí)的影響。但是,由于極值化法在對(duì)變量

67、進(jìn)行無量綱化過程中,僅僅與該變量的最大值和最小值這兩個(gè)極端值有關(guān),而與其它取值無關(guān),這使得該方法在改變各變量權(quán)重時(shí)過分依賴兩個(gè)極端的取值。如果兩個(gè)變量取值相近,其分析權(quán)重近似相同,但在原始變量數(shù)據(jù)中存在明顯的極大值時(shí),會(huì)造成兩個(gè)變量的分析權(quán)重不同。結(jié)合本論文中所選取的樣本數(shù)據(jù)(樣本數(shù)據(jù)詳見表3.1)的特點(diǎn),可知這兩種方法都不適合對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。</p><p><b> ?。?)標(biāo)準(zhǔn)化變換:&

68、lt;/b></p><p><b> ?。?. 3)</b></p><p>  此方法變換后的數(shù)據(jù)均值為0,標(biāo)準(zhǔn)差為1,消去了量綱的影響,并且當(dāng)抽樣樣本改變時(shí),它仍能保持相對(duì)穩(wěn)定性。另外,此方法進(jìn)行標(biāo)準(zhǔn)化的同時(shí)還消除了各變量在變異程度上的差異,從而使變換后的各變量在聚類分析中的重要性程度是同等看待的。</p><p>  綜合以上比較

69、和分析,本論文中采用標(biāo)準(zhǔn)化變換的方法對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。在軟件中,對(duì)應(yīng)選擇即可。</p><p>  3.2.2用軟件對(duì)樣本公司股票進(jìn)行聚類分析</p><p>  利用軟件對(duì)樣本公司股票進(jìn)行系統(tǒng)聚類分析,具體操作步驟如下:</p><p> ?。?)打開軟件,導(dǎo)入樣本數(shù)據(jù)(此處的樣本數(shù)據(jù)是事先經(jīng)過編輯好的數(shù)據(jù)文件,此處即表3.1中的所有數(shù)據(jù));</p>

70、;<p>  (2)在軟件中,依次選擇分析、分類、系統(tǒng)聚類,彈出系統(tǒng)聚類分析對(duì)話框;</p><p> ?。?)在彈出的系統(tǒng)聚類分析對(duì)話框中,把每股收益、每股凈資產(chǎn)、主營(yíng)收入增長(zhǎng)率、主營(yíng)利潤(rùn)增長(zhǎng)率和凈資產(chǎn)收益率這5項(xiàng)指標(biāo)評(píng)價(jià)體系依次導(dǎo)入到變量這一欄中,此處為了更清晰地了解分類結(jié)果,我們還需要把樣本股票的簡(jiǎn)稱導(dǎo)入到標(biāo)注個(gè)案這一欄中。這里要特別需要注意的是,在軟件中,數(shù)據(jù)文件中的一列數(shù)據(jù)稱為一個(gè)變量,每

71、個(gè)變量都應(yīng)該有一個(gè)變量名,一行數(shù)據(jù)稱為一條個(gè)案或觀測(cè)量。此處,因?yàn)槲覀円獙?duì)樣本股票進(jìn)行分類,屬于個(gè)案,因此,我們需要在彈出的系統(tǒng)聚類分析對(duì)話框中的分群這一欄中選擇個(gè)案;</p><p> ?。?)點(diǎn)擊統(tǒng)計(jì)量,選擇合并進(jìn)程表、相似性矩陣,在聚類成員一欄中選擇,因?yàn)槲覀儸F(xiàn)在還不知道樣本股票分為幾類比較合適;</p><p> ?。?)點(diǎn)擊繪制,選擇樹狀圖、所有聚類、垂直;</p>

72、<p> ?。?)點(diǎn)擊方法,在聚類方法中選擇組間聯(lián)接,在度量標(biāo)準(zhǔn)一欄的區(qū)間選項(xiàng)中選擇距離,在轉(zhuǎn)換值一欄的標(biāo)準(zhǔn)化選項(xiàng)中選擇;</p><p> ?。?)最后點(diǎn)擊確定運(yùn)行。</p><p>  可得到如下的輸出結(jié)果:</p><p>  圖3.1顯示的是用距離計(jì)算的近似矩陣表(此處由于樣本數(shù)據(jù)較多,故只截取表的一部分),其實(shí)質(zhì)是一個(gè)不相似矩陣,其中的數(shù)值表示

73、各個(gè)樣本之間的相似系數(shù),數(shù)值越大,表示兩樣本距離越大:</p><p>  圖3. 1 近似矩陣</p><p>  表3.2顯示的是聚類表,該表反映的是每一階段的聚類結(jié)果,其中的第4列系數(shù)表示聚合系數(shù),第2列和第3列表示的是聚合的類,此聚類表是為本論文在后面通過畫“碎石圖”來確定合適的分類個(gè)數(shù)做鋪墊,并且由表3.2可知,聚類過程總共進(jìn)行了39次:</p><p&g

74、t;  表3.2 聚類表</p><p>  圖3.2是冰柱圖(此處設(shè)置為垂直輸出),也是反映聚類狀況的圖,若按照事先假定的聚類數(shù),在冰柱圖中那類的行上從左到右可以找到各類所包含的樣本:</p><p>  圖3. 2 冰柱圖</p><p>  圖3.3是樹狀圖即聚類譜系圖,從中可直觀地顯示聚類的過程,當(dāng)知道分類個(gè)數(shù)時(shí),可以從聚類譜系圖中清楚的看出各種股票

75、的歸類。</p><p>  圖3.3 聚類譜系圖</p><p>  3.2.3分類個(gè)數(shù)的確定</p><p>  正如在“2.5 系統(tǒng)聚類法中類個(gè)數(shù)的確定問題”這一節(jié)中討論的那樣,我們使用聚類分析中的“碎石圖”來確定比較合適的分類個(gè)數(shù)。利用“表3.2 聚類表”中的第列和第列數(shù)據(jù),以第列數(shù)據(jù)的逆序即以分類數(shù)的逆序?yàn)闄M坐標(biāo),第列數(shù)據(jù)即以聚合系數(shù)為縱坐標(biāo),選取合

76、適的坐標(biāo)范圍和刻度,在中畫出“碎石圖”,如圖3.4。</p><p>  圖3. 4 碎石圖</p><p>  由以上“碎石圖”可以形象地看出,當(dāng)分類個(gè)數(shù)為時(shí),曲線開始變得平緩,因此,選擇分類數(shù)為是比較合適的。</p><p>  隨后,在軟件中,重復(fù)在“3.2.2 用軟件對(duì)樣本公司股票進(jìn)行聚類分析”進(jìn)行系統(tǒng)聚類分析的操作,需要變化的操作有兩個(gè):一個(gè)是在第“(

77、3)”步彈出的系統(tǒng)聚類分析對(duì)話框中,還要選擇,并在彈出的對(duì)話框中輸入分類數(shù)為,這一步的目的是為了后面對(duì)分類結(jié)果進(jìn)行方差檢驗(yàn)做準(zhǔn)備;二是在第“(4)”步中的聚類成員一欄中輸入分類個(gè)數(shù)為,可得到分類數(shù)為時(shí)的聚類表,見表3.3。</p><p>  表3.3顯示的是群集成員,從該表中可以直接知道分為類的結(jié)果以及各自樣本的歸類:</p><p>  表3.3 群集成員</p>&

78、lt;p><b>  3.2.4聚類結(jié)果</b></p><p>  由以上軟件運(yùn)行的表3.3結(jié)果可得到以下聚類分析結(jié)果:</p><p>  表3.4 第1類</p><p>  表3.5 第2類</p><p>  表3.6 第3類</p><p>  表3.7 第4類&

79、lt;/p><p>  表3.8 第5類</p><p>  3.2.5對(duì)聚類結(jié)果進(jìn)行檢驗(yàn)</p><p>  以上通過系統(tǒng)聚類分析方法對(duì)樣本數(shù)據(jù)進(jìn)行了分類,那么,上述的聚類分析得到的分類結(jié)果是否有效呢?為了驗(yàn)證上述聚類分組的效果,我們通軟件,利用方法對(duì)上述的分類結(jié)果進(jìn)行檢驗(yàn)。</p><p>  利用方法,檢驗(yàn)各個(gè)類別在所有變量上的差異,如

80、果差異顯著,我們就可以認(rèn)為分類結(jié)果是可靠的。關(guān)于利用方法對(duì)分類結(jié)果進(jìn)行檢驗(yàn)的方法和步驟,詳見附錄。</p><p>  以下圖3.5是最后輸出的檢驗(yàn)結(jié)果:</p><p>  圖3.5 方法檢驗(yàn)</p><p>  圖3.5中的方法檢驗(yàn)表就是對(duì)平均值差異性的檢驗(yàn)了,由顯著性這一列可知,都達(dá)到了顯著的水平,這說明分類結(jié)果是比較有效的。</p><

81、;p><b>  3.2.6結(jié)果分析</b></p><p>  表3.9 相應(yīng)指標(biāo)均值</p><p>  為了更加直觀地進(jìn)行綜合分析,我們按照“3.1 聚類分析在證券市場(chǎng)分析中應(yīng)用時(shí)的指標(biāo)評(píng)價(jià)體系的選擇”這一節(jié)把相應(yīng)的指標(biāo)匯總成表3.10:</p><p>  表3.10 指標(biāo)匯總分析</p><p>

82、  根據(jù)表3.10中的指標(biāo)匯總信息,分析如下:</p><p>  第類:該類股票的盈利低、成長(zhǎng)性慢,即使該類公司具有相對(duì)較強(qiáng)的擴(kuò)張能力,但由于該類公司經(jīng)營(yíng)不善或前景不好等原因,表現(xiàn)出業(yè)績(jī)較差,交投不活躍,嚴(yán)重時(shí)會(huì)導(dǎo)致公司虧損。投資者在進(jìn)行此類股票的投資時(shí),要具有風(fēng)險(xiǎn)意識(shí),不要盲目追風(fēng)作出投資決策、進(jìn)行投機(jī)活動(dòng)。</p><p>  第類:屬于高盈利、高成長(zhǎng)性的績(jī)優(yōu)股,甚至?xí)砷L(zhǎng)為比績(jī)優(yōu)股

83、更優(yōu)的藍(lán)籌股。并且,該類公司的擴(kuò)張能力也比較好,這類公司不管在資金、市場(chǎng),還是在信譽(yù)等其他方面都占有明顯優(yōu)勢(shì),具有較強(qiáng)的綜合競(jìng)爭(zhēng)力和核心競(jìng)爭(zhēng)力,并且對(duì)市場(chǎng)的各種波動(dòng)具有較強(qiáng)的應(yīng)變能力,該類股票是投資者進(jìn)行投資的最佳選擇。</p><p>  第類:具有與第類同樣較高的盈利能力和擴(kuò)張能力,即便如此,但是與第類相比,第類的成長(zhǎng)能力明顯不如第類,充其量只能成為績(jī)優(yōu)股,而不是藍(lán)籌股,廣大的投資者可以對(duì)第類股票作出投資決策

84、、進(jìn)行投資,但是同有著較大藍(lán)籌股潛力的第類股票相比,第類股票就略顯遜色。鑒于此,建議投資者可以對(duì)第類和第類股票進(jìn)行適當(dāng)?shù)耐顿Y組合,適當(dāng)?shù)脑黾訉?duì)第類股票的投資比例。</p><p>  第類:屬于成長(zhǎng)能力非常強(qiáng)、成長(zhǎng)性非??斓臐摿桑蔷哂休^低的每股收益、凈資產(chǎn)收益率和每股凈資產(chǎn)。以上說明第類公司只是在盈利能力和擴(kuò)張能力方面相對(duì)而言顯得較弱,但是具有較高的主營(yíng)收入增長(zhǎng)率和主營(yíng)利潤(rùn)增長(zhǎng)率,特別是其主營(yíng)利潤(rùn)增長(zhǎng)率特別

85、高。說明該類股票正處于高速發(fā)展階段,其成長(zhǎng)發(fā)展前景非常好,比較適合投資者進(jìn)行長(zhǎng)期性的投資。</p><p>  第類:該類股票的盈利能力良好,且其擴(kuò)張能力也較高,盡管在這類中其擴(kuò)張能力是最高的,但是其成長(zhǎng)能力不很理想,這說明該類公司很可能由于存在成本長(zhǎng)期居高的情況,而導(dǎo)致其收入和利潤(rùn)的增長(zhǎng)率比較緩慢,這樣,就會(huì)抵消部分?jǐn)U張能力,從而會(huì)影響到公司將來的的擴(kuò)張和成長(zhǎng)。投資者在對(duì)該類股票進(jìn)行投資時(shí),要慎之又慎。<

86、/p><p>  由以上的聚類結(jié)果及其分析可知,聚類分析能夠有效地對(duì)股票的收益性、成長(zhǎng)性等多方面進(jìn)行分析,從而有利于投資者準(zhǔn)確地把握股票的總體特性以及預(yù)測(cè)股票的成長(zhǎng)能力,進(jìn)而使投資者及時(shí)做出最佳的投資決策,以此獲得可觀的投資回報(bào)。這都表明了聚類分析方法在證券市場(chǎng)投資分析中具有有效性和實(shí)用性。</p><p><b>  4.總結(jié)和展望</b></p><

87、;p>  聚類分析方法是一種應(yīng)用極為廣泛的多元統(tǒng)計(jì)分析方法,聚類分析在證券市場(chǎng)投資方面有很大的研究潛力和研究?jī)r(jià)值,本文將聚類分析模型應(yīng)用于證券投資中,進(jìn)行了拓展性的研究和探討,采用綜合指標(biāo)來反映上市公司的盈利性、成長(zhǎng)性和擴(kuò)張性,并且通過對(duì)聚類結(jié)果進(jìn)行定量分析得出各類公司的實(shí)力強(qiáng)弱情況。立足于基本面的定量分析,研究股票的內(nèi)在價(jià)值,有利于投資者正確作出投資決策、確定投資價(jià)值、降低投資風(fēng)險(xiǎn)。本文在聚類分析的基礎(chǔ)上,對(duì)聚類分析的結(jié)果進(jìn)行方

88、法檢驗(yàn),進(jìn)一步驗(yàn)證了分析結(jié)果的可靠性、可信性。</p><p>  文中在選擇和處理不同指標(biāo)的方法方面仍待需要改進(jìn),但聚類分析方法在證券投資市場(chǎng)分析中確實(shí)具有很大的研究潛力和研究?jī)r(jià)值,并且本論文的研究也表明了具有一定的可行性和實(shí)用性,從而為投資者進(jìn)行證券投資提供有力工具。本文中的樣本數(shù)據(jù)僅僅選取了40家在滬深上市的山東省的公司企業(yè),并以此來進(jìn)行聚類分析,當(dāng)然還可以選擇不同省份或不同區(qū)域的樣本數(shù)據(jù)進(jìn)行進(jìn)一步的深入研

89、究和分析。</p><p><b>  總結(jié)</b></p><p>  經(jīng)過兩個(gè)多月的努力,我的畢業(yè)設(shè)計(jì)論文終于順利完成了,從剛開始的一無所知到現(xiàn)在的了解了聚類分析的概念背景及其現(xiàn)實(shí)應(yīng)用性,我從中學(xué)到了很多知識(shí)。由于以前從未接觸過聚類分析在證券市場(chǎng)分析中的應(yīng)用,剛開始無從下手,在查了一些相關(guān)資料并且多次與導(dǎo)師交流之后,才逐漸地有了頭緒,但是第一次做的時(shí)候仍然出現(xiàn)了不

90、少方向的錯(cuò)誤。有問題不可怕,只要你勇敢去解決它,在整個(gè)解決問題的過程中我收獲頗多。</p><p>  畢業(yè)設(shè)計(jì)是我們專業(yè)課程知識(shí)綜合應(yīng)用的實(shí)踐訓(xùn)練,本論文介紹了聚類分析在證券市場(chǎng)分析中應(yīng)用的可行性、可靠性和可信性。并在理論分析之后成功地完成了樣本數(shù)據(jù)的分類,得到并驗(yàn)證了分類結(jié)果的合理、正確性。在完成論文的路上,我走得比較坎坷,但是“千里之行,始于足下”,畢業(yè)設(shè)計(jì)讓我學(xué)會(huì)了腳踏實(shí)地的邁出每一步,鍛煉了我的綜合運(yùn)用

91、所學(xué)知識(shí)和技能,理論聯(lián)系實(shí)際、獨(dú)立分析和解決實(shí)際問題的能力,培養(yǎng)了我正確的理論聯(lián)系實(shí)際的工作作風(fēng),嚴(yán)肅認(rèn)真的科學(xué)態(tài)度和初步的科學(xué)研究能力,更讓我明白了跟導(dǎo)師保持良好的溝通的重要性。</p><p>  初次研究聚類分析在證券市場(chǎng)分析中的應(yīng)用,加上自己水平有限,文也中難免有些瑕疵,但這次的經(jīng)歷對(duì)我還是很重要的,為我以后即將開始的研究生學(xué)習(xí)有著非常重要的借鑒和開河意義。</p><p><

92、;b>  致 謝</b></p><p>  本論文是在我的導(dǎo)師 陳鳳欣老師 的悉心指導(dǎo)下完成的。沒有老師精心的指導(dǎo),沒有老師不惜辛苦的督促,我是無法完成論文的。她嚴(yán)肅的科學(xué)態(tài)度,嚴(yán)謹(jǐn)?shù)闹螌W(xué)精神,精益求精的工作作風(fēng),都深深地感染和激勵(lì)著我。尤其是在我走錯(cuò)方向、思路失誤的時(shí)候,老師仍是耐心地再次為我講解,一遍一遍地指導(dǎo)我。在此謹(jǐn)向陳老師致以誠(chéng)摯的謝意。衷心感謝山東交通學(xué)院理學(xué)院信息與計(jì)算科學(xué)專業(yè)的

93、各位領(lǐng)導(dǎo)和老師,謝謝你們對(duì)我的生活和學(xué)習(xí)進(jìn)行指導(dǎo)和幫助。</p><p>  感謝對(duì)我論文進(jìn)行評(píng)審的各位專家教授,感謝對(duì)論文的指導(dǎo)和提出寶貴的意見! </p><p>  最后,在完成論文的過程中,很多可敬的師長(zhǎng)、同學(xué)、朋友給了我無盡的幫助,在這里請(qǐng)接受我誠(chéng)摯的謝意!</p><p><b>  參考文獻(xiàn)</b></p><

94、p>  [1] 高惠璇.應(yīng)用多元統(tǒng)計(jì)分析[M].北京:北京大學(xué)出版社,2005.1</p><p>  [2] 何曉群.現(xiàn)代統(tǒng)計(jì)分析方法與應(yīng)用[M].北京:中國(guó)人民大學(xué)出版社,2007.8</p><p>  [3] 高惠璇.實(shí)用統(tǒng)計(jì)方法與SAS系統(tǒng)[M].北京:北京大學(xué)出版社,2001.10</p><p>  [4] 杰里米 西格爾.長(zhǎng)期股票投資[M].北

95、京:機(jī)械工業(yè)出版社,2011.9</p><p>  [5] 周世武.金融計(jì)算與建模[M].北京:清華大學(xué)出版社,2007.8</p><p>  [6] 梅長(zhǎng)林 范金城.數(shù)據(jù)分析方法[M].北京:高等教育出版社,2006.2</p><p>  [7] 薛薇.統(tǒng)計(jì)分析與SPSS的應(yīng)用[M].中國(guó)人民大學(xué)出版社,2003,170-183</p><

96、;p>  [8] 周焯華 陳文南 張宗益.聚類分析在證券投資分析中的應(yīng)用[J].重慶大學(xué)學(xué)報(bào),2002,(25)7.</p><p>  [9] 鄧秀勤.聚類分析在股票市場(chǎng)板塊分析中的應(yīng)用[J].數(shù)理統(tǒng)計(jì)與管理,1999.5(18),(1-4).</p><p>  [10] 王冬梅.建立我國(guó)上市公司業(yè)績(jī)綜合評(píng)價(jià)指標(biāo)體系[J].證券與投資,2001</p><p&

97、gt;  [11] 郭志剛.社會(huì)統(tǒng)計(jì)分析方法—SPSS軟件應(yīng)用[M].北京:中國(guó)人民大學(xué)出版社,1999.</p><p>  [12] 何光漢.證券投資與證券管理[M].武漢:華中理工大學(xué)出版社,1996.</p><p>  [13] 陳共 周升業(yè) 吳曉求.證券投資分析[M]. 北京:中國(guó)人民大學(xué)出版社,1997.</p><p><b>  附錄&l

98、t;/b></p><p><b>  附錄A</b></p><p>  在軟件中利用方法,對(duì)聚類分析結(jié)果進(jìn)行檢驗(yàn)的方法和步驟如下:</p><p>  我們看到在數(shù)據(jù)視圖窗口和變量視圖窗口都已經(jīng)形成了一個(gè)新的變量,顯示了case的分類結(jié)果,如圖所示,這里顯示了分為5個(gè)類的結(jié)果 。</p><p><b&g

99、t;  圖一 數(shù)據(jù)視圖</b></p><p><b>  圖二 變量視圖</b></p><p>  在菜單欄上執(zhí)行:analyse(分析)--compare means(比較均值)--means(均值),打開平均數(shù)對(duì)話框</p><p><b>  圖三</b></p><p&g

100、t;  將指標(biāo)變量都放入因變量列表中,然后將分組變量(聚類分析得到的新變量)放入自變量列表中</p><p><b>  圖四</b></p><p>  點(diǎn)擊確定按鈕,開始運(yùn)行數(shù)據(jù),并顯示結(jié)果</p><p>  我們會(huì)看到分為5類結(jié)果時(shí)各自的平均數(shù),下面的表格就是將case分為5、類的結(jié)果,當(dāng)然這種方法只能計(jì)算出各組平均數(shù)(這與用計(jì)算均值結(jié)

101、果完全一樣,只是精度有差異),如何檢驗(yàn)平均數(shù)的差異就要用到下面的方法</p><p><b>  圖五</b></p><p>  在菜單欄上執(zhí)行:analyse(分析)--compare means(比較均值)--one way anova(單因素方差)</p><p><b>  圖六</b></p>&

102、lt;p>  將指標(biāo)變量放到因變量列表,將分組變量放入因子列表中,然后點(diǎn)擊ok,開始處理數(shù)據(jù)</p><p><b>  圖七</b></p><p>  我們看到下面的這個(gè)表格就是對(duì)平均數(shù)的差異的檢驗(yàn)了,看sig這一列,都達(dá)到了顯著的水平,這說明這種分類還是比較有效的。</p><p><b>  圖八</b>&l

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論