機(jī)器學(xué)習(xí)專題

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-01-07 格式：ppt 頁數(shù)：115 大小：3.00MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

已閱讀1頁，還剩114頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、序,有一位計(jì)算機(jī)科學(xué)家曾經(jīng)和很多其他學(xué)科的科學(xué)家們?cè)谝黄鸷献?，大家互相介紹各自的工作的時(shí)候，這位計(jì)算機(jī)科學(xué)家苦心構(gòu)思了這么一個(gè)例子，他說：我的工作就是要讓計(jì)算機(jī)認(rèn)識(shí)這個(gè)，然后他畫了下面這幅圖，嚴(yán)格的說是寫了這組嚴(yán)格對(duì)齊的數(shù)字,0000000000000000000000000000000000000000011000000000110001100000000011000110000000001100011000000000

2、110001100000000011000110000000001100011000000000111111111000000011111111100000000000011000000000000001100000000000000110000000000000000000000000000000000000,?？耍╯ank）：“一臺(tái)計(jì)算機(jī)若不能進(jìn)行學(xué)習(xí)，就不能說它具有智能” Simon（1983）：學(xué)習(xí)就是系統(tǒng)中

3、的變化，這種變化使系統(tǒng)比以前更有效地去做同樣的工作。無統(tǒng)一的機(jī)器學(xué)習(xí)定義。機(jī)器學(xué)習(xí)是研究如何使用機(jī)器來模擬人類學(xué)習(xí)活動(dòng)的一門學(xué)科。稍嚴(yán)格的提法是:ML是一門研究機(jī)器獲得新知識(shí)和新技能，并識(shí)別現(xiàn)有知識(shí)的學(xué)問,1、機(jī)器學(xué)習(xí)的定義,人工智能主要是為了研究人的智能，模仿其機(jī)理將其應(yīng)用于工程的科學(xué)。在這個(gè)過程中必然會(huì)問道：“機(jī)器怎樣做才能像人類一樣具有學(xué)習(xí)能力”。機(jī)器學(xué)習(xí)廣泛應(yīng)用于機(jī)器人、圖像處理、語音識(shí)別、數(shù)據(jù)挖掘等

4、領(lǐng)域。機(jī)器學(xué)習(xí)的發(fā)展有利于推動(dòng)其他領(lǐng)域的發(fā)展。,2、為什么要研究機(jī)器學(xué)習(xí)？,預(yù)測(cè)難：學(xué)習(xí)后知識(shí)庫發(fā)生了什么變化，系統(tǒng)功能的變化的預(yù)測(cè)。歸納推理：是論證的前提支持結(jié)論但不確保結(jié)論的推理過程(演繹推理保真);而且，歸納的結(jié)論是無限多的，其中相當(dāng)多是假的，給生成的知識(shí)帶來不可靠性。判斷難：機(jī)器目前很難觀察什么重要、什么有意義。,3、實(shí)現(xiàn)的困難,5,4 系統(tǒng)學(xué)習(xí)性能評(píng)價(jià),分類精度：是否能夠?qū)斎氲臄?shù)據(jù)進(jìn)行正確、精確的分類。解答的正

5、確性和質(zhì)量：無論是用于分類的，還是解決問題的系統(tǒng)都有解答正確性問題。同時(shí)，正確性不一定保證有好的質(zhì)量，好的質(zhì)量包括：可讀性、穩(wěn)定性等多方面的因素。學(xué)習(xí)的速度：學(xué)習(xí)速度是一個(gè)很重要的系統(tǒng)指標(biāo)。它不僅僅影響系統(tǒng)的設(shè)計(jì)，同時(shí)，影響系統(tǒng)的實(shí)現(xiàn)。一個(gè)很費(fèi)時(shí)的學(xué)習(xí)方法，某種意義上也是很難實(shí)現(xiàn)的。因?yàn)椋ǔ；ㄙM(fèi)大量時(shí)間所進(jìn)行的操作表現(xiàn)在對(duì)學(xué)習(xí)樣本量的要求、系統(tǒng)空間的要求、系統(tǒng)硬件性能的要求上。,6,,環(huán)境,學(xué)習(xí)環(huán)節(jié),,知識(shí)庫,執(zhí)行環(huán)節(jié),,,,,,

6、,學(xué)習(xí)是建立理論、形成假設(shè)和進(jìn)行歸納推理的過程。整個(gè)過程包括：信息的存儲(chǔ)、知識(shí)的處理兩部分,三、機(jī)器學(xué)習(xí)模型,學(xué)習(xí)系統(tǒng),學(xué)習(xí)系統(tǒng)所感知到的外界信息集合，也是學(xué)習(xí)系統(tǒng)的外界來源,對(duì)環(huán)境提供的信息進(jìn)行整理、分析歸納或類比，形成知識(shí)，并將其放入知識(shí)庫,存儲(chǔ)經(jīng)過加工后的信息（即知識(shí)）,根據(jù)知識(shí)庫去執(zhí)行一系列任務(wù)，并將執(zhí)行結(jié)果或執(zhí)行過程中獲得的信息反饋給學(xué)習(xí)環(huán)節(jié),,,,,學(xué)習(xí)模型,輸入x,輸出,約束條件,機(jī)器學(xué)習(xí)的分類,根據(jù)是否需要已知類別

7、的樣本進(jìn)行學(xué)習(xí)，機(jī)器學(xué)習(xí)可以分為兩大類：有教師學(xué)習(xí)（監(jiān)督學(xué)習(xí)）無教師學(xué)習(xí)（非監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)）,監(jiān)督學(xué)習(xí)supervised learning,利用已知類別的樣本去訓(xùn)練算法從而調(diào)整分類器的參數(shù)，這樣的學(xué)習(xí)過程叫做監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)的任務(wù)是學(xué)習(xí)一個(gè)模型，使模型能夠?qū)θ我饨o定的輸入，對(duì)其相應(yīng)的輸出做出一個(gè)很好的預(yù)測(cè)。常見的監(jiān)督學(xué)習(xí)算法有：決策樹adbost算法樸素貝葉斯算法回歸算法支持向量機(jī),,,,訓(xùn)練集,學(xué)習(xí)系統(tǒng),

8、測(cè)試系統(tǒng),測(cè)試集,模型,測(cè)試結(jié)果,監(jiān)督學(xué)習(xí)示意圖,,上表是用于區(qū)分不同鳥類需要使用的四個(gè)不同的屬性值，分別選取的是體重、翼展、腳蹼和后背顏色作為評(píng)測(cè)基準(zhǔn)。這些測(cè)量的四種值成為特征，也叫屬性。,,數(shù)據(jù)X={x1,x2,x3,x4} 表示一組數(shù)據(jù)標(biāo)簽label Y={y1,y2,y3,y4}訓(xùn)練集 T={(x1,y1),(x2,y2),(x3,y3)}測(cè)試集 {(x4,y4)}特征損失函數(shù)，訓(xùn)練誤差，測(cè)試誤差經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化與結(jié)

9、構(gòu)風(fēng)險(xiǎn)最小化交叉驗(yàn)證,選取特定的機(jī)器學(xué)習(xí)算法進(jìn)行分類，首先需要做的是訓(xùn)練算法，既學(xué)習(xí)如何分類。通常我們?yōu)樗惴ㄝ斎氪罅恳逊诸悢?shù)據(jù)作為算法的訓(xùn)練集。訓(xùn)練集就是用于訓(xùn)練機(jī)器學(xué)習(xí)算法的數(shù)據(jù)樣本集合，表1是包含5個(gè)樣本集合的訓(xùn)練集，每個(gè)訓(xùn)練樣本有4中特征和一個(gè)目標(biāo)變量，目標(biāo)變量是機(jī)器學(xué)習(xí)算法的預(yù)測(cè)結(jié)果既F(x)，其中x為一組輸入樣本。,損失函數(shù),在監(jiān)督學(xué)習(xí)中，給定x，根據(jù)F(x)給出相應(yīng)的輸出，而這個(gè)輸出是預(yù)測(cè)輸出，和真實(shí)值y可能一致，也可能

10、不一致。用一個(gè)損失函數(shù)或者代價(jià)函數(shù)來度量預(yù)測(cè)錯(cuò)誤的程度。損失函數(shù)是F（x）和y的非負(fù)值函數(shù)，記做L(y,F(x))。,常用的損失函數(shù),（1） 0-1損失函數(shù)（2）平方損失函數(shù) （3）絕對(duì)損失函數(shù) （4）對(duì)數(shù)損失函數(shù),經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化與結(jié)構(gòu)風(fēng)險(xiǎn)最小化,經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的策略認(rèn)為，經(jīng)驗(yàn)風(fēng)險(xiǎn)最小的模型是最優(yōu)模型結(jié)構(gòu)風(fēng)險(xiǎn)最小化是為了防止過擬合而提出的策略。結(jié)構(gòu)風(fēng)險(xiǎn)在經(jīng)驗(yàn)風(fēng)險(xiǎn)的上加上表示模型復(fù)

11、雜度的正則化項(xiàng)或者說是懲罰項(xiàng) min R(f),奧卡姆剃刀原理：在所有可能的模型中，能夠很好地解釋已知數(shù)據(jù)并且十分簡單的次啊是最好的模型，也是應(yīng)該選擇的模型。,如果給定的樣本數(shù)據(jù)充足，進(jìn)行模型選擇的一種簡單方法就是隨機(jī)地將數(shù)據(jù)切分成三部分，分別為訓(xùn)練集，驗(yàn)證集和測(cè)試集。訓(xùn)練集用來訓(xùn)練模型，驗(yàn)證機(jī)用于模型選擇，測(cè)試集用于最終對(duì)學(xué)習(xí)方法的評(píng)估。在學(xué)習(xí)到不同的復(fù)雜度的模型中，選擇對(duì)驗(yàn)證集有最小預(yù)測(cè)誤差的模型

12、。但是，許多實(shí)際應(yīng)用中數(shù)據(jù)并不是充分的，為了選擇好的模型，可以采用交叉驗(yàn)證的方法。交叉驗(yàn)證的基本思想是重復(fù)的使用數(shù)據(jù)；把給定的數(shù)據(jù)進(jìn)行切分，將切分的數(shù)據(jù)集組合成訓(xùn)練集與測(cè)試集，在此基礎(chǔ)上反復(fù)地進(jìn)行訓(xùn)練，測(cè)試以及模型的選擇。,交叉驗(yàn)證,（1）簡單交叉驗(yàn)證：首先隨機(jī)地將已給數(shù)據(jù)分為兩部分，一部分作為訓(xùn)練集，另一部分最為測(cè)試集；然后用訓(xùn)練集在各種條件下訓(xùn)練模型，從而得到不同的模型，在測(cè)試集上評(píng)價(jià)各個(gè)模型的測(cè)試誤差，

13、選出測(cè)試誤差最小的模型（2）S折交叉驗(yàn)證：首先隨機(jī)的把已給的數(shù)據(jù)切分成s個(gè)互不相交的大小相同的子集，然后利用s-1個(gè)子集的數(shù)據(jù)訓(xùn)練模型，利用余下的自己測(cè)試模型；重復(fù)的隨機(jī)選擇訓(xùn)練子集，最后選出評(píng)測(cè)中平均測(cè)試誤差最小的模型（3）留一交叉驗(yàn)證：當(dāng)S=N時(shí)，成為留一交叉驗(yàn)證，這往往在數(shù)據(jù)缺乏的時(shí)候使用。,交叉驗(yàn)證,樸素貝葉斯算法,貝葉斯分類是一類分類算法的總稱，這類算法均以貝葉斯定理為基礎(chǔ)，故統(tǒng)稱為貝葉斯分類假設(shè)一個(gè)樣本集的數(shù)據(jù)分類

14、兩類。P1(x,y)表示數(shù)據(jù)點(diǎn)（x y）屬于類別1的概率，p2(x,y)表示數(shù)據(jù)點(diǎn) （x y）屬于類別2的概率如果p1(x,y)>p2(x,y) 則數(shù)據(jù)（x y）屬于類別1 如果p1(x,y)<p2(x,y) 則數(shù)據(jù)（x y）屬于類別2,貝葉斯分類的基礎(chǔ)——貝葉斯定理,基本流程,1、設(shè) 為一個(gè)待分類項(xiàng)，而每個(gè)a為x的一個(gè)特征屬性。2 有類別集合

15、3 計(jì)算 4 求出最大的則x劃分為類別,,,某個(gè)醫(yī)院早上收了六個(gè)門診病人，如下表。　　癥狀　　職業(yè) 疾病　　打噴嚏　護(hù)士　　　感冒　　打噴嚏　農(nóng)夫　　　過敏　　頭痛　　建筑工人　腦震蕩　　頭痛　　建筑工人　感冒　　打噴嚏　教師　　　感冒　　頭痛　　教師　　　腦震蕩現(xiàn)在又來了第七個(gè)病人，是一個(gè)打噴嚏的建筑工人。

17、0;　　　　= 0.66 x 0.33 x 0.5 / 0.5 x 0.33 　　　　= 0.66因此，這個(gè)打噴嚏的建筑工人，有66%的概率是得了感冒。同理，可以計(jì)算這個(gè)病人患上過敏或腦震蕩的概率。比較這幾個(gè)概率，就可以知道他最可能得什么病。這就是貝葉斯分類器的基本方法：在統(tǒng)計(jì)資料的基礎(chǔ)上，依據(jù)某些特征，計(jì)算各個(gè)類別的概率，從而實(shí)現(xiàn)分類。,基于樸素貝葉斯的文本分類,首先需要拆分文本以便從中獲取特征（詞條），一個(gè)詞條是任

18、意字符的組合。,,,將W 作為一個(gè)個(gè)獨(dú)立的特征，上述公式可寫成,假設(shè)所有詞都相互獨(dú)立（獨(dú)立性加色）,訓(xùn)練階段,創(chuàng)建包含所有文檔中出現(xiàn)的不重復(fù)的詞列表['cute' 'love' 'help' 'garbage' 'quit' 'I' 'problems' 'is' 'park' 'st

19、op' 'flea' 'dalmation' 'licks' 'food' 'not' 'him' 'buying' 'posting' 'has' 'worthless' 'ate' 'to' 'maybe' 'p

20、lease' 'dog' 'how' 'stupid' 'so' 'take' 'mr' 'steak' 'my']然后將每一個(gè)文本片段表示為一個(gè)詞條向量，1表示詞條出現(xiàn)在文檔中，0表示未出現(xiàn)。[0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 1 1 0

21、0 0 0 0 0 1]給出一個(gè)新的文檔 ,計(jì)算,,通過訓(xùn)練集，對(duì)算法進(jìn)行訓(xùn)練得出P1，P2。,測(cè)試階段,給定一個(gè)測(cè)試詞條，轉(zhuǎn)換成詞條向量計(jì)算 = =比較

22、大小。,優(yōu)點(diǎn)：在數(shù)據(jù)較少的情況下仍然有效，可以處理多類別問題缺點(diǎn)：對(duì)于輸入數(shù)據(jù)的準(zhǔn)備方式比較敏感。,決策樹學(xué)習(xí),,決策樹,在示例學(xué)習(xí)中，每一個(gè)概念實(shí)際上可以看成是例子中所屬的一個(gè)類別,,,可以看做是一個(gè)對(duì)目標(biāo)分類的劃分和獲取策略,由一個(gè)根結(jié)點(diǎn)，若干葉結(jié)點(diǎn)和非葉結(jié)點(diǎn)構(gòu)成。根結(jié)點(diǎn)對(duì)應(yīng)于學(xué)習(xí)任務(wù)，分類的開始。每個(gè)葉結(jié)點(diǎn)都包含一個(gè)分類名(概念

23、)，表示一個(gè)實(shí)例的結(jié)束。每個(gè)非葉結(jié)點(diǎn)都包含表示相應(yīng)實(shí)例中的某一屬性。邊代表某一屬性可能的屬性值。,決策樹,從根節(jié)點(diǎn)到葉節(jié)點(diǎn)的每一條路徑都代表一個(gè)具體的實(shí)例同一路徑上的所有屬性之間為合取關(guān)系，不同路徑（即一個(gè)屬性的不同屬性值）之間為析取關(guān)系。決策樹的分類過程就是從這棵樹的根接點(diǎn)開始，按照給定的事例的屬性值去測(cè)試對(duì)應(yīng)的樹枝，并依次下移，直至到達(dá)某個(gè)葉節(jié)點(diǎn)為止。,關(guān)于決策樹：,,可表示為如下規(guī)則集： IF 鳥類會(huì)飛 AN

24、D 是家養(yǎng)的 THEN 該鳥類可能是和平鴿 IF 鳥類會(huì)飛 AND 不是家養(yǎng)的 THEN 該鳥類可能是信天翁 IF 鳥類不會(huì)飛 AND 會(huì)游泳 THEN 該鳥類可能是企鵝 IF 鳥類不會(huì)飛 AND 不會(huì)游泳 THEN 該鳥類可能是鴕鳥,決策樹還可以表示成規(guī)則的形式,昆蘭（J.R.Quinlan）于1979年提出的一種以信息熵（entropy）的下降速度作為屬性選擇

25、標(biāo)準(zhǔn)的一種學(xué)習(xí)算法。輸入是一個(gè)用來描述各種已知類別的例子集學(xué)習(xí)結(jié)果是一棵用于進(jìn)行分類的決策樹,ID3 算法：,1.令根結(jié)點(diǎn)包含例子集中所有實(shí)例。2.如果每個(gè)葉結(jié)點(diǎn)包含的例子都屬于同一分類，則停止劃分。3.否則需對(duì)葉結(jié)點(diǎn)進(jìn)行進(jìn)一步劃分： (1)需要進(jìn)一步劃分的葉結(jié)點(diǎn)所包含的例子組成子例子集S。 (2)找出對(duì)S來說E值最小的屬性abest。 (3)根據(jù)屬性abest的值對(duì)S進(jìn)行劃分，每個(gè)值將生成一個(gè)分枝。

26、 (4) 執(zhí)行步驟2。,,通過E值可以找出一個(gè)最有利于當(dāng)前劃分的屬性,ID3 算法：,,E是一個(gè)基于熵(平均信息量)的函數(shù)，該函數(shù)評(píng) 價(jià)用各屬性進(jìn)行分類所能獲得的信息量，選擇E 值最小即獲得信息量最大的屬性。,ID3 算法,S中屬性ai的值為vij的正例數(shù)目,Nj-為屬性ai的值為vij的反例數(shù)目,熵,熵是研究不確定人工智能的一個(gè)重要參數(shù),熵的歷史可以追溯到19世紀(jì)。1864年德國物理學(xué)家克勞修斯在研究熱力學(xué)時(shí)首先提出熵

27、的概念：,1877年，玻爾茲曼又給出了熵的統(tǒng)計(jì)學(xué)新定義——玻爾茲曼公式，即S=klnW;k為玻爾茲曼常數(shù)；W是某一宏觀態(tài)所對(duì)應(yīng)的微觀態(tài)數(shù)目，即該微觀態(tài)的熱力學(xué)幾率,1948年，香農(nóng)將熵的定義引入信息領(lǐng)域：信息熵,設(shè)一個(gè)系統(tǒng)X由多個(gè)事件|Xi|（i=1，2,…,n）組成，事件Xi的概率為p(Xi)，那么信息熵定義為：,信息熵的定義：,信息熵大，說明什么？,例：給出概率分布,其信息熵分別為：,信息熵越大，不確定性程度越大信息熵表示事件

28、集X中事件出現(xiàn)的平均不確定性當(dāng)X中事件出現(xiàn)的概率相等時(shí)，信息熵達(dá)到最大值,,E是一個(gè)基于熵(平均信息量)的函數(shù)，該函數(shù)評(píng) 價(jià)用各屬性進(jìn)行分類所能獲得的信息量，選擇E 值最小即獲得信息量最大的屬性。,ID3 算法：,S中屬性ai的值為vij的正例數(shù)目,Nj-為屬性ai的值為vij的反例數(shù)目,危險(xiǎn),狗的例子集,E顏色.棕色＝ E顏色.黑色＝,,,∴ E顏色＝5.510＋5.510＝11.020,,顏色=棕色的狗：4只是危險(xiǎn)

29、的，2只不是危險(xiǎn)的。顏色=黑色的狗：2只是危險(xiǎn)的，4只不是危險(xiǎn)的。,E體形.大＝E體形.中＝E體形.?。?,,∴ E體形＝3.245＋3.245＝6.490,體形=大的4條狗全是危險(xiǎn)的；體形=中/小的狗：1條是危險(xiǎn)的；3條不是危險(xiǎn)的。,ID3 算法,E毛型.光滑＝ E毛型.卷毛＝,∴E毛型＝6＋6＝12,,,毛型=光滑的狗：3條是危險(xiǎn)的；3條不是危險(xiǎn)的。毛型=卷毛的狗：3條是危險(xiǎn)的；3條不是危險(xiǎn)的。,因此，

30、E體形< E顏色< E毛型,現(xiàn)在必須對(duì)“中”“小”這兩個(gè)分枝的實(shí)例重復(fù)上述計(jì)算過程。,,E顏色＝4 和 E毛型＝6.490,現(xiàn)在只有“體形”為“中”和“小”的“棕色”狗還沒有明確類別，需用“毛型”來進(jìn)一步劃分。,,,需要的匹配次數(shù)：24,,需要的匹配次數(shù)：36,決策樹的優(yōu)點(diǎn),可以生成可以理解的規(guī)則；計(jì)算量相對(duì)來說不是很大；可以處理連續(xù)和離散字段；決策樹可以清晰的顯示哪些字段比較重要。,AdaBoost元算法,當(dāng)需要做

31、出重要決定的時(shí)候，大家往往會(huì)聽取多個(gè)人的意見而不是一個(gè)人的意見，元算法就是采用這種思想。,機(jī)器學(xué)習(xí)種類繁多，各有優(yōu)缺點(diǎn)。我們自然可以將不同的分類器組合起來，而這種組合結(jié)果稱為集成算法，或者元算法。,集成方法有很多形式：可以是不同算法的集成，也可以是同一算法在不同設(shè)置下的集成，還可以是數(shù)據(jù)集不同部分分配給不同分類器之后的集成。,基于數(shù)據(jù)隨機(jī)重抽樣的分類器構(gòu)建方法,自舉匯聚法，也稱bagging方法，是在原始數(shù)據(jù)集選擇s次后得到s個(gè)新數(shù)據(jù)集

32、的方法。新數(shù)據(jù)集和原數(shù)據(jù)集相等，每個(gè)數(shù)據(jù)集都是通過在原始數(shù)據(jù)集中隨機(jī)選取一個(gè)樣本進(jìn)行替換而得到的。這里的替換意味著可以多次選擇同一個(gè)樣本。,在s個(gè)數(shù)據(jù)建好之后，將某個(gè)學(xué)習(xí)算法分別作用于每個(gè)數(shù)據(jù)集就得到s個(gè)分類器。當(dāng)要對(duì)新數(shù)據(jù)進(jìn)行分類的時(shí)候，需要應(yīng)用s個(gè)分類器進(jìn)行分類，選擇分類器投票結(jié)果中最多的類別作為最后的分類結(jié)果。,另一與bagging類似的技術(shù)是boosting技術(shù)。前者在訓(xùn)練中，不同的訓(xùn)練器是通過串行訓(xùn)練而獲得的，每個(gè)分類器都根據(jù)

33、已訓(xùn)練出的分類器的性能來進(jìn)行訓(xùn)練。而boosting是通過集中關(guān)注已有分類器錯(cuò)分的哪些數(shù)據(jù)獲得新的分類器。,Boosting方法種類很多，其中最流行的就是AdaBoost算法。,,,,,,,,,,,,,,,,,,分類器2,分類器1,分類器3,∑,,,0.69,0.90,0.97,AdaBoost元算法,思想：使用弱分類器和過個(gè)實(shí)例來構(gòu)建一個(gè)強(qiáng)分類器基本過程：訓(xùn)練數(shù)據(jù)中的每個(gè)樣本，并賦予一個(gè)權(quán)重，這些權(quán)重構(gòu)成了向量D，以及分類器的權(quán)值。

34、一開始，這些權(quán)重初始化成相等的值。首先在訓(xùn)練數(shù)據(jù)上訓(xùn)練出一個(gè)弱分類器并計(jì)算該分類器的錯(cuò)誤率，然后再同一數(shù)據(jù)集上再次訓(xùn)練弱分類器。在分類器的第二次訓(xùn)練當(dāng)中，將會(huì)重新調(diào)整每個(gè)樣本的權(quán)重，使分對(duì)的樣本權(quán)重變低，分錯(cuò)的樣本權(quán)重變高，同時(shí)更新分類器的權(quán)值，以此類推。,,其中α是根據(jù)錯(cuò)誤率ε進(jìn)行計(jì)算的，錯(cuò)誤率ε定義如下：而α的計(jì)算公式如下：計(jì)算出α的值后，可以對(duì)權(quán)值向量D進(jìn)行調(diào)整，使那些正確分類的樣本權(quán)值變低，錯(cuò)誤分類的樣本權(quán)值變高。如果

35、一個(gè)樣本被正確分類，則其權(quán)值被更改為：反之：,,假設(shè)訓(xùn)練出m個(gè)分類器，最終的分類結(jié)果等于：,,圖中，“+”和“-”分別表示兩種類別，在這個(gè)過程中，我們使用水平或者垂直的直線作為分類器，來進(jìn)行分類。,,第一步：　根據(jù)分類的正確率，得到一個(gè)新的樣本分布D2，一個(gè)子分類器h1其中：　其中劃圈的樣本表示被分錯(cuò)的。在右邊的途中，比較大的“+”表示對(duì)該樣本做了加權(quán)，,,第二步：根據(jù)分類的正確率，得到一

36、個(gè)新的樣本分布D3，一個(gè)子分類器h2,,第三步：得到一個(gè)子分類器h3,,整合所有的子分類器：,Adaboost優(yōu)點(diǎn),1)adaboost是一種有很高精度的分類器2)可以使用各種方法構(gòu)建子分類器，adaboost算法提供的是框架 3)當(dāng)使用簡單分類器時(shí)，計(jì)算出的結(jié)果是可以理解的。而且弱分類器構(gòu)造極其簡單 4)簡單，不用做特征篩選5)不用擔(dān)心overfitting！,回歸,回歸的目的就是預(yù)測(cè)數(shù)值型的目標(biāo)

37、值。總成績=0.6*期末成績+0.2*期中成績+0.2*平時(shí)成績這就是回歸方程，其中0.6 0.2 0.2就是回歸系數(shù)，求這些回歸系數(shù)的過程就是回歸。假設(shè)我們有一組數(shù)據(jù){X,Y}，X={x1,x2,…,xm},Y={y1,y2,…,ym},對(duì)error求導(dǎo)，并令其等于零，解出,,,局部加權(quán)線性回歸：給待測(cè)點(diǎn)附近每個(gè)點(diǎn)一個(gè)權(quán)重。,,K=1,K=0.01,K=0.003,,如果特征比樣本數(shù)還多（n>m）,輸入矩陣X不是滿秩矩陣，

38、而非滿秩矩陣在求逆會(huì)出現(xiàn)問題。為了解決這個(gè)問題，引入了嶺回歸的概念。,,嶺回歸就是在矩陣上加上一個(gè) 矩陣，使其非奇異。矩陣I 是一個(gè)m*m的單位矩陣，對(duì)角線上為1，其他元素為0. 是自定義的一個(gè)參數(shù)。,Logistic回歸,,,假設(shè)現(xiàn)在有一些數(shù)據(jù)點(diǎn)，我們用一條直線對(duì)這些點(diǎn)擬合（最佳擬合直線），這個(gè)擬合的過程就叫回歸。根據(jù)現(xiàn)有數(shù)據(jù)對(duì)分類邊界線簡歷回歸公式，以此進(jìn)行分類，訓(xùn)練分類器時(shí)的做法

39、就是尋找最佳擬合參數(shù)。,我們想要的函數(shù)應(yīng)該是能夠接受所有的輸入然后預(yù)測(cè)出類別。在兩類的情況下，函數(shù)應(yīng)該輸出0或1.有很多單位躍階函數(shù)（海維賽德躍階函數(shù)）。然而，這種函數(shù)在跳躍點(diǎn)上從0瞬間跳到1上，這個(gè)瞬間躍階很難處理好Sigmoid函數(shù) 當(dāng)x為0時(shí)，函數(shù)值為0.5，隨著x增大，函數(shù)值增大并逼近于1，x減小，函數(shù)值減小并逼近于0.,,如果采用向量

40、的方法寫,X就是輸入數(shù)據(jù)，就是需要進(jìn)行訓(xùn)練的參數(shù)。通過訓(xùn)練后找到最優(yōu)化的參數(shù),梯度上升法,基本思想：想找到某函數(shù)的最大值，最好的方法是沿著該函數(shù)的梯度方向探尋。,梯度上升算法的迭代公式：,,,,每個(gè)回歸系數(shù)初始化為1重復(fù)N次：計(jì)算整個(gè)數(shù)據(jù)集的梯度使用更新回歸系數(shù)返回回歸系數(shù),,,,W=[4.120711455781440, 0.4797796

41、32289162, -0.616416051893343],這個(gè)分類結(jié)果只錯(cuò)分了4個(gè)點(diǎn)，分類精度相當(dāng)不錯(cuò)。但是這個(gè)方法需要大量的計(jì)算，不適用于大規(guī)模的數(shù)據(jù)。,神經(jīng)網(wǎng)絡(luò),人工神經(jīng)網(wǎng)絡(luò)（Artificial Neural Networks，簡寫為ANNs）也簡稱為神經(jīng)網(wǎng)絡(luò)（NNs）或稱作連接模型（Connection Model），它是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征，進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型。這種網(wǎng)絡(luò)依靠系統(tǒng)的復(fù)雜程度，通

42、過調(diào)整內(nèi)部大量節(jié)點(diǎn)之間相互連接的關(guān)系，從而達(dá)到處理信息的目的。,,,86,,連接權(quán)值,87,,改變權(quán)值的過程就是學(xué)習(xí)的過程,88,,規(guī)律？,89,The Hebb Rule,D. Hebb, 1904-1985.Degree in English, 1925.Master degree in psychology at McGill University.Ph.D. from Harvard in 1936.Moved to Y

43、erkes Lab in 1942.Published “The Organization of Behavior” in 1949.,90,Hebb Rule,,,,,,,,,,,,,,synapse,Hebb 規(guī)則是最早的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)規(guī)則之一，其最關(guān)鍵的一條假設(shè)：若一條突觸兩側(cè)的兩個(gè)神經(jīng)元同時(shí)被激活，那么突觸的強(qiáng)度將增大。,91,,權(quán)值W 不僅僅在 a，p 全為正數(shù)增大，在全為負(fù)數(shù)時(shí)也增大,92,Hebb 規(guī)則,如果兩個(gè)神經(jīng)

44、元的突觸同時(shí)激活，那么它們之間的連接強(qiáng)度會(huì)增加,93,自聯(lián)想存儲(chǔ)器– 學(xué)習(xí)規(guī)則,,Supervised Hebbian Learning,94,Matrix Form:,(Zero InitialWeights),學(xué)習(xí)規(guī)則,95,,,,P1 P2 P3,P,,,？,96,P,P3,P2,P1,,Inputs:,Outputs:,Input:,Output: ???,

45、97,,基于heb神經(jīng)網(wǎng)絡(luò)的PCA,傳統(tǒng)PCA算法的缺點(diǎn)：需要大量的計(jì)算屬于批量學(xué)習(xí)基于神經(jīng)網(wǎng)絡(luò)的PCA的優(yōu)點(diǎn)：不需要計(jì)算協(xié)方差矩陣屬于在線學(xué)習(xí),99,基于hebb規(guī)則的權(quán)值更新公式：,,數(shù)據(jù)集,,基于hebb規(guī)則的神經(jīng)網(wǎng)絡(luò)已被證明當(dāng)?shù)螖?shù)無窮大時(shí)，方差趨向于,,,64 pages,102,Sanger proposed the Ge

46、neralized Hebbian Algorithm (GHA),多維壓縮,64 pages,103,GHA Learning Algorithm,64 pages,104,2維壓縮,(Oja Algorithm based onHebb rules),第一個(gè)輸出神經(jīng)元權(quán)值向量,第二個(gè)輸出神經(jīng)元權(quán)值向量,64 pages,105,,…,…,感知機(jī),感知器是用于線性可分模式分類的最簡單的神經(jīng)網(wǎng)絡(luò).它由一個(gè)具有可調(diào)突觸權(quán)值和偏置的神經(jīng)元

47、組成。,,,,…,X1X2xm,,w1,w2,wm,,偏置b,,,v,Φ（·）,輸出Y,感知器權(quán)值自適應(yīng)公式,1.假如訓(xùn)練成員第N個(gè)成員x(n)根據(jù)算法中的第N次迭代的權(quán)值向量w(n)能正確分類，那么感知器的權(quán)值向量不做修改2.否則，感知器的權(quán)值向量根據(jù)以下規(guī)則進(jìn)行修改: w(n+1)=w(n)-η(n)x(n) 假如預(yù)測(cè)結(jié)果為1，實(shí)際屬于類2 w(n+1)=w(n)+η(n

48、)x(n) 假如預(yù)測(cè)結(jié)果為2，實(shí)際屬于類1這里η(n)是學(xué)習(xí)參數(shù)，控制這第n次迭代中作用于權(quán)值向量的調(diào)節(jié),BP神經(jīng)網(wǎng)絡(luò),反向傳播算法也稱BP算法。由于這種算法在本質(zhì)上是一種神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的數(shù)學(xué)模型，所以，有時(shí)也稱為BP模型。BP算法是為了解決多層前向神經(jīng)網(wǎng)絡(luò)的權(quán)系數(shù)優(yōu)化而提出來的；所以，BP算法也通常暗示著神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)是一種無反饋的多層前向網(wǎng)絡(luò)。故而．有時(shí)也稱無反饋多層前向網(wǎng)絡(luò)為BP模型。,基本原理：利用輸出后的誤差來估計(jì)輸

49、出層的直接前導(dǎo)層的誤差，再用這個(gè)誤差估計(jì)更前一層的誤差，如此一層一層的反傳下去，就獲得了所有其他各層的誤差估計(jì),BP神經(jīng)網(wǎng)絡(luò),,,,,具有一層隱藏層的多層感知器,函數(shù)信號(hào)的前向傳播和誤差信號(hào)的反向傳播,BP模型的學(xué)習(xí)過程,反向傳播算法分二步進(jìn)行，即正向傳播和反向傳播。這兩個(gè)過程的工作簡述如下。1．正向傳播輸入的樣本從輸入層經(jīng)過隱單元一層一層進(jìn)行處理，通過所有的隱層之后，則傳向輸出層；在逐層處理的過程中，每一層神經(jīng)元的狀態(tài)只對(duì)下一層神

50、經(jīng)元的狀態(tài)產(chǎn)生影響。在輸出層把現(xiàn)行輸出和期望輸出進(jìn)行比較，如果現(xiàn)行輸出不等于期望輸出，則進(jìn)入反向傳播過程。2．反向傳播反向傳播時(shí)，把誤差信號(hào)按原來正向傳播的通路反向傳回，并對(duì)每個(gè)隱層的各個(gè)神經(jīng)元的權(quán)系數(shù)進(jìn)行修改，以望誤差信號(hào)趨向最小。步驟1,2不斷循環(huán) 直到網(wǎng)絡(luò)輸出誤差減少到可接受程度或者進(jìn)行到預(yù)先設(shè)定的次數(shù)為止。,自組織映射,當(dāng)人腦接收外界的時(shí)空信息時(shí)，大腦皮層的特定區(qū)域會(huì)興奮，而且類似的外界信息在對(duì)應(yīng)的區(qū)域是連續(xù)的。因此Koh

51、onen認(rèn)為，一個(gè)神經(jīng)網(wǎng)絡(luò)在接受外界輸入模式時(shí)，將會(huì)分為不同的對(duì)應(yīng)區(qū)域，且各個(gè)區(qū)域?qū)斎肽Ｊ接胁煌捻憫?yīng)特征，而且這個(gè)特征是自動(dòng)完成的。SOFM只有兩層：輸入層和競(jìng)爭層，競(jìng)爭層神經(jīng)元的排列有多種形式：一維線陣、二維平面、三維柵格等等。,權(quán)值調(diào)整方法是在勝者為王基礎(chǔ)上改進(jìn)的，即優(yōu)勝領(lǐng)域內(nèi)的神經(jīng)元都可以調(diào)整權(quán)值。理論上應(yīng)該是離勝者越近，學(xué)習(xí)率的越大，但是為簡化計(jì)算，實(shí)際中優(yōu)勝領(lǐng)域內(nèi)一般取相同的學(xué)習(xí)率。優(yōu)勝領(lǐng)域開始定的很大，隨著訓(xùn)練次

52、數(shù)的增加，最終應(yīng)該收縮到0。 SOFM分為訓(xùn)練階段和工作階段，要訓(xùn)練階段，權(quán)向量被訓(xùn)練為輸入樣本空間的聚類中心。在工作階段，當(dāng)輸入向量與某個(gè)競(jìng)爭層的內(nèi)星權(quán)值相似時(shí)，自然會(huì)被分到對(duì)應(yīng)的聚類上去。因此SOFM可用作模式分類器。注意當(dāng)輸入模式在訓(xùn)練集中從未出現(xiàn)過時(shí)，SOFM網(wǎng)只能將它歸入最接近的模式分類中去。,自組織映射主要有三個(gè)過程：1.競(jìng)爭。對(duì)每個(gè)輸入模式，網(wǎng)絡(luò)中的神經(jīng)元計(jì)算它們各自判別的函數(shù)值。具有最大函數(shù)值的特定神經(jīng)元成為競(jìng)爭的

53、勝利者2.合作。獲勝神經(jīng)元決定興奮神經(jīng)元的拓?fù)溧徲虻目臻g位置，從而提供這樣的相鄰神經(jīng)元合作的基礎(chǔ)3.突觸調(diào)節(jié)。使興奮神經(jīng)元通過對(duì)它們的突觸權(quán)值進(jìn)行適當(dāng)?shù)恼{(diào)節(jié)以增強(qiáng)它們關(guān)于該輸入模式的判別函數(shù)值。所做的調(diào)節(jié)是獲勝神經(jīng)元對(duì)以后相似的輸入模式響應(yīng)增強(qiáng)了。,遞歸神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)的特點(diǎn),1)可以充分逼近任意復(fù)雜的非線性關(guān)系； (2)所有定量或定性的信息都等勢(shì)分布貯存于網(wǎng)絡(luò)內(nèi)的各神經(jīng)元，故有很強(qiáng)的魯棒性和容錯(cuò)性； (3

眾賞文庫> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

機(jī)器學(xué)習(xí)專題

文檔簡介

溫馨提示

最新文檔

評(píng)論

機(jī)器學(xué)習(xí)專題

文檔簡介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載