什么是機器學(xué)習(xí)-huihoo_第1頁
已閱讀1頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,1,機器學(xué)習(xí),第1章 引言,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,2,什么是機器學(xué)習(xí),什么是機器學(xué)習(xí)計算機程序如何隨著經(jīng)驗積累自動提高性能系統(tǒng)自我改進(jìn)的過程歷史成功應(yīng)用學(xué)習(xí)識別人類講話學(xué)習(xí)駕駛車輛學(xué)習(xí)分類新的天文結(jié)構(gòu)學(xué)習(xí)對弈西洋雙陸棋,2003.12.18,機器學(xué)習(xí)-引言 作者

2、:Mitchell 譯者:曾華軍等 講者:陶曉鵬,3,相關(guān)學(xué)科,人工智能計算復(fù)雜性理論控制論信息論統(tǒng)計學(xué),2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,4,學(xué)習(xí)問題的標(biāo)準(zhǔn)描述,定義如果一個計算機針對某類任務(wù)T的用P衡量的性能根據(jù)經(jīng)驗E來自我完善,那么我們稱這個計算機程序在從經(jīng)驗E中學(xué)習(xí),針對某類任務(wù)T,它的性能用P來衡量。西洋跳棋學(xué)習(xí)問題的解釋E,和自己下棋T,參與比賽P,

3、比賽成績(或贏棋能力,擊敗對手的百分比)手寫識別學(xué)習(xí)問題機器人駕駛學(xué)習(xí)問題,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,5,學(xué)習(xí)問題的標(biāo)準(zhǔn)描述(2),定義太寬泛甚至包括了以非常直接的方式通過經(jīng)驗自我提高的計算機程序?qū)嶋H的機器學(xué)習(xí)問題往往比較復(fù)雜定義一類問題探索解決這類問題的方法理解學(xué)習(xí)問題的基本結(jié)構(gòu)和過程,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾

4、華軍等 講者:陶曉鵬,6,設(shè)計一個學(xué)習(xí)系統(tǒng),基本設(shè)計方法和學(xué)習(xí)途徑(以西洋跳棋為例)選擇訓(xùn)練經(jīng)驗選擇目標(biāo)函數(shù)選擇目標(biāo)函數(shù)的表示選擇函數(shù)逼近算法最終設(shè)計,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,7,設(shè)計一個學(xué)習(xí)系統(tǒng),西洋跳棋學(xué)習(xí)問題任務(wù)T,下西洋跳棋性能標(biāo)準(zhǔn)P,擊敗對手的百分比訓(xùn)練經(jīng)驗E,和自己進(jìn)行訓(xùn)練對弈學(xué)習(xí)系統(tǒng)需要選擇要學(xué)習(xí)的知識的確切類型對于這個目標(biāo)知識的表

5、示一種學(xué)習(xí)機制,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,8,選擇訓(xùn)練經(jīng)驗,第一個關(guān)鍵屬性,訓(xùn)練經(jīng)驗?zāi)芊駷橄到y(tǒng)的決策提供直接或間接的反饋第二個重要屬性,學(xué)習(xí)器在多大程度上控制樣例序列第三個重要屬性,訓(xùn)練樣例的分布能多好地表示實例分布,通過樣例來衡量最終系統(tǒng)的性能,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,9,選擇目標(biāo)函數(shù),目標(biāo)函數(shù)C

6、hooseMoveChooseMove: B?M,接受合法棋局集合中的棋盤狀態(tài)作為輸入,并從合法走子集合中選擇某個走子作為輸出問題轉(zhuǎn)化我們把提高任務(wù)T的性能P的問題轉(zhuǎn)化(或簡化)為學(xué)習(xí)像ChooseMove這樣某個特定的目標(biāo)函數(shù),2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,10,選擇目標(biāo)函數(shù)(2),ChooseMove的評價學(xué)習(xí)問題很直觀地轉(zhuǎn)化成這個函數(shù)這個函數(shù)的學(xué)習(xí)很困難,因為

7、提供給系統(tǒng)的是間接訓(xùn)練經(jīng)驗另一個目標(biāo)函數(shù)V一個評估函數(shù),V: B?R,它為任何給定棋局賦予一個數(shù)值評分,給好的棋局賦予較高的評分優(yōu)點,學(xué)習(xí)簡單V的應(yīng)用根據(jù)V能夠輕松地找到當(dāng)前棋局的最佳走法。,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,11,選擇目標(biāo)函數(shù)(3),V的設(shè)計,對于集合B中的任意棋局b,V(b)定義如下如果b是一最終的勝局,那么V(b)=100如果b是一最終的負(fù)局,

8、那么V(b)=-100如果b是一最終的和局,那么V(b)=0如果b不是最終棋局,那么V(b)=V(b’),其中b’是從b開始雙方都采取最優(yōu)對弈后可達(dá)到的終局,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,12,選擇目標(biāo)函數(shù)(4),上面設(shè)計的缺陷遞歸定義運算效率低不可操作簡評學(xué)習(xí)任務(wù)簡化成發(fā)現(xiàn)一個理想目標(biāo)函數(shù)V的可操作描述。通常要完美地學(xué)習(xí)這樣一個V的可操作的形式是非常困難的。

9、一般地,我們僅希望學(xué)習(xí)算法得到近似的目標(biāo)函數(shù)V’,因此學(xué)習(xí)目標(biāo)函數(shù)的過程常稱為函數(shù)逼近。,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,13,選擇目標(biāo)函數(shù)的表示,函數(shù)的表示一張大表,對于每個唯一的棋盤狀態(tài),表中有唯一的表項來確定它的狀態(tài)值規(guī)則集合二項式函數(shù)人工神經(jīng)網(wǎng)絡(luò),2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,14,選擇目標(biāo)函數(shù)的表

10、示(2),重要的權(quán)衡過程一方面,我們總希望選區(qū)一個非常有表現(xiàn)力的描述,以最大可能地逼近理想的目標(biāo)函數(shù)另一方面,越有表現(xiàn)力的描述需要越多的訓(xùn)練數(shù)據(jù),使程序能從它表示的多種假設(shè)中選擇,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,15,選擇目標(biāo)函數(shù)的表示(3),一個簡單的表示法,對于任何給定的棋盤狀態(tài),函數(shù)V可以通過以下棋盤參數(shù)的線性組合來計算。x1,黑子的數(shù)量x2,紅子的數(shù)量x3,黑

11、王的數(shù)量x4,紅王的數(shù)量x5,被紅子威脅的黑子數(shù)量x6,被黑子威脅的紅子數(shù)量,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,16,選擇目標(biāo)函數(shù)的表示(4),目標(biāo)函數(shù)V(b)=w0+w1x1+w2x2+…+w6x6其中,w0…w6是權(quán)值,表示不同棋局特征的相對重要性至此,問題轉(zhuǎn)化為學(xué)習(xí)目標(biāo)函數(shù)中的系數(shù)(即權(quán)值),2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾

12、華軍等 講者:陶曉鵬,17,選擇函數(shù)逼近算法,每個訓(xùn)練樣例表示成二元對b是棋盤狀態(tài),Vtrain(b)是訓(xùn)練值比如,,100>訓(xùn)練過程從學(xué)習(xí)器可得到的間接訓(xùn)練經(jīng)驗中導(dǎo)出上面的訓(xùn)練樣例調(diào)整系數(shù)wi,最佳擬合這些訓(xùn)練樣例,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,18,選擇函數(shù)逼近算法(2),估計訓(xùn)練值困難處一個簡單的方法,Vtrain(b)=V’(Successor(

13、b))調(diào)整權(quán)值最佳擬合的定義,比如誤差平方和最小尋找算法,比如最小均方法,LMS Least Mean Squares,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,19,最終設(shè)計,,,,,,,,,實驗生成器,執(zhí)行系統(tǒng),泛化器,鑒定器,新問題,解答路線,假設(shè),訓(xùn)練樣例,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,20,最終設(shè)計(2),執(zhí)行

14、系統(tǒng)用學(xué)會的目標(biāo)函數(shù)來解決給定的任務(wù)鑒定器以對弈的路線或歷史記錄作為輸入,輸出目標(biāo)函數(shù)的一系列訓(xùn)練樣例。泛化器以訓(xùn)練樣例為輸入,產(chǎn)生一個輸出假設(shè),作為它對目標(biāo)函數(shù)的估計。實驗生成器以當(dāng)前的假設(shè)作為輸入,輸出一個新的問題,供執(zhí)行系統(tǒng)去探索。,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,21,西洋跳棋學(xué)習(xí)的更多討論,圖1-2第13章理論上的保證這種學(xué)習(xí)技術(shù)是否確保發(fā)現(xiàn)一個非常

15、接近的近似。更復(fù)雜的目標(biāo)函數(shù)其他學(xué)習(xí)算法最近鄰算法,存儲訓(xùn)練樣例,尋找保存的最接近的情形來匹配新的情況遺傳算法,產(chǎn)生大量候選的西洋跳棋程序,讓它們相互比賽,保留最成功的程序并進(jìn)一步用模擬進(jìn)化的方式來培育或變異它們基于解釋的學(xué)習(xí),分析每次成敗的原因,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,22,機器學(xué)習(xí)的一個觀點,一個有效的觀點機器學(xué)習(xí)問題歸結(jié)于搜索問題本書給出了對一些基本

16、表示定義的假設(shè)空間的搜索算法通過搜索策略和搜索空間的內(nèi)在結(jié)構(gòu)來刻畫學(xué)習(xí)方法,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬,23,機器學(xué)習(xí)的問題,存在什么樣的算法能從特定的訓(xùn)練數(shù)據(jù)學(xué)習(xí)一般的目標(biāo)函數(shù)呢?如果提供了充足的訓(xùn)練數(shù)據(jù),什么樣的條件下,會使特定的算法收斂到期望的函數(shù)?哪個算法對哪些問題和表示的性能最好?多少訓(xùn)練數(shù)據(jù)是充足的?怎樣找到學(xué)習(xí)到假設(shè)的置信度與訓(xùn)練數(shù)據(jù)的數(shù)量及提供給學(xué)習(xí)器的

17、假設(shè)空間特性之間的一般關(guān)系?學(xué)習(xí)器擁有的先驗知識是怎樣引導(dǎo)從樣例進(jìn)行泛化的過程的?當(dāng)先驗知識僅僅是近似正確時,它們會有幫助嗎?關(guān)于選擇有效的后驗訓(xùn)練經(jīng)驗,什么樣的策略最好?這個策略的選擇會如何影響學(xué)習(xí)問題的復(fù)雜性。怎樣把學(xué)習(xí)任務(wù)簡化為一個或多個函數(shù)逼近問題?換一種方式,系統(tǒng)該試圖學(xué)習(xí)哪些函數(shù)?這個過程本身能自動化嗎?學(xué)習(xí)器怎樣自動地改變表示法來提高表示和學(xué)習(xí)目標(biāo)函數(shù)的能力?,2003.12.18,機器學(xué)習(xí)-引言 作者:Mitch

18、ell 譯者:曾華軍等 講者:陶曉鵬,24,全書內(nèi)容簡介,第2章,基于符號和邏輯表示的概念學(xué)習(xí)第3章,決策樹第4章,人工神經(jīng)網(wǎng)絡(luò)第5章,統(tǒng)計和估計理論的基礎(chǔ)概念第6章,貝葉斯理論第7章,計算學(xué)習(xí)第8章,基于實例的學(xué)習(xí)第9章,遺傳算法第10章,規(guī)則學(xué)習(xí)第11章,基于解釋的學(xué)習(xí)第12章,近似知識與現(xiàn)有數(shù)據(jù)的結(jié)合第13章,增強學(xué)習(xí),2003.12.18,機器學(xué)習(xí)-引言 作者:Mitchell 譯者:曾華軍等 講者:陶曉鵬

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論