版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、專業(yè)技術(shù)講座學習人工智能人工智能(ArtificialIntelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應用系統(tǒng)的一門新的技術(shù)科學。它是計算機科學的一個分支,它企圖了解智能的實質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應的智能機器,該領(lǐng)域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。人工智能從誕生以來,理論和技術(shù)日益成熟,應用領(lǐng)域也不斷擴大,可以設(shè)想,未來人
2、工智能帶來的科技產(chǎn)品,將會是人類智慧的“容器”。其可以對人的意識、思維的信息過程的模擬。人工智能不是人的智能,但能像人那樣思考、也可能超過人的智能??偟膩碚f是一門極富挑戰(zhàn)性的科學,從事這項工作的人必須懂得計算機知識,心理學和哲學。人工智能是包括十分廣泛的科學,它由不同的領(lǐng)域組成,如機器學習,計算機視覺等等,其研究的一個主要目標是使機器能夠勝任一些通常需要人類智能才能完成的復雜工作。但不同的時代、不同的人對這種“復雜工作”的理解是不同的。
3、第一次具體知道這個概念是在一檔綜藝節(jié)目《最強大腦》。百度研究的人工智能型機器人“小度”和高智商、特殊天賦人群的pk。它向我展示了人工智能在聲音圖像處理上目前已達到的高度。記憶猶新的是一場人臉辨別,陰差陽錯的識別了一對雙胞胎。之前我還在納悶這個機器人到底是靠什么來判斷如何根據(jù)細微的特征來尋找上policy與value網(wǎng)絡(luò)相當于共用了之前大部分的特征提取層,輸出階段的最后幾層結(jié)構(gòu)仍然是相互獨立的。訓練的損失函數(shù)也同時包含了policy和va
4、lue兩部分。這樣的顯然能夠節(jié)省訓練時間,更重要的是混合的policy與value網(wǎng)絡(luò)也許能適應更多種不同情況。在網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計上,新的算法與之前的AlphaGo有兩個大的區(qū)別。首先,與之前將走子策略(policy)網(wǎng)絡(luò)和勝率值(value)網(wǎng)絡(luò)分開訓練不同,新的網(wǎng)絡(luò)結(jié)構(gòu)可以同時輸出該步的走子策略(policy)和當前情形下的勝率值(value)另外一個大的區(qū)別在于特征提取層采用了20或40個殘差模塊,每個模塊包含2個卷積層。與之前采用
5、的12層左右的卷積層相比,殘差模塊的運用使網(wǎng)絡(luò)深度獲得了很大的提升。AlphaGoZero不再需要人工提取的特征應該也是由于更深的網(wǎng)絡(luò)能更有效地直接從棋盤上提取特征。根據(jù)文章提供的數(shù)據(jù),這兩點結(jié)構(gòu)上的改進對棋力的提升貢獻大致相等。因為這些改進,AlphaGoZero的表現(xiàn)和訓練效率都有了很大的提升,僅通過4塊TPU和72小時的訓練就能夠勝過之前訓練用時幾個月的原版AlphaGo。在放棄學習人類棋手的走法以及人工提取特征之后,算法能夠取得
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論