

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、人工智能的核心技術是什么?《人工智能標準化白皮書(2018)》1機器學習機器學習(MachineLearning)是一門涉及統(tǒng)計學、系統(tǒng)辨識、逼近理論、神經(jīng)網(wǎng)絡、優(yōu)化理論、計算機科學、腦科學等諸多領域的交叉學科,研究計算機怎樣模擬或實現(xiàn)人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能,是人工智能技術的核心?;跀?shù)據(jù)的機器學習是現(xiàn)代智能技術中的重要方法之一,研究從觀測數(shù)據(jù)(樣本)出發(fā)尋找規(guī)律,利用這些規(guī)律
2、對未來數(shù)據(jù)或無法觀測的數(shù)據(jù)進行預測。根據(jù)學習模式、學習方法以及算法的不同,機器學習存在不同的分類方法。(1)根據(jù)學習模式將機器學習分類為監(jiān)督學習、無監(jiān)督學習和強化學習等。監(jiān)督學習監(jiān)督學習是利用已標記的有限訓練數(shù)據(jù)集,通過某種學習策略方法建立一個模型,實現(xiàn)對新數(shù)據(jù)實例的標記(分類)映射,最典型的監(jiān)督學習算法包括回歸和分類。監(jiān)督學習要求訓練樣本的分類標簽已知,分類標簽精確度越高,樣本越具有代表性,學習模型的準確度越高。監(jiān)督學習在自然語言處理
3、、信息檢索、文本挖掘、手寫體辨識、垃圾郵件偵測等領域獲得了廣泛應用。無監(jiān)督學習無監(jiān)督學習是利用無標記的有限數(shù)據(jù)描述隱藏在未標記數(shù)據(jù)中的結構規(guī)律,最典型的非監(jiān)督學習算法包括單類密度估計、單類數(shù)據(jù)降維、聚類等。無監(jiān)督學習不需要訓練樣本和人工標注數(shù)據(jù),便于壓縮數(shù)據(jù)存儲、減少計算量、提升算法速度,還可以避免正、負樣本偏移引起的分類錯誤問題。主要用于經(jīng)濟預測、異常檢測、數(shù)據(jù)挖掘、圖像處理、模式識別等領域,例如組織大型計算機集群、社交網(wǎng)絡分析、市場
4、分割、天文數(shù)據(jù)分析等。強化學習強化學習是智能系統(tǒng)從環(huán)境到行為映射的學習,以使強化信號函數(shù)值最大。由于外部環(huán)境提供的信息很少,強化學習系統(tǒng)必須靠自身的經(jīng)歷進行學習。強化學習的目標是學習從環(huán)境狀態(tài)到行為的映射,使得智能體選擇的行為能夠獲得環(huán)境最大的獎賞,使得外部環(huán)境對學習系統(tǒng)在某種意義下的評價為最佳。其在機器人控制、無人駕駛、下棋、工業(yè)控制等領域獲得成功應用。(2)根據(jù)學習方法可以將機器學習分為傳統(tǒng)機器學習和深度學習。傳統(tǒng)機器學習傳統(tǒng)機器學
5、習從一些觀測(訓練)樣本出發(fā),試圖發(fā)現(xiàn)不能通過原理分析獲得的規(guī)律,實現(xiàn)對未來數(shù)據(jù)行為或趨勢的準確預測。相關算法包括邏輯回歸、隱馬爾科夫方法、支持向種自適應機制以確定演化機制的影響等。2知識圖譜知識圖譜本質上是結構化的語義知識庫,是一種由節(jié)點和邊組成的圖數(shù)據(jù)結構,以符號形式描述物理世界中的概念及其相互關系,其基本組成單位是“實體—關系—實體”三元組,以及實體及其相關“屬性—值”對。不同實體之間通過關系相互聯(lián)結,構成網(wǎng)狀的知識結構。在知識圖
6、譜中,每個節(jié)點表示現(xiàn)實世界的“實體”,每條邊為實體與實體之間的“關系”。通俗地講,知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關系網(wǎng)絡,提供了從“關系”的角度去分析問題的能力。知識圖譜可用于反欺詐、不一致性驗證、組團欺詐等公共安全保障領域,需要用到異常分析、靜態(tài)分析、動態(tài)分析等數(shù)據(jù)挖掘方法。特別地,知識圖譜在搜索引擎、可視化展示和精準營銷方面有很大的優(yōu)勢,已成為業(yè)界的熱門工具。但是,知識圖譜的發(fā)展還有很大的挑戰(zhàn),如數(shù)據(jù)的噪聲問
7、題,即數(shù)據(jù)本身有錯誤或者數(shù)據(jù)存在冗余。隨著知識圖譜應用的不斷深入,還有一系列關鍵技術需要突破。3自然語言處理自然語言處理是計算機科學領域與人工智能領域中的一個重要方向,研究能實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法,涉及的領域較多,主要包括機器翻譯、機器閱讀理解和問答系統(tǒng)等。(1)機器翻譯機器翻譯技術是指利用計算機技術實現(xiàn)從一種自然語言到另外一種自然語言的翻譯過程。基于統(tǒng)計的機器翻譯方法突破了之前基于規(guī)則和實例翻譯方法的
8、局限性,翻譯性能取得巨大提升?;谏疃壬窠?jīng)網(wǎng)絡的機器翻譯在日常口語等一些場景的成功應用已經(jīng)顯現(xiàn)出了巨大的潛力。隨著上下文的語境表征和知識邏輯推理能力的發(fā)展,自然語言知識圖譜不斷擴充,機器翻譯將會在多輪對話翻譯及篇章翻譯等領域取得更大進展。目前非限定領域機器翻譯中性能較佳的一種是統(tǒng)計機器翻譯,包括訓練及解碼兩個階段。訓練階段的目標是獲得模型參數(shù),解碼階段的目標是利用所估計的參數(shù)和給定的優(yōu)化目標,獲取待翻譯語句的最佳翻譯結果。統(tǒng)計機器翻譯主
9、要包括語料預處理、詞對齊、短語抽取、短語概率計算、最大熵調序等步驟?;谏窠?jīng)網(wǎng)絡的端到端翻譯方法不需要針對雙語句子專門設計特征模型,而是直接把源語言句子的詞串送入神經(jīng)網(wǎng)絡模型,經(jīng)過神經(jīng)網(wǎng)絡的運算,得到目標語言句子的翻譯結果。在基于端到端的機器翻譯系統(tǒng)中,通常采用遞歸神經(jīng)網(wǎng)絡或卷積神經(jīng)網(wǎng)絡對句子進行表征建模,從海量訓練數(shù)據(jù)中抽取語義信息,與基于短語的統(tǒng)計翻譯相比,其翻譯結果更加流暢自然,在實際應用中取得了較好的效果。(2)語義理解語義理解
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論