已閱讀1頁,還剩57頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、知識圖譜與知識庫在很多類型的應用中被廣泛使用,例如語義網(wǎng)絡,機器翻譯,查詢擴展,文本分類等。此外,分類知識庫也在數(shù)據(jù)清理,實體解析,信息集成領域扮演著重要的角色。隨著知識圖譜中實體與關系規(guī)模的持續(xù)增長,一方面知識圖譜本身可能存在著數(shù)據(jù)質量問題,另一方面,如何對海量數(shù)據(jù)進行存儲、應用是對知識圖譜研究的一個巨大挑戰(zhàn)。
針對上述挑戰(zhàn),本文研究了知識圖譜上的數(shù)據(jù)清理問題并且對知識圖譜的存儲、應用做了一定程度的探索。本文工作分為兩大塊:
2、
首先針對大規(guī)模實體網(wǎng)絡中數(shù)據(jù)清理的挑戰(zhàn),通過分析知識圖譜,我們發(fā)現(xiàn)在大規(guī)模知識圖譜中存在著“孤兒概念”這樣的數(shù)據(jù)問題。本文中就此問題提出了首先基于統(tǒng)計實驗的算法來找到這些存在問題的概念實體,并且通過一系列自然語言與機器學習的方法為這些存在問題的概念實體進行清理。實驗證明,我們基于統(tǒng)計實驗的算法的確可以找到“孤兒概念”并且可以有效的進行清理,從而增加了知識圖譜的準確性。而后對于本文對大規(guī)模網(wǎng)絡存儲以及應用進行了探索,利用了重新
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向中文知識圖譜的數(shù)據(jù)重組與應用.pdf
- 領域應用 知識圖譜的技術與應用
- 領域知識圖譜的技術與應用
- 基于知識圖譜的海量數(shù)據(jù)錯誤標簽的糾正.pdf
- 面向成果轉化的知識圖譜研究及應用.pdf
- 態(tài)勢感知_知識圖譜
- 領域入門知識圖譜地技術與-應用
- 知識圖譜構建方法研究
- 智慧城市解決方案——數(shù)據(jù)化建設知識圖譜
- 智慧城市解決方案——數(shù)據(jù)化建設知識圖譜
- 知識圖譜————8知識的存儲與檢索
- 學術機構知識圖譜的構建研究.pdf
- 教育技術學知識圖譜的構建.pdf
- 基于文言虛詞的知識圖譜構建.pdf
- 產(chǎn)品平臺領域的知識圖譜研究.pdf
- 中醫(yī)健康知識圖譜的構建研究.pdf
- 產(chǎn)品平臺領域的知識圖譜研究
- 基于知識圖譜的知識管理研究進展.pdf
- 國內(nèi)知識轉移研究的知識圖譜分析.pdf
- 基于共詞分析和社會網(wǎng)絡分析的關聯(lián)數(shù)據(jù)知識圖譜構建.pdf
評論
0/150
提交評論