基于概念網(wǎng)絡的信息檢索研究與開發(fā)實踐.pdf_第1頁
已閱讀1頁,還剩65頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著網(wǎng)絡信息的擴張,如何提高信息檢索系統(tǒng)對自然語言的處理能力,成為研究熱點.傳統(tǒng)的基于關鍵詞字面匹配的方式無法解決復雜的語言關聯(lián)問題,一些新的自然語言表達模型試圖刻畫語義關系,利用自然語言處理技術實現(xiàn)對文本信息的理解和檢索.該文在分析已有模型和方法的基礎上,提出了基于概念網(wǎng)絡的信息檢索思想,旨在采用自然語言處理技術解決檢索系統(tǒng)文本分析的詞法和語義問題,以語言單位的意義(概念)為核心,構建英語概念網(wǎng)絡的語言知識表達方式,用于詞法分析、關聯(lián)

2、搜索、語義匹配與相似度計算等方面.論文的主要內容分為三部分:1.研究并闡釋了概念網(wǎng)絡的表達體系,將概念網(wǎng)絡用于英語的自然語言知識的表達.概念(義項)成為描述語言關聯(lián)現(xiàn)象的基本單位,按屬性、關系和行為三部分深入分析了概念的組成,不同的概念通過關系和行為(產(chǎn)生式規(guī)則)聯(lián)系起來成為概念網(wǎng)絡;分析了基于概念網(wǎng)絡進行信息檢索的可行性,對在此基礎上的自然語言處理過程作了策略分析,認為需要分階段和層次—詞法、語法、語義和語用;初步構建了包含英語概念網(wǎng)

3、絡在內的實驗用知識庫.2.基于知識的多語言詞法分析器.該文利用專家系統(tǒng)的技術,將詞法分析的知識組織成數(shù)據(jù)、知識庫和控制三部分,建立了一套規(guī)則表示與解釋的機制;需要時推理機從數(shù)據(jù)庫調用知識,實現(xiàn)了具體分析規(guī)則的內容與程序的分離,使得可以無需修改程序代碼而直接向數(shù)據(jù)庫添加、刪除、更新知識,這給系統(tǒng)更新帶來了方便;對于多語言詞法分析來講,就可能達到在同一個框架內使用內容不同的詞法分析知識的目的.這個框架有望能夠以很小的代價發(fā)展成德語、法語等同

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論