基于概念網(wǎng)絡(luò)的信息檢索研究與開發(fā)實踐.pdf_第1頁
已閱讀1頁,還剩65頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、隨著網(wǎng)絡(luò)信息的擴(kuò)張,如何提高信息檢索系統(tǒng)對自然語言的處理能力,成為研究熱點.傳統(tǒng)的基于關(guān)鍵詞字面匹配的方式無法解決復(fù)雜的語言關(guān)聯(lián)問題,一些新的自然語言表達(dá)模型試圖刻畫語義關(guān)系,利用自然語言處理技術(shù)實現(xiàn)對文本信息的理解和檢索.該文在分析已有模型和方法的基礎(chǔ)上,提出了基于概念網(wǎng)絡(luò)的信息檢索思想,旨在采用自然語言處理技術(shù)解決檢索系統(tǒng)文本分析的詞法和語義問題,以語言單位的意義(概念)為核心,構(gòu)建英語概念網(wǎng)絡(luò)的語言知識表達(dá)方式,用于詞法分析、關(guān)聯(lián)

2、搜索、語義匹配與相似度計算等方面.論文的主要內(nèi)容分為三部分:1.研究并闡釋了概念網(wǎng)絡(luò)的表達(dá)體系,將概念網(wǎng)絡(luò)用于英語的自然語言知識的表達(dá).概念(義項)成為描述語言關(guān)聯(lián)現(xiàn)象的基本單位,按屬性、關(guān)系和行為三部分深入分析了概念的組成,不同的概念通過關(guān)系和行為(產(chǎn)生式規(guī)則)聯(lián)系起來成為概念網(wǎng)絡(luò);分析了基于概念網(wǎng)絡(luò)進(jìn)行信息檢索的可行性,對在此基礎(chǔ)上的自然語言處理過程作了策略分析,認(rèn)為需要分階段和層次—詞法、語法、語義和語用;初步構(gòu)建了包含英語概念網(wǎng)

3、絡(luò)在內(nèi)的實驗用知識庫.2.基于知識的多語言詞法分析器.該文利用專家系統(tǒng)的技術(shù),將詞法分析的知識組織成數(shù)據(jù)、知識庫和控制三部分,建立了一套規(guī)則表示與解釋的機(jī)制;需要時推理機(jī)從數(shù)據(jù)庫調(diào)用知識,實現(xiàn)了具體分析規(guī)則的內(nèi)容與程序的分離,使得可以無需修改程序代碼而直接向數(shù)據(jù)庫添加、刪除、更新知識,這給系統(tǒng)更新帶來了方便;對于多語言詞法分析來講,就可能達(dá)到在同一個框架內(nèi)使用內(nèi)容不同的詞法分析知識的目的.這個框架有望能夠以很小的代價發(fā)展成德語、法語等同

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論