基于本體和規(guī)則的受控自然語言系統(tǒng)模型研究.pdf_第1頁
已閱讀1頁,還剩114頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、從20世紀(jì)50年代至今,自然語言處理作為人工智能的一個重要分支有很大發(fā)展。但是由于自然語言本身的特性,目前計算語言技術(shù)還不能像人一樣處理自然語言,從而限制了自然語言在智能系統(tǒng)中的應(yīng)用。受控自然語言是自然語言的一個子集,以語言學(xué)、邏輯學(xué)、知識分類理論、心理學(xué)和信息學(xué)等為理論基礎(chǔ),在一個領(lǐng)域內(nèi)限制自然語言的詞庫、語法及意義,減少或者消除語言的歧義性和復(fù)雜性的目的,從而提高了自然語言在智能系統(tǒng)中的應(yīng)用性。語義網(wǎng)是目前被廣泛用于知識表示的一種技

2、術(shù),目的是構(gòu)造一個以本體為核心的語義網(wǎng)絡(luò)。目前,由W3C組織提出的OWL 本體和SWRL 規(guī)則技術(shù)規(guī)范已經(jīng)廣泛用于構(gòu)造各種知識庫系統(tǒng)。本文在對受控自然語言、本體及規(guī)則的相關(guān)理論進行深入研究基礎(chǔ)上,提出了基于本體和規(guī)則的受控自然語言系統(tǒng)模型,主要工作包括以下幾個方面:
   首先,建立了基于WordNet的受控自然語言本體詞庫模型CNLNet,采用本體論描述領(lǐng)域概念及概念之間的關(guān)系,便于受控自然語言系統(tǒng)進行歧義消解處理。WordN

3、et是一個規(guī)模最大并且使用最為廣泛的在線英語語義詞典。WordNet 把同義詞集合作為基本元素按照一種系統(tǒng)化結(jié)構(gòu)進行組織,每個同義詞集合代表一個詞匯概念,語義之間的關(guān)系通過概念之間的關(guān)系體現(xiàn),包括同義關(guān)系、反義關(guān)系、整體與部分和上下位關(guān)系等等,形成一個完整的詞匯語義網(wǎng)絡(luò)。本體是從哲學(xué)范疇借用的一個概念,是語義網(wǎng)體系結(jié)構(gòu)中的重要內(nèi)容,具有強大的語義描述能力,采用形式化和結(jié)構(gòu)化的方式從不同的層次對本體及本體之間的關(guān)系進行語義描述,便于計算機

4、可以識別并且對其進行解釋和處理。
   其次,提出了基于本體詞庫的下文無關(guān)文法理論的受控自然語言解釋器CNLInterpreter。CNLInterpreter 有兩部分組成:句法剖析器和語法樹解釋器。句法剖析器以概率詞條化上下文無關(guān)文法理論為基礎(chǔ),結(jié)合CNLNet 本體詞庫,把受控自然語言句子剖析成抽象語法樹;語法樹解釋器把抽象語法樹解釋成中間表達語言篇章表述結(jié)構(gòu),篇章表述結(jié)構(gòu)描述了受控自然語言句子的語義信息。實驗證明該解釋器

5、具有較好的句法剖析和語義解釋能力。然后,提出了基于本體和規(guī)則的受控自然語言系統(tǒng)的推理機CNLReasoner。CNLReasoner的邏輯基礎(chǔ)是語義網(wǎng)OWL 本體公理和SWRL 規(guī)則公理。受控自然語言句子經(jīng)過語言處理部分生成篇章表述結(jié)構(gòu),然后通過知識轉(zhuǎn)換工具轉(zhuǎn)換成語義網(wǎng)OWL 本體和SWRL 規(guī)則知識,最后通過Jess 規(guī)則引擎對知識進行推理。實驗證明了該推理機的正確性和有效性。
   最后,建立了基于本體和規(guī)則的受控自然語言的

6、用戶接口系統(tǒng)模型?;谶壿嫷氖芸刈匀徽Z言具有形式邏輯的基礎(chǔ),除了可以用于描述知識外,還可以作為計算機系統(tǒng)的用戶接口與用戶進行交互。受控自然語言句子通過語言處理部分生成篇章表述結(jié)構(gòu),通過基于本體和規(guī)則的知識庫系統(tǒng)識別用戶輸入的關(guān)鍵語義信息,提交給應(yīng)用系統(tǒng)執(zhí)行相關(guān)操作,并返回執(zhí)行結(jié)果信息。
   通過以上工作,本文詳細(xì)討論了基于本體和規(guī)則的受控自然語言系統(tǒng)模型。本文在本體和規(guī)則的理論基礎(chǔ)上提出了兩種受控自然語言應(yīng)用模型:一是基于本體

7、和規(guī)則的推理系統(tǒng),結(jié)合語義網(wǎng)本體和規(guī)則公理進行推理,構(gòu)建知識庫系統(tǒng);二是基于本體和規(guī)則的用戶接口系統(tǒng),通過本體與規(guī)則分析受控自然語言的語義信息,提交給應(yīng)用系統(tǒng),執(zhí)行系統(tǒng)動作,完成業(yè)務(wù)操作。這兩個系統(tǒng)模型基本實現(xiàn)了本體、規(guī)則和受控自然語言的有機結(jié)合,為受控自然語言在相關(guān)領(lǐng)域范圍內(nèi)應(yīng)用提供技術(shù)支持框架。實驗表明,本文提出的基于本體和規(guī)則的受控自然語言系統(tǒng)模型不僅具有重要的理論意義,而且具有實用價值,本文研究結(jié)果可以作為受控自然語言相關(guān)應(yīng)用研

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論