海量科學(xué)文獻(xiàn)中知識檢索與推理的融合.pdf_第1頁
已閱讀1頁,還剩141頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、萬維網(wǎng)知識表示相關(guān)研究的進(jìn)展,特別是鏈接數(shù)據(jù)項(xiàng)目及相關(guān)數(shù)據(jù)集的發(fā)布,使得人類知識庫達(dá)到了前所未有的規(guī)模。從網(wǎng)頁中提取結(jié)構(gòu)化知識的研究更促進(jìn)了人類知識庫向“萬維網(wǎng)規(guī)?!卑l(fā)展。檢索與推理是知識處理的兩種重要手段,而知識規(guī)模的海量性為這兩種手段提出了巨大的挑戰(zhàn):
   1.對于檢索:由于萬維網(wǎng)用戶背景及需求的差異,對于同樣的查詢輸入,不同的用戶可能期望得到更適合自己需求的結(jié)果。傳統(tǒng)知識檢索系統(tǒng)難以滿足上述需求,特別是在海量知識庫背景下

2、。
   2.對于推理:由于萬維網(wǎng)海量知識庫存在規(guī)模大、不完備、動(dòng)態(tài)變化的特點(diǎn),傳統(tǒng)方法的假設(shè)(如小規(guī)模的事實(shí)與公理集、推理規(guī)則的完備性、知識源的靜態(tài)性等)使得在萬維網(wǎng)海量知識庫上有效推理十分困難。
   本文圍繞以上問題,提出了知識檢索與推理的雙向融合方法與具體策略,并以萬維網(wǎng)上科學(xué)文獻(xiàn)知識庫為背景進(jìn)行了驗(yàn)證,具體研究內(nèi)容概括如下:
   1.知識檢索與推理的融合框架:在海量信息與知識處理的已有研究成果中,曾提

3、出通過邏輯改善檢索,以及通過搜索改善推理的思想。以上兩種思想缺乏具體的實(shí)現(xiàn)策略與在實(shí)際問題求解中的驗(yàn)證,且相關(guān)的方法強(qiáng)調(diào)單向的改善。本文在結(jié)合以上兩種思想的基礎(chǔ)上研究了知識檢索與推理的雙向融合框架。
   2.萬維網(wǎng)知識結(jié)構(gòu)及組織方法:本文以概念及其關(guān)系為基礎(chǔ),對知識結(jié)構(gòu)的基本組成與定義進(jìn)行了論述,并在此基礎(chǔ)上研究了集成萬維網(wǎng)分散式知識源的方法。結(jié)合粒度理論,本文研究了兩類萬維網(wǎng)知識組織方法,并討論了針對不同知識組織方法生成的知

4、識結(jié)構(gòu)的基本操作與運(yùn)用。
   3.研究興趣的測度及其結(jié)構(gòu)與動(dòng)力學(xué)特性:為了在動(dòng)態(tài)變化的知識源中追蹤用戶研究興趣的變化,本文研究了量化刻畫研究興趣的測度方法。為了深刻認(rèn)識研究興趣的特點(diǎn),本文依據(jù)復(fù)雜網(wǎng)絡(luò)與人類行為動(dòng)力學(xué)理論,對研究興趣的結(jié)構(gòu)及其動(dòng)力學(xué)特性進(jìn)行了探索與分析。
   4.知識檢索與推理的融合方法與策略:本文依據(jù)研究興趣的結(jié)構(gòu)與動(dòng)力學(xué)特性,從不同角度(如累加興趣、保留興趣、興趣時(shí)延等)量化衡量科研人員研究興趣,

5、并將其作為融合知識檢索與推理的依據(jù)。受粒計(jì)算理論“多層次、多視角的結(jié)構(gòu)化問題求解”思想的啟發(fā),本文研究了運(yùn)用知識結(jié)構(gòu)的?;M織及問題求解的?;枷虢鉀Q知識處理中規(guī)模問題的具體策略。
   本文的主要貢獻(xiàn)體現(xiàn)在以下幾方面:
   1.為應(yīng)對知識處理的規(guī)模瓶頸,提出了以用戶為中心的知識檢索與推理雙向融合框架。該框架強(qiáng)調(diào)融合的雙向性,即:在檢索過程中,以用戶興趣之間的差異為出發(fā)點(diǎn),通過與興趣相關(guān)的推理改善檢索;在推理過程中,通

6、過檢索與用戶興趣相關(guān)的知識源子集,減少與查詢及用戶需求無關(guān)的推理。此外,該框架還通過用戶反饋指導(dǎo)檢索與推理進(jìn)行更為交互式的、貼近用戶需求的融合。
   2.結(jié)合信息表、粒邏輯及萬維網(wǎng)知識表示語言的表達(dá)能力,提出了?;R結(jié)構(gòu)并探討了其多層次、多視角的組織方法,為融合知識檢索與推理提供了可行的依據(jù)。在?;R結(jié)構(gòu)的基礎(chǔ)上,針對萬維網(wǎng)知識源的分散性,提出了通過多種基本運(yùn)算用于集成知識源,討論了由此產(chǎn)生的知識結(jié)構(gòu)在海量知識處理中的潛在

7、意義。
   3.為追蹤科研人員研究興趣及動(dòng)態(tài)變化過程,提出了具體測度方法,特別是針對捕捉近期興趣,受人類認(rèn)知記憶理論啟發(fā),提出了類似記憶保持的保留興趣模型。采用復(fù)雜網(wǎng)絡(luò)與人類行為動(dòng)力學(xué)理論,部分揭示了研究興趣的結(jié)構(gòu)與動(dòng)力學(xué)特點(diǎn),特別是興趣分布、興趣時(shí)延遵循冪律的結(jié)論為基于興趣融合知識檢索與推理提供了理論保證。
   4.根據(jù)以上有關(guān)用戶興趣及知識粒化組織的研究成果,提出了基于興趣及基于粒度兩種融合檢索與推理的具體方法。

8、基于興趣的融合方法包含兩種策略,即基于興趣的查詢優(yōu)化策略和基于興趣的子集預(yù)選查詢策略。這種方法在檢索與推理的融合過程中從不同角度(累加興趣、保留興趣、興趣時(shí)延角度等)融入用戶背景,使得知識處理的結(jié)果更貼近特定用戶。基于粒度的融合方法包含起始點(diǎn)策略、多層完備度策略、多層特定度策略、多視角策略、及不同策略的融合。該方法以不完備知識處理為背景,運(yùn)用知識源的粒化組織特點(diǎn)減少知識處理的開銷,并為從不同層次和視角滿足用戶需求提供了可行的方法。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論