Query語義依存分析技術(shù)研究.pdf_第1頁
已閱讀1頁,還剩61頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、互聯(lián)網(wǎng)的飛速發(fā)展使得信息以前所未有的速度產(chǎn)生和傳播,面對信息呈指數(shù)式增長、垃圾信息泛濫成災(zāi)的困境,搜索引擎如何找到對用戶真正有用的信息遇到了很大的挑戰(zhàn)。在傳統(tǒng)的搜索引擎中,用戶輸入查詢(query),搜索引擎返回一個很長的網(wǎng)頁列表。它不知道用戶在問什么,不知道用戶想找什么,只是通過基于關(guān)鍵字匹配的檢索方式,把包含有關(guān)鍵詞的網(wǎng)頁找到;再通過網(wǎng)頁排序的算法,將結(jié)果列表進(jìn)行排序以后展示給用戶,用戶需要在很長的列表中,自己篩選出真正想要的信息。

2、Query語義依存分析技術(shù)首先可以改善傳統(tǒng)搜索引擎中的網(wǎng)頁排序,它能夠?qū)uery進(jìn)行深層語義理解,從而更準(zhǔn)確的理解用戶的需求,減輕用戶篩選信息的負(fù)擔(dān)。
  另一方面,相對于傳統(tǒng)搜索引擎,語義搜索近來受到工業(yè)界和學(xué)術(shù)界的廣泛關(guān)注。和傳統(tǒng)搜索引擎給出信息列表不同,語義搜索將所有信息組織成一個龐大的知識庫,面對用戶的query,它直接從知識庫中檢索并返回答案。從而用戶省去了自己篩選信息的步驟,更快速更直接地達(dá)到搜索的目的。Query語

3、義依存分析技術(shù)可以幫助語義搜索引擎更深刻的理解用戶需求,更準(zhǔn)確的在知識庫中進(jìn)行答案的查找。除此之外,query語義依存分析技術(shù)還在自動問答、智能個人助手、信息檢索、信息抽取等方向有著廣闊的應(yīng)用前景。
  本文提出了基于規(guī)則和基于統(tǒng)計(jì)的兩個語義依存分析技術(shù),主要研究內(nèi)容包括:
  (1)Query語義依存分析和普通句子上的語義依存分析的異同。相對普通句子來說,query具有長度較短且結(jié)構(gòu)松散的特點(diǎn),因而和普通句子上的語義依存分

4、析技術(shù)有很大的差別。
  (2)Query語義依存分析的依存關(guān)系體系的確定,即根據(jù)query的特點(diǎn),以及應(yīng)用的需求,確定一個合適的依存關(guān)系體系。依存關(guān)系體系的確定,首先要考慮體系的完整性,是否能把主要的語義現(xiàn)象覆蓋住。其次也要考慮技術(shù)上的成本、應(yīng)用的需求等。本文確定了五類語義依存關(guān)系,分別是屬性、限定、施事、受事、需求。其中限定關(guān)系又分了六個子類別,分別是時間限定、地點(diǎn)限定、數(shù)字限定、型號限定、疑問限定、否定限定。
  (3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論