

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)庫(kù)系統(tǒng)是用來(lái)組織、存儲(chǔ)和管理數(shù)據(jù)的倉(cāng)庫(kù),它在企業(yè)、部門乃至個(gè)人的日常生產(chǎn)生活等諸多領(lǐng)域都得到了廣泛的應(yīng)用。隨著現(xiàn)代互聯(lián)網(wǎng)的迅速發(fā)展,信息呈現(xiàn)爆炸式增長(zhǎng),數(shù)據(jù)庫(kù)系統(tǒng)存儲(chǔ)的信息小斷增多,用戶搜索這些信息的需求也日益激增。傳統(tǒng)的數(shù)據(jù)庫(kù)訪問(wèn)方式需要用戶掌握結(jié)構(gòu)化的查詢語(yǔ)言,了解并且熟悉底層的數(shù)據(jù)模式,而這對(duì)于大多數(shù)的普通用戶來(lái)說(shuō)是非常復(fù)雜的。受到關(guān)鍵字查詢?cè)趙eb搜索引擎上獲得巨大成功的影響,近些年來(lái)在數(shù)據(jù)庫(kù)支持關(guān)鍵字查詢得到了來(lái)自數(shù)據(jù)庫(kù)領(lǐng)
2、域和信息檢索領(lǐng)域研究人員的廣泛關(guān)注并且成為新興的研究熱點(diǎn)。
不同于傳統(tǒng)的數(shù)據(jù)庫(kù)查詢方式,數(shù)據(jù)庫(kù)上的關(guān)鍵字查詢簡(jiǎn)單易用,查詢沒(méi)有固定的格式限制,極大地減輕了用戶學(xué)習(xí)和記憶的壓力。但是這也給如何開(kāi)發(fā)一個(gè)高效健壯的關(guān)鍵字查詢系統(tǒng)帶來(lái)了巨大挑戰(zhàn)。傳統(tǒng)的數(shù)據(jù)庫(kù)查詢的結(jié)果是一組孤立的元組,而關(guān)鍵字查詢則需要從數(shù)據(jù)庫(kù)的不同表中組合與關(guān)鍵字匹配的元組來(lái)形成最終結(jié)果,這會(huì)導(dǎo)致查詢的搜索空間急膨脹。一般來(lái)講,關(guān)鍵字查詢的搜索空間與查詢中的關(guān)鍵字?jǐn)?shù)
3、目成指數(shù)型關(guān)系。還有關(guān)鍵字查詢經(jīng)常是臟的,用戶的查詢中經(jīng)常包含一些不相關(guān)或者不正確的詞,而通常這些臟查詢會(huì)對(duì)隨后的查詢處理的效率和準(zhǔn)確性產(chǎn)生負(fù)面的影響。
為了解決查詢的搜索空間指數(shù)性爆炸這一問(wèn)題,一個(gè)被稱作查詢清理的預(yù)處理步驟被引入進(jìn)來(lái),它被用來(lái)清理用戶提交的原始查詢并抽取出高質(zhì)量的查詢項(xiàng)。這個(gè)新增的預(yù)處理步驟不僅改進(jìn)后續(xù)查詢結(jié)果的質(zhì)量,而且還大大地降低了后續(xù)的查詢搜索算法的搜索空間。但是它仍然存在一些問(wèn)題,即引入的查詢清理算
4、法并沒(méi)有考慮到用戶偏好,而這樣的偏好可以用來(lái)進(jìn)一步改進(jìn)查詢清理的質(zhì)量。
基于模式圖的關(guān)鍵字查詢方法存它的執(zhí)行過(guò)程中會(huì)生成大量的候選網(wǎng)絡(luò),其中有些候選網(wǎng)絡(luò)所表示的關(guān)系沒(méi)有實(shí)際意義的或者極少被用戶訪問(wèn),而有些候選網(wǎng)絡(luò)所表示的關(guān)系則更為用戶所偏好,即用戶經(jīng)常訪問(wèn)這類關(guān)系。而傳統(tǒng)的基于模式圖的方法通常按照候選網(wǎng)絡(luò)大小遞增的順序依次求解候選網(wǎng)絡(luò),而不是按照用戶對(duì)候選網(wǎng)絡(luò)的偏好程度對(duì)候選網(wǎng)絡(luò)求解,這樣做也會(huì)影響到整個(gè)查詢執(zhí)行的效率和查詢結(jié)
5、果的質(zhì)量。
本文主要針對(duì)數(shù)據(jù)庫(kù)關(guān)鍵字查詢中存在的上述問(wèn)題,借助于記錄用戶行為的查詢?nèi)罩?提出兩種基于查詢?nèi)罩痉椒〝U(kuò)展原有的查詢清理方法以進(jìn)一步改進(jìn)查詢清理的質(zhì)量。還使用樹(shù)數(shù)據(jù)挖掘算法來(lái)對(duì)用戶的查詢?nèi)罩具M(jìn)行挖掘來(lái)獲取用戶偏好,并通過(guò)它來(lái)改進(jìn)基于模式圖的關(guān)鍵字查詢方法。木文的主要上作及成果如下:
(1)針對(duì)提出的查詢清理算法中的原始得分函數(shù),在它的基礎(chǔ)上提出了兩種利用查詢?nèi)罩具M(jìn)行擴(kuò)展的方法。原始的得分函數(shù)僅僅根據(jù)數(shù)據(jù)庫(kù)來(lái)
6、對(duì)產(chǎn)生的項(xiàng)進(jìn)行評(píng)分,沒(méi)有考慮到該項(xiàng)存在志中的使用行為。我們基于查詢?nèi)罩臼褂脙煞N不同方式來(lái)對(duì)產(chǎn)生的項(xiàng)進(jìn)行評(píng)分,從而獲得一個(gè)項(xiàng)的日志評(píng)分。最后再將得到的日志評(píng)分和原始的評(píng)分按照某種方式結(jié)合起來(lái)形成項(xiàng)的最終評(píng)分。我們給出的實(shí)驗(yàn)證明提出的兩種改進(jìn)方法都存一定程度上改進(jìn)查詢清理的質(zhì)量,獲得了不錯(cuò)的效果。
(2)通過(guò)使用查詢?nèi)罩緛?lái)進(jìn)一步改進(jìn)傳統(tǒng)的基于模式圖的查詢方法。一般地,基于模式圖的查詢算法通常按兩個(gè)步驟處理查詢:候選網(wǎng)絡(luò)生成和候選網(wǎng)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)據(jù)庫(kù)關(guān)鍵字查詢清理技術(shù)研究.pdf
- 關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵字查詢優(yōu)化研究.pdf
- 基于關(guān)鍵字的關(guān)系數(shù)據(jù)庫(kù)查詢技術(shù)的研究.pdf
- 不確定數(shù)據(jù)庫(kù)的關(guān)鍵字查詢算法研究.pdf
- 面向關(guān)系數(shù)據(jù)庫(kù)的語(yǔ)義關(guān)鍵字查詢研究.pdf
- 基于E-R圖的關(guān)系數(shù)據(jù)庫(kù)關(guān)鍵字查詢.pdf
- 分布式關(guān)系數(shù)據(jù)庫(kù)上的關(guān)鍵字查詢.pdf
- 面向關(guān)系數(shù)據(jù)庫(kù)關(guān)鍵字查詢的物化視圖維護(hù)方法研究.pdf
- 基于語(yǔ)義信息的面向數(shù)據(jù)庫(kù)的Top-k關(guān)鍵字查詢技術(shù).pdf
- 基于查詢語(yǔ)義的XML關(guān)鍵字查詢算法的研究.pdf
- 基于關(guān)鍵字的XML查詢.pdf
- 基于查詢語(yǔ)義的xml關(guān)鍵字查詢算法的研究(1)
- 基于關(guān)鍵字查詢的數(shù)據(jù)庫(kù)搜索引擎系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于XML的關(guān)鍵字查詢算法研究.pdf
- 關(guān)鍵字查詢性能優(yōu)化研究.pdf
- 基于關(guān)鍵字的模糊查詢技術(shù)的研究.pdf
- XML上基于SLCA的關(guān)鍵字查詢研究.pdf
- 數(shù)據(jù)庫(kù)查詢
- 關(guān)鍵數(shù)據(jù)庫(kù)的關(guān)鍵詞查詢研究
- XML關(guān)鍵字查詢中數(shù)據(jù)索引和查詢結(jié)果排序算法研究.pdf
評(píng)論
0/150
提交評(píng)論