版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、隨著互聯(lián)網(wǎng)和萬維網(wǎng)(World Wide Web)的快速繁榮發(fā)展,萬維網(wǎng)逐漸成為人們生活中不可或缺的一種信息獲取來源。萬維網(wǎng)給信息檢索技術(shù)帶來了極大的機(jī)遇和挑戰(zhàn)。經(jīng)過最近十幾年的發(fā)展,信息檢索已經(jīng)由一個純粹的學(xué)術(shù)研究學(xué)科轉(zhuǎn)變成大多數(shù)人信息獲取的技術(shù)基礎(chǔ)。
隨著Web2.0概念的普及和發(fā)展,萬維網(wǎng)不再僅僅是一個巨大的信息庫,更逐漸成為一個用戶參與和交流的平臺。Web2.0應(yīng)用網(wǎng)站的蓬勃發(fā)展將再次推動信息檢索技術(shù)的革新。本文認(rèn)
2、為,在Web2.0時(shí)代,信息檢索技術(shù)主要有以下三方面的發(fā)展趨勢:1)更加靈活的個性化信息服務(wù)。隨著用戶的急劇增加,Web2.0網(wǎng)站迫切需要滿足用戶的個性化信息需求。然而,傳統(tǒng)的Web信息檢索技術(shù)并不擅長處理Web2.0應(yīng)用的復(fù)雜結(jié)構(gòu)數(shù)據(jù)。Web2.0需要更加靈活的個性化信息服務(wù),如信息推薦系統(tǒng)。2)更加有效的多媒體數(shù)據(jù)檢索技術(shù)。隨著Web2.0的普及,用戶可以很方便地上傳和分享多媒體信息。多媒體數(shù)據(jù)的迅速增多使得多媒體信息檢索技術(shù)成為人
3、們關(guān)注的焦點(diǎn)。3)檢索服務(wù)的專業(yè)化。當(dāng)前,Web2.0應(yīng)用中的用戶產(chǎn)生數(shù)據(jù)已經(jīng)成為萬維網(wǎng)這個巨大信息庫的重要組成部分之一。過于繁雜的Web數(shù)據(jù)使得Web信息檢索向領(lǐng)域化、專業(yè)化方向發(fā)展。
很多Web數(shù)據(jù)呈現(xiàn)復(fù)雜的內(nèi)在關(guān)聯(lián)結(jié)構(gòu)。本文指出,為了更好地解決這些數(shù)據(jù)上的相關(guān)檢索問題、提升檢索效果,就需要充分利用蘊(yùn)含在數(shù)據(jù)復(fù)雜關(guān)聯(lián)結(jié)構(gòu)中的知識。圖學(xué)習(xí)技術(shù)能夠?qū)?fù)雜關(guān)聯(lián)結(jié)構(gòu)進(jìn)行較好地建模并捕捉其中蘊(yùn)含的知識。因此,結(jié)合上述發(fā)展趨勢,本
4、文研究工作圍繞基于圖學(xué)習(xí)的Web信息檢索技術(shù)展開,具體在以下四個相關(guān)研究問題上進(jìn)行深入研究并提出了新穎的圖學(xué)習(xí)算法:
1)Web2.0社區(qū)化標(biāo)簽應(yīng)用中的個性化標(biāo)簽推薦:社區(qū)化標(biāo)簽應(yīng)用中用戶可以對資源任意地加標(biāo)簽。產(chǎn)生的標(biāo)簽標(biāo)注數(shù)據(jù)可以很自然地用圖來建模。本文提出一種新的基于圖的多類關(guān)聯(lián)對象查詢排序算法,以解決社區(qū)化標(biāo)簽應(yīng)用中的個性化標(biāo)簽推薦問題。
2)Web2.0社區(qū)化標(biāo)簽應(yīng)用中的個性化文檔推薦;傳統(tǒng)的信息推
5、薦系統(tǒng)聚焦在評級打分?jǐn)?shù)據(jù)上,而社區(qū)化標(biāo)簽應(yīng)用中的標(biāo)簽標(biāo)注數(shù)據(jù)是一種不同的且具有特殊圖結(jié)構(gòu)的數(shù)據(jù)。本文提出一種新的基于圖的多類關(guān)聯(lián)對象降維(語義空間學(xué)習(xí))算法,將用戶、標(biāo)簽和文檔映射到同一語義空間中,然后根據(jù)用戶與文檔之間的歐式距離來進(jìn)行文檔推薦。
3)人臉圖像檢索與識別:傳統(tǒng)的人臉檢索和識別研究利用降維技術(shù)(子空間學(xué)習(xí))來獲得人臉圖像的高層次特征表達(dá)。最近提出的一種基于圖的二階張量子空間學(xué)習(xí)算法在人臉圖像上表現(xiàn)比較出色,但
6、是其時(shí)間復(fù)雜度比較高。本文提出一種新的基于圖的高效二階張量子空間學(xué)習(xí)算法,在保證可接受的檢索、識別性能的同時(shí),降低了學(xué)習(xí)子空間映射函數(shù)的時(shí)間復(fù)雜度。
4)高質(zhì)量專業(yè)Web資源抓取:聚焦爬蟲是從Web上抓取主題相關(guān)信息資源的一種重要技術(shù)手段。對垂直搜索引擎來講,最重要的研究問題之一是如何從Web中把高質(zhì)量的相關(guān)資源找出來。本文提出一種新的基于Web圖的網(wǎng)頁主題質(zhì)量在線評估算法,并在此基礎(chǔ)上設(shè)計(jì)了一個獲取高質(zhì)量主題相關(guān)、Web
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于半監(jiān)督流形學(xué)習(xí)的Web信息檢索技術(shù)研究.pdf
- 基于領(lǐng)域主題的Web信息檢索技術(shù)研究.pdf
- 基于WEB的信息檢索再處理技術(shù)研究.pdf
- 基于移動終端的Web信息檢索技術(shù)研究.pdf
- 基于Web的個性化信息檢索技術(shù)研究.pdf
- 基于時(shí)態(tài)語義的Web信息檢索關(guān)鍵技術(shù)研究.pdf
- Web信息檢索的關(guān)鍵技術(shù)研究.pdf
- Web信息檢索排序函數(shù)技術(shù)研究.pdf
- 基于改進(jìn)向量空間模型的Web信息檢索技術(shù)研究.pdf
- Web主題信息檢索中的語義檢索技術(shù)研究及應(yīng)用.pdf
- 基于文本的Web圖像檢索技術(shù)研究.pdf
- 基于語義Web技術(shù)的智能信息檢索研究.pdf
- 基于概念檢索的智能信息檢索技術(shù)研究.pdf
- 基于本體的Web信息檢索系統(tǒng)及其關(guān)鍵技術(shù)研究.pdf
- 基于文本的WEB圖片檢索技術(shù)研究.pdf
- 位置相關(guān)的Web信息檢索關(guān)鍵技術(shù)研究.pdf
- Web信息檢索及應(yīng)用設(shè)計(jì)優(yōu)化技術(shù)研究.pdf
- Web信息檢索與主題提取的關(guān)鍵技術(shù)研究.pdf
- 面向智能信息檢索的Web挖掘關(guān)鍵技術(shù)研究.pdf
- 基于web的普通話新聞檢索技術(shù)研究.pdf
評論
0/150
提交評論