基于Web的人物信息搜索關(guān)鍵問題研究.pdf_第1頁
已閱讀1頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、互聯(lián)網(wǎng)技術(shù)的快速發(fā)展和網(wǎng)絡(luò)數(shù)據(jù)的爆發(fā)式增長,使得Web上積累了海量的信息資源,Web成為人們獲取信息的重要渠道。人是客觀活動的主體,人物信息是一種很重要的資源,通過Web對人物信息進行搜索是一種很常見的行為。但是海量的信息存在同時增加信息搜索的難度,如何準確、快速、全面的把人們所需要的信息呈現(xiàn)出來是一個急需解決的問題。通用搜索技術(shù)某種程度上滿足了人們對人物信息搜索需求,但仍存在著一些問題:社交媒體上存在大量的人物信息,但由于其特殊性,普

2、通的信息獲取方式并不適用;人物存在重名現(xiàn)象,通用搜索引擎基于關(guān)鍵字匹配的排名方式,使得其對人物重名問題的解決無能為力。
  本文對上述兩個關(guān)鍵問題進行了研究。面向社交網(wǎng)站的個人信息搜索方法研究:對社交網(wǎng)站平臺和相關(guān)技術(shù)進行了詳細調(diào)研,提出網(wǎng)頁解析和API查詢相結(jié)合的方法。實現(xiàn)了跨平臺的社交網(wǎng)站個人信息搜索系統(tǒng),該系統(tǒng)通過屬性匹配的方式解決人名歧義問題,并對提取的信息進行建模保存。Web人物搜索中的人名消歧方法研究:在總結(jié)前人相關(guān)工

3、作的基礎(chǔ)上,提出了一種基于組合特征的Web人名消歧方法,該方法通過提取人物網(wǎng)頁不同的特征信息,利用空間向量模型構(gòu)造組合特征向量,依據(jù)特征向量間的相似度比較,運用層次聚類的方法實現(xiàn)人名消歧。Web人名消歧原型系統(tǒng)的設(shè)計與實現(xiàn):在對Web人名消歧方法進行研究的基礎(chǔ)上,研發(fā)了一個Web人名消歧原型系統(tǒng)。該工具接收人名輸入,運用本文所提的人名消歧方法對通用搜索引擎的人名檢索結(jié)果進行人名消歧,實現(xiàn)以聚類特征為標簽的再排功能。在該原型系統(tǒng)上的實驗表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論