2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩82頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、互聯(lián)網(wǎng)產(chǎn)業(yè),針對各行各業(yè)的門戶網(wǎng)站越來越多,包括旅游,美食,時事等。各種類型的門戶網(wǎng)站由于面對的用戶群以及自身所有元素的不同,需要處理的各種問題也不同。比如針對美食類的門戶網(wǎng)站,網(wǎng)站內(nèi)容以圖片,介紹等居多,那么需要面對的問題大多在圖片以及內(nèi)容處理等方面。
  本課題所研究的內(nèi)容是某美食類網(wǎng)站關(guān)于圖片,內(nèi)容的處理以及垂直搜索的問題。對于圖片處理,簡單來說是圖片的匹配,采用匹配算法過濾出重復(fù)的圖片然后根據(jù)匹配數(shù)據(jù)采取不同的操作。該問題

2、通過建立數(shù)據(jù)庫存儲原來的圖片信息,使用顏色直方圖生成算法生成對應(yīng)的顏色直方圖并用距離向量算法計算圖片的相似度數(shù)據(jù)來實(shí)現(xiàn)。內(nèi)容處理問題即點(diǎn)評處理,該問題與圖片處理類似,通過中文分詞算法對點(diǎn)評內(nèi)容進(jìn)行分詞,然后根據(jù)規(guī)則對待匹配的內(nèi)容進(jìn)行排序,最后進(jìn)行匹配操作計算匹配度。垂直搜索問題即針對美食類的信息進(jìn)行專項搜索,該問題通過建立源數(shù)據(jù)的倒排索引樹,檢索索引并對結(jié)果進(jìn)行排序的方式來實(shí)現(xiàn)。結(jié)果排序可分為熱度排序和按字段排序,熱度排序采用散熱算法模

3、擬熱度的增加和減少,從而達(dá)到熱度排名的效果。
  通過解決上述問題,并實(shí)現(xiàn)其功能,可以總結(jié)出本課題的研究內(nèi)容為美食類網(wǎng)站的搜索與圖片和點(diǎn)評數(shù)據(jù)匹配的研究與實(shí)現(xiàn)。目前點(diǎn)評處理以及圖片去重模塊都可以匹配出大部分的重復(fù)內(nèi)容。站內(nèi)搜索模塊可以完成基本的搜索和排序功能。不過點(diǎn)評和圖片去重模塊在性能上有待加強(qiáng),另外在匹配精度上也需加強(qiáng)。搜索模塊的排序算法還需經(jīng)過大量測試之后進(jìn)一步進(jìn)行調(diào)整。
  通過完成本課題的設(shè)計與實(shí)現(xiàn),對中文分詞,索

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論