個性化資訊推薦系統(tǒng)的設(shè)計與實(shí)現(xiàn).pdf_第1頁
已閱讀1頁,還剩63頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、推薦系統(tǒng)被認(rèn)為是解決互聯(lián)網(wǎng)信息爆炸問題最有效的方法之一。在電子商務(wù)領(lǐng)域,推薦系統(tǒng)得到了廣泛使用,像Amazon,Ebay,阿里巴巴等電商巨頭都使用推薦系統(tǒng)為用戶推薦產(chǎn)品,并顯著提高了企業(yè)利潤。但是在資訊信息領(lǐng)域,用戶還處于海量信息的泥潭中,盡管有很多優(yōu)秀的垂直的網(wǎng)站幫助用戶梳理信息,比如36kr為用戶整理創(chuàng)業(yè)類信息,csdn提供了創(chuàng)作、分享博客的平臺,但它們所涉及的領(lǐng)域往往很局限,遠(yuǎn)遠(yuǎn)不能滿足用戶閱讀多樣化的個性需求。
  為了匯

2、集海量優(yōu)質(zhì)資訊信息,滿足用戶閱讀的個性化需求,我們開發(fā)了個性化資訊推薦引擎。作為自主創(chuàng)業(yè)項目,我們的目標(biāo)是自動幫用戶篩選推薦感興趣的優(yōu)質(zhì)新聞、博客和文檔等。一般用戶會有多個興趣點(diǎn),通過個性化資訊推薦引擎,就可以直接看到興趣多樣化的資訊列表,無需去多個站點(diǎn)找尋,節(jié)約了時間;同時推薦系統(tǒng)可以不斷學(xué)習(xí)用戶行為日志,使推薦內(nèi)容更符合用戶興趣。
  目前系統(tǒng)已經(jīng)完成第一版本的開發(fā)工作,搭建起了推薦系統(tǒng)的基礎(chǔ)框架,Web服務(wù)框架,并設(shè)計了數(shù)據(jù)

3、庫等。基礎(chǔ)框架涉及爬蟲子系統(tǒng),抽取子系統(tǒng)和個性化推薦子系統(tǒng)。爬蟲子系統(tǒng)使用Java開發(fā),負(fù)責(zé)從各個優(yōu)質(zhì)的網(wǎng)站中爬取源信息,并基于hash和simhash算法設(shè)計了去重規(guī)則;抽取子系統(tǒng)使用Python語言開發(fā),對第三方開源軟件BeautifulSoup和Readability做了優(yōu)化調(diào)整實(shí)現(xiàn)不同站點(diǎn)的通用抽取,另外對特定站點(diǎn)實(shí)現(xiàn)基于模板的信息抽取,提高了抽取精確度;個性化推薦使用了新穎的基于tag的推薦方法,并組合協(xié)同過濾的推薦結(jié)果,使推

4、薦列表更精準(zhǔn)。另外,使用SSH框架開發(fā)Web服務(wù)模塊,為用戶提供基本的交互,比如對文章的行為反饋、登陸注冊和添加興趣標(biāo)簽等操作。
  本文按照軟件開發(fā)的流程,首先介紹了系統(tǒng)的開發(fā)背景、發(fā)展現(xiàn)狀以及開發(fā)中用到了相關(guān)技術(shù);接著對需求分析、概要設(shè)計、詳細(xì)設(shè)計和系統(tǒng)實(shí)現(xiàn)分別進(jìn)行了詳細(xì)描述,需求分析介紹了總體需求,確定了系統(tǒng)各部分的功能需求,并從效率、可靠性、易用性三個方面討論了非功能性需求,概要設(shè)計對系統(tǒng)整體框架和模塊劃分進(jìn)行了詳細(xì)介紹,

5、詳細(xì)設(shè)計涉及到爬蟲子系統(tǒng)、抽取子系統(tǒng)、個性化推薦子系統(tǒng)、Web服務(wù)子系統(tǒng)、資訊檢索子系統(tǒng)和用戶管理子系統(tǒng),分別展開詳細(xì)設(shè)計,系統(tǒng)實(shí)現(xiàn)主要從代碼實(shí)現(xiàn)角度,介紹了開發(fā)過程中遇到的問題以及解決方法。
  本論文中開發(fā)的系統(tǒng)已實(shí)際在線測試服務(wù)了近半年的的時間,在沒有推廣的情況下,第一月注冊用戶超過了700人,日訪問的pv峰值達(dá)到1500多,平均達(dá)到100多。通過用戶反饋,推薦系統(tǒng)著實(shí)解決了用戶閱讀領(lǐng)域信息難找的問題,提高了用戶的學(xué)習(xí)效率。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論