基于組合推薦技術(shù)的音樂(lè)推薦引擎研究與實(shí)現(xiàn).pdf_第1頁(yè)
已閱讀1頁(yè),還剩72頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、分類號(hào):UDC:密級(jí):學(xué)校代號(hào):11845學(xué)號(hào):2111205052廣東工業(yè)大學(xué)碩士學(xué)位論文(工學(xué)碩士)基于組合推薦技術(shù)的音樂(lè)推薦引擎研究與實(shí)現(xiàn)李恒新指導(dǎo)教師姓名、職稱:鎣堅(jiān)堡熬援學(xué)科(專業(yè))或領(lǐng)域名稱:讓簋扭廑且技苤學(xué)生所屬學(xué)院:讓簋扭堂瞳論文答辯日期:三Q二五生五旦摘要摘要音樂(lè)的獲取多種多樣,從網(wǎng)絡(luò)上獲取已成為大多數(shù)人的首選。而匆忙的現(xiàn)代化生活以及龐大的網(wǎng)絡(luò)資源,讓很多人無(wú)暇去仔細(xì)搜索自己喜愛的音樂(lè),并且大量適合用戶的音樂(lè)沒(méi)有機(jī)會(huì)被

2、用戶欣賞到。怎么快速挖掘用戶喜好,幫用戶找到自己所喜歡的音樂(lè),就是音樂(lè)推薦引擎的主要作用。推薦算法是引擎的核一11,算法的優(yōu)劣決定了推薦的質(zhì)量?;趦?nèi)容的推薦研究很早就開始。本文針對(duì)音樂(lè)數(shù)據(jù)的獨(dú)特性,進(jìn)行了標(biāo)簽化處理,使其能應(yīng)用在基于內(nèi)容的推薦上,而基于內(nèi)容的算法主要采用聚類算法。用傳統(tǒng)的TFIDF方法生成音樂(lè)文檔向量來(lái)進(jìn)行聚類,不僅效率低,聚類質(zhì)量也不高。因此,本文采用另一種生成向量的算法,那就是用Simhash算法計(jì)算出物品的指紋特

3、征值,再進(jìn)行聚類。實(shí)驗(yàn)驗(yàn)證了此種方法運(yùn)行效率高,聚類效果也好。另外,在推薦領(lǐng)域,協(xié)同過(guò)濾算法也是El前應(yīng)用比較廣的推薦算法。針對(duì)協(xié)同過(guò)濾推薦算法運(yùn)算量大的特點(diǎn),本文實(shí)現(xiàn)了在Hadoop平臺(tái)上的基于用戶的分布式協(xié)同過(guò)濾算法,優(yōu)化用戶相似矩陣和去掉熱門和冷門項(xiàng)目偏好向量,并且簡(jiǎn)化整個(gè)流程。在實(shí)驗(yàn)中,和Mahout算法集上的基于項(xiàng)目的分布式協(xié)同過(guò)濾算法比較,在同等數(shù)據(jù)量的前提下,速度更快,推薦質(zhì)量也沒(méi)有降低。最后,本文搭建了一個(gè)B/S結(jié)構(gòu)的音

4、樂(lè)推薦引擎原型系統(tǒng),整合離線推薦算法結(jié)果,并加入在線推薦功能,滿足用戶的實(shí)時(shí)需求,成為一個(gè)體驗(yàn)較佳的個(gè)性化推薦系統(tǒng)。本文的主要研究工作總結(jié)如下:1對(duì)音樂(lè)進(jìn)行標(biāo)簽化處理,加入權(quán)重,并對(duì)歌詞分詞過(guò)濾處理,采用Simhash算法生成二進(jìn)制指紋特征值,而不是用傳統(tǒng)的TFIDF來(lái)生成向量表示音樂(lè)文檔,在存儲(chǔ)和計(jì)算量上都得到了優(yōu)化。接著用Kmeans聚類算法對(duì)指紋特征值進(jìn)行聚類,得出多簇相似的歌曲,實(shí)現(xiàn)改進(jìn)的基于內(nèi)容的推薦算法。2對(duì)Mahout中基

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論