社會化標注系統(tǒng)中群組推薦方法研究.pdf_第1頁
已閱讀1頁,還剩127頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著Web2.0技術(shù)的興起,網(wǎng)絡(luò)上出現(xiàn)了大量的社會化標注系統(tǒng),用戶可以通過一個開放的平臺對共享資源進行個性化標注,同時可以上傳資源并將其分享到感興趣的群組中。由于群組能夠滿足用戶間交互與興趣分享等諸多需求,近年來吸引了大量的用戶。但是隨著群組數(shù)量的飛速增長,用戶手動的瀏覽或查找感興趣的群組成為一件困難而耗時的工作,迫切需要一種工具幫助用戶從海量的群組中過濾出有用的信息,群組推薦系統(tǒng)應(yīng)運而生。群組推薦系統(tǒng)可以幫助用戶發(fā)現(xiàn)有價值的群組信息,

2、節(jié)約用戶時間,提高用戶對網(wǎng)站的滿意度,從而吸引更多用戶加入網(wǎng)站,實現(xiàn)服務(wù)提供商與用戶的雙贏。本文主要研究如何為社會化標注系統(tǒng)中的用戶和資源推薦群組,并以社會化標注系統(tǒng)中的典型代表——Flickr圖片共享網(wǎng)站為例,介紹主要的研究方法。盡管本文提出的方法都是基于Flickr,但它們均可以推廣到任意具有群組信息的社會化標注系統(tǒng)中。
  Flickr允許用戶上傳圖片,為圖片添加標簽并將圖片分享到感興趣的群組中。用戶、標簽、圖片和組是Fli

3、ckr中主要的四個實體,它們之間相互關(guān)聯(lián),形成了用戶、標簽、圖片和組之間的四元關(guān)系。本文在分析該四元關(guān)系的基礎(chǔ)上,提出了基于四元語義分析的Flickr組推薦模型,并利用該模型完成了以下工作:
  (1)利于四元語義分析為Flickr用戶推薦組
  為Flickr用戶推薦組的現(xiàn)有研究主要使用基于協(xié)同過濾的推薦算法,利用(用戶,組)二元關(guān)系或者(用戶,標簽,組)三元關(guān)系挖掘用戶和組之間潛在的語義關(guān)系。由于它們均忽略了圖片豐富的視

4、覺信息,同時標簽可能存在多義性和歧義性,因此往往不能提供準確的推薦結(jié)果。本文針對現(xiàn)有研究存在的問題和不足,提出了一種基于四元語義分析的Flickr組推薦方法,利用四階張量建模用戶、標簽、圖片類和組之間的四元關(guān)系,通過高階奇異值分解技術(shù)挖掘用戶和組之間潛在的語義關(guān)系,得到為用戶推薦的組列表。該方法首次將四元語義分析引入到組推薦領(lǐng)域,綜合利用圖片的視覺特征和標簽信息,通過挖掘用戶和組之間隱含的語義關(guān)系,為用戶推薦組。通過在Flickr數(shù)據(jù)集

5、上的實驗證明了本文提出的方法相比利用用戶、標簽和組之間三元關(guān)系的方法,在top-k和MAP評價標準下,取得了更精確的推薦結(jié)果。此外,在對Flickr圖片分類時,提出了一種基于稀疏編碼的改進的空間金字塔匹配方法,為空間金字塔中不同層次的圖像的稀疏編碼值賦予不同的權(quán)重,設(shè)計了一種新的空間金字塔匹配核,在Caltech101/256及PascalVOC2006數(shù)據(jù)集上的實驗證明,新的空間金字塔匹配核函數(shù)在分類準確率上優(yōu)于已有的基于空間金字塔匹

6、配的方法。
  (2)利用四元語義分析為Flickr圖片推薦組
  現(xiàn)有為Flickr圖片推薦組的研究主要使用基于內(nèi)容的推薦算法,需要為每個主題建立一個模型,系統(tǒng)可擴展性差。此外,推薦時僅根據(jù)圖片的特征沒有考慮用戶的興趣,導(dǎo)致推薦結(jié)果不一定滿足用戶的興趣需要。本文針對現(xiàn)有研究存在的問題和不足,提出了基于四階張量分解的Flickr組推薦算法,將用戶的興趣信息引入到推薦模型中,利用基于協(xié)同過濾的推薦方法為圖片推薦組。算法使用四階

7、張量建模圖片、用戶、標簽和組之間的四元關(guān)系,利用高階奇異值分解和kernel-SVD技術(shù)挖掘用戶潛在的興趣以及圖片和組之間潛在的語義關(guān)系,為圖片推薦滿足用戶興趣需要的組。此外,為了解決模型的可擴展性問題,當(dāng)有新的用戶、圖片、標簽和組加入模型時,利用folding-in或IncrementalSVD技術(shù)增量更新模型,避免了大量的重復(fù)計算。通過在Flickr數(shù)據(jù)集上的實驗證明了本文提出的算法比現(xiàn)有基于內(nèi)容的推薦算法推薦結(jié)果的MAP值有大幅提

8、升。
  (3)設(shè)計并實現(xiàn)了Flickr組推薦統(tǒng)一框架及Web應(yīng)用原型系統(tǒng)。
  現(xiàn)有的Flickr組推薦方法只能單獨為用戶或圖片推薦組,不能將兩者集成在一個統(tǒng)一框架中。而實際應(yīng)用中,F(xiàn)lickr用戶不僅希望知道自己上傳的圖片適合分享的組同時還希望了解有哪些自己感興趣的組。本文在前面兩項工作的基礎(chǔ)上,建立了基于四元語義分析的Flickr組推薦統(tǒng)一框架,設(shè)計并實現(xiàn)了Flickr組推薦Web應(yīng)用原型系統(tǒng),該系統(tǒng)可以在為圖片推薦組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論