基于評(píng)論挖掘的跨域推薦問題研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩73頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、近年來,蓬勃發(fā)展的在線商品評(píng)論網(wǎng)站給廣大用戶帶來了極大便利,同時(shí)用戶也留下了大量的偏好信息。在線商家通過這些偏好信息,了解用戶興趣,為其推薦商品,由此,推薦系統(tǒng)應(yīng)運(yùn)而生。推薦系統(tǒng)將用戶表現(xiàn)出的偏好信息進(jìn)行合理的運(yùn)算,預(yù)測(cè)出用戶可能喜歡的商品,供用戶參考。這已被廣泛應(yīng)用于各大在線商品評(píng)論網(wǎng)站中,如Amazon,eBay, Taobao,JD.eom等,取得了極大成功。
  然而,直到如今,新用戶的冷啟動(dòng)問題仍然是推薦系統(tǒng)中的一個(gè)不可

2、忽視的重要挑戰(zhàn)。對(duì)此,跨領(lǐng)域推薦(以下簡(jiǎn)稱“跨域推薦”)作為一種有效的解決思路,正在引起越來越多研究者的關(guān)注??缬蛲扑]旨在利用知識(shí)遷移的策略,將一個(gè)相對(duì)稠密域的用戶偏好遷移到相對(duì)稀疏的目標(biāo)域中,用以輔助解決目標(biāo)域的冷啟動(dòng)問題?,F(xiàn)今的跨域推薦工作絕大多數(shù)利用的是用戶對(duì)商品的評(píng)分,而實(shí)際上,評(píng)論文本之類的文本信息蘊(yùn)含著更為豐富的用戶偏好,這是已有工作往往所忽視的。在評(píng)論中,用戶往往會(huì)表達(dá)出對(duì)商品在更細(xì)粒度上的喜惡,合理利用這些細(xì)粒度的情感偏

3、好,將大大有助于提高跨域推薦的準(zhǔn)確度。例如,對(duì)于一部手機(jī),一個(gè)用戶的評(píng)論可以向我們展現(xiàn)出他對(duì)“屏幕”的看法或者對(duì)“電池”的看法,這比僅利用評(píng)分精確得多。
  基于此,本文研究如何有效利用評(píng)論中的細(xì)粒度用戶偏好進(jìn)行跨域推薦。由于評(píng)論中的偏好信息是雜亂無章的,所以利用評(píng)論中的細(xì)粒度偏好進(jìn)行跨域推薦相比僅利用評(píng)分等數(shù)據(jù)更為復(fù)雜。其中包含兩個(gè)挑戰(zhàn):第一,如何建模用戶在評(píng)論中的細(xì)粒度偏好來適應(yīng)知識(shí)遷移的需要?第二,如何有效地進(jìn)行基于評(píng)論的知

4、識(shí)遷移?本文對(duì)此進(jìn)行了較為深入的研究,提出了一個(gè)比較完整的解決框架,包含了一系列比較復(fù)雜的問題。具體工作和貢獻(xiàn)概括如下:
  1.針對(duì)跨域框架中細(xì)粒度偏好的建模問題,本文將“方面”這一層級(jí)引入框架中,并且分別用“評(píng)價(jià)值張量”和“關(guān)注度張量”去建模用戶偏好。從評(píng)論中提取用戶的細(xì)粒度情感偏好,本文使用“用戶-商品-方面”這種三元關(guān)系來組織。對(duì)于這種三元關(guān)系,本文使用三維張量(third-order tensor,以下簡(jiǎn)稱“張量”)進(jìn)行

5、建模。在張量中,每一個(gè)元素記錄某用戶對(duì)某商品在某“方面”上的情感程度。這種建模方式在跨域推薦中的優(yōu)勢(shì)在于:第一,可以將評(píng)論中雜亂無章的用戶偏好組織成便于運(yùn)算的結(jié)構(gòu)化數(shù)據(jù),便于實(shí)現(xiàn)兩域數(shù)據(jù)的對(duì)接;第二,將“方面”作為一個(gè)獨(dú)立的維度,便于捕捉兩個(gè)不同域中“方面”的聯(lián)系,使得“方面”這一層級(jí)的作用在跨域推薦中得以充分發(fā)揮。引入“方面”層級(jí)后,為解決用戶對(duì)商品在各“方面”上的情感偏好與對(duì)商品的整體偏好之間的關(guān)系問題,本文基于“一個(gè)用戶對(duì)某商品在

6、其更為關(guān)注的方面上的評(píng)價(jià)將更大地影響該用戶對(duì)該商品的整體評(píng)價(jià)”這一思想,在每個(gè)域中建模“評(píng)價(jià)值張量”和“關(guān)注度張量”。
  2.針對(duì)細(xì)粒度知識(shí)的跨域遷移問題,本文首次提出了一種基于評(píng)論的聯(lián)合張量分解模型(Review Based Joint Tensor Factorization,RB-JTF),并將其應(yīng)用于跨域推薦框架中。RB-JTF模型通過將輔助域張量和目標(biāo)域張量進(jìn)行聯(lián)合地分解來實(shí)現(xiàn)知識(shí)遷移。怎樣通過聯(lián)合地分解兩個(gè)不同域的張

7、量來跨域遷移知識(shí)這個(gè)問題在目前來說仍然沒有被很好地解決,是一個(gè)重要挑戰(zhàn)。在RB-JTF中,首先兩個(gè)張量均被分解為三個(gè)因子矩陣,分別為用戶,商品和“方面”的潛在特征矩陣。然后,RB-JTF的知識(shí)遷移策略包括兩個(gè)部分:第一,使用戶的潛在特征在輔助域和目標(biāo)域中實(shí)現(xiàn)共享;第二,捕捉兩個(gè)域中“方面”的聯(lián)系并將其融入知識(shí)遷移模型,首先度量?jī)蓚€(gè)“方面”的語(yǔ)義相似度,然后根據(jù)語(yǔ)義相似度對(duì)“方面”的潛在特征的距離給予不同程度的約束,實(shí)現(xiàn)“方面”潛在特征的

8、遷移。本文給出了RB-JTF模型的目標(biāo)函數(shù),并且使用非線性共軛梯度法對(duì)因子矩陣進(jìn)行學(xué)習(xí),并分析了算法的時(shí)間復(fù)雜性。不同于以往的跨域推薦模型,RB-JTF預(yù)測(cè)的是“方面”這個(gè)層級(jí)的偏好,為了將預(yù)測(cè)的用戶對(duì)商品各方面的評(píng)價(jià)轉(zhuǎn)化為對(duì)這件商品整體的評(píng)價(jià),本文分別在評(píng)價(jià)值張量和關(guān)注度張量上進(jìn)行知識(shí)的跨域遷移。另外,針對(duì)張量的稀疏問題,本文提出了緩解策略,通過預(yù)估張量中的部分元素以及其可靠度,進(jìn)一步提高聯(lián)合張量分解模型的準(zhǔn)確度。
  3.本文

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論