版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著用戶需求的多樣化,個(gè)性化推薦系統(tǒng)不僅用于電子商務(wù),也用于推薦網(wǎng)頁(yè)、電影、文本等。為了讓人們方便準(zhǔn)確地獲得需要的文獻(xiàn),研究基于文本信息的推薦技術(shù)成為必要。文本信息推薦系統(tǒng)的功能是收集和分析用戶歷史閱讀過(guò)的感興趣文本,據(jù)此來(lái)認(rèn)識(shí)用戶偏好信息并建立用戶興趣模型,然后將與模型匹配度高的文本推薦給用戶。
在文本信息推薦系統(tǒng)中,用戶興趣建模模塊是其中一個(gè)核心的模塊。模型創(chuàng)建時(shí),通過(guò)分詞、特征選擇直接從文本中獲得特征詞向量的文本表示方法
2、只考慮了文本在詞形上的相同點(diǎn),而忽略了文本在詞義上的相同點(diǎn)。這將會(huì)導(dǎo)致推薦時(shí),僅能推薦出詞形相同的文本,不能推薦出詞形不同但詞義相關(guān)的文本,從而導(dǎo)致查全率低。此外,當(dāng)用戶使用系統(tǒng)的時(shí)間越長(zhǎng),用戶累計(jì)的歷史閱讀信息就越多。此時(shí),對(duì)用戶興趣模型進(jìn)行更新時(shí),系統(tǒng)從歷史用戶閱讀文本中提取用戶興趣模型的計(jì)算量會(huì)變得越來(lái)越龐大。在此情況下,系統(tǒng)響應(yīng)時(shí)間變得越來(lái)越慢。這不利于用戶體驗(yàn)。
針對(duì)以上問(wèn)題,本文做了如下工作:
1)本文設(shè)
3、計(jì)了一種文本信息推薦系統(tǒng)框架,給出了系統(tǒng)的整體結(jié)構(gòu)和各個(gè)模塊的功能。本文參與了系統(tǒng)整體設(shè)計(jì),實(shí)現(xiàn)了用戶興趣模型模塊功能。
2)提出了一種基于單詞間詞義相關(guān)性的用戶興趣模型創(chuàng)建方法:通常認(rèn)為每個(gè)單詞具有多個(gè)詞義,單純依靠單詞本身無(wú)法確定單詞的詞義,但在同一篇文本中的多個(gè)單詞,其詞義具有相關(guān)性,即同一篇文本的多個(gè)單詞可能具有相同的上位概念(更一般化的概念)。該模型創(chuàng)建方法的主要思想是利用單詞間的詞義相關(guān)性來(lái)判斷單詞在文本中的正確詞
4、義,進(jìn)而選擇該詞義下的上位概念來(lái)構(gòu)建用戶興趣模型。本文提出了利用文本單詞間的詞義相關(guān)性來(lái)進(jìn)行詞義識(shí)別的方法。由于單詞的一重詞義具有它固有的上位概念,單詞間詞義的相關(guān)性體現(xiàn)在它們的上位概念關(guān)系中,因此該詞義識(shí)別方法通過(guò)單詞間各個(gè)詞義的上位概念關(guān)系來(lái)判斷單詞的正確詞義。最后通過(guò)該詞義識(shí)別方法獲得單詞正確詞義下的上位概念,以上位概念表示單詞構(gòu)建文本的概念向量,在此基礎(chǔ)上創(chuàng)建用戶興趣模型。
3)對(duì)用戶興趣模型的快速更新方法進(jìn)行了研究:
5、通常模型更新是在前一次模型中增加或者刪除信息,在這個(gè)過(guò)程中保存前一次模型創(chuàng)建時(shí)的中間結(jié)果,在這個(gè)中間結(jié)果的基礎(chǔ)上再進(jìn)行更新時(shí),可以減少重復(fù)計(jì)算工作,達(dá)到快速更新的目的。本文對(duì)模型快速更新方法的一般思路進(jìn)行了梳理,實(shí)現(xiàn)了三種常見(jiàn)模型的快速更新方法。在本文設(shè)計(jì)的文本信息推薦系統(tǒng)結(jié)構(gòu)上,實(shí)現(xiàn)了基于單詞間詞義相關(guān)性的模型增量更新方法。
最后通過(guò)實(shí)驗(yàn)證明,本文提出的基于單詞間詞義相關(guān)性的用戶興趣模型創(chuàng)建方法提取出的模型在推薦時(shí)具有更高的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于網(wǎng)絡(luò)信息的個(gè)性化用戶詞典更新方法.pdf
- 結(jié)構(gòu)損傷識(shí)別與模型更新方法研究.pdf
- 基于變化信息文件的增量更新方法研究.pdf
- 基于基態(tài)修正模型的增量采編與更新方法研究.pdf
- 豫南杉木更新方法研究.pdf
- 適用于手機(jī)取證的中文短文本分類方法研究與實(shí)現(xiàn).pdf
- 基于用戶興趣模型的移動(dòng)商務(wù)文本信息過(guò)濾研究.pdf
- 信息預(yù)測(cè)新方法與軟件
- 開(kāi)采沉陷區(qū)數(shù)字高程模型預(yù)測(cè)更新方法研究.pdf
- 動(dòng)態(tài)視頻背景更新方法研究.pdf
- FPGA固件遠(yuǎn)程更新方法的研究.pdf
- 37211.基于oosolid數(shù)據(jù)模型的三維地質(zhì)模型構(gòu)建與動(dòng)態(tài)更新方法研究
- 文本分類新方法的研究與應(yīng)用.pdf
- 自適應(yīng)背景更新方法研究
- 自適應(yīng)背景更新方法研究.pdf
- 白菜種質(zhì)資源鑒定與更新方法研究.pdf
- gridview控件批量更新方法的改進(jìn)研究與實(shí)現(xiàn)
- 29255.基于增量信息的地表覆蓋數(shù)據(jù)更新方法研究
- 49505.基于arcgis的基礎(chǔ)地理信息更新方法研究
- 信息對(duì)抗新方法研究.pdf
評(píng)論
0/150
提交評(píng)論