基于WEB使用挖掘的智能個(gè)性化系統(tǒng)研究.pdf_第1頁
已閱讀1頁,還剩51頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、近年來,隨著Internet的飛速發(fā)展,越來越多的研究機(jī)構(gòu)、團(tuán)體以及個(gè)人開始注意到網(wǎng)絡(luò),并通過它來發(fā)布信息、查找信息.盡管Internet上有海量的信息,人們還是常常感到不能夠找到自己想要找的信息.于是,人們提出來將數(shù)據(jù)挖掘思想與智能個(gè)性化思想結(jié)合來建設(shè)網(wǎng)站的想法.智能個(gè)性化網(wǎng)站不但能夠?qū)τ脩艉晚撁孢M(jìn)行聚類操作,還能夠?yàn)椴煌挠脩籼峁┫鄳?yīng)的服務(wù).換句話說,這種網(wǎng)站可以為用戶提供個(gè)性化的服務(wù).由于Web是一個(gè)無結(jié)構(gòu)的動(dòng)態(tài)的分布式的信息系統(tǒng)

2、,直接對(duì)它進(jìn)行挖掘是困難的,獲取的知識(shí)是不可靠的.然而,Web服務(wù)器的log日志有著完整的結(jié)構(gòu).所以,我們可以通過對(duì)Web日志文件的挖掘來實(shí)現(xiàn)智能個(gè)性化服務(wù).本文首先分析了網(wǎng)絡(luò)的現(xiàn)狀,并提出了問題所在.然后介紹了Web挖掘的描述及其意義,以及實(shí)現(xiàn)智能個(gè)性化預(yù)測服務(wù)所用到的理論基礎(chǔ).接著,詳細(xì)的描述了本系統(tǒng)的三個(gè)處理過程.數(shù)據(jù)預(yù)處理階段.數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘過程中的第一步,它主要包括四部分的工作:數(shù)據(jù)收集、數(shù)據(jù)凈化、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)歸約.挖

3、掘算法階段.這部分工作是本文的一個(gè)重點(diǎn).挖掘算法階段使用優(yōu)化的矩陣聚類算法--權(quán)值矩陣聚類算法對(duì)用戶群體和頁面進(jìn)行聚類.與普通的矩陣聚類算法相比,權(quán)值矩陣聚類算法將網(wǎng)站訪問頻度作為參數(shù)考慮進(jìn)來提出了一個(gè)新的概念--權(quán)值關(guān)聯(lián)矩陣,這是本文的創(chuàng)新點(diǎn)之一,它的優(yōu)點(diǎn)是能夠更準(zhǔn)確的反映網(wǎng)站的訪問情況.模式分析及應(yīng)用階段.本階段將挖掘結(jié)果應(yīng)用到預(yù)測用戶的訪問路徑和新用戶的歸類上,這是本文的另一個(gè)重要工作.這里提出了一種新的路徑預(yù)測算——HCI算法.

4、它的基本思想是:為當(dāng)前瀏覽頁面的每個(gè)鏈接計(jì)算出一個(gè)分值,分值最大的即為推薦鏈接.這是本文的另一個(gè)創(chuàng)新點(diǎn).通過與傳統(tǒng)路徑預(yù)測算法的比較,HCI算法的優(yōu)點(diǎn)是:描述用戶的行為更準(zhǔn)確,預(yù)測用戶的瀏覽路徑更簡單方便,預(yù)測命中率較高.對(duì)于新的用戶,當(dāng)他們第一次瀏覽網(wǎng)站的時(shí)候,通過計(jì)算他們和其他用戶的相似度對(duì)其進(jìn)行歸類.通過對(duì)學(xué)校日志的實(shí)踐證明,采用基于改進(jìn)的矩陣聚類算法進(jìn)行挖掘,并將挖掘結(jié)果用于個(gè)性化服務(wù)的思想是有效的、可行的.這種實(shí)踐為以后將個(gè)性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論