版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著互聯(lián)網的發(fā)展,Web中提供的信息越來越豐富,但是Web站點及信息數(shù)目的增多,導致用戶尋找信息困難,這就促進了提供一對一服務的個性化服務系統(tǒng)的出現(xiàn)。個性化服務的實現(xiàn)需要借助Web數(shù)據(jù)挖掘技術。一般來說,Web挖掘分為四個子任務:資源搜索、數(shù)據(jù)預處理、模式發(fā)現(xiàn)和模式分析。預處理是Web挖掘任務的一個重要階段,也是工作量較大的一部分,數(shù)據(jù)預處理的質量直接關系到數(shù)據(jù)挖掘結果的好壞。Web挖掘的針對性強,對于不同領域,數(shù)據(jù)預處理、模式發(fā)現(xiàn)和模
2、式分析等過程的處理也不完全相同。 目前,具體到針對個性化服務的數(shù)據(jù)預處理研究方面,研究大都停留在對啟發(fā)式規(guī)則的簡單應用,而沒有結合相關的領域知識。尤其是在會話識別中,一般根據(jù)設定的閾值進行“一刀切”式的處理,會話識別的精度不高,從而影響了后續(xù)對用戶訪問習慣的挖掘。 本文著重對個性化服務所基于的Web數(shù)據(jù)挖掘技術中的數(shù)據(jù)預處理過程進行研究。在研究過程中以中俄經貿合作網個性化服務所需的Web挖掘數(shù)據(jù)形式為目標,通過改進現(xiàn)有的
3、啟發(fā)式規(guī)則,進行系統(tǒng)建模、數(shù)據(jù)結構設計、程序流程設計等,使用編程語言最終實現(xiàn)了一套Web日志數(shù)據(jù)預處理系統(tǒng)。該系統(tǒng)將數(shù)據(jù)預處理的過程一數(shù)據(jù)清洗、用戶識別、會話識別等功能封裝起來,增加了數(shù)據(jù)預處理過程的可重用性,使得在進行進一步個性化研究時更加快捷、方便。同時,在SQL SERVER形成了一個可供進一步進行個性化服務研究的數(shù)據(jù)挖掘庫。 在如何能高效地應對更大數(shù)據(jù)量下的日志處理,如何在不影響效率的前提下更加精確地識別用戶和會話,以及
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 聚類算法在中俄經貿合作網的應用.pdf
- 中俄農業(yè)經貿合作研究.pdf
- 中俄雙邊經貿合作發(fā)展研究.pdf
- 中俄能源經貿合作發(fā)展問題研究.pdf
- 中俄經貿合作模式創(chuàng)新問題研究.pdf
- 經濟外交背景下的中俄經貿合作.pdf
- 中俄經貿合作現(xiàn)狀、問題及對策分析
- 新形勢下中俄經貿合作問題研究.pdf
- 中俄經貿合作的現(xiàn)實基礎和發(fā)展對策研究.pdf
- 基于產業(yè)關聯(lián)視角下的中俄經貿合作研究
- 新時期中俄農業(yè)經貿合作研究.pdf
- 俄羅斯加入wto對中俄經貿合作的影響
- 中俄兩國基于產業(yè)層面的經貿合作研究.pdf
- 新時期中俄經貿合作的發(fā)展、問題及對策.pdf
- 中韓經貿合作研究.pdf
- 當前金融危機對中俄經貿合作的影響及對策研究.pdf
- 俄羅斯移民政策及對中俄經貿合作的影響.pdf
- 個性化服務
- 面向個性化信息服務的數(shù)據(jù)挖掘研究.pdf
- 基于數(shù)據(jù)挖掘的WEB個性化服務研究.pdf
評論
0/150
提交評論