基于數(shù)據(jù)挖掘的網(wǎng)上圖書銷量預(yù)測系統(tǒng)的設(shè)計與實現(xiàn).pdf_第1頁
已閱讀1頁,還剩65頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、近年來,網(wǎng)絡(luò)信息技術(shù)發(fā)展給圖書零售業(yè)帶來前所未有的變革,網(wǎng)上書店成為了電子商務(wù)的先鋒,但同時市場激烈的競爭逼使網(wǎng)絡(luò)圖書銷售集團針對圖書銷售方面選擇技術(shù)含量更高的數(shù)據(jù)挖掘手段,提高企業(yè)的分析決策能力和市場競爭力。
  本文以某網(wǎng)絡(luò)圖書銷售集團的歷史銷售數(shù)據(jù)為對象,設(shè)計了書籍預(yù)測分類系統(tǒng),通過對書籍的價格、類別、當前銷量、出版社等因素的分析挖掘,從中提取出分類規(guī)則,發(fā)現(xiàn)暢銷書籍和滯銷書籍的主要特征,挖掘出暢銷書的模式,然后利用這個模型

2、對新的進貨書籍數(shù)據(jù)進行分析預(yù)測,為圖書倉儲的進、退貨提供決策依據(jù)。
  系統(tǒng)采用決策規(guī)則樹IBLE算法構(gòu)建分類預(yù)測模型,該算法是利用信息論中信道容量的概念作為對圖書實體中選擇重要屬性的度量,信道容量是一個不依賴于正例和反例的比例,僅依賴于訓(xùn)練集中正例、反例的屬性取值的選擇量,這樣信道容量克服了互信息依賴正例、反例的比例的缺點,而且,用多個屬性組合成規(guī)則的結(jié)點來鑒別實例,能夠更有效地正確判別。此外在算法設(shè)計上,對IBLE算法引入歸一

3、化互信息,將它用作生成決策規(guī)則樹的啟發(fā)式信息,在建樹的同時得到分類的邏輯規(guī)則。
  為了解決決策樹生成過程中的訓(xùn)練數(shù)據(jù)噪聲處理問題和IBLE算法對時間順序數(shù)據(jù)的過度擬合問題,提出了對數(shù)據(jù)預(yù)處理中加進差異、差異比的屬性,從而使得決策樹在生成過程中簡化了計算,在一定程度上克服了IBLE算法的不足之處,最終得到了較為理想的決策規(guī)則樹,其結(jié)點個數(shù)明顯減少,而分類精度變得更高。
  在系統(tǒng)實現(xiàn)上,實現(xiàn)了挖掘流程和模型結(jié)果的可視化,允許

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論