版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、在科研工作者的科研活動(dòng)中,發(fā)表論文是其中非常重要的部分。論文承載著科研工作者的研究成果,只有發(fā)表在出版物上,才能得到世人的認(rèn)可。對于長期從事科學(xué)研究的工作者來說,可以依據(jù)現(xiàn)有的科研經(jīng)驗(yàn)檢索與論文研究方向相匹配的期刊,但檢索結(jié)果也是不全面的;對于發(fā)表論文經(jīng)驗(yàn)不足的科研工作者,面對成千上萬的期刊就像大海撈針,如果選擇了不適合的期刊進(jìn)行投稿,經(jīng)過長時(shí)間的審稿之后會有較大的被退稿的可能。若被拒稿,再重新投稿,還需要重新排版,這樣反復(fù)的工作量,浪
2、費(fèi)了科研工作者大量寶貴的科研時(shí)間。選擇適合投稿的出版物,成為科研工作者面臨的重要問題。因此,向投稿人推薦適合投稿的出版物成為非常有現(xiàn)實(shí)意義的工作。
第一,向投稿人推薦適合投稿的期刊,首先要考慮期刊與稿件的研究領(lǐng)域是否相同,本文利用余弦相似度方法計(jì)算期刊與論文研究方向的相關(guān)度。研究方向相關(guān)度作為期刊推薦數(shù)據(jù)樣本中最重要的數(shù)據(jù)屬性,因?yàn)橹挥醒芯糠较蛳嚓P(guān)才有推薦成功的可能。其次考慮期刊的質(zhì)量,利用K-Means算法對數(shù)據(jù)樣本中影響期
3、刊重要性的指標(biāo),影響因子和載文量這兩個(gè)屬性的值進(jìn)行聚類,研究屬性值的分布,使每個(gè)分組盡可能的合理。
第二,選擇數(shù)據(jù)挖掘算法中的ID3算法進(jìn)行數(shù)據(jù)樣本的分類。首先數(shù)據(jù)樣本中屬性取值太多,ID3算法處理困難。為了解決ID3算法的不足,利用多值邏輯理論對數(shù)據(jù)屬性值進(jìn)行離散化,使屬性取值映射到多值邏輯有限的幾個(gè)值上,從而減少屬性的取值。最后將改進(jìn)后的ID3算法應(yīng)用到稿刊推薦中,推薦與論文相關(guān)的期刊。
第三,選擇數(shù)據(jù)挖掘算法中
4、的 C4.5算法進(jìn)行數(shù)據(jù)樣本的分類。為了提高 C4.5算法的處理效率,利用多值邏輯理論進(jìn)行改進(jìn)。將改進(jìn)后的 C4.5算法應(yīng)用到稿刊推薦中,并與改進(jìn)后的ID3算法進(jìn)行準(zhǔn)確度的對比分析。實(shí)驗(yàn)驗(yàn)證,改進(jìn)后的ID3算法的分類準(zhǔn)確度高于改進(jìn)后的C4.5算法。
本文將數(shù)據(jù)挖掘分類算法應(yīng)用到稿刊推薦研究中,由分類模型提取分類規(guī)則,利用分類規(guī)則推薦出與用戶論文相關(guān)度高的期刊。采用MySQL數(shù)據(jù)庫和Java面向?qū)ο蟪绦蛟O(shè)計(jì)語言,以數(shù)據(jù)挖掘、數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于Web數(shù)據(jù)挖掘的推薦系統(tǒng)算法研究.pdf
- 基于Web數(shù)據(jù)挖掘的智能推薦研究.pdf
- 基于數(shù)據(jù)挖掘的文獻(xiàn)自動(dòng)推薦研究.pdf
- 基于數(shù)據(jù)挖掘的數(shù)字圖書館個(gè)性化推薦算法研究.pdf
- 基于大數(shù)據(jù)的推薦算法研究.pdf
- 基于海量數(shù)據(jù)挖掘的打車推薦系統(tǒng).pdf
- 基于Hadoop平臺的數(shù)據(jù)挖掘算法研究.pdf
- 基于關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法的研究.pdf
- 基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘算法研究.pdf
- 基于數(shù)據(jù)挖掘的視頻推薦技術(shù)研究.pdf
- 基于評論挖掘的協(xié)同過濾推薦算法研究.pdf
- 基于Hadoop的數(shù)據(jù)挖掘算法的研究.pdf
- 基于PageRank算法的Web數(shù)據(jù)挖掘的研究.pdf
- 基于粒子群算法的數(shù)據(jù)挖掘.pdf
- 基于數(shù)據(jù)挖掘算法的入侵檢測研究.pdf
- 基于粒計(jì)算的數(shù)據(jù)挖掘算法研究.pdf
- 基于異常數(shù)據(jù)挖掘算法的研究.pdf
- 基于海量數(shù)據(jù)挖掘的分類算法研究.pdf
- 基于數(shù)據(jù)挖掘理論的跟蹤算法研究.pdf
- 基于密度的離群數(shù)據(jù)挖掘算法研究.pdf
評論
0/150
提交評論