版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著金融市場(chǎng)的全球化發(fā)展以及計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的廣泛應(yīng)用,全球金融市場(chǎng)已經(jīng)開始走向金融網(wǎng)絡(luò)化。與此同時(shí),互聯(lián)網(wǎng)業(yè)已成為企業(yè)、機(jī)構(gòu)和個(gè)人獲取金融信息的主要來(lái)源:作為專業(yè)金融信息服務(wù)提供商或是個(gè)人,在面對(duì)如此海量、繁雜的互聯(lián)網(wǎng)金融信息資源時(shí)不可避免會(huì)遇到一個(gè)巨大的挑戰(zhàn),即如何從互聯(lián)網(wǎng)中實(shí)時(shí)、快速地分類和處理金融數(shù)據(jù),如何提高Web金融數(shù)據(jù)獲取效率和質(zhì)量,從而改善公司金融信息服務(wù)質(zhì)量,提升公司在金融信息服務(wù)行業(yè)的核心競(jìng)爭(zhēng)力,這也成為當(dāng)今學(xué)術(shù)界研究
2、的重點(diǎn)問(wèn)題之一。
隨著信息技術(shù)和通訊技術(shù)的發(fā)展,自動(dòng)信息分類技術(shù)已經(jīng)成為人們有效的金融信息分類工具。當(dāng)今,Web文本分類的中文信息處理是一個(gè)重要的研究領(lǐng)域。其目標(biāo)是分析文本內(nèi)容的基礎(chǔ)上,分配一個(gè)文本到更合適的類別,以便提高文本檢索應(yīng)用程序的處理效率。目前有許多方法應(yīng)用到此技術(shù)中去。
目前,K最近鄰算法(KNN)被認(rèn)為是向量空間模型下最好的分類算法之一。KNN算法也是文本自動(dòng)分類領(lǐng)域中的一種常用算法,對(duì)于低維度
3、的文本分類,其分類準(zhǔn)確率較高。然而在處理大量高維度文本時(shí),傳統(tǒng)的KNN算法由于需處理大量訓(xùn)練樣本導(dǎo)致樣本相似度的計(jì)算量增加,降低了分類效率。為解決這個(gè)問(wèn)題,人們利用粗糙集對(duì)高維文本信息進(jìn)行屬性約簡(jiǎn),刪除冗余屬性?,F(xiàn)在相繼有了一些粗糙集和KNN的混合分類方法,主要是在屬性約簡(jiǎn)方面去做研究。雖然效率上比傳統(tǒng)的單一的KNN算法在分類效率上有了很大提高,但是仍有很大的改進(jìn)空間。于此,本文在基于粗糙集和KNN算法的基礎(chǔ)上,將給出一種基于粗糙集的K
4、NN分類系統(tǒng)模型和結(jié)合金融環(huán)境下的分類應(yīng)用系統(tǒng)。在模型和系統(tǒng)中,我們將引入一種改進(jìn)型分明矩陣的約簡(jiǎn)方法來(lái)約簡(jiǎn)屬性,并采用一種改進(jìn)型的CHI和模式聚合方法來(lái)處理特征提取階段,這樣使特征向量的個(gè)數(shù)大大的有效約簡(jiǎn),減少分類階段的數(shù)據(jù)輸入量,從而提高整個(gè)分類系統(tǒng)的分類效率,降低分類系統(tǒng)的時(shí)間和空間復(fù)雜度。在本文中,我們還通過(guò)實(shí)驗(yàn)結(jié)果與分析,說(shuō)明了這種基于粗糙集的KNN改進(jìn)的分類算法比目前一般的基于粗糙集的KNN分類算法,在分類效率上有了很大的提
5、高。
本文在分析Web文本挖掘與Web文本分類的研究現(xiàn)狀和存在問(wèn)題的基礎(chǔ)上,主要研究了Web文本分類關(guān)鍵技術(shù)、方法和基于粗糙集和KNN的混合Web文本改進(jìn)分類算法。本文的主要工作包括一下內(nèi)容:
(1)介紹Web挖掘、Web文本挖掘、Web文本分類、粗糙集的基礎(chǔ)理論和相關(guān)知識(shí),介紹Web文本分類過(guò)程中的關(guān)鍵技術(shù)。
(2)給出結(jié)合粗糙集與KNN的Web文本分類系統(tǒng)模型。
(3)給出一種
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 粗糙集在文本分類系統(tǒng)中的應(yīng)用研究.pdf
- 基于模糊粗糙集的Web文本分類研究.pdf
- 粗糙集理論在文本挖掘的分類算法中的應(yīng)用研究.pdf
- 粗糙集在Web挖掘中的應(yīng)用研究.pdf
- 基于粗糙集的Web文本分類技術(shù)研究.pdf
- 粗糙集理論在文本分類算法中的應(yīng)用
- 基于粗糙集的web文本挖掘研究.pdf
- 基于粗糙集理論的文本分類方法研究.pdf
- 粗糙集理論在文本挖掘中的應(yīng)用研究.pdf
- 基于粗糙集的文本自動(dòng)分類研究.pdf
- 粗糙集在紋理圖像分類中的應(yīng)用研究.pdf
- 基于粗糙集理論的文本分類算法研究及應(yīng)用.pdf
- 基于粗糙集的分類知識(shí)發(fā)現(xiàn)方法及其應(yīng)用研究.pdf
- 基于粗糙集的多標(biāo)記文本分類方法研究.pdf
- 基于粗糙集與支持向量機(jī)的Web文本分類.pdf
- 粗糙集方法及應(yīng)用研究.pdf
- 粗糙集理論在Web信息過(guò)濾中的應(yīng)用研究.pdf
- 粗糙集理論在中文文本分類中的應(yīng)用.pdf
- 基于粗糙集理論的文本分類研究.pdf
- 基于粗糙集的文本分類算法研究.pdf
評(píng)論
0/150
提交評(píng)論