版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、學(xué)位論文獨創(chuàng)性聲明學(xué)位論文獨創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進行的研究工作及取得的研究成果。據(jù)我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得直昌態(tài)堂或其他教育機構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說明并表示謝意。學(xué)位論文作者簽名(手寫):名f南鑫簽字日期:為≯年6月7日學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完
2、全了解南昌大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,有權(quán)保留并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和磁盤,允許論文被查閱和借閱。本人授權(quán)直昌太堂可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編本學(xué)位論文。同時授權(quán)中國科學(xué)技術(shù)信息研究所和中國學(xué)術(shù)期刊(光盤版)電子雜志社將本學(xué)位論文收錄到《中國學(xué)位論文全文數(shù)據(jù)庫》和《中國優(yōu)秀博碩士學(xué)位論文全文數(shù)據(jù)庫》中全文發(fā)表,并通過網(wǎng)絡(luò)向社會公眾提供信息服務(wù)。(
3、保密的學(xué)位論文在解密后適用本授權(quán)書)學(xué)位論文作者簽名(手寫):卸幺磊導(dǎo)師簽名(手寫):阪已勃吞簽字日期:乃7拜多月、7日簽字日期:支。f砂t;月7日’1摘要摘要隨著IT行業(yè)的興盛和互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,信息資源也在迅速、海量地增長。由于其中大部分的信息資源都以異構(gòu)、動態(tài)的Web文本形式存在,因此如何在這巨大的數(shù)據(jù)海洋中快捷方便地找到人們所需的信息已成為大家關(guān)注的焦點。Web文本分類技術(shù)是解決以上問題的一個主要方式,為此,本文在以下幾方面
4、對其做了相關(guān)的探討和研究:第一,提出了一種改進的X2統(tǒng)計方法。由于傳統(tǒng)的X。統(tǒng)計法往往會將很高的權(quán)重分配給分類能力較小的低頻詞,而分類能力強的特征詞權(quán)重則相對降低。因此,改進算法考慮了文檔中的詞頻因素,這樣可在一定程度上避免上述缺陷。第二,提出使用一種優(yōu)化的反向傳播算法。該方法不同于傳統(tǒng)的反向傳播算法,它在分類器的構(gòu)建過程中,其學(xué)習(xí)步長會進行微調(diào)。因此,在調(diào)整網(wǎng)絡(luò)連接權(quán)值之前,需要先計算對應(yīng)的學(xué)習(xí)步長。學(xué)習(xí)步長的計算結(jié)合了delta—b
5、ar。delta規(guī)則,該規(guī)則的引用避免了學(xué)習(xí)步長取值過大或過小帶來的易陷入局部極小值和網(wǎng)絡(luò)振蕩等問題。第三,針對使用向量空問模型(VSM)表示文本時會產(chǎn)生過高的文本特征維數(shù)而導(dǎo)致神經(jīng)網(wǎng)絡(luò)不易收斂,學(xué)習(xí)時間太長的問題,結(jié)合特征選擇和粗糙集理論,提出了基于優(yōu)化的RSBPNN文本分類方法。首先,運用本文提出的改進x2統(tǒng)計法預(yù)降維,然后利用其中的屬性約簡理論刪除冗余的特征詞,進行特征空間的再約簡操作,最后使用優(yōu)化的神經(jīng)網(wǎng)絡(luò)進行分類。第四,設(shè)計和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于RS-SVM的中文文本分類研究.pdf
- 基于RS-BPNN理論的隧道圍巖穩(wěn)定性分析及預(yù)測.pdf
- 基于RS-BPNN的房地產(chǎn)項目前期投資風(fēng)險評價研究.pdf
- 基于TAN的文本分類方法研究.pdf
- 基于WordNet本體庫的文本分類方法.pdf
- 基于NMF的中文文本分類方法.pdf
- 基于意群的文本分類方法研究.pdf
- 基于集成SVM的文本分類方法研究.pdf
- 基于文本分類技術(shù)的漏洞分類.pdf
- 基于內(nèi)容和情感的文本分類方法研究.pdf
- 基于改進詞語權(quán)重的文本分類方法研究.pdf
- 基于引力場模型的文本分類方法.pdf
- 基于極大頻繁序列模式的文本分類方法.pdf
- 基于相關(guān)主題模型的文本分類方法研究.pdf
- 基于流形學(xué)習(xí)的文本分類方法研究.pdf
- 基于文本分類技術(shù)的信息過濾方法的研究.pdf
- 基于詞向量的短文本分類方法研究.pdf
- 基于擴展的VSM中文文本分類方法.pdf
- 基于FPGA的文本分類高效實現(xiàn)方法研究.pdf
- 基于Spark并行化文本分類方法的研究.pdf
評論
0/150
提交評論