2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩101頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著社會(huì)經(jīng)濟(jì)與科學(xué)技術(shù)的發(fā)展,信息技術(shù)得到了廣泛的應(yīng)用,許多領(lǐng)域積累了大量的數(shù)據(jù),迫切需要一種新技術(shù)與工具來(lái)幫助人們快速地從海量的數(shù)據(jù)中找出重要的有價(jià)值的信息,數(shù)據(jù)挖掘技術(shù)就是基于這種背景應(yīng)運(yùn)而生。而作為數(shù)據(jù)挖掘的一個(gè)重要研究?jī)?nèi)容一序列模式挖掘,已經(jīng)得到了許多研究,提出了許多有關(guān)序列模式挖掘的算法,如AprioriAll算法、SPADE算法以及PrifixSpan算法等等,而且序列模式挖掘在許多領(lǐng)域得到了廣泛的應(yīng)用,如顧客購(gòu)買行為分析、

2、Web訪問(wèn)模式分析以及DNA序列分析等等。 但是,目前已經(jīng)提出的許多序列模式挖掘算法僅僅是挖掘出滿足用戶指定的最小支持度minsup的序列模式,并沒(méi)有考慮序列模式的重要性,即雖算法挖掘出的所有的序列模式都滿足用戶指定最小支持度minsup,但用戶可能更關(guān)注比較重要的序列模式,它們雖然不能滿足用戶指定最小支持度,但是這些序列對(duì)用戶來(lái)說(shuō)比較有價(jià)值;相反地,有些序列模式可能對(duì)用戶來(lái)說(shuō)重要程度并不是很大,并不需要挖掘,這就需要算法能夠自

3、適應(yīng)地調(diào)整以挖掘出符合用戶需求的序列模式,但已提出的挖掘算法沒(méi)有考慮這種特征,無(wú)法挖掘出這樣的序列模式。 由于形式概念分析中的概念格模型只需訪問(wèn)一次數(shù)據(jù)庫(kù)就可構(gòu)建成功,并且它的知識(shí)與層次表達(dá)能力強(qiáng),將序列引入概念格中,只需存儲(chǔ)最大公共子序列,減少了冗余序列的產(chǎn)生。為此,本文對(duì)序列模式挖掘與模糊概念格的結(jié)合進(jìn)行了系統(tǒng)的研究,主要研究成果如下: (1)針對(duì)目前概念格構(gòu)造算法在較大規(guī)模稀疏的數(shù)據(jù)集或分布式的數(shù)據(jù)集上,生成概念時(shí)

4、仍然需要耗費(fèi)大量的時(shí)間,本文提出了一種基于IE-Tree(Intension andExtension Tree)與特征空間劃分的概念生成算法IETreeCS(Concept Set based onIntension and Extension Tree)。IETreeCS算法首先將形式背景轉(zhuǎn)為IE-Tree,減少了數(shù)據(jù)集的存儲(chǔ)量;然后該算法在IE-Tree的基礎(chǔ)上進(jìn)行了特征空間的描述與劃分,最后給出了完整的IETreeCS算法。實(shí)驗(yàn)

5、結(jié)果表明該算法在較大規(guī)模稀疏的數(shù)據(jù)集或分布式的數(shù)據(jù)集上性能優(yōu)越,有明顯地提高。同時(shí),IETreeCS算法也為序列模糊概念格的構(gòu)建提供了算法支持。 (2)為了組織與挖掘有價(jià)值的滿足多需求的序列模式,本文提出了一種序列模糊概念格模型,并給出了序列模糊概念格的構(gòu)造算法SeqFuzCL(Sequence FuzzyConcept Lattice)。在傳統(tǒng)的模糊形式背景的基礎(chǔ)上,本文將其在序列上進(jìn)行了擴(kuò)展,定義了序列模糊形式背景;利用擴(kuò)展

6、的序列模糊形式背景,定義了概念的Galois閉包連接、序列模糊概念及其格結(jié)構(gòu),最后給出了序列模糊概念格的構(gòu)建算法SeqFuzCL。通過(guò)實(shí)驗(yàn)表明,序列模糊概念格模型不僅可以方便有效的組織自適應(yīng)序列模式,在時(shí)間與空間上都具有良好的性能,而且還可以在序列模糊概念格上挖掘傳統(tǒng)意義下的序列模式,同時(shí),為進(jìn)一步挖掘自適應(yīng)序列模式提供了理論支持。 (3)由于在實(shí)際應(yīng)用中,許多大型數(shù)據(jù)庫(kù)是以分布式的形式存在的,為了能夠有效與方便地處理分布環(huán)境下

7、的序列,本文在序列模糊概念格的基礎(chǔ)上提出了分布序列模糊概念格模型及其構(gòu)建算法DSeqFuzCL(Distributed Sequence FuzzyConcept Lattice)。在分布序列模糊概念格模型上,不僅可以有效挖掘分布序列模式,而且還可以挖掘滿足用戶多需求的特殊分布序列模式,如分布加權(quán)序列模式等。通過(guò)實(shí)驗(yàn)證明,本文提出的分布序列模糊概念格構(gòu)建算法DSeqFuzCL具有良好的時(shí)間與空間性能。 (4)在序列模糊概念格的基

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論