版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、計算機研究與發(fā)展DOI:10.7544issn10001239.2016.JournalofComputerResearchDevelopment卷(期):起止頁年收稿日期收稿日期:20160316;修回日期修回日期:20160426六號基金項目基金項目:國家自然科學(xué)基金項目(60903098);吉林省工業(yè)技術(shù)研究和開發(fā)項目(JF2012c0162);吉林大學(xué)研究生創(chuàng)新基金項目(2015040)ThiswkissupptedbytheN
2、ationalNaturalScienceFoundationofChina(60903098)theProjectofJilinProvincialIndustrialTechnologyResearchDevelopment(JF2012c0162)theGraduateInnovationFundofJilinUniversity(2015040).六號,核實準(zhǔn)確完整的基金名稱和英文翻譯通信作者通信作者:彭濤(tpeng@jlu.
3、)(注:此模板非完整論文,已做刪減。只看格式,勿參考內(nèi)容)(注:此模板非完整論文,已做刪減。只看格式,勿參考內(nèi)容)異質(zhì)網(wǎng)中基于張量表示的動態(tài)離群點檢測方法異質(zhì)網(wǎng)中基于張量表示的動態(tài)離群點檢測方法題目三號劉露1左萬利12彭濤12作者四號宋體,作者和單位的對應(yīng)關(guān)系標(biāo)注在作者姓名的右上角1(吉林大學(xué)計算機科學(xué)與技術(shù)學(xué)院長春130012)單位小五號2(符號計算與知識工程教育部重點實驗室(吉林大學(xué))長春130012)1(.)小五號TensRepr
4、esentationBasedDynamicOutlierDetectionMethodinHeterogeneouswkTitle四號四號LiuLu1ZuoWanli12PengTao12Name五號1(CollegeofComputerScienceTechnologyJilinUniversityChangchun130012)Depart.Crespond小五號2(KeyLabatyofSymbolComputationKnow
5、ledgeEngineering(JilinUniversity)MinistryofEducationChangchun130012)AbstractMiningrichsemanticinfmationhiddeninheterogeneousinfmationwkisanimptanttaskindatamining.Thevaluedatadistributiongenerationmechanismofoutliersarea
6、lldifferentfromthatofnmaldata.Itisofgreatsignificanceofanalyzingitsgenerationmechanismeveneliminatingoutliers.Outlierdetectioninhomogeneousinfmationwkhasbeenstudiedexpledfalongtime.Howeverfewofthemareaimingatdynamicoutli
7、erdetectioninheterogeneouswks.Manyissuesneedtobesettled.Duetothedynamicsoftheheterogeneousinfmationwknmaldatamaybecomeoutliersovertime.ThispaperproposesadynamicTensRepresentationBasedOutlierdetectionmethodcalledTRBOutlie
8、r.Itconstructstensindextreeaccdingtothehighderdatarepresentedbytens.Thefeaturesareaddedtodirectitemsetindirectitemsetrespectivelywhensearchingthetensindextree.Meanwhilewedescribeaclusteringmethodbasedonthecrelationofshtt
9、extstojudgewhethertheobjectsindatasetschangetheiriginalclustersthendetectoutliersdynamically.Thismodelcankeepthesemanticrelationshipinheterogeneouswksasmuchaspossibleinthecaseoffullyreducingthetimespacecomplexity.Theexpe
10、rimentalresultsshowthatourproposedmethodcandetectoutliersdynamicallyinheterogeneousinfmationwkeffectivelyefficiently.Abstract五號,至少200字,影響EI索引Keywdsdynamicoutlierdetectionheterogeneousinfmationwktensrepresentationtensinde
11、xtreeclusteringKeywds五號摘要挖掘隱藏在異質(zhì)信息網(wǎng)絡(luò)中豐富的語義信息是數(shù)據(jù)挖掘的重要任務(wù)之一離群點在值、數(shù)據(jù)分布、和產(chǎn)生機制上都明顯不同于正常數(shù)據(jù)對象檢測離群點并分析其不同的產(chǎn)生機制,最終消除離群點具有重要的現(xiàn)實意義目前,針對異質(zhì)信息網(wǎng)絡(luò)動態(tài)離群點檢測的研究工作相對較少,還有很多問題有待解決由于異質(zhì)信息網(wǎng)絡(luò)的動態(tài)性,隨著時間的變化,正常數(shù)據(jù)對象也可能轉(zhuǎn)變?yōu)殡x群點針對異質(zhì)網(wǎng)絡(luò)提出一種基于張量表示的動態(tài)離群點檢測方法,并
12、根據(jù)張量表示的高階數(shù)據(jù)構(gòu)建張量索引樹通過搜索張量索引樹,將特征加入到直接3計算機研究與發(fā)展2016年定的關(guān)系類當(dāng)節(jié)點類型數(shù)量∣A∣1或邊的類型數(shù)量∣R∣1時,這樣的信息網(wǎng)絡(luò)被稱為異質(zhì)信息網(wǎng)絡(luò)反之為同質(zhì)信息網(wǎng)絡(luò)定義2異質(zhì)信息網(wǎng)絡(luò)中的N階張量我們將異質(zhì)信息網(wǎng)絡(luò)中的N階張量表示為X∈?其中,N為張量的階數(shù)(也可稱模NtypeNltypeltypelIII?2211數(shù))第1階張量的長度記為l1,其對應(yīng)的實體類型為type1第N階張量的長度記為l
13、N,其對應(yīng)的實體類型為typeNtypei∈A,1≤i≤N?公式用office2003編輯器或者mathtype,普通變量用斜體,向量、矢量、張量用黑斜體例如,文獻網(wǎng)絡(luò)可以被表示成1個4階張量,X∈?電影網(wǎng)絡(luò)可以被表示為1TermVenuePaperAuth4321llllIIII個4階張量X∈?或一個3階張LanguageGenreMovieAct4321llllIIII量X∈?GenreMovieAct321lllIII定義3張量索
14、引樹張量索引樹是包含n(n≥1)個節(jié)點且滿足下列條件的有限集合:1)張量索引樹中的每一個節(jié)點都由1個N(N≥1)維向量組成2)存在唯一一個向量節(jié)點X0,它是由一系列時序數(shù)據(jù)組成的向量,稱為張量索引樹的根節(jié)點3)張量索引樹同一層的節(jié)點可以包含不同類型的數(shù)據(jù)但同一類型的數(shù)據(jù)都處于張量索引樹的同一層中…………2.2張量索引樹的構(gòu)建我們之前提到過,張量矢量化可能破壞各階中數(shù)據(jù)之間的關(guān)系在大數(shù)據(jù)環(huán)境下,不可避免地會引起維數(shù)災(zāi)難而對于異質(zhì)網(wǎng)絡(luò)中的數(shù)
15、據(jù),如何進行高階統(tǒng)計也是我們需要考慮的問題應(yīng)用張量分解方法,例如構(gòu)建鄰接矩陣,處理數(shù)據(jù)集中的樣本會出現(xiàn)嚴重的數(shù)據(jù)稀疏性問題在本節(jié)中,我們提出了一種構(gòu)建張量索引樹的方法來處理異質(zhì)信息網(wǎng)絡(luò)中用張量表示的數(shù)據(jù),進而動態(tài)發(fā)現(xiàn)網(wǎng)絡(luò)中存在的離群點我們首先描述張量索引樹的構(gòu)建過程由于本文主要解決動態(tài)離群點發(fā)現(xiàn)的問題,因此,張量索引樹的根節(jié)點為時序數(shù)據(jù)組成的向量X=(X1,X2,…,Xn),如圖1中Layer1所示在本節(jié)中,我們使用文獻網(wǎng)絡(luò)中的3階張量
16、模型來說明構(gòu)建過程在時間點X1中,順序遍歷N(N=3)階張量中的第1階張量將屬于type1類型的實體(作者名)加入第2層向量節(jié)點中同時,將該作者發(fā)表的論文依次加入第3層向量節(jié)點中第3層向量節(jié)點中的論文題目作為第2層向量節(jié)點中作者名的后繼節(jié)點……張量索引樹的構(gòu)建不僅可以加快離群點檢測的速度,而且可以有效解決在使用鄰接矩陣進行計算時出現(xiàn)的數(shù)據(jù)稀疏性問題X1X2XiXn1Xn...A11A12A1n1Length=n1A21A22A2n2Le
17、ngth=n2An1An2AnnmLength=nmP11P12P1u1P21P22P2u2Pn1Pn2PnumT11T12T1v1T21T22T2v2Tn1Tn2T2v...mLayer1:TimestampLayer2:AuthLayer3:PaperLayer4:TermLength=u1Length=u2Length=umLength=v1Length=v2Length=vm...........................
18、.........Fig.1Thetensindextreeconstructedbyathirddertensinbibliographicwk.圖1文獻網(wǎng)絡(luò)中由3階張量所構(gòu)建的張量索引樹中英文圖題用小五號,圖內(nèi)的字用英文六號3基于張量表示的聚類過程在本節(jié)中,我們詳細介紹如何根據(jù)給定的入口entry(source,target)搜索張量索引樹,進而使用聚類方法發(fā)現(xiàn)異質(zhì)網(wǎng)絡(luò)中存在的離群點(即源節(jié)點相對于目標(biāo)類別是否離群)張量索引樹可以根
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 一種新的圖像置亂算法-歡迎訪問計算機研究與發(fā)展
- 一種基于小波變換和騎士巡游的圖像置亂算法題目三號
- 圖像的混沌置亂算法研究.pdf
- 基于混沌置亂和Radon變換置亂的圖像加密算法.pdf
- 數(shù)字圖像置亂算法的研究.pdf
- 基于分區(qū)圖像置亂算法的研究.pdf
- 圖像置亂算法及其評估研究.pdf
- 一種基于線性同余的空間變換圖像置亂加密新算法.pdf
- 彩色數(shù)字圖像的置亂算法研究.pdf
- 基于改進的zigzag置亂的dwt圖像水印算法
- 一種基于BRISK的快速圖像拼接新算法.pdf
- 一種新的圖像分割算法—一種基于免疫遺傳算法和粗糙集的改進圖像分割算法.pdf
- 基于混沌映射的數(shù)字圖像置亂算法.pdf
- 一種新的顏色量化算法
- 基于混沌映射與排序變換的圖像置亂算法.pdf
- 基于最佳置亂的自適應(yīng)圖像數(shù)字水印算法.pdf
- 一種新的基于區(qū)域生長的彩色圖像分割算法.pdf
- 基于置亂的DWT域數(shù)字圖像水印算法研究.pdf
- 一種圖像拼接算法的研究.pdf
- 基于騎士巡游變換的圖像置亂算法及評價方法.pdf
評論
0/150
提交評論