

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、信息網(wǎng)絡(luò)表示現(xiàn)實世界中實體以及實體之間的聯(lián)系。隨著科技的進(jìn)步和互聯(lián)網(wǎng)的普及,信息網(wǎng)絡(luò)應(yīng)用廣泛,如社交網(wǎng)絡(luò)、生物網(wǎng)絡(luò)、交通網(wǎng)絡(luò)等。信息網(wǎng)絡(luò)可以用圖數(shù)據(jù)模型進(jìn)行建模,包含頂點和邊兩個元素,其中頂點對應(yīng)現(xiàn)實世界中的實體對象,邊對應(yīng)實體之間的聯(lián)系。按照信息網(wǎng)絡(luò)中頂點和關(guān)系的類型的數(shù)量,信息網(wǎng)絡(luò)被劃分為兩類:同構(gòu)信息網(wǎng)和異構(gòu)信息網(wǎng)。同構(gòu)信息網(wǎng)中頂點和邊的類型都只有一種,如朋友網(wǎng)、作者合作網(wǎng)等。異構(gòu)信息網(wǎng)包含多種類型的頂點和邊。大多數(shù)真實世界的信息
2、網(wǎng)絡(luò)都是異構(gòu)的,如知識圖譜、社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)等。異構(gòu)信息網(wǎng)絡(luò)強(qiáng)大的表達(dá)能力使其蘊(yùn)含大量有價值的信息,使異構(gòu)信息網(wǎng)絡(luò)查詢和分析研究具有重要的現(xiàn)實意義。本文運用算法學(xué)、數(shù)據(jù)分析和計算復(fù)雜性的相關(guān)技術(shù),結(jié)合異構(gòu)信息網(wǎng)信息豐富和結(jié)構(gòu)復(fù)雜的特點,對異構(gòu)信息網(wǎng)絡(luò)查詢和分析問題進(jìn)行深入研究,主要研究成果概括如下:
1.本文研究了異構(gòu)信息網(wǎng)上可達(dá)性查詢問題。可達(dá)性查詢是查詢兩個頂點之間是否存在路徑連接,是信息網(wǎng)絡(luò)中的基本查詢。研究兩個頂點的關(guān)
3、系時,首先考慮的查詢也是兩點的可達(dá)性。然而,信息網(wǎng)絡(luò)上的可達(dá)性查詢不涉及頂點的類型和邊的類型,且都是建立在有向無環(huán)圖的基礎(chǔ)上。在異構(gòu)信息網(wǎng)中環(huán)路是經(jīng)常存在的,把異構(gòu)信息網(wǎng)中強(qiáng)連通組件壓縮成一個頂點會丟失不同類型頂點之間的路徑信息,現(xiàn)有的信息網(wǎng)絡(luò)上可達(dá)性研究都無法解決異構(gòu)信息網(wǎng)上基于不同關(guān)系的可達(dá)性查詢。本文形式化的定義了異構(gòu)信息網(wǎng)上可達(dá)性查詢問題,并證明該問題的時間復(fù)雜性是PTIME的。隨著網(wǎng)絡(luò)規(guī)模的爆炸式增長,每個查詢都需要遍歷一遍網(wǎng)
4、絡(luò)的時間開銷是不能容忍的。因此,本文提出MP索引結(jié)構(gòu)用于快速響應(yīng)查詢。通過將網(wǎng)絡(luò)的元路徑按照長度進(jìn)行分層,構(gòu)建元路徑的偏序圖。在偏序圖上選擇一部分元路徑,并預(yù)計算元路徑上頂點的可達(dá)信息,使多個查詢可以共享相同元路徑中頂點可達(dá)信息。在真實和人工數(shù)據(jù)集上實驗驗證了本文算法可以快速響應(yīng)查詢。
2.本文研究了異構(gòu)信息網(wǎng)上聚集算法。聚集操作允許用戶從特定的維度上觀察數(shù)據(jù)的視圖,是多維分析的基礎(chǔ)。然而,信息網(wǎng)絡(luò)上的聚集操作只基于同構(gòu)信息網(wǎng)
5、上頂點的屬性維度,與頂點的類型、邊的類型、以及網(wǎng)絡(luò)的結(jié)構(gòu)無關(guān)。異構(gòu)信息網(wǎng)不僅包含多種類型的頂點,還包含多種類型的關(guān)系,聚集的維度不應(yīng)該僅限于頂點的屬性,而忽略豐富的結(jié)構(gòu)信息。因此信息網(wǎng)絡(luò)上現(xiàn)有的聚集工作無法用于異構(gòu)信息網(wǎng)。本文提出了基于多種類型頂點和多種類型邊的聚集操作,聚集的維度包括:頂點的類型、頂點的屬性和邊的類型。定義了異構(gòu)信息網(wǎng)上基于圖熵的度量函數(shù),該函數(shù)能夠很好的刻畫異構(gòu)信息網(wǎng)中頂點在不同關(guān)系上的相似度。本文證明了異構(gòu)信息網(wǎng)上
6、的聚集問題是NP難的,并提出了線性時間和空間的高效近似聚集算法。聚集算法包括兩個過程:信息維聚集和結(jié)構(gòu)維聚集。本文進(jìn)一步證明了算法的近似比。最后在真實數(shù)據(jù)集上的實驗結(jié)果顯示異構(gòu)信息網(wǎng)上的聚集算法能夠在特定的維度上對異構(gòu)信息網(wǎng)進(jìn)行深入的分析,并具有較好的可擴(kuò)展性。
3.本文研究了異構(gòu)信息網(wǎng)上立方體計算問題。立方體計算允許用戶從不同的維度觀察數(shù)據(jù)對象的概括,是多維數(shù)據(jù)分析的核心。由于信息網(wǎng)絡(luò)上聚集操作的維度定義的局限制,也導(dǎo)致其立
7、方體物化技術(shù)只基于頂點的屬性維度,通過屬性子集合之間的包含關(guān)系,選擇部分立方體進(jìn)行物化。異構(gòu)信息網(wǎng)上維度概念的復(fù)雜化,使得傳統(tǒng)立方體物化技術(shù)并不適用于異構(gòu)信息網(wǎng)。本文提出了異構(gòu)信息網(wǎng)上立方體概念,從多個維度分析網(wǎng)絡(luò):頂點屬性、頂點類型和元路徑。本文研究了異構(gòu)信息網(wǎng)上的部分立方體物化問題,證明了該問題是NP難的。為了解決部分立方體物化問題,本文提出了異構(gòu)信息網(wǎng)上聚集圖之間兩種依賴關(guān)系:屬性依賴和路徑依賴,利用這兩種依賴關(guān)系建立代價模型和構(gòu)
8、建方體格。本文為解決部分立方體物化問題提出了貪心算法,證明了該算法的近似比。在真實數(shù)據(jù)集上的實驗結(jié)果顯示異構(gòu)信息網(wǎng)立方體可以從多個維度上對網(wǎng)絡(luò)進(jìn)行有效的分析,部分立方體物化算法可以提高查詢效率。
4.本文研究了異構(gòu)信息網(wǎng)上近似冰山立方體問題。冰山立方體問題是計算聚集值大于閾值的立方體,是多維數(shù)據(jù)分析中的重要操作。然而,現(xiàn)有信息網(wǎng)絡(luò)上冰山立方體也是基于同構(gòu)信息網(wǎng)中頂點的屬性維度。顯然,這并不適用于異構(gòu)信息網(wǎng)。對于具有多種類型頂點
9、和邊的異構(gòu)信息網(wǎng)來說,冰山立方體需要涉及頂點的屬性維度、類型維度,以及結(jié)構(gòu)維度,聚集函數(shù)也更加復(fù)雜。因此,需要一種新的冰山立方體定義,刻畫異構(gòu)信息網(wǎng)復(fù)雜的語義和結(jié)構(gòu)。本文形式化的定義了異構(gòu)信息網(wǎng)上冰山立方體,證明了該問題是NP難的。為了快速求解問題,本文設(shè)計了基于隨機(jī)游走的近似算法,并證明了基于隨機(jī)游走計算頂點相似性的相對誤差界。本文設(shè)計了兩種剪枝策略。當(dāng)聚集函數(shù)滿足單調(diào)性時,可以提前結(jié)束方體計算或直接對方體進(jìn)行剪枝。在真實和人工數(shù)據(jù)集
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 異構(gòu)信息網(wǎng)絡(luò)Top-k相關(guān)性查詢方法研究.pdf
- 基于jspjava信息網(wǎng)設(shè)計和實現(xiàn)
- 異構(gòu)信息網(wǎng)絡(luò)分析模型及其應(yīng)用研究.pdf
- 寧夏農(nóng)村信息網(wǎng)的績效分析.pdf
- 異構(gòu)信息網(wǎng)絡(luò)檢索技術(shù)研究.pdf
- 化學(xué)信息網(wǎng)ppt
- 安徽電力信息網(wǎng)
- 教育信息網(wǎng)若干子系統(tǒng)的研究和實現(xiàn).pdf
- 異構(gòu)信息集成查詢技術(shù)的研究與實現(xiàn).pdf
- 測控信息網(wǎng)傳輸協(xié)議研究.pdf
- 基于威脅分析的電力信息網(wǎng)風(fēng)險態(tài)勢評估和預(yù)測.pdf
- 異構(gòu)信息網(wǎng)絡(luò)上的主題建模研究.pdf
- 附件-浙江農(nóng)業(yè)信息網(wǎng)
- jsp就業(yè)信息網(wǎng)論文
- 陜西采購招標(biāo)信息網(wǎng)
- 營口地區(qū)電力信息網(wǎng)系統(tǒng)規(guī)劃和設(shè)計.pdf
- 文件-浙江農(nóng)業(yè)信息網(wǎng)
- 中國研究生招生信息網(wǎng)
- 控制網(wǎng)與信息網(wǎng)的數(shù)據(jù)融合.pdf
- 郵政信息網(wǎng)信息安全問題初探.pdf
評論
0/150
提交評論