版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、隨著網(wǎng)絡(luò)的快速發(fā)展,人們處在這個“信息爆炸”的時代,常常面對海量數(shù)據(jù)分析和處理的任務(wù),且這樣的數(shù)據(jù)仍在以幾何級數(shù)增長。同時,在現(xiàn)實中這些海量數(shù)據(jù)往往又是高維而稀疏的,且存在著大量的冗余。因而能對高維海量數(shù)據(jù)做壓縮處理,且保持其內(nèi)在屬性的有效處理方法成為人工智能、機器學(xué)習、數(shù)據(jù)挖掘等領(lǐng)域的重要研究課題之一。高效的維數(shù)約減算法是對高維海量數(shù)據(jù)處理的一種有效方法,且具有一定的實際應(yīng)用價值。本文的關(guān)注點集中在適用于高維海量數(shù)據(jù)的快速維數(shù)約減算法
2、的研究及其具體應(yīng)用。 本文分別提出了兩種新的維數(shù)約減算法:(1)基于期望擾動的直接隨機映像算法(On the Expected Distortion Bound of Direct Random Projection,簡稱DRP);(2)基于錨點集的最小平方誤差等距嵌入算法(Anchor points based Isometric Embedding under least square error criterion,簡稱A
3、IE)。 基于期望擾動的直接隨機映像算法DRP具有O(dn)的時間復(fù)雜性,這樣的性能評價是建立在對期望擾動分析的基礎(chǔ)上的。并證明了1)DRP算法的期望擾動的界。2)在適當?shù)慕o定條件下,可在O(1)的隨機時間內(nèi)找到一個將期望擾動限定在一個合適范圍之內(nèi)的DRP映像。進而提出了一種獲得中肯DRP的啟發(fā)式算法。此算法具有穩(wěn)固的漸進加速比,相對于其他隨機映像算法具有更好的穩(wěn)定性。而且在流數(shù)據(jù)模式下,可采用增量策略,DRP算法的時間復(fù)雜性為
4、O(d log d)。 基于錨點集的最小平方誤差等距嵌入算法AIE具有O(n log(n))的時間復(fù)雜性,而且在獲得測地線距離后的計算時間復(fù)雜度達到對嵌入點數(shù)的線性關(guān)系,且可以完全并行實現(xiàn)。與Isomap、LLE等非線性維數(shù)約減算法相比較,具有更優(yōu)化的時間復(fù)雜性。 當前主流的搜索引擎根據(jù)查詢詞在網(wǎng)頁中的出現(xiàn)頻率,輔以網(wǎng)頁權(quán)威性等信息,生成查詢結(jié)果。但用戶提供的查詢詞往往非常簡單,在許多情況下,搜索引擎難以確定用戶的查詢意
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于圖的半監(jiān)督維數(shù)約減算法研究及其應(yīng)用.pdf
- 非線性維數(shù)約減算法中若干關(guān)鍵問題的研究.pdf
- 面向問答系統(tǒng)的大規(guī)模文本數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究.pdf
- 文本數(shù)據(jù)挖掘在信息監(jiān)控中的應(yīng)用研究.pdf
- 文本數(shù)據(jù)挖掘在工程圖文檔中的應(yīng)用.pdf
- Web數(shù)據(jù)挖掘及其在網(wǎng)絡(luò)新聞文本數(shù)據(jù)中的應(yīng)用.pdf
- 40570.面向大規(guī)模文本數(shù)據(jù)的并行svm算法的設(shè)計與實現(xiàn)
- 基于流形學(xué)習和低秩表示的維數(shù)約減算法研究.pdf
- Web文本數(shù)據(jù)挖掘研究.pdf
- K-means算法的改進及其在文本數(shù)據(jù)聚類中的應(yīng)用.pdf
- 面向大規(guī)模圖數(shù)據(jù)的挖掘分析算法研究.pdf
- 大規(guī)模數(shù)據(jù)集高效數(shù)據(jù)挖掘算法研究.pdf
- 大規(guī)??茖W(xué)數(shù)據(jù)挖掘中密度聚類算法的研究.pdf
- 電力中文文本數(shù)據(jù)挖掘技術(shù)及其在可靠性中的應(yīng)用研究.pdf
- 基于WWW的文本數(shù)據(jù)挖掘研究.pdf
- 基于鄰域粗糙集的屬性約簡和樣本約減算法研究及在文本分類中的應(yīng)用.pdf
- 大規(guī)模數(shù)據(jù)庫關(guān)聯(lián)規(guī)則挖掘算法研究.pdf
- 大規(guī)模數(shù)據(jù)挖掘聚類算法的研究與實現(xiàn).pdf
- H-KTT聚類算法及其在大規(guī)模AMI數(shù)據(jù)分析中的應(yīng)用.pdf
- 大規(guī)模軌跡數(shù)據(jù)的檢索、挖掘及應(yīng)用.pdf
評論
0/150
提交評論