版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、隨著世界各國的各大天文臺的落成與不斷地運行,天文數(shù)據(jù)也在以驚人的速度飛速地增長,對海量天文數(shù)據(jù)的處理也成為了目前天文領(lǐng)域迫切需要解決的問題。這些海量的數(shù)據(jù)包含了測光數(shù)據(jù),光譜數(shù)據(jù)和天文圖像數(shù)據(jù)等多種數(shù)據(jù),本文主要針對天體光譜數(shù)據(jù)的預(yù)處理和自動分類進行研究,因為海量的光譜數(shù)據(jù)中隱含著很多時變天體、稀少天體,甚至還有一些未知天體,而特殊天體的發(fā)現(xiàn)對天文領(lǐng)域的一些宇宙演變規(guī)律以及研究生命的起源等都有著特殊的意義。雖然有了這些天體的光譜數(shù)據(jù),但
2、是仍然無法確定他們的類型,僅僅靠天文觀測來發(fā)現(xiàn)新天體是非常困難的,工作量也很龐大,所以很多計算機領(lǐng)域研究者著重于研究光譜的自動分類的方法,也有很多研究者研究挖掘特殊天體的方法。
研究發(fā)現(xiàn)很多研究人員在使用計算機的自動分類技術(shù)來完成恒星光譜的自動分類工作,而特殊天體的發(fā)現(xiàn)是其中一個非常重要的研究領(lǐng)域。本文主要針對斯隆數(shù)字巡天發(fā)布的相關(guān)的海量光譜數(shù)據(jù)進行分析,重點研究了特殊天體的光譜數(shù)據(jù)特征,分析光譜數(shù)據(jù)的高維特征,找出適合高維光
3、譜數(shù)據(jù)的降維算法,確定其最佳維數(shù)特征;并通過算法的比較和優(yōu)化構(gòu)造不同的分類模型,最終通過實驗對比確定最終的高準確率的分類模型。目的是發(fā)現(xiàn)新的特殊天體WDMS(WhiteDwarf+M Sequence Binaries,白矮主序雙星),從而對前人已發(fā)現(xiàn)的結(jié)果進行補充,為天體演化、密度分布、結(jié)構(gòu)等問題提供了更好的條件,同時也為進一步探究銀河系的形成與演化起到了不可或缺的作用。
本文研究了高維的天體光譜數(shù)據(jù)的有效的特征提取方法并確
4、定WDMS的最佳降維維數(shù)。分別研究了線性特征提取方法和非線性特征提取方法對高維的光譜數(shù)據(jù)進行降維。針對線性特征提取方法主要使用了PCA(主變量分析)的方法提取光譜的主要特征值構(gòu)造光譜特征矩陣,通過主成分分析,能夠從樣本集中找到一組變換基P。針對非線性性的方法主要使用了流形學(xué)習算法:等距特征映射(Isometric Feature Mapping,ISOMAP)和深度學(xué)習的棧式自編碼(SAE)。ISOMAP采用了微分幾何中的測地線距離,而
5、非歐式距離;棧式自編碼器能夠?qū)π螺斎氲墓庾V數(shù)據(jù)進行特征提取,利用訓(xùn)練得到的權(quán)值和光譜進行線性組合即可得到特征光譜數(shù)據(jù)。最后對線性與非線性的特征提取方法進行對比,從時間效率和準確度上確定更適合高維光譜數(shù)據(jù)的特征提取方法,并最終與分類算法結(jié)合確定WDMS的最佳維數(shù)特征。本文的主要創(chuàng)新點有:
1.使用深度學(xué)習實現(xiàn)對低信噪比的光譜數(shù)據(jù)進行數(shù)據(jù)降維。因為對于高信噪比的光譜數(shù)據(jù)使用線性的特征提取方法能夠得到較高的分類準確率,但是對于低信噪
6、比光譜數(shù)據(jù)分類效果不是很好,目前大多數(shù)的WDMS的研究者都主要研究信噪比高的光譜,而低信噪比的光譜由于光譜特征不夠明顯,所以研究上有一定的困難性,而本文通過實驗證明深度學(xué)習對于低信噪比的光譜數(shù)據(jù)也有很好的特征提取的效果。
2.WDMS的分類模型構(gòu)造?;诖_定好的降維算法,構(gòu)造了不同的分類模型,并對比了不同分類模型的分類效果,最終確定了針對SDSS(斯隆數(shù)字巡天)發(fā)布的DR10的全部數(shù)據(jù)的分類模型。該模型是通過對分類算法和聚類算
7、法的分類的準確率進行對比,然后將二者進行整合,利用聚類算法剔除大量的非WDMS,然后對剩余的光譜采用分類的方法,并對分類方法進行優(yōu)化,提出了一個基于聚類+分類的高準確率的WDMS的發(fā)現(xiàn)模型。最終通過該模型在DR10中共找出了4986個結(jié)果,其中4240個是WDMS,經(jīng)過驗證目前沒有被發(fā)現(xiàn)的有22個。實驗表明使用有效的數(shù)據(jù)挖掘方法進行特殊天體的自動搜索快速、準確率高、分類效果明顯,可以將此方法應(yīng)用到其他的望遠鏡數(shù)據(jù)上。
3.對已
8、發(fā)現(xiàn)的WDMS構(gòu)造顏色特征模型。Szkody提出的測光判據(jù)為相關(guān)研究提供了有效的可行性依據(jù),本論文通過構(gòu)建具有多項式特性的高維映射神經(jīng)網(wǎng)絡(luò)和徑向基神經(jīng)網(wǎng)絡(luò),對WDMS的顏色特征進行深度探索,擬合出分類效果更佳明顯的顏色特征模型,從而將該模型使用到SDSS發(fā)布的測光數(shù)據(jù)中,可以對海量的測光數(shù)據(jù)進行有效的數(shù)據(jù)篩選,從而大大提高了數(shù)據(jù)挖掘的效率。同時將該模型作為前面分類模型的數(shù)據(jù)預(yù)處理模型,完成海量數(shù)據(jù)挖掘的數(shù)據(jù)篩選工作,然后使用分類模型完成
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 29919.白矮主序雙星的尋找與觀測的研究
- 海量數(shù)據(jù)庫中的小模式發(fā)現(xiàn).pdf
- 海量天文星表數(shù)據(jù)的交叉與融合.pdf
- 面向海量數(shù)據(jù)的高效天文交叉證認的研究.pdf
- 面向海量天文數(shù)據(jù)的分布式存儲引擎的研究.pdf
- 海量客運數(shù)據(jù)中的頻繁旅行模式發(fā)現(xiàn)算法研究與實現(xiàn).pdf
- 海量光譜數(shù)據(jù)降維方法的研究與應(yīng)用.pdf
- 基于healpix的海量天文數(shù)據(jù)球面可視化研究開題報告
- 基于支持向量機的海量天體光譜數(shù)據(jù)分類系統(tǒng)研究.pdf
- 海量用戶行為序列中的模式發(fā)現(xiàn)及應(yīng)用.pdf
- 數(shù)據(jù)挖掘在保險海量數(shù)據(jù)中的研究與應(yīng)用.pdf
- 基于屬性偏序結(jié)構(gòu)原理的中藥近紅外光譜知識發(fā)現(xiàn)研究.pdf
- 47094.虛擬天文臺環(huán)境下的海量數(shù)據(jù)存儲與訪問技術(shù)研究
- 數(shù)據(jù)集成中的真值發(fā)現(xiàn)研究.pdf
- 海量數(shù)據(jù)存儲模式的研究.pdf
- MongoDB中的海量數(shù)據(jù)動態(tài)平衡.pdf
- 海量數(shù)據(jù)組織中的索引機制研究與實現(xiàn).pdf
- 40446.太陽鄰域下主序星的光譜定量分析
- NOSQL數(shù)據(jù)庫在海量數(shù)據(jù)存儲中的研究與應(yīng)用.pdf
- 基于序投影距離的微陣列數(shù)據(jù)診斷基因模式發(fā)現(xiàn)技術(shù)研究.pdf
評論
0/150
提交評論