版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、<p> 題 目 基于多元統(tǒng)計模型的地震數(shù)據(jù)分析與處理</p><p> 摘 要:</p><p> 本文研究了地震數(shù)據(jù)的處理與分析問題。地震的發(fā)生是一個極其復雜的過程,存在大量不確定因素與不確定信息,給地震的預(yù)測帶來諸多的困難。本文用主成分分析方法構(gòu)建綜合指標用于描述地震發(fā)生前的數(shù)據(jù)規(guī)律,并用貝葉斯判別分析方法對地震的樣本數(shù)據(jù)進行學習、驗證及預(yù)測,取得
2、了較好的效果。</p><p> 針對任務(wù)一,我們從原始數(shù)據(jù)中計算出各項指標的日均值,繪制出各指標分年度的時間序列圖,同時利用一階差分法分析了這些指標對地震的影響情況(見正文表1),得到了較好的結(jié)果。</p><p> 針對任務(wù)二,我們選取了附件數(shù)據(jù)中的十個指標進行主成分分析,為了消除各指標量綱的不統(tǒng)一,我們使用了相關(guān)系數(shù)矩陣。根據(jù)主成分分析,最終確定了5個主成分作為反應(yīng)地震異常的綜合
3、指標,發(fā)現(xiàn)電磁波、氣溫、氣壓等因素的異常與地震的發(fā)生有密切的關(guān)系。</p><p> 針對任務(wù)三,我們使用了多元統(tǒng)計模型中的貝葉斯判別分析法,假定樣本數(shù)據(jù)只來源于兩個總體,即地震前兆的數(shù)據(jù)總體和正常的數(shù)據(jù)總體。考慮到地震前兆的樣本數(shù)據(jù)均表現(xiàn)出顯著的起伏波動特征,因此我們選取了標準差作為判別變量。在地震前兆的數(shù)據(jù)總體中抽取5組,在正常的數(shù)據(jù)總體中抽取6組作為學習和檢驗樣本進行貝葉斯判別分析,判對比率為81.8%,
4、并對2010年上半年的地震數(shù)據(jù)進行分析,發(fā)現(xiàn)里面包含地震前兆特征,后驗概率接近于1。</p><p> 任務(wù)四中,我們闡述了對地震數(shù)據(jù)的分析處理步驟,并且指出了地震數(shù)據(jù)分析平臺建立的作用與意義。平臺中包含的數(shù)據(jù)處理程序已在附件中給出。</p><p> 針對任務(wù)五,我們提出了一些可行性的設(shè)想,如觀測站應(yīng)在分布于不同地域的許多臺站同時進行以提供更多的數(shù)據(jù),加強震例總結(jié)和地震前兆時空分布特
5、征的研究等。</p><p> 關(guān)鍵詞:地震數(shù)據(jù)處理;主成分分析;貝葉斯判別分析</p><p> 參賽隊號 043 </p><p><b> 一、問題重述</b></p><p><b> 1.1 背景分析</b></p><
6、p> 地震是地殼快速釋放能量過程中造成的振動。雖然預(yù)測地震是世界性難題,但迄今科學界普遍認為,有可能反映地震前兆特征的指標可能不少于10個。已經(jīng)有專業(yè)儀器在多個定點實時按秒記錄這些指標的數(shù)據(jù),期望通過對記錄數(shù)據(jù)的分析研究找到地震的前兆特征。</p><p> 現(xiàn)已采集到某地2005年1月1日至2010年6月30日按小時觀測的10多個指標的數(shù)據(jù),和該地區(qū)該時期內(nèi)已發(fā)生地震的時刻、經(jīng)緯度、震級及震源深度的數(shù)
7、據(jù)。這些數(shù)據(jù)中隱藏著地震發(fā)生的前兆特征。科學地截取這些數(shù)據(jù)的有用片段,對數(shù)據(jù)進行合理地預(yù)處理,用數(shù)學方法揭示地震前兆的數(shù)據(jù)特征,是一項很有意義的研究工作。</p><p> 題給數(shù)據(jù)中的這10多個指標,究竟哪些與地震的發(fā)生有關(guān),有何種關(guān)系,是單一關(guān)系還是復合關(guān)系;除這10多個指標外還有哪些因素及含題給指標在內(nèi)的哪些指標的哪種數(shù)學模型更能反映地震的前兆特征等等,人們迄今仍不很清楚,需要進行深入地研究。地震數(shù)據(jù)的觀
8、測是持續(xù)進行的,隨著時間的推移數(shù)據(jù)的規(guī)模會不斷擴大。從中挖掘地震的前兆特征,必須有合理的數(shù)學模型,也必須有科學高效的算法分析平臺。因此,需要我們結(jié)合附件中給出的實際記錄數(shù)據(jù),嘗試完成以下任務(wù)。</p><p><b> 1.2 任務(wù)的提出</b></p><p> 任務(wù)一:分析數(shù)據(jù)特征,建立數(shù)學模型以度量各指標對地震發(fā)生的敏感程度。</p><
9、p> 任務(wù)二:構(gòu)造由某些或全部指標構(gòu)成的綜合指標,使其盡可能地集中反映地震發(fā)生前的數(shù)據(jù)特征的統(tǒng)計規(guī)律。</p><p> 任務(wù)三:結(jié)合題給數(shù)據(jù),廣泛查閱與地震相關(guān)的其它指標的數(shù)據(jù)和分析方法,建立數(shù)學模型來研究地震發(fā)生前的數(shù)量特征。</p><p> 任務(wù)四:將前述各項任務(wù)的計算程序集結(jié)成地震數(shù)據(jù)分析平臺,使其能夠完成形如題給數(shù)據(jù)的其它地震數(shù)據(jù)的分析,并能自動輸出前述任務(wù)的重要的
10、分析結(jié)果。</p><p> 任務(wù)五:對于進一步的研究設(shè)想寫一篇切實可行的報告。</p><p><b> 二、模型假設(shè)</b></p><p> 地震監(jiān)測點的監(jiān)測設(shè)施能正常運轉(zhuǎn);</p><p> 地震監(jiān)測設(shè)施周圍不存在影響其工作效能的干擾源,如飛機場、發(fā)電廠等;</p><p> 由
11、于題目中所監(jiān)控到的地震均不屬于強震,因此不考慮有余震的情況;</p><p> 對于監(jiān)測記錄中出現(xiàn)的個別數(shù)值極大預(yù)測量均當作極端異常值予以剔除。</p><p><b> 三、符號說明</b></p><p> ?。涸^測值時間序列,;</p><p> ?。簽榈趥€指標第個樣本的原始數(shù)據(jù);</p>&l
12、t;p><b> :特征值,;</b></p><p> ?。旱趥€指標的貢獻率;</p><p> ?。罕硎镜趥€主成分,;</p><p><b> ?。簶颖揪C合評價值。</b></p><p><b> 四、問題分析</b></p><p>
13、 根據(jù)問題重述,可以知道這是研究地震數(shù)據(jù)的處理與分析的問題。該問題的關(guān)鍵在于確定哪些指標與地震發(fā)生有著密切的關(guān)系,哪種數(shù)學模型更能反映地震的前兆特征。對此問題,從五個方面出發(fā),分別建立數(shù)學模型來度量各指標對地震發(fā)生的敏感程度、綜合某些或全部指標使其盡可能地集中反映地震發(fā)生前的數(shù)據(jù)特征的統(tǒng)計規(guī)律、建立數(shù)學模型來研究地震發(fā)生前的數(shù)量特征、將計算程序集結(jié)成地震數(shù)據(jù)分析平臺、對于進一步研究設(shè)想寫一篇切實可行的報告。</p>&l
14、t;p> 對于任務(wù)一,要分析附件中所給的數(shù)據(jù),建立數(shù)學模型以度量各指標對地震發(fā)生的敏感程度。附件中已給的10多個指標是按小時給出的,為了更直觀的顯示各指標與地震的關(guān)系,首先剔除極端異常數(shù)據(jù),對這些數(shù)據(jù)進行日平均處理。再對各個指標在地震前三個月的數(shù)據(jù)進行差分分析,比較分析后得到各指標對地震發(fā)生的敏感程度。</p><p> 對于任務(wù)二,運用主成分分析法找出由10多個指標的線性組合而成的綜合指標。這些主成分
15、可以盡可能地反映原來指標的信息 ,同時彼此間相互獨立,以達到集中反映地震發(fā)生前數(shù)據(jù)特征的主要統(tǒng)計規(guī)律。在所給的檢測數(shù)據(jù)指標中,有些指標在地震發(fā)生前出現(xiàn)較明顯的異常,而另一些指標并不出現(xiàn)異常,這些都會給考慮指標與地震關(guān)系帶來困難。主成分分析法正是解決這一問題的理想工具。</p><p> 任務(wù)三中要結(jié)合題給數(shù)據(jù),建立數(shù)學模型來研究地震發(fā)生前的數(shù)量特征。主要運用貝葉斯判別分析法進行建模,對已給數(shù)據(jù)進行先驗信息、后驗
16、信息分析。</p><p> 任務(wù)四要將計算程序集結(jié)成地震數(shù)據(jù)分析平臺,能夠完成其它地震數(shù)據(jù)的分析,并能自動輸出前任務(wù)的重要分析結(jié)果。</p><p> 任務(wù)五是針對進一步的研究設(shè)想寫一篇切實可行的報告。</p><p> 五、模型的建立與求解</p><p> 5.1 任務(wù)一的分析與解答</p><p>
17、地震是地殼快速釋放能量過程中造成的振動,期間會產(chǎn)生地震波的一種自然現(xiàn)象。地震發(fā)生時,最基本的現(xiàn)象是地面的連續(xù)振動,主要是明顯的晃動。由附件中所給的該地區(qū)該時期內(nèi)已發(fā)生地震的信息,該地區(qū)地震發(fā)生頻率比較高,在2007年和2008年都發(fā)生過兩次,地震發(fā)生間隔最少為40天。針對題中所給的不同指標數(shù)據(jù)特征,分析其對地震發(fā)生的敏感度。</p><p> 考慮到數(shù)據(jù)量大,而且由于數(shù)據(jù)采集過程中,可能儀器出現(xiàn)故障等不可抗因素
18、造成數(shù)據(jù)錯誤,所以我們首先必須剔除數(shù)據(jù)中的極端異常數(shù)據(jù),例如:在2008年的數(shù)據(jù)中,6月2日11:00的雨量為335544.3;3月20日0:00-3:00的水溫達到上萬甚至幾百億等,像這些數(shù)據(jù)我們首先就把它們從數(shù)據(jù)中剔除。只有在數(shù)據(jù)盡可能真實的情況下再來進行數(shù)據(jù)分析,才能得出數(shù)據(jù)的本質(zhì)特征。</p><p> 5.1.1 指標異常分析</p><p> 在對附件中的數(shù)據(jù)進行處理修正后
19、,先對各組數(shù)據(jù)進行分類匯總,計算出各組數(shù)據(jù)的日平均值,月平均值等,再利用軟件畫出各指標從2005年至2009年的日均值圖,從日均值圖來看,在每次地震來之前,電壓、電磁波幅度EW、電磁波幅度NS、地溫、水位、氣溫、氣壓、水溫、氣氡等指標的年變形態(tài)基本完好,但也有的指標由于受季節(jié)性的影響,如氣溫、氣壓等,不能很好地反映該指標數(shù)據(jù)的應(yīng)震能力。為此,我們引入一階差分方法[1]來刻畫每個指標對地震發(fā)生的影響敏感度。一階差分法是一種壓制長周期,突出
20、較短周期的高通線性濾波器。設(shè)原觀測值時間序列為,則一階差分時間序列為:</p><p> 短臨異常往往表現(xiàn)為測值突跳或離散度增大,而差分序列可以突出這類異常,對信息有一定的放大作用。</p><p> 根據(jù)已有專家學者的研究結(jié)果,結(jié)合前面我們對全年的日均值圖的分析,我們發(fā)現(xiàn)在題中所給數(shù)據(jù)中,地震發(fā)生前各指標有明顯波動異常的數(shù)據(jù)一般都在地震前的3個月左右,為了分析的方便以及對比,我們截取
21、了每次地震之前90天的數(shù)據(jù)來進行一階差分分析,利用統(tǒng)計軟件畫出了如下差分時間序列圖:</p><p> 圖5-1-1 2005年11月2日地震前電壓一階差分時間序列圖</p><p> 圖5-1-2 2006年7月26日地震前電壓一階差分時間序列圖</p><p> 圖5-1-3 2007年3月22日地震前電壓一階差分時間序列圖</p>&
22、lt;p> 圖5-1-4 2007年5月15日地震前電壓一階差分時間序列圖</p><p> 圖5-1-5 2009年11月5日地震前電壓一階差分時間序列圖</p><p> 從圖5-1-1到圖5-1-5可以看出,2005年電壓的變化起伏比較大,快到11月份的時候電壓值也突然增加,表現(xiàn)出了一定的地震預(yù)兆特征;2006年電壓變化處于平和狀態(tài),只有6月初出現(xiàn)了比較大的下降趨勢,
23、但很快有走向了平緩,對于這種情況,也有可能是發(fā)生地震的征兆;2007年電壓變化比較小,未見顯著的相關(guān)性;2008年和2009年在地震前電壓都出現(xiàn)了比較大的變化,而且持續(xù)時間一個月左右,表現(xiàn)出了臨震異常比較明顯的征兆。</p><p> 圖5-1-6 2005年11月2日地震前電磁波EW一階差分時間序列圖</p><p> 圖5-1-7 2006年7月26日地震前電磁波EW一階差分時
24、間序列圖</p><p> 圖5-1-8 2007年3月22日地震前電磁波EW一階差分時間序列圖</p><p> 圖5-1-9 2008年5月15日地震前電磁波EW一階差分時間序列圖</p><p> 圖5-1-10 2009年11月5日地震前電磁波EW一階差分時間序列圖</p><p> 圖5-1-11 2005年11月2
25、日地震前電磁波NS一階差分時間序列圖</p><p> 圖5-1-12 2006年7月26日地震前電磁波NS一階差分時間序列圖</p><p> 圖5-1-13 2007年3月22日地震前電磁波NS一階差分時間序列圖</p><p> 圖5-1-14 2008年5月15日地震前電磁波NS一階差分時間序列圖</p><p> 圖5
26、-1-15 2009年11月5日地震前電磁波NS一階差分時間序列圖</p><p> 地震時產(chǎn)生電磁波輻射現(xiàn)象目前已是不爭的事實,其產(chǎn)生的主要原因是壓電、壓磁效應(yīng)在巖石所受載荷超過其破裂強度產(chǎn)生破裂時,巖石晶格被破壞,產(chǎn)生電位跳躍輻射出電磁波信號。因此,電磁波輻射現(xiàn)象與地震活動有著較為密切的關(guān)系,電磁波觀測資料是一種捕捉臨震信號較有效的手段。</p><p> 圖5-1-6至圖5-1
27、-15反應(yīng)了地震前南北方向電磁波幅度和東西方向電磁波幅度的變化狀況,總體來說,每次地震前,電磁波都表現(xiàn)出了較大的異常。因此,電磁波對地震的發(fā)生有比較明顯的預(yù)測效應(yīng)。</p><p> 圖5-1-16 2005年11月2日地震前地溫一階差分時間序列圖</p><p> 圖5-1-17 2006年7月26日地震前地溫一階差分時間序列圖</p><p> 圖5-
28、1-18 2007年3月22日地震前地溫一階差分時間序列圖</p><p> 圖5-1-19 2008年5月15日地震前地溫一階差分時間序列圖</p><p> 圖5-1-20 2009年11月5日地震前地溫一階差分時間序列圖</p><p> 大量研究表明,地溫增加是比較可靠的地震前兆。從我們分析的數(shù)據(jù)也可以看出,2005年至2009年中,每次地震發(fā)生
29、之前,地溫都會表現(xiàn)出比較大的異常,特別是2005年11月2日的那次地震發(fā)生前,地溫表現(xiàn)出了明顯的上升趨勢。</p><p> 圖5-1-21 2005年11月2日地震前水位一階差分時間序列圖</p><p> 圖5-1-22 2006年7月26日地震前水位一階差分時間序列圖</p><p> 圖5-1-23 2007年3月22日地震前水位一階差分時間序列
30、圖</p><p> 圖5-1-24 2008年5月15日地震前水位一階差分時間序列圖</p><p> 圖5-1-25 2009年11月5日地震前水位一階差分時間序列圖</p><p> 地震會給地下水帶來嚴重的影響,會引起地下水位的升降。反之,如果正常的地下水位突然出現(xiàn)水位升降的異常,可能是受到外力的作用而變化的,這時就 有可能發(fā)生地震,應(yīng)做好準備,及
31、時跟蹤捕捉更可靠的信息。從2005年到2009年的數(shù)據(jù)我們也發(fā)現(xiàn)地震發(fā)生前該地區(qū)的水位出現(xiàn)異常,在做了一階差分后,異常表現(xiàn)的更突出,因此,水位的變化也是一個地震前兆的一個重要因素。</p><p> 圖5-1-26 2005年11月2日地震前氣溫一階差分時間序列圖</p><p> 圖5-1-27 2006年7月26日地震前氣溫一階差分時間序列圖</p><p&
32、gt; 圖5-1-28 2007年3月22日地震前氣溫一階差分時間序列圖</p><p> 圖5-1-29 2008年5月15日地震前氣溫一階差分時間序列圖</p><p> 圖5-1-30 2009年11月5日地震前氣溫一階差分時間序列圖</p><p> 氣溫這一指標是最容易受季節(jié)性影響的,從氣溫的日均值圖中可以看出,氣溫變化呈現(xiàn)出周期性的變化,很
33、難發(fā)現(xiàn)地震前氣溫的異常變化。在對溫度數(shù)據(jù)進行一階差分處理后,從圖5-1-26到圖5-1-30中我們可以看到圖像的變化也是一直趨于平緩,未見很大的跳躍,據(jù)此,我們認為由于氣溫受外界影響的因素太多,比如天氣、季節(jié),等因素,因此我們不能武斷地說氣溫不是地震前兆的一個指標,還有待進一步的研究。</p><p> 圖5-1-31 2005年11月2日地震前氣壓一階差分時間序列圖</p><p>
34、 圖5-1-32 2006年7月26日地震前氣壓一階差分時間序列圖</p><p> 圖5-1-33 2007年3月22日地震前氣壓一階差分時間序列圖</p><p> 圖5-1-34 2008年5月15日地震前氣壓一階差分時間序列圖</p><p> 圖5-1-35 2009年11月5日地震前氣壓一階差分時間序列圖</p><p&
35、gt; 氣壓的變化跟氣溫的變化類似,也是受外界太多的因素的影響,就題中的數(shù)據(jù)說明氣壓對地震的發(fā)生有一定的異常反應(yīng)。</p><p> 圖5-1-36 2005年11月2日地震前水溫一階差分時間序列圖</p><p> 圖5-1-37 2006年7月26日地震前水溫一階差分時間序列圖</p><p> 圖5-1-38 2007年3月22日地震前水溫一階差
36、分時間序列圖</p><p> 圖5-1-39 2008年5月15日地震前水溫一階差分時間序列圖</p><p> 圖5-1-40 2009年11月5日地震前水溫一階差分時間序列圖</p><p> 水溫前兆異常中,臨震異常最為顯著,一般認為獲取水溫臨震異常時預(yù)測地震發(fā)生的有效手段。對該地區(qū)的每次地震前的數(shù)據(jù)進行分析,發(fā)現(xiàn)水溫可以很好的反映地震的前兆。特別
37、是在一階差分方法處理后的數(shù)據(jù)中,2005年到2009年發(fā)生地震前,水溫的一階差分曲線都出現(xiàn)了比較大的波動。所以如果某觀測點測得的水溫數(shù)據(jù)突然異常,應(yīng)該對其進行跟蹤,并作出相應(yīng)的處理。</p><p> 圖5-1-41 2005年11月2日地震前氣氡一階差分時間序列圖</p><p> 圖5-1-42 2006年7月26日地震前氣氡一階差分時間序列圖</p><p
38、> 圖5-1-43 2007年3月22日地震前氣氡一階差分時間序列圖</p><p> 圖5-1-44 2008年5月15日地震前氣氡一階差分時間序列圖</p><p> 圖5-1-45 2009年11月5日地震前氣氡一階差分時間序列圖</p><p> 氡是一種放射性氣體,是鐳衰變的中間產(chǎn)物。氡在巖石的孔隙和裂隙中以自由氡、吸附氡和封閉氡的形式
39、存在,在地下水中以溶解氡的形式存在。自由逸出水面的氡稱為氣氡。</p><p> 通過附件中數(shù)據(jù),選取的是2005年以來該地區(qū)發(fā)生的幾次地震,從圖5-1-46知,2006年1月至6月初呈鋸齒狀,6月15日以后呈急劇上升狀態(tài)直到到7月初氣氡量超過20,2006年7月26日發(fā)生地震。</p><p> 圖5-1-46 2006年日均值</p><p> 2007
40、年3月22日發(fā)生地震,震前氣氡呈鋸齒狀在10附近上下擺動,無明顯異常狀態(tài)。震后氣氡持上升狀態(tài),3月28日起氣氡量持續(xù)3天超過20,4月5日發(fā)生地震。</p><p> 圖5-1-47 2007年日均值</p><p> 2008年2月至4月初氣氡值持續(xù)在5以下,之后不斷升高超過40,在5月15日發(fā)生地震。受地震影響氣氡值在30左右跳動,6月21日跳到20以下后突然升高,6月27日高過
41、40,7月5日再次發(fā)生地震。</p><p> 圖5-1-48 2008年日均值</p><p> 2009年6月中旬至7月中旬水氡異常,之后趨于平穩(wěn)狀態(tài),11月5日發(fā)生地震。</p><p> 圖5-1-49 2009年日均值</p><p> 研究表明,氡反應(yīng)靈敏,氣氡在地震分析預(yù)報中起著十分重要的作用。</p>
42、<p> 5.1.2 各指標對地震的敏感程度</p><p> 通過分析上面2005年至2009年的數(shù)據(jù),由于題中給的數(shù)據(jù)中雨量、傾斜儀等數(shù)據(jù)缺失太多,所以我們在此問中不予考慮,留在后面再做分析,通過分析其他指標數(shù)據(jù),我得出如下表格來評價各指標對地震發(fā)生的敏感程度。</p><p> 表1 地震時間及各指標在震前是否記錄到異常</p><p>
43、5.2 任務(wù)二的解答</p><p> 近年來,對短臨地震預(yù)報的研究漸趨增多。但是,定量的、綜合地研究短臨前兆指標體系的文章還不多[2]。隨著數(shù)據(jù)庫技術(shù)的成熟和數(shù)據(jù)應(yīng)用的普及,人類積累的數(shù)據(jù)量正在以指數(shù)速度增長。面臨浩渺無際的數(shù)據(jù),人們期望獲得從汪洋數(shù)據(jù)中去粗取精、去偽存真的技術(shù)。于是,從數(shù)據(jù)庫中發(fā)現(xiàn)知識及其核心技術(shù)——數(shù)據(jù)挖掘便應(yīng)運而生。</p><p> 在數(shù)據(jù)挖掘中,數(shù)據(jù)清洗是數(shù)
44、據(jù)挖掘前的一個重要環(huán)節(jié),包括去噪聲、填補丟失的域、刪除無效數(shù)據(jù)、保持數(shù)據(jù)的完整性和正確性等,還包括對時序數(shù)據(jù)的整理和歸并以及對數(shù)據(jù)相關(guān)指標的分析等。本文將用主成分分析方法對附件給出了10多個指標進行分析,集中確定反映地震發(fā)生前的數(shù)據(jù)特征的統(tǒng)計規(guī)律。</p><p> 5.2.1 模型的建立與求解</p><p> 主成分分析法旨在力保原始數(shù)據(jù)信息丟失最小的情況下,對高維變量空間進行降維
45、處理,即在保證原始數(shù)據(jù)信息損失最小的前提下,經(jīng)過線性變換和舍棄部分信息,以少數(shù)的綜合變量取代原有的多維變量。</p><p> 基于主成分分析法的地震前綜合指標評價模型 </p><p> 1、主成分分析原理及計算過程 </p><p> ?。?)將樣本數(shù)據(jù)標準化,得到標準化后的數(shù)據(jù)矩陣為</p><p><b> ,<
46、/b></p><p> 其中:,,,為原始樣本數(shù)據(jù)。 </p><p> (2)計算相關(guān)系數(shù)矩陣 </p><p><b> R =</b></p><p> ?。?)計算R的特征方程的個非負特征值。</p><p> ?。?)計算對應(yīng)特征值的相應(yīng)的特征向量,個特征向量成的特征向量矩
47、陣</p><p> (5)由特征向量C組成個新因子,有。</p><p> (6)選擇(個主分量,這p個主分量的累積方差貢獻率大于等于85%以上,即。 </p><p> (7)根據(jù)Z=XC,計算p個主成分的值。</p><p> (8)計算樣本綜合評價值,式中。</p><p> 2、地震發(fā)生前數(shù)據(jù)特征的
48、主成分分析評價</p><p> 根據(jù)前面問題的分析,在眾多指標中降雨量受到外界因素影響很大,傾斜儀所得數(shù)據(jù)依賴儀器精確度較高,故我們選取除這些指標外的9個指標構(gòu)成綜合指標,表2為通過主成分分析法得到的各參數(shù)在各主成分中的特征值及貢獻率。由表2可以看到,取5個主成分時累計貢獻率已達到90.58%,取6個主成分時累計貢獻率已達到97.87%。這表明前5個主成分已包含了樣本中的絕大部分信息量。</p>
49、<p> 表2 各參數(shù)在各主成分中的特征值、貢獻率</p><p> 表3為所選指標在5個主成分中的系數(shù)(特征向量),由表3可知主成分1中的x2電磁波幅度EW值、x3電磁波幅度NS值、x6氣溫值、x7氣壓值系數(shù)較大,是構(gòu)成主成分1 的主要參數(shù);主成分2中x5水位值、x6氣溫值、x9氣氡值系數(shù)較大,是構(gòu)成主成分2 的主要參數(shù);主成分3中x1電壓值、x4地溫值系數(shù)較大,是構(gòu)成主成分3的主要參數(shù);主成分
50、4中x1電壓值、x4地溫值、x7氣壓值系數(shù)較大,是構(gòu)成主成分4的主要參數(shù);主成分5中x4地溫值、x8氣氡值系數(shù)較大,是構(gòu)成主成分5的主要參數(shù)。</p><p> 表3 5個主成分的載荷</p><p> 主成分的得分及綜合得分見附錄1。</p><p> 圖5-2-1 綜合指標的時間序列圖</p><p> 本文取前5個主成分進行分
51、析,并根據(jù)主成分來計算地震發(fā)生前數(shù)據(jù)的綜合指標Y。圖5-2-1為該地區(qū)地震綜合指標Y隨時間的變化曲線??梢钥吹皆?005年11月2日該地區(qū)2.3級地震前和2006年7月26日發(fā)生的3.6級地震前不到一年的時間內(nèi)。該地區(qū)的指標數(shù)據(jù)出現(xiàn)了明顯的下降后,在升高的過程中,異常幅度明顯大于0.25,盡管在地震前數(shù)據(jù)綜合指標Y在上述一些地震前出異常升降現(xiàn)象,Y值總體是漸增趨勢,但異常幅度一般小于0.25,。這反應(yīng)了地震前該區(qū)各指標出現(xiàn)一定的增強,但
52、增強的水平仍不高。</p><p> 圖5-2-2 第一主成分的時間序列圖</p><p> 圖5-2-2至圖5-2-6是根據(jù)綜合得到主成分1至主成分5隨時間變化的曲線 ,從中可以看到圖5-2-1中綜合指標Y的基本形態(tài)主要由主成分1確定。這是由于主成分1的貢獻率最大 ,已達到33%。表明地震強度綜合指標Y主要由該地區(qū)發(fā)生地震的、、及4個參數(shù)值確定,這是由于其他成分貢獻率較小的緣故。&l
53、t;/p><p> 比較圖中上述5個反應(yīng)地震前期數(shù)據(jù)特征的參數(shù)隨時間的變化,由于這些參數(shù)分別反映了地震發(fā)生前的數(shù)據(jù)不同側(cè)面的特征,可以看出有的圖中的一些參數(shù)在地震發(fā)生前的異常變化不明顯,而一些參數(shù)在其他時段反而變化比較大,總體預(yù)報效果不好。而通過主成分分析發(fā)現(xiàn),綜合指標Y則比較好地反映了地震發(fā)生前數(shù)據(jù)特征的綜合特征。</p><p> 5.3 問題三的模型與解答</p>&l
54、t;p> 近年來世界各地不斷發(fā)生災(zāi)難性地震, 造成大量的人員傷亡和經(jīng)濟損失, 尤其是 2008 年震驚世界的“5·12” 汶川大地震, 更是讓人觸目驚心。此后, 地震預(yù)測研究再次引起多方重視。所謂地震預(yù)測即根據(jù)所認識到或摸索出的規(guī)律, 用科學的方法對未來地震發(fā)生的時間、地點和強度做出預(yù)先估計。而地震預(yù)報則是在具備一定可靠程度的前提下, 將地震預(yù)測的意見向公眾宣布??梢?科學的地震預(yù)測是成功實現(xiàn)地震預(yù)報的基礎(chǔ)。地震前相關(guān)
55、指標的出現(xiàn)成為地震前兆已成為無可厚非的客觀事實。為了減少地震帶給人類的生命與財產(chǎn)損失,對短臨地震預(yù)報的研究漸趨增多,對人類認識地震及防御工作起到了十分重要的作用。</p><p> 董曉娜[3]給出震例數(shù)據(jù)概要,《中國震例》中提到的異常進行系統(tǒng)整理,總計209條震例,涉及到106個異常指標,其中測震指標41個,前兆指標65個(見[3]中表1)。夏洪瑞在文獻[4]中針對目前地震數(shù)據(jù)擬合方法中需要解決的主要問題進行
56、了分析與討論,提出了應(yīng)用常規(guī)二次多項式擬合地震數(shù)據(jù)的方法,給出了具體實施步驟,并利用理論模型和實際地震資料對方法進行了驗證。</p><p> 董瑞樹[5]分別介紹了特征地震模型與混合地震模型的建立,采用正態(tài)分布擬合得到滿意的結(jié)果,在中國西部特征地震原地復發(fā)價格經(jīng)驗概率分布選用對數(shù)正態(tài)分布,利用對數(shù)正態(tài)分布條件概率建立混合地震模型。</p><p> 目前地震活動性分析有許多指標參量,
57、各參量在不同時段變化各異,預(yù)報效果不理想。由于各參量之間通常具有一定的相關(guān)性,王煒在[6]中選擇了地震頻次 N( ML≥3.0)、b值、η值、A(b)值、Mf值、Ac值、C值和D值8個參量進行因子分析,得到的反映地震活動時、空、強異常特征的綜合指標W。并在2005年江西九江5.7級地震和華北14次5.7級以上地震前出現(xiàn)明顯的異常變化,可以較好地反映地震活動時、空、強異常特征。并對因子分析的有關(guān)問題進行了討論。</p>&l
58、t;p> 本文應(yīng)用貝葉斯判別分析,建立數(shù)學模型來研究地震發(fā)生前的數(shù)量特征。</p><p> 5.3.1 貝葉斯判別分析原理</p><p> Bayes學派將人類的經(jīng)驗信息與抽樣數(shù)據(jù)信息協(xié)調(diào),得到后驗分布進行決策。因為他的實用性使得某些專家認為21世紀可能是Bayes學派思想占主導地位。判別分析的特點是根據(jù)已掌握的、歷史上每個類別的若干樣本的數(shù)據(jù)信息,總結(jié)出客觀事物分類的規(guī)律
59、性,建立判別公式和判別準則。然后,當遇到新的樣本點時,只要根據(jù)總結(jié)出來的判別公式和判別準則,就能判別該樣本點所屬的類別。</p><p> 設(shè)有定義明確的 g個類,,……,分別為,,……,的多元正態(tài)分布,對任何一個個體,若己知P個變量的觀察值,要求判斷該個體最可能屬于哪一個類。如果制訂了一個判別規(guī)則,難免會發(fā)生錯分現(xiàn)象,若把實屬于第i類的個體錯分到第j類的概率記為,這種錯分造成的損失記為,那么在這個判別分類規(guī)則
60、下實屬第i類的個體錯分到其他類別的損失為:</p><p> 記第類個體出現(xiàn)的概率為,從而這個判別分類規(guī)則錯分的平均損失為: </p><p> 貝葉斯判別準則就是根據(jù)平均損失最小原則來尋找一個判別規(guī)則來進行判別。但在實際問題中,要精確地給出的值,使之真正反映客觀需要是比較困難的,因為不論何種錯分都同樣不受歡迎,故可把它們看作完全相等,則令,.這時平均損失量L變?yōu)椋?</p&
61、gt;<p> 就相當于錯分概率,平均損失最小就相當于錯分類的概率最小。</p><p> 5.3.2 任務(wù)三的求解</p><p> 針對任務(wù)三,由于地震發(fā)生前各指標體現(xiàn)出的起伏波動程度較大的離散狀態(tài),在數(shù)據(jù)處理時我們采用日均值的標準差,這樣能更好的與正常狀態(tài)下的數(shù)據(jù)進行區(qū)分。我們假定樣本數(shù)據(jù)只來源于兩個總體,即地震前兆的數(shù)據(jù)總體(組別1)和正常狀態(tài)下的數(shù)據(jù)總體(組別
62、2)。</p><p> 對于樣本容量的選擇,組別1選自地震前90天指標的數(shù)據(jù),組別2選自正常狀態(tài)下90天的數(shù)據(jù)。運用貝葉斯判別分析原理,結(jié)合經(jīng)過處理的數(shù)據(jù),通過Minitab軟件分析,結(jié)果如表4。</p><p> 表4 貝葉斯判別分析結(jié)果</p><p> 在上表中,只有觀測量1和觀測量9的擬合結(jié)果是錯誤的,整個模型的判對率達到了81.8%。同時我們把2
63、010年上半年的數(shù)據(jù)代入這個模型中,得到的分組判別結(jié)果為1,也就是是說在2010年上半年的數(shù)據(jù)中,包含有地震前兆的特征。后驗概率為1.0。(程序見附件)</p><p> 5.4 任務(wù)四的模型與解答</p><p> 本任務(wù)要求設(shè)計地震數(shù)據(jù)分析平臺,使其能夠完成形如上述題給數(shù)據(jù)的其它地震的分析。</p><p> 5.4.1 地震數(shù)據(jù)分析平臺的功能</p
64、><p> 地震無疑是當今世界上最具破壞力的災(zāi)難之一。一次大地震,能給人們的生產(chǎn)生活帶來難以估計的損失。然而由于地震災(zāi)害成因復雜、影響因素眾多,是迄今為止最難有效預(yù)防的天然災(zāi)害之一。為了降低地震災(zāi)害給國家和人民所帶來的生命財產(chǎn)損失,我們應(yīng)該完善預(yù)警機制,加強地震的預(yù)測工作。因而建立一個比較有效的地震數(shù)據(jù)分析平臺就顯得十分重要。在了解數(shù)據(jù)分析平臺的整體功能前,我們首先要了解整個的分析過程。</p>&l
65、t;p> 本平臺進行數(shù)據(jù)分析的總體步驟如下:</p><p> 一、數(shù)據(jù)文件的收集與讀取。</p><p> 只有擁有了數(shù)據(jù),才能進行數(shù)據(jù)的分析。首先,要對各地震監(jiān)測站的數(shù)據(jù)進行收集與整理,并且要確保數(shù)據(jù)能夠被系統(tǒng)所讀取。這是我們進行后續(xù)處理的前提。</p><p> 二、觀測數(shù)據(jù)項的折線圖。</p><p> 在把數(shù)據(jù)導入系
66、統(tǒng)后,我們可以通過在圖形化界面上觀察數(shù)據(jù)變化的整體趨勢和數(shù)據(jù)變化的特點,來發(fā)現(xiàn)數(shù)據(jù)項之間的依存關(guān)系,幫助我們進行直觀判斷,為進一步的分析提供思路。</p><p><b> 三、層次分析</b></p><p> 這是一個非常重要的處理過程,因為地震監(jiān)測站點所監(jiān)測的數(shù)據(jù)指標往往比較多,然而太多的變量往往使我們對問題的分析變得復雜。因此,我們希望變量個數(shù)較少而得到的
67、信息較多。我們用層次分析法構(gòu)建矩陣最后通過一致性檢驗</p><p> 四、貝葉斯判別分析及預(yù)測</p><p> 判別分析是一種判定樣本所屬類型的統(tǒng)計方法。貝葉斯判別法能夠保留各總體出現(xiàn)的概率的大?。ㄏ闰灨怕剩瑴p少誤判的發(fā)生,是一種非常有效的判別手段。對于地震的前兆指標的數(shù)據(jù),它們必定會呈現(xiàn)與正常時各指標所體現(xiàn)出來的數(shù)值特征。因此,正常的數(shù)據(jù)來地震前兆的數(shù)據(jù)應(yīng)該來自于兩類不同的總體
68、。通過對已經(jīng)劃分好組別的樣本數(shù)據(jù)進行學習,我們可以對當前的地震數(shù)據(jù)進行判別,得到它所屬的組別。</p><p> 5.4.2 地震數(shù)據(jù)分析平臺開發(fā)與設(shè)計的意義</p><p> 本平臺的設(shè)計在于突出主成分分析及貝葉斯判別模型的使用效果,通過研究,我們發(fā)現(xiàn)它比一般的回歸模型更加有效,更貼近真實情況,并且預(yù)測也更準確。 </p><p> 通過本平臺我們可以完成完
69、整的分析過程,包括對數(shù)據(jù)的讀取與預(yù)整理,對數(shù)據(jù)的分析和對數(shù)據(jù)的呈現(xiàn)等等,然而,對于地震數(shù)據(jù)的處理是一個非常復雜的問題,我們的模型還是存在這樣或是那樣的不足,在以后需要不斷完善和加以改進,加入多種決策方法來解決不同性質(zhì)的問題,滿足各種需要。通過構(gòu)建這個平臺,可以驗證本文中的模型的實際可用性,同時也起到一個拋磚引玉的作用,讓更多的人關(guān)注和推動地震活動的分析與預(yù)測。</p><p> 5.5 進一步的研究設(shè)想<
70、/p><p> 由于地震過程的復雜性,地殼深部的不可入性,地震事件的小概率性,決定地震預(yù)測是個全球性的科學難題。</p><p> 地震前異常變化與地震關(guān)系的不唯一性,各局部地區(qū)異常變化關(guān)系的復雜性,不同地震前異?,F(xiàn)象的差異性,臨震異常的短暫性,都使得地震預(yù)測的困難重重。</p><p> 綜觀世界,當代的地震預(yù)報仍處于比較低的水平階段。尚無把握預(yù)報準確的發(fā)震地點
71、和時間。</p><p> 研究表明短期前兆對地震時間的預(yù)報是必要的,但它的性質(zhì)在許多情況下我們還不清楚。單憑經(jīng)驗企圖查明短期前兆出現(xiàn)時間對震級和震中距方面的依賴關(guān)系看來是不可靠的。考慮到強烈地震發(fā)生較少,預(yù)報工作也就更加艱巨,需要相當長的時間,精密的技術(shù)裝備,系統(tǒng)化的野外觀測和對觀測結(jié)果的反復比較,才有可能事先發(fā)出預(yù)報。觀測應(yīng)在分布于不同地域的許多臺站同時進行。而題中給出的數(shù)據(jù)是非常有限的,僅僅給出一個觀測點
72、12個指標的數(shù)據(jù)。若有更多地震前兆指標的更多數(shù)據(jù),我們即可建立更加精確的模型,從而能夠較精確的預(yù)測地震的發(fā)生。再者我們?nèi)詿o法預(yù)報地震發(fā)生的時間、地點、震級的大小。</p><p> 于是我們研究設(shè)想找到更多的地震前兆特征指標,并揭示各指標的內(nèi)在聯(lián)系,然后根據(jù)經(jīng)驗和對地震孕育與發(fā)生過程的認識進行的地震預(yù)報。今后,不僅應(yīng)在對各單項觀測結(jié)果進行分析的基礎(chǔ)上,進一步加強震例總結(jié)和地震前兆時空分布特征的研究,同時應(yīng)大力加
73、強有關(guān)的基礎(chǔ)性研究工作,加強各種預(yù)報方法的研究攻關(guān)。</p><p><b> 參考文獻</b></p><p> [1] 緱亞江,劉東升,何松毅等.石泉4.7級地震前天水深井水溫的短臨異常特征[J].高原地震,2003,15(4):45-51.</p><p> [2] 李文英,陳紹緒,張清榮.地震短臨預(yù)報綜合指標的研究[J].地震,
74、1994,5:20-30.</p><p> [3] 董曉娜,段會川.基于粗糙集的屬性約簡在地震異常指標識別中的應(yīng)用研究[J].山西地震,2010,1:21-24.</p><p> [4] 夏洪瑞,董江偉,鄒少峰等.常規(guī)二次多項式擬合地震數(shù)據(jù)[J].石油物探,2006,45(5):492-496.</p><p> [5] 董瑞樹,染洪流,任國強.混合地震模
75、型的建立及其科學意義[J].西北地震學報,2000,22(4):390-396.</p><p> [6] 王煒,林命週,趙利飛等. 地震活動參數(shù)約簡的因子分析方法[J].西北地震學報,2006,28(4):303-308.</p><p> [7] 張昱,李英,李永強等.甘肅及鄰區(qū)數(shù)字化氣氡觀測及其地震前兆監(jiān)測效能評估[J].地震研究,2008,31(3):28-32.</p&
76、gt;<p> [8] 趙靜,但琦.數(shù)學建模與數(shù)學實驗[M],北京:高等教育出版社,2003.</p><p> [9] 姜啟源,謝金星,葉俊.數(shù)學模型[M],北京:高等教育出版社,2003.</p><p><b> 附錄:</b></p><p> 表1 2005年~2009年各項指標月平均值</p>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 空間建模與數(shù)據(jù)分析論文
- 統(tǒng)計學論文(數(shù)據(jù)分析)
- 統(tǒng)計建模與數(shù)據(jù)分析實驗報告
- 數(shù)學建模數(shù)據(jù)分析題
- 數(shù)學建模論文-基于統(tǒng)計分析的葡萄酒評價模型
- 基于微博用戶行為的數(shù)學建模和數(shù)據(jù)分析.pdf
- 時空序列數(shù)據(jù)分析和建模.pdf
- 模型參數(shù)調(diào)整的數(shù)據(jù)分析、處理及決策.pdf
- 基于“數(shù)據(jù)分析”的統(tǒng)計教學策略研究
- 基于主題模型的用戶手機日志數(shù)據(jù)分析
- 數(shù)據(jù)分析的統(tǒng)計方法選擇小結(jié)
- 基于bayes估計和rasch模型擬合的考試缺失數(shù)據(jù)分析
- 統(tǒng)計學數(shù)據(jù)分析 統(tǒng)計學
- 41561.經(jīng)濟物理學中的金融數(shù)據(jù)分析:統(tǒng)計與建模
- 基于OLTP數(shù)據(jù)庫的數(shù)據(jù)分析建模過程的研究.pdf
- 基于saas和云技術(shù)的商業(yè)數(shù)據(jù)分析及挖掘模型應(yīng)用
- 基于KMV模型和符號數(shù)據(jù)分析的股票板塊特征分析.pdf
- excel數(shù)據(jù)分析工具進行多元回歸分析
- 定性數(shù)據(jù)分析論文
- 基于廣義Thurstone模型的排序數(shù)據(jù)分析.pdf
評論
0/150
提交評論