MPT建模方法研究及其應(yīng)用.pdf_第1頁
已閱讀1頁,還剩141頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、多項(xiàng)加工樹模型(Multinomial Processing Tree Models,MPT)是一種源自社會科學(xué)領(lǐng)域的統(tǒng)計(jì)建模方法。其建模思想是依據(jù)當(dāng)前學(xué)科背景,運(yùn)用樹狀結(jié)構(gòu)對具有不同邏輯層次的信息處理過程進(jìn)行擬合,其中每一個(gè)信息加工過程的邏輯路徑選擇都將表示為分支概率的形式。進(jìn)而運(yùn)用統(tǒng)計(jì)學(xué)工具根據(jù)實(shí)際觀測數(shù)據(jù)對樹狀模型進(jìn)行參數(shù)辨識,并對所得結(jié)果進(jìn)行量化分析以形成結(jié)論。MPT模型首先被應(yīng)用于認(rèn)知科學(xué)領(lǐng)域?qū)﹄[性認(rèn)知過程的擬合分析并取得了巨

2、大的成功,而后進(jìn)一步延伸到社會學(xué)、語言學(xué)、邏輯學(xué)、數(shù)據(jù)挖掘與人工智能等相關(guān)學(xué)科領(lǐng)域。與其他建模分析方法相比,MPT模型在結(jié)構(gòu)依據(jù)與結(jié)論形成等方面優(yōu)勢明顯,但仍存在著模型結(jié)構(gòu)表述較為復(fù)雜,參數(shù)擬合迭代算法收斂速度較慢等方面的問題,并在多參數(shù)多子樹等復(fù)雜情況下尤為明顯。
   本文在深入研究MPT模型相關(guān)理論與標(biāo)準(zhǔn)算法的基礎(chǔ)上,從改進(jìn)模型表述與算法效率入手,一方面提出了MPT模型的上下文無關(guān)語言編碼算法及模型間等價(jià)轉(zhuǎn)化規(guī)則,使得對模

3、型結(jié)構(gòu)的調(diào)整得以完全在一維編碼空間中進(jìn)行;另一方面,在原算法基礎(chǔ)上提出了兩種改進(jìn)型參數(shù)擬合加速算法,取得了較高的計(jì)算性能。進(jìn)而將MPT模型推廣到對列聯(lián)表的建模處理與特異規(guī)則提取過程中,取得了較好的應(yīng)用效果。論文主要包括如下研究內(nèi)容:
   首先,綜合表述了MPT模型的產(chǎn)生背景及研究與應(yīng)用現(xiàn)狀,并對現(xiàn)有MPT模型的基本理論與標(biāo)準(zhǔn)計(jì)算過程進(jìn)行了必要的分析證明,總結(jié)歸納了模型的性質(zhì)與標(biāo)準(zhǔn)建模流程,給出了具體的應(yīng)用實(shí)例,并與其他建模方法

4、進(jìn)行了對比。
   其次,結(jié)合模型結(jié)構(gòu)特點(diǎn)與數(shù)據(jù)結(jié)構(gòu)中的相關(guān)概念,研究并發(fā)展了MPT模型上下文無關(guān)語言編碼方法,系統(tǒng)的建立了MPT模型編碼化表述框架:①基于前序遍歷的二叉樹MPT(Binary-MPT)模型字符串編/解碼算法,從而確定了字符編碼與模型結(jié)構(gòu)之間的雙向唯一映射關(guān)系;②基于乘積因子形式的字符串轉(zhuǎn)碼規(guī)則,從而確定了BMPT模型在偏序等復(fù)雜參數(shù)約束條件下模型結(jié)構(gòu)的相應(yīng)變化在一維編碼層面上的對應(yīng)關(guān)系;③基于編碼算法的多分支M

5、PT(Multi-link MPT)向BMPT模型的等價(jià)轉(zhuǎn)化規(guī)范,從而將全部形式的MPT模型結(jié)構(gòu)納入到該編碼表述框架中。
   再次,針對原參數(shù)擬合算法收斂速度較慢的問題,在原算法基礎(chǔ)上提出了兩種加速算法:①參數(shù)初始值選擇算法。其在原有迭代過程中,能夠自動偵測出收斂速度最慢的參數(shù),并根據(jù)其運(yùn)動趨勢自動賦予其一系列的新的初始值使之更接近其收斂點(diǎn),從而達(dá)到削弱某一特定參數(shù)對全局收斂速度所造成的負(fù)面影響的目的;②基于矩陣形式的EM算法

6、。其利用矩陣運(yùn)算的靈活性與高效性,將原有復(fù)雜的遍歷迭代過程轉(zhuǎn)化為一系列矩陣運(yùn)算的形式,進(jìn)而完成從參數(shù)估計(jì)到擬合優(yōu)度檢驗(yàn)的全部計(jì)算過程,從而在具備更優(yōu)的表達(dá)形式的同時(shí)能夠獲得更高的單步迭代運(yùn)算效率。
   特別的,通過聯(lián)合運(yùn)用上述兩算法以綜合其各自優(yōu)勢,能夠明顯提升模型參數(shù)擬合算法的運(yùn)行效率。上述結(jié)論在對不同規(guī)模的MPT模型的實(shí)際應(yīng)用中得到了驗(yàn)證。
   接著,針對對數(shù)線性模型等傳統(tǒng)列聯(lián)表分析工具的局限性,將MPT 建模方

7、法引入到對列聯(lián)表的分析處理中:①在標(biāo)準(zhǔn)的列聯(lián)表MPT模型結(jié)構(gòu)的基礎(chǔ)上,結(jié)合列聯(lián)表自身特點(diǎn),通過調(diào)整樹狀模型結(jié)構(gòu)層次以實(shí)現(xiàn)對特殊列聯(lián)表的個(gè)性化擬合;②
   通過引入隱性分組的相關(guān)概念將模型假設(shè)關(guān)系進(jìn)一步局限在相應(yīng)分組中,由此在降低了假設(shè)強(qiáng)度的同時(shí)也便于對不同分組進(jìn)行類比分析。以上方法從不同方面提高了模型對特殊列聯(lián)表的擬合度,進(jìn)而為特殊列聯(lián)表中的隱性關(guān)聯(lián)發(fā)現(xiàn)與特異規(guī)則提取創(chuàng)造了條件。在將上述算法與其他主流分析方法分別應(yīng)用于經(jīng)典數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論