

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、全自動的語義分析一直是自然語言理解的主要任務(wù)之一。通過深層語義分析,可以將自然語言轉(zhuǎn)化為形式語言,從而使計(jì)算機(jī)能夠與人類無障礙的溝通。為達(dá)此目的,人們已經(jīng)進(jìn)行了多年的努力,然而由于這一問題過于復(fù)雜,目前取得的效果并不理想。淺層語義分析是對深層語義分析的一種簡化,它只標(biāo)注與句子中謂詞有關(guān)的成分的語義角色,如施事、受事、時間和地點(diǎn)等。其能夠?qū)柎鹣到y(tǒng)、信息抽取和機(jī)器翻譯等應(yīng)用產(chǎn)生推動作用。語義角色標(biāo)注是淺層語義分析的一種實(shí)現(xiàn)方式,具有定義清
2、晰,便于評價(jià)的優(yōu)點(diǎn),近年來受到越來越多學(xué)者的關(guān)注。
目前主流的語義角色標(biāo)注研究集中于使用各種統(tǒng)計(jì)機(jī)器學(xué)習(xí)技術(shù),利用多種語言學(xué)特征,進(jìn)行語義角色的識別和分類。近年的研究表明,影響語義角色標(biāo)注系統(tǒng)性能的首要因素并非機(jī)器學(xué)習(xí)模型,而是使用的特征。因此,若想提高系統(tǒng)的性能,細(xì)致的特征工程工作是必不可少的。然而,隨著越來越多特征的加入,特征之間的相互影響越來越嚴(yán)重,使得系統(tǒng)性能增長的趨勢逐漸趨緩,并達(dá)到一個上限。為此必須尋找新的方法以解
3、決這一問題。
基于核的方法通過對已有特征進(jìn)行組合或者分解,將低維特征空間映射到高維特征空間,從而將在低維空間不容易區(qū)分的問題在高維空間加以解決,是一種可行的解決方案。
本文正是利用核方法這一優(yōu)點(diǎn),將其應(yīng)用于語義角色標(biāo)注這一問題中。除了使用已有的核方法外,還提出了多種新的核方法。
首先,我們構(gòu)造了一個語義角色標(biāo)注基線系統(tǒng),該系統(tǒng)使用特征向量表示待分類對象,并在特征向量之上,使用基于多項(xiàng)式核的方法,自動的對特征
4、進(jìn)行組合。實(shí)驗(yàn)結(jié)果表明,當(dāng)使用二次多項(xiàng)式核對特征進(jìn)行兩兩組合時,該系統(tǒng)是目前已知的最好的基于單句法分析器的語義角色標(biāo)注系統(tǒng)之一。
接著,我們針對基線系統(tǒng)中,特征向量很難恰當(dāng)?shù)谋硎窘Y(jié)構(gòu)化的特征這一問題,使用了卷積樹核自動將較大的結(jié)構(gòu)特征進(jìn)行分解,并能夠在多項(xiàng)式時間內(nèi)進(jìn)行核函數(shù)的計(jì)算。然而,通常的卷積樹核混淆了語義角色標(biāo)注中不同的特征,因此,我們提出了混合卷積樹核融合多種樹核,來對不同種類的特征分別進(jìn)行建模,最終獲得優(yōu)于標(biāo)準(zhǔn)卷積樹
5、核的性能。然后將混合卷積樹核與二次多項(xiàng)式核進(jìn)行融合,得到的復(fù)合核取得了比單獨(dú)使用兩種核都好的結(jié)果。
但是,標(biāo)準(zhǔn)卷積樹核要求兩棵子樹之間必須是精確匹配的,而不考慮結(jié)構(gòu)相似,語義角色相同的情況。因此,我們提出了新的句法驅(qū)動卷積樹核,在核函數(shù)的設(shè)計(jì)過程中,融入了語言學(xué)知識,容許結(jié)構(gòu)和節(jié)點(diǎn)的近似匹配,最終取得了較標(biāo)準(zhǔn)卷積樹更好的性能。最后同樣與多項(xiàng)式核進(jìn)行融合,并取得了更好的性能。
最后,我們使用基于核的方法,實(shí)現(xiàn)了一個目前
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于樹核方法的中文語義角色標(biāo)注研究.pdf
- 基于依存樹核函數(shù)的語義角色標(biāo)注研究.pdf
- 中文語義角色標(biāo)注的方法研究.pdf
- 基于依存分析的語義角色標(biāo)注研究.pdf
- 基于LSTM的漢語語義角色標(biāo)注研究.pdf
- 基于條件場的語義角色標(biāo)注.pdf
- 基于特征選擇的中文語義角色標(biāo)注研究.pdf
- 基于最大熵的語義角色標(biāo)注系統(tǒng).pdf
- 基于特征的中文語義角色標(biāo)注系統(tǒng).pdf
- 基于特征向量的語義角色標(biāo)注研究.pdf
- 基于漢語虛詞用法的語義角色標(biāo)注研究.pdf
- 基于結(jié)構(gòu)學(xué)習(xí)的語義角色標(biāo)注.pdf
- 基于語義角色標(biāo)注的中文問答系統(tǒng)研究.pdf
- 基于依存關(guān)系的中文語義角色標(biāo)注研究.pdf
- 基于語義的謂詞標(biāo)注方法研究.pdf
- 基于漢語框架網(wǎng)的問句語義角色標(biāo)注研究.pdf
- 基于主動學(xué)習(xí)的漢語框架語義角色標(biāo)注.pdf
- 基于依存句法分析的語義角色標(biāo)注.pdf
- 語義角色標(biāo)注的集成策略的研究.pdf
- 基于本體的自動語義標(biāo)注方法研究.pdf
評論
0/150
提交評論