版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、隱喻是人類基本的思維方式之一,在自然語言中,隱喻的使用是一種非常普遍的現(xiàn)象?,F(xiàn)今,隱喻已經(jīng)成為了語言學(xué)家,心理學(xué)家和認(rèn)知科學(xué)家所關(guān)注的課題之一。一切自然語言處理系統(tǒng)的本質(zhì)都是基于知識的系統(tǒng),如果機(jī)器要實現(xiàn)對一個表達(dá)的理解,所需要的知識與人完成同樣任務(wù)所需要的知識是無差別的。而隱喻的機(jī)器處理在知識庫的使用上,經(jīng)歷了從手工構(gòu)造隱喻概念映射庫,到手工構(gòu)造的語義網(wǎng)知識庫的過程。本文的研究目的,是將隱喻所使用的知識庫擴(kuò)展到最自然和最能被人們所接受
2、的百科知識庫,從而彌補(bǔ)手工構(gòu)造知識庫存在的代價高和規(guī)模小的缺點。
本文分析了現(xiàn)有的隱喻處理思想,根據(jù)隱喻是一個“求同存異”的過程的思想,將其分為“求同”和“存異”兩個部分。其中“存異”用于對隱喻進(jìn)行識別,判斷隱喻表達(dá)的表面語義是否存在語義矛盾,作為隱喻識別的標(biāo)準(zhǔn);“求同”用于對隱喻進(jìn)行解釋,根據(jù)喻體的特征和本體的屬性是否匹配,進(jìn)行隱喻的解釋。
在名詞性隱喻識別方面,根據(jù)構(gòu)成隱喻的本體和喻體分屬不同的概念域中的
3、特點,提出了基于百科的名詞性隱喻識別方法。利用信息檢索技術(shù),從概念對應(yīng)的百科頁面中獲取概念的世界知識,計算兩個概念的世界知識的重合程度,作為判斷概念是否屬于同一個概念域的依據(jù),進(jìn)行隱喻的識別。實驗結(jié)果證明在使用百度百科作為世界知識庫時,隱喻/常規(guī)表達(dá)的識別正確率達(dá)到81.06%,顯示了識別算法對漢語名詞性隱喻識別的有效性。
在名詞性隱喻解釋方面,根據(jù)構(gòu)成隱喻的本體和喻體具有某些相似性的特點,提出了基于百科的名詞性隱喻解釋方
4、法。隱喻的解釋是基于互動論的過程,是模擬人類根據(jù)喻體所提供的顯著特征,決定本體如何選擇喻體特征,如何利用喻體特征對本體進(jìn)行描述的過程。為了實現(xiàn)這一隱喻解釋的機(jī)制,本文提出了喻體特征、本體屬性的獲取算法和基于互信息的特征轉(zhuǎn)移算法,最終實現(xiàn)隱喻的語義解釋。
綜上所述,本文的研究給出了基于百科知識作為語義知識庫進(jìn)行漢語名詞性隱喻識別與解釋計算的思想與方法,在漢語隱喻計算的研究道路上作出了試探性探索,為隱喻計算的資源、理論和模型的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論