現(xiàn)代漢語名詞歧義度研究.pdf_第1頁
已閱讀1頁,還剩238頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、歧義度是本文的核心論題,我們對其理論背景、定義、計算方法和影響因素做了系統(tǒng)論述。歧義度源于計算機詞義消歧,詞義消歧指用計算機自動給多義詞標(biāo)注一個確定的義項,是自然語言處理領(lǐng)域一個十分重要又十分困難的課題,也是當(dāng)前研究的熱點問題。注意到不同多義詞的消歧結(jié)果差異巨大,有的多義詞可以輕易得到很高的消歧正確率,有的詞則難以實現(xiàn)。多義詞這種體現(xiàn)在詞義消歧難易程度的差異是由其內(nèi)在語義屬性決定的,這種內(nèi)在屬性就是歧義度。
  在詞匯語義學(xué)視角下

2、,歧義度可以看做多義詞的一個客觀狀況,它體現(xiàn)多義詞義項間組合關(guān)系差異大小,在更深層次上體現(xiàn)了義項間語義關(guān)系親疏遠近的差異,多義詞義項組合關(guān)系趨同則其歧義度高,反之就低,歧義度差異及其內(nèi)在因素正可以從語義及其分布兩個層面上解讀多義詞義項的關(guān)系。描寫現(xiàn)代漢語名詞的歧義度、分析造成詞匯間歧義度差異的原因、探究歧義度研究的應(yīng)用價值是這篇論文要解決的三個主要問題。
  第一章主要介紹了本文選題的依據(jù)、研究對象、方法、步驟、特色、意義。

3、>  第二章主要介紹了詞義消歧的進展與問題,著重論述了歧義度的提出、計算、在詞匯語義學(xué)中的位置和基礎(chǔ)理論。
  第三章介紹了歧義度研究的課題設(shè)計,實現(xiàn)了1352個多義名詞的詞義消歧和歧義度計算,分析了多義名詞區(qū)別性形式特征的內(nèi)容和功能。統(tǒng)計發(fā)現(xiàn)歧義度最高為100%,最低為0,差異巨大,論文從義項間語義關(guān)系及其對應(yīng)的區(qū)別性形式特征兩個方面相結(jié)合的方法分析了這種現(xiàn)象的成因,這也是后面幾章的主要內(nèi)容。
  第四章以統(tǒng)計數(shù)據(jù)為基礎(chǔ)回

4、答了語義距離與歧義度的關(guān)系。語義距離表示多義詞義項間語義關(guān)系的親疏遠近,具體表現(xiàn)為多義詞義項在語義分類詞典內(nèi)義類上的遠近關(guān)系及概念語義相似性大小。統(tǒng)計發(fā)現(xiàn),語義距離與歧義度之間存在密切負相關(guān)關(guān)系,根據(jù)歧義度與語義距離,將多義詞義項間關(guān)系分為同義近義關(guān)系、同義類關(guān)系、跨義類關(guān)系三種類型,從寬計算同義近義關(guān)系可以并入同義類關(guān)系,同義類、跨義類是兩種最重要的語義關(guān)系,本文分別建構(gòu)了不同的分析框架,解釋其內(nèi)部詞歧義度差異的原因。
  第五

5、章提取了同義類詞[職業(yè)領(lǐng)域]、[構(gòu)造]、[附屬]等十幾種重要的區(qū)別性義素及其與之對應(yīng)的區(qū)別性形式特征,分析了義項間的區(qū)別性義素種類多少對歧義度的影響。
  第六章針對跨義類詞語義距離過大,不適于直接使用義素分析方法的特點,提取了語義相似、相關(guān)、無關(guān)三種語義關(guān)系模型,從義項歷時聯(lián)系、認知語言學(xué)角度解釋了其歧義來源,分析了其內(nèi)部不同詞歧義度的差異和原因。
  第七章以多義詞語義距離和歧義度理論為基礎(chǔ)提出了機用詞典義項粒度設(shè)置的原

6、則和方法,分析了其對歧義度的影響?!艾F(xiàn)漢”有義項粒度過細的特點,有24.10%的詞語義距離為1,42.79%的詞為同義類詞,這些詞義項間區(qū)別不明顯,歧義度卻很高,如去掉語義距離為1的詞平均歧義度將由46.20%變?yōu)?0.54%,去掉所有同義類詞歧義度將變?yōu)?5.68%。
  第八章提出了歧義度分析對詞義消歧的啟示,認為在研究中應(yīng)該重視詞義屬性,應(yīng)該在分類的基礎(chǔ)上有所側(cè)重地分別研究。
  第九章對全文的主要結(jié)論做了簡單總結(jié),簡

7、述了研究的不足和后續(xù)研究計劃。
  本文在詞匯語義學(xué)層面上回答了詞義與形式特征的關(guān)系,嘗試了詞義統(tǒng)計研究方法,構(gòu)建了將詞義與其形式特征相互印證的方法;在詞義消歧領(lǐng)域,通過對歧義度和多義詞義項關(guān)系的研究,一定程度上解決了機用詞典義項粒度問題,提出了分類逐步解決詞義消歧課題的思路,提出了用歧義度解決詞義消歧算法評測難的方法。在研究過程中堅持以實際應(yīng)用推動理論建構(gòu)的思路,不盲從已有的研究模式,在繼承前人研究的基礎(chǔ)上提出了歧義度的新概念并

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論