版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、歧義度是本文的核心論題,我們對(duì)其理論背景、定義、計(jì)算方法和影響因素做了系統(tǒng)論述。歧義度源于計(jì)算機(jī)詞義消歧,詞義消歧指用計(jì)算機(jī)自動(dòng)給多義詞標(biāo)注一個(gè)確定的義項(xiàng),是自然語(yǔ)言處理領(lǐng)域一個(gè)十分重要又十分困難的課題,也是當(dāng)前研究的熱點(diǎn)問(wèn)題。注意到不同多義詞的消歧結(jié)果差異巨大,有的多義詞可以輕易得到很高的消歧正確率,有的詞則難以實(shí)現(xiàn)。多義詞這種體現(xiàn)在詞義消歧難易程度的差異是由其內(nèi)在語(yǔ)義屬性決定的,這種內(nèi)在屬性就是歧義度。
在詞匯語(yǔ)義學(xué)視角下
2、,歧義度可以看做多義詞的一個(gè)客觀狀況,它體現(xiàn)多義詞義項(xiàng)間組合關(guān)系差異大小,在更深層次上體現(xiàn)了義項(xiàng)間語(yǔ)義關(guān)系親疏遠(yuǎn)近的差異,多義詞義項(xiàng)組合關(guān)系趨同則其歧義度高,反之就低,歧義度差異及其內(nèi)在因素正可以從語(yǔ)義及其分布兩個(gè)層面上解讀多義詞義項(xiàng)的關(guān)系。描寫(xiě)現(xiàn)代漢語(yǔ)名詞的歧義度、分析造成詞匯間歧義度差異的原因、探究歧義度研究的應(yīng)用價(jià)值是這篇論文要解決的三個(gè)主要問(wèn)題。
第一章主要介紹了本文選題的依據(jù)、研究對(duì)象、方法、步驟、特色、意義。
3、> 第二章主要介紹了詞義消歧的進(jìn)展與問(wèn)題,著重論述了歧義度的提出、計(jì)算、在詞匯語(yǔ)義學(xué)中的位置和基礎(chǔ)理論。
第三章介紹了歧義度研究的課題設(shè)計(jì),實(shí)現(xiàn)了1352個(gè)多義名詞的詞義消歧和歧義度計(jì)算,分析了多義名詞區(qū)別性形式特征的內(nèi)容和功能。統(tǒng)計(jì)發(fā)現(xiàn)歧義度最高為100%,最低為0,差異巨大,論文從義項(xiàng)間語(yǔ)義關(guān)系及其對(duì)應(yīng)的區(qū)別性形式特征兩個(gè)方面相結(jié)合的方法分析了這種現(xiàn)象的成因,這也是后面幾章的主要內(nèi)容。
第四章以統(tǒng)計(jì)數(shù)據(jù)為基礎(chǔ)回
4、答了語(yǔ)義距離與歧義度的關(guān)系。語(yǔ)義距離表示多義詞義項(xiàng)間語(yǔ)義關(guān)系的親疏遠(yuǎn)近,具體表現(xiàn)為多義詞義項(xiàng)在語(yǔ)義分類詞典內(nèi)義類上的遠(yuǎn)近關(guān)系及概念語(yǔ)義相似性大小。統(tǒng)計(jì)發(fā)現(xiàn),語(yǔ)義距離與歧義度之間存在密切負(fù)相關(guān)關(guān)系,根據(jù)歧義度與語(yǔ)義距離,將多義詞義項(xiàng)間關(guān)系分為同義近義關(guān)系、同義類關(guān)系、跨義類關(guān)系三種類型,從寬計(jì)算同義近義關(guān)系可以并入同義類關(guān)系,同義類、跨義類是兩種最重要的語(yǔ)義關(guān)系,本文分別建構(gòu)了不同的分析框架,解釋其內(nèi)部詞歧義度差異的原因。
第五
5、章提取了同義類詞[職業(yè)領(lǐng)域]、[構(gòu)造]、[附屬]等十幾種重要的區(qū)別性義素及其與之對(duì)應(yīng)的區(qū)別性形式特征,分析了義項(xiàng)間的區(qū)別性義素種類多少對(duì)歧義度的影響。
第六章針對(duì)跨義類詞語(yǔ)義距離過(guò)大,不適于直接使用義素分析方法的特點(diǎn),提取了語(yǔ)義相似、相關(guān)、無(wú)關(guān)三種語(yǔ)義關(guān)系模型,從義項(xiàng)歷時(shí)聯(lián)系、認(rèn)知語(yǔ)言學(xué)角度解釋了其歧義來(lái)源,分析了其內(nèi)部不同詞歧義度的差異和原因。
第七章以多義詞語(yǔ)義距離和歧義度理論為基礎(chǔ)提出了機(jī)用詞典義項(xiàng)粒度設(shè)置的原
6、則和方法,分析了其對(duì)歧義度的影響?!艾F(xiàn)漢”有義項(xiàng)粒度過(guò)細(xì)的特點(diǎn),有24.10%的詞語(yǔ)義距離為1,42.79%的詞為同義類詞,這些詞義項(xiàng)間區(qū)別不明顯,歧義度卻很高,如去掉語(yǔ)義距離為1的詞平均歧義度將由46.20%變?yōu)?0.54%,去掉所有同義類詞歧義度將變?yōu)?5.68%。
第八章提出了歧義度分析對(duì)詞義消歧的啟示,認(rèn)為在研究中應(yīng)該重視詞義屬性,應(yīng)該在分類的基礎(chǔ)上有所側(cè)重地分別研究。
第九章對(duì)全文的主要結(jié)論做了簡(jiǎn)單總結(jié),簡(jiǎn)
7、述了研究的不足和后續(xù)研究計(jì)劃。
本文在詞匯語(yǔ)義學(xué)層面上回答了詞義與形式特征的關(guān)系,嘗試了詞義統(tǒng)計(jì)研究方法,構(gòu)建了將詞義與其形式特征相互印證的方法;在詞義消歧領(lǐng)域,通過(guò)對(duì)歧義度和多義詞義項(xiàng)關(guān)系的研究,一定程度上解決了機(jī)用詞典義項(xiàng)粒度問(wèn)題,提出了分類逐步解決詞義消歧課題的思路,提出了用歧義度解決詞義消歧算法評(píng)測(cè)難的方法。在研究過(guò)程中堅(jiān)持以實(shí)際應(yīng)用推動(dòng)理論建構(gòu)的思路,不盲從已有的研究模式,在繼承前人研究的基礎(chǔ)上提出了歧義度的新概念并
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 現(xiàn)代漢語(yǔ)歧義研究.pdf
- 現(xiàn)代漢語(yǔ)歧義現(xiàn)象研究.pdf
- 現(xiàn)代漢語(yǔ)歧義句功能研究.pdf
- 現(xiàn)代漢語(yǔ)物體名詞研究.pdf
- 現(xiàn)代漢語(yǔ)關(guān)系名詞研究.pdf
- 現(xiàn)代漢語(yǔ)歧義結(jié)構(gòu)的化解.pdf
- 現(xiàn)代漢語(yǔ)N+V結(jié)構(gòu)歧義研究.pdf
- 現(xiàn)代漢語(yǔ)名詞語(yǔ)義研究.pdf
- 現(xiàn)代漢語(yǔ)“副詞+名詞”結(jié)構(gòu)研究.pdf
- 現(xiàn)代漢語(yǔ)名詞詞義偏離研究.pdf
- 現(xiàn)代漢語(yǔ)名詞解釋
- 現(xiàn)代漢語(yǔ)稱謂名詞義征研究.pdf
- 現(xiàn)代漢語(yǔ)“程度副詞+名詞”結(jié)構(gòu)研究.pdf
- 現(xiàn)代漢語(yǔ)名詞的比喻義研究.pdf
- 現(xiàn)代漢語(yǔ)名詞謂語(yǔ)句研究.pdf
- 現(xiàn)代漢語(yǔ)名詞性狀特征研究.pdf
- 現(xiàn)代漢語(yǔ)性別特征名詞研究.pdf
- 現(xiàn)代漢語(yǔ)句法歧義加工的眼動(dòng)研究.pdf
- 現(xiàn)代漢語(yǔ)名詞性定指賓語(yǔ)研究.pdf
- 現(xiàn)代漢語(yǔ)標(biāo)量名詞短語(yǔ)語(yǔ)義功能研究.pdf
評(píng)論
0/150
提交評(píng)論