2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩107頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、在當今信息時代,人機口語對話系統(tǒng)有著廣泛的應(yīng)用需求??谡Z語言中包含有大量的省略、停頓、重復(fù)、自我糾錯以及不合語法的現(xiàn)象等,因此在漢語人機口語對話中,口語語言的分析理解是人機對話系統(tǒng)實現(xiàn)的關(guān)鍵和難點?,F(xiàn)在的口語對話系統(tǒng)語言的分析處理方法大多采用模板匹配處理方法,然而口語語言的靈活性使得模板數(shù)量過于龐大,而且導(dǎo)致系統(tǒng)準確性不高。本文著重研究漢語口語對話系統(tǒng)中的口語語言分析,嘗試用內(nèi)涵概念分析的思想,把對語言的分析上升到概念層次上進行分析來解

2、決該問題。本文研究工作背景來源于上海市科委科技項目限定領(lǐng)域口語對話系統(tǒng)--交通領(lǐng)域口語對話系統(tǒng)SHJTQ,SHJTQ提供上海市任意兩個地點之間、在不同的交通方式(步行、自行車、出租車、公交車)下的交通路線信息的查詢。
   目前限定領(lǐng)域的口語語言分析理解的方法大致可以分為兩類:概率統(tǒng)計方法和規(guī)則分析方法。概率統(tǒng)計分析技術(shù)主要基于語言結(jié)構(gòu)的統(tǒng)計特性,缺乏智能性和可靠性。規(guī)則分析方法又分為邏輯分析方法和概念分析方法兩類。邏輯分析方法

3、以蒙太古的語義學(xué)為代表,用模型論來表示片斷英語的語義,但要處理真實文本、全面地解釋漢語語義,仍然感到邏輯分析的局限性。概念分析是后繼的邏輯學(xué)家維特根斯坦、奧斯汀、塞爾這些哲學(xué)家提出的,語言哲學(xué)家以及心理哲學(xué)家關(guān)心的是有關(guān)心理、感覺、情感一類詞匯的概念分析,但不注重對于指稱實體的詞類及其概念的研究。
   現(xiàn)在的口語對話系統(tǒng)都是在應(yīng)用層面進行語言的分析處理,提出的解決方法大多采用字串匹配的方法或是在字串匹配的基礎(chǔ)上加入一些處理方法

4、。這種分析方法最大的缺點就是字串不同或字串次序變化,分析就會失敗。因此無法解釋靈活多變的口語語言。本文提出了內(nèi)涵概念分析的思想,把對語言的分析上升到概念層次上進行分析,口語語言雖然靈活多變,但表達的概念是一樣的,從而解決了模板匹配解決不了的問題。
   從實現(xiàn)角度講,除音調(diào)外一字符串(如短語、句)的語音要用1K數(shù)據(jù)存儲空間,對通常對話的語音處理將占用超大量存儲空間。如果改為-漢字-模板,兩千常用漢字的語音信息共2K*1K數(shù)據(jù),利

5、用漢語是字組合表達概念直接耦合的優(yōu)點,將字語音模板作為單位,字組合即為語音模板信息組合,可大大減少語音數(shù)據(jù),為語音對話使用開創(chuàng)了可行前景。可不限用戶使用規(guī)定的表達格式、模板可自由表達。但由此帶來語言處理的復(fù)雜性和重要性。本文充分利用漢語概念內(nèi)涵模型思想,實現(xiàn)了專用領(lǐng)域內(nèi)對話詞語的概念分析,并獲成功。
   本文研究了SHJTQ中詞匯(主要是交通工具類詞匯)的內(nèi)涵特征,提出了名詞具有“定義特征”和“情景區(qū)分特征”兩個概念。在不同語

6、境下,詞匯的凸現(xiàn)特征(情景區(qū)分特征)有所不同。提出用一種“E-A-V”(實體-屬性-值)的方法表征名詞的概念。本文研究了SHJTQ中用戶問句,針對用戶問句多為疑問句的特點,借助言語行為理論的思想,對SHJTQ系統(tǒng)用戶查詢問句進行了言語行為分類。分析研究了SHJTQ口語語句的內(nèi)涵概念,根據(jù)用戶查詢問題的分類,逐個將各類用戶查詢例句了進行概念分析,解決了字串匹配不能解決的口語語言中的各種變異現(xiàn)象,為漢語口語語言的理解研究提供新的思路。

7、>   本文介紹了限定領(lǐng)域?qū)υ捪到y(tǒng)口語語言的概念分析方法在SHJTQ中的具體應(yīng)用。著重分析了SHJTQ語言分析模塊的設(shè)計等,同時本文給出了系統(tǒng)的測試結(jié)果和分析。
   本文研究的創(chuàng)新點主要在如下幾方面:
   1.用概念分析的方法分析漢語口語語言,有別于傳統(tǒng)的應(yīng)用層面上的字串匹配分析方法。從概念層面分析解釋了SHJTQ中口語語言,解釋了口語語言在形式上靈活多變,但表達的是同一概念。另外采用概念分析方法,漢語和其他語言(

8、如英語等)在體態(tài)(形態(tài)、時態(tài)等)方面的差別就會退化,有助于實現(xiàn)多語種的口語對話。第三,在具體實現(xiàn)方面,有了口語語言的概念分析,語音識別需要的模板量就可以大大減少,可以推進口語對話系統(tǒng)的發(fā)展。
   2.采用“E-A-V”(實體-屬性-值)的表示概念語義模型,表征了名詞的多義性。本文采用的是陸汝占先生的內(nèi)涵邏輯分析即概念分析的基本思想,即對一個詞語所表示的概念進行分解,求解出上位概念、下位區(qū)分概念、定義屬性特征以及擴展特征;解釋了

9、詞語、指稱實體、概念三者關(guān)系。認為名詞是指稱實體的詞語項,實體包括物理實體和抽象實體兩類。名詞具有內(nèi)涵性質(zhì)即語義特征,提出了“定義特征”和“情景區(qū)分特征”兩個概念。分析了SHJTQ中詞匯(主要是交通工具類名詞詞匯)的內(nèi)涵特征,將內(nèi)涵特征理論引入到漢語語言研究,通過內(nèi)涵特征來解釋紛紜復(fù)雜的漢語語義是一個新嘗試。
   3.用內(nèi)涵概念分析的方法研究了SHJTQ口語語句,根據(jù)用戶查詢問題的言語行為分類,逐個將各類用戶查詢例句進行概念分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論