

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、近年來(lái),利用語(yǔ)料庫(kù)處理各種語(yǔ)言現(xiàn)象已被許多語(yǔ)言學(xué)家及計(jì)算機(jī)專(zhuān)家所認(rèn)可,各種類(lèi)型的語(yǔ)料庫(kù)應(yīng)運(yùn)而生,但關(guān)于東北地方口語(yǔ)語(yǔ)料庫(kù)的建設(shè)目前還處于空白。本文選擇東北地方口語(yǔ)語(yǔ)料庫(kù)的建設(shè)作為研究課題,選擇《人民日?qǐng)?bào)》標(biāo)注語(yǔ)料庫(kù)的標(biāo)注作參考,并利用構(gòu)建的東北地方口語(yǔ)語(yǔ)料庫(kù)與《人民日?qǐng)?bào)》標(biāo)注語(yǔ)料庫(kù)的語(yǔ)法現(xiàn)象進(jìn)行對(duì)比,從而考察東北地方口語(yǔ)的特色。 首先,通過(guò)對(duì)國(guó)內(nèi)外語(yǔ)料庫(kù)建設(shè)的發(fā)展與現(xiàn)狀、計(jì)算機(jī)語(yǔ)言學(xué)的現(xiàn)狀、語(yǔ)料庫(kù)建設(shè)的口語(yǔ)語(yǔ)料庫(kù)的調(diào)研,確定了以
2、《人民日?qǐng)?bào)》標(biāo)注語(yǔ)料庫(kù)作為知識(shí)源,東北地方口語(yǔ)作為基礎(chǔ)生語(yǔ)料庫(kù),探討了口語(yǔ)標(biāo)注的基本技術(shù),對(duì)東北地方口語(yǔ)語(yǔ)料的加工進(jìn)行了詳細(xì)闡述。 其次,利用Microsoft SQL Server作為構(gòu)建語(yǔ)料庫(kù)的技術(shù)平臺(tái),在此基礎(chǔ)上確定了東北地方口語(yǔ)語(yǔ)料庫(kù)的總體設(shè)計(jì)和基本構(gòu)架,并論述了語(yǔ)料庫(kù)的實(shí)現(xiàn)手段,在語(yǔ)料庫(kù)管理系統(tǒng)中介紹了語(yǔ)料的入庫(kù)問(wèn)題,以及如何為加工處理后的語(yǔ)料提供訪問(wèn)控制接口問(wèn)題。 最后利用該語(yǔ)料庫(kù)研究東北地方口語(yǔ)特色,包括東
3、北地方口語(yǔ)的詞匯研究和語(yǔ)法研究,及有東北特色的高頻詞統(tǒng)計(jì)。 本文的特色主要表現(xiàn)在以下兩個(gè)方面: 1)、首次構(gòu)建東北地方口語(yǔ)語(yǔ)料庫(kù),并利用該語(yǔ)料庫(kù)研究東北地方口語(yǔ),包括詞匯研究、語(yǔ)法研究、頻率統(tǒng)計(jì)以及句子長(zhǎng)度計(jì)算。 2)、根據(jù)語(yǔ)料自身的特點(diǎn),為已標(biāo)注或經(jīng)統(tǒng)計(jì)獲得的熟語(yǔ)料提供了豐富的訪問(wèn)控制接口,增強(qiáng)了語(yǔ)料庫(kù)的功能。 本文構(gòu)建了一個(gè)初步規(guī)模的東北地方口語(yǔ)語(yǔ)料庫(kù),并進(jìn)行了實(shí)驗(yàn)對(duì)比,得出了一定的結(jié)論,同時(shí)也為語(yǔ)言
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 蕭紅作品的東北地方文化風(fēng)情.pdf
- 東北地方文化中的喜劇元素分析.pdf
- 東北地方史研究的回顧與思考
- 東北地方文化中的喜劇元素分析
- 清代東北地方行政制度研究.pdf
- 清代東北地方廳研究_20724.pdf
- 托??谡Z(yǔ)語(yǔ)料庫(kù)整理fancy
- 中英可比較語(yǔ)料庫(kù)的構(gòu)建.pdf
- 個(gè)人語(yǔ)料庫(kù)的創(chuàng)建及應(yīng)用.pdf
- 英漢可比較語(yǔ)料庫(kù)的構(gòu)建與應(yīng)用研究.pdf
- 語(yǔ)料庫(kù)的創(chuàng)建與應(yīng)用
- 基于語(yǔ)料庫(kù)的英語(yǔ)口語(yǔ)句型研究.pdf
- 俄語(yǔ)語(yǔ)料庫(kù)和基于語(yǔ)料庫(kù)的語(yǔ)法研究.pdf
- 社保審計(jì)領(lǐng)域語(yǔ)料庫(kù)構(gòu)建研究.pdf
- 桂林旅游資料英語(yǔ)可比語(yǔ)料庫(kù)的構(gòu)建與應(yīng)用.pdf
- 語(yǔ)料庫(kù)研究.pdf
- 面向本體學(xué)習(xí)的動(dòng)態(tài)語(yǔ)料庫(kù)構(gòu)建方法.pdf
- 限定性文本的語(yǔ)料庫(kù)自動(dòng)構(gòu)建.pdf
- 基于口語(yǔ)語(yǔ)料庫(kù)的話(huà)語(yǔ)標(biāo)記語(yǔ)對(duì)比研究.pdf
- 基于錨文本的領(lǐng)域語(yǔ)料庫(kù)自動(dòng)構(gòu)建.pdf
評(píng)論
0/150
提交評(píng)論