版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、依存關(guān)系指的是句子中詞與詞之間支配與被支配的關(guān)系,將這種關(guān)系以計(jì)算機(jī)可接受的方式表示出來(lái)就是一個(gè)有向的依存結(jié)構(gòu)圖。依存關(guān)系因其直觀、容易理解和簡(jiǎn)潔的結(jié)構(gòu),使得依存句法分析成為目前句法分析領(lǐng)域中的重要的研究方向之一。傳統(tǒng)的句法分析的首要任務(wù)是確定句子所包含的結(jié)構(gòu),其次是確定各部分之間的內(nèi)在聯(lián)系,而依存句法分析的主要目的就是通過(guò)分析句子中各詞之間的依存關(guān)系來(lái)識(shí)別句子的句法結(jié)構(gòu)。
隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,大規(guī)模收集語(yǔ)料成為可能,一
2、些主流的語(yǔ)言如英文已經(jīng)建立起了規(guī)模很大的語(yǔ)料庫(kù),并用統(tǒng)計(jì)的方法讓計(jì)算機(jī)來(lái)處理成為可能。但是就目前來(lái)說(shuō),收集完之后的語(yǔ)料庫(kù)需要人工的對(duì)其詞性和依存關(guān)系進(jìn)行標(biāo)注,這將耗費(fèi)大量的人力、物力和財(cái)力。對(duì)于中文的依存語(yǔ)料庫(kù)來(lái)說(shuō),目前已建成的漢語(yǔ)依存樹庫(kù)規(guī)模很小,而且由于沒(méi)有統(tǒng)一的標(biāo)注規(guī)范,使得各研究組織機(jī)構(gòu)的語(yǔ)料庫(kù)之間存在著很大的差異。
課題考慮到中文依存語(yǔ)料庫(kù)規(guī)模較小的不足之處,利用大量的未標(biāo)記語(yǔ)料,設(shè)計(jì)并實(shí)現(xiàn)了一種基于改進(jìn)的Tri-t
3、raining算法的半監(jiān)督學(xué)習(xí)方法,并取得了較好的性能。
實(shí)驗(yàn)采用的語(yǔ)料全部來(lái)自于 CoNLL-2009的中文評(píng)測(cè)數(shù)據(jù),其中共有22276個(gè)語(yǔ)句,利用基于兩種不同方法的句法分析器 MSTParser和 MaltParser訓(xùn)練得到三種類型的分類器模型來(lái)實(shí)現(xiàn)改進(jìn)的Tri-training算法。最初的Tri-training算法的過(guò)程過(guò)于繁瑣,且其迭代的過(guò)程十分耗時(shí)。本文改進(jìn)了 Tri-training算法的時(shí)間復(fù)雜度,并且使用三
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于序列標(biāo)注的中文依存句法分析研究.pdf
- 基于樹庫(kù)的中文依存句法分析的研究.pdf
- 基于機(jī)器學(xué)習(xí)的漢語(yǔ)依存句法分析優(yōu)化研究.pdf
- 基于語(yǔ)義的依存句法分析優(yōu)化研究.pdf
- 基于轉(zhuǎn)換的依存句法分析研究.pdf
- 基于依存句法分析的語(yǔ)義角色標(biāo)注.pdf
- 基于統(tǒng)計(jì)方法的漢語(yǔ)長(zhǎng)句依存句法分析.pdf
- 依存語(yǔ)法句法分析系統(tǒng)的研究.pdf
- 基于漢蒙依存句法樹轉(zhuǎn)換的蒙古文依存句法分析.pdf
- 基于統(tǒng)計(jì)的漢語(yǔ)依存句法分析研究.pdf
- 依存句法分析的置信度研究.pdf
- 基于最大生成樹的三階中文依存句法分析.pdf
- 基于依存句法分析的詞義消歧方法研究.pdf
- 基于依存句法分析的中文評(píng)價(jià)對(duì)象抽取和情感傾向性分析.pdf
- 中文多詞表達(dá)抽取及其在依存句法分析中的應(yīng)用.pdf
- 基于LPCFG的中文句法分析.pdf
- 基于依存語(yǔ)法的漢語(yǔ)句法分析研究.pdf
- 基于統(tǒng)計(jì)方法的漢語(yǔ)依存句法分析研究.pdf
- 日語(yǔ)依存句法分析技術(shù)研究.pdf
- 多種特征模板的依存句法分析算法.pdf
評(píng)論
0/150
提交評(píng)論