基于結(jié)構(gòu)和語義信息的模糊限制信息范圍檢測.pdf_第1頁
已閱讀1頁,還剩61頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、模糊限制語是指一些“有意把事情弄的模模糊糊的詞語”。由模糊限制語引導的模糊限制信息表達不確定的、含糊的或推測的觀點。生物醫(yī)學文獻中含有許多模糊限制信息。在生物醫(yī)學信息抽取中,為防止把模糊限制信息作為真實信息使用,模糊限制信息檢測具有重要意義。模糊限制信息檢測可分為模糊限制語識別和模糊限制信息范圍檢測兩個任務(wù)。模糊限制語識別已經(jīng)取得較大發(fā)展,而模糊限制信息范圍檢測比較復雜,性能仍有待提高。本文通過深入探索模糊限制信息范圍的句法結(jié)構(gòu)和語義信

2、息,研究模糊限制信息范圍檢測任務(wù),研究工作包括如下內(nèi)容:
  研究基于依存結(jié)構(gòu)的候選邊界選擇算法。傳統(tǒng)的范圍檢測研究是把模糊限制語及其左(右)側(cè)的詞作為范圍的左(右)候選邊界。這會產(chǎn)生大量負樣例,正負樣例數(shù)量不平衡,誤導分類器。相鄰的正負樣例具有相似的結(jié)構(gòu)和上下文信息,分類器難以區(qū)分。本文提出基于依存結(jié)構(gòu)的候選邊界選擇算法,利用詞之間的依存關(guān)系選擇候選。實驗顯示,正負樣例數(shù)量的比值由1∶15變?yōu)?∶3,性能提高2.76% F1值。

3、這表明候選邊界選擇算法能夠大幅度減少負樣例數(shù)量,提高正負樣例的區(qū)分度,提高范圍檢測性能。
  研究基于結(jié)構(gòu)信息的模糊限制信息范圍檢測。模糊限制信息范圍在結(jié)構(gòu)上是與模糊限制語相關(guān)的一個短語或從句,因此范圍檢測對句法結(jié)構(gòu)具有較強的依賴性。本文利用卷積樹核函數(shù),基于依存和短語結(jié)構(gòu),探索了模糊限制信息范圍的結(jié)構(gòu)化表示方法。實驗顯示,基于依存結(jié)構(gòu)、短語結(jié)構(gòu)以及依存和短語結(jié)合的檢測性能分別達到64.57%,63.51%和66.67%F1值。這

4、表明依存和短語結(jié)構(gòu)對范圍檢測都是有效的,依存結(jié)構(gòu)和短語結(jié)構(gòu)具有互補關(guān)系,它們的結(jié)合能進一步提高系統(tǒng)性能。
  研究了基于語義信息的模糊限制信息范圍檢測。模糊限制信息范圍在語義上是包含模糊限制語的一段完整連續(xù)的語義片斷,因此范圍檢測對語義信息具有較強的依賴性。本文基于LSTM深度學習模型,探索了模糊限制信息范圍的語義表示方法。此外,為了綜合基于詞匯、句法及語義系統(tǒng)的優(yōu)勢,融合三者的檢測結(jié)果。實驗顯示,基于語義表示的檢測性能達到65.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論