

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、命名實(shí)體關(guān)系是構(gòu)建語(yǔ)義網(wǎng)絡(luò)、本體和語(yǔ)義Web的基礎(chǔ),并且廣泛應(yīng)用于信息檢索、機(jī)器翻譯以及自動(dòng)問(wèn)答等系統(tǒng)中。在命名實(shí)體關(guān)系抽取研究中,特征選擇和特征抽取是兩個(gè)關(guān)鍵問(wèn)題。位置特征擁有良好的可計(jì)算性和可操作性,同時(shí)語(yǔ)義特征具有較強(qiáng)的可理解性和現(xiàn)實(shí)性。目前,中文命名實(shí)體關(guān)系抽取主要采用空間向量模型、傳統(tǒng)語(yǔ)義計(jì)算或支持向量機(jī)等方法。上述三種方法均是單一地使用位置特征或語(yǔ)義特征,沒(méi)能將兩種特征進(jìn)行合理而有效地結(jié)合,因此抽取效果均不夠理想。
2、 為了提高中文命名實(shí)體關(guān)系抽取的效果,本文提出了一種基于位置特征和語(yǔ)義特征相結(jié)合的關(guān)系抽取算法LaSE(Location and Semantic Extraction)。本文的主要工作如下:
(1)在確保關(guān)系抽取效果的前提下,LaSE 算法靈活地運(yùn)用詞語(yǔ)的詞性識(shí)別命名實(shí)體,替代了傳統(tǒng)抽取方法需要人工提供的命名實(shí)體表。一方面,這一改進(jìn)大大地減少了人工參與;另一方面,詞性是一個(gè)與領(lǐng)域無(wú)關(guān)的概念,不會(huì)引入任何領(lǐng)域知識(shí)。
3、r> (2)本文中,采用基于詞語(yǔ)間相對(duì)距離的信息增益來(lái)刻劃位置特征,使用基于泛本體《知網(wǎng)》的語(yǔ)義相似度計(jì)算來(lái)抽取語(yǔ)義特征。通過(guò)位置特征和語(yǔ)義特征的結(jié)合,能很好地適應(yīng)中文實(shí)際情況。大量實(shí)驗(yàn)證明:LaSE 算法的抽取效果明顯高于單一使用位置特征或語(yǔ)義特征的抽取算法。
(3)LaSE 算法僅需要提供少量的關(guān)系種子就能自動(dòng)抽取目標(biāo)關(guān)系的關(guān)系實(shí)例,是一種半監(jiān)督學(xué)習(xí)算法;算法不需要任何領(lǐng)域知識(shí),具有良好的領(lǐng)域獨(dú)立性,從一個(gè)領(lǐng)域移
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于詞匯語(yǔ)義信息的中文命名實(shí)體關(guān)系抽取研究.pdf
- 基于依存樹(shù)的中文命名實(shí)體語(yǔ)義關(guān)系抽取的研究.pdf
- 命名實(shí)體間語(yǔ)義關(guān)系抽取研究.pdf
- 中文命名實(shí)體識(shí)別及其關(guān)系抽取研究.pdf
- 語(yǔ)言學(xué)特征在中文命名實(shí)體間語(yǔ)義關(guān)系抽取中的應(yīng)用研究.pdf
- 漢語(yǔ)專(zhuān)業(yè)領(lǐng)域命名實(shí)體語(yǔ)義關(guān)系自動(dòng)抽取研究.pdf
- 基于樹(shù)核函數(shù)的命名實(shí)體語(yǔ)義關(guān)系抽取方法的研究.pdf
- 命名實(shí)體識(shí)別及其關(guān)系抽取.pdf
- 基于網(wǎng)絡(luò)抱團(tuán)發(fā)現(xiàn)的命名實(shí)體關(guān)系抽取.pdf
- 面向信息抽取的中文命名實(shí)體識(shí)別研究.pdf
- 中文命名實(shí)體識(shí)別粒度和特征選擇研究.pdf
- 基于核函數(shù)的命名實(shí)體關(guān)系抽取技術(shù)研究.pdf
- 基于迭代方法的命名實(shí)體關(guān)系抽取技術(shù)研究.pdf
- 基于種子自擴(kuò)展的命名實(shí)體關(guān)系抽取方法的研究.pdf
- 基于特征向量的中文實(shí)體間語(yǔ)義關(guān)系抽取研究.pdf
- 基于混合方法的復(fù)雜命名實(shí)體抽取研究.pdf
- 基于句法和語(yǔ)義分析的中文實(shí)體關(guān)系抽取.pdf
- 基于CRF的中文命名實(shí)體識(shí)別研究.pdf
- 基于Wikipedia的中文命名實(shí)體識(shí)別研究.pdf
- 中文微博的地理位置命名實(shí)體識(shí)別研究.pdf
評(píng)論
0/150
提交評(píng)論