版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、專利是人類的知識成果,最大程度的開發(fā)利用專利知識,可以為國家和企業(yè)縮短時(shí)間,節(jié)省費(fèi)用。專利知識抽取,作為深層次理解專利內(nèi)容的重要基礎(chǔ),日益成為專利研究的熱點(diǎn),直接影響著專利檢索、專利翻譯、專利分析等多方面應(yīng)用的性能。有效的利用專利知識,可以揭示專利中隱藏的重要信息,為企業(yè)的發(fā)展以及重大決策的制定提供重要參考和指導(dǎo)作用。本文從專利術(shù)語、專利技術(shù)主題以及專利功效短語三方面對專利知識進(jìn)行識別,以及對部分知識進(jìn)行規(guī)范化研究,主要研究工作如下:<
2、br> 專利術(shù)語作為專利文獻(xiàn)核心內(nèi)容的主要表現(xiàn)形式,其抽取任務(wù)是專利多方面研究的基礎(chǔ)工作。本文提出一種基于層次過濾方法抽取專利術(shù)語。該方法基于后綴數(shù)組獲取的重復(fù)字串作為候選詞,根據(jù)候選詞集合中無效詞串的特點(diǎn)將其分為破碎字串、冗余字串和通用詞,通過識別和過濾三類無效字串來獲得專利術(shù)語。分別提出一種獨(dú)立性計(jì)算法過濾破碎字串,相對活躍度計(jì)算方法和分詞糾錯(cuò)法過濾冗余字串。實(shí)驗(yàn)結(jié)果表明,識別的術(shù)語平均正確率為90.87%,平均召回率為84.68
3、%,該方法對中文專利術(shù)語抽取取得了較好的效果。
利用文本挖掘技術(shù)進(jìn)行技術(shù)主題抽取和主題規(guī)范化工作。根據(jù)技術(shù)主題在專利摘要中的分布特點(diǎn)以及技術(shù)主題的粒度特征,提出一種主題度計(jì)算方法,將主題度較大的詞作為主題詞;通過計(jì)算相似度獲得主題詞的同義詞對,借助詞頻統(tǒng)計(jì)特征對主題詞規(guī)范化表示。實(shí)驗(yàn)結(jié)果表明,提出的主題詞抽取方法是有效的,實(shí)驗(yàn)準(zhǔn)確率為95.5%,召回率為95.5%;同時(shí)提出的主題規(guī)范化方法具有較大的意義。
功效信息作
4、為專利功效分析的關(guān)鍵和基礎(chǔ),其完整性和準(zhǔn)確性對分析結(jié)果的有效性和準(zhǔn)確性具有決定性意義。為了提高功效信息抽取的效果,提出一種功效短語識別方法。功效短語進(jìn)行高度概括化,將功效短語分為功效主題、功效屬性和功效值三部分。短語的識別即三個(gè)組成部分的詞語識別。綜合利用功效短語所在句子特征和構(gòu)詞特征,包括句子位置信息、線索詞等有效特征。同時(shí),采用條件隨機(jī)場模型及其復(fù)合模板,對專利摘要文件進(jìn)行功效短語識別。實(shí)驗(yàn)結(jié)果表明,準(zhǔn)確率為79.25%,召回率為5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 專利知識獲取及其支持概念創(chuàng)新設(shè)計(jì)的方法研究.pdf
- 產(chǎn)品專利知識獲取及其輔助產(chǎn)品創(chuàng)新的方法研究.pdf
- 中文領(lǐng)域術(shù)語自動(dòng)獲取方法的研究.pdf
- 基于文本的中文本體知識獲取的研究.pdf
- 基于概念格的知識獲取方法研究.pdf
- 基于Rough Set的知識獲取方法研究.pdf
- 基于粒計(jì)算的知識獲取方法研究.pdf
- 基于詞向量的中文詞匯蘊(yùn)涵知識獲取研究.pdf
- 建筑施工隱性安全知識獲取方法研究.pdf
- 粗糙集的知識獲取方法研究.pdf
- 飾品設(shè)計(jì)知識獲取方法研究及其應(yīng)用.pdf
- 林業(yè)機(jī)械專利知識獲取及輔助創(chuàng)新平臺研究.pdf
- 基于語義分類的常識知識獲取方法研究.pdf
- 粒度概念格集成與知識獲取方法研究.pdf
- 基于粗集的知識獲取方法的研究.pdf
- 數(shù)學(xué)概念的知識獲取與分析方法研究.pdf
- 不完備數(shù)據(jù)的動(dòng)態(tài)知識獲取方法研究.pdf
- 兼語句的知識分析與獲取方法研究.pdf
- 中文詞典中詞匯屬性知識的獲取.pdf
- 兼語句的知識分析與獲取方法研究
評論
0/150
提交評論