

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著Internet的迅猛發(fā)展,信息逐步數(shù)字化、網(wǎng)絡(luò)化、全球化。如何高效、準(zhǔn)確地利用互聯(lián)網(wǎng)上的有用信息已成為人們關(guān)心的課題。對(duì)于生物信息學(xué)研究者來(lái)說(shuō),能否充分利用國(guó)際國(guó)內(nèi)已有的文獻(xiàn)數(shù)據(jù)庫(kù)、構(gòu)建各機(jī)構(gòu)內(nèi)部使用的文獻(xiàn)數(shù)據(jù)庫(kù),這是能否有效開展研究工作的基本保障。另一方面,隨著人類基因組計(jì)劃的完成,已經(jīng)涌現(xiàn)了大量旨在從生物數(shù)據(jù)中分析和挖掘有關(guān)知識(shí)的生物信息軟件,若這些軟件能被充分地共享,則將有效推動(dòng)生物信息學(xué)研究人員的研究工作,由此,對(duì)這些軟件
2、進(jìn)行Web發(fā)布以提供共享服務(wù)也就變得日益重要。
針對(duì)在建設(shè)文獻(xiàn)數(shù)據(jù)庫(kù)時(shí)文獻(xiàn)索引信息需手工錄入、上傳文獻(xiàn)效率低的不足,研制了PDF文獻(xiàn)索引信息自動(dòng)抽取工具。通過(guò)對(duì)PDF文件結(jié)構(gòu)和信息抽取原理進(jìn)行分析,提煉和總結(jié)了生物信息領(lǐng)域中大量重要期刊的PDF文獻(xiàn)索引信息的特征和規(guī)律,并制定出抽取規(guī)則,根據(jù)抽取規(guī)則,對(duì)文件進(jìn)行語(yǔ)義信息分析,實(shí)現(xiàn)了該領(lǐng)域的PDF文獻(xiàn)索引信息的自動(dòng)抽取,提高了文獻(xiàn)上傳效率。在生物信息文獻(xiàn)數(shù)據(jù)庫(kù)中對(duì)該工具進(jìn)行了
3、測(cè)試。測(cè)試證明,系統(tǒng)能實(shí)現(xiàn)單個(gè)文獻(xiàn)和批量文獻(xiàn)的自動(dòng)上傳,使生物信息文獻(xiàn)數(shù)據(jù)庫(kù)素材的收集變得方便。
通過(guò)分析元搜索引擎的特性,將元搜索引擎技術(shù)應(yīng)用到文獻(xiàn)的搜索上來(lái),開發(fā)了一個(gè)文獻(xiàn)元搜索引擎,它包括界面、調(diào)度、顯示三個(gè)核心功能模塊,選擇多個(gè)著名的學(xué)術(shù)文獻(xiàn)搜索引擎和數(shù)據(jù)庫(kù)為目標(biāo)搜索源,克服了單個(gè)文獻(xiàn)數(shù)據(jù)庫(kù)中存在的文獻(xiàn)數(shù)量有限、覆蓋面窄和有效檢索率低等問(wèn)題,為進(jìn)一步整合分布式、異構(gòu)生物信息數(shù)據(jù)庫(kù)打下了基礎(chǔ)。
針對(duì)目前
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于XML的WEB數(shù)據(jù)庫(kù)信息發(fā)布系統(tǒng)的研究與設(shè)計(jì).pdf
- 基于VLAN的Web數(shù)據(jù)庫(kù)的自動(dòng)發(fā)布系統(tǒng)及其應(yīng)用.pdf
- 生物分子信息數(shù)據(jù)庫(kù)
- 模型生物數(shù)據(jù)庫(kù)的構(gòu)建.pdf
- 設(shè)計(jì)構(gòu)建基于Intranet-Web的數(shù)據(jù)庫(kù)信息系統(tǒng).pdf
- 基于Web數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)挖掘技術(shù).pdf
- 構(gòu)建基于組件技術(shù)的Web數(shù)據(jù)庫(kù)應(yīng)用.pdf
- 水稻生物信息數(shù)據(jù)庫(kù)及本地化生物信息分析平臺(tái)的構(gòu)建.pdf
- 生物信息異構(gòu)數(shù)據(jù)庫(kù)集成研究.pdf
- 綜合生物活性肽結(jié)構(gòu)數(shù)據(jù)庫(kù)構(gòu)建.pdf
- 海洋專題數(shù)據(jù)庫(kù)信息發(fā)布相關(guān)技術(shù)的研究與實(shí)現(xiàn).pdf
- WEB數(shù)據(jù)庫(kù)應(yīng)用測(cè)試.pdf
- 綜合神經(jīng)肽信息數(shù)據(jù)庫(kù)構(gòu)建.pdf
- Web數(shù)據(jù)庫(kù)柔性查詢結(jié)果自動(dòng)排序方法研究.pdf
- 基于web的數(shù)據(jù)庫(kù)管理軟件設(shè)計(jì)
- 水稻生物學(xué)數(shù)據(jù)庫(kù)的構(gòu)建.pdf
- 基于Web的醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于科技文獻(xiàn)數(shù)據(jù)庫(kù)網(wǎng)站的信息用戶滿意模型構(gòu)建研究.pdf
- 基于Web的眼眶病數(shù)據(jù)庫(kù)構(gòu)建及其應(yīng)用.pdf
- 房地產(chǎn)信息數(shù)據(jù)庫(kù)系統(tǒng)構(gòu)建與實(shí)現(xiàn)
評(píng)論
0/150
提交評(píng)論