數(shù)字圖書(shū)館跨庫(kù)檢索平臺(tái)的設(shè)計(jì)_第1頁(yè)
已閱讀1頁(yè),還剩5頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p>  數(shù)字圖書(shū)館跨庫(kù)檢索平臺(tái)的設(shè)計(jì)</p><p>  摘要:在基于移動(dòng)Agent的分布式異構(gòu)數(shù)據(jù)庫(kù)設(shè)計(jì)實(shí)現(xiàn)的基礎(chǔ)上,將其應(yīng)用于校園數(shù)字圖書(shū)館檢索,本文介紹系統(tǒng)的運(yùn)行環(huán)境及應(yīng)用于數(shù)字圖書(shū)館跨庫(kù)檢索的工作流程,最終通過(guò)實(shí)驗(yàn)結(jié)果對(duì)比基于本模型的檢索方式與傳統(tǒng)信息檢索方式的檢索效率。 </p><p>  關(guān)鍵詞:Agent、數(shù)據(jù)庫(kù)、數(shù)據(jù)檢索 </p><p&

2、gt;  中圖分類號(hào):G250.74文獻(xiàn)標(biāo)識(shí)碼: A </p><p><b>  1引言 </b></p><p>  隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的不斷進(jìn)步,數(shù)字圖書(shū)館近年來(lái)在各個(gè)大中專院校飛速發(fā)展,院校購(gòu)買的數(shù)據(jù)庫(kù)資源越來(lái)越多,多數(shù)數(shù)據(jù)庫(kù)資源都多達(dá)幾十種。傳統(tǒng)的檢索流程為:用戶根據(jù)自己的需要依次登錄各個(gè)檢索界面,檢索記錄,保存自己的檢索結(jié)果,如此重復(fù)的檢索過(guò)程,加上各數(shù)字

3、資源系統(tǒng)是由不同的部門在不同的時(shí)間開(kāi)發(fā)出來(lái)的,導(dǎo)致各個(gè)數(shù)字資源系統(tǒng)檢索界面、檢索模型和檢索結(jié)果顯示界面不同,而且各系統(tǒng)收錄的資源重復(fù)率較高,而用戶為了得到較滿意的檢索結(jié)果,不得不頻繁登錄各個(gè)檢索系統(tǒng)。隨著數(shù)字圖書(shū)館規(guī)模的增加,傳統(tǒng)的檢索過(guò)程模型就越來(lái)越不能滿足用戶的檢索要求。因此,構(gòu)建一個(gè)數(shù)字圖書(shū)館跨庫(kù)檢索平臺(tái)有著十分重要的意義。 </p><p><b>  2設(shè)計(jì)原則 </b></

4、p><p>  該數(shù)字圖書(shū)館跨庫(kù)檢索平臺(tái)的設(shè)計(jì)遵循以下設(shè)計(jì)原則: </p><p>  (1)克服數(shù)據(jù)源異構(gòu)性問(wèn)題。由于要將這些數(shù)字圖書(shū)館集成起來(lái)構(gòu)建一個(gè)數(shù)字圖書(shū)館跨庫(kù)檢索平臺(tái),而不改變?cè)械拿總€(gè)數(shù)字圖書(shū)館的結(jié)構(gòu),所以需要訪問(wèn)的數(shù)據(jù)庫(kù)類型有Oracle、Sybase和Access等,對(duì)于這些異構(gòu)數(shù)據(jù)庫(kù)的透明訪問(wèn)就是應(yīng)考慮的問(wèn)題。 </p><p>  (2)滿足數(shù)字圖書(shū)

5、館數(shù)量的不斷增加和信息更新的需求。 </p><p>  (3)對(duì)檢索用戶訂閱的檢索結(jié)果通過(guò)分布式緩存檢索結(jié)果,減少用戶的在線連接時(shí)間。 </p><p><b>  3運(yùn)行環(huán)境 </b></p><p>  限于實(shí)際條件,我們?cè)趯?shí)驗(yàn)室局域網(wǎng)內(nèi)對(duì)書(shū)庫(kù)信息進(jìn)行了查詢?cè)囼?yàn)。 </p><p>  本系統(tǒng)采用多臺(tái)PC計(jì)算機(jī)構(gòu)成

6、實(shí)驗(yàn)環(huán)境,其中包括:(1)五臺(tái)PC作為數(shù)據(jù)庫(kù)服務(wù)器,分別是某校購(gòu)買的超星和書(shū)生電子書(shū)數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)類型為SQL Server2000數(shù)據(jù)庫(kù);校論文數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)類型為Sybase11.5數(shù)據(jù)庫(kù);校課件/教案數(shù)據(jù)庫(kù)和校隨書(shū)光盤數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)類型為Access數(shù)據(jù)庫(kù)。(2)一臺(tái)PC作為目錄服務(wù)器,用來(lái)為數(shù)據(jù)庫(kù)服務(wù)器提供注冊(cè)服務(wù)并供客戶端進(jìn)行查詢,數(shù)據(jù)庫(kù)用的是Access數(shù)據(jù)庫(kù)。(3)一臺(tái)PC作為客戶端,讀者從客戶端向系統(tǒng)發(fā)出查詢操作請(qǐng)求。

7、</p><p>  所有PC機(jī)上的操作系統(tǒng)平臺(tái)選用Windows XP,Agent平臺(tái)選用的版本是Aglet2.02,運(yùn)行環(huán)境為Tahiti服務(wù)器,Java平臺(tái)是JDK 1.5,目錄服務(wù)器上Aglet通過(guò)JDBC-ODBC橋和Access數(shù)據(jù)庫(kù)進(jìn)行連接,數(shù)據(jù)庫(kù)服務(wù)器上各個(gè)專用數(shù)據(jù)庫(kù)的驅(qū)動(dòng)程序是到各個(gè)公司的網(wǎng)站上下載的,例如從微軟公司網(wǎng)站下下載了SQL Server 2000的JDBC驅(qū)動(dòng)程序,它的核心文件有3個(gè)

8、,它們是msbase.jar、mssqlserver.jar和msutil.jar,將這3個(gè)文件的完整路徑寫入環(huán)境變量CLASSPATH中即可。 </p><p><b>  4工作流程 </b></p><p>  系統(tǒng)總體結(jié)構(gòu)如圖1所示。 </p><p>  圖1 系統(tǒng)總體結(jié)構(gòu) </p><p>  系統(tǒng)工作流程介

9、紹如下: </p><p>  (1)啟動(dòng)目錄服務(wù)器上的目錄管理Agent,激活目錄搜索服務(wù)Agent和注冊(cè)服務(wù)Agent,初始化數(shù)據(jù)庫(kù)注冊(cè)信息表; </p><p>  (2)啟動(dòng)異構(gòu)數(shù)據(jù)庫(kù)服務(wù)器上的數(shù)據(jù)庫(kù)管理Agent,使得注冊(cè)Agent處于激活狀態(tài),獲取并攜帶本地?cái)?shù)據(jù)庫(kù)服務(wù)器的所有信息; </p><p>  (3)注冊(cè)Agent移動(dòng)到目錄服務(wù)器和注冊(cè)服務(wù)Ag

10、ent進(jìn)行通信,將自己攜帶的數(shù)據(jù)庫(kù)服務(wù)器的所有信息注冊(cè)到目錄服務(wù)器的數(shù)據(jù)庫(kù)注冊(cè)信息表中。 </p><p>  (4)以上三步實(shí)現(xiàn)了系統(tǒng)的初始化。在此基礎(chǔ)上,啟動(dòng)客戶端上的用戶管理Agent,激活目錄搜索Agent到目錄服務(wù)器上檢索數(shù)據(jù)庫(kù)注冊(cè)信息,當(dāng)客戶提出數(shù)據(jù)庫(kù)操作請(qǐng)求時(shí),用戶管理Agent接收、解析請(qǐng)求,然后建立對(duì)應(yīng)的查詢Agent,由它們攜帶查詢請(qǐng)求移動(dòng)到各個(gè)數(shù)據(jù)庫(kù)上進(jìn)行數(shù)據(jù)查詢操作; </p>

11、<p>  (5)查詢Agent在數(shù)據(jù)庫(kù)服務(wù)器端根據(jù)查詢請(qǐng)求,完成數(shù)據(jù)庫(kù)的相關(guān)查詢操作,操作結(jié)束后,攜帶結(jié)果返回到客戶端; </p><p>  (6)用戶Agent將所得結(jié)果整理、匯總,以合適的方式展現(xiàn)給客戶。 </p><p>  后三步完成了從客戶到數(shù)據(jù)庫(kù)訪問(wèn)的完整步驟。 </p><p><b>  5測(cè)試分析 </b>&

12、lt;/p><p>  為了保證測(cè)試結(jié)果的對(duì)比性,假設(shè)在該時(shí)段只有測(cè)試者自己使用該系統(tǒng)檢索,即系統(tǒng)的負(fù)載相同,網(wǎng)絡(luò)正常無(wú)阻塞,本測(cè)試在傳統(tǒng)的數(shù)字圖書(shū)館查詢頁(yè)面和該系統(tǒng)下分別進(jìn)行測(cè)試: </p><p>  測(cè)試參數(shù)為:檢索項(xiàng)為“論文”,檢索詞為“數(shù)據(jù)庫(kù)”。 </p><p>  在傳統(tǒng)的數(shù)字圖書(shū)館查詢頁(yè)面下分別進(jìn)入各個(gè)書(shū)庫(kù)的檢索頁(yè)面進(jìn)行查詢,不計(jì)之間的切換時(shí)間,記錄返回

13、的記錄數(shù)和返回時(shí)間,測(cè)試次數(shù)為20次,求各次返回時(shí)間的平均值。在本系統(tǒng)下分別選中其中的一個(gè)(以超星為例),兩個(gè)(以超星和書(shū)生,超星和課件/教案為例),三個(gè)(以超星、書(shū)生和課件/教案為例),四個(gè)檢索數(shù)據(jù)庫(kù)分別進(jìn)行測(cè)試,記錄返回的記錄數(shù)和返回時(shí)間,測(cè)試次數(shù)也為20次,求各次返回時(shí)間的平均值。測(cè)試結(jié)果如表5-1所示: </p><p>  表5-1測(cè)試結(jié)果1 </p><p>  測(cè)試結(jié)果表明,

14、基于本文設(shè)計(jì)的檢索系統(tǒng)發(fā)揮了良好的的并行搜索功能,信息檢索速率遠(yuǎn)遠(yuǎn)高于傳統(tǒng)的檢索方式,特別是當(dāng)檢索書(shū)庫(kù)的數(shù)量增加時(shí),返回時(shí)間增長(zhǎng)并不明顯,而傳統(tǒng)的檢索模式則迅速增長(zhǎng),達(dá)到正常預(yù)測(cè)的結(jié)果。 </p><p>  通過(guò)制造人為的網(wǎng)絡(luò)運(yùn)行故障,在執(zhí)行檢索過(guò)程中將其中的超星數(shù)據(jù)庫(kù)斷開(kāi)連接5秒左右,再繼續(xù)連接上。表5-2列出了網(wǎng)絡(luò)發(fā)生故障時(shí)的返回記錄數(shù)和平均返回時(shí)間。 </p><p>  測(cè)試結(jié)果

15、2表明,網(wǎng)絡(luò)發(fā)生故障對(duì)傳統(tǒng)的檢索方式不僅僅有檢索時(shí)間延遲的影響,還影響其檢索的結(jié)果。而基于本文模型的檢索系統(tǒng)發(fā)揮網(wǎng)絡(luò)依賴性小的優(yōu)勢(shì),網(wǎng)絡(luò)的暫時(shí)性故障對(duì)檢索結(jié)果幾乎沒(méi)有影響,只是使檢索時(shí)間稍微增大。 </p><p>  表5-2測(cè)試結(jié)果2 </p><p><b>  6小結(jié) </b></p><p>  從實(shí)驗(yàn)角度進(jìn)行了基于移動(dòng)Agent訪問(wèn)

16、模型的數(shù)字圖書(shū)館跨庫(kù)檢索平臺(tái)的測(cè)試,最終實(shí)驗(yàn)表明,和傳統(tǒng)的信息檢索方式進(jìn)行了對(duì)比,設(shè)計(jì)的應(yīng)用系統(tǒng)能夠在不改變?cè)袛?shù)據(jù)庫(kù)結(jié)構(gòu)的基礎(chǔ)上,對(duì)各種異構(gòu)數(shù)據(jù)庫(kù)進(jìn)行透明訪問(wèn),并且能夠滿足數(shù)字圖書(shū)館數(shù)量不斷增加和信息更新的需求,同時(shí)系統(tǒng)在網(wǎng)絡(luò)不穩(wěn)定和系統(tǒng)發(fā)生故障等情況下依然能夠很好的工作,具有效率較高、占用資源較少、使用方便、良好的擴(kuò)充性和可靠性等優(yōu)點(diǎn)。 </p><p><b>  參考文獻(xiàn) </b>&

17、lt;/p><p>  鄭元兵 基于移動(dòng)Agent的分布式異構(gòu)數(shù)據(jù)庫(kù)訪問(wèn)技術(shù)研究 重慶大學(xué) 碩士學(xué)位論文 2006. </p><p>  張薇,馬丹,王本立.移動(dòng)agent的平臺(tái)、通信和標(biāo)準(zhǔn).計(jì)算機(jī)應(yīng)用研究.2002, 4:136-139. </p><p>  齊玉杰.全路客票發(fā)售和預(yù)訂系統(tǒng)中分布式數(shù)據(jù)庫(kù)通訊中問(wèn)件的開(kāi)發(fā)和應(yīng)用[D].鐵道部科學(xué)研究院2000.7.

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論