-
簡(jiǎn)介:該文主要工作內(nèi)容如下1將整個(gè)系統(tǒng)以中間件形式開(kāi)發(fā)實(shí)現(xiàn)了通過(guò)CW方式進(jìn)行文檔編輯操作將客戶端的MICROSOFTOFFICE融入客戶端IE瀏覽器中使用戶操作更方便2實(shí)現(xiàn)了最大限度的與MICROSOFTOFFICE兼容用戶無(wú)須經(jīng)過(guò)更多的培訓(xùn)就能夠使用采用該中間件開(kāi)發(fā)的文檔管理軟件3實(shí)現(xiàn)了通過(guò)網(wǎng)絡(luò)在線編輯和保存服務(wù)器文檔的功能用戶通過(guò)中間件打開(kāi)、編輯、保存服務(wù)器上的文檔就像操作本地的文檔一樣簡(jiǎn)單4實(shí)現(xiàn)了手寫簽名、電子印章、痕跡保留、版本控制等功能這些功能是電子政務(wù)和辦公自動(dòng)化中文檔管理最重要的功能該中間件能很好的實(shí)現(xiàn)這些功能5實(shí)現(xiàn)了客戶端軟件自動(dòng)升級(jí)的功能該中間件采用插件技術(shù)能夠通過(guò)版本號(hào)的更新實(shí)現(xiàn)自動(dòng)更新客戶端軟件的功能
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 59
大小: 1.99(MB)
子文件數(shù):
-
簡(jiǎn)介:隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的迅速發(fā)展和互聯(lián)網(wǎng)的高速普及,信息數(shù)據(jù)量正在飛速的膨脹。XML作為一種重要的網(wǎng)絡(luò)信息交換格式,如何有效的組織和存儲(chǔ)正在快速增長(zhǎng)的海量XML數(shù)據(jù),并提供快速高效的數(shù)據(jù)檢索,是當(dāng)今信息檢索領(lǐng)域的一個(gè)研究重點(diǎn)。目前,XML數(shù)據(jù)的存儲(chǔ)和檢索一般使用NATIVEXML或者關(guān)系數(shù)據(jù)庫(kù),但這類系統(tǒng)無(wú)法滿足大規(guī)模數(shù)據(jù)的性能需求,而基于分布式的XML數(shù)據(jù)存儲(chǔ)和檢索技術(shù)則尚未成熟。本文針對(duì)以上需求,在對(duì)XML和云計(jì)算技術(shù)的研究基礎(chǔ)上,設(shè)計(jì)并實(shí)現(xiàn)了一種海量XML文檔存儲(chǔ)和檢索平臺(tái)。首先,本文提出了一種XML到HBASE的數(shù)據(jù)映射模型,該模型采用四路編碼算法,實(shí)現(xiàn)了XML數(shù)據(jù)到HBASE數(shù)據(jù)之間的映射。其次,本文借鑒了MAPREDUCE的計(jì)算模型,采用HBASE數(shù)據(jù)庫(kù),設(shè)計(jì)并實(shí)現(xiàn)了以XPATH為前端查詢語(yǔ)言的數(shù)據(jù)檢索機(jī)制,充分利用HBASE的特點(diǎn),提高檢索效率。最后,本文設(shè)計(jì)了一組實(shí)驗(yàn),并通過(guò)該實(shí)驗(yàn)驗(yàn)證了本文提出的海量XML數(shù)據(jù)存儲(chǔ)和檢索平臺(tái)的性能和有效性。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 71
大?。?2.73(MB)
子文件數(shù):
-
簡(jiǎn)介:國(guó)際會(huì)議網(wǎng)站管理系統(tǒng)是一個(gè)基于APACHE服務(wù)器平臺(tái),采用PHP、JAVRIPT等腳本技術(shù),利用MYSQL數(shù)據(jù)庫(kù)設(shè)計(jì)實(shí)現(xiàn)的網(wǎng)絡(luò)學(xué)術(shù)信息交流平臺(tái)。旨在以網(wǎng)頁(yè)的形式實(shí)現(xiàn)多元化的信息傳遞功能并展現(xiàn)國(guó)際學(xué)術(shù)會(huì)議的文化氛圍。本系統(tǒng)在結(jié)合了軟件工程的相關(guān)理論基礎(chǔ)上對(duì)其進(jìn)行了詳細(xì)的需求分析、概要設(shè)計(jì)并最終實(shí)現(xiàn)。論文首先分析國(guó)際學(xué)術(shù)會(huì)議網(wǎng)站管理系統(tǒng)的項(xiàng)目需求,明確系統(tǒng)所要實(shí)現(xiàn)的功能和最終目標(biāo),確定系統(tǒng)體系結(jié)構(gòu)設(shè)計(jì)并通過(guò)系統(tǒng)的用例分析進(jìn)行系統(tǒng)需求的詳細(xì)設(shè)計(jì);然后確定實(shí)現(xiàn)論文管理、用戶信息和權(quán)限管理以及信息檢索功能所需要使用的關(guān)鍵技術(shù)。在系統(tǒng)設(shè)計(jì)階段,通過(guò)對(duì)系統(tǒng)流程的進(jìn)一步分析,完成數(shù)據(jù)庫(kù)設(shè)計(jì)和頁(yè)面設(shè)計(jì)。在詳細(xì)設(shè)計(jì)階段,對(duì)系統(tǒng)的各個(gè)功能模塊分別給出了詳細(xì)的程序設(shè)計(jì)。在系統(tǒng)實(shí)現(xiàn)階段,詳細(xì)介紹了系統(tǒng)主要功能模塊和實(shí)現(xiàn)細(xì)節(jié)。本系統(tǒng)的技術(shù)創(chuàng)新點(diǎn)主要體現(xiàn)在以下幾個(gè)方面首先是在頁(yè)面設(shè)計(jì)中實(shí)現(xiàn)了動(dòng)態(tài)的下拉菜單、半透明的背景效果以及鼠標(biāo)滑過(guò)時(shí)的顏色交替等特效;在登錄模塊中采用驗(yàn)證碼技術(shù)對(duì)用戶登錄信息進(jìn)行驗(yàn)證;論文上傳模塊中,對(duì)上傳文件的存儲(chǔ)方式進(jìn)行研究;在信息檢索模塊中對(duì)符合查詢條件的關(guān)鍵字進(jìn)行描紅匹配,并高亮顯示查詢結(jié)果;在郵箱模塊中實(shí)現(xiàn)了多人群發(fā)郵件功能等。本系統(tǒng)是通過(guò)網(wǎng)絡(luò)信息技術(shù)實(shí)現(xiàn)的在線交流和信息評(píng)審系統(tǒng)。通過(guò)對(duì)本系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn),能夠進(jìn)一步促進(jìn)科研人員對(duì)知識(shí)的探索、對(duì)學(xué)術(shù)上的創(chuàng)新和在技術(shù)層次上的突破。完善本系統(tǒng)將推動(dòng)我國(guó)信息產(chǎn)業(yè)化人才隊(duì)伍的壯大,對(duì)實(shí)現(xiàn)人才強(qiáng)國(guó)戰(zhàn)略有著深遠(yuǎn)的意義。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 78
大?。?2.56(MB)
子文件數(shù):
-
簡(jiǎn)介:XML將文檔標(biāo)記推向一個(gè)新的高度提供了一個(gè)人可閱讀自解釋結(jié)構(gòu)合理可擴(kuò)展并能用一致的手段來(lái)描述、傳送數(shù)據(jù)的途徑XML帶給WEB的革新將和HTML媲美XML的迅速發(fā)展對(duì)其存儲(chǔ)和檢索提出了更高的要求結(jié)合傳統(tǒng)數(shù)據(jù)庫(kù)和XML是一個(gè)重要的研究方向該論文描述了XML當(dāng)前的研究現(xiàn)狀及其應(yīng)用綜述了一系列相關(guān)規(guī)范和相關(guān)產(chǎn)品的我們著重討論XML和數(shù)據(jù)庫(kù)間的關(guān)系以及它們之間的數(shù)據(jù)轉(zhuǎn)換并實(shí)現(xiàn)了一個(gè)在關(guān)系型數(shù)據(jù)庫(kù)和XML文檔間傳送數(shù)據(jù)的系統(tǒng)它向用戶提供了XML文檔和關(guān)系型數(shù)據(jù)庫(kù)映射的手段實(shí)現(xiàn)了一個(gè)可被其它系統(tǒng)使用的中間件的雛形可以作為這些系統(tǒng)處理XML數(shù)據(jù)的核心最后在附錄B中還列出一些相關(guān)產(chǎn)品
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 57
大?。?1.92(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時(shí)間:2024-03-10
頁(yè)數(shù): 50
大?。?2.07(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 61
大?。?1.85(MB)
子文件數(shù):
-
簡(jiǎn)介:開(kāi)放文檔格式是基于XML純文本的一種安全持久的文檔格式包含了字處理文檔、電子表格、演示文稿、繪圖等多種文檔類型具有跨平臺(tái)的優(yōu)勢(shì)。由于開(kāi)放文檔格式規(guī)范非常繁雜已經(jīng)超過(guò)了一千多頁(yè)讓很多初級(jí)開(kāi)發(fā)者望而卻步。為了讓開(kāi)發(fā)者更容易操作開(kāi)放文檔格式而無(wú)需關(guān)心具體的文檔規(guī)范ODFTOOLKIT社區(qū)發(fā)布了多種輕量級(jí)的開(kāi)放文檔開(kāi)發(fā)工具包其中的SIMPLEODFAPI以其易學(xué)、易用和易擴(kuò)展的特性受到越來(lái)越多開(kāi)發(fā)者的青睞。隨著SIMPLEODFAPI的不斷發(fā)展以開(kāi)放文檔作為存儲(chǔ)介質(zhì)的應(yīng)用會(huì)越來(lái)越豐富。本文詳細(xì)介紹了開(kāi)放文檔的使用場(chǎng)景和應(yīng)用前景如何將開(kāi)放文檔與新興技術(shù)相結(jié)合以及SIMPLEODFAPI操作開(kāi)放文檔的基本方法。結(jié)合一些目前流行的新技術(shù)如新浪微博、GOOGLEDOCS等將時(shí)間管理思想深化和擴(kuò)展開(kāi)發(fā)了一個(gè)可以隨時(shí)隨地進(jìn)行時(shí)間管理并且與社交網(wǎng)絡(luò)相結(jié)合的時(shí)間管理工具。本文開(kāi)發(fā)的時(shí)間管理工具豐富了時(shí)間管理的應(yīng)用場(chǎng)景更加貼近人們的日常生活。在開(kāi)發(fā)過(guò)程中使用純JAVA語(yǔ)言編寫并且遵循MVC模式方便軟件在日后輕松移植到其它操作系統(tǒng)包括手機(jī)操作系統(tǒng)ROID上。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 72
大小: 2.61(MB)
子文件數(shù):
-
簡(jiǎn)介:該文通過(guò)對(duì)工程圖文檔管理現(xiàn)狀的深入分析闡明了應(yīng)用計(jì)算機(jī)技術(shù)對(duì)工程圖文檔管理實(shí)現(xiàn)自動(dòng)化的必要性和可行性給出了工程圖紙文檔管理系統(tǒng)應(yīng)具備的基本功能及其實(shí)現(xiàn)的技術(shù)路線并詳細(xì)地描述了該系統(tǒng)的開(kāi)發(fā)工具、實(shí)現(xiàn)環(huán)境、后臺(tái)數(shù)據(jù)庫(kù)管理系統(tǒng)DBMS、數(shù)據(jù)庫(kù)表結(jié)構(gòu)、各個(gè)模塊的功能及其具體的實(shí)現(xiàn)方法在附錄中給出了絕大部分程序的原代碼該系統(tǒng)由服務(wù)器端和客戶端兩部分組成服務(wù)器端由用戶管理、工程圖文檔管理、代碼管理、數(shù)據(jù)查詢和響應(yīng)客戶查閱圖文檔的請(qǐng)求等模塊組成每一個(gè)用戶的有關(guān)信息均可按其所屬的院所、部處和科室以樹(shù)狀圖的形式展開(kāi)每一個(gè)圖文檔的有關(guān)信息均可按其所屬的工程、子工程和子子工程以樹(shù)狀圖的形式展開(kāi)層次清楚簡(jiǎn)單明了用戶端的主要功能是向服務(wù)器提交查閱圖文檔的請(qǐng)求該系統(tǒng)為企業(yè)的圖文檔管理提供了一套完整的計(jì)算機(jī)應(yīng)用解決方案使用該系統(tǒng)可以大大提高企業(yè)圖文檔信息的共享程度和安全性規(guī)范圖文檔管理從而促進(jìn)企業(yè)核心競(jìng)爭(zhēng)力的全面提升該系統(tǒng)試用于中航油新疆公司取得了良好的效果
下載積分: 5 賞幣
上傳時(shí)間:2024-03-11
頁(yè)數(shù): 68
大?。?2.76(MB)
子文件數(shù):
-
簡(jiǎn)介:對(duì)于海量的學(xué)術(shù)資源,若是將知識(shí)的控制單元由文獻(xiàn)深化到知識(shí)元,并把文獻(xiàn)分解為一個(gè)個(gè)獨(dú)立的知識(shí)元,這樣會(huì)便于知識(shí)的存儲(chǔ)與查找,以縮短知識(shí)創(chuàng)造的過(guò)程。另外,文獻(xiàn)中知識(shí)元的鏈接關(guān)系可以揭示出相關(guān)領(lǐng)域之間的隱性知識(shí),以挖掘出新的知識(shí)單元,從而實(shí)現(xiàn)知識(shí)的增值轉(zhuǎn)化,加速知識(shí)創(chuàng)新的進(jìn)程。學(xué)術(shù)資源中知識(shí)元的研究,對(duì)于推動(dòng)人類對(duì)知識(shí)利用及新知識(shí)創(chuàng)造的進(jìn)程有著至關(guān)重要的作用。知識(shí)元的抽取是其相關(guān)研究領(lǐng)域的基礎(chǔ)性工作。目前關(guān)于知識(shí)元的理論研究還沒(méi)有統(tǒng)一的認(rèn)知,不同知識(shí)元研究領(lǐng)域?qū)χR(shí)元的模型有不同的定義。另外當(dāng)前研究證實(shí)了文獻(xiàn)之間存在著知識(shí)元的隱含關(guān)聯(lián),但是要從學(xué)術(shù)資源中抽取知識(shí)元還沒(méi)有行之有效的方法,而采用人工操作的工作量太大,實(shí)現(xiàn)起來(lái)比較困難。雖然有學(xué)者已經(jīng)嘗試著利用計(jì)算機(jī)自動(dòng)抽取知識(shí)元,但是他們對(duì)知識(shí)元的認(rèn)知有些差異,系統(tǒng)的抽取效果也不夠理想,因此不適合用到學(xué)術(shù)資源的知識(shí)元抽取工作當(dāng)中。本文將基于學(xué)術(shù)文獻(xiàn)資源,致力于該領(lǐng)域知識(shí)元的自動(dòng)抽取研究工作。本文首先結(jié)合數(shù)字圖書館學(xué)術(shù)資源的特征,提出能夠體現(xiàn)其特征的知識(shí)元七元組結(jié)構(gòu)模型。為了知識(shí)元抽取的全面性,對(duì)學(xué)術(shù)文獻(xiàn)資源進(jìn)行主題劃分成為不可或缺的工作。針對(duì)主題劃分工作,本文引入歸一化割準(zhǔn)則用于主題劃分,其中權(quán)值矩陣需要準(zhǔn)確地反映文本關(guān)系圖中各個(gè)節(jié)點(diǎn)間的相似程度,它影響著分割準(zhǔn)則的分割效果。文中從語(yǔ)義的角度計(jì)算節(jié)點(diǎn)間的相似度,完成權(quán)值矩陣的構(gòu)建,并在此基礎(chǔ)上提出基于歸一化割的主題劃分算法,并驗(yàn)證了該算法在主題劃分中的有效性。然后,本文基于同一領(lǐng)域內(nèi)的學(xué)術(shù)文獻(xiàn)資源,提出術(shù)語(yǔ)定義句子抽取算法。該算法首先對(duì)學(xué)術(shù)文獻(xiàn)中句子進(jìn)行硬匹配,生成候選術(shù)語(yǔ)定義句庫(kù),然后結(jié)合定義隸屬度算法和句子重要度排序算法,進(jìn)一步提升抽取術(shù)語(yǔ)定義句子的準(zhǔn)確性。實(shí)驗(yàn)表明本文算法的效果表現(xiàn)良好。接著,將主題劃分算法及術(shù)語(yǔ)定義抽取算法融入抽取系統(tǒng)中。首先針對(duì)學(xué)術(shù)文獻(xiàn)資源在規(guī)模上變大的問(wèn)題,本文借助潛在語(yǔ)義分析模型構(gòu)建文本關(guān)系圖,并用于主題劃分模塊,然后結(jié)合術(shù)語(yǔ)定義抽取模塊,構(gòu)建知識(shí)元抽取系統(tǒng),最終完成知識(shí)元屬性內(nèi)容描述的抽取工作。同時(shí),本文在抽取到該屬性的基礎(chǔ)上介紹了知識(shí)元其它屬性的抽取思想。最后,本文對(duì)研究工作進(jìn)行總結(jié),并提出了展望。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 76
大小: 2.58(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時(shí)間:2024-03-10
頁(yè)數(shù): 79
大?。?1.21(MB)
子文件數(shù):
-
簡(jiǎn)介:該文在綜述了基本情況后分析了采用XML文檔進(jìn)行信息提取的優(yōu)點(diǎn)提出了一個(gè)基于XML的中間文檔格式IEMLINFMATIONEXTRACTIONMARKUPLANGUAGE包括文檔的標(biāo)題、篇章結(jié)構(gòu)、文本格式信息、鏈接、表格和一些元數(shù)據(jù)信息等詳述了將常用的文檔格式如PDF、WD等轉(zhuǎn)換為XML中間文檔的方法在這個(gè)XML中間文檔的基礎(chǔ)上進(jìn)行了文本內(nèi)容特征提取的工作系統(tǒng)的主要特點(diǎn)如下實(shí)現(xiàn)多種常用格式文檔的內(nèi)容和結(jié)構(gòu)的分析定義通用的文檔格式描述語(yǔ)言并基于對(duì)文檔的形式描述實(shí)現(xiàn)對(duì)多種文檔的識(shí)別、分析基于中間文檔格式提取出文檔的標(biāo)題根據(jù)具體模板提取出了電子期刊論文的標(biāo)題、摘要、關(guān)鍵詞等信息
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 53
大小: 1.49(MB)
子文件數(shù):
-
簡(jiǎn)介:該文首先分析了目前辦公信息系統(tǒng)中文檔數(shù)據(jù)庫(kù)與關(guān)系數(shù)據(jù)庫(kù)集成的意義和研究現(xiàn)狀簡(jiǎn)單討論了文檔數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)的特征并對(duì)這兩類數(shù)據(jù)庫(kù)的關(guān)鍵應(yīng)用概念進(jìn)行了比較接著該文在探討了集成平臺(tái)的兩種選擇后確定了以基于LOTUSDOMINONOTES的辦公自動(dòng)化系統(tǒng)為基礎(chǔ)集成關(guān)系數(shù)據(jù)庫(kù)的思想隨后分析了NOTES文檔數(shù)據(jù)庫(kù)與關(guān)系數(shù)據(jù)庫(kù)的幾種數(shù)據(jù)交換接口選擇LSDO作為該文集成兩類數(shù)據(jù)庫(kù)的接口在此基礎(chǔ)上該文研究了基于LOTUSDOMINONOTES平臺(tái)集成文檔數(shù)據(jù)庫(kù)與關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵技術(shù)系統(tǒng)安全性及權(quán)限控制、公文流轉(zhuǎn)、數(shù)據(jù)一致性等并提出相應(yīng)的解決方案最后通過(guò)實(shí)例進(jìn)一步驗(yàn)證和說(shuō)明了應(yīng)用上述解決方案的可行性該文對(duì)辦公信息系統(tǒng)中兩類數(shù)據(jù)庫(kù)集成的關(guān)鍵技術(shù)進(jìn)行了研究和總結(jié)探索出一些好的開(kāi)發(fā)經(jīng)驗(yàn)和方案對(duì)于今后開(kāi)發(fā)類似項(xiàng)目有一定的參考價(jià)值達(dá)到了兩類數(shù)據(jù)庫(kù)系統(tǒng)優(yōu)勢(shì)互補(bǔ)提高企業(yè)辦公效率的目的
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 48
大?。?1.39(MB)
子文件數(shù):
-
簡(jiǎn)介:隨著信息化程度的加深幾乎所有的紙質(zhì)文檔都將轉(zhuǎn)換成電子版進(jìn)行保存以便進(jìn)行保存、攜帶、檢索和查閱。目前基于全文數(shù)據(jù)庫(kù)的檢索系統(tǒng)需要數(shù)據(jù)庫(kù)作為底層支撐這不論是在操作還是經(jīng)濟(jì)上都是普通用戶難以接受的。已有的面向磁盤文件的全文檢索系統(tǒng)在文檔類型的多樣化和檢索結(jié)果的優(yōu)化方面都存在一定的缺陷。在面向文檔的全文檢索系統(tǒng)中首先分析了系統(tǒng)背景和目的給出了功能和性能方面的需求采取瀏覽器服務(wù)器體系結(jié)構(gòu)并將系統(tǒng)劃分為用戶界面、索引管理、文檔檢索和結(jié)果展示四個(gè)模塊。然后對(duì)基于詞頻和逆文本頻率的相似度評(píng)分算法進(jìn)行了詳盡的分析指出這個(gè)算法在文檔的相似度得分上存在的缺陷并依據(jù)這些缺點(diǎn)從“全詞匹配”和“詞項(xiàng)相鄰度”這兩個(gè)角度對(duì)算法進(jìn)行了優(yōu)化。接著詳實(shí)地闡明系統(tǒng)中索引管理、文檔檢索和結(jié)果展示的實(shí)現(xiàn)流程。在索引管理模塊中分?jǐn)?shù)據(jù)庫(kù)中表的管理和磁盤上文件索引的管理兩個(gè)方面的實(shí)現(xiàn)來(lái)陳述文檔檢索模塊中在詳細(xì)介紹了文檔檢索過(guò)程的同時(shí)給出了改進(jìn)后的相似度排序算法的具體的實(shí)現(xiàn)。最后對(duì)系統(tǒng)中能夠解析的文檔類型、文件索引管理功能和文檔檢索功能及改進(jìn)后的相似度評(píng)分算法的性能設(shè)計(jì)了實(shí)驗(yàn)進(jìn)行了測(cè)試。實(shí)驗(yàn)結(jié)果表明面向文檔的全文檢索系統(tǒng)在功能上可以滿足用戶對(duì)多類型文檔的檢索需求且改進(jìn)后的相似度排序算法在用戶滿意度方面也有一定的作用。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 53
大?。?2.15(MB)
子文件數(shù):
-
簡(jiǎn)介:該文在對(duì)XML文檔的特點(diǎn)、XML的基本理論、XML查詢語(yǔ)言以及傳統(tǒng)信息檢索模型在XML文檔檢索中的應(yīng)用等問(wèn)題進(jìn)行仔細(xì)分析的基礎(chǔ)上提出了XML文檔檢索的總體系統(tǒng)框架、具體算法及其實(shí)現(xiàn)作者首先將XML文檔進(jìn)行分類在此基礎(chǔ)上認(rèn)為一個(gè)好的檢索算法應(yīng)該能適用于不同類型的文檔檢索需求根據(jù)這一思想作者提出了將XPATH語(yǔ)言與傳統(tǒng)的向量空間模型相結(jié)合實(shí)現(xiàn)基于簡(jiǎn)單XPATH路徑的向量檢索算法來(lái)實(shí)現(xiàn)對(duì)XML文檔的檢索充分利用XML文檔分類層次體系結(jié)構(gòu)的特點(diǎn)對(duì)于每篇XML文檔分析其文檔結(jié)構(gòu)并采用聚類學(xué)習(xí)算法形成文檔結(jié)構(gòu)類屬詞典從而實(shí)現(xiàn)XML文檔查詢的導(dǎo)航機(jī)制和消除文檔結(jié)構(gòu)的異構(gòu)性采用自底向上的查找方法實(shí)現(xiàn)路徑匹配準(zhǔn)確定位用戶的興趣需要同時(shí)最大限度地減少檢索時(shí)間提高檢索速度
下載積分: 5 賞幣
上傳時(shí)間:2024-03-11
頁(yè)數(shù): 67
大?。?1.6(MB)
子文件數(shù):
-
簡(jiǎn)介:互聯(lián)網(wǎng)的發(fā)展對(duì)文檔信息處理系統(tǒng)產(chǎn)生了重大的影響傳統(tǒng)的文檔信息處理系統(tǒng)采用CS結(jié)構(gòu)往往導(dǎo)致客戶端龐大服務(wù)器端容易出現(xiàn)資源瓶頸等缺點(diǎn)。而基于互聯(lián)網(wǎng)采用BS結(jié)構(gòu)的文檔管理系統(tǒng)在客戶端只需安裝標(biāo)準(zhǔn)的瀏覽器無(wú)需像CS模式那樣在不同的客戶機(jī)上安裝不同的客戶應(yīng)用程序BS模式的功能都在服務(wù)器上實(shí)現(xiàn)使開(kāi)發(fā)與維護(hù)工作簡(jiǎn)單易行;對(duì)用戶來(lái)說(shuō)操作上也簡(jiǎn)單了許多。本文在對(duì)現(xiàn)在流行的WEB開(kāi)發(fā)技術(shù)研究的基礎(chǔ)上進(jìn)行篩選和比較之后選擇了J2EE作為系統(tǒng)的整體架構(gòu)。J2EE把數(shù)據(jù)庫(kù)訪問(wèn)JAVA組件和WEB技術(shù)等有機(jī)地集成在一起使之適合于構(gòu)建高校文檔信息處理系統(tǒng)它能更好支持BS結(jié)構(gòu)保證了系統(tǒng)具有很好的可擴(kuò)展性。本人作為主要參與者通過(guò)對(duì)J2EE技術(shù)的研究建設(shè)及實(shí)現(xiàn)了濟(jì)南大學(xué)文檔信息處理系統(tǒng)。該系統(tǒng)采用了系統(tǒng)建模的方式采用了MVC設(shè)計(jì)模式進(jìn)行開(kāi)發(fā)做到視圖、控制、模型三部分的分離使軟件的開(kāi)發(fā)與維護(hù)更加方便。文章詳細(xì)介紹了該系統(tǒng)的建設(shè)及實(shí)現(xiàn)從功能模塊、方案設(shè)計(jì)、整體架構(gòu)方面給出了一個(gè)完整的實(shí)現(xiàn)過(guò)程。該系統(tǒng)能夠滿足一般高校關(guān)于文檔信息處理的功能是一個(gè)基于J2EE架構(gòu)的文檔信息處理系統(tǒng)使文檔管理與學(xué)校業(yè)務(wù)流程相結(jié)合能快速存取各種類型的應(yīng)用程序文檔。它使得大量紙質(zhì)文件被電子文件取代人工傳遞被網(wǎng)絡(luò)流轉(zhuǎn)取代降低了耗材開(kāi)銷消除了翻閱文件的煩惱使辦公實(shí)現(xiàn)了質(zhì)的飛躍。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 68
大?。?8.81(MB)
子文件數(shù):