-
簡介:文件雕復(fù)技術(shù)作為一種不依賴系統(tǒng)元信息對(duì)數(shù)據(jù)進(jìn)行恢復(fù)的有效手段通過結(jié)合數(shù)據(jù)的特征保留盡可能多的原始數(shù)據(jù)有效地彌補(bǔ)了傳統(tǒng)恢復(fù)技術(shù)依賴于文件系統(tǒng)元信息的不足。但是目前的雕復(fù)主要針對(duì)完整連續(xù)的或分片完整的數(shù)據(jù)內(nèi)容進(jìn)行雕復(fù)還少有對(duì)內(nèi)容不完整的分片數(shù)據(jù)作有效的恢復(fù)研究。本文以微軟OOXML文檔為研究對(duì)象研究該格式文檔在部分?jǐn)?shù)據(jù)缺失或分片情況下對(duì)文本內(nèi)容的恢復(fù)方法。首先在對(duì)OOXML格式標(biāo)準(zhǔn)中的DOCX文檔結(jié)構(gòu)作深入剖析基礎(chǔ)之上本文提出一種針對(duì)破損或分片DOCX文檔的文本內(nèi)容恢復(fù)方法。通過直接讀取磁盤數(shù)據(jù)或從磁盤映像文件中尋找DOCX文檔數(shù)據(jù)片提取主文檔部件的內(nèi)容并對(duì)其進(jìn)行重新組織將DOCX文檔主體部分文本內(nèi)容恢復(fù)出來。實(shí)驗(yàn)結(jié)果表明這種方法可以有效地恢復(fù)破損或分片DOCX文檔中的文本內(nèi)容。其次在對(duì)OOXML格式標(biāo)準(zhǔn)中的PPTX文檔結(jié)構(gòu)作深入剖析基礎(chǔ)之上本文提出一種針對(duì)破損或分片PPTX文檔的主體文本內(nèi)容恢復(fù)方法。通過直接讀取磁盤數(shù)據(jù)或從磁盤映像文件中尋找PPTX文檔數(shù)據(jù)片順序提取幻燈片部件的內(nèi)容并對(duì)其進(jìn)行重新組織將幻燈片文本文本內(nèi)容恢復(fù)出來。實(shí)驗(yàn)結(jié)果表明提出的方法可以有效地恢復(fù)破損或分片PPTX文檔中的文本內(nèi)容。最后在對(duì)OOXML格式標(biāo)準(zhǔn)中的XLSX文檔結(jié)構(gòu)作深入剖析基礎(chǔ)之上本文提出一種針對(duì)破損或分片XLSX表單文檔的主體文本內(nèi)容恢復(fù)方法。通過直接讀取磁盤數(shù)據(jù)或磁盤映像文件利用文件尾結(jié)構(gòu)最大長度雕復(fù)方法縮小搜索范圍再尋找XLSX文檔數(shù)據(jù)片提取每個(gè)表單部件與共享字符串表部件的內(nèi)容并對(duì)其進(jìn)行重新組織將表單部分文本內(nèi)容恢復(fù)出來。實(shí)驗(yàn)結(jié)果表明提出的方法可以有效地恢復(fù)破損或分片XLSX文檔中的文本內(nèi)容。本文對(duì)損壞或分片OOXML文檔數(shù)據(jù)塊中的文本內(nèi)容恢復(fù)技術(shù)進(jìn)行了研究提出利用該格式文檔里的關(guān)鍵部件數(shù)據(jù)重新組織文檔文本內(nèi)容來實(shí)現(xiàn)數(shù)據(jù)塊中原文檔主體文本內(nèi)容的恢復(fù)。課題的研究成果為殘缺文件數(shù)據(jù)塊的數(shù)據(jù)恢復(fù)提供了有意義的參考。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁數(shù): 61
大?。?1.09(MB)
子文件數(shù):
-
簡介:英語學(xué)術(shù)論文中被動(dòng)句的語篇功能及其漢譯學(xué)位類型學(xué)科專業(yè)學(xué)位類別作者姓名作者學(xué)號(hào)導(dǎo)師姓名及職稱實(shí)踐導(dǎo)師姓名及職稱學(xué)院名稱論文提交日期學(xué)位授予單位一一童些堂僮翻逄亟±鐘臣Q212QQ籩一周塞堇副煎握奎撻副纏重壘B國亟堂院2Q13生魚月.魚目泌直抖撞太堂學(xué)位論文原創(chuàng)性聲明本人鄭重聲明所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研究所取得的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外,本論文不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫的成果作品。對(duì)本文的研究做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本人完全意識(shí)到本聲明的法律后果由本人承擔(dān)。作者簽名瞻歪日期渺年6月中日學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)湖南科技大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。涉密論文按學(xué)校規(guī)定處理。作者簽名鐘磊鋤麟喲日期卯哆年日期M盧6月LIF日IIR9B二,
下載積分: 5 賞幣
上傳時(shí)間:2024-03-10
頁數(shù): 106
大?。?3.6(MB)
子文件數(shù):
-
簡介:隨著時(shí)代的變遷,信息技術(shù)得到了快速的發(fā)展且趨于成熟。人們對(duì)于信息的獲取途徑不再是通過報(bào)紙或者口口相傳的方式,而是基于各種媒體的方式,如電視、電腦、手機(jī)等途徑。面對(duì)信息量爆炸式增長,人們對(duì)于快速獲取有用信息的要求不斷提高。如何盡可能有效地組織和管理信息變得尤為重要。傳統(tǒng)的單一語言文本分類系統(tǒng)在處理這些信息分類的問題上已經(jīng)遠(yuǎn)遠(yuǎn)不能達(dá)到人們的要求。因此,如何實(shí)現(xiàn)海量文本信息高效準(zhǔn)確的多語言文檔分類顯得尤為重要。本文在闡述文本分類的發(fā)展歷程基礎(chǔ)上,通過比較分析貝葉斯算法、K近鄰算法和ROCCHIO算法,結(jié)合多語言特點(diǎn),設(shè)計(jì)并實(shí)現(xiàn)了基于貝葉斯算法的多語言文本分類器的系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn),并對(duì)系統(tǒng)性能進(jìn)行了簡單測試,結(jié)果表明它能實(shí)現(xiàn)分類功能。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁數(shù): 54
大?。?3.43(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁數(shù): 61
大?。?1.88(MB)
子文件數(shù):
-
簡介:目前,電子文檔已經(jīng)基本代替了原始的紙質(zhì)文檔,可是隨之而來的是許多問題電子文檔處理效率較低,電子文檔存儲(chǔ)的安全完整問題和交換過程中的安全問題等。針對(duì)上述的這些問題,我們公司設(shè)計(jì)了泛華訊文檔管理系統(tǒng)。此系統(tǒng)的特點(diǎn)是應(yīng)用集中統(tǒng)一的文檔管理和采用標(biāo)準(zhǔn)模板庫來解決電子文檔處理效率較低的問題;為了保證文檔存儲(chǔ)安全,我們要求文檔管理系統(tǒng)的客戶專門配置一臺(tái)文檔服務(wù)器,要求此服務(wù)器的磁盤陣列必須采用RAID5技術(shù)來增強(qiáng)硬盤的物理安全;建議采用本地備份加異地備份來保證一旦文檔服務(wù)器出了問題后立刻恢復(fù)數(shù)據(jù)。為了保證文檔的傳輸安全,我們應(yīng)用了IPSECVPN和SSLVPN。其中IPSECVPN用于保證異地遠(yuǎn)程備份過程中點(diǎn)對(duì)點(diǎn)在TCP/IP數(shù)據(jù)鏈路層的安全、SSLVPN用于保證本地局域網(wǎng)中數(shù)據(jù)流在TCP/IP應(yīng)用層中的安全。采用單向散列函數(shù)MD5來確保電子文檔的原始真實(shí)性;采用快速的對(duì)稱加密技術(shù)AES來加密文檔服務(wù)器上面的物理文件以保證電子文檔的實(shí)體文件不被簡單的得到;采用非對(duì)稱加密技術(shù)來保證文檔安全的共享并且實(shí)現(xiàn)文檔電子簽名。為了減少來自內(nèi)部和外部的攻擊,我們還設(shè)計(jì)了日志審計(jì)系統(tǒng)來捕獲非法的攻擊嘗試。經(jīng)過大量客戶的實(shí)際應(yīng)用,這套文檔管理系統(tǒng)確實(shí)可以極大的提高文檔處理效率,降低物理文檔丟失的風(fēng)險(xiǎn),保證電子文檔的原始真實(shí)性,保證文檔在局域網(wǎng)中傳輸?shù)陌踩院涂煽啃裕WC文檔操作的可審計(jì)性。泛華訊文檔管理系統(tǒng)還提供較新的概念虛擬文檔功能。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁數(shù): 46
大小: 1.4(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁數(shù): 73
大小: 1.38(MB)
子文件數(shù):
-
簡介:文檔圖像理解就是把紙質(zhì)介質(zhì)上的信息轉(zhuǎn)變?yōu)橛?jì)算機(jī)能夠理解和編輯的信息,以方便保存和使用。在OCR技術(shù)已經(jīng)相當(dāng)完善的今天,圖像分析已經(jīng)成為文檔圖像理解中的一個(gè)十分關(guān)鍵的問題。隨著版面復(fù)雜度的提高以及人們對(duì)于處理精度要求的提高,傳統(tǒng)的版面分析方法和技術(shù)在處理各種復(fù)雜版面時(shí)遇到了各種問題,已經(jīng)無法滿足實(shí)際應(yīng)用的需求,而單純的修修補(bǔ)補(bǔ)也無濟(jì)于事。版面的復(fù)雜性包括兩個(gè)方面;一是版面內(nèi)容造成的復(fù)雜性,二是各種干擾因素造成的復(fù)雜性。如何建立一個(gè)較為完善的系統(tǒng)并有效的解決這兩方面的問題成了研究者關(guān)注的焦點(diǎn)。本文從研究人類視覺的角度入手,在傳統(tǒng)的版面分析技術(shù)基礎(chǔ)上,以若干人工智能分析原則為指導(dǎo),建立了對(duì)于復(fù)雜版面分析的系統(tǒng)模型。本文提出的系統(tǒng)模型有以下幾個(gè)特點(diǎn)一基于完備性和正交性的系統(tǒng)設(shè)計(jì)原則保證的系統(tǒng)的可繼承性和可擴(kuò)展性,不但能夠較好實(shí)現(xiàn)對(duì)復(fù)雜結(jié)構(gòu)的理解,同時(shí)又能提升對(duì)一般版面的分析精度。二改變了傳統(tǒng)的過程式的處理流程,而代之以面向?qū)ο蟮奶幚砹鞒?,以區(qū)域分析為基礎(chǔ),保證了系統(tǒng)的可擴(kuò)展性。三改變傳統(tǒng)的以文字信息提取為中心的方式,在對(duì)整個(gè)版面框架理解的基礎(chǔ)上,完成對(duì)各個(gè)組成結(jié)構(gòu)的理解,這樣為版面理解和版面恢復(fù)提供了足夠的信息。同時(shí),本文結(jié)合實(shí)際應(yīng)用,對(duì)于幾類比較常見的復(fù)雜版面分析系統(tǒng)給出了實(shí)例分析和評(píng)測結(jié)果。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-10
頁數(shù): 56
大?。?1.86(MB)
子文件數(shù):
-
簡介:分類號(hào)TP0000學(xué)號(hào)13080021UDC400密級(jí)公開文學(xué)碩士學(xué)位論文ACPUSBASEDSTUDYOF“CHINARISE“INENGLISHACADEMICTEXTS基于基于語料庫語料庫的英語學(xué)術(shù)文本中的英語學(xué)術(shù)文本中的“中國崛起”“中國崛起”研究研究碩士生姓名張宗波學(xué)科專業(yè)外國語言文學(xué)研究方向軍事語料庫指導(dǎo)教師馬曉雷副教授國防科學(xué)技術(shù)大學(xué)研究生院國防科學(xué)技術(shù)大學(xué)研究生院二〇一五年二〇一五年十月ACPUSBASEDSTUDYOF“CHINARISE“INENGLISHACADEMICTEXTSATHESISSUBMITTEDTOTHEGRADUATESCHOOLOFNATIONALUNIVERSITYOFDEFENSETECHNOLOGYINPARTIALFULFILLMENTOFTHEREQUIREMENTSFTHEDEGREEOFMASTEROFARTSBYZHANGZONGBOUNDERTHESUPERVISIONOFASSOCIATEPROFESSMAXIAOLEINATIONALUNIVERSITYOFDEFENSETECHNOLOGYCHANGSHAHUNANOCTOBER,2015
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁數(shù): 114
大?。?2.38(MB)
子文件數(shù):
-
簡介:伴隨著計(jì)算機(jī)的不斷普及以及互聯(lián)網(wǎng)技術(shù)的蓬勃發(fā)展,電子文檔慢慢取代基于紙張的信息漸漸被人們所接受,以電子文檔的形式辦公也具有越來越明顯的優(yōu)勢。但是這也帶來了一些負(fù)面影響,由于目前大家的知識(shí)產(chǎn)權(quán)意識(shí)比較淡薄,其內(nèi)容很容易通過網(wǎng)絡(luò)被傳播。隨著電網(wǎng)基建項(xiàng)目的增多,國家電網(wǎng)公司對(duì)工程項(xiàng)目的管理也提出了較以往更高的要求。以發(fā)文為例,2012年,國家電網(wǎng)公司基建部共下發(fā)了1020個(gè)文件,其中大部分文件是關(guān)于施工質(zhì)量、安全規(guī)范化管理方面的。管理要求之多,為歷年罕見。為切實(shí)提高工程項(xiàng)目管理中管理者的管理水平,對(duì)項(xiàng)目文檔進(jìn)行記錄并定量管理,充分利用計(jì)算機(jī)科學(xué)技術(shù),實(shí)現(xiàn)項(xiàng)目管理辦公自動(dòng)化和資源共享,我們迫切需要一套完善的項(xiàng)目文檔進(jìn)程管理系統(tǒng)來支持國家電網(wǎng)基建項(xiàng)目的工作。本文從國家電網(wǎng)基建項(xiàng)目管理人員了解、監(jiān)督和控制項(xiàng)目的進(jìn)度和所做的研究工作的需求幾方面出發(fā),采用目前業(yè)界流行的MVC設(shè)計(jì)框架以及STRUTS和HIBERNATE技術(shù)相結(jié)合的方法,在ECLIPSE平臺(tái)上進(jìn)行開發(fā),數(shù)據(jù)庫采用的是SQLSERVER,在此基礎(chǔ)上實(shí)現(xiàn)了基于BS模式下的國網(wǎng)基建施工電子文檔管理系統(tǒng),具體功能有統(tǒng)計(jì)分析、郵件通知、文檔管理、項(xiàng)目方向、評(píng)論管理、日志管理、參與項(xiàng)目管理、系統(tǒng)維護(hù)等八個(gè)功能模塊。在對(duì)國網(wǎng)基建施工電子文檔管理系統(tǒng)開發(fā)的過程中,首先對(duì)項(xiàng)目的系統(tǒng)功能需求進(jìn)行了詳細(xì)的分析和描述,在設(shè)計(jì)部分描述了一個(gè)總體框架和結(jié)構(gòu)圖,對(duì)各個(gè)功能模塊、數(shù)據(jù)庫、靜動(dòng)態(tài)行為模型等進(jìn)行了比較詳細(xì)的描述和設(shè)計(jì)。然后,在系統(tǒng)實(shí)現(xiàn)部分中給出了關(guān)鍵問題和技術(shù)的實(shí)現(xiàn)依據(jù),并以文檔下載功能為例給出了具體的代碼和運(yùn)行結(jié)果圖。最后總結(jié)了本文的主要內(nèi)容以及對(duì)未來工作的展望和建議。該方案是國網(wǎng)基建施工電子文檔數(shù)據(jù)管理平臺(tái)項(xiàng)目實(shí)踐的結(jié)果,能夠切實(shí)提高系統(tǒng)的可維護(hù)性和可擴(kuò)展性。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-10
頁數(shù): 74
大?。?2.85(MB)
子文件數(shù):
-
簡介:本文對(duì)企業(yè)電子文檔管理現(xiàn)狀進(jìn)行了分析與研究,闡明了當(dāng)前電子文檔管理中面臨的各種安全問題。針對(duì)電子文檔安全管理的需求,提出了多種加強(qiáng)電子文檔管理的安全措施,并把用戶需要與安全措施結(jié)合,應(yīng)用于PDM系統(tǒng)。論文分析了當(dāng)前信息安全的發(fā)展?fàn)顩r以及信息安全研究的發(fā)展趨勢,針對(duì)企業(yè)電子文檔安全管理的需要,研究了相關(guān)的安全技術(shù),如加密技術(shù)、身份鑒別技術(shù)等。信息安全技術(shù)應(yīng)用于管理系統(tǒng),主要考慮了以下方面首先,基于明文存儲(chǔ)與傳輸?shù)挠脩鬒D密碼存在的安全問題,提出了一種加密處理的安全方式。該算法改進(jìn)了傳統(tǒng)的單值移位代換算法,使加密算法的安全性基于在多值移位K上,為增強(qiáng)PDM系統(tǒng)的安全性提供了理論基礎(chǔ);其次,針對(duì)企業(yè)電子文檔管理的實(shí)際需求,提出一種新的基于角色的訪問控制模型。該模型擴(kuò)展了RBAC模型,引入了文檔操作集DOS概念,并通過對(duì)相關(guān)文檔的封裝處理,簡化了電子文檔的權(quán)限管理;再次,針對(duì)電子文檔在網(wǎng)絡(luò)傳輸中存在的安全問題,在文檔管理中采用了加密技術(shù)、鑒別技術(shù)以及電子文檔流動(dòng)的過程追蹤技術(shù)。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁數(shù): 49
大小: 1.21(MB)
子文件數(shù):
-
簡介:不同的形式化方法不僅在學(xué)術(shù)研究中得到支持與倡導(dǎo),而且目前已經(jīng)廣泛應(yīng)用到實(shí)際工業(yè)項(xiàng)目的各個(gè)方面。由于計(jì)算機(jī)系統(tǒng)越來越復(fù)雜,可能在一個(gè)系統(tǒng)中需要用到多種形式化方法,因此十分有必要將不同的形式化方法進(jìn)行集成,這對(duì)于建立正確而嚴(yán)密的系統(tǒng)很有幫助。所有的形式化方法都是基于數(shù)學(xué)符號(hào)和知識(shí)之上,OMDOC開放數(shù)學(xué)文檔作為一種XML應(yīng)用,提出了一種針對(duì)數(shù)學(xué)注釋與概念的內(nèi)容標(biāo)記模式,為建立一種作為基于不同形式化方法的系統(tǒng)之間的交互的內(nèi)容語言提供了可能的基礎(chǔ)。本文首先對(duì)形式化語言交換格式OPENMATH和它的擴(kuò)展OMDOC的有效性進(jìn)行了系統(tǒng)的研究,并在此基礎(chǔ)上針對(duì)目前點(diǎn)對(duì)點(diǎn)翻譯的不足,提出了一種新的基于中間格式的集成方法,即以O(shè)MDOC作為中間語言,將SPARK驗(yàn)證語言FDL翻譯為PVS,從而自動(dòng)地實(shí)現(xiàn)了兩個(gè)著名的驗(yàn)證系統(tǒng)SPARK和PVS之間的集成。并且作為中間文檔,產(chǎn)生的OMDOC格式能夠轉(zhuǎn)換為其它的形式化語言從而將其它形式化方法進(jìn)行集成。由于OMDOC格式的數(shù)學(xué)理論具有一致的XML樹型結(jié)構(gòu),對(duì)于各種可以與OMDOC文檔進(jìn)行交互的系統(tǒng)而言,為其理論的修改和重用提供了可能。最后設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)簡單的翻譯器進(jìn)行仿真實(shí)驗(yàn),正確地實(shí)現(xiàn)了FDL與PVS之間的單步和自動(dòng)轉(zhuǎn)換。論文的主要?jiǎng)?chuàng)新點(diǎn)1在語義層上,基于OPENMATH和OMDOC機(jī)制,提出一種以O(shè)MDOC為中間語言,進(jìn)行SPARKFDL和PVS語言之間的轉(zhuǎn)換,從而進(jìn)一步實(shí)現(xiàn)兩種驗(yàn)證系統(tǒng)的集成方案。對(duì)于N個(gè)系統(tǒng)之間的集成而言,傳統(tǒng)的點(diǎn)對(duì)點(diǎn)轉(zhuǎn)換需要進(jìn)行N2次轉(zhuǎn)換,而這種基于OMDOC的轉(zhuǎn)換方法則只需要2N次,降低了翻譯過程中復(fù)雜度。2為了保證集成的完整性和有效性,自主研究并定義了私有字典,提供多個(gè)自定義標(biāo)記模式,實(shí)現(xiàn)SPARKFDL語法與OMDOC格式的轉(zhuǎn)換,從而生成包含標(biāo)準(zhǔn)字典和私有字典的OMDOC文檔,并通過一個(gè)經(jīng)過修改的接口,將該文檔定制為特定的、面向PVS的OMDOC文檔,最后基于XSLT樣式表來實(shí)現(xiàn)與PVS的語法轉(zhuǎn)換。3針對(duì)FDL中的聲明、規(guī)則以及驗(yàn)證條件,分別定義常量、變量、類型聲明轉(zhuǎn)換規(guī)則將所有的FDL聲明都轉(zhuǎn)換為SYMBOL和DEFINITION元素片段;定義規(guī)則聲明轉(zhuǎn)換,將所有規(guī)則都變?yōu)锳XIOM元素片段;驗(yàn)證條件表達(dá)式轉(zhuǎn)換規(guī)則,將所有的驗(yàn)證條件轉(zhuǎn)為ASSERTION元素片段。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁數(shù): 69
大?。?2.72(MB)
子文件數(shù):
-
簡介:文檔格式的多樣化給文檔閱讀軟件帶來了挑戰(zhàn),特別是隨著各類便攜式電子閱讀器在市場上的競爭發(fā)展,與之相對(duì)應(yīng)的電子文檔格式也是互相對(duì)立,互不相容。針對(duì)這一問題,本文在嵌入式閱讀設(shè)備的基礎(chǔ)上,研究并開發(fā)了一種能夠兼容多種電子文檔格式的閱讀系統(tǒng),同時(shí)借鑒傳統(tǒng)的紙筆式閱讀標(biāo)注方式,提供了對(duì)多種文檔標(biāo)注的功能。系統(tǒng)包括了多格式文檔展示與多格式文檔標(biāo)注兩種關(guān)鍵技術(shù)。展示技術(shù)主要研究并實(shí)現(xiàn)了如何兼容打開多格式文檔,支持動(dòng)態(tài)添加對(duì)新格式文檔的解析,并在此基礎(chǔ)上,采用緩存、動(dòng)態(tài)更新等方式來快速展示文檔頁面。標(biāo)注技術(shù)主要研究調(diào)查了文檔標(biāo)注的分類,在此基礎(chǔ)上,實(shí)現(xiàn)了各類標(biāo)注及擦除標(biāo)注的功能,并在存儲(chǔ)層面上,使用文檔容器將原始文檔和標(biāo)注數(shù)據(jù)融合為一體進(jìn)行保存。系統(tǒng)在用戶交互層面和數(shù)據(jù)存儲(chǔ)層面將兩種技術(shù)進(jìn)行結(jié)合,在實(shí)現(xiàn)層面進(jìn)行分離,不僅實(shí)現(xiàn)了多格式文檔的展示和標(biāo)注功能,而且在操作上更為友好方便。最后還對(duì)系統(tǒng)在閱讀文檔過程中的各類操作性能進(jìn)行了測試,測試結(jié)果表明該系統(tǒng)達(dá)到了應(yīng)用的標(biāo)準(zhǔn)。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁數(shù): 67
大?。?2.61(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁數(shù): 69
大小: 1.78(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時(shí)間:2024-03-10
頁數(shù): 60
大?。?3.37(MB)
子文件數(shù):
-
簡介:隨著全球信息技術(shù)的飛速發(fā)展,文檔數(shù)量急劇增加,人們的查詢需求日益多樣化,傳統(tǒng)的文檔檢索系統(tǒng)已經(jīng)不能滿足用戶需求,因此文檔檢索的研究具有重要的研究意義和廣泛的應(yīng)用價(jià)值。全球的語言種類繁多,在用戶沒有明確的檢索線索的情況下,如何進(jìn)行有效的檢索就成為了信息檢索面臨的嶄新的研究課題。本學(xué)位論文將圖像檢索技術(shù)運(yùn)用于文檔檢索系統(tǒng)中,提出了一種針對(duì)圖像內(nèi)容的文檔檢索方法。首先,提出了版面分析過程中的圖像分割方法。舍棄版面分析提取的文字部分,基于游程熵的顯著差異來分割出文檔中的圖片。該方法先計(jì)算文檔圖像每行的游程熵,然后利用圖片與文字之間游程熵的差異,使圖片區(qū)域與高游程熵對(duì)應(yīng),有效地提取出了文檔中的圖片。提出基于多特征圖像檢索算法,通過數(shù)字圖像的位平面信息,選取重要位平面并計(jì)算直方圖作為第一特征;然后計(jì)算位平面的局部顏色密度,并計(jì)算局部的顏色密度熵作為第二特征;最后計(jì)算位平面的全局平滑度作為第三個(gè)特征,并結(jié)合三種特征進(jìn)行基于圖像內(nèi)容的檢索。最后,結(jié)合版面分析分割出的圖片,把每一幅圖像的來源記錄在關(guān)聯(lián)數(shù)據(jù)庫中,并計(jì)算圖片的三種特征,構(gòu)造特征庫,最終通過圖像檢索結(jié)果來判斷圖像的出處并輸出檢索的文檔結(jié)果。實(shí)驗(yàn)結(jié)果表明,本文提出的圖文分割與圖像檢索方法可靠而有效,精確度與穩(wěn)定性滿足實(shí)用需求。另外,本文將位平面作為主要特征源,對(duì)抗噪聲的攻擊能力很強(qiáng),運(yùn)算速度快,適用于實(shí)用文檔檢索,而且為圖像語義特征的研究進(jìn)行了有益的探索。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁數(shù): 57
大?。?2.64(MB)
子文件數(shù):