眾賞文庫
全部分類
  • 抗擊疫情 >
    抗擊疫情
    病毒認知 防護手冊 復工復產 應急預案 防控方案 英雄事跡 院務工作
  • 成品畢設 >
    成品畢設
    外文翻譯 畢業(yè)設計 畢業(yè)論文 開題報告 文獻綜述 任務書 課程設計 相關資料 大學生活 期刊論文 實習報告
  • 項目策劃 >
    項目策劃
    土地準備 規(guī)劃設計 開工開盤 項目綜合 竣工移交 售后移交 智慧方案 安全專項 環(huán)境影響評估報告 可行性研究報告 項目建議書 商業(yè)計劃書 危害評估防治 招投標文件
  • 專業(yè)資料 >
    專業(yè)資料
    人文法律 環(huán)境安全 食品科學 基礎建設 能源化工 農林牧畜 綜合待分類 教育經驗 行政人力 企業(yè)管理 醫(yī)學衛(wèi)生 IT技術 土木建筑 考研專題 財會稅務 公路隧道 紡織服裝
  • 共享辦公 >
    共享辦公
    總結匯報 調研報告 工作計劃 述職報告 講話發(fā)言 心得體會 思想匯報 事務文書 合同協(xié)議 活動策劃 代理加盟 技術服務 求職簡歷 辦公軟件 ppt模板 表格模板 融資協(xié)議 發(fā)言演講 黨團工作 民主生活
  • 學術文檔 >
    學術文檔
    自然科學 生物科學 天文科學 醫(yī)學衛(wèi)生 工業(yè)技術 航空、航天 環(huán)境科學、安全科學 軍事 政學 文化、科學、教育、 交通運輸 經濟 語言、文字 文學 農業(yè)科學 社會科學總論 藝術 歷史、地理 哲學 數(shù)理科學和化學 綜合性圖書 哲學宗教
  • 經營營銷 >
    經營營銷
    綜合文檔 經濟財稅 人力資源 運營管理 企業(yè)管理 內控風控 地產策劃
  • 教學課件 >
    教學課件
    幼兒教育 小學教育 初中教育 高中教育 職業(yè)教育 成人教育 高等教育 考研資源 試題真題 作業(yè)習題 課后答案 綜合教學
  • 土木建筑 >
    土木建筑
    專項施工 應急預案 建筑規(guī)范 工藝方案 技術交底 施工表格 圖片圖集
  • 課程導學 >
    課程導學
    醫(yī)學綜合 中醫(yī)養(yǎng)生 醫(yī)學研究 身心發(fā)展 醫(yī)學試題 影像醫(yī)學 醫(yī)院辦公 外科醫(yī)學 老年醫(yī)學 內科醫(yī)學 婦產科 神經科 醫(yī)學課件 眼鼻喉科 皮膚病科 腫瘤科 兒科醫(yī)學 康復醫(yī)學 全科醫(yī)學 護理學科 針灸學科 重癥學科 病毒學科 獸醫(yī) 藥學
    • 簡介:網絡的飛速發(fā)展使得對高質量的WEB文本信息檢索的需求變得空前的迫切。而要提高檢索系統(tǒng)的性能,除了改進和提高檢索方法的性能,還必須加強對主題相關信息的收集和加工,以獲得有效的檢索資源。本文對面向用戶興趣文檔的主題相關信息的智能檢索進行了研究,其宗旨是進一步提高WEB信息檢索的服務質量,主要內容包括事件相關文檔的檢索和事件重要信息的抽取與集成。取得了以下一些研究成果第一、提出了一種自動獲取事件框架的方法。首先,建立災難性事件的統(tǒng)一框架;然后在統(tǒng)一框架的基礎上使用BOOTSTRAPPING方法獲取關鍵詞;最后通過對相關句子進行聚類得到最終的框架知識結構。將框架應用到與主題相關檢索有效地降低其他事件的干擾,使事件相關文檔的檢索性能明顯提高。第二、實現(xiàn)了一個事件關鍵信息的抽取與集成系統(tǒng),本系統(tǒng)具有如下特色(1)在進行事件抽取時,首先利用句型模板構造抽取規(guī)則,然后直接從經過基本短語識別、時間短語和空間短語識別和規(guī)范化處理的文本中抽取事件信息,從而跳過了深層句法分析,降低了實現(xiàn)系統(tǒng)的難度;(2)利用框架間的相似性,提高資源重用度。(3)利用事件的規(guī)范化的時空信息關聯(lián)不同文檔中的同一事件,實現(xiàn)了事件合并,并提出按時間流順序的線索性文件抽取的輸出方式。第三,系統(tǒng)地分析了中文機構名的特點與命名實體識別在機構名識別上的諸多難點,提出統(tǒng)計和規(guī)則相結合的中文機構名識別法。即采用統(tǒng)計的方法在訓練語料庫中獲取機構名知識庫,然后根據機構名特點設計了機構名識別的規(guī)則。在統(tǒng)計與規(guī)則的結合下獲得了較好的機構名識別效果。第四,本文集成了災難性事件信息檢索和信息抽取系統(tǒng)。將信息檢索與信息抽取結合起來為用戶提供更精確、更容易閱讀的信息服務。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 78
      11人已閱讀
      ( 4 星級)
    • 下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 74
      22人已閱讀
      ( 4 星級)
    • 簡介:掃描文檔圖像已經成為電子政務中辦公文檔、數(shù)字圖書館中圖書資料等媒體信息的主要表現(xiàn)形式,如何對其進行高比率壓縮已成一個迫切需要研究的問題。本文作者提出了掃描文檔圖像處理與壓縮的總體流程并設計了掃描文檔圖像壓縮和解壓縮的系統(tǒng),重點對其關鍵技術及其壓縮處理系統(tǒng)進行了研究。其主要工作包括如下首先,對掃描文檔圖像其本身特征進行了研究與分析,指出了掃描文檔圖像壓縮處理系統(tǒng)應具備的功能特性。在圖像壓縮之前對圖像進行一系列預處理,能夠獲得更好的圖像視覺效果。預處理方法主要包括有背景去噪和文字增強等。第二,提出了一種基于興趣域的掃描文檔圖像的壓縮與處理方法,在壓縮之前先對圖像進行分割,將一幅圖像分成兩個層文本層和插圖層。把分割出來的文本層作為興趣域,插圖層則相應的為非興趣域,然后針對掃描文檔圖像本身的特性對各層進行壓縮與解壓縮,以求達到比通用圖像壓縮算法更高的壓縮比。第三,分別對文本層和插圖層進行壓縮,壓縮采用的方法依次為亞抽樣、小波變換、零樹編碼和算術熵編碼;解壓縮過程為算術熵解碼、零樹解碼、小波逆變換和圖像平滑。第四,壓縮數(shù)據傳輸時采用了一種特殊的漸進傳輸方法,根據用戶需要分兩次傳輸,可有效的降低對傳輸帶寬的要求。第五,相應于壓縮方案,對解壓獲得的重建圖像進行后處理,主要包括圖像平滑放大和圖像效果增強。最后,開發(fā)了實現(xiàn)上述內容的軟件,做到了理論與實踐相結合。本文研究的思想、方法和實現(xiàn)技術絕大多數(shù)都可以在數(shù)字圖書館和基于網絡的電子政務中直接應用。該論文的主要創(chuàng)新點有兩個一個是在圖像壓縮之前采用了圖像分割的方法,有利于更好的針對圖像的自身特點對之進行有效的壓縮;另一個是采用了一種結合興趣域和漸進傳輸?shù)膾呙栉臋n圖像的壓縮和傳輸方法,使得圖像的壓縮比和傳輸性能達到最好的平衡。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 52
      4人已閱讀
      ( 4 星級)
    • 簡介:隨著網絡技術的飛速發(fā)展,信息大量膨脹和聚集,XMLEXTENSIBLEMARKUPLANGUAGE作為一種常用的數(shù)據交換和傳輸標準,蘊含了豐富的信息。因此,對XML,文檔的挖掘已經成為WEB挖掘一個新的研究熱點。本文重點對XML文檔分類方法進行了研究。XML文檔的結構特征是XML文檔分類區(qū)別于文本分類的一個重要方面,這使很多成熟的文本分類算法無法應用到XML文檔分類中。因此,本文重點對XML文檔的結構特征進行了研究。首先,給出一種頻率。路徑模型來表示XML文檔的結構,該模型中不但保存了節(jié)點的標簽信息,同時統(tǒng)計了相同路徑出現(xiàn)的頻率,使得在保證不丟失有效信息的前提下大大減小了原來路徑模型的規(guī)模。其次,在頻率路徑模型的基礎上,給出一種帶位置權重的基于路徑的XML文檔結構相似度計算方法WLCSWEIGHTEDLONGESTCOMMONSUBSEQUENCE。該方法在路徑匹配時,使用最長公共子序列方法,能夠捕捉到現(xiàn)有路徑匹配方法漏掉的有效信息;在進行路徑相似度計算時,引入位置權重向量,將路徑節(jié)點的位置信息考慮在內。通過在真實數(shù)據集上做實驗表明WLCS方法召回率和準確率均高于當前存在的基于路徑計算相似度的方法。再次,基于頻率路徑模型給出一種新的XML文檔結構向量化方法。該方法使用一種基于路徑頻率的信息增益方法選擇特征路徑,使用WLCS方法中的路徑相似度計算方法生成特征路徑向量,并通過實驗說明該方法的有效性。最后,在本文研究基礎上,結合大連市公安局“全文搜索系統(tǒng)”的實際課題,給出XML文檔分類的一個具體應用。
      下載積分: 5 賞幣
      上傳時間:2024-03-11
      頁數(shù): 60
      5人已閱讀
      ( 4 星級)
    • 簡介:隨著社會信息化進程的不斷深入,辦公軟件已經成為人們日常辦公不可缺少的基礎軟件之一。但自上世紀以來,各個辦公軟件廠商大多采用封閉專有的文檔格式,這些標準不開放,存在安全隱患,已經無法滿足文檔組合、內容提取、數(shù)據挖掘等新的工作環(huán)境的挑戰(zhàn)和新的應用程序的需求。近幾年來,隨著XML技術的不斷成熟,新的基于XML的開放的文檔格式標準成為國際文檔格式的發(fā)展主流,不僅為用戶沖破法律上或者技術上的貿易壁壘提供保證,而且為簡單快捷的實現(xiàn)文件和數(shù)據管理、數(shù)據恢復、數(shù)據挖掘以及與企業(yè)業(yè)務系統(tǒng)的數(shù)據交換提供了可能。本文從理論和應用兩個角度出發(fā),以滿足這些新的需求和挑戰(zhàn)為目標,在對基于XML的開放文檔格式深入研究的基礎上,為實現(xiàn)應用程序與基于XML的開放文檔格式的互操作建立一種低成本、高效率的解決方案。重點對當前世界上三種主流的基于XML的開放文檔格式之一,中文辦公軟件文檔格式開發(fā)工具包的實現(xiàn)及實際應用進行了研究。在綜合分析研究了基于XML的開放文檔格式的國內外研究現(xiàn)狀和趨勢的基礎上,深入研究了UOF標準文檔格式定義,分析了UOF文檔格式的特點;將以上分析研究作為理論前提,提出了適合于基于XML的開放文檔格式的SCHEMA模式定義處理模型;并將其應用于對UOFSCHEMA的處理,最終在JAVA平臺上實現(xiàn)了符合UOF標準的應用開放工具包UOFAPI,包括文字處理存取模塊、電子表格存取模塊、演示文稿存取模塊、格式與內容分離模塊和壓縮打包模塊。UOFAPI使那些即使不懂UOF格式的程序員也能夠簡單方便的操作UOF格式文檔,實現(xiàn)了企業(yè)業(yè)務系統(tǒng)與UOF格式文檔信息的集成。在應用方面,本研究根據山東省研究生學位與研究生教育管理系統(tǒng)山東省研究生教育創(chuàng)新計劃重大項目,編號2006G01的具體需求,在對UOFAPI研究和改進的基礎上,設計并實現(xiàn)了一個基于開放文檔格式UOF的通用數(shù)據遷移系統(tǒng)。數(shù)據遷移模塊主要實現(xiàn)研究生系統(tǒng)業(yè)務數(shù)據的遷移,主要包括數(shù)據導入和導出,遷移過程采用JAVA反射技術實現(xiàn),以達到系統(tǒng)的通用性?;赨OF格式的數(shù)據遷移系統(tǒng)采用CS架構,具體的業(yè)務實現(xiàn)方法在SERVER端上實現(xiàn),CLIENT端只提供導入導出的圖形化界面,向SERVER傳遞導入導出命令來實現(xiàn)數(shù)據遷移。基于UOFAPI的數(shù)據遷移系統(tǒng)在研究生管理系統(tǒng)中的實際應用驗證了本文所提出的理論的可行性和UOFAPI的實用性。證明了UOFAPI在實現(xiàn)文檔資源與應用程序的互操作方面的優(yōu)越性能,UOFAPI對提高應用程序直接創(chuàng)建和操作UOF格式文檔的效率,具有十分重要的理論意義和應用價值。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 74
      9人已閱讀
      ( 4 星級)
    • 簡介:目前,伴隨著數(shù)據庫技術、數(shù)據挖掘技術、數(shù)據倉庫技術等的成熟和廣泛應用,結構化文檔管理問題已經基本得到解決;信息技術的廣泛應用帶來非結構化文檔激增,但對其應用效率低下,而新興管理思想的涌現(xiàn)以及全球化競爭的日益加劇迫切要求對組織中的非結構化文檔資源進行有效的管理。非結構化文檔管理正日益成為互聯(lián)網時代信息資源管理的一個關鍵問題。本文將語義WEB技術及標準引入非結構化文檔的分析、標記和應用過程,以形成一套有效的非結構化文檔管理方法,滿足企業(yè)應用的迫切需求。本文首先系統(tǒng)介紹了語義WEB的相關理論,其中重點是語義WEB的三大關鍵技術XML、RDF及本體。之后圍繞非結構化文檔管理生命周期的全過程獲取、標記、組織存儲及應用,分析了每個環(huán)節(jié)目前還存在的問題。之后引入語義WEB技術進行分析和解決,重點解決了1)文檔標記中涉及到的標記語言(外表特征和內容特征兩方面)、標記過程及標記工具,并最終形成完整的結構化的標記描述,以利于計算機進行理解和自動處理;2)組織方法采用基于本體的組織方法代替?zhèn)鹘y(tǒng)線性組織方法,以滿足分布式的網絡信息組織的需要,同時存儲方式采取監(jiān)督機制來協(xié)同源文檔和標記文檔之間的同步關系,以確保兩者同時更改和刪除;3)最后具體的應用則從信息檢索、自動分類、智能推理三個方向來分析信息檢索時利用本體進行查詢擴展,并根據語義相似度進行檢索排序;自動分類則以領域本體作為分類樹,以形成動態(tài)統(tǒng)一的分類標準;智能推理方面則利用本體和描述邏輯來實現(xiàn)計算機理解的、規(guī)范化的描述,并利用描述邏輯的推理功能進行智能推理。最后,在完成前面分析和解決問題的基礎上,形成了完整的非結構化文檔管理框架,詳細描述非結構化文檔管理生命周期的全過程,并設計了一個企業(yè)郵件管理原型系統(tǒng),以驗證研究的可行性和正確性。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 85
      17人已閱讀
      ( 4 星級)
    • 簡介:B2C電子商務的迅猛發(fā)展,也暴露出一些問題,例如由于信息的膨脹,客戶在從電子商務網站的搜索引擎或者其他專業(yè)的搜索引擎中搜索到需要的信息非常困難??蛻趔w驗程度的降低肯定也會影響B(tài)2C電子商務的發(fā)展。作為WEB挖掘重要手段的WEB文檔聚類方法,能夠較好的解決這一問題。本文主要是將WEB文檔聚類方法應用于B2C電子商務中的途徑進行了嘗試,給出了一個精簡型的WEB文檔聚類系統(tǒng)實現(xiàn)框架,并對核心功能進行了程序實現(xiàn)。全文分以下三個部分討論首先,對B2C電子商務中WEB挖掘的需求,提出了基于WEB文檔聚類的頁面推薦和商品推薦兩個應用結合點。其中頁面推薦又可基于提供方的不同分為電子商務站點搜索引擎應用和公用搜索引擎應用。然后,在分析兩種WEB挖掘系統(tǒng)實現(xiàn)框架的基礎上,提出了一個精簡后的WEB文檔聚類系統(tǒng)實現(xiàn)框架,及其處理步驟。最后,分析了WEB文檔聚類系統(tǒng)具體實現(xiàn)過程中的三大關鍵技術WEB文檔的獲取,文本的表示和文本的聚類運算。WEB文檔的獲取使用了元搜索引擎技術和自定義網絡蜘蛛技術。文本的表示使用了向量空間模型(VSM),在分析了VSM的優(yōu)點和不足以后,給出了其實施方法。文本的聚類使用了層次聚類的方法,其他基于矩陣的聚類方法的也可以很好的融合到系統(tǒng)中。討論了三大關鍵技術以后,給出了一個實驗設計及其結果分析。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 65
      8人已閱讀
      ( 4 星級)
    • 簡介:企業(yè)電子文檔屬于企業(yè)的重要資源,是企業(yè)核心競爭力的具體表現(xiàn)形式。其主要包括企業(yè)的合同,項目文檔以及待發(fā)專利等。在激烈的知識競爭中,由于核心電子文檔的泄露,導致企業(yè)的經濟損失以及名譽損失,甚至關系企業(yè)的生死存亡,因此企業(yè)對電子文檔安全防護和管理的重視程度也越來越高。本文就企業(yè)如何防止核心電子文檔泄露進行了研究,并指出其中比較容易被忽略的一環(huán)企業(yè)電子文檔形成過程之中產生的過程文檔。這些不同版本文檔廣泛存在于參與該文檔編寫、整合、審核、修改、提交等操作過程的員工電腦上,涉及到的員工數(shù)量眾多,極易產生泄密隱患,也是現(xiàn)有企業(yè)文檔管理系統(tǒng)所忽略的問題。針對上述過程文檔的檢測問題,本文研究實現(xiàn)了一個企業(yè)電子文檔相似度快速檢測系統(tǒng)。該系統(tǒng)以COPS系統(tǒng)模型為藍本,采用文本塊分級匹配的思想,選取不同粒度文本塊的數(shù)字指紋進行文檔相似度檢測。利用企業(yè)提供的核心文檔的預處理建立涉密文檔樣本庫,而后通對相似度檢測,將涉密過程文檔從員工電腦內海量存儲的電子文檔中檢測出來,提交給企業(yè)文檔管理系統(tǒng)進行妥善處理,以達到縮小企業(yè)涉密電子文檔分布范圍的目的,進而提高企業(yè)核心文檔的安全性。實驗結果和企業(yè)反饋信息表明該系統(tǒng)具有較高的檢測速度和準確率。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 54
      5人已閱讀
      ( 4 星級)
    • 簡介:互聯(lián)網的蓬勃發(fā)展帶動了信息檢索技術的不斷成熟,搜索引擎已經成為每個人都離不開的重要工具,人性化服務的時代背景也要求信息檢索技術向智能化發(fā)展。傳統(tǒng)的基于關鍵詞機械匹配的信息檢索方式已經不能滿足科學研究和普通用戶的需求,因此基于語義的信息檢索成為當前信息檢索研究的熱點,通過自然語言語句進行信息檢索已經成為發(fā)展的趨勢。面對自然語言查詢語句,目前的檢索系統(tǒng)往往不能夠精確的理解用戶的查詢請求同時,在檢索的過程中,現(xiàn)有的技術往往將文檔中的語義信息丟棄。在對現(xiàn)有的信息檢索模型的分析研究下,我們發(fā)現(xiàn)單純的查詢語句處理和主題模型檢索并不能滿足用戶對檢索結果準確率越來越高的要求。分析現(xiàn)有的技術和研究成果,本文提出了一種基于雙層語義分析的文檔排序方法,分別通過查詢語句層次語義分析和文檔篇章層次語義分析,獲取信息檢索過程中所需的語義信息,從而提升搜索引擎性能。同時給出了基于雙層語義分析的全文檢索系統(tǒng)框架,該系統(tǒng)能夠在查詢語句層次上,對查詢語句進行語義處理和復述在文檔篇章層次上,通過提取文檔中的潛在主題語義信息,用于優(yōu)化檢索結果。該方法通過結合查詢語句層次的語義信息和篇章層次語義信息,在向量空間模型的基礎上給出了基于雙層語義分析的文檔打分公式。根據提出的基于雙層語義分析的全文檢索系統(tǒng)框架,設計并實現(xiàn)了原型系統(tǒng),并解決在系統(tǒng)實現(xiàn)的中的問題。通過對系統(tǒng)的實驗結果進行分析,驗證了這種基于雙層語義分析的全文檢索方法的有效性。
      下載積分: 5 賞幣
      上傳時間:2024-03-11
      頁數(shù): 53
      5人已閱讀
      ( 4 星級)
    • 簡介:自然語言中普遍存在著同義詞和多義詞現(xiàn)象,致使人們很難通過以詞形匹配的關鍵詞檢索尋找到真正需要的網絡資源。潛在語義索引通過奇異值分解將同義詞映射到潛在語義空間的同一維度上,同時將多義詞映射到不同的維度上,進而在一定程度上解決了一詞多義和多詞一義的現(xiàn)象。潛在語義索引與其它基于概念詞典的方法相比,具有可計算性強,領域適應能力強的優(yōu)點,并已成為了自然語言處理領域中的研究熱點。本文的研究工作是通過強化合理的特征共現(xiàn)信息來提高潛在語義空間中特征向量和文檔向量的準確度,進而提高系統(tǒng)的性能。基于以上的想法,本文提出了基于偽文檔的潛在語義索引的優(yōu)化框架,所謂偽文檔即是通過對原始文檔集合進行有指導地組織而形成的新的文檔。同時,本文在基于偽文檔的優(yōu)化框架的基礎上提出了兩種優(yōu)化策略基于語義塊的優(yōu)化方法及基于語義資源的優(yōu)化方法。針對潛在語義索引以文檔窗口為傳遞窗口造成的特征相關度不準確的問題,本文提出了基于語義塊的優(yōu)化方法。該方法是通過對原始文檔集合有指導地分割,將語義相近的特征劃分到同一個語義塊單元中,從而加強了語義相關特征的相關性,最終優(yōu)化了潛在語義空間中的代表特征和文檔的向量。同時,在應用潛在語義索引的過程中,生成潛在語義空間的整個過程是完全無指導的,使得語義空間中的表達特征和文檔的向量不夠準確。基于語義資源的優(yōu)化方法通過將人的先驗知識融入到原始的文檔集合中,有指導地強化了同義特征之間的相關度,最終使得潛在語義空間中表達特征和文檔的向量更加準確。最終,本文開發(fā)了“基于潛在語義索引的專利檢索系統(tǒng)”作為實驗系統(tǒng),針對本文提出的方法以可視化的形式展示了實驗效果。
      下載積分: 5 賞幣
      上傳時間:2024-03-11
      頁數(shù): 56
      4人已閱讀
      ( 4 星級)
    • 簡介:隨著互聯(lián)網和搜索引擎技術的發(fā)展普及,人們對于如何在龐大的互聯(lián)網上高效地獲得有價值的信息日益關注。文檔自動摘要技術作為人們挑戰(zhàn)信息爆炸式增長與信息有效利用之間矛盾的重要武器,受到世界的廣泛認可。目前國際上許多學校和企業(yè)都在進行文檔自動摘要技術的研究,并取得一定成績,也產生了各種各樣的自動摘要應用系統(tǒng)。但在我國,文檔自動摘要技術發(fā)展歷史比較短。我國文本摘要技術的發(fā)展研究還處于初級階段。國內主要研究基于統(tǒng)計的方法,例如向量空間模型的摘要系統(tǒng)VECTSPACEMODEL。而基于語義的研究較少,一是由于語義對于語言學的研究要求較高,還有各種語料庫的建立,語義詞典的開發(fā)相對國外比較落后,因此本文對于語義方面做單文檔摘要進行研究。單文檔自動摘要的目標是在原始的文本中通過摘取,提煉主要信息,提供一篇簡潔全面的摘要。已有的方法大都是通過統(tǒng)計和機器學習的技術從文本中直接提取出句子。本文主要研究基于語義的單文檔自動摘要。首先研究了基于語義的詞語相似度計算和句子相似度計算。在此基礎上,提出了改進型KMEDOIDS摘要系統(tǒng)和對稱非負矩陣分解的摘要系統(tǒng)。通過兩個系統(tǒng)與以往的系統(tǒng)進行試驗比對,該方法提高了單文檔摘要的質量。這說明基于語義的摘要方法有一定的效果,值得今后進一步地研究。
      下載積分: 5 賞幣
      上傳時間:2024-03-09
      頁數(shù): 71
      12人已閱讀
      ( 4 星級)
    • 簡介:隨著計算機與網絡的普及應用,數(shù)據信息安全問題成為了人們關注的重點。而移動存儲介質是傳遞信息數(shù)據的重要平臺,主要包括U盤、移動硬盤等。其能給信息交換和傳遞帶來極大的便捷,但是與此同時也帶來了巨大的安全隱患。當前數(shù)據信息安全問題不單只來自于外界的攻擊,還存在部分來自于內部的泄密,因此為了防止U盤數(shù)據泄露,設計實現(xiàn)針對U盤的文檔保護系統(tǒng)十分有必要。本文所設計實現(xiàn)的就是一種基于WINDOWS平臺的U盤文檔保護系統(tǒng)。本文首先從相關技術分析入手,為本文所研究設計的系統(tǒng)提供了技術支持。文章論述了基于WINDOWS平臺的U盤文檔保護系統(tǒng)的功能需求,包括U盤監(jiān)控服務以及文檔透明管理。然后,文章就U盤文檔保護系統(tǒng)系統(tǒng)設計展開了論述。使用USB設備監(jiān)控技術和文檔保護過濾技術實現(xiàn)了U盤監(jiān)控服務和文檔透明加解密服務。文章最后對U盤文檔保護系統(tǒng)進行了功能測試和性能測試。主要測試了系統(tǒng)的U盤實時動態(tài)監(jiān)控功能和文檔透明加解密功能。文章還總結出系統(tǒng)的優(yōu)勢與不足,并且對日后研究的重點與方向進行展望。該系統(tǒng)的優(yōu)勢在于對文檔進行加解密的是通過透明加解密的方式。透明加解密技術主要由用戶模式的用戶控制程序與內核模式的文件過濾驅動組成。其主要實現(xiàn)的功能為接受用戶控制模式的命令,根據加密的規(guī)則對相應的文件進行透明加解密處理。用戶在使用過程中無法得知保護文件經過了加解密處理。本系統(tǒng)在一定程度上實現(xiàn)了U盤文檔的安全保護管理,保證了文檔的保密性與安全性。
      下載積分: 5 賞幣
      上傳時間:2024-03-09
      頁數(shù): 81
      10人已閱讀
      ( 4 星級)
    • 簡介:二值文檔圖像作為二值圖像與文檔圖像的交集,是二值圖像的主體,在傳真、電子政務、數(shù)字圖書館建設和網上閱卷等領域中都有廣泛的應用,而且灰度文檔圖像也可以通過位平面分解的方法轉化為二值文檔圖像,面對圖像數(shù)據量巨大的特點,對二值文檔圖像壓縮進行研究,不僅可以減少圖像存儲空間以及由此產生的成本,同時可以降低系統(tǒng)的訪問、處理以及傳輸帶寬負擔,因此有必要對二值文檔圖像壓縮進行研究。本文主要研究成果主要包括以下兩個方面1對版面分析進行了深入研究,并對其中的關鍵技術進行了創(chuàng)新。版面分析是二值文檔圖像壓縮中非常重要的一個步驟,通過對文檔圖像中各區(qū)域進行分類,可以有效提高文檔圖像的壓縮比。本文對版面分析中的關鍵技術進行了研究創(chuàng)新,并進行了MATLAB仿真驗證,包括對常用的二值化方法OTSU結合局部閾值思想提出了一種新的方法MOTSU方法;針對HOUGH變換中難以同時兼顧精確度和速度的問題,提出了一種新的傾斜角度檢測方法,該方法可以有效提高傾斜角度檢測的速度與精度;并采用數(shù)學形態(tài)學方法對去噪和版面分解進行了研究及實現(xiàn)。2對熵編碼進行了改進,并實現(xiàn)了二值文檔圖像的變換編碼,將變換編碼思想成功引入二值文檔圖像壓縮中。本文對熵編碼方法進行了改進,提出了一種基于分層策略的熵編碼方法,即首先通過收縮原始圖像獲取縮略圖,以及與縮略圖中前景像素相應的組合圖像,然后再進行熵編碼處理,通過這種方法可以減少文檔圖像中的游程種類數(shù)目。本文的另一項創(chuàng)新是實現(xiàn)了二值文檔圖像的變換編碼,首先本文利用二值小波變換給出了一種簡單的濾波器設計方法,并給出了濾波器的快速算法,進行了二值文檔圖像二值小波變換的多分辨率分解和重構,并且通過實驗我們可以看到經過二值小波變換后圖像冗余統(tǒng)計信息減少,即在壓縮時可以用更少的比特位表示圖像。最終結合改進的熵編碼方法實現(xiàn)了將變換編碼方法引入二值文檔圖像的壓縮,拓展了二值文檔圖像壓縮可用方法的范圍。
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 78
      7人已閱讀
      ( 4 星級)
    • 簡介:在企業(yè)級分布式應用系統(tǒng)的多層體系結構中中間業(yè)務邏輯層是整個系統(tǒng)的關鍵組成部分它負責實現(xiàn)企業(yè)的主要業(yè)務流程然而實現(xiàn)業(yè)務邏輯層關鍵在于如何保證業(yè)務信息無阻礙、可路由和端對端安全的傳輸首先信息要在傳輸過程中能夠穿越各種防火墻的阻攔其次通過動態(tài)制定傳輸路徑的方式來保證信息必須經過當次業(yè)務流程的中間節(jié)點最后必須保證重要數(shù)據從起點到終點整個過程中的保密性和完整性本文正是在這樣的背景下展開工作的在遼河油田油井施工設計系統(tǒng)的開發(fā)過程中用戶要求施工設計文檔的審核審批流程采用分布式體系結構實現(xiàn)對系統(tǒng)的分析表明在審核審批流程中信息需要穿越各種防火墻油井設計文檔以WD文檔的形式存取設計文檔必須依次通過代表一審、二審、三審和審批人員的中間節(jié)點由于信息的重要性必須對信息采取相應的安全保護措施最終我們決定采用WEBSERVICE作為網絡上信息傳輸?shù)姆椒ㄖ宰龀鲞@樣的選擇有以下幾個原因第一WEBSERVICE的首選協(xié)議SOAP簡單對象存取協(xié)議大多數(shù)情況下是基于HTTP協(xié)議的所以SOAP消息能夠穿透各種防火墻第二SOAP的掛載擴展規(guī)范WSATTACHMENTS和DIME直接INTER消息封裝說明了SOAP消息如何掛載二進制附件第三SOAP的路由擴展規(guī)WSADDRESSING為制定SOAP消息的傳輸路徑提供了有力支持第四SOAP的安全擴展規(guī)WSSECURITY使保護SOAP消息中重要信息變?yōu)榭赡鼙疚囊栽O計文檔的審核審批流程為主要線索提出能滿足消息路由、安全、處理及掛載等方面要求的SOAP消息模型并基于此消息模型建立一個消息傳輸框架來模擬審核審批流程最終設計并實現(xiàn)遼河油田油井施工設計文檔審核審批子系統(tǒng)結果表明與通常采用的BS結構相比系統(tǒng)采用的中間節(jié)點型路由模型通過增加較少的本地處理代價來減少網絡應答代價并且使系統(tǒng)具有比較好的安全性和可靠性適用于以安全性和可靠性為目標的分布式應用系統(tǒng)業(yè)務邏輯層的實現(xiàn)
      下載積分: 5 賞幣
      上傳時間:2024-03-10
      頁數(shù): 71
      13人已閱讀
      ( 4 星級)
    • 下載積分: 5 賞幣
      上傳時間:2024-03-09
      頁數(shù): 60
      4人已閱讀
      ( 4 星級)
    關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯(lián)系我們

    機械圖紙源碼,實習報告等文檔下載

    備案號:浙ICP備20018660號