版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、情報的收集、處理與研究工作關系到國家各方面的發(fā)展與進步。評定一個國家軍隊戰(zhàn)斗力的強弱,除戰(zhàn)略、戰(zhàn)術、技術裝備、武器裝備、教育水平等因素之外,情報工作的收集能力之強弱,是評價標準的重要組成部份,尤其在高度信息化的“第三波戰(zhàn)爭”時代,情報工作的高科技化及杰出的收集能力,已成為國防現代化最主要的努力方向。隨著世界各國在各個領域的競爭日趨激烈,情報收集、研究工作也受到各個國家越來越多的重視。 情報搜集是情報研究工作的基礎和前提,是情報分
2、析的物質基礎,對公開軍事情報資料的搜集是軍事情報搜集不可缺少的組成部分。隨著計算機技術和網絡技術的快速發(fā)展,從互聯網上獲取公開的情報信息成為情報收集的一個重要途徑,受到各國情報部門的普遍重視。但由于互聯網具有自由、異構的特點,使得人們直接在互聯網上搜集有價值的情報資料時,面臨著巨大的困難,必須求助于相應的工具軟件。搜索引擎技術的出現使得這一困難在某種程度上得到了緩解,但同時搜索引擎又帶來了許多新的問題,如“信息過載”、“相關度差”等。
3、 本課題將以網絡標準搜索引擎為依托,采用元搜索、網頁信息提取與噪聲消除、中文分詞與歧義剔除和向量空間模型(Vector Space Model, VSM)等技術,開發(fā)基于軍事應用的智能化網絡搜索工具。該工具以用戶自定義關鍵詞為基礎,自動進行多引擎調度,搜集Internet 上的公開情報資料,通過搜尋、分類、去重、排序等綜合性自動處理、將具有高相關度的公開情報信息以鏈接的形式存入情報數據庫并反饋給用戶作為最新情報信息資料。
4、本論文的主要工作如下: 1 搜索技術 在分析搜索引擎結構框架的基礎上,提出并開發(fā)基于元搜索引擎技術的網絡情報搜集系統(NISF)。以不間斷運行、定時搜索的方式,進行網絡公開情報資料的收集。NISF 元搜索系統包括用戶接口、標準搜索引擎分配和調用機制以及搜索結果處理與返回三個主要方面。 在用戶接口設計上,構建情報用戶需求模型,提出了基于關鍵詞列表和用戶反饋的情報用戶模型,通過不斷收集用戶的反饋信息,調整關鍵詞權重,
5、使用戶模型逐漸趨向于用戶真實需求,提高情報信息搜索的準確性。 在對標準搜索引擎分配調用機制上,提出了分配系數的概念和數學模型,針對用戶搜索主題描述,利用分配系數評判標準搜索引擎在該類主題上的搜索性能,選擇最優(yōu)的標準搜索引擎完成搜索任務。 在搜索結果處理與返回上,采用數據庫技術剔除搜索結果中標題或URL相同的信息,使用VSM 分析計算搜索結果與用戶需求模型之間的相關度,在此基礎上提出了一種改進的基于用戶反饋的文本自適應過濾
6、算法。在搜索信息提取上提出了基于HTML 標記符號和關鍵詞的主題鏈接、主題文本內容提取算法以及Web 頁面文本內容提取結果評價方法與數學模型。 2 情報處理技術 本文對情報文檔處理的主要任務是實現情報分檔自動分類。由于目前計算機還不能完全理解自然語言,因此常用抽取文檔高頻詞的方法描述文檔。 本文在抽取高頻詞上提出一種基于詞典和詞頻的中文分詞方法。在比較向量空間模型和集合運算模型的基礎上,采用向量空間模型計算文檔相
7、似度;在描述文檔距離上,比較了余弦公式與歐氏距離的性能,最終采用余弦公式計算文檔間的距離。在分類算法上采用一種VSM、KNN 和SVM 相結合的文檔分類算法。最后將分類結果存入數據庫。 3 軟件系統開發(fā)與實現 基于以上技術,在Microsoft WindowsXP 系統上,采用Borland Delphi7.0開發(fā)基于軍事應用的網絡情報搜集系統(Network Intelligence Search Finder,NIS
8、F)。 結論: 1 基于關鍵詞和用戶反饋的用戶需求模型可以量化用戶需求,比較真實地反映用戶的檢索請求。 2 分配系數能夠很好地評價標準搜索引擎在搜索某個關鍵詞上的性能,為元搜索系統調用標準搜索引擎提供了依據。 3 改進的基于用戶反饋的自適應文本過濾算法能夠使用戶得到相關度更高的情報信息。 4 Web 頁面信息提取技術在Web 頁面鏈接和文本內容提取上有很好的表現,主題信息率的提出為評價Web 頁面
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于web的智能搜索應用技術探討
- 基于本體的智能搜索技術實現.pdf
- 基于垂直搜索技術的競爭情報采集系統的設計與實現.pdf
- 基于語義網絡的智能搜索引擎研究.pdf
- 基于信息融合的企業(yè)競爭情報元搜索技術研究.pdf
- 基于元搜索與內容聚類的情報獲取技術研究.pdf
- 基于對等網絡的文檔搜索技術.pdf
- 基于領域本體的網絡智能搜索模型研究與實現.pdf
- 基于本體的領域智能搜索技術研究.pdf
- 基于OPNET的軍事通信網絡仿真及應用.pdf
- 基于潛在語義分析的智能搜索技術研究.pdf
- Internet中智能信息搜索技術的研究與應用.pdf
- 基于軍事通信的Ad Hoc網絡路由算法的應用技術研究.pdf
- 基于Web的網絡搜索技術研究.pdf
- 網絡訂餐系統及智能搜索算法應用研究.pdf
- 基于領域本體的智能搜索系統的研究和應用.pdf
- 基于推薦網絡的服務搜索技術研究.pdf
- 基于語義網的智能搜索技術的研究與實現.pdf
- 數據挖掘技術在智能搜索引擎中的應用.pdf
- 基于用戶行為的智能搜索研究.pdf
評論
0/150
提交評論