基于企業(yè)價值評估的金融數(shù)據(jù)智能提取方法研究.pdf_第1頁
已閱讀1頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、在互聯(lián)網高速發(fā)展、迅速普及的信息爆炸時代,搜索引擎的出現(xiàn)給人們的生活帶來了巨大的便利。但是,現(xiàn)有搜索引擎大部分依賴于關鍵字檢索技術,由于互聯(lián)網上充斥了大量資源和各種各樣用戶,通過關鍵字搜索出來的數(shù)據(jù)有很大一部分不能有效滿足用戶的需要。信息提取技術是一種能夠獲取特定事件或者事件與事件之間關系的技術,是一個從無結構的自由文本或其他信息資源中抽取出結構化,無二義性信息的過程。信息提取技術不僅僅能過濾掉對用戶沒有用的信息,而且還能生成用戶感興趣

2、的特定信息,這使其成為企業(yè)價值評估的重要工具。企業(yè)價值評估是收集、分析以及應用金融信息來評估企業(yè)的價值,評估的結果可以作為衡量企業(yè)上市以及兼并重組等的重要依據(jù)。關于企業(yè)價值評估的信息和事件來源于財務報表、報表附注以及金融新聞,而這三大數(shù)據(jù)源都是以HTML和PDF的格式分布互聯(lián)網各處。所以,要想快速準確提取評估相關的金融數(shù)據(jù),改變過去通過手工收集數(shù)據(jù)的方法,研究出一套智能提取的方法是非常有必要的。
  本文在主體結構上分為四個部分,

3、第一部分闡述了智能信息提取的理論和方法,包括中文分詞、詞性標注、關鍵字提取以及行列表格數(shù)據(jù)提取等方面的理論。第二部分根據(jù)財務報表、報表附注以及金融新聞等不同的數(shù)據(jù)源,分類提出了獲得企業(yè)價值評估所需數(shù)據(jù)的智能提取方法,對每一類具體的方法進行了詳細的分析。第三部分設計開發(fā)了基于企業(yè)價值評估的金融數(shù)據(jù)智能提取的原型系統(tǒng),主要包括輸入輸出模塊、詞分析的模塊以及信息提取模塊等三大功能模塊,把具體的智能提取方法和數(shù)據(jù)庫關系模型應用到其中,并且通過財

4、務報表、報表附注以及金融新聞的數(shù)據(jù)測試實驗,檢驗了提取方法的可行性,并對測試結果進行了評價和分析。第四部分通過介紹基于企業(yè)價值評估的金融數(shù)據(jù)智能提取方法的應用,把智能提取方法和原型系統(tǒng)應用到企業(yè)并購重組,股票投資以及財務風險評估等經營管理活動當中,大大節(jié)省人力成本,提取決策效率。
  本文的特點在于,應用自然語言處理技術,根據(jù)不同的金融數(shù)據(jù)的數(shù)據(jù)源,提出不同的智能提取方法,然后結合企業(yè)價值評估數(shù)據(jù)庫關系模型,自動的從這些數(shù)據(jù)源提取

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論