基于圖書的問答系統的設計實現和關鍵技術.pdf_第1頁
已閱讀1頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著互聯網的迅速發(fā)展,人們獲取信息和知識的途徑越來越多樣化,基于常問問題集(FAQ)的問答系統便是其中一個有效的方式。與傳統的搜索引擎相比,FAQ問答系統能夠直接返回用戶所提出問題的答案,提高了用戶知識獲取的效率。同時FAQ問答系統是自然語言處理領域中一個相當活躍的分支。FAQ的構建與更新、問題的分析與相似度計算等都是FAQ問答系統中的研究熱點和核心內容。
  數字圖書館中有大量專業(yè)的圖書資源,其中,問答類型的圖書通常是針對一個或

2、者多個領域進行專業(yè)性的知識問答,因此會形成大量問答對,而這些問答對就是常問問題集不可或缺的部分。并且,相對于其他常問問題集,它們更能夠提供專業(yè)性強且準確度高的答案。
  本論文針對問答類型的圖書資源,首先對問答系統的研究現狀做了詳細分析,介紹了問答系統的基本架構和相關理論基礎,介紹了基本的分詞方法、主題模型、問題相似度計算方法。然后設計并實現了一個基于圖書的問答系統。論文的主要工作如下:
  (1)分析基于圖書的問答系統的需

3、求,并針對需求進行系統分析和設計。提出了系統的架構設計和模塊設計,實現了基于圖書的問答系統并上線運行。
  (2)針對系統的數據需求,通過正則匹配等技術從大量的圖書資源中篩選出問答類型的圖書,然后抽取問答圖書的目錄信息,通過字符串匹配等方法過濾掉其中的噪音信息,最終獲取問答類圖書中的問題對數據,以此構建FAQ庫。
  (3)重點研究了問題分析和問題相似度計算的相關技術,并結合問題數據的結構、主題和短文本等特征提出了針對圖書問

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論