面向讀者的博客情感分類及檢索.pdf_第1頁
已閱讀1頁,還剩45頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著計算機網(wǎng)絡(luò)的發(fā)展,Web應(yīng)用變得豐富多彩。相應(yīng)地,越來越多的人們通過博客、空間及微博等網(wǎng)絡(luò)文本“對話”的形式來進行個人情感的表達和生活需求、興趣的交流。
   情感計算主要是針對文本中的評論信息進行分析、計算,挖掘人們對海量信息的評價觀點和意見。通常我們所見到的博客大多是主觀性文本,而主觀性文本中又包含了不同的情感內(nèi)容,這些情感內(nèi)容分屬不同的類別,正是人們所關(guān)注的。如果采用傳統(tǒng)的文本分類方法進行分類,則會忽略文本中包含的情感

2、語義信息,造成語義的缺失。如何彌補這項不足,正是本文的立意所在。
   本文針對博客情感分類和檢索進行了較為深入的探討,所做的工作主要包含以下幾個方面:
   首先,采用了最大熵模型的方法從讀者檢索語句中抽取情感特征向量。我們對讀者輸入的檢索語句進行帶詞性標注的分詞,然后采用基于最大熵理論的方法針對不同的詞性進行情感特征表現(xiàn)能力的測試,建立起讀者的情感特征向量。
   其次,設(shè)計了一種基于博客語料建立的情感數(shù)據(jù)庫

3、模型。我們給出了該情感數(shù)據(jù)庫的模型定義,對該數(shù)據(jù)庫做了一個總體的描述;接下來計算了情感數(shù)據(jù)庫中各個文本的整體情感強度;最后將這些文本、情感類別以及情感等級強度值綜合起來,形成結(jié)構(gòu)化的情感數(shù)據(jù)庫。
   最后,實現(xiàn)了面向讀者的博客情感分類及檢索系統(tǒng)。我們定義了讀者情感特征向量和博客文本的情感數(shù)據(jù)集合在數(shù)據(jù)庫中的存儲表示,然后建立了二者之間的混合映射關(guān)系同時確立其存儲表示;最后對讀者如何檢索博客文本的過程進行了細致的討論,建立起博客

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論