基于條件隨機(jī)場的微博情感對象識別研究.pdf_第1頁
已閱讀1頁,還剩67頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、近年來社交網(wǎng)絡(luò)飛速發(fā)展,越來越多的人通過微博來進(jìn)行信息交換和分享。由于微博具有短小精悍,使用便捷,傳播迅速等特點(diǎn),使得其廣受歡迎。用戶樂于在微博上分享自己的觀點(diǎn)或體驗(yàn),這使得微博中存在著大量具有情感傾向的用戶評論信息。隨著這樣的評論信息迅速膨脹,僅靠人工的方法難以應(yīng)對海量信息的處理和分析。因此,如何利用計(jì)算機(jī)技術(shù)對微博中的評論數(shù)據(jù)進(jìn)行有效的加工處理和分析挖掘已成為當(dāng)前熱門研究問題,情感對象識別研究就是用于解決這個問題的一種非常有效的途徑

2、。
  本文主要是針對中文微博文本進(jìn)行情感對象識別研究,然而對非結(jié)構(gòu)化的文本進(jìn)行情感對象識別本身就是一個困難的問題,現(xiàn)有研究往往存在一些不足之處。一方面,微博和傳統(tǒng)文本是有區(qū)別的,其表達(dá)簡短且具有較大的自由性,通常不是規(guī)范的中文語言表達(dá),現(xiàn)有的基礎(chǔ)中文文本處理工具并不能很好的適用于微博這種特殊的文本,這為情感對象識別任務(wù)提高了難度。為了解決這個問題,本文提出對微博文本進(jìn)行了規(guī)范化處理并構(gòu)建了包括網(wǎng)絡(luò)用語詞典、表情詞典、情感詞典和否

3、定詞詞典等在內(nèi)的多個詞典,通過這種方式不但能夠改善現(xiàn)有文本處理工具對微博進(jìn)行分詞和句法依賴解析,而且還能夠更加有效地結(jié)合上下文信息進(jìn)行特征提取。另一方面,針對文本中顯性出現(xiàn)的情感對象,目前一些方法已經(jīng)能夠有效的識別,但是面對隱性的情感對象時還是顯得力不從心。因此,當(dāng)情感對象直接出現(xiàn)在文本中時,本文采用條件隨機(jī)場模型和分類模型相融合的方式進(jìn)行情感對象識別;而對于情感對象并不出現(xiàn)在文本中時,則嘗試對蘊(yùn)含的情感對象進(jìn)行抽象化處理,提出了一種包

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論