

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著互聯(lián)網(wǎng)的廣泛普及,網(wǎng)絡(luò)已經(jīng)成為人們獲取信息、共享信息的主要途徑。微博作為一種新興的互動(dòng)交流平臺(tái),也逐漸成為人們網(wǎng)絡(luò)生活的一部分,面向微博文本的相關(guān)研究受到越來越多學(xué)者的關(guān)注。面向微博的情感分析是微博相關(guān)文本分析中的一個(gè)重要的課題,而中文微博的情感信息抽取作為中文微博情感分析的基礎(chǔ)任務(wù),受到研究者的廣泛關(guān)注,逐漸成為一個(gè)熱門的研究方向。
中文微博的情感信息抽取的目的在于將無結(jié)構(gòu)的情感文本轉(zhuǎn)換成有結(jié)構(gòu)的文本——情感信息單元,不
2、但可以直接應(yīng)用于用戶評(píng)論分析與決策等方面,而且可以服務(wù)于其它情感分析任務(wù),如文本情感分類。其中情感信息單元包括評(píng)價(jià)對(duì)象、評(píng)價(jià)詞語、極性及觀點(diǎn)持有者四個(gè)元素。然而,由于微博文本語言表達(dá)隨意,大多數(shù)微博文本的句法結(jié)構(gòu)都是不完整的,且具有大量的冗余信息和網(wǎng)絡(luò)詞匯,采用原有文本意見挖掘方法進(jìn)行抽取信息的效果并不理想。因此需要結(jié)合微博自身特點(diǎn),對(duì)現(xiàn)有技術(shù)進(jìn)行改進(jìn)以便抽取微博情感信息,主要研究?jī)?nèi)容包括以下幾個(gè)方面:
(1)中文微博評(píng)價(jià)對(duì)象
3、候選集的構(gòu)建。結(jié)合中文微博文本的特點(diǎn),對(duì)微博文本進(jìn)行預(yù)處理,利用句法分析獲取名詞短語,對(duì)名詞短語進(jìn)行后處理,再構(gòu)建包括名詞、名詞短語以及微博話題在內(nèi)的評(píng)價(jià)對(duì)象候選集,并對(duì)該步驟的實(shí)驗(yàn)結(jié)果進(jìn)行分析。
(2)中文微博候選評(píng)價(jià)對(duì)象的篩選。采用3種策略實(shí)現(xiàn)候選評(píng)價(jià)對(duì)象的篩選:首先,采用SVM模型篩選候選評(píng)價(jià)對(duì)象,通過采用語義角色信息、最小距離和詞頻三個(gè)特征,實(shí)現(xiàn)SVM模型分類器對(duì)候選評(píng)價(jià)對(duì)象進(jìn)行篩選;其次,采用加權(quán)模型篩選候選評(píng)價(jià)對(duì)象
4、,根據(jù)不同特征,計(jì)算候選評(píng)價(jià)對(duì)象的權(quán)重分?jǐn)?shù),從而判別其是否為正確的評(píng)價(jià)對(duì)象。最后,基于CRF模型善于解決序列標(biāo)注問題的特點(diǎn),引入常用的情感信息抽取特征,以及情感詞、語義角色標(biāo)注等特征,采用CRF模型對(duì)候選評(píng)價(jià)對(duì)象進(jìn)行篩選。
(3)評(píng)價(jià)對(duì)象的極性判別。若評(píng)價(jià)對(duì)象附近存在情感詞,則尋找距離評(píng)價(jià)對(duì)象最近的情感詞,根據(jù)情感詞表,判斷評(píng)價(jià)對(duì)象的情感極性;若評(píng)價(jià)對(duì)象附近不存在情感詞,則用微博句子的情感極性代替評(píng)價(jià)對(duì)象的情感極性,其中微博句
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向中文微博的情感分類方法研究.pdf
- 面向中文微博的情感分類研究.pdf
- 面向中文微博文本的情感分類研究.pdf
- 面向目標(biāo)的中文微博情感分析研究.pdf
- 面向微博的變異流行詞抽取方法研究.pdf
- 面向微博文本的事件抽取.pdf
- 中文微博評(píng)論對(duì)象抽取研究.pdf
- 中文微博情感分類研究.pdf
- 面向中文微博文本的情感識(shí)別與分類技術(shù)研究.pdf
- 基于CRF和名詞短語識(shí)別的中文微博情感要素抽取.pdf
- 基于CRF的中文微博交通信息事件抽取.pdf
- 基于中文微博的情感分析研究.pdf
- 中文微博情感分析技術(shù)研究.pdf
- 面向話題的微博情感分析研究.pdf
- 基于聯(lián)合推斷的微博信息抽取研究.pdf
- 微博熱點(diǎn)話題抽取及其情感分類.pdf
- 基于情感詞典的中文微博情感傾向分析研究.pdf
- 中文微博情感評(píng)測(cè)報(bào)告
- 中文微博的情感分析和應(yīng)用.pdf
- 中文微博評(píng)論的情感傾向分析.pdf
評(píng)論
0/150
提交評(píng)論