版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、作為Web2.0時代具有代表的社交平臺,微博已經(jīng)成為了一種主流的信息分享和交流的平臺,微博營銷也應運而生。微博營銷是一種新型的網(wǎng)絡營銷方式,商家通過在微博上發(fā)表與商品主題相關(guān)的帖子,以他的粉絲和偶像為傳播媒介,讓其他用戶能夠快速地了解到商品信息。微博營銷是一種口碑式的營銷方式,用戶的評論中攜帶大量的情報信息,對商家和其他用戶都有重要的意義;對商家而言,評論信息越多,說明有更多的用戶關(guān)注他的商品;評論的內(nèi)容也能夠讓商家及時發(fā)現(xiàn)商品的優(yōu)缺點
2、。對用戶來說,了解到與商品有關(guān)的評論信息,他們能夠做出正確的購買決定。然而,微博評論往往較多,以人工的方式來讀取所有評論是耗時的,也是不現(xiàn)實的,并且由于評論的自由性,有些評論其實是與微博帖子內(nèi)容不相關(guān)的,而且有些評論者對主題是不了解的,或者評論者是一些新用戶,他們的評論不具有權(quán)威性。因此,挖掘出那些與主題相關(guān)的,而且評論者對主題具有一定偏好和較高的權(quán)威性的評論具有重要的現(xiàn)實意義。本文所研究的內(nèi)容如下:
1、微博評論的模型化。傳
3、統(tǒng)的文本表達模型,如向量空間模型(Vector Space Model,VSM),將文本抽象成向量,使用詞頻-逆文檔頻率(Term Frequency–Inverse Document Frequency,TF-IDF)來計算詞語的權(quán)重。微博帖子和評論是一種短文本,使用VSM來模型化微博帖子和評論是不科學的。因此,本文提出了用PostWordGraph(PWG)圖來模型化微博帖子和評論。在PWG中,節(jié)點表示詞,邊表示詞之間的關(guān)系。
4、> 2、從短文本集中提取關(guān)鍵詞。微博評論的自由性導致了微博評論中含有一些與主題無關(guān)的詞語,這些詞語不僅僅會增加計算開銷,而且會影響準確性。在PWG的基礎上,本文提出了PostWordRank(PWR)算法來計算PWG中的詞的權(quán)重。詞的PWR值反應了該節(jié)點的重要性。因此,那些具有較高的PWR值的詞將被當做關(guān)鍵詞,那些包含關(guān)鍵詞的評論將更可能是與主題相關(guān)的。
3、本文提出了中文短文本語義相似度算法(Chinese Short-T
5、ext Semantic Similarity Algorithm,CSSSA)。CSSSA不僅考慮了詞語的詞性,還考慮了詞語之間的語義相似度。
4、本文定義了評論相關(guān)分值(Comment Related Score,CRS)。CRS不僅僅考慮了評論內(nèi)容與主題的語義相似性,而且考慮了評論者的主題偏好(User Topic Preference,UTP)和權(quán)威值(User Authority Value,UAV)。
最
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中文微博評論與微博主題相關(guān)性的研究.pdf
- 中文微博評論對象抽取研究.pdf
- 中文微博的話題相關(guān)性分析研究.pdf
- 中文微博評論的情感傾向分析.pdf
- 微博事件的評論挖掘.pdf
- 企業(yè)微博互動與用戶需求的相關(guān)性研究.pdf
- 中文微博的話題檢測及微博預警.pdf
- 微博可信性與微博事件預測的研究.pdf
- 人民微博新浪微博騰訊微博
- 基于評論的在線多媒體微博主題挖掘算法研究.pdf
- 中文微博情感分類研究.pdf
- 基于微博公共平臺的單條微博熱門程度預測及其相關(guān)微博發(fā)現(xiàn).pdf
- 中文微博情緒分析.pdf
- 微博垃圾評論識別方法研究.pdf
- 微博垃圾評論識別方法研究
- 基于評論情感的微博謠言檢測研究.pdf
- 基于評論與轉(zhuǎn)發(fā)的微博聯(lián)合主題挖掘系統(tǒng)的設計與實現(xiàn).pdf
- 95518.微博用戶行為與中國股市波動相關(guān)性的研究
- 新浪微博與騰訊微博個人頁比較研究.pdf
- 微博評論情感傾向性分類研究.pdf
評論
0/150
提交評論