

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著 Web2.0技術(shù)的誕生和迅速發(fā)展,互聯(lián)網(wǎng)進(jìn)入了在線社交網(wǎng)絡(luò)的時(shí)代。由于信息發(fā)布、傳播的開(kāi)放性和自由性,在線社交網(wǎng)絡(luò)中的信息傳播活躍性達(dá)到前所未有的高度。研究在線社交網(wǎng)絡(luò)的信息傳播規(guī)律,不僅有助于加深對(duì)網(wǎng)絡(luò)結(jié)構(gòu)和用戶群體行為的認(rèn)識(shí),也能有助于引導(dǎo)在線社會(huì)網(wǎng)絡(luò)輿情,因而具有重要的理論價(jià)值和研究意義。
在線社交網(wǎng)絡(luò)具有主題多樣性、動(dòng)態(tài)演化性、數(shù)據(jù)規(guī)模海量性、高噪音性和非線性等特點(diǎn),因此在分析方法和計(jì)算模型上都與傳統(tǒng)社交網(wǎng)絡(luò)具有
2、很大差別。本文以輿情分析為應(yīng)用背景,在分析研究現(xiàn)狀的基礎(chǔ)上,針對(duì)在線社交網(wǎng)絡(luò)中的社會(huì)關(guān)系中的主題多樣性和動(dòng)態(tài)演化性、數(shù)據(jù)的高噪音性、數(shù)據(jù)規(guī)模的海量性和話題熱度變化的非線性進(jìn)行了研究。本文主要的研究工作和貢獻(xiàn)如下:
1.研究了面向微博的社會(huì)關(guān)系信息抽取問(wèn)題,針對(duì)社會(huì)關(guān)系中的主題多樣性和動(dòng)態(tài)演化性,提出了一種主題和時(shí)間敏感的連接強(qiáng)度在線計(jì)算模型。
在線社交網(wǎng)絡(luò)中的信息傳播更多構(gòu)建于社會(huì)關(guān)系之上。一方面,用戶之間的通信主要
3、是以電子文本的形式進(jìn)行的,而文本是與主題相關(guān)的,這意味著社交網(wǎng)絡(luò)中的個(gè)體間連接具有主題多樣性。另一方面,社交網(wǎng)絡(luò)是一個(gè)動(dòng)態(tài)的網(wǎng)絡(luò),個(gè)體間的連接強(qiáng)度和信息內(nèi)容是隨著時(shí)間而不斷演化的。已有方法大多沒(méi)有同時(shí)考慮上述兩個(gè)特性,影響了用戶傳播行為預(yù)測(cè)模型的精度。針對(duì)已有方法的不足,本文將用戶之間通信歷史記錄中的主題和時(shí)間兩個(gè)因素結(jié)合起來(lái),提出了一種主題和時(shí)間敏感的連接強(qiáng)度計(jì)算模型。實(shí)驗(yàn)結(jié)果證明,相對(duì)于已有模型,本文提出的連接強(qiáng)度在線計(jì)算模型不僅在
4、用戶傳播行為預(yù)測(cè)的準(zhǔn)確性方面有明顯提升(提升幅度達(dá)33%左右),還能有效地發(fā)現(xiàn)微博用戶中的“主題好友”和“個(gè)人好友”。
2.研究了面向信息傳播的微博用戶興趣信息抽取問(wèn)題,針對(duì)微博文本中存在的高噪音性,提出了一種結(jié)合微博特征的微博用戶興趣發(fā)現(xiàn)方法。
微博文本具有篇幅短、規(guī)范性差、新詞泛濫等高噪音性,導(dǎo)致基于傳統(tǒng)信息抽取技術(shù)的用戶興趣發(fā)現(xiàn)方法無(wú)法發(fā)揮到良好的效果。本文為通過(guò)微博文本發(fā)現(xiàn)微博用戶興趣,提出一種微博用戶興趣關(guān)
5、鍵詞抽取方法。用戶興趣關(guān)鍵詞是指微博文本中最能反映用戶興趣的詞語(yǔ)集合。該方法首先針對(duì)微博篇幅短的特點(diǎn),將每名用戶的所有微博文檔合成一個(gè)長(zhǎng)文檔,接著利用微博文檔中的轉(zhuǎn)發(fā)數(shù)、標(biāo)簽和發(fā)布時(shí)間等特征設(shè)計(jì)了候選興趣關(guān)鍵詞的特征,再使用機(jī)器學(xué)習(xí)的分類(lèi)算法,有效地抽取出用戶興趣關(guān)鍵詞,實(shí)現(xiàn)了用戶興趣的發(fā)現(xiàn)。通過(guò)微博用戶分類(lèi)對(duì)本文提出的用戶興趣發(fā)現(xiàn)效果進(jìn)行檢驗(yàn)。實(shí)驗(yàn)結(jié)果證明,本文提出的用戶興趣發(fā)現(xiàn)方法準(zhǔn)確率達(dá)到89.79%,在性能上比已有方法提升了約2
6、0%。在基于用戶興趣關(guān)鍵詞的微博用戶分類(lèi)中,由于能有效排除微博中無(wú)意義的詞匯,因而相對(duì)于傳統(tǒng)方法,分類(lèi)準(zhǔn)確率能達(dá)到91.26%,性能提升了18.7%。
3.研究了新型社交網(wǎng)絡(luò)應(yīng)用“微群”中信息傳播機(jī)制,針對(duì)數(shù)據(jù)海量性和社會(huì)關(guān)系隱藏性,提出了一種結(jié)合連接強(qiáng)度和用戶興趣的用戶傳播行為動(dòng)態(tài)預(yù)測(cè)模型。
微群是微博客社交網(wǎng)站中的一種類(lèi)似“QQ群”的新型社交網(wǎng)絡(luò)應(yīng)用,近年來(lái)發(fā)展迅速。這類(lèi)應(yīng)用將微博與電子公告板兩者的特點(diǎn)結(jié)合起來(lái),
7、形成了新的傳播機(jī)制。在微群中,連接強(qiáng)度和用戶興趣共同影響著微博用戶信息交互行為。另外,由于微群的數(shù)量及其成員規(guī)模龐大并且社會(huì)關(guān)系隱藏在海量的回復(fù)關(guān)系,因此微群具有數(shù)據(jù)海量性和社交關(guān)系隱藏性的特點(diǎn)。針對(duì)微群以上特性,本文提出一種結(jié)合連接強(qiáng)度和用戶興趣的用戶傳播行為動(dòng)態(tài)預(yù)測(cè)模型。該模型先基于用戶平時(shí)發(fā)布的微博與給定話題的內(nèi)容相似度,度量用戶對(duì)目標(biāo)話題的個(gè)人興趣度,再利用用戶之間的回復(fù)關(guān)系構(gòu)建與話題相關(guān)的影響力網(wǎng)絡(luò),然后基于自重啟隨機(jī)游走的話
8、題興趣度排序方法預(yù)測(cè)用戶傳播行為。該模型在內(nèi)容相似性度量中,基于LDA(Latent Dirichlet Allocation)模型的文本表示方法,有效克服了傳統(tǒng)基于“詞袋”的方法所帶來(lái)的高維度弊端。此外,該方法利用相鄰時(shí)間片文本數(shù)據(jù)具有相同語(yǔ)境的特點(diǎn),實(shí)現(xiàn)動(dòng)態(tài)更新話題內(nèi)容,使預(yù)測(cè)模型能實(shí)時(shí)處理不斷涌現(xiàn)文本流數(shù)據(jù)。實(shí)驗(yàn)結(jié)果證明:本文提出的動(dòng)態(tài)預(yù)測(cè)模型在預(yù)測(cè)性能上優(yōu)于已有的預(yù)測(cè)模型,性能提升幅度約35%左右。
4.針對(duì)輿情話題熱
9、度變化的非線性,提出了一種基于改進(jìn)型神經(jīng)網(wǎng)絡(luò)的話題熱度預(yù)測(cè)模型。
輿情話題是由突發(fā)事件引起的話題,其熱度受到傳統(tǒng)新聞媒體、話題內(nèi)容本身和網(wǎng)絡(luò)中的意見(jiàn)領(lǐng)袖、用戶群體數(shù)量等多種因素的影響,具有非線性變化的特點(diǎn)。已有的預(yù)測(cè)模型大多基于傳統(tǒng)統(tǒng)計(jì)模型,一般只適用于線性變化或周期性變化的話題。針對(duì)已有預(yù)測(cè)模型的不足,本文提出了一種基于改進(jìn)型神經(jīng)網(wǎng)絡(luò)的話題熱度預(yù)測(cè)模型。首先基于灰色關(guān)聯(lián)度理論,發(fā)現(xiàn)意見(jiàn)領(lǐng)袖的影響力、回帖數(shù)和點(diǎn)擊數(shù)均與話題熱度
10、存在很強(qiáng)的正相關(guān)性,進(jìn)而利用神經(jīng)網(wǎng)絡(luò)對(duì)話題熱度與上述因素之間的非線性關(guān)系進(jìn)行建模和預(yù)測(cè)。此外,針對(duì)標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)容易陷入局部最優(yōu)解的不足,采用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)模型,進(jìn)一步提高了預(yù)測(cè)精度。實(shí)驗(yàn)結(jié)果表明,無(wú)論是相對(duì)于標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)還是其它已有算法,本文提出的預(yù)測(cè)模型在話題熱度預(yù)測(cè)方面都有明顯的提升。
綜上所述,本文針對(duì)在線社交網(wǎng)絡(luò)數(shù)據(jù)的特點(diǎn),研究了面向在線社交網(wǎng)絡(luò)輿情的信息傳播分析技術(shù),分別從微觀層次和宏觀層次分析了在線社交網(wǎng)絡(luò)中
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向社交網(wǎng)絡(luò)的群體分析關(guān)鍵技術(shù)研究.pdf
- 53357.面向社交網(wǎng)絡(luò)的話題傳播關(guān)鍵技術(shù)研究
- 面向網(wǎng)絡(luò)輿情監(jiān)測(cè)的關(guān)鍵技術(shù)研究.pdf
- 面向網(wǎng)絡(luò)輿情分析的觀點(diǎn)挖掘關(guān)鍵技術(shù)研究.pdf
- 社交網(wǎng)絡(luò)分析關(guān)鍵技術(shù)研究.pdf
- 網(wǎng)絡(luò)輿情分析關(guān)鍵技術(shù)研究.pdf
- 面向博客的輿情分析若干關(guān)鍵技術(shù)研究.pdf
- 面向社交媒體的文本情感分析關(guān)鍵技術(shù)研究.pdf
- 面向網(wǎng)絡(luò)輿情分析的Web數(shù)據(jù)源獲取關(guān)鍵技術(shù)研究.pdf
- 面向?qū)W術(shù)領(lǐng)域的輿情分析關(guān)鍵技術(shù)研究.pdf
- 網(wǎng)絡(luò)輿情信息挖掘關(guān)鍵技術(shù)研究與應(yīng)用.pdf
- 網(wǎng)絡(luò)輿情預(yù)測(cè)關(guān)鍵技術(shù)研究.pdf
- 網(wǎng)絡(luò)輿情分析關(guān)鍵技術(shù)研究與實(shí)現(xiàn).pdf
- 社會(huì)網(wǎng)絡(luò)中信息傳播若干關(guān)鍵技術(shù)研究.pdf
- 網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 面向微博輿情的用戶挖掘及消息傳播預(yù)測(cè)關(guān)鍵技術(shù)研究.pdf
- 網(wǎng)絡(luò)輿情檢測(cè)與控制關(guān)鍵技術(shù)研究.pdf
- 高校網(wǎng)絡(luò)輿情監(jiān)測(cè)關(guān)鍵技術(shù)研究.pdf
- 輿情信息采集關(guān)鍵技術(shù)研究與應(yīng)用.pdf
- 大規(guī)模復(fù)雜網(wǎng)絡(luò)信息傳播平臺(tái)關(guān)鍵技術(shù)研究.pdf
評(píng)論
0/150
提交評(píng)論