版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、2013年被學(xué)術(shù)界定義為大數(shù)據(jù)元年,經(jīng)過了近些年的快速發(fā)展,大數(shù)據(jù)對各個領(lǐng)域都引起了深刻的變革,其影響力日益凸顯。新聞領(lǐng)域的大數(shù)據(jù)變革尤為顯著,隨著自動撰稿技術(shù)的發(fā)展和移動終端的普及,媒體的新聞發(fā)布量呈爆發(fā)式增長,海量新聞的涌現(xiàn)給國際輿論研究人員帶來了新的挑戰(zhàn),以往依賴人工處理的新聞稿件采集、篩選流程已經(jīng)無法應(yīng)對如此大規(guī)模的數(shù)據(jù)源。境外媒體的涉華輿論分析工作具有特殊的意義,其研究成果極大的影響信息時代中的新型政治輿論博弈的工作展開,所以
2、我們必須緊跟技術(shù)發(fā)展潮流,轉(zhuǎn)變傳統(tǒng)的思維觀念、打造新型處理手段。本次研究中,通過對涉華輿情研究人員的訪談交流,明確了傳統(tǒng)新聞稿件采集的工作流程及要求,并依此梳理出新聞媒體評級體系與新聞稿件評級體系的基本邏輯框架,形成新聞稿件數(shù)據(jù)清洗方法的規(guī)則庫主體。此外,研究過程中閱讀了大量的新聞學(xué)、對外傳播學(xué)等學(xué)科的領(lǐng)域文獻,根據(jù)新聞傳播及涉外交流的自身特點對數(shù)據(jù)清洗方法進行了有針對性擴充完善,形成本次研究的涉華輿情數(shù)據(jù)清洗規(guī)則庫。其后對規(guī)則庫中的各
3、項具體評級指標(biāo)進行建模評分,通過確定評判等級和隸屬函數(shù)使定性的描述轉(zhuǎn)化為具體評級分?jǐn)?shù)。在構(gòu)建涉華新聞數(shù)據(jù)清洗規(guī)則庫的基礎(chǔ)上,結(jié)合大數(shù)據(jù)處理技術(shù)將數(shù)據(jù)清洗規(guī)則進行技術(shù)實現(xiàn)。實驗首先對新聞稿件進行預(yù)處理,包括:數(shù)據(jù)標(biāo)準(zhǔn)化、匹配消重、補全缺失數(shù)據(jù);然后根據(jù)隱馬爾可夫模型建立交互式規(guī)則庫。實驗過程中以商業(yè)化新聞數(shù)據(jù)庫作為實驗數(shù)據(jù)對涉華輿情新聞數(shù)據(jù)清洗方法進行了檢驗。檢驗結(jié)果表明應(yīng)用數(shù)據(jù)清洗方法能夠較為有效的減少數(shù)據(jù)處理總量、去除無關(guān)新聞噪音,對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人民輿情數(shù)據(jù)庫
- 日本經(jīng)濟新聞(20012013)涉華經(jīng)濟報道研究
- 涉華經(jīng)濟新聞報道的體裁分析.pdf
- 《日本經(jīng)濟新聞》(2001-2013)涉華經(jīng)濟報道研究.pdf
- 面向農(nóng)業(yè)領(lǐng)域知識庫構(gòu)建的數(shù)據(jù)清洗方法優(yōu)化研究.pdf
- 涉稅網(wǎng)絡(luò)輿情應(yīng)急管理研究.pdf
- 廣西涉稅網(wǎng)絡(luò)輿情管理研究.pdf
- 福田時期《朝日新聞》涉華報道傾向性研究.pdf
- 涉華經(jīng)濟新聞報道的體裁分析_15705.pdf
- 基于數(shù)據(jù)倉庫的數(shù)據(jù)清洗方法研究.pdf
- 數(shù)據(jù)清洗方法研究及工具設(shè)計.pdf
- 基于CNML的新聞數(shù)據(jù)庫新聞專題挖掘研究.pdf
- 《朝日新聞》網(wǎng)站的涉華重大事件報道研究.pdf
- 涉獄事件社會輿情應(yīng)對策略研究.pdf
- RFID中間件數(shù)據(jù)清洗方法研究.pdf
- 農(nóng)業(yè)大數(shù)據(jù)清洗方法比較研究.pdf
- 《今日美國》涉華報道研究.pdf
- 中美國際新聞比較研究——對《新華網(wǎng)》涉美和《紐約時報網(wǎng)》涉華報道比較研究.pdf
- 大連市涉稅網(wǎng)絡(luò)輿情管理研究.pdf
- 新媒體時代涉檢網(wǎng)絡(luò)輿情應(yīng)對研究.pdf
評論
0/150
提交評論