2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩137頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著人們對自身健康關注程度的日益提高,對醫(yī)療保健的觀念也正逐漸發(fā)生改變,主張從過去被動的疾病治療到積極的健康自我管理。病人要想積極的參與到自身疾病的診療決策以及日常的健康自我管理,沒有一個良好的信息交流平臺是無法實現(xiàn)的。近年來網(wǎng)絡健康社區(qū)的快速發(fā)展為人們交流醫(yī)療健康信息提供了可能,大量用戶參與到網(wǎng)絡健康社區(qū)中尋求和分享個人健康保健和疾病診療經驗、對各健康話題提出自己的觀點,同時網(wǎng)絡健康社區(qū)也為病人及其家屬進行情感交流與尋求情感支持創(chuàng)造了

2、良好的溝通平臺。深入地了解和分析網(wǎng)絡健康社區(qū)是一個非常有意義的研究課題,一方面可以幫助社區(qū)網(wǎng)站優(yōu)化人機交互界面,提供更個性化的工具和功能來便于社區(qū)成員更好地參與到社區(qū)討論中,提高其參與的積極性;另一方面對參與網(wǎng)絡健康社區(qū)的廣大用戶來說,對網(wǎng)絡健康社區(qū)的深入研究可以幫助他們更快的了解這一新興的在線交流形式,幫助他們快速的發(fā)現(xiàn)其感興趣的話題或者尋找他們希望與之交流的社區(qū)成員,使他們更好的融入到網(wǎng)絡健康社區(qū)平臺中。
  正因為網(wǎng)絡健康社

3、區(qū)在人們日常生活中發(fā)揮著越來越重要的作用,因此也成為眾多研究者關注的熱點。許多研究已經從不同角度和側面展開,例如分析不同人群在社區(qū)中的參與特點,探索社區(qū)中健康相關的熱點主題以及分析成員在社區(qū)中的情感表達與交流等幾個方面。但目前大部分研究采用的是基于調查問卷的方法,或者依靠人工標注的內容分析方法,隨著網(wǎng)絡健康社區(qū)的快速發(fā)展,當面對日益增長的海量的社區(qū)文本時,這些傳統(tǒng)的人工分析方法不但效率低下,而且缺乏科學性和客觀性,無法對網(wǎng)絡健康社區(qū)進行

4、更有效的分析。因此本文探索利用機器學習和文本挖掘等智能化處理方法,對目前網(wǎng)絡健康社區(qū)研究中的主要熱點問題進行全面系統(tǒng)的分析,主要研究內容包括以下三個方面:健康熱點主題的識別、社區(qū)成員角色的識別以及社區(qū)成員的情感表達分析等。
  (1)健康熱點主題識別。社區(qū)成員在網(wǎng)絡健康社區(qū)中可以對感興趣的話題進行自由的交流,但研究發(fā)現(xiàn)由于社區(qū)信息組織的無序導致用戶難以快速的查找到所需要的信息,社區(qū)網(wǎng)站和相關研究者也很難從中發(fā)現(xiàn)用戶對各類健康主題的

5、興趣和需求,由此我們提出了健康熱點主題的自動識別方法。通過借助于UMLS等外部醫(yī)療知識源,我們從社區(qū)論壇的發(fā)帖文本中抽取了n-gram特征、領域相關特征以及情感特征等能有效表示健康主題的特征集合,然后通過文本聚類技術對社區(qū)發(fā)帖文本按其主題劃分為不同的簇,每一個結果簇代表一類健康熱點主題,最后通過對簇中關鍵詞抽取的方式實現(xiàn)對健康熱點主題的有效識別。在實驗的測試和評估中,以國際知名網(wǎng)絡健康社區(qū)Medhelp為實驗數(shù)據(jù)來源,選擇其中的肺癌、乳

6、腺癌和糖尿病三種典型疾病為研究對象搜集樣本數(shù)據(jù),在對模型的各項參數(shù)進行確定后,我們分別得到了7個結果簇,通過關鍵詞抽取,我們最終定義了7個健康熱點主題,分別是個人詳細介紹、情感支持、癥狀、檢查、并發(fā)癥、用藥和治療,隨后驗證了方法的有效性。最后通過進一步討論,我們發(fā)現(xiàn)在不同類型疾病論壇中健康熱點主題的分布也有明顯差異,比如肺癌論壇中的癥狀、乳腺癌論壇中的檢查、糖尿病論壇中的用藥等主題的分布都明顯高于其他主題。
  (2)社區(qū)成員角色

7、識別。網(wǎng)絡健康社區(qū)中有不同類型的參與人群,他們有著不同的參與目的和需求,表現(xiàn)出不同的角色特征。對不同角色成員的有效識別便于網(wǎng)站提供差異化服務來滿足不同成員的需求,也便于社區(qū)成員之間增強相互理解和信任。然而出于隱私保護等原因使得個人有效信息相對缺乏,這給有效識別社區(qū)成員的角色造成了很大困難,為此我們引入了基于文體學的文本作者角色識別理論,提出了網(wǎng)絡健康社區(qū)中的成員角色識別方法,通過對社區(qū)成員發(fā)帖文本的文體寫作特征來判斷社區(qū)成員的不同角色類

8、型,提取的文體特征包括詞匯特征、句法特征和結構特征,并結合內容相關的特征構成特征集,然后采用文本聚類方法將所有發(fā)帖按其不同的文體寫作特征進行劃分,最終實現(xiàn)對社區(qū)成員角色的有效識別。在實驗中我們仍然以Medhelp健康社區(qū)三種疾病論壇中的發(fā)帖文本作為實驗語料,對病人、護理者和醫(yī)療專家等三類主要角色進行了有效識別,并通過進一步討論對三類人群的差異化進行了分析。
  (3)社區(qū)成員的情感表達分析。網(wǎng)絡健康社區(qū)作為一個用戶廣泛參與交流的平

9、臺,社區(qū)成員的發(fā)帖都包含了他們豐富的情感表達,因此我們探索建立了一套面向網(wǎng)絡健康社區(qū)的情感分析方法來有效地識別這些包含情感表達的發(fā)帖文本,并分析其中的情感傾向性。首先,我們介紹了對網(wǎng)絡文本的情感分析技術,并分別根據(jù)基于機器學習的情感分析方法和基于情感詞典的情感分析方法來設計研究框架,對健康社區(qū)中的發(fā)帖文本進行主客觀分類和情感極性分類。在基于機器學習的方法中通過選取領域特征、詞性特征、文體特征等有效區(qū)分文本情感的特征構成特征集,并采用SV

10、M分類算法實現(xiàn)對文本的情感分類。在基于情感詞典的分析方法中,探索如何引入外部情感知識源來抽取文本中的情感詞并計算其情感表達強度,設定合理的情感極性區(qū)分標準來判別文本的情感傾向性。通過實驗測試,發(fā)現(xiàn)兩種情感分析方法各有優(yōu)劣,最終我們將兩種方法進行有效的融合,并通過科學的度量驗證了融合兩種方法的情感分析綜合模型的有效性。在進一步深入的分析討論中,我們針對不同的疾病類型,不同的健康主題和不同類型的成員角色等從多個角度對社區(qū)成員的情感表達特點進

11、行了分析和總結。
  本文的創(chuàng)新工作主要體現(xiàn)在以下三個方面:
  (1)提出了基于文本聚類的網(wǎng)絡健康社區(qū)熱點主題識別方法。由于目前對網(wǎng)絡健康社區(qū)熱點主題的研究多采用基于人工統(tǒng)計標注的方法,處理效率低下且缺乏科學性,本文提出將文本聚類的方法運用到網(wǎng)絡社區(qū)的健康主題識別中,在傳統(tǒng)的文本表示方法的基礎上,本文提出引入外部醫(yī)療健康知識源從文本中抽取出區(qū)分健康主題的領域相關特征,并進一步提出加入情感特征來提高聚類效果,最后通過實驗驗證

12、我們構建的健康主題識別模型的有效性。
  (2)提出了基于文體學的網(wǎng)絡健康社區(qū)成員角色識別方法。有效地識別不同的社區(qū)成員角色是分析研究網(wǎng)絡健康社區(qū)的主要基礎和前提,而由于個人資料的缺乏和隱私保護的需要使得我們難以識別成員的角色,因此相關角度的研究也非常少。本文創(chuàng)新性的提出了基于文體學的角色識別方法,從網(wǎng)絡文本中提取詞匯特征、語法特征和結構特征等能區(qū)分不同類型社區(qū)成員的發(fā)帖風格特征來判斷成員的角色,并通過實驗驗證了該方法的有效性。<

13、br>  (3)提出了適用于網(wǎng)絡健康社區(qū)中情感分析綜合模型。由于基于機器學習的情感分析方法和基于情感詞典的情感分析方法在應用于網(wǎng)絡健康社區(qū)的文本情感分析中各有利弊,我們提出了將兩者相結合的情感分析綜合模型,首先在文本的主客觀分類上,我們采用機器學習的方法,選取領域特征、詞性特征、文體特征等特征集,實現(xiàn)對文本的主客觀分類。然后在對主觀性文本的情感極性分析中,我們采用基于情感詞典的方法,利用外部情感詞典SentiWordNet來抽取文本中的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論