2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩87頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、隨著網(wǎng)絡(luò)上豐富且可用的評論資源不斷增加,針對觀點分析和觀點挖掘的研究應(yīng)運而生。它們針對這些來自網(wǎng)絡(luò)上對產(chǎn)品或社會問題的公眾評論的文本資源進行研究,并從中抽取和總結(jié)出重要觀點。本文研究并設(shè)計一種觀點分析系統(tǒng),它從無標(biāo)記的原始評論文本中抽取觀點和它們對應(yīng)的極性,并能夠建立觀點與極性的映射關(guān)系。研究的主要內(nèi)容如下。
  首先,著眼于觀點分析領(lǐng)域特征的抽取工作。從粒度的角度考慮特征的性質(zhì)可以將特征分為粗粒度特征和細粒度特征。在這部分內(nèi)容中

2、主要研究如何準(zhǔn)確的抽取一個事物最具代表性的粗粒度特征,進而圍繞這些粗粒度特征進行細粒度特征的抽取和篩選。研究中應(yīng)用bootstrapping等算法在沒有標(biāo)注的文本集合上學(xué)習(xí)相關(guān)于每個特征的詞語或短語,它們用于特征和極性的識別。然后,針對前人提出的特征相關(guān)詞語的歧義度計算方法和存在的問題進行分析和討論并在本文中提出一種計算歧義度的新方法,以及重新定義特征相關(guān)詞語的得分計算公式。
  第二,許多針對評論文本結(jié)構(gòu)的研究發(fā)現(xiàn),在真實評論文

3、本中的句子或段落通常包含兩個或兩個以上特征,這樣的句子或段落需要基于特征的文本分割方法。另外,本文的研究中發(fā)現(xiàn)在不同的評論文本之間長度存在著巨大的差距。針對這些現(xiàn)象,本文中提出了一種基于特征的文本分割方法叫做LSMAS,它基于兩種文本分割方法而且在它們的基礎(chǔ)上加以改進并提出了部分新的公式。
  第三,這部分的研究集中在評論文本的極性分析上。通用極性詞典普遍存在的問題是對依賴特定域的詞語或短語極性判斷精確度不高。為解決這個問題,在這

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論