2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩86頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著Web2.0的迅速發(fā)展,用戶越來越多地參與到互聯(lián)網的信息交互中,形成了以標簽為代表的社會化標記等廣泛應用。盡管圍繞著標簽應用進行的研究日益增多,標簽應用的性能提升卻遇到了瓶頸。從描述資源和分享信息的角度來講,標簽標注的準確性意義重大。在標簽應用越來越廣泛的今天,如何為資源自動生成準確的標簽則成為了非常值得研究的課題。
  本文在分析當今標簽研究領域特點和問題的基礎上,以博客標簽為研究點,提出了從不同標簽類別的角度為資源自動推薦

2、標簽的方法。這一方法本著設計分類體系、對標簽分類、判斷博文缺失標簽類別、對缺失類別進行標簽推薦這一思路完成最終研究目的。首先從描述資源全面性考慮為標簽設計特定分類體系,并以此分類體系作為研究基礎。通過綜合運用正則表達式抽取、詞典識別、語義區(qū)分度計算等方式實現將博文標簽由簡單到復雜、逐類區(qū)分的一種快速高效的自動分類算法,將博文標簽分類到本文設計的標簽分類體系。為了實現類別的細化和主題含義區(qū)分,本文考察標簽層次概念關系、標簽間共現分布差異,

3、并借助同層概念詞典,將主題類標簽細化為三層主題含義,從而為后續(xù)推薦精確的標簽提供依據。其次通過從發(fā)布者及使用者兩個角度考察單類別標簽的分布規(guī)律以及多標簽類別間關聯(lián)分布規(guī)律,找出現有標簽類別的相關性,并據此給出一個發(fā)現博文標簽缺失類別的方法。最后根據博文缺失的類別為該類別推薦標簽,并針對不同的推薦問題,提出基于文本相似度、基于文本自身屬性以及基于層次關系這三種標簽推薦方法。
  本文將通過實驗驗證標簽分類算法的高速性及有效性,并通過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論