Behaviors Modeling and Analysis of Big Data from Web Apps Using Machine Learning and Deep Rnn Techniques.pdf_第1頁
已閱讀1頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、本文提出了一種移動計算的大數(shù)據(jù)服務應用,它是一種基于上下文情境處理網(wǎng)絡平臺用戶文本數(shù)據(jù)的方法,應用數(shù)據(jù)挖掘技術和深度機器學習技術來進行想法/行為建模和數(shù)據(jù)分析。研究展示了,如何在文本數(shù)據(jù)處理過程中應用深度遞歸神經(jīng)網(wǎng)絡(Deep RNN)算法、機器學習和模式識別,如何進行聯(lián)想記憶保存和實驗優(yōu)化,如何通過Python編程建立機器學習庫。在這些工作中,基于深度遞歸神經(jīng)網(wǎng)絡算法的Python開發(fā)的模型架構,用來為文本行為模型提供概念支持,通過語

2、境詞特征識別來進行總體數(shù)據(jù)分析的行為檢測。
  首先,研究展示了一個web應用程序的示例原型,它是可以獲取用戶關于項目評論等的文本的一個系統(tǒng)(文中稱為行為數(shù)據(jù),可以用于數(shù)據(jù)收集的電子服務),可以看做行為分析項目的數(shù)據(jù)源。主要研究了深度RNN算法和行為建模概念如何應用到這樣的分類數(shù)據(jù)集的行為模式檢測中。通過觀察潛在的上下文特征(詞在文本中的情感屬性),可以與一些行為模式關聯(lián)起來作為句子/段落/文件/記錄的子集。方法包括:首先,手工數(shù)

3、據(jù)注釋作為標簽記錄集的局部思想建模和行為檢測方法。其次,建立向量數(shù)組的詞集(上下文感知特性),然后應用深度RNN算法來實現(xiàn)監(jiān)督機器學習技術,此技術通過檢測這些情景化特征向量的有序發(fā)生來學習,再構建智能的文本形式模型。文本模型應該準確地產(chǎn)生可接受的目標預測,描述了與已知的分類顯著的相似性,在訓練算法時通過自動條款推理機制進行行為學習。隨后,我們能夠定義適當?shù)臄?shù)據(jù)表示(行為建模),在這些數(shù)據(jù)表示和構建模型的推斷中學習。
  通過執(zhí)行基

4、于機器學習方法,特別是深度RNN學習,它使用包含上下文保存詞特征的數(shù)值化向量作為數(shù)組輸入,進行訓練和測試以解釋本文中所提出的方法。第一個文本語料庫是轉(zhuǎn)換成一個矩陣向量即數(shù)組的句子,單詞的數(shù)值化格式(同樣單詞出現(xiàn)的次數(shù))。這些向量通過使用分布式(DM)目標詞來預測詞匯在文檔中的上下文關系。接下來,深層神經(jīng)網(wǎng)絡學習算法被用來通過計算特征識別功能學習向量模式。在神經(jīng)網(wǎng)絡設計的多維矩陣中,采用低水平代數(shù)計算優(yōu)化支持差異化的數(shù)學表達式。此外,存儲

5、單元元素作為神經(jīng)元單位被定位在網(wǎng)絡中,用來有效構建、存儲和維持確定信號在每個階段的復現(xiàn)。
  盡管擬議的方法可能適用于廣泛的網(wǎng)頁和移動計算環(huán)境的情況下,但人們更關注情感數(shù)據(jù)。用案例研究的實驗,使用合成和真實世界數(shù)據(jù)進行情感分析(SA);通過特征建模和算法訓練得到文本模型,進行分析和評估。通過使用可靠的性能指標評估,部署了真實行為檢測場景的智能文本模式,最后分析討論了結果。實驗結果證明,我的方法實現(xiàn)了準確、健壯和可靠的解決方案,可以

6、克服以前存在的一些問題。進一步,通過比較它與其他流行多分類器算法來測試本算法的有效性,包括:KNN,隨機森林和消極/積極的分類器算法。初步結果表明,與其他方法相比這種方法更有效。在研究的過程中,基于如何獲得實用技能和知識提出了一些關鍵的討論,識別潛在的觀念行為,推導出行為模型,并報告興趣的數(shù)據(jù)分析工作。進一步論文給出了特征建模的一些改進方法,以維持精確算法設計及優(yōu)化,同時引入其他數(shù)據(jù)類型來幫助實現(xiàn)更好的系統(tǒng)并避免過多的復雜度。
 

7、 因此,本文行為建模的研究包括以下四個階段:(1)確定一個行為方面和必要的上下文特征作為文本數(shù)據(jù)。(2)像web-app功能服務定義的那樣,通過網(wǎng)絡與云存儲收集來自用戶的上下文數(shù)據(jù)。(3)使用收集的數(shù)據(jù)來執(zhí)行深度機器學習,使用最適當?shù)臄?shù)據(jù)挖掘工具來分析和陳述事實。(4)評估、驗證和基準測試等其他工作。本研究為通過提供現(xiàn)實的、理論的和經(jīng)過分析的網(wǎng)頁數(shù)據(jù)來進行機器學習,使用上下文特征的ML和RNN算法,使用模式分析工具和大數(shù)據(jù)分析進行行為建

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論