版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、計(jì)算機(jī)與信息學(xué)院計(jì)算機(jī)與信息學(xué)院本科畢業(yè)論文(設(shè)計(jì))文獻(xiàn)綜述本科畢業(yè)論文(設(shè)計(jì))文獻(xiàn)綜述淺談數(shù)據(jù)挖掘淺談數(shù)據(jù)挖掘0前言隨著網(wǎng)絡(luò)的迅猛發(fā)展,依托于網(wǎng)絡(luò)的網(wǎng)絡(luò)購(gòu)物做為一種新型的消費(fèi)方式脫穎而出,在全國(guó)乃至全球范圍內(nèi)都在迅猛的發(fā)展。網(wǎng)絡(luò)購(gòu)物行業(yè)也越來(lái)越得到更多人的關(guān)注,與此同時(shí),各種研究方法、數(shù)據(jù)分析方法也被運(yùn)用到了關(guān)于網(wǎng)絡(luò)購(gòu)物的研究當(dāng)中。數(shù)據(jù)挖掘技術(shù)作為一種新的數(shù)據(jù)分析方法逐步應(yīng)用到網(wǎng)絡(luò)購(gòu)物的分析中,獲取數(shù)據(jù)、抽取規(guī)律、預(yù)測(cè)趨勢(shì)、建立模式,
2、這對(duì)促進(jìn)網(wǎng)絡(luò)購(gòu)物行業(yè)的健康、有序發(fā)展是十分有益的。本研究使用數(shù)據(jù)挖掘的方法,借助SAS工具,以阿里巴巴大數(shù)據(jù)競(jìng)賽的真實(shí)數(shù)據(jù)為基礎(chǔ),對(duì)天貓用戶購(gòu)物行為進(jìn)行了研究分析。1什么是數(shù)據(jù)挖掘數(shù)據(jù)挖掘(英語(yǔ):Datamining),又譯為資料探勘、數(shù)據(jù)采礦。它是數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)(英語(yǔ):KnowledgeDiscoveryinDatabases,簡(jiǎn)稱:KDD)中的一個(gè)步驟。數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過(guò)算法搜索隱藏于其中信息的過(guò)程。數(shù)據(jù)挖掘通常與計(jì)
3、算機(jī)科學(xué)有關(guān),并通過(guò)統(tǒng)計(jì)、在線分析處理、情報(bào)檢索、機(jī)器學(xué)習(xí)、專家系統(tǒng)(依靠過(guò)去的經(jīng)驗(yàn)法則)和模式識(shí)別等諸多方法來(lái)實(shí)現(xiàn)上述目標(biāo)。在較淺的層次上,它利用現(xiàn)有數(shù)據(jù)庫(kù)管理系統(tǒng)的查詢、檢索及數(shù)據(jù)挖掘功能,與多維分析、統(tǒng)計(jì)分析方法相結(jié)合,進(jìn)行聯(lián)機(jī)運(yùn)算分析處理,從而得出可供決策參考的統(tǒng)計(jì)分析數(shù)據(jù)的一個(gè)有商業(yè)意義的結(jié)果,這個(gè)結(jié)果可以出售給需要的賣家,這就是所謂的大數(shù)據(jù)分析。在深層次上,則從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)前所未有的、隱含的知識(shí)。例如:在大街上川流不息的車流
4、量,在普通人眼里,當(dāng)你通過(guò)一個(gè)十字路口時(shí),可能會(huì)看到除了塞車就是車禍,亦或者沒(méi)有事的安全通行,沒(méi)有其他的信息可能會(huì)有,如果是一個(gè)數(shù)據(jù)挖掘人員就會(huì)發(fā)現(xiàn)其中的數(shù)據(jù)信息,一小時(shí)會(huì)有橫向會(huì)有多少車流量,豎向會(huì)有多少車流量,這樣可以得到一組數(shù)據(jù),通過(guò)數(shù)據(jù)挖掘分析后得到更有的結(jié)果,十字路口的紅綠燈就可以根據(jù)車流量設(shè)置時(shí)間長(zhǎng)短。而從另一個(gè)角度,如果在十字路口進(jìn)行路線測(cè)繪的話,就可以得到類似地圖的數(shù)據(jù),手機(jī)中的導(dǎo)航軟件就是通過(guò)這樣實(shí)現(xiàn)的,所以我們生活中
5、數(shù)據(jù)挖掘無(wú)處不在,只是在我們不認(rèn)識(shí)數(shù)據(jù)挖掘時(shí),不會(huì)去發(fā)現(xiàn)。2數(shù)據(jù)挖掘的任務(wù)數(shù)據(jù)挖掘的兩個(gè)高層目標(biāo)是建立模型和預(yù)測(cè)。前者指用一些變量或數(shù)據(jù)庫(kù)的若干已知字段通過(guò)相應(yīng)的數(shù)據(jù)挖掘分析軟件,以及某些情況下需要實(shí)地考察,再結(jié)合團(tuán)隊(duì)間的分析,結(jié)合數(shù)們需要將預(yù)測(cè)的結(jié)果整理成一份通俗易懂的報(bào)告,最好附上圖表,讓上司或領(lǐng)導(dǎo)更易理解,這也是十分關(guān)鍵的一步,一個(gè)好的結(jié)論沒(méi)有表述好,可能就會(huì)被拋棄。5天貓用戶數(shù)據(jù)挖掘的分析及作用數(shù)據(jù)挖掘如果運(yùn)用到天貓、淘寶上,那
6、么他就目的只有一個(gè)就是盈利。我們都知道雙十一網(wǎng)購(gòu)狂歡節(jié),今年2014年1分鐘就交易額突破了1億,如此巨大的交易額,不光需要他龐大的用戶量,還需要就是分析他們的需求信息。天貓用戶那么多,首先一點(diǎn)就是需要明確每一個(gè)用戶需要買什么東西,這就是我們數(shù)據(jù)挖掘需要做的,在我們上網(wǎng)點(diǎn)擊的過(guò)程,其實(shí)就是他們數(shù)據(jù)采集的過(guò)程,他們通過(guò)你點(diǎn)擊瀏覽的網(wǎng)站就預(yù)測(cè)你的喜好及可能還會(huì)去點(diǎn)擊的網(wǎng)站,并在一個(gè)欄目對(duì)你播放相對(duì)應(yīng)的廣告,促使你更有欲望去購(gòu)買這些東西。6數(shù)據(jù)
7、挖掘的應(yīng)用領(lǐng)域及前景與國(guó)外相比,國(guó)內(nèi)對(duì)DMKD的研究稍晚,1993年國(guó)家自然科學(xué)基金首次開(kāi)始支持對(duì)該領(lǐng)域的研究項(xiàng)目。近年來(lái)發(fā)展迅速,進(jìn)行的大多數(shù)研究項(xiàng)目是由政府資助進(jìn)行的,如國(guó)家自然科學(xué)基金、863計(jì)劃、“九五”計(jì)劃等。所涉及的研究領(lǐng)域很多,一般集中于學(xué)習(xí)算法的研究、數(shù)據(jù)挖掘的實(shí)際應(yīng)用以及有關(guān)數(shù)據(jù)挖掘理論方面的研究。國(guó)內(nèi)從事數(shù)據(jù)挖掘研究的機(jī)構(gòu)主要在大學(xué),也有部分在研究所或公司。當(dāng)前數(shù)據(jù)挖掘應(yīng)用主要集中在電信、零售、農(nóng)業(yè)、網(wǎng)絡(luò)日志、銀行、
8、電力、生物、天體、化工、醫(yī)藥等方面。5結(jié)論數(shù)據(jù)挖掘技術(shù)是一個(gè)讓你從無(wú)知到有知的探索,商業(yè)利益的強(qiáng)大驅(qū)動(dòng)力將會(huì)不停地促進(jìn)它的發(fā)展,每年都有新的數(shù)據(jù)挖掘方法和模型問(wèn)世,人們對(duì)它的研究正日益廣泛和深入,他也將變得更加具有交互性、可視性。[參考文獻(xiàn)][1]彭劍芳.基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)購(gòu)物行為的分析[D].云南:云南大學(xué),2011.5.1.[2]毛國(guó)君.數(shù)據(jù)挖掘技術(shù)與關(guān)聯(lián)規(guī)則挖掘算法研究[D].北京:北京工業(yè)大學(xué),2003.5.1.[3]李菁菁,邵
9、培基,黃亦瀟,等.數(shù)據(jù)挖掘在中國(guó)的現(xiàn)狀和發(fā)展研究[J].管理工程學(xué)報(bào),2004(03):10~15.[4]毛國(guó)君,等.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社2005.[5]PangNingTan,MichaelSteinbach,VipinKum.數(shù)據(jù)挖掘?qū)д揫M]北京:人民郵電出版社2010.12.10[6]DavidH,HelkkiMannila,PadhraicSmyth.數(shù)據(jù)挖掘原理[J]北京:機(jī)械工業(yè)出版社200909
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)據(jù)挖掘畢業(yè)論文外文翻譯
- 畢業(yè)論文--數(shù)據(jù)挖掘k均值算法實(shí)現(xiàn)
- 數(shù)據(jù)挖掘與顧客關(guān)系管理畢業(yè)論文
- 基于大數(shù)據(jù)的社交網(wǎng)絡(luò)數(shù)據(jù)挖掘-畢業(yè)論文
- 畢業(yè)論文--數(shù)據(jù)挖掘k均值算法實(shí)現(xiàn)
- 基于大數(shù)據(jù)的社交網(wǎng)絡(luò)數(shù)據(jù)挖掘-畢業(yè)論文
- 數(shù)據(jù)挖掘之分類算法的研究畢業(yè)論文
- 基于matlab的數(shù)據(jù)挖掘技術(shù)研究【畢業(yè)論文】
- 數(shù)據(jù)流上頻繁項(xiàng)挖掘方法研究畢業(yè)論文
- 挖掘機(jī)畢業(yè)論文
- 數(shù)據(jù)挖掘技術(shù)在高職招生中的應(yīng)用-畢業(yè)論文
- 通用數(shù)據(jù)挖掘——基于數(shù)據(jù)庫(kù)的用戶群篩選-畢業(yè)論文
- 畢業(yè)設(shè)計(jì)論文--數(shù)據(jù)挖掘技術(shù)
- 淺談php(畢業(yè)論文)
- 大數(shù)據(jù)畢業(yè)論文
- 畢業(yè)論文 數(shù)據(jù)挖掘算法在銀行客戶細(xì)分中的應(yīng)用
- 畢業(yè)論文《淺談“拒絕采訪”》
- 淺談店面銷售畢業(yè)論文
- 淺談商業(yè)插畫(huà)畢業(yè)論文
- 畢業(yè)論文《淺談教育公平》
評(píng)論
0/150
提交評(píng)論