市場(chǎng)營(yíng)銷中的數(shù)據(jù)分析方法_第1頁(yè)
已閱讀1頁(yè),還剩70頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、市場(chǎng)營(yíng)銷中的數(shù)據(jù)分析方法,,報(bào)告內(nèi)容,原理篇客戶關(guān)系管理中的數(shù)量方法 方法篇數(shù)據(jù)分析方法概論統(tǒng)計(jì)分析方法數(shù)據(jù)挖掘分析方法 工具篇常用數(shù)據(jù)分析工具簡(jiǎn)介 總結(jié)基本結(jié)論,,市場(chǎng)營(yíng)銷中的數(shù)量決策問題,傳統(tǒng)的純粹定性描述方法已遠(yuǎn)遠(yuǎn)不能滿足現(xiàn)代市場(chǎng)營(yíng)銷實(shí)踐的需要,為了體現(xiàn)市場(chǎng)營(yíng)銷學(xué)本身的科學(xué)性和對(duì)企業(yè)實(shí)踐的指導(dǎo)性,數(shù)據(jù)分析理論與方法在市場(chǎng)營(yíng)銷學(xué)中占有越來越重要的地位。理論上->計(jì)量市場(chǎng)營(yíng)銷學(xué)的出現(xiàn)理念上->數(shù)據(jù)庫(kù)營(yíng)

2、銷、關(guān)系營(yíng)銷的興起實(shí)務(wù)上->數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用探察數(shù)量決策問題的兩個(gè)視角理論上的框架要素實(shí)務(wù)上的業(yè)務(wù)流程,,視角一:市場(chǎng)營(yíng)銷學(xué)的理論框架,,核心概念營(yíng)銷觀念,營(yíng)銷計(jì)劃營(yíng)銷組織營(yíng)銷控制營(yíng)銷審計(jì),產(chǎn)品策略定價(jià)策略分銷策略促銷策略,需求分析市場(chǎng)細(xì)分目標(biāo)市場(chǎng)市場(chǎng)定位,,,基礎(chǔ)理論,戰(zhàn)略理論,策略理論,管理理論,,視角一示例:市場(chǎng)營(yíng)銷中的產(chǎn)品決策,產(chǎn)品定位定位圖分析(感知定位圖、偏好定位圖等)

3、新產(chǎn)品擴(kuò)散與產(chǎn)品生命周期管理巴斯模型(BASS Model)生長(zhǎng)曲線模型(Growth Curve Model)品牌決策消費(fèi)者品牌選擇模型,視角二示例:電信業(yè)業(yè)務(wù)流程視圖(eTOM),,視角二示例:理解客戶與市場(chǎng),市場(chǎng)購(gòu)買行為消費(fèi)者購(gòu)買行為模型消費(fèi)者品牌選擇模型市場(chǎng)需求測(cè)量市場(chǎng)需求預(yù)測(cè)模型市場(chǎng)細(xì)分,客戶生命周期與市場(chǎng)營(yíng)銷策略,,客戶生命周期,在不同生命周期階段需考慮不同問題,,如何發(fā)現(xiàn)并獲取潛在客戶?,階段A (A

4、cquisition)客戶獲取,,,,如何把客戶培養(yǎng)成高價(jià)值客戶?,階段B:(Build-up)客戶提升,如何使客戶使用新電信產(chǎn)品?如何培養(yǎng)顧客忠誠(chéng)度?,階段C:(Climax)客戶成熟,,如何延長(zhǎng)客戶“生命周期”?,階段D:(Decline)客戶衰退,,如何贏回客戶?,階段E:(Exit)客戶離網(wǎng),,,,客戶價(jià)值,多種分析主題在不同時(shí)期應(yīng)用,,客戶獲取市場(chǎng)細(xì)分與產(chǎn)品定位目標(biāo)客戶特征識(shí)別,刺激需求提升銷售,交叉

5、銷售目標(biāo)營(yíng)銷,客戶保持生存分析客戶風(fēng)險(xiǎn),客戶挽留,,客戶細(xì)分,細(xì)分是指將一個(gè)大的消費(fèi)群體劃分成一個(gè)個(gè)細(xì)分群的動(dòng)作,同屬于一個(gè)細(xì)分群的消費(fèi)者彼此相似,而隸屬于不同細(xì)分群的消費(fèi)者被視為不同。細(xì)分的目的可以讓管理者從一個(gè)比較高的層次上“鳥瞰”整個(gè)數(shù)據(jù)庫(kù)中的數(shù)據(jù),從而可以用不同的方法對(duì)待處于不同細(xì)分群眾的客戶,提供相對(duì)個(gè)性化的服務(wù)??蛻艏?xì)分的目的更好的了解客戶結(jié)構(gòu)改善客戶管理與溝通增加客戶貢獻(xiàn)度客戶細(xì)分中的數(shù)量方法聚類分析卡

6、方自動(dòng)交互檢測(cè)(CHAID),營(yíng)銷策略客戶保持基于獎(jiǎng)賞及高成本事件驅(qū)動(dòng)的保持策略專注的, 區(qū)分優(yōu)先級(jí)的Call center支持客戶獲取刻畫子分群的特征建立跟蹤系統(tǒng)(tracking systems)以從價(jià)值的角度監(jiān)控新來的客戶交叉銷售對(duì)高價(jià)值客戶進(jìn)行交叉銷售會(huì)產(chǎn)生更大的收益,,經(jīng)常地, 頭20%的客戶貢獻(xiàn)了將近100% 的整體利潤(rùn). 這些客戶對(duì)CRM策略開發(fā)是至關(guān)重要的。,示例:基于價(jià)值的客戶細(xì)分(高價(jià)值客戶),中間層

7、代表了客戶的大多數(shù). 他們利潤(rùn)較?。╰hin margins)但容量巨大(high volume).,,營(yíng)銷策略定價(jià)與行為改變識(shí)別服務(wù)機(jī)會(huì) – 增強(qiáng)可能的定價(jià)結(jié)構(gòu)性定價(jià)以鼓勵(lì)改善收益性的行為交叉銷售利用預(yù)測(cè)模型識(shí)別具有潛在價(jià)值的客戶利用事件營(yíng)銷與關(guān)系營(yíng)銷策略去增加產(chǎn)品的持有量渠道與服務(wù)的效率識(shí)別高成本/低回報(bào)的渠道并重新部署或調(diào)整結(jié)構(gòu)定位高成本業(yè)務(wù)流程以流線化或渠道遷移,示例:基于價(jià)值的客戶細(xì)分(中價(jià)值客戶),盡管數(shù)量

8、很少 (10% to 20%) 但他們消除了很大一部分的利潤(rùn).,,營(yíng)銷策略改變定價(jià)識(shí)別與負(fù)利潤(rùn)相關(guān)的定價(jià)策略與行為, 鼓勵(lì)服務(wù)使用與目標(biāo)定價(jià)以增加或引入由服務(wù)改變而帶來的可能收入客戶風(fēng)險(xiǎn)避免向具有信用風(fēng)險(xiǎn)的客戶進(jìn)行交叉銷售客戶獲取識(shí)別低價(jià)值客戶并積極地在獲取過程中避免與這類客戶發(fā)生接觸,示例:基于價(jià)值的客戶細(xì)分(低價(jià)值客戶),,,High Value ??,High Value ??,Low Value ??,Low Val

9、ue ??,示例:基于生命階段的客戶細(xì)分,,客戶獲取,在大多數(shù)商業(yè)領(lǐng)域中,業(yè)務(wù)發(fā)展的主要指標(biāo)里包括新客戶的獲取能力。新客戶的獲取包括發(fā)現(xiàn)那些對(duì)你的產(chǎn)品不了解的客戶,也包括以前接受你的競(jìng)爭(zhēng)對(duì)手服務(wù)的顧客??蛻臬@取中的數(shù)量方法特征識(shí)別(Profiling and Penetration Analysis)響應(yīng)模型(Response Model),,客戶保持,隨著行業(yè)的競(jìng)爭(zhēng)越來越激烈和獲得一個(gè)新客戶的開支愈來愈大,保持原有客戶的工作愈

10、來愈有價(jià)值??蛻舯3种械臄?shù)量方法流失預(yù)測(cè)模型客戶忠誠(chéng)度模型,,交叉銷售與提升銷售,交叉營(yíng)銷是指你向現(xiàn)有的客戶提供新的產(chǎn)品和服務(wù)的營(yíng)銷過程。公司與其客戶之間的商業(yè)關(guān)系是一種持續(xù)的不斷發(fā)展的關(guān)系,在這種關(guān)系建立起來以后,可以有很多種方法來不斷改善這種關(guān)系。雙方的目標(biāo)是達(dá)到雙贏的結(jié)果,客戶獲益是由于他們得到了更好更貼切的服務(wù)質(zhì)量,商家則因?yàn)樵黾愉N售量獲利。交叉銷售中的數(shù)量方法購(gòu)買傾向預(yù)測(cè)產(chǎn)品關(guān)聯(lián)分析,客戶流失,客戶流失預(yù)警分品牌

11、、高/中/低價(jià)值、主動(dòng)/被動(dòng)構(gòu)建模型分類預(yù)測(cè)數(shù)據(jù)挖掘模型客戶挽留流程設(shè)計(jì)彩鈴客戶流失預(yù)警分主動(dòng)/捆綁構(gòu)建模型分類預(yù)測(cè)數(shù)據(jù)挖掘模型客戶挽留流程設(shè)計(jì)競(jìng)爭(zhēng)對(duì)手流失預(yù)警聯(lián)通用戶流失預(yù)測(cè)客戶挽留流程設(shè)計(jì),交叉銷售與提升銷售,購(gòu)買傾向預(yù)測(cè)彩鈴預(yù)測(cè)模型彩信預(yù)測(cè)模型WAP預(yù)測(cè)模型購(gòu)物藍(lán)分析產(chǎn)品關(guān)聯(lián)分析營(yíng)銷方案關(guān)聯(lián)分析提升銷售價(jià)值提升預(yù)測(cè)模型,營(yíng)銷案預(yù)演,營(yíng)銷預(yù)演是為了支持業(yè)務(wù)人員制訂新的資費(fèi)營(yíng)銷方案,然后對(duì)該方案在歷史

12、數(shù)據(jù)上做相應(yīng)的測(cè)算,從而根據(jù)測(cè)算結(jié)果來指導(dǎo)下一步工作。,營(yíng)銷活動(dòng)管理-CMP,KPI預(yù)測(cè)模型,個(gè)人客戶分群,個(gè)人客戶價(jià)值評(píng)估,新產(chǎn)品生命周期分析,,報(bào)告內(nèi)容,原理篇客戶關(guān)系管理中的數(shù)量方法 方法篇數(shù)據(jù)分析方法概論統(tǒng)計(jì)分析方法數(shù)據(jù)挖掘分析方法 工具篇常用數(shù)據(jù)分析工具簡(jiǎn)介 總結(jié)基本結(jié)論,,數(shù)量分析方法(Quantitative Analysis),數(shù)量分析是對(duì)事物的數(shù)量特征、數(shù)量關(guān)系與數(shù)量變化的分析。數(shù)量分析的類型按照

13、分析的目的探索性數(shù)據(jù)分析描述性數(shù)據(jù)分析解釋性數(shù)據(jù)分析按照問題的本質(zhì)確定性分析不確定性分析,,數(shù)量分析中的模型化方法,數(shù)量模型是對(duì)現(xiàn)實(shí)問題的描述和模仿模型是為認(rèn)識(shí)目的或?qū)嵺`目的而建立的典型的模型化過程,數(shù)據(jù)分析模型,E.F.Codd的數(shù)據(jù)分析模型絕對(duì)模型(Categorical Model):依據(jù)預(yù)定義路徑尋找原因,如查詢解釋模型(Exegetical Model):依據(jù)多層次路徑尋找原因,如多維分析思考模型(Con

14、templative Model):參數(shù)化路徑,如場(chǎng)景分析公式模型(Formulaic Model):模型化路徑,如數(shù)據(jù)挖掘,,What happened ?,Why did it happen ?,What will happen ?,,ROI,,應(yīng)用復(fù)雜性,,Human Discovery,Machine-assisted Discovery,,常用的數(shù)據(jù)分析方法/模型,數(shù)量分析是對(duì)事物的數(shù)量特征、數(shù)量關(guān)系與數(shù)量變化的分析。數(shù)量

15、分析的類型按照分析的目的探索性數(shù)據(jù)分析描述性數(shù)據(jù)分析解釋性數(shù)據(jù)分析按照問題的本質(zhì)確定性分析不確定性分析,,認(rèn)識(shí)分析數(shù)據(jù):數(shù)據(jù)測(cè)量尺度,名義尺度有序尺度間隔尺度比例尺度,,認(rèn)識(shí)分析數(shù)據(jù):數(shù)據(jù)結(jié)構(gòu)類型,截面數(shù)據(jù)(Cross-section Data)時(shí)間序列數(shù)據(jù)(Time-series Data)面板數(shù)據(jù)(Panel Data),,數(shù)據(jù)分析的出發(fā)點(diǎn):數(shù)據(jù)矩陣,截面數(shù)據(jù)(Cross-section Data)時(shí)間序列

16、數(shù)據(jù)(Time-series Data)面板數(shù)據(jù)(Panel Data),,常用的統(tǒng)計(jì)分析方法,數(shù)據(jù)分類分析聚類分析判別分析數(shù)據(jù)化簡(jiǎn)分析主成分分析因子分析數(shù)據(jù)相關(guān)分析回歸分析典型相關(guān)分析數(shù)據(jù)預(yù)測(cè)分析時(shí)間序列預(yù)測(cè),什么是數(shù)據(jù)挖掘?,Data,Information,Knowledge,Wisdom,存在太多數(shù)據(jù)挖掘的定義,但基本上有這樣一種描述結(jié)構(gòu)To find / discover / extract / dr

17、edge / harvest 、、、Interesting / novel / useful / implicit / actable / meaningful 、、、Information / knowledge / patterns / trends / rules / anomalies 、、、In massive data / large data set / large database / data warehouse

18、 、、、,Data + context,Information + rules,Knowledge + experience,為什么會(huì)出現(xiàn)數(shù)據(jù)挖掘?,數(shù)據(jù)爆炸性增長(zhǎng)是數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生的根本原因。只見樹木,不見森林(Drowning in data but starving for information)計(jì)算復(fù)雜度數(shù)據(jù)管理問題數(shù)據(jù)類型的多樣性,處理大容量數(shù)據(jù)是數(shù)據(jù)挖掘技術(shù)區(qū)別于其他數(shù)據(jù)分析方法的唯一標(biāo)志嗎?,其他數(shù)據(jù)

19、分析方法:統(tǒng)計(jì)學(xué),從處理數(shù)據(jù)的角度看、、、數(shù)據(jù)規(guī)模不同數(shù)據(jù)來源不同:觀測(cè)數(shù)據(jù)(Secondary Analysis) VS 試驗(yàn)數(shù)據(jù)(Primary Analysis)數(shù)據(jù)類型不同(結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù))從分析思想的角度看更關(guān)注實(shí)證性分析(Empirical Analysis)而非探索性分析(Exploratory Analysis)更關(guān)注模型(Model)而非算法(Algorithm)但二者具有相當(dāng)密切

20、的聯(lián)系從數(shù)據(jù)分析的角度,統(tǒng)計(jì)學(xué)現(xiàn)在是且仍將是數(shù)據(jù)挖掘最重要的技術(shù)支撐和思想源泉更加深入的滲透和交叉(如探索性數(shù)據(jù)分析,EDA),數(shù)據(jù)挖掘是數(shù)據(jù)驅(qū)動(dòng)的探索性分析 !,數(shù)據(jù)挖掘:多學(xué)科的匯合,數(shù)據(jù)挖掘,數(shù)據(jù)庫(kù)技術(shù),統(tǒng)計(jì)學(xué),其它學(xué)科,信息科學(xué),機(jī)器學(xué)習(xí),可視化,,,,,,,人工智能,,科學(xué)計(jì)算,,數(shù)據(jù)挖掘是一個(gè)過程,“from data mining to knowledge discovery in database”. U. fay

21、yad, G.P.Shapiro and P.Smyth (1996),數(shù)據(jù)挖掘過程中的數(shù)據(jù)預(yù)處理,數(shù)據(jù)清洗填充缺失值, 修均噪聲數(shù)據(jù), 識(shí)別或刪除孤立點(diǎn), 并解決數(shù)據(jù)不一致問題主要分析方法:分箱(Binning)、聚類、回歸數(shù)據(jù)集成多個(gè)數(shù)據(jù)庫(kù)、數(shù)據(jù)方或文件的集成數(shù)據(jù)變換規(guī)范化與匯總數(shù)據(jù)簡(jiǎn)化減少數(shù)據(jù)量的同時(shí), 還可以得到相同或相近的分析結(jié)果主要分析方法:抽樣、主成分分析數(shù)據(jù)離散化數(shù)據(jù)簡(jiǎn)化的一部分, 但非常重要 (尤

22、其對(duì)于數(shù)值型數(shù)據(jù)來說),數(shù)據(jù)挖掘過程中的數(shù)據(jù)探索,探索性數(shù)據(jù)分析(Exploratory Data Analysis, EDA)探索性地查看數(shù)據(jù),概括數(shù)據(jù)集的結(jié)構(gòu)和關(guān)系對(duì)數(shù)據(jù)集沒有各種嚴(yán)格假定“玩”數(shù)據(jù)主要任務(wù)數(shù)據(jù)可視化(a picture is worth a thousand words)殘差分析(數(shù)據(jù)=擬合 + 殘差)數(shù)據(jù)的重新表達(dá)(什么樣的尺度-對(duì)數(shù)抑或平方跟-會(huì)簡(jiǎn)化分析?)方法的耐抗性(對(duì)數(shù)據(jù)局部不良的不敏感性

23、,如中位數(shù)耐抗甚于均值)常見方法統(tǒng)計(jì)量,如均值、方差、根方差、協(xié)方差、峰度、偏度、相關(guān)系數(shù)等統(tǒng)計(jì)圖,如餅圖、直方圖、散點(diǎn)圖、箱尾圖等模型,如聚類,數(shù)據(jù)挖掘結(jié)果的評(píng)價(jià),興趣度度量:一個(gè)模式是有意義的,如果它易于被人理解,在某種程度上,對(duì)于新數(shù)據(jù)或者測(cè)試數(shù)據(jù)是有效的、潛在有用或者驗(yàn)證了用戶渴望確認(rèn)的某些假設(shè)。目前仍無很好的解決辦法,很大程度上仍依靠人工不存在解決這個(gè)問題的簡(jiǎn)單技術(shù),最終答案是不要把數(shù)據(jù)挖掘當(dāng)作脫離數(shù)據(jù)內(nèi)涵的簡(jiǎn)單技

24、術(shù)來運(yùn)用客觀興趣度:基于統(tǒng)計(jì)或模式的結(jié)構(gòu),如統(tǒng)計(jì)量、支持度、lift等主觀興趣度:基于用戶對(duì)數(shù)據(jù)的確信程度,如意外程度、新奇程度或者可行動(dòng)性等過度擬合(Over-fitting)問題,什么不是數(shù)據(jù)挖掘?,定量分析(Quantitative Analysis)的需要存在企業(yè)管理運(yùn)行的各個(gè)側(cè)面或環(huán)節(jié),但并非所有的定量分析問題都可以歸結(jié)到數(shù)據(jù)挖掘范疇的問題。簡(jiǎn)單的報(bào)表、圖表及多維分析仍是日常分析工作的主要內(nèi)容小樣本數(shù)據(jù)的分析傳統(tǒng)統(tǒng)計(jì)

25、分析方法更成熟有效,如趨勢(shì)預(yù)測(cè)某些特定業(yè)務(wù)問題無法用數(shù)據(jù)挖掘算法加以解決,例如資源最優(yōu)配置問題是個(gè)運(yùn)籌學(xué)問題某些物流管理問題或者供應(yīng)鏈管理問題是個(gè)隨機(jī)規(guī)劃問題營(yíng)銷預(yù)演本質(zhì)是個(gè)系統(tǒng)仿真問題,幾個(gè)基本概念,模型(Model) vs 模式(Pattern)數(shù)據(jù)挖掘的根本目的就是把樣本數(shù)據(jù)中隱含的結(jié)構(gòu)泛化(Generalize)到總體(Population)上去模型:對(duì)數(shù)據(jù)集的一種全局性的整體特征的描述或概括,適用于數(shù)據(jù)空間中的所有

26、點(diǎn),例如聚類分析模式:對(duì)數(shù)據(jù)集的一種局部性的有限特征的描述或概括,適用于數(shù)據(jù)空間的一個(gè)子集,例如關(guān)聯(lián)分析算法(Algorithm):一個(gè)定義完備(well-defined)的過程,它以數(shù)據(jù)作為輸入并產(chǎn)生模型或模式形式的輸出描述型挖掘(Descriptive) vs 預(yù)測(cè)型挖掘(Predictive)描述型挖掘:對(duì)數(shù)據(jù)進(jìn)行概括,以方便的形式呈現(xiàn)數(shù)據(jù)的重要特征預(yù)測(cè)型挖掘:根據(jù)觀察到的對(duì)象特征值來預(yù)測(cè)它的其他特征值描述型挖掘可以是

27、目的,也可以是手段,幾類基本的挖掘算法,關(guān)聯(lián)規(guī)則(模式、描述型)發(fā)現(xiàn)數(shù)據(jù)集中的頻繁模式例如:buy(x,”diapers”) ? buy(x,”beers”) [0.5%, 60%]分類與預(yù)測(cè)(模型、預(yù)測(cè)型)發(fā)現(xiàn)能夠區(qū)分或預(yù)測(cè)目標(biāo)變量(唯一的)的規(guī)則或者函數(shù)分類的目標(biāo)變量一般是范疇型的,而預(yù)測(cè)則是數(shù)量型的,并不必然帶有任何時(shí)間延續(xù)型的暗示例如:股票市值的預(yù)測(cè),病人病情的判斷聚類(模型、描述型)對(duì)數(shù)據(jù)分組以形成新類,類標(biāo)記

28、是未知的例如:市場(chǎng)細(xì)分孤立點(diǎn)探測(cè)(Outlier Detection)(模式、預(yù)測(cè)型)分析異?;蛟肼晹?shù)據(jù)的行為模式例如:欺詐檢測(cè),關(guān)聯(lián)規(guī)則的基本概念,基本定義給定(1)事務(wù)數(shù)據(jù)集(2)每個(gè)事務(wù)是數(shù)據(jù)項(xiàng)的集合,試圖發(fā)現(xiàn)項(xiàng)集中的頻繁模式或關(guān)聯(lián)關(guān)系所謂頻繁模式或者關(guān)聯(lián)規(guī)則就是一個(gè)具有“A ? B”形式的邏輯蘊(yùn)涵式頻繁模式并不必然蘊(yùn)涵著因果關(guān)系或相關(guān)關(guān)系!算法實(shí)現(xiàn)基本上基于APRIORI法則:頻繁項(xiàng)集的所有非空子集一定也是頻繁(

29、Frequent)的基本分類布爾關(guān)聯(lián)規(guī)則 vs 定量關(guān)聯(lián)規(guī)則buy(x,”diapers”) ? buy(x,”beers”)Age(x,”30..39”) ^ income(x,”42k..48k”) ? buy(x,”PC”)單維關(guān)聯(lián)規(guī)則 vs 多維關(guān)聯(lián)規(guī)則單層關(guān)聯(lián)規(guī)則 vs 多層關(guān)聯(lián)規(guī)則Age(x,”30..39”) ^ income(x,”42k..48k”) ? buy(x,”IBM PC”)序列模式(Sequ

30、ence Pattern)數(shù)據(jù)項(xiàng)是一個(gè)包含時(shí)間標(biāo)簽的序偶[item(i),t],關(guān)聯(lián)規(guī)則的度量,發(fā)現(xiàn)具有最小置信度和支持度的全部規(guī)則 X ^ Y ? Z 支持度(support), s, 事務(wù)中包含{X & Y & Z}的概率置信度(confidence), c, 事務(wù)中包含{X & Y}的條件下, 包含Z的條件概率,令最小支持度為50%, 最小置信度為50%, 則有A ? C (50%, 66.6

31、%)C ? A (50%, 100%),,,,,,顧客購(gòu)買尿布,顧客購(gòu)買兩者,顧客購(gòu)買啤酒,,對(duì)支持度與置信度的批判,示例總共5000名學(xué)生, 其中3000人玩籃球3750人吃谷類食品2000人既玩籃球又吃谷類食品play basketball ? eat cereal [40%, 66.7%] 是一個(gè)誤導(dǎo)規(guī)則, 因?yàn)槌怨阮愂称返膶W(xué)生占學(xué)生總數(shù)的75%, 比66.7%更高play basketball ? not

32、 eat cereal [20%, 33.3%] 其實(shí)是一個(gè)更精確的規(guī)則, 盡管它的支持度和置信度都比較低,關(guān)聯(lián)規(guī)則的應(yīng)用,市場(chǎng)購(gòu)物籃分析(Market Basket Analysis)例如一個(gè)事務(wù)是客戶的一個(gè)購(gòu)物清單,同一客戶的兩份清單被認(rèn)為是兩個(gè)不同的事務(wù)數(shù)據(jù)項(xiàng)是所有可能陳列貨物的全集目標(biāo)是發(fā)現(xiàn)同時(shí)出現(xiàn)的貨品組合間的關(guān)聯(lián)模式應(yīng)用:商品貨價(jià)設(shè)計(jì)、倉(cāng)儲(chǔ)規(guī)劃、網(wǎng)頁(yè)布局、產(chǎn)品目錄設(shè)計(jì)等等交叉銷售(Cross Selling)客戶

33、依次購(gòu)買不同產(chǎn)品的序列目標(biāo)是發(fā)現(xiàn)在購(gòu)買某一產(chǎn)品組合之后客戶可能購(gòu)買的另一產(chǎn)品或服務(wù)應(yīng)用:網(wǎng)絡(luò)故障分析、網(wǎng)站門戶設(shè)計(jì)等,分類問題的基本定義,給定一數(shù)據(jù)集合(訓(xùn)練集)數(shù)據(jù)記錄由一系列變量組成其中有一個(gè)變量是目標(biāo)分類標(biāo)簽尋找一模型,使目標(biāo)分類變量值是其他變量值的一個(gè)函數(shù)利用上述函數(shù),一未知分類變量值的數(shù)據(jù)記錄能夠盡可能準(zhǔn)確地被判定到某一類別中去一般會(huì)有另一獨(dú)立地?cái)?shù)據(jù)集(測(cè)試集)用以驗(yàn)證所構(gòu)建分類函數(shù)的準(zhǔn)確性,避免過度擬合,分類過

34、程示意,訓(xùn)練集,,分類學(xué)習(xí),訓(xùn)練集,,分類器,,,,,IF rank = ‘professor’OR years > 6THEN tenured = ‘yes’,,,Jef is YES!,,,分類中的決策樹(Decision Tree)歸納,決策樹 類似于流程圖的樹型結(jié)構(gòu)內(nèi)部節(jié)點(diǎn)代表對(duì)某個(gè)屬性的一次測(cè)試分支代表測(cè)試的輸出結(jié)果葉節(jié)點(diǎn)代表分類標(biāo)簽或分布決策樹的生成包括兩個(gè)階段樹的創(chuàng)建首先, 所有訓(xùn)練樣本都位于根節(jié)點(diǎn)

35、遞歸地基于選擇屬性來劃分樣本集樹的修剪識(shí)別并刪除那些反映噪聲或孤立點(diǎn)的分支應(yīng)用決策樹: 對(duì)未知樣本進(jìn)行分類在決策樹上測(cè)試樣本的各個(gè)屬性值,決策樹示意,age?,overcast,student?,credit rating?,no,yes,fair,excellent,,,,<=30,>40,,,,,,,,,,no,no,yes,yes,yes,30..40,示例:是否購(gòu)買計(jì)算機(jī)?,聚類的基本概念,基本定義將數(shù)據(jù)

36、對(duì)象集劃分成事先未知的分組或類別聚類的原則:類內(nèi)相似度高,類間相似度低相似度一般為某種距離函數(shù)D(i,j)聚類既可以作為獨(dú)立分析工具考察數(shù)據(jù)分布結(jié)構(gòu),也可以作為其他分析方法的預(yù)處理步驟很不幸,對(duì)聚類結(jié)果的評(píng)價(jià)一般都是主觀的基本分類將數(shù)據(jù)對(duì)象集劃分成事先未知的分組或類別,聚類示意,基于歐氏距離的三維空間中的聚類,,,,,,,,,,,,,,,,,,,,,,,,,,,A1,A2,B1,,,,x,y,z,從算法到應(yīng)用,,報(bào)告內(nèi)容,原

37、理篇客戶關(guān)系管理中的數(shù)量方法 方法篇數(shù)據(jù)分析方法概論統(tǒng)計(jì)分析方法數(shù)據(jù)挖掘分析方法其他分析方法 工具篇常用數(shù)據(jù)分析工具簡(jiǎn)介 總結(jié)基本結(jié)論,,數(shù)據(jù)分析軟件,數(shù)據(jù)分析軟件的種類按照分析模式統(tǒng)計(jì)分析軟件數(shù)據(jù)挖掘軟件OLAP軟件科學(xué)計(jì)算軟件按照分析范圍通用分析軟件專用分析軟件按照分析規(guī)模企業(yè)級(jí)分析軟件桌面級(jí)分析軟件,,數(shù)據(jù)分析軟件的基本特點(diǎn),功能全面,系統(tǒng)地集成了多種成熟的數(shù)據(jù)分析方法有完善的數(shù)據(jù)定義、

38、操作和管理功能方便地生成各種統(tǒng)計(jì)圖形和統(tǒng)計(jì)表格使用方式簡(jiǎn)單、靈活,有完備的聯(lián)機(jī)幫助功能軟件開放性好,能方便地和其他軟件進(jìn)行數(shù)據(jù)交換,,學(xué)習(xí)使用統(tǒng)計(jì)分析軟件的基本方法,弄清分析的目的正確收集待處理和分析的數(shù)據(jù)(目的、影響因素的剔除)弄清分析方法的概念、含義和適用范圍。無需記憶公式選擇一種或幾種分析方法來探索性地分析數(shù)據(jù)讀懂計(jì)算機(jī)分析的數(shù)據(jù)結(jié)果,發(fā)現(xiàn)規(guī)律,得出結(jié)論,,SAS:The Power to Know,SAS (Sta

39、tistical Analysis System)是一個(gè)模塊化、集成化的大型應(yīng)用軟件系統(tǒng);目前國(guó)際上最流行的一種大型統(tǒng)計(jì)分析系統(tǒng);統(tǒng)計(jì)分析的標(biāo)準(zhǔn)軟件SAS系統(tǒng)主要完成以數(shù)據(jù)為中心的四大任務(wù):數(shù)據(jù)訪問;數(shù)據(jù)管理;數(shù)據(jù)呈現(xiàn);數(shù)據(jù)分析。 它由數(shù)十個(gè)專用模塊構(gòu)成,SAS/STAT(統(tǒng)計(jì)分析);SAS/ETS(經(jīng)濟(jì)計(jì)量與時(shí)間序列分析);SAS/QC(質(zhì)量控制管理);SAS/OR(運(yùn)籌學(xué));SAS/IML(矩陣運(yùn)算);SAS/GRAPH(繪圖)

40、等,,SPSS:Real Stat, Real Easy,SPSS(Statistical Package for the Social Science)--社會(huì)科學(xué)統(tǒng)計(jì)軟件包是世界是著名的統(tǒng)計(jì)分析軟件之一。SPSS for Windows是一個(gè)組合式軟件包,它集數(shù)據(jù)整理、分析功能于一身。用戶可以根據(jù)實(shí)際需要和計(jì)算機(jī)的功能選擇模塊,以降低對(duì)系統(tǒng)硬盤容量的要求,有利于該軟件的推廣應(yīng)用。SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計(jì)分析、圖表分析

41、、輸出管理等等。SPSS統(tǒng)計(jì)分析過程包括描述性統(tǒng)計(jì)、均值比較、一般線性模型、相關(guān)分析、回歸分析、對(duì)數(shù)線性模型、聚類分析、數(shù)據(jù)簡(jiǎn)化、生存分析、時(shí)間序列分析、多重響應(yīng)等幾大類,每類中又分好幾個(gè)統(tǒng)計(jì)過程,比如回歸分析中又分線性回歸分析、曲線估計(jì)、Logistic回歸、Probit回歸、加權(quán)估計(jì)、兩階段最小二乘法、非線性回歸等多個(gè)統(tǒng)計(jì)過程,而且每個(gè)過程中又允許用戶選擇不同的方法及參數(shù)。SPSS也有專門的繪圖系統(tǒng),可以根據(jù)數(shù)據(jù)繪制各種圖形。,,報(bào)

42、告內(nèi)容,原理篇客戶關(guān)系管理中的數(shù)量方法 方法篇數(shù)據(jù)分析方法概論統(tǒng)計(jì)分析方法數(shù)據(jù)挖掘分析方法 工具篇常用數(shù)據(jù)分析工具簡(jiǎn)介 總結(jié)基本結(jié)論,總結(jié),關(guān)鍵是業(yè)務(wù)問題的發(fā)現(xiàn)及其構(gòu)建以及切實(shí)迎合業(yè)務(wù)需要 從分析方法的角度切入討論只是手段而非目的 方法還是很重要的 方法應(yīng)該是最不會(huì)成為問題的 方法是個(gè)工具箱,關(guān)于Teradata,,2005 Revenue by Business Unit,Teradata Dat

43、a Warehouse,Retail Solutions,Financial Solutions,Worldwide Customer Services,Systemedia,NCR公司概貌,Fortune 500 companyGlobal operations in over 100 countries & territoriesMore than 28,000 employe

44、es$6B revenueNon-pension operating income 3 point improvement to 9%,Teradata在Fortune500中的優(yōu)異表現(xiàn),Leading industriesBanking GovernmentInsurance & HealthcareManufacturing RetailTelecommunicationsTransportation Lo

45、gisticsTravel World class customer listMore than 800 customersGlobal presence Over 100 countries and territories,FORTUNE Global Rankings, July 2005,Top Ten Ranking in Fortune 500,分析型CRM是擅長(zhǎng)之一,,Retail,Financial,Trav

46、el,,,,Communications,,Insurance,,,,Manufacturing/Sourcing,Union Bank of Norway,,Technology ROI AwardsHarrah’s - Grand Prize WinnerState of Iowa - Winner, Public SectorTDWI Best Practices Award Enterprise Data Wareho

47、use: Union PacificGovernment & Non-profit: State of MichiganWorld Class Solution Awards Jefferson County Public Schools, winner- Data Management category; GCN Agency Awards US Air Force Knowledge Systems, Mate

48、rial Systems Group/Enterprise Systems DivisionNCDM Database Excellence AwardFubon Financial Holding Company (Taiwan) - Silver Award,CIO Magazine Enterprise Value AwardsContinental Airlines, Winner - TransportationAc

49、e Hardware, Winner - Retail/WholesaleIntelligent Enterprise Editors’ Choice AwardsTeradata named one of Intelligent Enterprise Dozen Most Influential CompaniesDM Review 100Teradata - industry leader in business int

50、elligence, data warehousing and analytics market CRM Market LeaderTeradata - Market Leader in CRM Analytics categoryBest Practices in Business IntelligenceLexisNexis, Managing and Enhancing BI Applications and Inf

51、rastructure categoryRealWare AwardsFubon Financial Holding Company, Merit Award Winner - Marketing Management, Best Intelligent CRM Application category,Teradata用戶所獲贊譽(yù) - 2004,Teradata用戶所獲贊譽(yù) - 2005,BI Excellence Award

52、Sponsor: Gartner GroupContinental Airlines 1to1 Impact AwardSponsor: Peppers & Rogers Continental Airlines - Technology OptimizationTDWI Best Practices AwardSunrise – Customer Relationship ManagementIn

53、novation PrizeSponsor: 01 InformatiqueChampion (groupe Carrefour),Computerworld’s Best Practices Award in Business IntelligenceHospital Corporation of America, Inc. - Creating a BI Vision and Strategies for Improved

54、ROI 2005 World Class Solution Award in the Business IntelligenceSponsor: DM Review Verizon Wireless – Business Intelligence CRM Magazine’s 2005 Market Leaders Awards Fubon Financial Holding - CRM Elite, Analytics,

55、,Teradata用戶所獲贊譽(yù) - 2006,,TDWI Best Practices AwardsRoyal Bank of Canada - Enterprise Data WarehousingNationwide Insurance – Master Data ManagementPannon GSM - Predictive AnalyticsBNSF Railway, Inc. – Business Performa

56、nce ManagementVentana Research 2006 Performance Leadership AwardsBNSF Railway, Inc. - winner in Finance Performance Leadership,The DMA Awards, Financial Services Council National Australia Bank selected as winner of

57、The DMA’s Financial Services Company of the Year awardFinTech Asia AwardsSponsor: Financial Insight Asia/PacificChina Trust Commercial Bank – Winner in Customer Analytics2006 Supply & Demand Chain Executive 10

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論