版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、市場營銷中的數(shù)據(jù)分析方法,,報告內(nèi)容,原理篇客戶關(guān)系管理中的數(shù)量方法 方法篇數(shù)據(jù)分析方法概論統(tǒng)計(jì)分析方法數(shù)據(jù)挖掘分析方法 工具篇常用數(shù)據(jù)分析工具簡介 總結(jié)基本結(jié)論,,市場營銷中的數(shù)量決策問題,傳統(tǒng)的純粹定性描述方法已遠(yuǎn)遠(yuǎn)不能滿足現(xiàn)代市場營銷實(shí)踐的需要,為了體現(xiàn)市場營銷學(xué)本身的科學(xué)性和對企業(yè)實(shí)踐的指導(dǎo)性,數(shù)據(jù)分析理論與方法在市場營銷學(xué)中占有越來越重要的地位。理論上->計(jì)量市場營銷學(xué)的出現(xiàn)理念上->數(shù)據(jù)庫營
2、銷、關(guān)系營銷的興起實(shí)務(wù)上->數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用探察數(shù)量決策問題的兩個視角理論上的框架要素實(shí)務(wù)上的業(yè)務(wù)流程,,視角一:市場營銷學(xué)的理論框架,,核心概念營銷觀念,營銷計(jì)劃營銷組織營銷控制營銷審計(jì),產(chǎn)品策略定價策略分銷策略促銷策略,需求分析市場細(xì)分目標(biāo)市場市場定位,,,基礎(chǔ)理論,戰(zhàn)略理論,策略理論,管理理論,,視角一示例:市場營銷中的產(chǎn)品決策,產(chǎn)品定位定位圖分析(感知定位圖、偏好定位圖等)
3、新產(chǎn)品擴(kuò)散與產(chǎn)品生命周期管理巴斯模型(BASS Model)生長曲線模型(Growth Curve Model)品牌決策消費(fèi)者品牌選擇模型,視角二示例:電信業(yè)業(yè)務(wù)流程視圖(eTOM),,視角二示例:理解客戶與市場,市場購買行為消費(fèi)者購買行為模型消費(fèi)者品牌選擇模型市場需求測量市場需求預(yù)測模型市場細(xì)分,客戶生命周期與市場營銷策略,,客戶生命周期,在不同生命周期階段需考慮不同問題,,如何發(fā)現(xiàn)并獲取潛在客戶?,階段A (A
4、cquisition)客戶獲取,,,,如何把客戶培養(yǎng)成高價值客戶?,階段B:(Build-up)客戶提升,如何使客戶使用新電信產(chǎn)品?如何培養(yǎng)顧客忠誠度?,階段C:(Climax)客戶成熟,,如何延長客戶“生命周期”?,階段D:(Decline)客戶衰退,,如何贏回客戶?,階段E:(Exit)客戶離網(wǎng),,,,客戶價值,多種分析主題在不同時期應(yīng)用,,客戶獲取市場細(xì)分與產(chǎn)品定位目標(biāo)客戶特征識別,刺激需求提升銷售,交叉
5、銷售目標(biāo)營銷,客戶保持生存分析客戶風(fēng)險,客戶挽留,,客戶細(xì)分,細(xì)分是指將一個大的消費(fèi)群體劃分成一個個細(xì)分群的動作,同屬于一個細(xì)分群的消費(fèi)者彼此相似,而隸屬于不同細(xì)分群的消費(fèi)者被視為不同。細(xì)分的目的可以讓管理者從一個比較高的層次上“鳥瞰”整個數(shù)據(jù)庫中的數(shù)據(jù),從而可以用不同的方法對待處于不同細(xì)分群眾的客戶,提供相對個性化的服務(wù)??蛻艏?xì)分的目的更好的了解客戶結(jié)構(gòu)改善客戶管理與溝通增加客戶貢獻(xiàn)度客戶細(xì)分中的數(shù)量方法聚類分析卡
6、方自動交互檢測(CHAID),營銷策略客戶保持基于獎賞及高成本事件驅(qū)動的保持策略專注的, 區(qū)分優(yōu)先級的Call center支持客戶獲取刻畫子分群的特征建立跟蹤系統(tǒng)(tracking systems)以從價值的角度監(jiān)控新來的客戶交叉銷售對高價值客戶進(jìn)行交叉銷售會產(chǎn)生更大的收益,,經(jīng)常地, 頭20%的客戶貢獻(xiàn)了將近100% 的整體利潤. 這些客戶對CRM策略開發(fā)是至關(guān)重要的。,示例:基于價值的客戶細(xì)分(高價值客戶),中間層
7、代表了客戶的大多數(shù). 他們利潤較?。╰hin margins)但容量巨大(high volume).,,營銷策略定價與行為改變識別服務(wù)機(jī)會 – 增強(qiáng)可能的定價結(jié)構(gòu)性定價以鼓勵改善收益性的行為交叉銷售利用預(yù)測模型識別具有潛在價值的客戶利用事件營銷與關(guān)系營銷策略去增加產(chǎn)品的持有量渠道與服務(wù)的效率識別高成本/低回報的渠道并重新部署或調(diào)整結(jié)構(gòu)定位高成本業(yè)務(wù)流程以流線化或渠道遷移,示例:基于價值的客戶細(xì)分(中價值客戶),盡管數(shù)量
8、很少 (10% to 20%) 但他們消除了很大一部分的利潤.,,營銷策略改變定價識別與負(fù)利潤相關(guān)的定價策略與行為, 鼓勵服務(wù)使用與目標(biāo)定價以增加或引入由服務(wù)改變而帶來的可能收入客戶風(fēng)險避免向具有信用風(fēng)險的客戶進(jìn)行交叉銷售客戶獲取識別低價值客戶并積極地在獲取過程中避免與這類客戶發(fā)生接觸,示例:基于價值的客戶細(xì)分(低價值客戶),,,High Value ??,High Value ??,Low Value ??,Low Val
9、ue ??,示例:基于生命階段的客戶細(xì)分,,客戶獲取,在大多數(shù)商業(yè)領(lǐng)域中,業(yè)務(wù)發(fā)展的主要指標(biāo)里包括新客戶的獲取能力。新客戶的獲取包括發(fā)現(xiàn)那些對你的產(chǎn)品不了解的客戶,也包括以前接受你的競爭對手服務(wù)的顧客??蛻臬@取中的數(shù)量方法特征識別(Profiling and Penetration Analysis)響應(yīng)模型(Response Model),,客戶保持,隨著行業(yè)的競爭越來越激烈和獲得一個新客戶的開支愈來愈大,保持原有客戶的工作愈
10、來愈有價值??蛻舯3种械臄?shù)量方法流失預(yù)測模型客戶忠誠度模型,,交叉銷售與提升銷售,交叉營銷是指你向現(xiàn)有的客戶提供新的產(chǎn)品和服務(wù)的營銷過程。公司與其客戶之間的商業(yè)關(guān)系是一種持續(xù)的不斷發(fā)展的關(guān)系,在這種關(guān)系建立起來以后,可以有很多種方法來不斷改善這種關(guān)系。雙方的目標(biāo)是達(dá)到雙贏的結(jié)果,客戶獲益是由于他們得到了更好更貼切的服務(wù)質(zhì)量,商家則因?yàn)樵黾愉N售量獲利。交叉銷售中的數(shù)量方法購買傾向預(yù)測產(chǎn)品關(guān)聯(lián)分析,客戶流失,客戶流失預(yù)警分品牌
11、、高/中/低價值、主動/被動構(gòu)建模型分類預(yù)測數(shù)據(jù)挖掘模型客戶挽留流程設(shè)計(jì)彩鈴客戶流失預(yù)警分主動/捆綁構(gòu)建模型分類預(yù)測數(shù)據(jù)挖掘模型客戶挽留流程設(shè)計(jì)競爭對手流失預(yù)警聯(lián)通用戶流失預(yù)測客戶挽留流程設(shè)計(jì),交叉銷售與提升銷售,購買傾向預(yù)測彩鈴預(yù)測模型彩信預(yù)測模型WAP預(yù)測模型購物藍(lán)分析產(chǎn)品關(guān)聯(lián)分析營銷方案關(guān)聯(lián)分析提升銷售價值提升預(yù)測模型,營銷案預(yù)演,營銷預(yù)演是為了支持業(yè)務(wù)人員制訂新的資費(fèi)營銷方案,然后對該方案在歷史
12、數(shù)據(jù)上做相應(yīng)的測算,從而根據(jù)測算結(jié)果來指導(dǎo)下一步工作。,營銷活動管理-CMP,KPI預(yù)測模型,個人客戶分群,個人客戶價值評估,新產(chǎn)品生命周期分析,,報告內(nèi)容,原理篇客戶關(guān)系管理中的數(shù)量方法 方法篇數(shù)據(jù)分析方法概論統(tǒng)計(jì)分析方法數(shù)據(jù)挖掘分析方法 工具篇常用數(shù)據(jù)分析工具簡介 總結(jié)基本結(jié)論,,數(shù)量分析方法(Quantitative Analysis),數(shù)量分析是對事物的數(shù)量特征、數(shù)量關(guān)系與數(shù)量變化的分析。數(shù)量分析的類型按照
13、分析的目的探索性數(shù)據(jù)分析描述性數(shù)據(jù)分析解釋性數(shù)據(jù)分析按照問題的本質(zhì)確定性分析不確定性分析,,數(shù)量分析中的模型化方法,數(shù)量模型是對現(xiàn)實(shí)問題的描述和模仿模型是為認(rèn)識目的或?qū)嵺`目的而建立的典型的模型化過程,數(shù)據(jù)分析模型,E.F.Codd的數(shù)據(jù)分析模型絕對模型(Categorical Model):依據(jù)預(yù)定義路徑尋找原因,如查詢解釋模型(Exegetical Model):依據(jù)多層次路徑尋找原因,如多維分析思考模型(Con
14、templative Model):參數(shù)化路徑,如場景分析公式模型(Formulaic Model):模型化路徑,如數(shù)據(jù)挖掘,,What happened ?,Why did it happen ?,What will happen ?,,ROI,,應(yīng)用復(fù)雜性,,Human Discovery,Machine-assisted Discovery,,常用的數(shù)據(jù)分析方法/模型,數(shù)量分析是對事物的數(shù)量特征、數(shù)量關(guān)系與數(shù)量變化的分析。數(shù)量
15、分析的類型按照分析的目的探索性數(shù)據(jù)分析描述性數(shù)據(jù)分析解釋性數(shù)據(jù)分析按照問題的本質(zhì)確定性分析不確定性分析,,認(rèn)識分析數(shù)據(jù):數(shù)據(jù)測量尺度,名義尺度有序尺度間隔尺度比例尺度,,認(rèn)識分析數(shù)據(jù):數(shù)據(jù)結(jié)構(gòu)類型,截面數(shù)據(jù)(Cross-section Data)時間序列數(shù)據(jù)(Time-series Data)面板數(shù)據(jù)(Panel Data),,數(shù)據(jù)分析的出發(fā)點(diǎn):數(shù)據(jù)矩陣,截面數(shù)據(jù)(Cross-section Data)時間序列
16、數(shù)據(jù)(Time-series Data)面板數(shù)據(jù)(Panel Data),,常用的統(tǒng)計(jì)分析方法,數(shù)據(jù)分類分析聚類分析判別分析數(shù)據(jù)化簡分析主成分分析因子分析數(shù)據(jù)相關(guān)分析回歸分析典型相關(guān)分析數(shù)據(jù)預(yù)測分析時間序列預(yù)測,什么是數(shù)據(jù)挖掘?,Data,Information,Knowledge,Wisdom,存在太多數(shù)據(jù)挖掘的定義,但基本上有這樣一種描述結(jié)構(gòu)To find / discover / extract / dr
17、edge / harvest 、、、Interesting / novel / useful / implicit / actable / meaningful 、、、Information / knowledge / patterns / trends / rules / anomalies 、、、In massive data / large data set / large database / data warehouse
18、 、、、,Data + context,Information + rules,Knowledge + experience,為什么會出現(xiàn)數(shù)據(jù)挖掘?,數(shù)據(jù)爆炸性增長是數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生的根本原因。只見樹木,不見森林(Drowning in data but starving for information)計(jì)算復(fù)雜度數(shù)據(jù)管理問題數(shù)據(jù)類型的多樣性,處理大容量數(shù)據(jù)是數(shù)據(jù)挖掘技術(shù)區(qū)別于其他數(shù)據(jù)分析方法的唯一標(biāo)志嗎?,其他數(shù)據(jù)
19、分析方法:統(tǒng)計(jì)學(xué),從處理數(shù)據(jù)的角度看、、、數(shù)據(jù)規(guī)模不同數(shù)據(jù)來源不同:觀測數(shù)據(jù)(Secondary Analysis) VS 試驗(yàn)數(shù)據(jù)(Primary Analysis)數(shù)據(jù)類型不同(結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù))從分析思想的角度看更關(guān)注實(shí)證性分析(Empirical Analysis)而非探索性分析(Exploratory Analysis)更關(guān)注模型(Model)而非算法(Algorithm)但二者具有相當(dāng)密切
20、的聯(lián)系從數(shù)據(jù)分析的角度,統(tǒng)計(jì)學(xué)現(xiàn)在是且仍將是數(shù)據(jù)挖掘最重要的技術(shù)支撐和思想源泉更加深入的滲透和交叉(如探索性數(shù)據(jù)分析,EDA),數(shù)據(jù)挖掘是數(shù)據(jù)驅(qū)動的探索性分析 !,數(shù)據(jù)挖掘:多學(xué)科的匯合,數(shù)據(jù)挖掘,數(shù)據(jù)庫技術(shù),統(tǒng)計(jì)學(xué),其它學(xué)科,信息科學(xué),機(jī)器學(xué)習(xí),可視化,,,,,,,人工智能,,科學(xué)計(jì)算,,數(shù)據(jù)挖掘是一個過程,“from data mining to knowledge discovery in database”. U. fay
21、yad, G.P.Shapiro and P.Smyth (1996),數(shù)據(jù)挖掘過程中的數(shù)據(jù)預(yù)處理,數(shù)據(jù)清洗填充缺失值, 修均噪聲數(shù)據(jù), 識別或刪除孤立點(diǎn), 并解決數(shù)據(jù)不一致問題主要分析方法:分箱(Binning)、聚類、回歸數(shù)據(jù)集成多個數(shù)據(jù)庫、數(shù)據(jù)方或文件的集成數(shù)據(jù)變換規(guī)范化與匯總數(shù)據(jù)簡化減少數(shù)據(jù)量的同時, 還可以得到相同或相近的分析結(jié)果主要分析方法:抽樣、主成分分析數(shù)據(jù)離散化數(shù)據(jù)簡化的一部分, 但非常重要 (尤
22、其對于數(shù)值型數(shù)據(jù)來說),數(shù)據(jù)挖掘過程中的數(shù)據(jù)探索,探索性數(shù)據(jù)分析(Exploratory Data Analysis, EDA)探索性地查看數(shù)據(jù),概括數(shù)據(jù)集的結(jié)構(gòu)和關(guān)系對數(shù)據(jù)集沒有各種嚴(yán)格假定“玩”數(shù)據(jù)主要任務(wù)數(shù)據(jù)可視化(a picture is worth a thousand words)殘差分析(數(shù)據(jù)=擬合 + 殘差)數(shù)據(jù)的重新表達(dá)(什么樣的尺度-對數(shù)抑或平方跟-會簡化分析?)方法的耐抗性(對數(shù)據(jù)局部不良的不敏感性
23、,如中位數(shù)耐抗甚于均值)常見方法統(tǒng)計(jì)量,如均值、方差、根方差、協(xié)方差、峰度、偏度、相關(guān)系數(shù)等統(tǒng)計(jì)圖,如餅圖、直方圖、散點(diǎn)圖、箱尾圖等模型,如聚類,數(shù)據(jù)挖掘結(jié)果的評價,興趣度度量:一個模式是有意義的,如果它易于被人理解,在某種程度上,對于新數(shù)據(jù)或者測試數(shù)據(jù)是有效的、潛在有用或者驗(yàn)證了用戶渴望確認(rèn)的某些假設(shè)。目前仍無很好的解決辦法,很大程度上仍依靠人工不存在解決這個問題的簡單技術(shù),最終答案是不要把數(shù)據(jù)挖掘當(dāng)作脫離數(shù)據(jù)內(nèi)涵的簡單技
24、術(shù)來運(yùn)用客觀興趣度:基于統(tǒng)計(jì)或模式的結(jié)構(gòu),如統(tǒng)計(jì)量、支持度、lift等主觀興趣度:基于用戶對數(shù)據(jù)的確信程度,如意外程度、新奇程度或者可行動性等過度擬合(Over-fitting)問題,什么不是數(shù)據(jù)挖掘?,定量分析(Quantitative Analysis)的需要存在企業(yè)管理運(yùn)行的各個側(cè)面或環(huán)節(jié),但并非所有的定量分析問題都可以歸結(jié)到數(shù)據(jù)挖掘范疇的問題。簡單的報表、圖表及多維分析仍是日常分析工作的主要內(nèi)容小樣本數(shù)據(jù)的分析傳統(tǒng)統(tǒng)計(jì)
25、分析方法更成熟有效,如趨勢預(yù)測某些特定業(yè)務(wù)問題無法用數(shù)據(jù)挖掘算法加以解決,例如資源最優(yōu)配置問題是個運(yùn)籌學(xué)問題某些物流管理問題或者供應(yīng)鏈管理問題是個隨機(jī)規(guī)劃問題營銷預(yù)演本質(zhì)是個系統(tǒng)仿真問題,幾個基本概念,模型(Model) vs 模式(Pattern)數(shù)據(jù)挖掘的根本目的就是把樣本數(shù)據(jù)中隱含的結(jié)構(gòu)泛化(Generalize)到總體(Population)上去模型:對數(shù)據(jù)集的一種全局性的整體特征的描述或概括,適用于數(shù)據(jù)空間中的所有
26、點(diǎn),例如聚類分析模式:對數(shù)據(jù)集的一種局部性的有限特征的描述或概括,適用于數(shù)據(jù)空間的一個子集,例如關(guān)聯(lián)分析算法(Algorithm):一個定義完備(well-defined)的過程,它以數(shù)據(jù)作為輸入并產(chǎn)生模型或模式形式的輸出描述型挖掘(Descriptive) vs 預(yù)測型挖掘(Predictive)描述型挖掘:對數(shù)據(jù)進(jìn)行概括,以方便的形式呈現(xiàn)數(shù)據(jù)的重要特征預(yù)測型挖掘:根據(jù)觀察到的對象特征值來預(yù)測它的其他特征值描述型挖掘可以是
27、目的,也可以是手段,幾類基本的挖掘算法,關(guān)聯(lián)規(guī)則(模式、描述型)發(fā)現(xiàn)數(shù)據(jù)集中的頻繁模式例如:buy(x,”diapers”) ? buy(x,”beers”) [0.5%, 60%]分類與預(yù)測(模型、預(yù)測型)發(fā)現(xiàn)能夠區(qū)分或預(yù)測目標(biāo)變量(唯一的)的規(guī)則或者函數(shù)分類的目標(biāo)變量一般是范疇型的,而預(yù)測則是數(shù)量型的,并不必然帶有任何時間延續(xù)型的暗示例如:股票市值的預(yù)測,病人病情的判斷聚類(模型、描述型)對數(shù)據(jù)分組以形成新類,類標(biāo)記
28、是未知的例如:市場細(xì)分孤立點(diǎn)探測(Outlier Detection)(模式、預(yù)測型)分析異?;蛟肼晹?shù)據(jù)的行為模式例如:欺詐檢測,關(guān)聯(lián)規(guī)則的基本概念,基本定義給定(1)事務(wù)數(shù)據(jù)集(2)每個事務(wù)是數(shù)據(jù)項(xiàng)的集合,試圖發(fā)現(xiàn)項(xiàng)集中的頻繁模式或關(guān)聯(lián)關(guān)系所謂頻繁模式或者關(guān)聯(lián)規(guī)則就是一個具有“A ? B”形式的邏輯蘊(yùn)涵式頻繁模式并不必然蘊(yùn)涵著因果關(guān)系或相關(guān)關(guān)系!算法實(shí)現(xiàn)基本上基于APRIORI法則:頻繁項(xiàng)集的所有非空子集一定也是頻繁(
29、Frequent)的基本分類布爾關(guān)聯(lián)規(guī)則 vs 定量關(guān)聯(lián)規(guī)則buy(x,”diapers”) ? buy(x,”beers”)Age(x,”30..39”) ^ income(x,”42k..48k”) ? buy(x,”PC”)單維關(guān)聯(lián)規(guī)則 vs 多維關(guān)聯(lián)規(guī)則單層關(guān)聯(lián)規(guī)則 vs 多層關(guān)聯(lián)規(guī)則Age(x,”30..39”) ^ income(x,”42k..48k”) ? buy(x,”IBM PC”)序列模式(Sequ
30、ence Pattern)數(shù)據(jù)項(xiàng)是一個包含時間標(biāo)簽的序偶[item(i),t],關(guān)聯(lián)規(guī)則的度量,發(fā)現(xiàn)具有最小置信度和支持度的全部規(guī)則 X ^ Y ? Z 支持度(support), s, 事務(wù)中包含{X & Y & Z}的概率置信度(confidence), c, 事務(wù)中包含{X & Y}的條件下, 包含Z的條件概率,令最小支持度為50%, 最小置信度為50%, 則有A ? C (50%, 66.6
31、%)C ? A (50%, 100%),,,,,,顧客購買尿布,顧客購買兩者,顧客購買啤酒,,對支持度與置信度的批判,示例總共5000名學(xué)生, 其中3000人玩籃球3750人吃谷類食品2000人既玩籃球又吃谷類食品play basketball ? eat cereal [40%, 66.7%] 是一個誤導(dǎo)規(guī)則, 因?yàn)槌怨阮愂称返膶W(xué)生占學(xué)生總數(shù)的75%, 比66.7%更高play basketball ? not
32、 eat cereal [20%, 33.3%] 其實(shí)是一個更精確的規(guī)則, 盡管它的支持度和置信度都比較低,關(guān)聯(lián)規(guī)則的應(yīng)用,市場購物籃分析(Market Basket Analysis)例如一個事務(wù)是客戶的一個購物清單,同一客戶的兩份清單被認(rèn)為是兩個不同的事務(wù)數(shù)據(jù)項(xiàng)是所有可能陳列貨物的全集目標(biāo)是發(fā)現(xiàn)同時出現(xiàn)的貨品組合間的關(guān)聯(lián)模式應(yīng)用:商品貨價設(shè)計(jì)、倉儲規(guī)劃、網(wǎng)頁布局、產(chǎn)品目錄設(shè)計(jì)等等交叉銷售(Cross Selling)客戶
33、依次購買不同產(chǎn)品的序列目標(biāo)是發(fā)現(xiàn)在購買某一產(chǎn)品組合之后客戶可能購買的另一產(chǎn)品或服務(wù)應(yīng)用:網(wǎng)絡(luò)故障分析、網(wǎng)站門戶設(shè)計(jì)等,分類問題的基本定義,給定一數(shù)據(jù)集合(訓(xùn)練集)數(shù)據(jù)記錄由一系列變量組成其中有一個變量是目標(biāo)分類標(biāo)簽尋找一模型,使目標(biāo)分類變量值是其他變量值的一個函數(shù)利用上述函數(shù),一未知分類變量值的數(shù)據(jù)記錄能夠盡可能準(zhǔn)確地被判定到某一類別中去一般會有另一獨(dú)立地?cái)?shù)據(jù)集(測試集)用以驗(yàn)證所構(gòu)建分類函數(shù)的準(zhǔn)確性,避免過度擬合,分類過
34、程示意,訓(xùn)練集,,分類學(xué)習(xí),訓(xùn)練集,,分類器,,,,,IF rank = ‘professor’OR years > 6THEN tenured = ‘yes’,,,Jef is YES!,,,分類中的決策樹(Decision Tree)歸納,決策樹 類似于流程圖的樹型結(jié)構(gòu)內(nèi)部節(jié)點(diǎn)代表對某個屬性的一次測試分支代表測試的輸出結(jié)果葉節(jié)點(diǎn)代表分類標(biāo)簽或分布決策樹的生成包括兩個階段樹的創(chuàng)建首先, 所有訓(xùn)練樣本都位于根節(jié)點(diǎn)
35、遞歸地基于選擇屬性來劃分樣本集樹的修剪識別并刪除那些反映噪聲或孤立點(diǎn)的分支應(yīng)用決策樹: 對未知樣本進(jìn)行分類在決策樹上測試樣本的各個屬性值,決策樹示意,age?,overcast,student?,credit rating?,no,yes,fair,excellent,,,,<=30,>40,,,,,,,,,,no,no,yes,yes,yes,30..40,示例:是否購買計(jì)算機(jī)?,聚類的基本概念,基本定義將數(shù)據(jù)
36、對象集劃分成事先未知的分組或類別聚類的原則:類內(nèi)相似度高,類間相似度低相似度一般為某種距離函數(shù)D(i,j)聚類既可以作為獨(dú)立分析工具考察數(shù)據(jù)分布結(jié)構(gòu),也可以作為其他分析方法的預(yù)處理步驟很不幸,對聚類結(jié)果的評價一般都是主觀的基本分類將數(shù)據(jù)對象集劃分成事先未知的分組或類別,聚類示意,基于歐氏距離的三維空間中的聚類,,,,,,,,,,,,,,,,,,,,,,,,,,,A1,A2,B1,,,,x,y,z,從算法到應(yīng)用,,報告內(nèi)容,原
37、理篇客戶關(guān)系管理中的數(shù)量方法 方法篇數(shù)據(jù)分析方法概論統(tǒng)計(jì)分析方法數(shù)據(jù)挖掘分析方法其他分析方法 工具篇常用數(shù)據(jù)分析工具簡介 總結(jié)基本結(jié)論,,數(shù)據(jù)分析軟件,數(shù)據(jù)分析軟件的種類按照分析模式統(tǒng)計(jì)分析軟件數(shù)據(jù)挖掘軟件OLAP軟件科學(xué)計(jì)算軟件按照分析范圍通用分析軟件專用分析軟件按照分析規(guī)模企業(yè)級分析軟件桌面級分析軟件,,數(shù)據(jù)分析軟件的基本特點(diǎn),功能全面,系統(tǒng)地集成了多種成熟的數(shù)據(jù)分析方法有完善的數(shù)據(jù)定義、
38、操作和管理功能方便地生成各種統(tǒng)計(jì)圖形和統(tǒng)計(jì)表格使用方式簡單、靈活,有完備的聯(lián)機(jī)幫助功能軟件開放性好,能方便地和其他軟件進(jìn)行數(shù)據(jù)交換,,學(xué)習(xí)使用統(tǒng)計(jì)分析軟件的基本方法,弄清分析的目的正確收集待處理和分析的數(shù)據(jù)(目的、影響因素的剔除)弄清分析方法的概念、含義和適用范圍。無需記憶公式選擇一種或幾種分析方法來探索性地分析數(shù)據(jù)讀懂計(jì)算機(jī)分析的數(shù)據(jù)結(jié)果,發(fā)現(xiàn)規(guī)律,得出結(jié)論,,SAS:The Power to Know,SAS (Sta
39、tistical Analysis System)是一個模塊化、集成化的大型應(yīng)用軟件系統(tǒng);目前國際上最流行的一種大型統(tǒng)計(jì)分析系統(tǒng);統(tǒng)計(jì)分析的標(biāo)準(zhǔn)軟件SAS系統(tǒng)主要完成以數(shù)據(jù)為中心的四大任務(wù):數(shù)據(jù)訪問;數(shù)據(jù)管理;數(shù)據(jù)呈現(xiàn);數(shù)據(jù)分析。 它由數(shù)十個專用模塊構(gòu)成,SAS/STAT(統(tǒng)計(jì)分析);SAS/ETS(經(jīng)濟(jì)計(jì)量與時間序列分析);SAS/QC(質(zhì)量控制管理);SAS/OR(運(yùn)籌學(xué));SAS/IML(矩陣運(yùn)算);SAS/GRAPH(繪圖)
40、等,,SPSS:Real Stat, Real Easy,SPSS(Statistical Package for the Social Science)--社會科學(xué)統(tǒng)計(jì)軟件包是世界是著名的統(tǒng)計(jì)分析軟件之一。SPSS for Windows是一個組合式軟件包,它集數(shù)據(jù)整理、分析功能于一身。用戶可以根據(jù)實(shí)際需要和計(jì)算機(jī)的功能選擇模塊,以降低對系統(tǒng)硬盤容量的要求,有利于該軟件的推廣應(yīng)用。SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計(jì)分析、圖表分析
41、、輸出管理等等。SPSS統(tǒng)計(jì)分析過程包括描述性統(tǒng)計(jì)、均值比較、一般線性模型、相關(guān)分析、回歸分析、對數(shù)線性模型、聚類分析、數(shù)據(jù)簡化、生存分析、時間序列分析、多重響應(yīng)等幾大類,每類中又分好幾個統(tǒng)計(jì)過程,比如回歸分析中又分線性回歸分析、曲線估計(jì)、Logistic回歸、Probit回歸、加權(quán)估計(jì)、兩階段最小二乘法、非線性回歸等多個統(tǒng)計(jì)過程,而且每個過程中又允許用戶選擇不同的方法及參數(shù)。SPSS也有專門的繪圖系統(tǒng),可以根據(jù)數(shù)據(jù)繪制各種圖形。,,報
42、告內(nèi)容,原理篇客戶關(guān)系管理中的數(shù)量方法 方法篇數(shù)據(jù)分析方法概論統(tǒng)計(jì)分析方法數(shù)據(jù)挖掘分析方法 工具篇常用數(shù)據(jù)分析工具簡介 總結(jié)基本結(jié)論,總結(jié),關(guān)鍵是業(yè)務(wù)問題的發(fā)現(xiàn)及其構(gòu)建以及切實(shí)迎合業(yè)務(wù)需要 從分析方法的角度切入討論只是手段而非目的 方法還是很重要的 方法應(yīng)該是最不會成為問題的 方法是個工具箱,關(guān)于Teradata,,2005 Revenue by Business Unit,Teradata Dat
43、a Warehouse,Retail Solutions,Financial Solutions,Worldwide Customer Services,Systemedia,NCR公司概貌,Fortune 500 companyGlobal operations in over 100 countries & territoriesMore than 28,000 employe
44、es$6B revenueNon-pension operating income 3 point improvement to 9%,Teradata在Fortune500中的優(yōu)異表現(xiàn),Leading industriesBanking GovernmentInsurance & HealthcareManufacturing RetailTelecommunicationsTransportation Lo
45、gisticsTravel World class customer listMore than 800 customersGlobal presence Over 100 countries and territories,FORTUNE Global Rankings, July 2005,Top Ten Ranking in Fortune 500,分析型CRM是擅長之一,,Retail,Financial,Trav
46、el,,,,Communications,,Insurance,,,,Manufacturing/Sourcing,Union Bank of Norway,,Technology ROI AwardsHarrah’s - Grand Prize WinnerState of Iowa - Winner, Public SectorTDWI Best Practices Award Enterprise Data Wareho
47、use: Union PacificGovernment & Non-profit: State of MichiganWorld Class Solution Awards Jefferson County Public Schools, winner- Data Management category; GCN Agency Awards US Air Force Knowledge Systems, Mate
48、rial Systems Group/Enterprise Systems DivisionNCDM Database Excellence AwardFubon Financial Holding Company (Taiwan) - Silver Award,CIO Magazine Enterprise Value AwardsContinental Airlines, Winner - TransportationAc
49、e Hardware, Winner - Retail/WholesaleIntelligent Enterprise Editors’ Choice AwardsTeradata named one of Intelligent Enterprise Dozen Most Influential CompaniesDM Review 100Teradata - industry leader in business int
50、elligence, data warehousing and analytics market CRM Market LeaderTeradata - Market Leader in CRM Analytics categoryBest Practices in Business IntelligenceLexisNexis, Managing and Enhancing BI Applications and Inf
51、rastructure categoryRealWare AwardsFubon Financial Holding Company, Merit Award Winner - Marketing Management, Best Intelligent CRM Application category,Teradata用戶所獲贊譽(yù) - 2004,Teradata用戶所獲贊譽(yù) - 2005,BI Excellence Award
52、Sponsor: Gartner GroupContinental Airlines 1to1 Impact AwardSponsor: Peppers & Rogers Continental Airlines - Technology OptimizationTDWI Best Practices AwardSunrise – Customer Relationship ManagementIn
53、novation PrizeSponsor: 01 InformatiqueChampion (groupe Carrefour),Computerworld’s Best Practices Award in Business IntelligenceHospital Corporation of America, Inc. - Creating a BI Vision and Strategies for Improved
54、ROI 2005 World Class Solution Award in the Business IntelligenceSponsor: DM Review Verizon Wireless – Business Intelligence CRM Magazine’s 2005 Market Leaders Awards Fubon Financial Holding - CRM Elite, Analytics,
55、,Teradata用戶所獲贊譽(yù) - 2006,,TDWI Best Practices AwardsRoyal Bank of Canada - Enterprise Data WarehousingNationwide Insurance – Master Data ManagementPannon GSM - Predictive AnalyticsBNSF Railway, Inc. – Business Performa
56、nce ManagementVentana Research 2006 Performance Leadership AwardsBNSF Railway, Inc. - winner in Finance Performance Leadership,The DMA Awards, Financial Services Council National Australia Bank selected as winner of
57、The DMA’s Financial Services Company of the Year awardFinTech Asia AwardsSponsor: Financial Insight Asia/PacificChina Trust Commercial Bank – Winner in Customer Analytics2006 Supply & Demand Chain Executive 10
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 淺析市場營銷中的財(cái)務(wù)分析
- 數(shù)據(jù)挖掘在市場營銷中的應(yīng)用.pdf
- 市場研究中的數(shù)據(jù)分析和闡釋
- sfe營銷數(shù)據(jù)分析
- 企業(yè)市場營銷和區(qū)域市場營銷之間的關(guān)系分析
- 市場營銷中的科學(xué)
- 數(shù)據(jù)挖掘在電信市場營銷中的應(yīng)用.pdf
- 84510.論圖書營銷中的數(shù)據(jù)分析
- 王老吉市場營銷分析
- 市場營銷分析工具
- 電力市場營銷分析
- 市場營銷例題分析
- 企業(yè)市場營銷中的管理觀念與營銷戰(zhàn)術(shù)分析
- 數(shù)據(jù)的力量——營銷數(shù)據(jù)分析與決策
- 策劃在市場營銷中的地位與分析
- 民營企業(yè)市場營銷的管理方法分析
- 國企市場營銷中的創(chuàng)新思維分析
- 面向智能化市場營銷的數(shù)據(jù)挖掘方法研究.pdf
- 數(shù)據(jù)挖掘在市場營銷中的應(yīng)用研究.pdf
- 數(shù)據(jù)分析方法實(shí)驗(yàn)
評論
0/150
提交評論