聚類分析的數(shù)據(jù)挖掘技術(shù)進(jìn)行電信市場(chǎng)客戶分群.doc
《聚類分析的數(shù)據(jù)挖掘技術(shù)進(jìn)行電信市場(chǎng)客戶分群.doc》由會(huì)員分享,可在線閱讀,更多相關(guān)《聚類分析的數(shù)據(jù)挖掘技術(shù)進(jìn)行電信市場(chǎng)客戶分群.doc(11頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
采用聚類分析的數(shù)據(jù)挖掘技術(shù)進(jìn)行電信市場(chǎng)客戶分群 1.引言 隨著國(guó)內(nèi)電信市場(chǎng)競(jìng)爭(zhēng)的日趨激烈,電信運(yùn)營(yíng)商的經(jīng)營(yíng)模式逐漸從“技術(shù)驅(qū)動(dòng)”向“市場(chǎng)驅(qū)動(dòng)”、“客戶驅(qū)動(dòng)”轉(zhuǎn)化。面對(duì)客戶的多樣化、層次化、個(gè)性化的需求,大眾化營(yíng)銷已經(jīng)失去了其優(yōu)勢(shì),基于客戶信息、客戶價(jià)值和行為,深入數(shù)據(jù)分析的洞察力營(yíng)銷、精確化營(yíng)銷的理念逐漸被各大電信運(yùn)營(yíng)商所接受,并渴望通過(guò)從數(shù)據(jù)中挖掘價(jià)值來(lái)減少營(yíng)銷成本、提高營(yíng)銷效益。近幾年迅速崛起的數(shù)據(jù)挖掘技術(shù)成為實(shí)現(xiàn)這些目標(biāo)的必要手段。 數(shù)據(jù)挖掘是從海量數(shù)據(jù)中提取隱含在其中的有用信息和知識(shí)的過(guò)程。電信各運(yùn)營(yíng)支撐系統(tǒng)所積累的海量歷史數(shù)據(jù)是企業(yè)的一筆寶貴財(cái)富,誰(shuí)能正確地挖掘與分析隱含在數(shù)據(jù)中的知識(shí),誰(shuí)就能更好地向用戶提供產(chǎn)品與服務(wù),從而在競(jìng)爭(zhēng)中脫穎而出。數(shù)據(jù)挖掘提供了從數(shù)據(jù)到價(jià)值的解決方案:“數(shù)據(jù) + 工具+方法+目標(biāo)+行動(dòng)=價(jià)值”。數(shù)據(jù)挖掘目前已有一系列應(yīng)用:分類分析、聚類分析、預(yù)測(cè)分析、偏差分析、關(guān)聯(lián)分析和時(shí)序模式等,這些應(yīng)用涉及到的技術(shù)和工具各不相同,然而卻可以依據(jù)統(tǒng)一的方法論來(lái)實(shí)行,并可以協(xié)同作戰(zhàn),解決許多有價(jià)值的商業(yè)問(wèn)題。由SPSS、NCR和Daimler-Benzd在1996年提出的CRISP-DM方法論是國(guó)際上數(shù)據(jù)挖掘行業(yè)流行的標(biāo)準(zhǔn),其成功之處在于源于實(shí)踐,是實(shí)際數(shù)據(jù)挖掘項(xiàng)目的智慧和經(jīng)驗(yàn)的結(jié)晶。CRISP-DM定義了數(shù)據(jù)挖掘項(xiàng)目的標(biāo)準(zhǔn)化流程,如圖1所示。 圖1 CRISP-DM方法論 準(zhǔn)確的細(xì)分市場(chǎng)和差異化的營(yíng)銷策略是目前電信企業(yè)市場(chǎng)營(yíng)銷所必須面對(duì)的難題。所謂市場(chǎng)細(xì)分是指營(yíng)銷者根據(jù)顧客之間需求的差異性,把一個(gè)整體市場(chǎng)劃分為若干個(gè)消費(fèi)者群的市場(chǎng)分類過(guò)程。由于顧客對(duì)電信產(chǎn)品需求的多樣性、變動(dòng)性以及電信企業(yè)資源的有限性,電信企業(yè)在進(jìn)行市場(chǎng)營(yíng)銷過(guò)程中,必須進(jìn)行市場(chǎng)分析,選擇目標(biāo)市場(chǎng),做出市場(chǎng)定位,并結(jié)合目標(biāo)市場(chǎng)的特點(diǎn)和結(jié)構(gòu)制定有針對(duì)性的市場(chǎng)營(yíng)銷策略??蛻舴秩菏橇私饪蛻暨M(jìn)行市場(chǎng)細(xì)分和目標(biāo)市場(chǎng)營(yíng)銷的前提。數(shù)據(jù)挖掘的分類和聚類的方法都可應(yīng)用于客戶分群。下面我們將對(duì)用聚類方法進(jìn)行客戶分群的實(shí)現(xiàn)模式進(jìn)行詳細(xì)闡述,為電信目標(biāo)市場(chǎng)營(yíng)銷的客戶分群提供完整的解決方案,并以實(shí)際案例驗(yàn)證其可行性。 基于聚類分析的客戶分群 聚類(clustering)是指把一組個(gè)體按照相似性歸成若干類別,即“物以類聚”,其目的是使得屬于同一類別的個(gè)體之間的相似度盡可能大,而不同類別的個(gè)體之間的相似度盡可能小。相似度是根據(jù)描述對(duì)象的屬性來(lái)測(cè)算的,距離是經(jīng)常采用的度量方式。聚類和分類有著很大的區(qū)別:分類時(shí),我們總是事先知道哪些屬性是重要的,運(yùn)營(yíng)商總是將重要的、有影響力的屬性作為分類的依據(jù);而聚類時(shí),運(yùn)營(yíng)商事先根本不知道哪些屬性起作用,任務(wù)之一就是要找到那些起關(guān)鍵作用的屬性。聚類分析能夠幫助我們發(fā)現(xiàn)特征迥異的不同客戶群,和對(duì)客戶分群起關(guān)健作用的指標(biāo)變量,并輔助運(yùn)營(yíng)商對(duì)各客戶群的特征進(jìn)行深刻洞察。 2.1 客戶分群的商業(yè)理解 依據(jù)CRISP-DM流程首先要進(jìn)行客戶分群的“商業(yè)理解”,這一初始階段集中在從商業(yè)角度理解項(xiàng)目的目標(biāo)和要求,然后把理解轉(zhuǎn)化為數(shù)據(jù)挖掘問(wèn)題的定義和一個(gè)旨在實(shí)現(xiàn)目標(biāo)的初步計(jì)劃。我們必須明確項(xiàng)目的商業(yè)目標(biāo),這個(gè)目標(biāo)應(yīng)該是適于用基于聚類分析的客戶分群方法去達(dá)到的。比如某電信運(yùn)營(yíng)商定義的客戶分群的商業(yè)目標(biāo)是“對(duì)某市數(shù)十萬(wàn)公眾客戶,從價(jià)值和行為的分析維度進(jìn)行客戶分群,以了解不同客戶群的消費(fèi)行為特征,為發(fā)展新業(yè)務(wù)、流失客戶保有、他網(wǎng)用戶爭(zhēng)奪的針對(duì)性營(yíng)銷策略的制訂提供分析依據(jù),并實(shí)現(xiàn)企業(yè)保存量、激增量的戰(zhàn)略目標(biāo)”。電信客戶從營(yíng)銷屬性分為三類:公眾客戶、商業(yè)客戶和大客戶,其中公眾客戶消費(fèi)行為有較大的隨機(jī)性,客戶分布難有規(guī)律可尋,比較適于聚類分析。我們可以將此商業(yè)目標(biāo)轉(zhuǎn)化為數(shù)據(jù)挖掘的可行性方案:從價(jià)值和行為維度,考察客戶業(yè)務(wù)擁有與使用、消費(fèi)行為變化、他網(wǎng)業(yè)務(wù)滲透等方面屬性,采用聚類分析的數(shù)據(jù)挖掘技術(shù)對(duì)研究的目標(biāo)客戶 (公眾客戶、入網(wǎng)時(shí)長(zhǎng)、地域?qū)傩浴a(chǎn)品擁有類型等方面限定)進(jìn)行客戶分群,對(duì)各客戶群進(jìn)行特征刻畫和屬性分析,為針對(duì)性營(yíng)銷確定目標(biāo)客戶群,并根據(jù)客戶群屬性和營(yíng)銷目標(biāo)量體裁衣制訂恰當(dāng)?shù)臓I(yíng)銷方案。由于客戶的特性是不斷變化的,數(shù)據(jù)挖掘的分析結(jié)果具有一定時(shí)效性,因此數(shù)據(jù)挖掘必須以項(xiàng)目來(lái)實(shí)施,在目標(biāo)、進(jìn)度和資源安排上明確要求。 2.2 客戶分群的數(shù)據(jù)理解 “巧婦難為無(wú)米之炊”,數(shù)據(jù)是挖掘的基礎(chǔ),在確定目標(biāo)和方案后需要進(jìn)行“數(shù)據(jù)理解”,以確定要支持我們的分析目標(biāo)需要哪些方面的數(shù)據(jù),數(shù)據(jù)基礎(chǔ)是否已經(jīng)具備,數(shù)據(jù)質(zhì)量是否能滿足要求,如果不能得到肯定的答復(fù),我們建議推遲項(xiàng)目實(shí)施直至條件成熟,因?yàn)椤斑M(jìn)去的是垃圾出來(lái)的仍是垃圾”,錯(cuò)誤的分析結(jié)果可能會(huì)給我們帶來(lái)重大的損失。比如在上述案例中,我們分析了各業(yè)務(wù)系統(tǒng)及企業(yè)數(shù)據(jù)倉(cāng)庫(kù)中客戶信息、客戶消費(fèi)及購(gòu)買使用行為三個(gè)方面最近六個(gè)月的歷史數(shù)據(jù)。電信企業(yè)擁有業(yè)務(wù)受理開通的CRM系統(tǒng),進(jìn)行計(jì)費(fèi)、帳務(wù)及欠費(fèi)處理的計(jì)費(fèi)系統(tǒng),卡類業(yè)務(wù)的智能網(wǎng)系統(tǒng),客戶服務(wù)的10000號(hào)系統(tǒng),營(yíng)銷服務(wù)的渠道系統(tǒng),還有結(jié)算系統(tǒng)、寬帶、窄帶及小靈通系統(tǒng)等等,這些業(yè)務(wù)系統(tǒng)儲(chǔ)蓄了企業(yè)運(yùn)營(yíng)的海量客戶數(shù)據(jù)。有些電信企業(yè)還建立了數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),對(duì)這些數(shù)據(jù)進(jìn)行了清洗、整合和集中,建立了企業(yè)統(tǒng)一數(shù)據(jù)視圖,并確保了數(shù)據(jù)來(lái)源的廣泛性、完整性和準(zhǔn)確性,為數(shù)據(jù)挖掘創(chuàng)造了更好的條件。我們從企業(yè)數(shù)據(jù)倉(cāng)庫(kù)中確定了以下數(shù)據(jù)的來(lái)源: 客戶基本資料 用戶基本資料 帳單信息 本地通話信息 長(zhǎng)話通話信息 卡通話信息 結(jié)算信息 窄帶使用信息 寬帶使用信息 客服交互行為 繳費(fèi)信息 欠費(fèi)信息 服務(wù)使用信息 … 除了數(shù)據(jù)源分析,數(shù)據(jù)理解階段的另一些重要任務(wù)是進(jìn)行數(shù)據(jù)探索和檢驗(yàn)數(shù)據(jù)質(zhì)量。我們可以借助一些可視化工具或統(tǒng)計(jì)分析進(jìn)行數(shù)據(jù)探索,以明確數(shù)據(jù)的分布狀況和重要的屬性及其關(guān)系。比如通過(guò)值分析對(duì)數(shù)據(jù)進(jìn)行基本的探查,包括空值、唯一值、空字符串、零值、正值、負(fù)值的統(tǒng)計(jì);統(tǒng)計(jì)分析計(jì)算各數(shù)值型變量的最小值、最大值、均值、標(biāo)準(zhǔn)差、眾數(shù)等,有利于發(fā)現(xiàn)一些異常值,便于更好地理解數(shù)據(jù);頻次分析、直方圖分析有助于更準(zhǔn)確地了解數(shù)據(jù)的分布,從中發(fā)現(xiàn)有價(jià)值的點(diǎn),其中頻次分析主要面向離散型變量,而直方圖分析主要面向連續(xù)型變量。數(shù)據(jù)探索有助于提煉數(shù)據(jù)描述和質(zhì)量報(bào)告,還能發(fā)現(xiàn)數(shù)據(jù)異常,并為進(jìn)一步的數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)準(zhǔn)備打基礎(chǔ),甚至可能直接指向數(shù)據(jù)挖掘的目標(biāo)。數(shù)據(jù)探索的同時(shí)可以全面檢驗(yàn)數(shù)據(jù)質(zhì)量,對(duì)數(shù)據(jù)的完整性、正確性、一致性有更細(xì)致的認(rèn)識(shí)。除了統(tǒng)計(jì)分析,抽樣核查比較也是數(shù)據(jù)檢驗(yàn)常用的方法,在進(jìn)行數(shù)據(jù)質(zhì)量核查時(shí),需要有對(duì)數(shù)據(jù)意義和取值范圍敏感的業(yè)務(wù)人員參與。 2.3 客戶分群的數(shù)據(jù)準(zhǔn)備 “數(shù)據(jù)準(zhǔn)備”包括所有從原始的未加工的數(shù)據(jù)構(gòu)造最終分析數(shù)據(jù)集的活動(dòng),是數(shù)據(jù)挖掘過(guò)程中最耗時(shí)的環(huán)節(jié),甚至要占據(jù)整個(gè)數(shù)據(jù)挖掘項(xiàng)目一半以上的工作量。數(shù)據(jù)準(zhǔn)備工作的流程如圖2所示。 圖2. 數(shù)據(jù)準(zhǔn)備流程 選擇數(shù)據(jù) 決定用來(lái)分析的數(shù)據(jù)。選擇標(biāo)準(zhǔn)包括與數(shù)據(jù)挖掘目標(biāo)的相關(guān)性,數(shù)據(jù)質(zhì)量和工具技術(shù)的限制,如對(duì)數(shù)據(jù)容量或數(shù)據(jù)類型的限制。數(shù)據(jù)選擇包括數(shù)據(jù)表格中屬性(列)和記錄(行)的選擇。我們可以分主題在企業(yè)數(shù)據(jù)倉(cāng)庫(kù)中選擇我們需要的各類數(shù)據(jù),并進(jìn)行按月匯總,生成月粒度數(shù)據(jù)基礎(chǔ)表。基礎(chǔ)表中每個(gè)用戶每個(gè)帳務(wù)月的信息匯總成一條記錄。如在我們的案例中基礎(chǔ)表涵蓋了以下數(shù)據(jù): 用戶及客戶的基本信息 包括客戶身份信息、聯(lián)系方式、產(chǎn)品擁有情況,用戶竣工時(shí)間、入網(wǎng)時(shí)長(zhǎng)、服務(wù)開通情況、優(yōu)惠套餐信息、客戶服務(wù)信息(投訴、咨詢、催繳情況)等 價(jià)值信息 包括話音、寬窄帶業(yè)務(wù)的月租費(fèi)、使用費(fèi)、優(yōu)惠費(fèi)用及增值業(yè)務(wù)、新業(yè)務(wù)、信息費(fèi)和卡類、結(jié)算費(fèi)用,還包括了繳欠費(fèi)信息 行為信息 包括時(shí)長(zhǎng)、次數(shù)、跳次、發(fā)話不同號(hào)碼數(shù)、時(shí)長(zhǎng)集中度(撥打時(shí)長(zhǎng)最多的三個(gè)號(hào)碼撥打時(shí)長(zhǎng)在總時(shí)長(zhǎng)中占比)、次數(shù)集中度 基礎(chǔ)表中數(shù)據(jù)屬性粒度要求盡量細(xì),以便于在后期靈活構(gòu)建數(shù)據(jù)。我們將以上價(jià)值和行為變量從專業(yè)(區(qū)內(nèi)、區(qū)間、本地移動(dòng)、本地異商固網(wǎng)、傳統(tǒng)國(guó)內(nèi)長(zhǎng)途、傳統(tǒng)國(guó)際長(zhǎng)途、傳統(tǒng)港澳臺(tái)長(zhǎng)途、傳統(tǒng)異地行動(dòng)、IP國(guó)內(nèi)長(zhǎng)途、IP國(guó)際長(zhǎng)途、IP港澳臺(tái)長(zhǎng)途、IP異地行動(dòng))和時(shí)段(白天:7:00-18:0、晚上:18:00-7:00、特殊時(shí)段:0:00-7:00)兩個(gè)維度進(jìn)行了劃分。 清洗數(shù)據(jù) 將數(shù)據(jù)質(zhì)量提高到所選分析技術(shù)和分析目標(biāo)要求的水平。這包括選擇需要進(jìn)行數(shù)據(jù)清洗的子集,插入適當(dāng)?shù)哪J(rèn)值或者通過(guò)更加復(fù)雜的技術(shù)如建模來(lái)估計(jì)缺失值,比如某月份的數(shù)據(jù)缺失我們可以用前后月份數(shù)據(jù)的平均值來(lái)填充,我們將擁有產(chǎn)品較多(可能不是公眾客戶)及公免的客戶數(shù)據(jù)剔除。此階段需要對(duì)基礎(chǔ)表的數(shù)據(jù)進(jìn)一步探索和檢驗(yàn)。 構(gòu)建數(shù)據(jù) 該任務(wù)包括構(gòu)建數(shù)據(jù)的準(zhǔn)備操作,如進(jìn)行變量設(shè)計(jì)生成派生屬性、生成完整的新記錄或者已存屬性的轉(zhuǎn)換值(將字符型字段轉(zhuǎn)化為數(shù)值型字段)。在基礎(chǔ)表基礎(chǔ)上通過(guò)抽取、合并、衍生得到分主題匯集的價(jià)值變量和行為變量形成的中間表,中間表中每個(gè)用戶6個(gè)月的信息匯總成一條記錄。抽取指直接從基礎(chǔ)表中選擇變量進(jìn)行匯總;合并指將基礎(chǔ)表中多個(gè)字段合并成一個(gè)字段匯總,如將區(qū)內(nèi)通話時(shí)長(zhǎng)和區(qū)間通話時(shí)長(zhǎng)合并成本地通話時(shí)長(zhǎng);衍生指根據(jù)各種邏輯關(guān)系派生出新的變量,如均值變量、占比變量、趨勢(shì)變量、波動(dòng)變量等。在進(jìn)行變量設(shè)計(jì)時(shí)建議技術(shù)人員和業(yè)務(wù)人員密切配合討論,根據(jù)業(yè)務(wù)需要、挖掘目標(biāo)及數(shù)據(jù)源的實(shí)際狀況確定數(shù)據(jù)選擇,確定基礎(chǔ)變量和數(shù)據(jù)源的映射關(guān)系,確定衍生變量的數(shù)據(jù)轉(zhuǎn)換邏輯。中間表變量命名的規(guī)范化有助于用戶理解、記憶和應(yīng)用,便利于將來(lái)數(shù)據(jù)挖掘的應(yīng)用分析。變量命名采用對(duì)變量屬性進(jìn)行描述的分段的英文縮寫(首字母大字)用下劃線連接來(lái)實(shí)現(xiàn),字段按屬性意義從大到小的范圍排列,從而在對(duì)變量進(jìn)行排序時(shí)可以把同一類型的變量聚集在一起,便于分析,如“價(jià)值/行為(v/b)_業(yè)務(wù)專業(yè)(Inner/Inter/Tol)_地域(Dms/Int/Gat)_撥打方式(Trd/IP)_ 值類型(Amt/Fee/Dur/Cnt/Dstn)_衍生值類型(Trd/Rat)”。中間表可以按模塊化原則來(lái)設(shè)計(jì)實(shí)現(xiàn),可隨著應(yīng)用和業(yè)務(wù)發(fā)展的需要不斷進(jìn)行擴(kuò)充。 整合數(shù)據(jù) 對(duì)各中間表的數(shù)據(jù)進(jìn)行聯(lián)合,生成最終的分析數(shù)據(jù)集也稱寬表。我們以客戶標(biāo)識(shí)為主鍵,串聯(lián)起客戶相關(guān)的所有信息數(shù)據(jù),建立起統(tǒng)一客戶視圖。在整合數(shù)據(jù)時(shí),我們要回顧商業(yè)理解階段對(duì)數(shù)據(jù)挖掘目標(biāo)的定義,以使我們的分析數(shù)據(jù)集能滿足需求。有些電信企業(yè)由于歷史數(shù)據(jù)以用戶為中心,難以建立起統(tǒng)一客戶數(shù)據(jù)視圖;這時(shí)可使數(shù)據(jù)挖掘的目標(biāo)限定于對(duì)某類用戶進(jìn)行分析;或以分析某類用戶為主,通過(guò)企業(yè)數(shù)據(jù)庫(kù)中用戶之關(guān)的關(guān)系數(shù)據(jù),去關(guān)聯(lián)其它產(chǎn)品信息輔助分析。在完成數(shù)據(jù)整合后,我們需要再次對(duì)數(shù)據(jù)質(zhì)量進(jìn)行核查。 格式數(shù)據(jù) 格式化轉(zhuǎn)換是指根據(jù)建模的要求,對(duì)數(shù)據(jù)表現(xiàn)形式進(jìn)行變換,如用K均值算法做聚類分析時(shí),需要先將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,對(duì)數(shù)據(jù)進(jìn)行Z變換,以消除量綱不同可能引起的數(shù)據(jù)差異。 2.4 客戶分群的模型建立 在生成最終分析的數(shù)據(jù)集后,就可以建立模型進(jìn)行聚類分析了?!澳P徒ⅰ彪A段主要是選擇和應(yīng)用各種建模技術(shù),同時(shí)對(duì)它們的參數(shù)進(jìn)行校準(zhǔn)以達(dá)到最優(yōu)值。通常對(duì)于同一個(gè)數(shù)據(jù)挖掘問(wèn)題類型,會(huì)有多種模型技術(shù),每一類技術(shù)又有多種實(shí)現(xiàn)算法。聚類分析常用的有k-means算法、Gaussian算法和Poisson算法,后兩種算法對(duì)數(shù)據(jù)分布有所要求。由于電信客戶對(duì)各類產(chǎn)品的消費(fèi)情況有較大差別,變量中會(huì)出現(xiàn)較多的0值,比如大量客戶國(guó)際長(zhǎng)途、電話卡或增值業(yè)務(wù)等的消費(fèi)記錄可能都為0值,因此適合用k-means算法來(lái)建立聚類模型。k-means算法通過(guò)隨機(jī)點(diǎn)劃分K個(gè)類,每條記錄被歸到類中心距它距離最近的類中。在明確建模技術(shù)和算法后需要確定模型參數(shù)和輸入變量。模型參數(shù)包括類的個(gè)數(shù)(建議值5、7、9)、最大迭代步數(shù)(建議值100)等。 寬表中包含了大量客戶數(shù)據(jù)變量,但我們只需要挑選部分變量參與建模;參與建模的變量太多會(huì)削弱主要業(yè)務(wù)屬性的影響,并給理解分群結(jié)果帶來(lái)困難;太少則不能全面覆蓋需要考察的各方面屬性,可能會(huì)遺漏一些重要的屬性關(guān)系。輸入變量的選擇對(duì)建立滿意的模型至關(guān)重要。我們應(yīng)結(jié)合商業(yè)理解,選擇有重要業(yè)務(wù)意義并與數(shù)據(jù)挖掘目標(biāo)密切相關(guān)的變量;被選擇的變量應(yīng)具備較好的數(shù)據(jù)質(zhì)量;被選變量之間相關(guān)性不宜太強(qiáng),如在總量與分量之間只挑選一類參與建模。由于價(jià)值變量和行為變量有較強(qiáng)的相關(guān)性,我們可以只挑選客戶業(yè)務(wù)收入變量進(jìn)行客戶價(jià)值分群,也可只挑選客戶消費(fèi)行為變量進(jìn)行客戶行為分群,根據(jù)數(shù)據(jù)挖掘的商業(yè)目標(biāo)選擇一種分群模式。也可以同時(shí)用兩種分群模式對(duì)同一批客戶作兩次分群,然后根據(jù)兩次分群的結(jié)果進(jìn)行組合,如先分成7個(gè)價(jià)值分群,再分成9個(gè)行為分群,組合后會(huì)有63個(gè)子群,見圖3。由于組合后子群數(shù)目較多不便分析和管理,我們可以借助透視圖分析將特征相似的子群進(jìn)行歸并,建議最終歸并成7到9個(gè)分群。進(jìn)行價(jià)值和行為組合分群的好處是,能同時(shí)兼顧考慮價(jià)值和行為兩方面因素對(duì)客戶分群的影響,更利于對(duì)各分群特征的深刻刻畫,并能有效消除單次分群產(chǎn)生的偏差,但過(guò)程較為復(fù)雜并且不能做到對(duì)參與分群客戶的全覆蓋。 圖3. 客戶價(jià)值及行為分群 模型建立是一個(gè)螺旋上升,不斷優(yōu)化的過(guò)程,在每一次分群結(jié)束后,需要判斷分群結(jié)果在業(yè)務(wù)上是否有意義,其各群特征是否明顯。如果結(jié)果不理想,則需要調(diào)整分群模型,對(duì)模型進(jìn)行優(yōu)化,稱之為分群調(diào)優(yōu)。分群調(diào)優(yōu)可通過(guò)調(diào)整分群個(gè)數(shù)及調(diào)整分群變量輸入來(lái)實(shí)現(xiàn),也可以通過(guò)多次運(yùn)行,選擇滿意的結(jié)果。通常可以依據(jù)以下原則判斷分群結(jié)果是否理想: 群間特征差異是否明顯 各分群之間有明顯特性差異;各分群主要的特征各不相同;決定各分群主要特征的變量各不相同或變量的取值屬性各不相同。 群內(nèi)特征是否相似 各分群有各自明顯的特性;各分群有決定其主要特性貢獻(xiàn)度最大的變量;決定各分群主要特征的變量在此群中的分布特性與在全體樣本中的分布特性有明顯差異; 分群是否易于管理及是否具有業(yè)務(wù)指導(dǎo)意義 分群的個(gè)數(shù)及各群人數(shù)的分布應(yīng)相對(duì)合理,分群結(jié)果能從業(yè)務(wù)上作出合理理解和解釋,并能切合業(yè)務(wù)需要,實(shí)現(xiàn)對(duì)客戶的深刻洞察,幫助制訂合適的營(yíng)銷措施。 2.5 客戶分群的模型評(píng)估 在分群調(diào)優(yōu)過(guò)程中我們已經(jīng)需要對(duì)模型進(jìn)行合理評(píng)估。在完成模型建立后,從數(shù)據(jù)分析的角度來(lái)看,模型似乎有很高的質(zhì)量,然而在模型最后發(fā)布前仍有必要更為徹底地評(píng)估模型和檢查建立模型的各個(gè)步驟,從而確保它真正地達(dá)到了商業(yè)目標(biāo)。我們會(huì)與商業(yè)分析師,以及行業(yè)專家從商業(yè)角度來(lái)討論數(shù)據(jù)挖掘結(jié)果以及項(xiàng)目過(guò)程中產(chǎn)生的其它所有結(jié)論。“模型評(píng)估”階段需要對(duì)數(shù)據(jù)挖掘過(guò)程進(jìn)行一次全面的回顧,從而決定是否存在重要的因素或任務(wù)由于某些原因而被忽視,此階段關(guān)鍵目的是決定是否還存在一些重要的商業(yè)問(wèn)題仍未得到充分地考慮。這種回顧也包括質(zhì)量保證問(wèn)題,如:過(guò)程的每一步是否必要?是否被恰當(dāng)?shù)貓?zhí)行?是否可以改進(jìn)?有什么不足及不確定的地方及會(huì)產(chǎn)生何種影響?根據(jù)評(píng)估結(jié)果和過(guò)程回顧,決定是完成該項(xiàng)目并在適當(dāng)?shù)臅r(shí)候進(jìn)行發(fā)布,還是開始進(jìn)一步的反復(fù)或建立新的數(shù)據(jù)挖掘項(xiàng)目。 2.6 客戶分群的模型發(fā)布 模型的創(chuàng)建通常并不是項(xiàng)目的結(jié)尾。即使建模的目的是增加對(duì)數(shù)據(jù)的了解,所獲得的了解也需要進(jìn)行組織并以一種客戶能夠使用的方式呈現(xiàn)出來(lái)。根據(jù)需要,發(fā)布過(guò)程可以簡(jiǎn)單到產(chǎn)生一個(gè)報(bào)告,也可以復(fù)雜到在整個(gè)企業(yè)中執(zhí)行一個(gè)可重復(fù)的數(shù)據(jù)挖掘過(guò)程??蛻舴秩旱慕Y(jié)果發(fā)布是通過(guò)客戶群特征刻畫和客戶群屬性分析來(lái)展現(xiàn)的。特征刻畫是對(duì)單個(gè)客戶群特征的詳細(xì)描述,屬性分析是對(duì)客戶群之間的屬性進(jìn)行比較分析。 形成客戶分群后,對(duì)客戶群的特征描述直接影響到營(yíng)銷活動(dòng)的策劃和執(zhí)行??蛻羧旱奶卣髅枋鍪前押芏嗫菰餆o(wú)味的數(shù)據(jù)變成生動(dòng)形象的客戶體現(xiàn),以幫助市場(chǎng)營(yíng)銷人員更好地理解客戶群。參與分群的變量決定了各分群的主要特性,除了對(duì)這些變量的統(tǒng)計(jì)及分布特性進(jìn)行深入刻畫外,對(duì)未參加分群的變量也可在特征刻畫階段來(lái)考察其統(tǒng)計(jì)特性。特征刻畫首先進(jìn)行客戶群特征粗略定性比較分析,然后可利用透視圖等工具對(duì)各客戶群寬表變量分類進(jìn)行詳細(xì)的定量刻畫,如圖4。 圖4. 客戶群特征刻畫 我們可以在特征刻畫的基礎(chǔ)上,通過(guò)客戶與收入分析、ARPU構(gòu)成分析、長(zhǎng)途構(gòu)成分析、產(chǎn)品滲透率分析、費(fèi)用趨勢(shì)分析、優(yōu)先級(jí)分析、入網(wǎng)時(shí)長(zhǎng)分析、離網(wǎng)率分析、指標(biāo)統(tǒng)計(jì)費(fèi)用構(gòu)成分析、費(fèi)用分布分析等多個(gè)方面對(duì)各客戶群進(jìn)行屬性分析為營(yíng)銷策劃提供依據(jù)。為輔助營(yíng)銷策劃需要對(duì)各戰(zhàn)略分群的人口、人口占比、收入、收入占比、MOU,各項(xiàng)業(yè)務(wù)的ARPU、收入占比和變化趨勢(shì)、滲透率等各項(xiàng)指標(biāo)進(jìn)行統(tǒng)計(jì);并結(jié)合流失傾向、收入下降趨勢(shì)、收入潛力(平均ARPU)、人數(shù)占比和商業(yè)目標(biāo),確定進(jìn)行營(yíng)銷的戰(zhàn)略分群的優(yōu)先級(jí)及營(yíng)銷的目標(biāo)客戶群,如圖5。 圖5. 客戶群屬性分析 實(shí)踐是檢驗(yàn)真理的唯一標(biāo)準(zhǔn),模型發(fā)布后也需要在營(yíng)銷實(shí)踐中驗(yàn)證調(diào)整。另外,數(shù)據(jù)挖掘結(jié)果已經(jīng)成為日常業(yè)務(wù)和其環(huán)境的一部分后,在運(yùn)用模型的過(guò)程中,模型的監(jiān)測(cè)和維護(hù)也是十分重要的事情。周密的維護(hù)策略將有助于避免不必要地長(zhǎng)期誤用數(shù)據(jù)挖掘結(jié)果。為了監(jiān)測(cè)數(shù)據(jù)挖掘結(jié)果的發(fā)布,項(xiàng)目需要根據(jù)應(yīng)用類型制定一個(gè)關(guān)于監(jiān)測(cè)過(guò)程的詳細(xì)計(jì)劃,例如定期察看各分群的主要特性是否已產(chǎn)生較大的偏移和變遷。這些監(jiān)測(cè)一個(gè)方面可以對(duì)營(yíng)銷效果進(jìn)行評(píng)估反饋,另一方面也為模型的維護(hù)和調(diào)整提供決策依據(jù),如是否需要運(yùn)行模型重新生成分群?是否應(yīng)對(duì)模型作出調(diào)整或重新生成模型?是否應(yīng)終止模型的使用? 3 戰(zhàn)術(shù)分群與目標(biāo)市場(chǎng)營(yíng)銷 在獲取了客戶分群結(jié)果,了解了客戶之后,應(yīng)該針對(duì)所掌握的情況,有所行動(dòng)。通過(guò)分群我們有了對(duì)客戶的整體感覺:哪些是最有價(jià)值的,哪些是最需要關(guān)注的,哪些可能是對(duì)企業(yè)貢獻(xiàn)度最低等等。通過(guò)客戶分群,得到了的客戶的不同貢獻(xiàn)及不同的消費(fèi)特征,進(jìn)而得到的整體優(yōu)先級(jí)考慮是進(jìn)行下一步工作的基礎(chǔ)和起點(diǎn),也是客戶分群最為重要的收獲之一。在客戶分群基礎(chǔ)上下一步工作就是營(yíng)銷活動(dòng)的設(shè)計(jì)與執(zhí)行。 營(yíng)銷活動(dòng)基本可分為機(jī)會(huì)識(shí)別、營(yíng)銷設(shè)計(jì)、方案執(zhí)行、管控調(diào)整四個(gè)環(huán)節(jié)。四個(gè)環(huán)節(jié)中,機(jī)會(huì)識(shí)別屬于營(yíng)銷活動(dòng)的戰(zhàn)略范疇,因?yàn)樗鼪Q定了營(yíng)銷活動(dòng)“做什么”,回答的是對(duì)誰(shuí)做營(yíng)銷,對(duì)某類業(yè)務(wù),做何種營(yíng)銷這樣的方向性、全局性問(wèn)題。營(yíng)銷設(shè)計(jì)屬于戰(zhàn)術(shù)范疇,因?yàn)樗鼪Q定了營(yíng)銷活動(dòng)“怎么做”,回答的是如何圍繞營(yíng)銷機(jī)會(huì)分配資源的問(wèn)題。營(yíng)銷機(jī)會(huì)確認(rèn)之后,需要利用企業(yè)資源為營(yíng)銷機(jī)會(huì)設(shè)計(jì)產(chǎn)品、價(jià)格、渠道、傳播等事項(xiàng),使?fàn)I銷機(jī)會(huì)從概念轉(zhuǎn)化為可執(zhí)行的營(yíng)銷活動(dòng)方案。方案執(zhí)行和管控調(diào)整則屬于執(zhí)行層面的環(huán)節(jié),通過(guò)建立合理的營(yíng)銷組織、激勵(lì)機(jī)制和技能培訓(xùn),使?fàn)I銷設(shè)計(jì)的方案得以執(zhí)行,以完成營(yíng)銷活動(dòng)。服務(wù)于營(yíng)銷機(jī)會(huì)識(shí)別分群屬于戰(zhàn)略分群,服務(wù)于營(yíng)銷設(shè)計(jì)的分群屬于戰(zhàn)術(shù)分群。上述的客戶分群是戰(zhàn)略分群,戰(zhàn)略分群是營(yíng)銷機(jī)會(huì)識(shí)別的手段,通過(guò)戰(zhàn)略分群,我們對(duì)營(yíng)銷策劃有了全局方向性的認(rèn)識(shí)。如對(duì)于流失型客戶,我們需要優(yōu)先關(guān)注他們,對(duì)他們馬上采取客戶保留的措施;對(duì)于增長(zhǎng)型和較穩(wěn)定用戶,我們可以通過(guò)交叉銷售、提升使用的方法,使他們可以使用的更多;對(duì)于高價(jià)值用戶,我們要優(yōu)先對(duì)其采用有關(guān)忠誠(chéng)度管理、客戶挽留和客戶贏回的一系列措施,使其繼續(xù)留在電信網(wǎng)內(nèi),減少流失,增加收入;對(duì)于低價(jià)值用戶,我們也應(yīng)該采取措施,增加其使用產(chǎn)品的個(gè)數(shù)和提升其使用量。而戰(zhàn)術(shù)分群是先有預(yù)定的營(yíng)銷機(jī)會(huì),后有分群,分群的目的是設(shè)計(jì)差異化的4P(產(chǎn)品、價(jià)格、促銷、渠道 )營(yíng)銷組合,以求最大化的利用營(yíng)銷機(jī)會(huì),提升客戶價(jià)值。 通過(guò)客戶分群(戰(zhàn)略分群)確定營(yíng)銷機(jī)會(huì),通過(guò)再次細(xì)分(戰(zhàn)術(shù)分群)確定營(yíng)銷方案。戰(zhàn)略分群關(guān)注總體,戰(zhàn)術(shù)分群關(guān)注個(gè)體,個(gè)體與總體的平均特性不一定一致。采用聚類的分析方法,由于我們?cè)谀P徒r(shí)需要同時(shí)考慮幾十個(gè)方面的維度,雖然每個(gè)分群都有決定其特性的主要屬性,但一些個(gè)體也會(huì)由于次要屬性的影響而歸到此類中,最終會(huì)導(dǎo)致許多個(gè)體與總體的平均特性有較大差異。因此在確定戰(zhàn)略分群后,還有可能會(huì)根據(jù)客戶特征、商業(yè)目標(biāo)、營(yíng)銷方案的可行性等進(jìn)一步進(jìn)行戰(zhàn)術(shù)分群。同時(shí)由于營(yíng)銷方案的普適性,最終會(huì)出現(xiàn):同一戰(zhàn)略分群的個(gè)體可能歸屬不同戰(zhàn)術(shù)分群,不同戰(zhàn)略分群個(gè)體也可能歸屬同一戰(zhàn)術(shù)分群。如在我們的案例中,首先根據(jù)上述的客戶戰(zhàn)略分群,識(shí)別出營(yíng)銷優(yōu)先級(jí)最高的三個(gè)客戶群:高值高危群、經(jīng)濟(jì)商務(wù)群和傳統(tǒng)長(zhǎng)途群;然后根據(jù)這三個(gè)目標(biāo)客戶群的個(gè)體和總體特性,同時(shí)考慮我們的商業(yè)目標(biāo)和營(yíng)銷方案的可行性、易操作性,從收入的變化趨勢(shì)和他網(wǎng)IP的使用情況兩個(gè)維度重新劃分出三個(gè)戰(zhàn)術(shù)分群:下降客戶群、上升客戶群和他網(wǎng)IP客戶群,并依據(jù)戰(zhàn)術(shù)分群來(lái)設(shè)計(jì)對(duì)應(yīng)的營(yíng)銷方案,如圖6。 圖6. 戰(zhàn)術(shù)分群 在進(jìn)行戰(zhàn)術(shù)分群時(shí)我們可以著重關(guān)注營(yíng)銷方案制訂方面需要考慮的因素,從而使?fàn)I銷方案更可行,更易操作,更有效。由于針對(duì)性營(yíng)銷需要對(duì)不同的目標(biāo)客戶群制訂不同的營(yíng)銷方案,如何通過(guò)營(yíng)銷方案的差異來(lái)實(shí)現(xiàn)對(duì)不同客戶需求的滿足及對(duì)不同客戶進(jìn)行區(qū)別對(duì)待,在有效區(qū)隔客戶的同時(shí)并能提高營(yíng)銷收益,需要周全考慮。結(jié)合目標(biāo)市場(chǎng)的客戶特征制訂出針對(duì)性的營(yíng)銷方案后,我們決定采用直郵、電話營(yíng)銷和社區(qū)經(jīng)理三種區(qū)別于大眾營(yíng)銷的渠道作為本次營(yíng)銷活動(dòng)的主要營(yíng)銷渠道。首先通過(guò)直郵讓客戶對(duì)營(yíng)銷活動(dòng)有所了解,然后通過(guò)10000號(hào)外呼向客戶推薦營(yíng)銷套餐,最后通過(guò)社區(qū)經(jīng)理上門與客戶進(jìn)行溝通,形成三個(gè)波次的營(yíng)銷執(zhí)行方案。此次基于客戶分群的目標(biāo)市場(chǎng)營(yíng)銷活動(dòng)的成功率比以往的大眾營(yíng)銷高出幾倍,投資回報(bào)率達(dá)到了百分之三千以上。 4 總結(jié) 數(shù)據(jù)挖掘技術(shù)能夠解決許多常規(guī)的數(shù)據(jù)分析方法不能解決的問(wèn)題。一方面,數(shù)據(jù)挖掘技術(shù)可以同時(shí)考慮非常多的因素,人觀察的緯度就十幾二十個(gè)緯度,同時(shí)觀察的緯度不可能超過(guò)太多;而數(shù)據(jù)挖掘技術(shù),比如聚類分析可以同時(shí)考慮非常多的因素,甚至達(dá)到幾十上百個(gè)維度。另外數(shù)據(jù)挖掘可以考察非常大的數(shù)據(jù)量,也就是說(shuō)對(duì)于大量的數(shù)據(jù)可以自動(dòng)的進(jìn)行分析。并且可以幫助我們?nèi)W(xué)習(xí)新的潛在模式,也就是說(shuō)我們用人工或者傳統(tǒng)的方法很難發(fā)現(xiàn)的一些規(guī)定。比如聚類分析,除了能夠有效地幫助我們劃分出特征迥異的客戶群,并幫助我們發(fā)現(xiàn)決定客戶分群的主要屬性,實(shí)現(xiàn)對(duì)各客戶群特征的深入洞察;同時(shí),正是因?yàn)榫垲惙治瞿軌驈谋姸嗟木S度去對(duì)客戶屬性作綜合考察,因此還能為我們揭示一些我們的經(jīng)驗(yàn)沒有發(fā)現(xiàn)的關(guān)系,或者對(duì)我們的經(jīng)驗(yàn)給以數(shù)據(jù)證實(shí),而這些往往會(huì)給我們帶來(lái)一些有價(jià)值的意外收獲,例如在我們的案例中,我們發(fā)現(xiàn)擁有寬帶的客戶離網(wǎng)率會(huì)比較低,擁有增值業(yè)務(wù)的用戶新業(yè)務(wù)的滲透率較高,增值業(yè)務(wù)和新業(yè)務(wù)使用較多的用戶與移動(dòng)用戶接觸較為頻繁,入網(wǎng)時(shí)長(zhǎng)較短的客戶離網(wǎng)率高于老客戶,卡類用戶對(duì)價(jià)格比較敏感但產(chǎn)品滲透率較高需求較旺盛,低值用戶產(chǎn)品滲透率也低,長(zhǎng)途構(gòu)成對(duì)ARPU影響至關(guān)重要,長(zhǎng)途和區(qū)間話務(wù)較易流失等等,這些對(duì)我們市場(chǎng)營(yíng)銷都很有啟發(fā)意義。 如上所述,聚類分析的數(shù)據(jù)挖掘技術(shù)能夠很好地應(yīng)用于電信目標(biāo)市場(chǎng)營(yíng)銷,為我們解決客戶分群的難題。本文基于實(shí)踐經(jīng)驗(yàn),依據(jù)CRISP-DM方法論給出了其完整的解決方案;對(duì)“商業(yè)理解–數(shù)據(jù)理解–數(shù)據(jù)準(zhǔn)備–模型建立–模型評(píng)估–模型發(fā)布”各個(gè)環(huán)節(jié)的實(shí)施關(guān)鍵點(diǎn)結(jié)合實(shí)例進(jìn)行了詳述闡述;最后還論述了戰(zhàn)略分群與戰(zhàn)術(shù)分群的關(guān)系,引導(dǎo)讀者對(duì)設(shè)計(jì)有效的目標(biāo)市場(chǎng)營(yíng)銷方案作更深入的思考。實(shí)踐證明本文提供的電信目標(biāo)市場(chǎng)營(yíng)銷客戶分群的解決方案是極為成功有效的。- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 聚類分析 數(shù)據(jù) 挖掘 技術(shù) 進(jìn)行 電信市場(chǎng) 客戶 分群
鏈接地址:http://ioszen.com/p-8929385.html