CRM系統(tǒng):數(shù)據(jù)挖掘在通信行業(yè)客戶(hù)關(guān)系管理中的應(yīng)用
數(shù)據(jù)挖掘在通信行業(yè)客戶(hù)關(guān)系管理中的應(yīng)用
曾耀輝
(廣東南方電信規(guī)劃咨詢(xún)?cè)O(shè)計(jì)院有限公司惠州分公司 惠州 516003)
摘 要 數(shù)據(jù)挖掘(Data Mining),是指從大量數(shù)據(jù)中,提取正確的、新穎的、潛在有用的并能夠被理解的知識(shí)
的過(guò)程。本文介紹了數(shù)據(jù)挖掘在通信行業(yè)客戶(hù)關(guān)系管理中的應(yīng)用過(guò)程,以及應(yīng)注意的問(wèn)題。指出,通過(guò)
利用數(shù)據(jù)挖掘技術(shù)建立基于數(shù)據(jù)挖掘技術(shù)的客戶(hù)關(guān)系管理模式,終將極大地提升企業(yè)的競(jìng)爭(zhēng)優(yōu)勢(shì),提高
企業(yè)的競(jìng)爭(zhēng)水平。
關(guān)鍵詞 客戶(hù)關(guān)系管理 數(shù)據(jù)挖掘 通信企業(yè) 客戶(hù)流失
1 數(shù)據(jù)挖掘的概念和流程
1.1 數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘(Data Mining),也叫知識(shí)發(fā)現(xiàn)、數(shù)據(jù)
開(kāi)采等,是指從大量數(shù)據(jù)中,提取正確的、新穎的、潛
在有用的并能夠被理解的知識(shí)的過(guò)程。 數(shù)據(jù)挖掘能進(jìn)行
分類(lèi)預(yù)測(cè)、聚類(lèi)分析、關(guān)聯(lián)規(guī)則和序列模式的發(fā)現(xiàn)、相
關(guān)分析、異常監(jiān)測(cè)和趨勢(shì)分析[1]。
數(shù)據(jù)挖掘技術(shù)是目前數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域廣泛使用的數(shù)據(jù)
分析手段。 它的分析思想是利用已知的數(shù)據(jù)通過(guò)建立數(shù)
學(xué)模型的方法找出隱含的業(yè)務(wù)規(guī)則, 在很多行業(yè)中都有
成功的案例。比如信用卡欺詐預(yù)測(cè)、通信行業(yè)惡意呼叫
行為分析等。
按照所挖掘的數(shù)據(jù)模式的不同,可以將數(shù)據(jù)挖掘方
法劃分為以下4 種[2]。
(1)關(guān)聯(lián)規(guī)則發(fā)現(xiàn),關(guān)聯(lián)規(guī)則挖掘發(fā)現(xiàn)大量數(shù)據(jù)中
項(xiàng)集之間有價(jià)值的關(guān)聯(lián)或相互聯(lián)系。
(2)分類(lèi)和預(yù)測(cè),分類(lèi)和預(yù)測(cè)用于提取描述重要數(shù)
據(jù)類(lèi)的模型并運(yùn)用該模型預(yù)測(cè)未來(lái)的數(shù)據(jù)趨勢(shì)。
(3)聚類(lèi)分析,聚類(lèi)就是將數(shù)據(jù)對(duì)象分組成為多個(gè)
類(lèi)或簇,在同一個(gè)簇中的對(duì)象之間具有較高的相似度,
而不同簇中的對(duì)象差別較大。
(4)序列模式分析,序列模式分析和關(guān)聯(lián)分析相
似,其目的也是為了挖掘數(shù)據(jù)之間的聯(lián)系,但序列模式
分析的側(cè)重點(diǎn)在于分析數(shù)據(jù)間的前后序列關(guān)系。
通常一個(gè)完整的數(shù)據(jù)挖掘過(guò)程由業(yè)務(wù)問(wèn)題定義、 數(shù)
據(jù)過(guò)濾、預(yù)處理、分析、準(zhǔn)備、模型選擇與建立、模型
的評(píng)估與檢驗(yàn)、模型應(yīng)用與鞏固等多個(gè)步驟組成。以下
介紹運(yùn)用數(shù)據(jù)挖掘技術(shù)分析客戶(hù)流失的一般過(guò)程。
1.2 數(shù)據(jù)挖掘流程
通信企業(yè)保存著客戶(hù)的相關(guān)信息, 呼叫數(shù)據(jù)及計(jì)費(fèi)
等大量的數(shù)據(jù),這些業(yè)務(wù)數(shù)據(jù)雖看似普通,卻能釋放出
關(guān)于客戶(hù)流失方面的珍貴信息, 數(shù)據(jù)挖掘技術(shù)與海量數(shù)
據(jù)有密不可分的關(guān)系,以及其強(qiáng)大的數(shù)學(xué)算法,使得它
能夠根據(jù)這些數(shù)據(jù)建立有關(guān)客戶(hù)流失的預(yù)測(cè)模型, 從而
分析出客戶(hù)流失的主要原因并且采取相應(yīng)措施有效地挽
留有流失傾向的客戶(hù)。
數(shù)據(jù)挖掘是一個(gè)周而復(fù)始的過(guò)程, 許多軟件供應(yīng)商
和數(shù)據(jù)挖掘顧問(wèn)公司都提供一些數(shù)據(jù)挖掘過(guò)程模型, 來(lái)
指導(dǎo)他們的用戶(hù)一步步的進(jìn)行數(shù)據(jù)挖掘工作,比如
SPSS 的5A 和SAS 的SEMMA。但基本的數(shù)據(jù)挖掘步
驟包括以下幾個(gè)步驟。
1.2.1 定義業(yè)務(wù)問(wèn)題
業(yè)務(wù)問(wèn)題定義要明確數(shù)據(jù)挖掘技術(shù)解決的是何種商
務(wù)問(wèn)題,對(duì)客戶(hù)流失管理來(lái)說(shuō)就是要定義何為流失。移
動(dòng)通信領(lǐng)域的客戶(hù)流失有三方面的含義: 一指客戶(hù)從本
移動(dòng)運(yùn)營(yíng)商轉(zhuǎn)網(wǎng)到其他通信運(yùn)營(yíng)商, 這是流失分析的重
點(diǎn);二指客戶(hù)使用的手機(jī)品牌發(fā)生改變,從本移動(dòng)運(yùn)營(yíng)
商的高價(jià)值品牌轉(zhuǎn)向低價(jià)值品牌, 如中國(guó)移動(dòng)的用戶(hù)從
全球通客戶(hù)轉(zhuǎn)為神州行客戶(hù);三指客戶(hù)ARPU(指每用
戶(hù)月平均消費(fèi)量)降低,從高價(jià)值客戶(hù)成為低價(jià)值客戶(hù)。
在客戶(hù)流失分析中有兩個(gè)核心變量:財(cái)務(wù)原因/ 非財(cái)
務(wù)原因、主動(dòng)流失/被動(dòng)流失??蛻?hù)流失可以相應(yīng)分為
4種類(lèi)型,其中非財(cái)務(wù)原因主動(dòng)流失的客戶(hù)往往是高價(jià)
值的客戶(hù)。他們會(huì)正常支付服務(wù)費(fèi)用,并容易對(duì)市場(chǎng)活
動(dòng)有所響應(yīng)。這種客戶(hù)是通信企業(yè)真正需要保住的客
戶(hù)。
1.2.2 數(shù)據(jù)處理
這一過(guò)程所花的時(shí)間和精力要占整個(gè)數(shù)據(jù)挖掘項(xiàng)目
的50%~90%,它包括4 個(gè)步驟。
(1)數(shù)據(jù)過(guò)濾,這一步驟可以確保收集的數(shù)據(jù)符合
分析的需要。
(2)數(shù)據(jù)預(yù)處理,這一步驟應(yīng)確保原始數(shù)據(jù)和輸入
標(biāo)準(zhǔn)一致,將分布在不同的數(shù)據(jù)庫(kù)中的數(shù)據(jù)和輸入標(biāo)準(zhǔn)
一致,將分布在不同的數(shù)據(jù)庫(kù)中數(shù)據(jù),集合和合并到單
一的營(yíng)銷(xiāo)數(shù)據(jù)庫(kù),并協(xié)調(diào)來(lái)自多個(gè)數(shù)據(jù)源的數(shù)據(jù)在數(shù)值
上的差異,使數(shù)據(jù)屬性標(biāo)準(zhǔn)化。
(3)數(shù)據(jù)分析,在建立良好的預(yù)測(cè)模型之前,必須
對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行初步分析,初步認(rèn)識(shí),找出對(duì)預(yù)
測(cè)輸出影響最大的數(shù)據(jù)字段,和決定是否需要定義導(dǎo)出
字段。
(4)數(shù)據(jù)準(zhǔn)備,這是建模前數(shù)據(jù)處理的最后一步,
也是數(shù)據(jù)挖掘過(guò)程的核心。
主要有4個(gè)部分:選擇變量、選擇記錄、創(chuàng)建新變
量、轉(zhuǎn)換變量,使之和選定用來(lái)建立模型的算法一致。
1.2.3 建立模型
在多個(gè)可供選擇的模型中找出最佳模型, 初始模型
可能沒(méi)法達(dá)到數(shù)據(jù)挖掘的目的,需要多次反復(fù)。在尋找
最優(yōu)模型過(guò)程中,可能要修改正在使用的數(shù)據(jù),甚至修
改問(wèn)題的定義。
1.2.4 評(píng)估和解釋模型
這個(gè)階段是對(duì)數(shù)據(jù)挖掘階段構(gòu)建的模型進(jìn)行比較和
評(píng)估,生成一個(gè)相對(duì)最優(yōu)模型,并對(duì)此模型用業(yè)務(wù)語(yǔ)言
加以解釋。模型驗(yàn)證的標(biāo)準(zhǔn)方法是從預(yù)處理數(shù)據(jù)中隨機(jī)
抽取兩個(gè)樣本,一個(gè)校準(zhǔn)樣本用于構(gòu)建模型,一個(gè)樣本
用于驗(yàn)證校準(zhǔn)樣本產(chǎn)生的模型。 通常一個(gè)好的模型運(yùn)用
到驗(yàn)證樣本中能得到較好的效果,如果效果差,就需要
重新構(gòu)建模型。
1.2.5 運(yùn)用和鞏固模型
對(duì)模型在實(shí)際應(yīng)用中的表現(xiàn)進(jìn)行監(jiān)控, 將數(shù)據(jù)挖掘
的結(jié)果同運(yùn)營(yíng)市場(chǎng)反饋緊密聯(lián)系起來(lái), 如果模型表現(xiàn)不
好,應(yīng)實(shí)時(shí)適應(yīng)市場(chǎng)調(diào)整挖掘模型,對(duì)模型做進(jìn)一步的
考察和修正,以反映業(yè)務(wù)運(yùn)作規(guī)律的變化。
2 客戶(hù)關(guān)系管理中數(shù)據(jù)挖掘的應(yīng)用條件
目前通信運(yùn)營(yíng)商都具有業(yè)務(wù)營(yíng)運(yùn)系統(tǒng)、業(yè)務(wù)受許多
理網(wǎng)站、客戶(hù)服務(wù)呼叫中心等客戶(hù)信息系統(tǒng),也擁有許
多成熟的數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng),這些系統(tǒng)具有如下特點(diǎn)。
(1)目前通信運(yùn)營(yíng)系統(tǒng)實(shí)質(zhì)上是實(shí)現(xiàn)了數(shù)據(jù)的物理
集中,業(yè)務(wù)系統(tǒng)之間則相互獨(dú)立。
(2)眾多的客戶(hù)數(shù)據(jù)、市場(chǎng)營(yíng)銷(xiāo)數(shù)據(jù)、賬務(wù)數(shù)據(jù)以
不同的數(shù)據(jù)格式和訪問(wèn)方式分散在不同的系統(tǒng)中,過(guò)于
分散、冗余,沒(méi)有形成整體的、唯一的、集中的客戶(hù)數(shù)
據(jù),不能滿足數(shù)據(jù)挖掘過(guò)程中數(shù)據(jù)必須具有單一視圖的
要求。
(3)這些系統(tǒng)都是聯(lián)機(jī)事務(wù)處理(On-Line Transaction,
OLTP)系統(tǒng),實(shí)時(shí)處理在線事務(wù),不能適應(yīng)數(shù)
據(jù)挖掘應(yīng)用大規(guī)模、頻繁的檢索和查詢(xún)操作。
數(shù)據(jù)挖掘技術(shù)本身不是萬(wàn)能的,一個(gè)完善的CRM
系統(tǒng)應(yīng)該以數(shù)據(jù)挖掘技術(shù)為核心,要有效的支持客戶(hù)關(guān)
系管理,必須建立企業(yè)級(jí)的客戶(hù)信息數(shù)據(jù)倉(cāng)庫(kù),能夠把
強(qiáng)力推薦:
天柏客戶(hù)關(guān)系管理系統(tǒng)
天柏客戶(hù)關(guān)系管理系統(tǒng)(CRM)是一款集專(zhuān)業(yè)性、實(shí)用性、易用性為一體的純B/S架構(gòu)的CRM系統(tǒng),它基于以客戶(hù)為中心的協(xié)同管理思想和營(yíng)銷(xiāo)理念,圍繞客戶(hù)生命周期的整個(gè)過(guò)程,針對(duì)不同價(jià)值的客戶(hù)實(shí)施以客戶(hù)滿意為目標(biāo)的營(yíng)銷(xiāo)策略,通過(guò)企業(yè)級(jí)協(xié)同,有效的“發(fā)現(xiàn)、保持和留住客戶(hù)”,從而達(dá)到留住客戶(hù)、提高銷(xiāo)售,實(shí)現(xiàn)企業(yè)利潤(rùn)最大化的目的。通過(guò)對(duì)客戶(hù)進(jìn)行7P的深入分析,即客戶(hù)概況分析(Profiling)、客戶(hù)忠誠(chéng)度分析(Persistency)、客戶(hù)利潤(rùn)分析(Profitability)、客戶(hù)性能分析(Performance)、客戶(hù)未來(lái)分析(Prospecting)、客戶(hù)產(chǎn)品分析(Product)、客戶(hù)促銷(xiāo)分析(Promotion)以及改善與管理企業(yè)銷(xiāo)售、營(yíng)銷(xiāo)、客戶(hù)服務(wù)和支持等與客戶(hù)關(guān)系有關(guān)的業(yè)務(wù)流程并提高各個(gè)環(huán)節(jié)的自動(dòng)化程度,從而幫助企業(yè)達(dá)到縮短銷(xiāo)售周期、降低銷(xiāo)售成本、擴(kuò)大銷(xiāo)售量、增加收入與盈利、搶占更多市場(chǎng)份額、尋求新的市場(chǎng)機(jī)會(huì)和銷(xiāo)售渠道,最終從根本上提升企業(yè)的核心競(jìng)爭(zhēng)力,使得企業(yè)在當(dāng)前激烈的競(jìng)爭(zhēng)環(huán)境中立于不敗之地。