CRM系統:數據挖掘在通信行業客戶關系管理中的應用
數據挖掘在通信行業客戶關系管理中的應用
曾耀輝
(廣東南方電信規劃咨詢設計院有限公司惠州分公司 惠州 516003)
摘 要 數據挖掘(Data Mining),是指從大量數據中,提取正確的、新穎的、潛在有用的并能夠被理解的知識
的過程。本文介紹了數據挖掘在通信行業客戶關系管理中的應用過程,以及應注意的問題。指出,通過
利用數據挖掘技術建立基于數據挖掘技術的客戶關系管理模式,終將極大地提升企業的競爭優勢,提高
企業的競爭水平。
關鍵詞 客戶關系管理 數據挖掘 通信企業 客戶流失
1 數據挖掘的概念和流程
1.1 數據挖掘的概念
數據挖掘(Data Mining),也叫知識發現、數據
開采等,是指從大量數據中,提取正確的、新穎的、潛
在有用的并能夠被理解的知識的過程。 數據挖掘能進行
分類預測、聚類分析、關聯規則和序列模式的發現、相
關分析、異常監測和趨勢分析[1]。
數據挖掘技術是目前數據倉庫領域廣泛使用的數據
分析手段。 它的分析思想是利用已知的數據通過建立數
學模型的方法找出隱含的業務規則, 在很多行業中都有
成功的案例。比如信用卡欺詐預測、通信行業惡意呼叫
行為分析等。
按照所挖掘的數據模式的不同,可以將數據挖掘方
法劃分為以下4 種[2]。
(1)關聯規則發現,關聯規則挖掘發現大量數據中
項集之間有價值的關聯或相互聯系。
(2)分類和預測,分類和預測用于提取描述重要數
據類的模型并運用該模型預測未來的數據趨勢。
(3)聚類分析,聚類就是將數據對象分組成為多個
類或簇,在同一個簇中的對象之間具有較高的相似度,
而不同簇中的對象差別較大。
(4)序列模式分析,序列模式分析和關聯分析相
似,其目的也是為了挖掘數據之間的聯系,但序列模式
分析的側重點在于分析數據間的前后序列關系。
通常一個完整的數據挖掘過程由業務問題定義、 數
據過濾、預處理、分析、準備、模型選擇與建立、模型
的評估與檢驗、模型應用與鞏固等多個步驟組成。以下
介紹運用數據挖掘技術分析客戶流失的一般過程。
1.2 數據挖掘流程
通信企業保存著客戶的相關信息, 呼叫數據及計費
等大量的數據,這些業務數據雖看似普通,卻能釋放出
關于客戶流失方面的珍貴信息, 數據挖掘技術與海量數
據有密不可分的關系,以及其強大的數學算法,使得它
能夠根據這些數據建立有關客戶流失的預測模型, 從而
分析出客戶流失的主要原因并且采取相應措施有效地挽
留有流失傾向的客戶。
數據挖掘是一個周而復始的過程, 許多軟件供應商
和數據挖掘顧問公司都提供一些數據挖掘過程模型, 來
指導他們的用戶一步步的進行數據挖掘工作,比如
SPSS 的5A 和SAS 的SEMMA。但基本的數據挖掘步
驟包括以下幾個步驟。
1.2.1 定義業務問題
業務問題定義要明確數據挖掘技術解決的是何種商
務問題,對客戶流失管理來說就是要定義何為流失。移
動通信領域的客戶流失有三方面的含義: 一指客戶從本
移動運營商轉網到其他通信運營商, 這是流失分析的重
點;二指客戶使用的手機品牌發生改變,從本移動運營
商的高價值品牌轉向低價值品牌, 如中國移動的用戶從
全球通客戶轉為神州行客戶;三指客戶ARPU(指每用
戶月平均消費量)降低,從高價值客戶成為低價值客戶。
在客戶流失分析中有兩個核心變量:財務原因/ 非財
務原因、主動流失/被動流失。客戶流失可以相應分為
4種類型,其中非財務原因主動流失的客戶往往是高價
值的客戶。他們會正常支付服務費用,并容易對市場活
動有所響應。這種客戶是通信企業真正需要保住的客
戶。
1.2.2 數據處理
這一過程所花的時間和精力要占整個數據挖掘項目
的50%~90%,它包括4 個步驟。
(1)數據過濾,這一步驟可以確保收集的數據符合
分析的需要。
(2)數據預處理,這一步驟應確保原始數據和輸入
標準一致,將分布在不同的數據庫中的數據和輸入標準
一致,將分布在不同的數據庫中數據,集合和合并到單
一的營銷數據庫,并協調來自多個數據源的數據在數值
上的差異,使數據屬性標準化。
(3)數據分析,在建立良好的預測模型之前,必須
對預處理后的數據進行初步分析,初步認識,找出對預
測輸出影響最大的數據字段,和決定是否需要定義導出
字段。
(4)數據準備,這是建模前數據處理的最后一步,
也是數據挖掘過程的核心。
主要有4個部分:選擇變量、選擇記錄、創建新變
量、轉換變量,使之和選定用來建立模型的算法一致。
1.2.3 建立模型
在多個可供選擇的模型中找出最佳模型, 初始模型
可能沒法達到數據挖掘的目的,需要多次反復。在尋找
最優模型過程中,可能要修改正在使用的數據,甚至修
改問題的定義。
1.2.4 評估和解釋模型
這個階段是對數據挖掘階段構建的模型進行比較和
評估,生成一個相對最優模型,并對此模型用業務語言
加以解釋。模型驗證的標準方法是從預處理數據中隨機
抽取兩個樣本,一個校準樣本用于構建模型,一個樣本
用于驗證校準樣本產生的模型。 通常一個好的模型運用
到驗證樣本中能得到較好的效果,如果效果差,就需要
重新構建模型。
1.2.5 運用和鞏固模型
對模型在實際應用中的表現進行監控, 將數據挖掘
的結果同運營市場反饋緊密聯系起來, 如果模型表現不
好,應實時適應市場調整挖掘模型,對模型做進一步的
考察和修正,以反映業務運作規律的變化。
2 客戶關系管理中數據挖掘的應用條件
目前通信運營商都具有業務營運系統、業務受許多
理網站、客戶服務呼叫中心等客戶信息系統,也擁有許
多成熟的數據庫應用系統,這些系統具有如下特點。
(1)目前通信運營系統實質上是實現了數據的物理
集中,業務系統之間則相互獨立。
(2)眾多的客戶數據、市場營銷數據、賬務數據以
不同的數據格式和訪問方式分散在不同的系統中,過于
分散、冗余,沒有形成整體的、唯一的、集中的客戶數
據,不能滿足數據挖掘過程中數據必須具有單一視圖的
要求。
(3)這些系統都是聯機事務處理(On-Line Transaction,
OLTP)系統,實時處理在線事務,不能適應數
據挖掘應用大規模、頻繁的檢索和查詢操作。
數據挖掘技術本身不是萬能的,一個完善的CRM
系統應該以數據挖掘技術為核心,要有效的支持客戶關
系管理,必須建立企業級的客戶信息數據倉庫,能夠把
強力推薦:
天柏客戶關系管理系統
天柏客戶關系管理系統(CRM)是一款集專業性、實用性、易用性為一體的純B/S架構的CRM系統,它基于以客戶為中心的協同管理思想和營銷理念,圍繞客戶生命周期的整個過程,針對不同價值的客戶實施以客戶滿意為目標的營銷策略,通過企業級協同,有效的“發現、保持和留住客戶”,從而達到留住客戶、提高銷售,實現企業利潤最大化的目的。通過對客戶進行7P的深入分析,即客戶概況分析(Profiling)、客戶忠誠度分析(Persistency)、客戶利潤分析(Profitability)、客戶性能分析(Performance)、客戶未來分析(Prospecting)、客戶產品分析(Product)、客戶促銷分析(Promotion)以及改善與管理企業銷售、營銷、客戶服務和支持等與客戶關系有關的業務流程并提高各個環節的自動化程度,從而幫助企業達到縮短銷售周期、降低銷售成本、擴大銷售量、增加收入與盈利、搶占更多市場份額、尋求新的市場機會和銷售渠道,最終從根本上提升企業的核心競爭力,使得企業在當前激烈的競爭環境中立于不敗之地。