CRM系統(tǒng):數(shù)據(jù)挖掘在電信客戶關(guān)系管理的應(yīng)用
數(shù)據(jù)挖掘在電信客戶關(guān)系管理的應(yīng)用
何明軒
( 同濟(jì)大學(xué), 上海200092)
摘要: 本文介紹了數(shù)據(jù)挖掘的相關(guān)概念與知識(shí), 提出了數(shù)據(jù)挖掘在當(dāng)今從海量數(shù)據(jù)中提取相關(guān)信息, 和知識(shí)發(fā)現(xiàn)的過(guò)程, 與此同時(shí)介
紹了數(shù)據(jù)挖掘在幫助企業(yè)進(jìn)行數(shù)據(jù)分析, 推理, 預(yù)測(cè)的應(yīng)用, 例如: 關(guān)聯(lián)分析、時(shí)序模式、偏差分析、分類、聚類、預(yù)測(cè)等。與此同時(shí), 著重提
出了數(shù)據(jù)挖掘在電信行業(yè)營(yíng)銷的應(yīng)用, 介紹了國(guó)內(nèi)外應(yīng)用現(xiàn)狀, 并以國(guó)內(nèi)某電信運(yùn)營(yíng)商的數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目為例, 例證了數(shù)據(jù)挖掘在客戶分
群和流失預(yù)測(cè)的成功應(yīng)用, 在此基礎(chǔ)上, 展望了未來(lái)的可發(fā)展方向。
關(guān)鍵詞: 數(shù)據(jù)挖掘; 企業(yè)應(yīng)用; 電信客戶分群; 客戶流失預(yù)測(cè)
中圖分類號(hào): TP274 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1009- 3044(2007)03- 10620- 02
The Application of Data Mining on CRM in Telecommunicaion
HE Ming- xuan
(Tongji University,Shanghai 200092)
Abs tract:This paper is about the introduction of data mining including the conception and some related knowledge which is discovering invisible
information from huge of data, we can call it process of knowledge of learning. Meanwhile, it also presents the application of data mining
on the field of data analysis, consequence and forecast in enterprises. For example, association analysis, warp analysis, sequence module, classification
and clustering. It also takes a telecommunication enterprises as example, which testified the success of attempt at using data mining at customer
clustering and prediction of losing customers. At the end of the paper, it prospects the future of the App of data mining on the solution of
other problems in telecommunication.
Key words :Data mining; Application on enterprises; Customer clustering; Prediction of losing customer
1 引言
隨著國(guó)內(nèi)電信市場(chǎng)競(jìng)爭(zhēng)的日趨激烈, 電信運(yùn)營(yíng)商的經(jīng)營(yíng)模式
逐漸從“技術(shù)驅(qū)動(dòng)”向“市場(chǎng)驅(qū)動(dòng)”、“客戶驅(qū)動(dòng)”轉(zhuǎn)化。這就要求運(yùn)
營(yíng)商要采取以客戶為中心的策略, 根據(jù)客戶的實(shí)際需求提供多樣
化、層次化、個(gè)性化的服務(wù)解決方案。因此, 客戶關(guān)系管理成了電
信運(yùn)營(yíng)商增加收入和利潤(rùn), 提高客戶滿意度、忠誠(chéng)度的有效工具。
在客戶關(guān)系管理的流程中, 為了準(zhǔn)確、及時(shí)地進(jìn)行經(jīng)營(yíng)決策, 必須
充分獲取并利用相關(guān)的數(shù)據(jù)信息對(duì)決策過(guò)程進(jìn)行輔助支持。另
外, 面對(duì)用戶的多樣化、層次化、個(gè)性化的需求, 大眾化營(yíng)銷已經(jīng)
失去了它的優(yōu)勢(shì), 基于客戶信息、客戶價(jià)值和行為的深入的數(shù)據(jù)
分析的洞察力營(yíng)銷、精確化營(yíng)銷的理念逐漸被各大電信運(yùn)營(yíng)商所
接受, 并渴望通過(guò)從數(shù)據(jù)中挖掘價(jià)值來(lái)減少營(yíng)銷成本、提高
營(yíng)銷效益。近幾年迅速發(fā)展起來(lái)的數(shù)據(jù)挖掘技術(shù)成為實(shí)現(xiàn)這些目
標(biāo)的必要手段。
數(shù)據(jù)挖掘是從海量數(shù)據(jù)中提取隱含在其中的有用信息和知
識(shí)的過(guò)程。它可以幫助企業(yè)對(duì)數(shù)據(jù)進(jìn)行微觀、中觀乃至宏觀的統(tǒng)
計(jì)、分析、綜合和推理, 從而利用已有數(shù)據(jù)預(yù)測(cè)未來(lái), 幫助企業(yè)贏
得競(jìng)爭(zhēng)優(yōu)勢(shì)。例如, 利用數(shù)據(jù)挖掘可以對(duì)企業(yè)的海量數(shù)據(jù)進(jìn)行客
戶分析, 包括客戶類型、各類客戶的需求傾向、購(gòu)買行為預(yù)測(cè)和客
戶信用政策分析、客戶流失分析等; 進(jìn)行市場(chǎng)研究, 包括商品市場(chǎng)
占有率預(yù)測(cè)、市場(chǎng)拓展計(jì)劃仿真; 進(jìn)行經(jīng)營(yíng)策略研究, 包括經(jīng)營(yíng)成
本與收入分析、風(fēng)險(xiǎn)控制、欺詐行為甄別等。
數(shù)據(jù)挖掘旨在從數(shù)據(jù)庫(kù)中提取正確的、非平常的、未知的、有
潛在應(yīng)用價(jià)值的并最終可為用戶理解的模式。它的出現(xiàn)為自動(dòng)和
智能地把海量的數(shù)據(jù)轉(zhuǎn)化成有用的信息和知識(shí)提供了手段。數(shù)據(jù)
挖掘涉及到諸如機(jī)器學(xué)習(xí)、模式識(shí)別、統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)和人工智能
等等眾多學(xué)科, 是數(shù)據(jù)庫(kù)理論和機(jī)器學(xué)習(xí)的交叉學(xué)科。
2 數(shù)據(jù)挖掘主要的一些應(yīng)用
(1)關(guān)聯(lián)分析: 其目的就是挖掘出隱藏在數(shù)據(jù)間的相互關(guān)系。
例如, 買電腦的顧客同時(shí)會(huì)買某種軟件, 這就是一條關(guān)聯(lián)規(guī)則。
(2) 時(shí)序模式: 通過(guò)時(shí)間序列搜索出重復(fù)發(fā)生概率較高的模
式, 這里強(qiáng)調(diào)時(shí)間序列的影響。例如, 購(gòu)買了激光打印機(jī)的人中,
半年后80%的人會(huì)買新硒鼓。
(3)分類: 找出一個(gè)類別的概念描述, 它代表了這類數(shù)據(jù)的整
體信息。分類數(shù)據(jù)挖掘中應(yīng)用最多的任務(wù)。
(4)聚類: 按一定規(guī)則將數(shù)據(jù)分為一系列有意義的子集。同一
聚類中, 個(gè)體之間的差距較小; 不同聚類中, 個(gè)體之間的距離偏
大。聚類和分類有著很大的區(qū)別: 分類時(shí), 我們總是事先知道哪些
屬性是重要的, 我們總是將重要的、有影響力的屬性作為分類的
依據(jù); 而聚類時(shí), 我們事先根本不知道哪些屬性起作用, 我們的任
務(wù)就是要找到那些起關(guān)鍵作用的屬性。
(5)偏差分析: 從數(shù)據(jù)庫(kù)中找出異常數(shù)據(jù), 比如欺詐行為的發(fā)
現(xiàn)。
(6)預(yù)測(cè): 利用歷史數(shù)據(jù)找出規(guī)律, 建立模型, 并用此模型預(yù)測(cè)
未來(lái)數(shù)據(jù)的種類、特征等。
在國(guó)內(nèi)外, 數(shù)據(jù)挖掘已經(jīng)有不少成功案例。目前國(guó)內(nèi)企業(yè)實(shí)
現(xiàn)數(shù)據(jù)挖掘的困難在于缺少數(shù)據(jù)積累、難于構(gòu)建業(yè)務(wù)模型、各類
人員之間的溝通存在障礙、缺少有經(jīng)驗(yàn)的實(shí)施者、初期資金投入
較大。而在國(guó)外, 數(shù)據(jù)挖掘首先在金融、證券、電信、零售業(yè)等數(shù)據(jù)
密集型行業(yè)實(shí)施, 因?yàn)檫@些行業(yè)信息化程度比較高, 數(shù)據(jù)庫(kù)中已
經(jīng)保留了大量數(shù)據(jù)資源。有數(shù)據(jù)表明, 進(jìn)入二十世紀(jì)90 年代, 人
類積累的數(shù)據(jù)量以每月高于15%的速度增加, 如果不借助強(qiáng)有力
的挖掘工具, 僅依靠人的能力來(lái)理解這些數(shù)據(jù)是不可能的。數(shù)據(jù)
挖掘的前景被人們普遍看好。國(guó)際知名調(diào)查機(jī)構(gòu)Gartner Group 在
高級(jí)技術(shù)調(diào)查報(bào)告中, 將數(shù)據(jù)挖掘和人工智能列為“未來(lái)三到五
年內(nèi)將對(duì)工業(yè)產(chǎn)生深遠(yuǎn)影響的五大關(guān)鍵技術(shù)”之首, 還將并行處
理體系和數(shù)據(jù)挖掘列為未來(lái)五年內(nèi)投資焦點(diǎn)的十大新興技術(shù)前
兩位。Gartner 的調(diào)查報(bào)告預(yù)計(jì): 到2010 年, 數(shù)據(jù)挖掘在相關(guān)市場(chǎng)
的應(yīng)用將從目前少于5%增加到超過(guò)80%。美國(guó)銀行家協(xié)會(huì)預(yù)測(cè)
數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)在美國(guó)商業(yè)銀行的應(yīng)用增長(zhǎng)率是
14.9%。
數(shù)據(jù)挖掘目前在電信行業(yè)也已得到廣泛應(yīng)用, 比如:
(1)客戶消費(fèi)模式分析
客戶消費(fèi)模式分析( 如固話話費(fèi)行為分析) 是對(duì)客戶歷年來(lái)
長(zhǎng)話、市話、信息臺(tái)的大量詳單、數(shù)據(jù)以及客戶檔案資料等相關(guān)數(shù)
據(jù)進(jìn)行關(guān)聯(lián)分析, 結(jié)合客戶的分類, 可以從消費(fèi)能力、消費(fèi)習(xí)慣、
消費(fèi)周期等諸方面對(duì)客戶的話費(fèi)行為進(jìn)行分析和預(yù)測(cè), 從而為固
話運(yùn)營(yíng)商的相關(guān)經(jīng)營(yíng)決策提供依據(jù)。
(2)客戶市場(chǎng)推廣分析
客戶市場(chǎng)推廣分析( 如優(yōu)惠策略預(yù)測(cè)仿真) 是利用數(shù)據(jù)挖掘
技術(shù)實(shí)現(xiàn)優(yōu)惠策略的仿真, 根據(jù)數(shù)據(jù)挖掘模型進(jìn)行模擬計(jì)費(fèi)和模
擬出賬, 其仿真結(jié)果可以揭示優(yōu)惠策略中存在的問(wèn)題, 并進(jìn)行相
應(yīng)的調(diào)整優(yōu)化, 以達(dá)到優(yōu)惠促銷活動(dòng)的收益最大化。
(3)客戶欠費(fèi)分析和動(dòng)態(tài)防欺詐
通過(guò)數(shù)據(jù)挖掘, 總結(jié)各種騙費(fèi)、欠費(fèi)行為的內(nèi)在規(guī)律, 并建立
一套欺詐和欠費(fèi)行為的規(guī)則庫(kù)。當(dāng)客戶的話費(fèi)行為與該庫(kù)中規(guī)則
吻合時(shí), 系統(tǒng)可以提示運(yùn)營(yíng)商相關(guān)部門采取措施, 從而降低運(yùn)營(yíng)
商的損失風(fēng)險(xiǎn)。
(4)客戶流失分析
根據(jù)已有的客戶流失數(shù)據(jù), 建立客戶屬性、服務(wù)屬性、客戶消
費(fèi)情況等數(shù)據(jù)與客戶流失概率相關(guān)聯(lián)的數(shù)學(xué)模型, 找出這些數(shù)據(jù)
之間的關(guān)系, 并給出明確的數(shù)學(xué)公式。然后根據(jù)此模型來(lái)監(jiān)控客
戶流失的可能性, 如果客戶流失的可能性過(guò)高, 則通過(guò)促銷等手
段來(lái)提高客戶忠誠(chéng)度, 防止客戶流失的發(fā)生。這就徹底改變了以
往電信運(yùn)營(yíng)商在成功獲得客戶以后無(wú)法監(jiān)控客戶流失、無(wú)法有效
實(shí)現(xiàn)客戶關(guān)懷的狀況。
各運(yùn)營(yíng)支撐系統(tǒng)所積累的海量歷史數(shù)據(jù)是企業(yè)的一筆寶貴
財(cái)富, 誰(shuí)能正確地挖掘與分析隱含在數(shù)據(jù)中的知識(shí), 誰(shuí)就能更好
地向用戶提供產(chǎn)品與服務(wù), 從而在競(jìng)爭(zhēng)中獲勝。數(shù)據(jù)挖掘正是充
分利用這些寶貴資源從中提取知識(shí)的一種技術(shù)。在國(guó)外, 英國(guó)電
信選用了SPSS 的數(shù)據(jù)挖掘產(chǎn)品Clementine, 為其“商業(yè)高速公路”
活動(dòng)分析數(shù)據(jù)和建立探索模型, 更好地了解了這些客戶的行為特
征, 向銷售人員提供最佳客戶的清單, 直郵活動(dòng)回應(yīng)率提高了
100%。美國(guó)西部電信利用銷售活動(dòng)管理軟件, 連同SAS 的Enterprise
Miner 一起, 既消除了銷售人員對(duì)全部客戶數(shù)據(jù)進(jìn)行評(píng)分
的負(fù)擔(dān), 也減少了手工干預(yù)所造成的人為錯(cuò)誤, 公司的市場(chǎng)營(yíng)銷
周期大為縮短, 使企業(yè)得到了更高的營(yíng)銷投資回報(bào)。麻薩諸賽州
Lightbridge 公司用數(shù)據(jù)挖掘技術(shù)中的分類回歸樹(shù)為英格蘭一家主
要電話公司建立和部署了一個(gè)分析客戶流失的預(yù)測(cè)模型, 使得公
司能及時(shí)發(fā)現(xiàn)高價(jià)值的流失客戶并且能夠及時(shí)采取挽留的措施,
極大降低了電話公司客戶流失率。比利時(shí)國(guó)家電信使用數(shù)據(jù)倉(cāng)庫(kù)
建立顧客信息系統(tǒng), 通過(guò)實(shí)施客戶欺騙檢測(cè), 能夠很快發(fā)現(xiàn)反常
電話以及欺騙性的打電話方式, 并能在造成重大經(jīng)濟(jì)損失之前終
止這種欺騙行為。
某電信運(yùn)營(yíng)商實(shí)施數(shù)據(jù)挖掘應(yīng)用有非常好的基礎(chǔ), 某電信運(yùn)
營(yíng)商在ITSP 規(guī)劃指導(dǎo)下, 于2004 年3 月啟動(dòng)數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目, 并
于2005 年6 月完成項(xiàng)目初驗(yàn)。建立了企業(yè)統(tǒng)一數(shù)據(jù)視圖和統(tǒng)一
統(tǒng)計(jì)口徑的數(shù)據(jù)倉(cāng)庫(kù)為數(shù)據(jù)挖掘提供了進(jìn)行廣泛的數(shù)據(jù)分析的
基礎(chǔ)。數(shù)據(jù)挖掘和數(shù)據(jù)倉(cāng)庫(kù)的協(xié)同工作, 一方面, 可以迎合和簡(jiǎn)化
數(shù)據(jù)挖掘過(guò)程中的重要步驟, 提高數(shù)據(jù)挖掘的效率和能力, 確保
數(shù)據(jù)挖掘中數(shù)據(jù)來(lái)源的廣泛性和完整性。另一方面, 數(shù)據(jù)挖掘技
術(shù)已經(jīng)成為數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用中極為重要和相對(duì)獨(dú)立的方面和工具。
數(shù)據(jù)挖掘和數(shù)據(jù)倉(cāng)庫(kù)的融合與互動(dòng)發(fā)展為廣大渴望從數(shù)據(jù)“奴
隸”到數(shù)據(jù)“主人”轉(zhuǎn)變的企業(yè)最終用戶提供了通途。另外, 該電信
也已經(jīng)在數(shù)據(jù)挖掘應(yīng)用方面作出了許多卓有成效的嘗試。數(shù)據(jù)倉(cāng)
庫(kù)的建設(shè)期間, 數(shù)據(jù)挖掘應(yīng)用也在其地市電信分公司進(jìn)行了試點(diǎn)
工作, 在客戶流失預(yù)測(cè)和客戶分群分面取得了顯著的應(yīng)用效果。
該公司于2005 年1 月20 日在某市啟動(dòng)基于數(shù)據(jù)挖掘的客戶分
群應(yīng)用的MR 項(xiàng)目試點(diǎn), 4 月1 日完成試點(diǎn)客戶分群, 隨后用一個(gè)
月時(shí)間在另一試點(diǎn)進(jìn)行了推廣, 目前已于8 月30 日通過(guò)了MR
試點(diǎn)初驗(yàn)。通過(guò)客戶分群, 根據(jù)客戶可能的行為和潛在的價(jià)值對(duì)
客戶進(jìn)行分類, 針對(duì)每一類客戶的特點(diǎn)制定有針對(duì)性的營(yíng)銷策
略, 為市