CRM系統:數據挖掘在企業CRM中的研究
數據挖掘在企業CRM中的研究
李忠
( 1 江南大學; 2 常州高等職業技術學校, 江蘇常州213000)
摘要:本文主要介紹了數據挖掘的基本概念、功能分類以及數據挖掘技術在CRM中的典型應用; 隨后文章選擇C4.5 算法
為本系統增加分析功能; 接著對C4.5 算法進行了深入的研究與分析, 發現在計算速度以及生成結果的復雜性上有待改進, 在
此基礎上提出了改進優化的方法并用程序實現, 通過實驗比較證明取得了良好的效果。在文章的最后用改進后的C4.5 算法
為本CRM系統實現了客戶的保持分析功能。
關鍵詞: CRM; 數據挖掘; 改進C4.5 算法; 功能; 處理
1 引言
客戶關系管理(Customer Relationship Management)的指導思
想就是對客戶進行系統化的研究, 以便改進對客戶的服務水平,
提高客戶的忠誠度, 并因此為企業帶來更多的利潤。這就要求
CRM系統要能夠在有效地獲取客戶的各種信息的同時, 對客戶
的行為方式進行深入地分析, 尋找其中的規律, 為客戶提供更
好、更個性化的服務, 為企業決策提供支持。然而如何管理和分
析大量、龐雜的客戶信息, 從中找出對企業管理決策有價值的知
識則需要有更先進的技術和工具的支持, 而數據挖掘等新興技
術的出現, 為CRM的實施提供了良好的支持。
數據挖掘的功能以及方法有多種, 如關聯分析、分類、聚類和時
序模式等, 關聯分析可以用于交叉營銷中的連帶銷售; 聚類一般
可以用于數據挖掘前數據的預處理; 而分類是CRM中運用最為
廣泛的一種方式, 它可以被用于客戶細分、客戶獲取等方面, 本
文將使用分類方法為CRM系統實現客戶的保持功能, 在接下來
將重點討論數據挖掘的CMR 中的運用。
2 典型算法分類與選擇
目前已經出現了好幾種決策樹分類算法, 如: ID3; C4.5;
CHAID; CHART; SLIQ; SPRINT; PUBLIC 等, 現列出與本課題相
關的具有代表性的一些算法。
ID3 算法雖然是比較經典也是最老的一種算法, 可是它存
在許多的不足: 一是它不能處理連續屬性值, 對于連續值屬性,
它都要把該屬性離散化, 這樣就大大降低了分類的精確度; 二是
算法過程不靈活, 不能處理有空缺值的樣本集合, 這就對訓練樣
本集合的質量提出很高的要求。三是生成的決策樹太大, 因為對
于每個離散屬性如果作為分裂屬性, 如果有n 個屬性值, 那么就
會長出n 個子樹。
SPRINT 算法是一種比較成熟的決策樹分類算法, 它幾乎克
服了以往已經提出的算法中的一些缺憾, 可是該算法的側重點
在于處理超大形容量的數據。此算法可以不受到機器主存大小
的限制, 可以把數據在主存與輔存之間來回切換。本人認為在本
文所建立的CRM系統中所處理的數據是與客戶有關, 而象中小
型企業這樣的客戶容量遠沒有這樣的大, 所以不建議使用該算
法。
C4.5 算法是Quinlan 的ID3 算法的改進版本, 該算法克服
了ID3 中的缺憾, 能夠直接處理連續值屬性, 能夠處理有空缺值
的樣本集合。它從樹的根結點處的所有訓練樣本開始,選取一個
屬性來區分這些樣本。對屬性的每一個值產生一個分支, 分支屬
性值的相應樣本子集被移到新生成的子結點上, 這個算法遞歸
地應用于每個子結點上, 直到結點的所有樣本都分區到某個類
中, 到達決策樹的葉結點的每條路徑表示一個分類規則。這樣自
頂向下的決策樹的生成算法的關鍵性決策是對結點屬性值的選
擇。該算法簡單易懂, 而且效率高, 這也正是我們所追求的目標。
所以本文中, 我們選擇該算法為CRM實現客戶的保持分析功
能。
3 基于C4.5 算法的改進
C4.5 算法雖然添加了對于有連續值的屬性的處理方法, 可
是在每個結點處都要對連續值進行排序, 浪費大量CPU 時間。
本文在C4.5 算法的基礎上引進了SPRINT 算法中對于連續值的
處理方法, 采用屬性列表( attribute lists) 的方式對記錄集一次性
進行排序。在表的數據集中, 我們在讀入內存的過程中就將其
分解為兩個屬性的列表, 然后對有連續值的屬性進行一次性的
排序。
強力推薦:
天柏客戶關系管理系統
天柏客戶關系管理系統(CRM)是一款集專業性、實用性、易用性為一體的純B/S架構的CRM系統,它基于以客戶為中心的協同管理思想和營銷理念,圍繞客戶生命周期的整個過程,針對不同價值的客戶實施以客戶滿意為目標的營銷策略,通過企業級協同,有效的“發現、保持和留住客戶”,從而達到留住客戶、提高銷售,實現企業利潤最大化的目的。通過對客戶進行7P的深入分析,即客戶概況分析(Profiling)、客戶忠誠度分析(Persistency)、客戶利潤分析(Profitability)、客戶性能分析(Performance)、客戶未來分析(Prospecting)、客戶產品分析(Product)、客戶促銷分析(Promotion)以及改善與管理企業銷售、營銷、客戶服務和支持等與客戶關系有關的業務流程并提高各個環節的自動化程度,從而幫助企業達到縮短銷售周期、降低銷售成本、擴大銷售量、增加收入與盈利、搶占更多市場份額、尋求新的市場機會和銷售渠道,最終從根本上提升企業的核心競爭力,使得企業在當前激烈的競爭環境中立于不敗之地。