CRM系統:數據挖掘在兒童培訓機構客戶關系管理中的應用
數據挖掘在兒童培訓機構客戶關系管理中的應用
趙艷芹,孫昌立
(黑龍江科技學院計算機與信息工程學院,哈爾濱150027)
(zyq_jean@sina. com)
摘 要:針對Ap riori關聯規則算法需要多次掃描事務數據庫及產生的候選集龐大的瓶頸問題,提出一種不產生
候選項目集,即可產生項目集的新算法,對數據的處理次數大大減少,提高了挖掘效率。并結合在兒童培訓機構客戶
關系管理(CRM)中客戶選擇的培訓內容的具體應用分析,闡明了基于Ap riori改進算法的CRM數據挖掘對于兒童培
訓機構增強競爭優勢的重要意義。
關鍵詞:數據挖掘;兒童培訓機構;客戶關系管理;Ap riori算法;頻繁集
中圖分類號: TP301. 6 文獻標志碼:A
Applica tion of da ta m in ing in CRM of children tra in ing institute
ZHAO Yan2qin, SUN Chang2li
(College of Com puter and Inform ation Engineering, Heilongjiang Institute of Science and Technology, Harbin Heilongjiang 150027, China)
Abstract: Concerning the bottleneck of classicalAp riori algorithm which need scan the transaction database multip le times
and might p roduce large candidate item sets, a new Ap riori algorithm was p roposed. The new algorithm could p roduce the item
sets without p roducing candidate item sets, thus greatly decreased the dealing timeswith data and imp roved the efficiency of data
mining. The new algorithm was app lied to analyze the chosen training items in the children training institute, expounding the
importantmeaning for increasing the competition of the imp roved Ap riori algorithm in CRM of children training institutes.
Key words: data mining; children training institute; Customer Relationship Management (CRM) ; Ap riori algorithm;
frequent itemset
0 引言
隨著我國對教育投資力度的增大,各大城市的規模不一
的兒童培訓機構也應運而生。面臨殘酷的市場競爭(兒童資
源有限) ,所有的兒童培訓機構都在不遺余力地爭取盡可能
多的客戶(兒童) ,與客戶保持長期穩定的關系。客戶關系管
理(Customer RelationshipManagement, CRM)作為一種旨在改
善企業與客戶之間關系的新型管理理念,其核心是“了解客
戶,傾聽客戶”,目標可以概括為“提高現有客戶滿意度和忠
誠度,降低客戶流失,吸引潛在客戶進入”,最終目的當然是
提高收益與競爭力。各大城市的兒童培訓機構要想從市場中
勝出,實施CRM的重要性不言而喻。數據挖掘中的關聯規則
算法通過對客戶需求進行深入的分析可以發現數據之間的潛
在聯系,為我們提供自動決策支持。
1 關聯規則數據挖掘
1. 1 數據挖掘理論基礎
數據挖掘(DataMining, DM) ,就是從大量的、不完全的、
有噪聲的、模糊的、隨機的數據庫中,提取隱含在其中的、人們
事先不知道的、但又是潛在有用的信息和知識的過程[ 1 ] 。關
聯規則挖掘的經典算法是頻繁集Ap riori算法[ 2 ] ,主要應用于
大規模商業數據中的規則提取,目前很多關聯規則算法均是
基于Ap riori算法改進的。
挖掘關聯規則就是發現存在于大量數據集中的關聯性或
相關性,例如關聯規則“95%客戶在購買醬油的同時也會購
買醋”,其直觀意義為顧客在購買某些商品的時候有多大傾
向會購買另外一些商品。
關聯規則挖掘問題是采用形式化描述來說明的,具有通
用意義,具體為:
設I = { i1, i2, ⋯, im } 是m個不同的項組成的集合。給定
一個事務數據庫D,其中的每一個事務T是I中一組項的集
合,即T A I,每個T有唯一的標識符T ID。若項集X A I且X A
T,則稱事務T包含項集X。關聯規則是形如X] Y的蘊涵式,
其中X A I, Y A I,且X ∩ Y = Á 。若關聯規則X] Y成立還應
具有以下兩個標志參數:支持度S,即事務數據庫D中至少有
S% 的事務同時包含X和Y中的所有項;置信度C,即在事務
數據庫D中包含X的事務至少有C% 同時也包含Y。在X] Y
中, X被稱為規則前件, Y被稱為規則后件,其中的X和Y均可
以由合取表達式構成。
1. 2 關聯規則經典頻繁集算法Ap riori
Ap riori算法是一種使用逐層搜索的迭代方法。Ap riori算
法利用Ap riori性質:“頻繁項目集的任何子集也一定是頻繁
的。”將滿足給定支持度的所有12頻繁項的每種組合作為產
生頻繁項的候選項,再對它們進行修剪,判斷其支持度是否大
于給定值,這樣遞推得到最后的頻繁集。由于Ap riori算法可
以產生相對較小的候選項目集,掃描數據庫的次數由最大頻
繁項目集的項目數決定,適合最大頻繁項目集相對較小的數
據集中的關聯規則挖掘問題。
1. 3 Ap riori算法的性能瓶頸
Ap riori算法作為一種經典的關聯規則挖掘算法,卻有兩
個致命的性能瓶頸[ 3 ]。
1)多次掃描事務數據庫。對每次k循環,候選集Ck 中的
每個元素都必須通過掃描數據庫一次來驗證其是否加入頻繁
項集Lk ,假如有一個頻繁大項集包含10個項的話, 那么就至
少需要掃描事務數據庫10遍。
2) 可能產生龐大的候選集。由Lk - 1產生k2候選集Ck是指
數增長的,如此大的候選集對時間和主存空間都是一種挑戰。
由于Ap riori算法的不足,本文提出了一種新的高效的關
聯規則挖掘算法,經實例驗證,其效率大大優于Ap riori算法。
強力推薦:
天柏客戶關系管理系統
天柏客戶關系管理系統(CRM)是一款集專業性、實用性、易用性為一體的純B/S架構的CRM系統,它基于以客戶為中心的協同管理思想和營銷理念,圍繞客戶生命周期的整個過程,針對不同價值的客戶實施以客戶滿意為目標的營銷策略,通過企業級協同,有效的“發現、保持和留住客戶”,從而達到留住客戶、提高銷售,實現企業利潤最大化的目的。通過對客戶進行7P的深入分析,即客戶概況分析(Profiling)、客戶忠誠度分析(Persistency)、客戶利潤分析(Profitability)、客戶性能分析(Performance)、客戶未來分析(Prospecting)、客戶產品分析(Product)、客戶促銷分析(Promotion)以及改善與管理企業銷售、營銷、客戶服務和支持等與客戶關系有關的業務流程并提高各個環節的自動化程度,從而幫助企業達到縮短銷售周期、降低銷售成本、擴大銷售量、增加收入與盈利、搶占更多市場份額、尋求新的市場機會和銷售渠道,最終從根本上提升企業的核心競爭力,使得企業在當前激烈的競爭環境中立于不敗之地。