CRM系統(tǒng):數(shù)據(jù)挖掘在兒童培訓機構客戶關系管理中的應用
數(shù)據(jù)挖掘在兒童培訓機構客戶關系管理中的應用
趙艷芹,孫昌立
(黑龍江科技學院計算機與信息工程學院,哈爾濱150027)
(zyq_jean@sina. com)
摘 要:針對Ap riori關聯(lián)規(guī)則算法需要多次掃描事務數(shù)據(jù)庫及產(chǎn)生的候選集龐大的瓶頸問題,提出一種不產(chǎn)生
候選項目集,即可產(chǎn)生項目集的新算法,對數(shù)據(jù)的處理次數(shù)大大減少,提高了挖掘效率。并結合在兒童培訓機構客戶
關系管理(CRM)中客戶選擇的培訓內(nèi)容的具體應用分析,闡明了基于Ap riori改進算法的CRM數(shù)據(jù)挖掘對于兒童培
訓機構增強競爭優(yōu)勢的重要意義。
關鍵詞:數(shù)據(jù)挖掘;兒童培訓機構;客戶關系管理;Ap riori算法;頻繁集
中圖分類號: TP301. 6 文獻標志碼:A
Applica tion of da ta m in ing in CRM of children tra in ing institute
ZHAO Yan2qin, SUN Chang2li
(College of Com puter and Inform ation Engineering, Heilongjiang Institute of Science and Technology, Harbin Heilongjiang 150027, China)
Abstract: Concerning the bottleneck of classicalAp riori algorithm which need scan the transaction database multip le times
and might p roduce large candidate item sets, a new Ap riori algorithm was p roposed. The new algorithm could p roduce the item
sets without p roducing candidate item sets, thus greatly decreased the dealing timeswith data and imp roved the efficiency of data
mining. The new algorithm was app lied to analyze the chosen training items in the children training institute, expounding the
importantmeaning for increasing the competition of the imp roved Ap riori algorithm in CRM of children training institutes.
Key words: data mining; children training institute; Customer Relationship Management (CRM) ; Ap riori algorithm;
frequent itemset
0 引言
隨著我國對教育投資力度的增大,各大城市的規(guī)模不一
的兒童培訓機構也應運而生。面臨殘酷的市場競爭(兒童資
源有限) ,所有的兒童培訓機構都在不遺余力地爭取盡可能
多的客戶(兒童) ,與客戶保持長期穩(wěn)定的關系??蛻絷P系管
理(Customer RelationshipManagement, CRM)作為一種旨在改
善企業(yè)與客戶之間關系的新型管理理念,其核心是“了解客
戶,傾聽客戶”,目標可以概括為“提高現(xiàn)有客戶滿意度和忠
誠度,降低客戶流失,吸引潛在客戶進入”,最終目的當然是
提高收益與競爭力。各大城市的兒童培訓機構要想從市場中
勝出,實施CRM的重要性不言而喻。數(shù)據(jù)挖掘中的關聯(lián)規(guī)則
算法通過對客戶需求進行深入的分析可以發(fā)現(xiàn)數(shù)據(jù)之間的潛
在聯(lián)系,為我們提供自動決策支持。
1 關聯(lián)規(guī)則數(shù)據(jù)挖掘
1. 1 數(shù)據(jù)挖掘理論基礎
數(shù)據(jù)挖掘(DataMining, DM) ,就是從大量的、不完全的、
有噪聲的、模糊的、隨機的數(shù)據(jù)庫中,提取隱含在其中的、人們
事先不知道的、但又是潛在有用的信息和知識的過程[ 1 ] 。關
聯(lián)規(guī)則挖掘的經(jīng)典算法是頻繁集Ap riori算法[ 2 ] ,主要應用于
大規(guī)模商業(yè)數(shù)據(jù)中的規(guī)則提取,目前很多關聯(lián)規(guī)則算法均是
基于Ap riori算法改進的。
挖掘關聯(lián)規(guī)則就是發(fā)現(xiàn)存在于大量數(shù)據(jù)集中的關聯(lián)性或
相關性,例如關聯(lián)規(guī)則“95%客戶在購買醬油的同時也會購
買醋”,其直觀意義為顧客在購買某些商品的時候有多大傾
向會購買另外一些商品。
關聯(lián)規(guī)則挖掘問題是采用形式化描述來說明的,具有通
用意義,具體為:
設I = { i1, i2, ⋯, im } 是m個不同的項組成的集合。給定
一個事務數(shù)據(jù)庫D,其中的每一個事務T是I中一組項的集
合,即T A I,每個T有唯一的標識符T ID。若項集X A I且X A
T,則稱事務T包含項集X。關聯(lián)規(guī)則是形如X] Y的蘊涵式,
其中X A I, Y A I,且X ∩ Y = Á 。若關聯(lián)規(guī)則X] Y成立還應
具有以下兩個標志參數(shù):支持度S,即事務數(shù)據(jù)庫D中至少有
S% 的事務同時包含X和Y中的所有項;置信度C,即在事務
數(shù)據(jù)庫D中包含X的事務至少有C% 同時也包含Y。在X] Y
中, X被稱為規(guī)則前件, Y被稱為規(guī)則后件,其中的X和Y均可
以由合取表達式構成。
1. 2 關聯(lián)規(guī)則經(jīng)典頻繁集算法Ap riori
Ap riori算法是一種使用逐層搜索的迭代方法。Ap riori算
法利用Ap riori性質(zhì):“頻繁項目集的任何子集也一定是頻繁
的。”將滿足給定支持度的所有12頻繁項的每種組合作為產(chǎn)
生頻繁項的候選項,再對它們進行修剪,判斷其支持度是否大
于給定值,這樣遞推得到最后的頻繁集。由于Ap riori算法可
以產(chǎn)生相對較小的候選項目集,掃描數(shù)據(jù)庫的次數(shù)由最大頻
繁項目集的項目數(shù)決定,適合最大頻繁項目集相對較小的數(shù)
據(jù)集中的關聯(lián)規(guī)則挖掘問題。
1. 3 Ap riori算法的性能瓶頸
Ap riori算法作為一種經(jīng)典的關聯(lián)規(guī)則挖掘算法,卻有兩
個致命的性能瓶頸[ 3 ]。
1)多次掃描事務數(shù)據(jù)庫。對每次k循環(huán),候選集Ck 中的
每個元素都必須通過掃描數(shù)據(jù)庫一次來驗證其是否加入頻繁
項集Lk ,假如有一個頻繁大項集包含10個項的話, 那么就至
少需要掃描事務數(shù)據(jù)庫10遍。
2) 可能產(chǎn)生龐大的候選集。由Lk - 1產(chǎn)生k2候選集Ck是指
數(shù)增長的,如此大的候選集對時間和主存空間都是一種挑戰(zhàn)。
由于Ap riori算法的不足,本文提出了一種新的高效的關
聯(lián)規(guī)則挖掘算法,經(jīng)實例驗證,其效率大大優(yōu)于Ap riori算法。
強力推薦:
天柏客戶關系管理系統(tǒng)
天柏客戶關系管理系統(tǒng)(CRM)是一款集專業(yè)性、實用性、易用性為一體的純B/S架構的CRM系統(tǒng),它基于以客戶為中心的協(xié)同管理思想和營銷理念,圍繞客戶生命周期的整個過程,針對不同價值的客戶實施以客戶滿意為目標的營銷策略,通過企業(yè)級協(xié)同,有效的“發(fā)現(xiàn)、保持和留住客戶”,從而達到留住客戶、提高銷售,實現(xiàn)企業(yè)利潤最大化的目的。通過對客戶進行7P的深入分析,即客戶概況分析(Profiling)、客戶忠誠度分析(Persistency)、客戶利潤分析(Profitability)、客戶性能分析(Performance)、客戶未來分析(Prospecting)、客戶產(chǎn)品分析(Product)、客戶促銷分析(Promotion)以及改善與管理企業(yè)銷售、營銷、客戶服務和支持等與客戶關系有關的業(yè)務流程并提高各個環(huán)節(jié)的自動化程度,從而幫助企業(yè)達到縮短銷售周期、降低銷售成本、擴大銷售量、增加收入與盈利、搶占更多市場份額、尋求新的市場機會和銷售渠道,最終從根本上提升企業(yè)的核心競爭力,使得企業(yè)在當前激烈的競爭環(huán)境中立于不敗之地。