RFM模型在销售数据分析中的应用(综述报告)

上传人:小** 文档编号:61305351 上传时间:2022-03-11 格式:DOC 页数:8 大小:206.50KB
返回 下载 相关 举报
RFM模型在销售数据分析中的应用(综述报告)_第1页
第1页 / 共8页
RFM模型在销售数据分析中的应用(综述报告)_第2页
第2页 / 共8页
RFM模型在销售数据分析中的应用(综述报告)_第3页
第3页 / 共8页
点击查看更多>>
资源描述
RFM模型在销售数据分析中的应用(以电气行业为例)本文作者:邓光耀摘要:本文以电气行业销響的数据分析为例,利用RFM模型对客户进行分类,提出了 R值、 F值、M值等三个指标的分类标准,及给出了确定RFM模型中客户在决策者心目中的排名 规则的具体办法,文中比较详细地介绍了确定指标排名规则的层次分析法,并综述了国内外 学者对RFM模型的研究情况。关键词:R (Recency): F (Frequency): M (Monetary):帕累托定律:层次分析法1 RFM模型相关背景知识介绍根据美国数据库营销研究所的Arthur Hughes 1994年的研究,客户数据库中有三个 神奇的要素,这三个要素构成了数据分析AJ好的指标:报近一次消费(Recency):消 费频率(Frequency):消费金额(Monetary)目前国内外学者对RFM模型做了以卜研究:周颖等人利用了聚类分析的方法对 电信市场进行了 RFM模型的分析;陈伯成等人利用了神经网络方法对模拟数据进行 T RFM模型的分析。这些研究均没冇对RFM模型的分类标准进行探讨,另外只简单 地按照各指标是否大于平均值来对客户分类。己经有了的RFM分析将客户群分成觅要 保持客户、眾要发展客户、重要挽留客户、一般更要客户、一般客户、无价值客户等 六个类别,分类规则基本上按照各指标的分值是否人于平均值来分的,本来有2*2*2二8 种,由于论文的作者根据聚类分析的结呆合并了两种客户类型,因此只有六个类别。 读者可以参考以下文献:林盛,肖旭.基于RFM的电信客户市场细分方法J哈尔滨工业 大学学报,2006, 5.以上分类不能达到监控客户交易异常行为,防止巫要客户流失的目的,因此本文提出 一种分类标准供人家参考,并利用层次分析法确定了 R、F、M等三个指标的权重, 从而给出合理的RFM指标的排名规则。本文另外利用实际数据研究了这三个指标的 相关性,并给出数据分析中要用到的excel函数表达式。2、分类标准的确定Spssl7.0以上版本提供了做RFM模型分析的模块,不过对各指标的分类标准却没冇公 布。本文根据公司销儕的实际数据,以2011年1月到2011年3月为样本期,考察了 450 家客户与公司的交易情况。提出以下分类标准:确定R值指标的excel函数表达式为:=if(c3二datevalue( ” 2010-1-31 ”),1 , if(c3=datevalue( 2010-2-28 ),2, if(c3=datevalue ( M 2010-3-10 ”),3, if (c3=datevalue( ” 2010-3-20 ”),4,5)。这里datevalue函数的作用是将口期转化为柑应的序列数,这样拖动填允柄,我们町 以快速右效地把各客户分类。确定F值指标、M值指标的分类我们町以按照帕累托定律來做, 所谓帕累托定律是指公司80%的销竹额是由20%的觅点客户创造的。故我们将排名前5$的F 值或者M值定义为5, 5弔到15%之间的客户定义为4, 15%到30%的客户定义为3, 30%到50%的客 户定义为2, 50%到100%的定义为1,根据以上标准可得excel函数表达式如下:F 值:=IF(D33, 1, IF(D36, 2, IF(D310, 3, IF(D318, 4,5):Mffi: =IF(F37500, 1, IF(F325000, 2, IF(F3lC0000, 3, IF(F311. 看起来代码543的客户应该比代码344的客户的排名高,但是由于在决策者的心中般看巫的 是M值指标,这样考虑起来代码344的客户的排名应该更高,这样就产生了矛盾。另外两家 代码均是555的客户谁的排名应该高些?这一点我们可以先比较交易额,交易额大的客户排 名更高,如果客户的交易额也相同,我们按最近交易口期来确定排名次序,如果还是相同的, 我们再看交易次数,看上次的排名情况等等来确定排名次序。实际上,我们一般情况I、只需 要比较交易额就可以确定排名次序。我们来解决代码543的客户与代码344的客户谁的排名高的问题,貝体办法是利用层次 分析法。层次分析法町以将感性认识呈化,从而得到各指标的权审。卜面叙述这种方法:层次分析法(The analytic hierarchy process)简称AHP,在20世纪70年代中期由 美国运智学家托马斯塞蒂(T.L. Saaty)正式提出。它是一种定性和定量相结合的、系统 化、层次化的分析方法。由于它在处理复杂的决策问题上的实用性和有效性,很快在世界范 闌得到重视。它的应用已遍及经济计划和管理、能源玫策和分配、行为科学、军爭指挥、运 输、农业、教育、人才、医疗和环境等领域。层次分析法的基本步骤:1、建立层次结构模型。在深入分析实际问题的基础上,将有关的各个因素按照不同属 性自上而卜地分解成若干层次,同一层的诸因素从属于上一层的因素或对上层冈素有影响, 同时又支配卜一层的因素或受到下层因素的作用。/上层为目标层,通常只有1个因索,瑕 下层通常为方案或对象层,中间可以有一个或几个层次,通常为准则或指标层。当准则过多 时(普如多于9个)应进一步分解出子准则层。2、构造成对比较阵。从层次结构模型的第2层开始,对于从属于(或影响)上一层每个 因索的同一层诸因素,用成对比较法和1一9比较尺度构造成对比较阵,直到瑕卜层。3、计算权向量并做一致性检验。对于每一个成对比较阵计算最人特征根及对应特征向 量,利用一致性指标、随机一致性指标和一致性比率做一致性检验。若检验通过,特征向最 (归一化后)即为权向量:若不通过,需重新构造成对比较阵。4、计算组合权向量并做组合一致性检验。计算放下层对目标的组合权向量,并根据公 式做组合一致性检验,若检验通过,则可按照组介权向量表示的结果进fj决策,否则需要匝 新考虑模型或重新构造那些一致性比率较大的成对比枚阵。构造成对比较矩阵:比较第i个元素与第j个元素相对上一层某个因素的朿要性时,使用数帚:化的相对 权重來描述。设共有n个元素参与比较,则力=(atJ)nxn称为成对比较矩阵。成对比较矩阵中aj的取值可参考Satty的提议.按卜述标度进行赋值。也在1-9及 其倒数中间取值。= 1,元素i与元素j对上一层次因素的巫要性相同:aj = 3. 元素i比元素j略重要;aij = 5,元素i比元素j重要:axj = 7,元素i比元素j 重要得多;axj = 9,元素i比元素j的极其重要;aXj = 2n, n=l, 2, 3,4,元素i与j_ 1的重要性介于a.j = 2n 一 1与a“ = 2n + 1之间: 切一仇,n=l, 2,. , 9,当且仅当 aji =1CLij 0,0,; 1,a,; 一=no成对比较矩阵的特点:a可。(备注:当i二j时候,1)例如某决策者的评价矩阵A为:51 1 1395 91这里解释一下此矩阵所表示的总思,= 1表示r值指标与r值指标本身相比在决策者心目中同样重要, 兀 =3表示R值指标比F值指标在决策者心目中略重要,13 = 一表示M值指标比R值指标歪要,32 = 9表示M值指标相对F值指标在决策者心目中极其觅要,此矩阵中的其他元素类似解释。在决策者心中M值指标最乘要,其次是 R值指标,由于运货需要成本,因此在决策者心中F值指标最不重要。从理论上分析得到:如果A是完全一致的成对比较矩阵,应该有但实际卜在构造成对比较矩阵时要求满足匕述众多等式是不町能的。因此退而要求成对 比较矩阵有一定的一致性,即可以允许成对比较矩阵存在一定程度的不一致性。由分析可知. 对完全一致的成对比较矩阵,其绝对值瑕人的特征值等于该矩阵的维数。对成对比较矩阵的一致性要求,转化为要求:的绝对值最大的特征值和该矩阵的维数相差不大。检验成对比 较矩阵A 一致性的步骤如下:计算衡量一个成对比矩阵A (nl阶方阵)不一致程度的指标CI:a =兀(0_刀7Z-1这里久 是矩阵A的最大特征值。另外矩阵的一致性标准RI如卜表: DUXn123456789RI000. 580. 901. 121. 211.321.411.45由于某决策者对应的矩阵为3阶方阵,故RI=3.矩阵A的随机-致性比率CR为:CR=CI/RIo当CR0. 1时,则认为矩阵A具冇满意的一 致性,否则需要调整A中的元素使其貝有满意一致性。由于实际中求矩阵的特征值比较复杂,我们可以有根法与和法两种求近似值的方法:和法:定义则u就是特征:1 A (如向量的近似值,Z =工为蚁人特征值的近似值。nuxn刊ui=(G)则 a?就是特征向量的近似值,Amax1 ”(力)=工为最人特征值的近似值。n J coi我们用两种办法计算矩阵A的近似最人特征值及特征向M:o和法I 特征向量 U二(0. 20, 0. 07, 0. 73), A =3.045。 max根法:特征向量co = (0.18,0.07,0.75),=3.029。我们计算两种方法对应的随机一致性比率,利法:CR二0. 0390. 1,通过了一致性检验。根 法:CR二0.0250.1,也可以通过致性检验,故按照和法的权重比例为(R值权重:F值权 重:M值权重)=(0.20,0.07,0.73),根法的权重比例为(R值权重:F值权蔭:M值权 S)= (0. 18, 0. 07, 0. 75)两种方法有点细微的差异.我们分别用两种近似值计算代码对应的分值如卜表: 和法:指标代码555545535455415435355345335分值5. 004.934.864. 804.734.664. 604. 534.46指标代码554544534454444434354344334分值4. 274. 204. 134. 074.003. 933. 873. 803. 73指标代码553543533453443433353343333分值3. 543.473. 403. 343. 273. 203. 143. 073根法:指标代码555545535455445435355345335分值5. 004. 934. 864. 824. 754. 684. 614. 574. 50指标代码554544534454444434354344334分值4.254. 181. 114.074.003. 933. 893. 823. 75指标代码553543533453443433353343333分值3. 503. 433. 363. 323.253. 183. 143. 073可以从上表看出,实际上无论是按照和法还是根法,对各指标排名是一样的。利用匕表(这里用根法,用和法也是同样的结果),我们解决代码543的客户与代码344 的客户谁的排名高的问题。代码543对应的分值为3.43,代码344对应的分值为3. 82,故代 码314的客户应当比代码543的客户排名高。在确定以上排名规则的过程中,我们町以利用power函数来计算开立方,mmult函数来 计算矩阵的乘积,sumproduct函数來计算各代码的分值,其体excel表达式比较简单,读 者可以看这些函数的帮助功能即可以写出正确的excel函数表达式,故不再赘述。另外不同 的决策考的评价矩阵町能会有所不同,读者町以按照层次分析法甫新确定排名次序。4、各指标的相关性及排名表中各代码的概率分布情况在计算各指标的相关性Z前,我们先计算样本口期数据与2010-12-31 口 Z间的差距, 由于日期在一个“cel单元格里,我们用mid函数来计算口期差,假设某客户的最后交易日 期为2011-3-31 II,他在C3单元格里,我们可以把2010-12-31放在D3单元格里,那么利 用excel函数计算的表达式为:=mid(c3, 1, 15)-mid($d$3, 1, 15),这里$d$3表示用的是绝 对坐标,这样我们町以快速有效地计算出口期差距。我们再分别计算口期差距、交易次数、 交易金额之间的相关系数,这一步可以利用correl函数计算。经计算可得原始的数据中交 易次数与交易金额之间的相关性最大,考察的样本中这个相关系数为0.74,离散化后(指 分类之后)的相关系数达0.81,证明F值与M值是高度相关的,这一定程度上缓解了根据 上面的评价矩阵得到的F值指标的权重比较低的缺点。另外还町以得到离散化后的相关系数 会比原始数据的相关系数更高一些,R值与F值的相关系数0.50R值与M值的相关系数为 0.44。另外读者也町以考虑一卜偏相关系数,以及数据标准化后各指标的相关系数。这些均町 以通过spss软件计算得到。例如固定M值,得到R值与F值的偏相关系数为0.27,耒固定 M值时它们之间的相关系数为0.50。偏相关系数的概念,与回归分析比较密切,这里不介绍 它的定义。考察排名表屮的各代码的分布情况我们町以得到555, 544, 534, 543, 533等出现的概率 比较大,有些代码如335, 553, 334等没有出现过。5、各类指标代码的直观分类(1)排名表中客户对应代码与(前三列红色字体为排名表中客户(27种);(2)无需巫点关注客户(前三列黑色字体的为无需重点关注客户(8种);(3)交易异常值客户(第4列到第6列,共2*5*3=30种,第7列到第9列红色字体, 共 3*3*2=18 种);555155515444244424333333333222422242111511151(4)可能的新客户群(第1列到第3列红色字体,共3*2*2=12种):(5)交易频率较高,R值,M值较低(第4列到第6列,共2*3*2=12种);(6)R值、F值较高,M值较低(第7列到第9列,共3*3*2=18种)。5111L51551422242442333333333244424224155515115至此125种代码全部分类完毕,对公司销售业绩提高有重人贡献的客户群为(1)、( 3)、(4)。虽然客户群中(4)的交易额目前比较小,但是由于新客户的对公司未来销售业 绩的增长的作用还是很大的。参考文献:E1陈伯成,梁冰,周越博,林析泉,赵延.自组织映射神经网络(SOM)在客户分类中的 一种应用M 系统工程理论与实践,2004,3.2李心玉,黄娟.Excel VBA在层次分析法中的应用J.电脑编程技术与维护,2010,21.3林盛,肖旭.基TRFM的电信客户市场细分方法J.哈尔滨工业大学学报,2006, 5.4谭海宁,许娟娟.基于云模型的客户细分研究一一以中国电信业为例M.技术经济, 2009, 4.5周颖,吕巍,井淼.基于数据挖掘技术的移动通信行业客户细分J.上海交通大学学报,2007, 7.
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!