银行客户数据分析

上传人:jian****019 文档编号:245141480 上传时间:2024-10-07 格式:PPT 页数:24 大小:662.01KB
返回 下载 相关 举报
银行客户数据分析_第1页
第1页 / 共24页
银行客户数据分析_第2页
第2页 / 共24页
银行客户数据分析_第3页
第3页 / 共24页
点击查看更多>>
资源描述
, , , , , ,*,*,银行客户数据分析,2007-09-01,1,背景,数据,客户群,服务,盈利,商业银行拥有大量的个人客户交易数据、个人客户服务数据和个人客户基本资料数据。在这些海量数据中,隐藏着大量的有价值的客户信息。运用数据挖掘中的聚类分析技术可以从这些数据集中提取客户的分类知识。聚类分析技术可以将性质、特征近似的数据对象归属在相同的群集中。商业银行可以利用此技术分辨出能有效为之服务的最有价值的客户,为他们提供更为个性化的服务,从而影响相关的客户行为并最终达到提高盈利的目的,。,2,数据集,客户数据集包含,10,000,条客户数据,包含有,31,个特征,(,属性,),分别为,:,Bank No(,银行代码,其值有:,004,024,077,等,),Account num(,账户代码,),Short Name(,客户名字,),First Contact Date(,第一次接触日期,),account open date(,账户开户日期,),account balance(,账户当前余额,),account low balance(,账户曾经最低余额,),account high balance(,账户曾经最高余额,),balance category(,余额类型,),Statement Low Balance(,最低交易账目,有正有负,),3,数据集,(属性,),Statement High Balance(,最高交易账目,),Statement Aggregate Debit Balance(,聚集透支账目,),Statement Aggregate Debit Day(,透支账目的天数,),Statement Aggregate Credit Balance(,聚集存款账目,),Statement Aggregate Credit Day(,存款账目的开数,),Return Check Count(,退回支票的次数,),Status(,客户状态,),Audit,Granding,(,授权级别,越高则风险越低,),Salary Before Last Month(,上一个月之前自动付款的账目,),Salary last Month(,上一个月自动付款的账目,),Salary this Month(,这一个月自动付款的账目,),Count of Credit this Month(,这个月存款的次数,),4,数据集,(属性,),Count of Debit this Month(,这个月取款的次数,),Count of OD(,透支的次数,),Amount of Deposit this Month(,本月存款的账目,),Amount of Withdraw this Month(,本月取款的账目,),Last Transaction Date(,上一次交易的日期,),Country Code(,客户所属的国家,),Birthday(,生日,),Sex(,性别,),5,数据预处理,我们选用,Weka,数据挖掘工具来对客户的账户数据进行分析,因此所有的原始数据都必须转换成能被,Weka,处理的数据集格式。,原始数据集的特征主要有四种类型的,分别是:数值型,(numeric),、标称型,(nominal),、日期型,(date),和字符串型,(string),。,对于缺失的属性值,因为,Weka,中的算法能自动处理属性值缺失的情况,所以按,Weka,数据集的格式要求用“,?”,表示。,6,数据预处理,(,规格化,),数值型特征,:,采用如下公式规格化到,0, 1,区间,标称型特征、日期型特征和字符串型特征保持不变,7,聚类分析,目标,我们的目的是对客户进行分群,从而使银行可以对不同群体的客户提供不同的服务。因此聚类分析是对客户进行自动分群的有效方法。,方法,k-means,算法,选取的特征,从,31,个原始属性值中选取,23,个属性用作聚类(都是数值型或标称型的),聚类参数,在经过规格化处理后的数据集中,用,k-means,算法在选定的,23,个属性上进行聚类,设定聚类数为,10.,8,各聚类大小,各聚类所包含的客户数量如下表,聚类,客户数量,聚类,1,145,聚类,2,69,聚类,3,133,聚类,4,6183,聚类,5,1985,聚类,6,213,聚类,7,46,聚类,8,446,聚类,9,413,聚类,10,368,表,1,9,对聚类大小的分析,由表,1,可知,各聚类有大有小,且大小悬殊,但也合乎客户关系处理的目的。客户关系管理的往往是找出一小部分的特殊客户(占,20%,左右)来进行特别地对待。在上表所示的,10,个聚类中,除去最大的聚类,4,后其余,9,个聚类的客户数达,3818,人,占总客户量的,38.18%,;除去最大的两个聚类(聚类,4,和聚类,5,)后其余,8,个聚类的客户数达,1833,人,占总客户量的,18.33%.,大聚类可以再继续细分,(,作为一个数据集再继续进行聚类操作,或直接提高聚类个数,),10,对各聚类结果的处理,聚类后的各聚类结果的数据是规格化处理后的数据的结果,我们要直观地分析各聚类的特点,必须把规格化的数据还原为原始数据。例如,最小值为,-10,000,,最大值为,1,000,000,的当前账户余额规格化为,0,1,后就难以理解各账户间存在的巨大差距,只有把它还原为原始的,-10000, 1000000,才能使人直观地理解其存在的差距。,把各聚类的数据集还原为原始数据后,再计算各特征的均值和标准差(数值型的特征);或者各标称量的数量(标称型的特征)。,11,聚类结果,分析,(,账户当前余额,),下表所示为,10,个聚类中各聚类的账户当前余额的正负及账户当前余额的均值和标准差,聚类,当前余额正负,当前余额值,+,均值,标准差,聚类,1,145,0,24445.50,73408.73,聚类,2,69,0,29164.41,78077.97,聚类,3,133,0,152882.48,604633.58,聚类,4,6182,1,5571.17,23957.76,聚类,5,1985,0,22102.61,64825.42,聚类,6,119,94,8432.82,18680.66,聚类,7,46,0,2093.91,5798.48,聚类,8,380,66,7729.67,33233.11,聚类,9,0,413,-24728.68,61844.23,聚类,10,368,0,36264.24,93389.14,12,聚类结果,分析,(,账户当前余额,),最明显的特殊客户群有两个,:,一个是,聚类,3,的客户群,该聚类的当前余额均值达,十五万,左右,比其他聚类的当前余额均值高出一个数量级。所以可以初步判断该聚类的客户是存款额高或者说是,高收入的客户群,。另外,该聚类当前余额的标准差也很大,这说明在富有的客户群中各客户的收入差距也是很大的,有的达百万、千万、甚至上亿,.,另一个明显的特殊客户群是,聚类,9,所示的客户群。该客户群中的,413,个客户当前账户余额,都为负值,,且其均值达负两万多元。因此可以认定该客户群是,高透支的客户群,。后面还会分析的透支额、透支次数、透支时间等属性的分析同样可以印证我们这个结论,.,13,聚类结果,分析,(,账户当前余额,),分析其他的八个聚类,聚类,4,是占,61.81%,的最大的,普通客户群,,该客户群中几乎所有的客户的当前余额都为正值,其均值为五千多,标准差为两万多不会太小,说明该庞大的客户群还是可以再继续细分的。,聚类,5,是占,19.85%,的第二大的客户群,该客户群比最大的客户群聚类,4,来说它的当前余额均值高很多,达两万多元。因此可以说聚类,5,是,大量普通客户中的中等存款额度的账户,(不包括低存款额度的账户)。,聚类,7,是账户当前余额为正值但存款额度较低的客户群。,聚类,1,,,2,,,6,,,8,,,10,这五个聚类在当前账户余额这一属性上不能发现其明显的特征,我们将在后续的其他属性上的分析发现其聚类特征。,14,聚类结果,分析,(,最低及最高交易账目,),下表所示为各聚类的最低交易账目和最高交易账目的均值与标准差,聚类,最低交易账目,最高交易账目,均值,标准差,均值,标准差,聚类,1,21710.57,67398.29,30649.77,87211.66,聚类,2,25422.80,71501.18,43955.38,100110.53,聚类,3,137112.35,560335.78,180985.33,617496.38,聚类,4,4664.66,21531.07,8869.53,31149.29,聚类,5,15040.53,49724.59,43980.40,109262.32,聚类,6,-,9205.019,15566.66,15999.42,28870.03,聚类,7,1703.67,5667.138,5432.09,12143.86,聚类,8,-,9331.17,32766.50,26126.10,143537.61,聚类,9,-,27823.94,64684.33,-,12265.06,33615.10,聚类,10,16948.34,54751.53,74335.21,148054.73,15,聚类结果,分析,(,最低及最高交易账目,),明显聚类特征,:,聚类,3,的最低交易账目和最高交易账目的均值都最高,这说明该类账户一般是有,大数额的资金流入,。,聚类,9,的最低交易账目和最高交易账目的均值都最小,属于,透支最多的一类,,这说明该类账户是属于,透支型的账户,,透支额维持在一个比较高的水平,且其最高交易额平均也达负一万两千多,说明这类型账户平均,很少正向资金存入,。,16,聚类结果,分析,(,最低及最高交易账目,),聚类,4,这个最大的客户群的最低和最高交易账目的平均值保持在一个,中等,的水平,最低四千多,最高八千多;,第二大客户,群聚类,5,的最低和最高交易账目的均值都较聚类,4,高很多,这也同样能够说明聚类,5,是大量的,中等偏高的存储客户,。,聚类,7,的最低和最高交易账目都较低(正值),属于,小额储蓄客户,。,聚类,6,和聚类,8,的最低交易账目平均为负值(属于透支),最高交易账目平均为正值(属于储蓄),因此该类型客户属于,有储蓄有透支的信用消费型客户,。,聚类,1,,,2,,,10,在这一属性上还不能分析出很明显的聚类特征,17,聚类结果,分析,(,透支账目,/,存款账目,),下表所示为聚集透支账目及透支账目天数、聚集存款账目及存款账目天数的均值和标准差。,聚类,聚集透支账目,透支账目天数,聚集存款账目,存款账目天数,均值,标准差,均值,标准差,均值,标准差,均值,标准差,聚类,1,0,0,0,0,621553.94,1893055.17,26,0,聚类,2,0,0,0,0,862332.67,2188134.51,26,0,聚类,3,0,0,0,0,3987771.63,15631280.74,26,0,聚类,4,0,0,0.00,0.03,145729.02,582818.60,26.00,0.03,聚类,5,0,0,0,0,599440.68,1531141.41,26,0,聚类,6,99402.83,202963.80,15.64,4.39,66568.08,130475.92,10.36,4.39,聚类,7,0,0,0,0,75543.65,239671.98,26,0,聚类,8,17345.04,51581.64,3.63,2.61,170027.62,856644.63,22.37,2.61,聚类,9,596935.00,1384363.12,25.39,1.31,2744.67,15650.27,0.61,1.31,聚类,10,0,0,0,0,907077.21,2107278.80,26,0,18,聚类结果,分析,(,透支账目,/,存款账目,),聚类,3,的聚集存款账目很高,均值达三百多万,该类型客户几乎不透支,但该类型客户的聚集存款账目的,标准差也奇高,,达一千五百多万,这也印证了前面所说的,高收入群体中的各个体收入差距还是很大,的。,聚类,9,是,高额度透支账户,,聚集透支账目均值接近六十万,但聚集存款账目均值仅有两千多,并且其透支时间长,平均达二十五天多。所以,该类型账户应该是,长期处于透支状态,。,19,聚类结果,分析,(,透支账目,/,存款账目,),前面提到,聚类,6,和聚类,8,是有透支有储蓄的,信用型消费客户,,在此也可以说明问题。这两个聚类的聚集透支账目和聚集存款账目都有不小的数额,但其不同点是,:,聚类,6,的聚集透支账目比聚集存款账目要高,且其透支时间长,说明该账户是,以透支消费为目的,以存款维持信用消费,。,聚类,8,的聚集存款账目要远高于聚集透支账目,说明该客户群,以储蓄为主,透支消费为次,。,聚类,7,是聚集存账目不高的客户群,且其不进行透支消费。,聚类,1,,,2,,,5,,,10,在这一属性上不能分析出明显的聚类特征。,20,聚类结果,分析,(,本月存取款账目,),下表所示为,本月存款次数、本月存款账目、本月取款次数、本月取款账目,的均值与标准差,聚类,这个月存款次数,本月存款账目,这个月取款次数,本月取款账目,均值,标准差,均值,标准差,均值,标准差,均值,标准差,聚类,1,0.16,0.44,3102.79,22512.43,0.68,2.14,6525.88,38214.38,聚类,2,1.52,1.95,14204.96,51897.49,5.64,6.67,20524.67,58284.22,聚类,3,0.94,1.18,36389.15,121866.58,3.79,5.04,44100.75,118407.29,聚类,4,0.43,0.65,6345.44,51757.41,1.04,1.40,6871.63,51832.93,聚类,5,2.37,1.40,48165.60,434339.24,8.56,4.63,53513.42,435119.06,聚类,6,2.82,3.12,30468.19,53245.35,10.88,9.13,31899.89,50629.19,聚类,7,0.96,1.86,5205.35,12258.95,2.61,5.76,6791.26,13240.96,聚类,8,3.32,2.98,47629.30,186798.96,9.10,8.03,49078.89,201585.59,聚类,9,1.99,3.20,15185.65,41397.60,8.33,10.04,23149.98,66096.16,聚类,10,7.18,4.07,99006.39,174714.05,19.58,10.04,99224.65,169294.68,21,聚类结果,分析,(,本月存取款账目,),聚类,1,,,4,,,7,都属于存取款账目比较小的账户类型。,聚类,1,的取款账目是存款账目的,2,倍;,聚类,4,的存取款账目相当;,聚类,7,的取款账目略高于存款账目。,另外,从本月的存取次数看,聚类,1,,,4,,,7,的存取次数都很低,因为他们的存取账目也低,可以认为这些类型的账户主要是,资金流动很小的账户类型,(或者说包含一部分的,睡眠账户,)。,22,聚类结果,分析,(,本月存取款账目,),聚类,2,,,3,,,5,,,6,,,8,,,9,,,10,都属于存取款账目较高的客户类型。,其中聚类,3,,,5,,,6,,,8,的平均存取款都为三四万;,聚类,2,和,9,平均存款账目一万多;平均取款账目两万多。,前面已经分析出的聚类,3,所代表的富有人群,其,当月存取款都在一个正常的平均水平,不会太高,。,聚类,10,是,本月存取款较高的客户群,,其存取账目几乎相等,但其存款次数多,取款次数也多,这说明该类型的账户是,资金流入流出频繁的账户类型,。,23,谢谢!,24,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!