数据挖掘项目模型方法课件

上传人:沈*** 文档编号:241929764 上传时间:2024-08-06 格式:PPT 页数:74 大小:1.03MB
返回 下载 相关 举报
数据挖掘项目模型方法课件_第1页
第1页 / 共74页
数据挖掘项目模型方法课件_第2页
第2页 / 共74页
数据挖掘项目模型方法课件_第3页
第3页 / 共74页
点击查看更多>>
资源描述
南方航空公司数据挖掘案例南方航空公司数据挖掘案例南方航空公司数据挖掘案例报告提纲报告提纲一、项目目标一、项目目标二、客户细分二、客户细分三、客户价值三、客户价值四、客户流失四、客户流失五、航线分析五、航线分析六、交叉销售六、交叉销售七、七、KPI报表报表报告提纲一、项目目标一、项目目标一、项目目标(1)常客户数据挖掘分析包括如下主题:客户细分、客户价值、客户流失、航线分析、交叉销售等。(2)通过各大主题分析,提升南航客户关系管理水准,促进销售增长。一、项目目标(1)常客户数据挖掘分析包括如下主题:二、细分模型二、细分模型1、模型需求目标通过客户细分模型分析在一时间段从上海始发或到达的全体乘客的行为特征,从客户的订票行为、支付行为、值机行为和乘机行为入手对用户进行细分,并且要求细分结果需要具备客户的航线特征以满足航空业市场营销活动的需求。二、细分模型1、模型需求目标通过客户细分模型分析在一时2、行为聚类、行为聚类(1)分析数据及变量分析数据及变量目标群体:目标群体:2008-01到到2009-06的从上海出发或到达的常旅的从上海出发或到达的常旅客客分析时间窗口:分析时间窗口:2008-11到到2009-10(训练样本)(训练样本)总数:总数:563,487 2008-12到到2009-11(校验样本)(校验样本)总数:总数:569,954 初始分析变量(初始分析变量(21个):个):2、行为聚类(1)分析数据及变量(2)行为聚类结果行为聚类结果2、行为聚类、行为聚类(2)行为聚类结果2、行为聚类(3)行为聚类结果说明行为聚类结果说明2、行为聚类、行为聚类(3)行为聚类结果说明2、行为聚类(4)行为训练集与校验集的迁徙变化行为训练集与校验集的迁徙变化2、行为聚类、行为聚类(4)行为训练集与校验集的迁徙变化2、行为聚类虹桥虹桥-广州广州 虹桥虹桥-深圳深圳浦东浦东-大连大连 浦东浦东-沈阳沈阳浦东浦东-武汉武汉 虹桥虹桥-郑州郑州虹桥虹桥-长沙长沙 浦东浦东-郑州郑州虹桥虹桥-北京北京 浦东浦东-深圳深圳虹桥虹桥-乌鲁木齐乌鲁木齐浦东浦东-广州广州浦东浦东-珠海珠海 虹桥虹桥-汕头汕头虹桥虹桥-贵阳贵阳 浦东浦东-海口海口浦东浦东-哈尔滨哈尔滨虹桥虹桥-南宁南宁浦东浦东-三亚三亚 浦东浦东-台北台北(1)(1)分析航线(分析航线(2020条)条)3、航线聚类、航线聚类虹桥-广州 虹桥-深圳(1)分析航线(20条)(2)航线聚类结果航线聚类结果3、航线聚类、航线聚类(2)航线聚类结果3、航线聚类4、行为与航线交叉结果、行为与航线交叉结果4、行为与航线交叉结果 采用聚类分析方法对客户行为及航线聚类采用聚类分析方法对客户行为及航线聚类。5 5、模型方法、模型方法 从客户的订票行为、支付行为、值机行从客户的订票行为、支付行为、值机行为和乘机行为入手对常客进行聚类分析,根为和乘机行为入手对常客进行聚类分析,根据组群客户行为特征及航线特征挖掘满足航据组群客户行为特征及航线特征挖掘满足航空业市场营销活动的目标会员群体。空业市场营销活动的目标会员群体。采用聚类分析方法对客户行为及航线聚类。5、6 6模型结果模型结果(1)依据会员行为聚类,得到8个会员群体,依据航线聚类得到15个航线群体。(2)分析每个群体的优劣势,概括出群体的优势与劣势特征。(3)群体迁徙分析(4)行为与航线群体交叉分析6模型结果(1)依据会员行为聚类,得到8个会员群体,7 KPI展现展现1.1.查看模型基本信息描述查看模型基本信息描述2.2.模型结果高级条件组合查询模型结果高级条件组合查询3.3.加载加载 保存自定义查询条件保存自定义查询条件4.4.使用模型结果查询条件使用模型结果查询条件5.5.使用上传的会员卡号使用上传的会员卡号6.6.导出到导出到CSVCSV文件文件7.7.导出到导出到EXCELEXCEL文件文件具体参见具体参见KPI系统系统7 KPI展现1.查看模型基本信息描述三、客户价值模型三、客户价值模型 1 1模型需求模型需求通过高质量的价值评分预测模型对客户通过高质量的价值评分预测模型对客户进行评分,根据模型输出结果可让一线人员进行评分,根据模型输出结果可让一线人员根据分值直观判断会员的价值高低,提供相根据分值直观判断会员的价值高低,提供相应的服务标准。应的服务标准。对会员按历史与近期价值分别进行评分。对会员按历史与近期价值分别进行评分。三、客户价值模型 1模型需求2、近期价值、近期价值客户群体:客户群体:2008年年1月月1日日2009年年4月月30日有乘机记录的常旅客日有乘机记录的常旅客.总数:总数:2308246.分析的时间窗口:分析的时间窗口:2008-01-012009-04-30(训练样本)(训练样本)2008-01-012009-07-30(校验样本)(校验样本)2、近期价值客户群体:最初变量(11个):票价收入 飞行次数 两舱比例 平均折扣 基本积分 票价利润 最后一次乘机时间至今 卡龄 合作伙伴积分 积分使用次数 促销积分最初变量(11个):分析群体数量为:2308246,其中合作伙伴积分:最大值:4091612 最小:0此项不为0的比例:8.4%;促销积分:最大值:108350 最小:0此项不为0的比例:5.1%;3、近期价值变量筛选过程、近期价值变量筛选过程分析群体数量为:2308246,其中3、近期价值变量筛选过程积分使用次数:最大值:459 最小:0此项不为0的比例:4.9%;两舱次数:最大值:202 最小:0此项不为0的比例:7.4%。积分使用次数:最大值:459 四个变量数据的特殊性,导致出现:有些会员飞行次数,基本里程分,票价收入并不高,但由于上述四个指标中有些指标远远高于其他会员,结果价值得分高,经过与业务部门商讨,最后达成一致:删除这四个分析变量。在进一步的模型建立中发现卡龄并不能准确的反映一个会员的价值:比如有的会员卡龄大但是最近两年乘机并不频繁,有的会员卡龄小,但是最近两年乘机频繁!因此将卡龄也删除了。对于“最后一次乘机时间至今时长”这个指标,也会导致模型不稳定及结果不合理性。例如:下面两个会员,从其他指标来看,后者的价值应该高于前者,但是由于最后一次乘机时间至今的影响,导致结果不合理!因此,建议采用五个指标。四个变量数据的特殊性,导致出现:有些会员飞行次数,基卡号卡号价值价值得分得分票价收票价收入入飞行次飞行次数数平均折扣平均折扣基本积分基本积分票价利润票价利润最后一次最后一次乘机时间乘机时间至今时长至今时长28000640819111.4011003120.6895114689.91068900032834411.4018858140.69172026093.0950一些特殊数据一些特殊数据卡号价值得分票价收入飞行次数平均折扣基本积分票价利润最后一次指标权重指标权重票价收票价收入入飞行次飞行次数数两舱比两舱比例例平均折平均折扣扣基本积基本积分分票价利票价利润润最后一最后一次乘机次乘机时间至时间至今时长今时长卡龄卡龄合作伙合作伙伴积分伴积分积分使积分使用次数用次数促销积促销积分分1.631.472.511.981.561.741.531.250.920.850.43票价收入票价收入飞行次数飞行次数平均折扣平均折扣基本积分基本积分票价利润票价利润最后一次乘机时间至今时长最后一次乘机时间至今时长1.761.632.021.731.770.71票价收入票价收入飞行次数飞行次数平均折扣平均折扣基本积分基本积分票价利润票价利润1.791.701.661.741.7611个指标个指标6个指标个指标5个指标个指标指标权重票价收入飞行次数两舱比例平均折扣基本积分票价利润最后上图只选取得分0的会员的得分分布图:得分0的会员有:759379,占总人数2308246的32.9%,其中有大部分会员的得分集中在0分值附近,最高分为377,最低分为-15。最后得分、排位展示情况如下:采用五个指标的结果采用五个指标的结果上图只选取得分0的会员的得分分布图:得分0的会员有:75得分排位示例得分排位示例得分排位示例分析群体:分析群体:2008年年1月月1日日2009年年4月月30日有乘机记录的常旅日有乘机记录的常旅客客.时间窗口:时间窗口:1998-11-1到到2009-04-30.分析变量(分析变量(9个):个):飞行次数,两舱比例,平均折扣,基本积分总和,飞行次数,两舱比例,平均折扣,基本积分总和,促销积分总和,合作伙伴积分总和,积分使用比例,促销积分总和,合作伙伴积分总和,积分使用比例,卡龄,最后一次乘机时间至今时长卡龄,最后一次乘机时间至今时长.4、历史价值、历史价值分析群体:4、历史价值考虑不同变量的结果比较考虑不同变量的结果比较飞行次飞行次数数两舱比两舱比例例平均折平均折扣扣基本积分基本积分总和总和促销积分促销积分总和总和合作伙伴合作伙伴积分总和积分总和积分使积分使用比例用比例卡龄卡龄最后一次乘机时间最后一次乘机时间至今时长至今时长0.94 1.83 1.38 0.85 1.16 1.200.95 0.76 1.809个变量得出的参数权重:4个变量得出的参数权重:飞行次数飞行次数平均折扣平均折扣基本积分总和基本积分总和最后一次乘机时间至今时最后一次乘机时间至今时长长1.061.330.901.473个变量得出的参数权重:飞行次数飞行次数平均折扣平均折扣基本积分总和基本积分总和1.181.481.07考虑不同变量的结果比较飞行次数两舱比例平均折扣基本积分总和促去除两舱比例,促销积分总和,合作伙伴积分总和,积分使用比例和卡龄。根据上面各变量的系数,我们可以看到客户的价值与这些变量成正比。两舱比例:因为坐两舱的人很少,计算出来的两舱比例权重不合理;促销积分总和,合作伙伴积分总和,积分使用比例:经过与业务部门协商,该数据的数量级差别太大,且只有6%左右的人有此数据,于是导致计算出来的比例权重不合理;最后一次乘机至今时长:是因为有的人就在时间窗口末端乘机,导致此变量对客户价值的得分产生不合理的结果;卡龄:对于卡龄长但是最近两年飞的很少,所以在很大程度上反映不了客户的真实价值,所以这里不予考虑此变量。考虑不同变量的结果比较考虑不同变量的结果比较去除两舱比例,促销积分总和,合作伙伴积分总和,积分使用比例和采用三个指标的得分采用三个指标的得分最大值:15 增量:1上图只选取得分0的会员的得分分布图:得分0的会员有:666420占总人数2308246的29%,大部分会员的得分集中在0附近。最后得分、排位展示情况如下:采用三个指标的得分最大值:15 增量:1历史价值排位历史价值排位历史价值排位5 5 模型结果模型结果(1)(1)得到会员按价值评分大小的排序表,得到会员按价值评分大小的排序表,并根据业务需要进行一百等分划分,帮并根据业务需要进行一百等分划分,帮助客户部清晰认识会员价值的分布。助客户部清晰认识会员价值的分布。(2)(2)价值迁徙变化价值迁徙变化5 模型结果(1)得到会员按价值评分大小的排序表,并根据业6 KPI展现展现1.查看模型基本信息描述查看模型基本信息描述2.模型结果高级条件组合查询模型结果高级条件组合查询3.加载加载保存自定义查询条件保存自定义查询条件4.使用模型结果查询条件使用模型结果查询条件5.使用上传的会员卡号使用上传的会员卡号6.导出到导出到CSV文件文件7.导出到导出到EXCEL文件文件具体参见具体参见kpi系统系统6 KPI展现1.查看模型基本信息描述四、流失模型四、流失模型 1模型需求南航面临常旅客流失的问题,通过建南航面临常旅客流失的问题,通过建立流失模型,对客户进行流失评分,及早立流失模型,对客户进行流失评分,及早发现客户流失倾向,并采取积极有效挽留发现客户流失倾向,并采取积极有效挽留措施措施。四、流失模型 (1)数据情况数据情况目标群体目标群体:会龄1年(观察窗口末端日期入会日期1年),并且乘机次数=2的南航会员。观察时间窗口观察时间窗口:2006-07-01到2008-06-30 表现窗口表现窗口:2008-07-01到 2009-06-30校验窗口校验窗口:2008-10-01到 2009-09-302 数据分析(1)数据情况2 数据分析超高端:超高端:乘机次数位于排序前1%的客户或升级里程位于排序前1%),并且平均乘机折扣率=0.8。人数:6427.比例:0.83%高端:高端:不属于上面的这些会员,乘机次数位于排序前1%和排序前10%之间的客户,或升级里程位于排序前1%与排序前10%之间。人数:28614。比例:3.70%。(2)目标客户分群标准目标客户分群标准超高端:(2)目标客户分群标准中端:中端:不属于上面的这些会员,乘机次数位于排序前30%或升级里程位于排序前30%。人数:294429,比例:38.05%。低端:低端:不属于上面的这些会员,人数:444335,比例:57.42%不同群体,流失标准不同,先将目标客户进行分群,然后针对不同的群体给出不同的流失标准。Notes:该标准是与业务部门经过多次讨论得到。中端:各群组特征各群组特征各群组特征3、建模方法、建模方法 LOGISTIC回归是一种特殊的回归模型,与古典的线性回归模型不同,其响应变量是一分类变量,而非连续变量。响应变量是一个二值化的变量,通常以10表示某一事件发生或者不发生。应用Logistic回归得到的概率p通常表示在将来某段时间后某一事件发生的概率。3、建模方法 LOGISTIC回归是一种特殊pOdds:目标事件发生的数量/非目标事件发生的数量.Odds ratio=prob(目标事件)/prob(非目标事件)=p/(1-p)p=prob(目标事件)prob表示事件发生的概率Logit:log of odds ratio=log(p/(1-p)Logistic回归:拟合下面的模型logit=a0+a1*X1+ak*Xkp=prob(目标事件)=exp(logit)/(1+exp(logit)p的取值范围:0,1pOdds:目标事件发生的数量/非目标事件发生的数量.4、变量选取、变量选取参与建模变量(12个):L1Y_Flight_Count 最近1年乘机次数Ration_L1Y_Flight_Count 最近1年的乘机比率L1Y_BASE_POINTS_SUM 最近1年里程积分L1Y_Points_Sum 最近1年观测窗口总累计积分Eli_Add_Point_Sum 非乘机积分总和Avg_discount 平均折扣率Days_from_last_to_end 最后一次乘机时间至观察窗口末端时长Max_flight_interval 观察窗口内最大乘机间隔Days_from_begin_to_first 观察窗口内第一次乘机时间至MAX(观察窗口始端,入会时间)时长Avg_flight_interval 平均乘机时间间隔Point_Chg_NotFlight 非乘机的积分变动次数Card_Age 卡龄4、变量选取参与建模变量(12个):5 5 模型结果模型结果(1)(1)给出会员十等分的流失评分分布图表给出会员十等分的流失评分分布图表(2)(2)给出会员的累积流失曲线。给出会员的累积流失曲线。(3)(3)给出会员的交叉给出会员的交叉/迁徙变化表。迁徙变化表。5 模型结果(1)给出会员十等分的流失评分分布图表训练样本:总数773805超高端:总数6427表现窗口:2006-07-01到2008-07-01组别:根据流失概率划分成十等分校验样本:928576超高端:6954表现窗口:2006-10-01到2008-10-01组别:根据流失概率划分成十等分超高端流失判断规则:表现窗口的超高端流失判断规则:表现窗口的 飞行次数飞行次数=观测窗口飞行次数的观测窗口飞行次数的0.2 且里程积分且里程积分=观测窗口里程积分的观测窗口里程积分的0.26、分析结果、分析结果训练样本:总数773805校验样本:928576超高端流失判超高端流失判断规则:表现窗口的超高端流失判断规则:表现窗口的 飞行次数飞行次数=观测窗飞行次数观测窗飞行次数的的0.4 且里程积分且里程积分=观测窗里程积分的观测窗里程积分的0.3)训练样本:773805超高端:6427表现窗口:2006-07-01到2008-06-30组别:根据流失概率划分成十等分测试样本:928576超高端:6954表现窗口:2006-10-01到2008-09-30组别:根据流失概率划分成十等分超高端流失判断规则:表现窗口的 飞行次数=观测窗飞行训练样本:773805,超高端:6427 表现窗口:2006-07-01到2008-06-30超高端ROC曲线(表现窗口的 飞行次数=观测窗飞行次数的0.2且里程积分=观测窗里程积分的0.2)校验样本:928576,超高端:6954 表现窗口:2006-10-01到2008-09-30训练样本:773805,超高端:6427 超高端ROC曲线超高端ROC曲线(表现窗口的 飞行次数=观测窗口飞行次数的0.4且里程积分=观测窗口里程积分的0.3校验样本:928576 超高端:6954 表现窗口:2006-10-01到2008-09-30训练样本:773805 超高端:6427 表现窗口:2006-07-01到2008-06-30超高端ROC曲线(表现窗口的 飞行次数=观测窗口飞行次数的流失结果展示流失结果展示流失结果展示7 KPI展现展现1.查看模型基本信息描述2.2.模型结果展示模型结果展示3.3.模型结果查询模型结果查询4.4.交叉交叉/迁徙表迁徙表实际系统演示模型结果实际系统演示模型结果7 KPI展现1.查看模型基本信息描述五、航线分析五、航线分析1 1 模型目标模型目标 目前公司促销的决策管理模式为:各个部门申请促销航线,经主管部门目前公司促销的决策管理模式为:各个部门申请促销航线,经主管部门批准。这种方式有其不合理性,没有真正体现资源效率的合理与公平。批准。这种方式有其不合理性,没有真正体现资源效率的合理与公平。期望:通过模型在数据分析的基础上选择合适航线,针对目标群体设计期望:通过模型在数据分析的基础上选择合适航线,针对目标群体设计合适产品。合适产品。从以上这些聚类,交叉以及预测的结果中联系航线分析模型需求,从航从以上这些聚类,交叉以及预测的结果中联系航线分析模型需求,从航线聚类结果,可以找到比较有特征的的航线(航段组合)或重点航线进线聚类结果,可以找到比较有特征的的航线(航段组合)或重点航线进行促销,连接会员信息,找到并选取航线上的目标客户作促销或其他活行促销,连接会员信息,找到并选取航线上的目标客户作促销或其他活动,帮助南方航空公司合理配置资源,实现利润最大化。动,帮助南方航空公司合理配置资源,实现利润最大化。五、航线分析1 模型目标 目前公司促销的决策管理模式为:各目标群体:南航现有国内航目标群体:南航现有国内航段明细数据,总数:段明细数据,总数:948821 948821。独立航段数:独立航段数:1502.1502.独立始发地:独立始发地:124.124.时间窗口:时间窗口:20082008年年1 1月月1 1日日20092009年年1010月月3030日。日。旅客承运量旅客承运量常客承运量常客承运量常客乘机比常客乘机比两舱常客乘机比两舱常客乘机比可累积舱位常客乘机比可累积舱位常客乘机比客座率客座率两舱客座率两舱客座率客公里收入客公里收入座公里收入座公里收入旅客平均票价旅客平均票价常客平均票价常客平均票价分析变量分析变量:目标群体:南航现有国内航段明细数据,总数:948821。旅 2、模型方法、模型方法(1)按航段、始发地、按时间(月)聚类(聚类算法);(2)预测主要始发地、航段的旅客承运量、会员承运量、两舱旅客/常客流量、常客乘机比预测(回归分析法);(3)用HASH表数据结构设计商务圈算法.2、模3 3 模型结果模型结果(1)(1)得到航线聚类群体得到航线聚类群体(2)(2)得到得到5 5个指标未来个指标未来1 1年每个月的预测值年每个月的预测值(3)(3)得出外航与南航两舱钱包份额得出外航与南航两舱钱包份额(4)(4)得到会员商务圈。得到会员商务圈。3 模型结果(1)得到航线聚类群体4、聚类结果、聚类结果始发地总体聚类该群优势特征突出该群劣势特征明显Notes:红色表示最大,橙色表示次大,绿色表示最小。4、聚类结果始发地总体聚类该群优势特征突出该群劣势特征明显N 按照始发地聚类结果描述按照始发地聚类结果描述以第一群、第三群、第四群为例:以第一群、第三群、第四群为例:第一群包括的始发地:安庆市、长治市、大同市、香格里拉第一群包括的始发地:安庆市、长治市、大同市、香格里拉 、黎平等。特、黎平等。特点:旅客承运量、常客承运量、两舱常客乘机比、客座率、两舱客座率、客点:旅客承运量、常客承运量、两舱常客乘机比、客座率、两舱客座率、客公里收入、常客平均票价均较低。公里收入、常客平均票价均较低。第三群包括的始发地:阿勒泰市第三群包括的始发地:阿勒泰市 、阿克苏市、阿克苏市 、哈密市、哈密市 、库车市、库车市 等。特点:等。特点:客公里收入、座公里收入均最高,旅客承运量、常客承运量均低于平均水平。客公里收入、座公里收入均最高,旅客承运量、常客承运量均低于平均水平。第四群包括的始发地:北京市、上海市、郑州市、常州市第四群包括的始发地:北京市、上海市、郑州市、常州市 、深圳市等。特、深圳市等。特点:旅客承运量、常客承运量、两舱常客乘机比、客座率、两舱客座率、可点:旅客承运量、常客承运量、两舱常客乘机比、客座率、两舱客座率、可累积舱位常客乘机比均最高;不过座公里收入最低。累积舱位常客乘机比均最高;不过座公里收入最低。分群特征明显。分群特征明显。按照始发地聚类结果描述以第一群、第三群、第航段总体聚类航段总体聚类航段总体聚类在上述聚类结果上进一步分析在上述聚类结果上进一步分析注:其他群其他月份均有类似的结果注:其他群其他月份均有类似的结果在上述聚类结果上进一步分析注:其他群其他月份均有类似的结果按航段、始发地聚类交叉结果按航段、始发地聚类交叉结果按航段、始发地聚类交叉结果始发地群始发地群1与航段群与航段群1交叉,时间段为交叉,时间段为1月份的特征表现月份的特征表现始发地群1与航段群1交叉,时间段为1月份的特征表现5 预测常客承运量、旅客承运量的结果预测常客承运量、旅客承运量的结果5 预测常客承运量、旅客承运量的结果5 预测常客承运量、旅客承运量的结果预测常客承运量、旅客承运量的结果5 预测常客承运量、旅客承运量的结果5 5 KPIKPI展现展现1.1.查看模型基本信息描述查看模型基本信息描述2.2.航段聚类航段聚类1 1)聚类结果(聚类特征描述、类的月度数据描述)聚类结果(聚类特征描述、类的月度数据描述)2 2)航段始发地交叉(始发地航段交叉表、具体航段、交叉月度明细表)航段始发地交叉(始发地航段交叉表、具体航段、交叉月度明细表)3.3.按航段、始发地或航段始发地交叉查询按航段、始发地或航段始发地交叉查询1 1)汇总结果查询)汇总结果查询2 2)明细结果查询)明细结果查询3 3)会员明细结果查询)会员明细结果查询4.4.両舱会员钱包份额分析両舱会员钱包份额分析1 1)查看航空公司両舱份额)查看航空公司両舱份额2 2)航空公司両舱份额汇总查询)航空公司両舱份额汇总查询3 3)南航外行共飞、南航独飞、南航不飞的份额查询)南航外行共飞、南航独飞、南航不飞的份额查询4 4)钱包份额明细查询)钱包份额明细查询5 KPI展现1.查看模型基本信息描述5.5.商务圈查询表商务圈查询表1 1)商务圈查询)商务圈查询2 2)两个时间段的商务圈对比查询)两个时间段的商务圈对比查询6.6.商务圈会员明细查询商务圈会员明细查询7.7.预测表预测表实际系统展现实际系统展现5.商务圈查询表六交叉销售模型六交叉销售模型 1 1模型需求模型需求交叉销售模型主要是指南航和合作伙伴间的交叉交叉销售模型主要是指南航和合作伙伴间的交叉销售,目前的交叉销售类型有:银行销售,目前的交叉销售类型有:银行/联名卡联名卡/积分兑积分兑换换/酒店酒店/通信通信/租车。合作伙伴的消费记录和乘机行租车。合作伙伴的消费记录和乘机行为之间靠会员卡号关联。为之间靠会员卡号关联。期望模型输出是:发现潜力会员期望模型输出是:发现潜力会员/提高乘机比提高乘机比/设设计合适的合作伙伴交叉产品,比如计合适的合作伙伴交叉产品,比如”机机+酒酒”产品设产品设计。计。六交叉销售模型 1模型需求2 2具体分析具体分析(1)(1)合作伙伴消费分析合作伙伴消费分析时间窗口:时间窗口:20082008年年1 1月月1 120092009年年1212月月3131日日目标客户:在时间窗口内有合作伙伴消费记目标客户:在时间窗口内有合作伙伴消费记录的南航会员。录的南航会员。2具体分析(1)合作伙伴消费分析分析变量表分析变量表分析变量变量名称说明合作合作伙伴伙伴消费消费变量变量合作伙伴消费次数会员在每个合作伙伴的消费次数合作伙伴消费积分会员在每个合作伙伴的消费积分次数占比会员在各合作伙伴的消费次数占总次数之比积分占比会员在各合作伙伴的消费积分占总积分之比总消费次数会员总消费次数总消费积分会员总消费积分分析变量表分析变量变量名称说明合作合作伙伴消费次数会员在每个(2)(2)南航消费分析南航消费分析时间窗口:时间窗口:20082008年年1 1月月1 1 2009 2009年年1212月月3131日日(该时间窗口与合作伙伴数据窗口一致,便(该时间窗口与合作伙伴数据窗口一致,便于比较)。于比较)。目标客户:在时间窗口内有南航消费记录的目标客户:在时间窗口内有南航消费记录的会员会员(2)南航消费分析分析变量表分析变量表分析变量变量名称说明南航南航消费消费变量变量乘机次数会员在每个合作伙伴的消费次数基本里程会员在每个合作伙伴的消费积分两舱乘机次数会员在各合作伙伴的消费次数占总次数之比平均折扣会员在各合作伙伴的消费积分占总积分之比经济舱平均折扣会员总消费次数两舱平均折扣会员总消费积分分析变量表分析变量变量名称说明南航乘机次数会员在每个合作伙伴3 3建模方法建模方法 采用统计方法,针对不同维度进行汇总,采用统计方法,针对不同维度进行汇总,从数据抽取,到从数据抽取,到KPIKPI展示所需数据全部利用展示所需数据全部利用ORACLEORACLE存储过程完成。存储过程完成。3建模方法4 模型结果模型结果(1)(1)会员消费份额分析结果会员消费份额分析结果(2)(2)各合作伙伴份额分析结果各合作伙伴份额分析结果(3)(3)南航及合作伙伴消费链分析结果南航及合作伙伴消费链分析结果 4 模型结果(1)会员消费份额分析结果5 KPI展现展现1.查看模型基本信息描述2.合作伙伴份额查询合作伙伴份额查询3.会员偏好结果查询会员偏好结果查询4.仅有乘机记录会员消费查询仅有乘机记录会员消费查询5.交叉消费会员结果查询交叉消费会员结果查询6.机加酒店链接分析机加酒店链接分析参加实际参加实际kpi系统系统5 KPI展现1.查看模型基本信息描述七、七、KPI报表报表七、KPI报表七、七、KPI报表报表七、KPI报表七、七、KPI报表报表七、KPI报表七、七、KPI报表报表七、KPI报表七、七、KPI报表报表七、KPI报表数据挖掘项目模型方法课件
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!