资源描述
单击此处编辑母版文本样式,第二级,第三级,-,*,-,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,单击此处编辑母版标题样式,某运营商数据挖掘项目汇报,_,新增用户维系,2010,年,3,月,新增用户维系基本流程,1,、采用生存分析法,对有流失倾向的用户进行提前预警,并可根据用户流失概率的高低划定预警级别,流失高危用户群,在网异动用户群,正常用户群,异动预警监控,1,、维系策略方案生成,渠道养卡监管措施,重入网与反复用户管控措施,正常低网龄用户维系措施,2,、维系方案实施,营销案实施流程,维系渠道,维系方式,维系策略及方案,1,、维系情况反馈,2,、目标达成情况,3,、维系效果评估:,渠道养卡识别及监管,重入网与反复重入网,正常低网龄用户维系,维系效果评估,1,、新增用户分群:,渠道养卡,重入网与反复重入网用户,正常低网龄用户细分,根据正常低网龄用户偏好进行细分,新增用户分群,建立新增用户维系闭环管理体系,准确分群,分级预警,制定针对性的维系策略和方案并实施,实现新增用户保有。,渠道养卡识别与监控,重入网与反复重入网管理,正常低网龄用户维系,新增用户维系,柳州渠道养卡行为特征及监控思路建议,产品:,渠道养卡一般选择无月租或最低月租的产品,以降低养卡的成本,研究发现柳州,2,种类型产品均被渠道选择使用,ARPU,:,渠道养卡号码消费额一般较低,研究发现柳州养卡号码月均消费一般低于,15,元,主叫时长:,渠道养卡号码主叫时长非常低,研究发现柳州有,70%,以上无通话行为,有通话行为用户主叫时长主要集中在,3,分钟以内,用户状态:,研究发现柳州渠道养卡新增号码停机流失高峰出现在入网后的第,1-3,个月,消费情况:,同一个渠道发展的养卡号码中,出现多个号码消费行为一致的情况,如多个号码入网当月和次月消费完全一致,激活,IMEI,:,养卡号码在激活时,一般用同一个手机激活,因此养卡号码中大量号码的激活,IMEI,一致,柳州渠道养卡行为特征,制定疑似养卡渠道的判断规则:从渠道发展用户的产品、,ARPU,、用户状态进行判断,当用户数占比符合一定标准后,即判断为疑似养卡渠道;,制定疑似养卡号码的判断规则:从用户消费情况、激活,IMEI,等进行判断,符合一定标准的号码为疑似养卡号码;,分析疑似养卡渠道的养卡号码量,计算养卡号码占其当月新发展的比,并按各渠道此比例排序,养卡行为监控思路建议,通过研究发现柳州渠道养卡行为特征及监控思路建议如下:,以上判断标准,都以同一渠道发展的用户作为判断基础数据;,判断步骤是首先判断疑似养卡渠道,在判断其为疑似养卡渠道后,统计其疑似养卡号码数量,对养卡号码的判断模型是对渠道养卡违规行为进行分析的基础,需要在执行中进一步分析、调研完善优化判断规则,提升判断准确率。,疑似养卡渠道和养卡号码判断规则,疑,似,养,卡,渠,道,产品:,渠道新增用户中,,30%,以上的用户都为两广情零听计划或都市“零听”计划二,该渠道为疑似养卡渠道,主叫时长,:渠道新增用户中,,50%,以上或,100,人以上的用户入网当月和次月主叫时长在,3,分钟内,该渠道为疑似养卡渠道,用户状态:,渠道新增用户中,入网后在第,3,个月,,30%,以上的用户状态为停机流失,该渠道为疑似养卡渠道,疑,似,养,卡,号,码,消费情况,:,a.,出现,5,个或以上号码号码入网当月和次月主叫时长都在,3,分钟内;,b.,或出现,5,个或以上号码号码入网当月和次月消费在,5,元以内;,c.,或出现,2,个以上号码入网当月或次月应收费完全一致,,这些号码为疑似养卡号码,激活情况:,a.,出现,5,个或以上号码号码激活,IMEI,一致,;,b.,或,2,个或以上号码登记身份证号一致,这些号码为疑似养卡号码,ARPU,:,渠道新增用户中,,30%,以上或,100,人以上的用户入网当月和次月,ARPU,低于,5,元,该渠道为疑似养卡渠道,渠道养卡识别与监控,重入网与反复重入网管理,正常低网龄用户维系,新增用户维系,重入网与反复重入网(跳蚤)用户识别规则,N,N+1,N-6,N-4,N-5,N-2,N-3,N-1,新入网激活月,新入网激活后第,1,月,新入网激活月前半年的存量用户历史,IMEI,库或身份证库,N,月在网用户,区分新增和存量用户,判断重入网用户,判断新入网用户的有效,IMEI,或身份证号码,N,月新入网用户中的重入网和反复重入网用户名单,剔除无效,IMEI,或身份证号码,生成、维护历史有效,IMEI,库或身份证号库,重入网:,新用户,IMEI,或身份证号与历史,IMEI,或身份证号码能够匹配(,6,个月以内)。如,,9,月新入网用户,IMEI,或身份证号与,3,月到,8,月用户,IMEI,或身份证号码库匹配后,得到,9,月新入网用户中重入网用户。,反复重入网(跳蚤用户):,重入网用户在,6,个月以内重入网,2,次及,2,次以上的用户。,识别规则:,通过对新入网用户使用手机的,IMEI,号(或身份证号码)与存量用户的,IMEI,号历史库(或身份证号码历史库)进行分析识别出重入网和反复重入网用户。,为了提高分析结果的准确率,每月定期对上月新入网的用户(上月入网并激活的用户)进行分析。分析示意如下:用户在,N,月入网并激活(有话单产生),则在,N+1,月(计算月)对,N,月入网并激活的所有用户进行重入网分析。,用户重入网主要原因分析,产品,价格,促销,/,宣传,渠道,产品线过长,产品重叠较多,目标用户群存在较多交叉,不同品牌及资费存在内部竞争,产品价格调整比较频繁,而且在价格调整过程中没有考虑产品体系间的平衡问题,预存费用低,用户入网门槛不高,使其可以轻易弃卡,新入网促销活动优惠力度过大,品牌及资费资费套餐互转门槛过高,停机保号、套餐互转等宣传不足,部分社会渠道迫于指标压力或利益驱动,诱导用户换卡,社会渠道虚假激活,通过养卡恶意套取酬金,追求经济收益,受入网优惠的吸引,换取吉祥号码,欠费,竞争对手以低资费、大力度的优惠活动吸引用户,但整体质量未能让用户满意,从而使用户在短暂离(移动)网后重新入网,公司内部,竞争对手,用户,服务,补卡成本高,手续复杂,补卡不如买新卡,欠费提醒不及时,欠费后被停机,选择重入网,从产品、促销、渠道、传播、服务等多方面入手加强重入网与反复重入网管理,降低重入网比率,重入网与反复重入网管理措施,加强入网促销活动管理,减少促销活动对在网用户的干扰;,提高入网首次预存费用,增加在网时长;,用户忠诚度管理:网龄营销。,产品,/,促销,传播,渠道,服务,加强(社会)渠道掌控,规范渠道行为,减少系统性离网行为。,采用户外广告、报纸等大众媒体及营业厅、,10086,短信、网站、,WAP,等自有媒体体开展网龄营销、优惠补卡及带号转品牌、套餐、停机保号等的传播。,加强欠费管理,减少无效欠费;,主卡付费,+,亲情网;,账户低余额时充值提示;,优惠或免费补卡;,推荐带号转品牌或带号转套餐。,渠道养卡识别与监控,重入网与反复重入网管理,正常低网龄用户维系,新增用户维系,正常低网龄用户维系基本策略,剔除了渠道养卡用户和反复重入网用户后所获得的正常低网龄用户是新增用户流失控制的重点。运用数据挖掘方法,识别出不同流失预警级别的用户,针对高危用户和异动用户分别采取针对性的营销捆绑手段进行维系,同时结合网龄营销,延长用户生命周期。,正常低网龄用户分群,用户,重绑:,针对高危用户在网黏性已很弱的特点,采取较大力度的营销捆绑策略,以返还周期短的财务捆绑和力度较大的业务捆绑为主,以服务捆绑为辅。,力保:,针对异动用户尚处于流失犹豫期、还具有一定黏性的特点,维系策略将以强化用户的业务黏性为重点,以业务捆绑和较长返还周期的财务捆绑为主,以服务捆绑为辅。,全用户常规保有(不研究)。,细分用户群,基本策略,流失高危,用户,在网异动,用户,相对稳定,用户,多级预警,多级维系,在模型挖掘的基础上,准确判别正常低网龄用户的流失倾向,根据用户流失概率的高低分别实施针对性的维系策略和措施,对可能流失的用户提前预防,多级维系,有效地防止用户流失。,流失异动用户,营销捆绑,日常维系及,异动监控,办理,未办理,模型匹配,低网龄用户,流失高危用户,是否流失,流失,未流失,1,1,2,一级匹配和维系;二级匹配和维系。,1,2,正常低网龄用户细分、预警及维系框架,精准营销模型,新增用户细分模型,用户价值,在网时长,渠道偏好,促销偏好,用户号码,消费特征,用户清单,话费余额,新增网用户流失模型,商务高端用户群,长途话务突出群,本地话务突出群,本地低端用户群,数据业务发烧群,漫游突出用户群,数据业务兴趣群,本地话务偏好群,在网异动用户,流失高危用户,长途话务突出群,本地话务突出群,本地低端用户群,漫游突出用户群,数据业务突出群,本地话务偏好群,当月新增用户,其他新增用户,营销案,用户流失预警和细分建模过程,流失现状分析,流失原因分析,流失用户特征分析,流失预警建模目标沟通确定,流失细分模型目标沟通确定,根据建模要求和现有数据情况,构思、沟通和确定建模数据提取需求,提取,09,年,1-10,月新增用户在,1-10,月的自然属性和消费行为数据,提取,09,年,10,月新增用户在,10,月的日消费行为数据,数据质量审核,数据探索,非正常用户的剔除。根据渠道养卡和跳蚤用户识别模型提取异常用户,数据抽样。确定建模用户集合,建模衍生变量计算。根据提取的基础数据宽表计算衍生变量,建模变量筛选,特征建模分析,卡方分析,方差分析,双变量分析,Pearson,相关分析,wald,显著性检验,量重要性分析,建模变量数据转换,对数变换,标准化变换,确定建模用户集,确定建模用户数据集,采用,Two,Step,聚类算法,建立用户细分模型,月数据用户细分模型(高价值 用户和在网,2,月及,2,月以上的新增用户细分,日数据用户细分模型(在网,1,月新增用户细分),业务解释聚类结果,调整模型参数和建模变量,直到得到满意结果,确定建模用户集,确定建模用户数据集,采用逻辑回归和决策树算法建立流失预警模型,在网,2,月新增用户流失预警模型,在网,2,月以上新增用户流失预警模型,在网,1,月新增用户流失预警模型,采用生存分析算法建立高价值用户流失预警模型,模型的评估,提升图、收益图,混淆矩阵。准确率和查全率,模型的优化,建模训练集比例,异常值处理,建模变量,建模方法,模型参数,显著性检验方法,显著性检验变量剔除阈值,树的深度和页节点记录个数,业务与数据 分析,数据准备,建模准备,细分模型,预警模型,模型评估和优化,数据提取,数据清洗,数据审核,数据集成,数据挖掘宽表构建,缺失数据处理,极值数据处理,错误数据处理,冗余数据处理,数据统计错误审核,数据源错误审核,数据统计口径审核,数据准备确保建模数据的完整性、可用性和完整性,提取建模所需数据,数据准备,筛选建模变量、根据模型要求进行数据变换,建模准备,字段过滤,变异系数,标准差,最大类别数,最小类别数,数据探索,数据分布,双变量分析,正态性检验,相关性分析,卡方分析,方差分析,相关分析,自相关分析,建模筛选,通过建模分析字段的重要性,决策树模型,信息增益旁别,逻辑回归模型,回归系数显著性检验,数据变换,标准化变换,对数变换,正态变换,经分数据,挖掘宽表,变量转换,变量筛选,健康度建,模指标库,变量清洗,用户细分采用凝聚层次聚类算法,选择,初始化,更新,结束,计算包含每对样本间距离(如欧氏距离)的相似矩阵,把每个样本作为一个簇,使用相似矩阵查找最相似的两个簇,将两个簇合并为一个簇,簇的个数通过合并被更新;同时更新相似矩阵,将两个簇的两行(两列)距离用,1,行(,1,列)距离替换反映合并操作。,当所有样本都合并成一个簇或满足指定的簇的数目时,整个过程结束。,层次聚类可以分为两种:凝聚的方式和分割的方式,凝聚是一种至底向上的方法,将每一条记录看作一个类,然后根据一些规则将他们聚合成越来越大的类,直到满足一些预先设定的条件。,1,2,3,4,执行,n-1,次步骤,2,和步骤,3,
展开阅读全文