某运营商数据挖掘项目汇报

上传人:fg****fg 文档编号:253030249 上传时间:2024-11-27 格式:PPT 页数:38 大小:1.10MB
返回 下载 相关 举报
某运营商数据挖掘项目汇报_第1页
第1页 / 共38页
某运营商数据挖掘项目汇报_第2页
第2页 / 共38页
某运营商数据挖掘项目汇报_第3页
第3页 / 共38页
点击查看更多>>
资源描述
单击此处编辑母版文本样式,第二级,第三级,-,38,-,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,单击此处编辑母版标题样式,某运营商数据挖掘项目汇报,_,新增用户维系,2010,年,3,月,新增用户维系基本流程,1,、采用生存分析法,对有流失倾向的用户进行提前预警,并可根据用户流失概率的高低划定预警级别,流失高危用户群,在网异动用户群,正常用户群,异动预警监控,1,、维系策略方案生成,渠道养卡监管措施,重入网与反复用户管控措施,正常低网龄用户维系措施,2,、维系方案实施,营销案实施流程,维系渠道,维系方式,维系策略及方案,1,、维系情况反馈,2,、目标达成情况,3,、维系效果评估:,渠道养卡识别及监管,重入网与反复重入网,正常低网龄用户维系,维系效果评估,1,、新增用户分群:,渠道养卡,重入网与反复重入网用户,正常低网龄用户细分,根据正常低网龄用户偏好进行细分,新增用户分群,建立新增用户维系闭环管理体系,准确分群,分级预警,制定针对性的维系策略和方案并实施,实现新增用户保有。,渠道养卡识别与监控,重入网与反复重入网管理,正常低网龄用户维系,新增用户维系,柳州渠道养卡行为特征及监控思路建议,产品:,渠道养卡一般选择无月租或最低月租的产品,以降低养卡的成本,研究发现柳州,2,种类型产品均被渠道选择使用,ARPU,:,渠道养卡号码消费额一般较低,研究发现柳州养卡号码月均消费一般低于,15,元,主叫时长:,渠道养卡号码主叫时长非常低,研究发现柳州有,70%,以上无通话行为,有通话行为用户主叫时长主要集中在,3,分钟以内,用户状态:,研究发现柳州渠道养卡新增号码停机流失高峰出现在入网后的第,1-3,个月,消费情况:,同一个渠道发展的养卡号码中,出现多个号码消费行为一致的情况,如多个号码入网当月和次月消费完全一致,激活,IMEI,:,养卡号码在激活时,一般用同一个手机激活,因此养卡号码中大量号码的激活,IMEI,一致,柳州渠道养卡行为特征,制定疑似养卡渠道的判断规则:从渠道发展用户的产品、,ARPU,、用户状态进行判断,当用户数占比符合一定标准后,即判断为疑似养卡渠道;,制定疑似养卡号码的判断规则:从用户消费情况、激活,IMEI,等进行判断,符合一定标准的号码为疑似养卡号码;,分析疑似养卡渠道的养卡号码量,计算养卡号码占其当月新发展的比,并按各渠道此比例排序,养卡行为监控思路建议,通过研究发现柳州渠道养卡行为特征及监控思路建议如下:,以上判断标准,都以同一渠道发展的用户作为判断基础数据;,判断步骤是首先判断疑似养卡渠道,在判断其为疑似养卡渠道后,统计其疑似养卡号码数量,对养卡号码的判断模型是对渠道养卡违规行为进行分析的基础,需要在执行中进一步分析、调研完善优化判断规则,提升判断准确率。,疑似养卡渠道和养卡号码判断规则,疑,似,养,卡,渠,道,产品:,渠道新增用户中,,30%,以上的用户都为两广情零听计划或都市“零听”计划二,该渠道为疑似养卡渠道,主叫时长,:渠道新增用户中,,50%,以上或,100,人以上的用户入网当月和次月主叫时长在,3,分钟内,该渠道为疑似养卡渠道,用户状态:,渠道新增用户中,入网后在第,3,个月,,30%,以上的用户状态为停机流失,该渠道为疑似养卡渠道,疑,似,养,卡,号,码,消费情况,:,a.,出现,5,个或以上号码号码入网当月和次月主叫时长都在,3,分钟内;,b.,或出现,5,个或以上号码号码入网当月和次月消费在,5,元以内;,c.,或出现,2,个以上号码入网当月或次月应收费完全一致,,这些号码为疑似养卡号码,激活情况:,a.,出现,5,个或以上号码号码激活,IMEI,一致,;,b.,或,2,个或以上号码登记身份证号一致,这些号码为疑似养卡号码,ARPU,:,渠道新增用户中,,30%,以上或,100,人以上的用户入网当月和次月,ARPU,低于,5,元,该渠道为疑似养卡渠道,渠道养卡识别与监控,重入网与反复重入网管理,正常低网龄用户维系,新增用户维系,重入网与反复重入网(跳蚤)用户识别规则,N,N+1,N-6,N-4,N-5,N-2,N-3,N-1,新入网激活月,新入网激活后第,1,月,新入网激活月前半年的存量用户历史,IMEI,库或身份证库,N,月在网用户,区分新增和存量用户,判断重入网用户,判断新入网用户的有效,IMEI,或身份证号码,N,月新入网用户中的重入网和反复重入网用户名单,剔除无效,IMEI,或身份证号码,生成、维护历史有效,IMEI,库或身份证号库,重入网:,新用户,IMEI,或身份证号与历史,IMEI,或身份证号码能够匹配(,6,个月以内)。如,,9,月新入网用户,IMEI,或身份证号与,3,月到,8,月用户,IMEI,或身份证号码库匹配后,得到,9,月新入网用户中重入网用户。,反复重入网(跳蚤用户):,重入网用户在,6,个月以内重入网,2,次及,2,次以上的用户。,识别规则:,通过对新入网用户使用手机的,IMEI,号(或身份证号码)与存量用户的,IMEI,号历史库(或身份证号码历史库)进行分析识别出重入网和反复重入网用户。,为了提高分析结果的准确率,每月定期对上月新入网的用户(上月入网并激活的用户)进行分析。分析示意如下:用户在,N,月入网并激活(有话单产生),则在,N+1,月(计算月)对,N,月入网并激活的所有用户进行重入网分析。,用户重入网主要原因分析,产品,价格,促销,/,宣传,渠道,产品线过长,产品重叠较多,目标用户群存在较多交叉,不同品牌及资费存在内部竞争,产品价格调整比较频繁,而且在价格调整过程中没有考虑产品体系间的平衡问题,预存费用低,用户入网门槛不高,使其可以轻易弃卡,新入网促销活动优惠力度过大,品牌及资费资费套餐互转门槛过高,停机保号、套餐互转等宣传不足,部分社会渠道迫于指标压力或利益驱动,诱导用户换卡,社会渠道虚假激活,通过养卡恶意套取酬金,追求经济收益,受入网优惠的吸引,换取吉祥号码,欠费,竞争对手以低资费、大力度的优惠活动吸引用户,但整体质量未能让用户满意,从而使用户在短暂离(移动)网后重新入网,公司内部,竞争对手,用户,服务,补卡成本高,手续复杂,补卡不如买新卡,欠费提醒不及时,欠费后被停机,选择重入网,从产品、促销、渠道、传播、服务等多方面入手加强重入网与反复重入网管理,降低重入网比率,重入网与反复重入网管理措施,加强入网促销活动管理,减少促销活动对在网用户的干扰;,提高入网首次预存费用,增加在网时长;,用户忠诚度管理:网龄营销。,产品,/,促销,传播,渠道,服务,加强(社会)渠道掌控,规范渠道行为,减少系统性离网行为。,采用户外广告、报纸等大众媒体及营业厅、,10086,短信、网站、,WAP,等自有媒体体开展网龄营销、优惠补卡及带号转品牌、套餐、停机保号等的传播。,加强欠费管理,减少无效欠费;,主卡付费,+,亲情网;,账户低余额时充值提示;,优惠或免费补卡;,推荐带号转品牌或带号转套餐。,渠道养卡识别与监控,重入网与反复重入网管理,正常低网龄用户维系,新增用户维系,正常低网龄,用,用户维系基,本,本策略,剔除了渠道,养,养卡用户和,反,反复重入网,用,用户后所获,得,得的正常低,网,网龄用户是,新,新增用户流,失,失控制的重,点,点。运用数,据,据挖掘方法,,,,识别出不,同,同流失预警,级,级别的用户,,,,针对高危,用,用户和异动,用,用户分别采,取,取针对性的,营,营销捆绑手,段,段进行维系,,,,同时结合,网,网龄营销,,延,延长用户生,命,命周期。,正常低网龄,用,用户分群,用户,重绑:,针对高危用,户,户在网黏性,已,已很弱的特,点,点,采取较,大,大力度的营,销,销捆绑策略,,,,以返还周,期,期短的财务,捆,捆绑和力度,较,较大的业务,捆,捆绑为主,,以,以服务捆绑,为,为辅。,力保:,针对异动用,户,户尚处于流,失,失犹豫期、,还,还具有一定,黏,黏性的特点,,,,维系策略,将,将以强化用,户,户的业务黏,性,性为重点,,以,以业务捆绑,和,和较长返还,周,周期的财务,捆,捆绑为主,,以,以服务捆绑,为,为辅。,全用户常规,保,保有(不研,究,究)。,细分用户群,基本策略,流失高危,用户,在网异动,用户,相对稳定,用户,多级预警,,多,多级维系,在模型挖掘,的,的基础上,,准,准确判别正,常,常低网龄用,户,户的流失倾,向,向,根据用,户,户流失概率,的,的高低分别,实,实施针对性,的,的维系策略,和,和措施,对,可,可能流失的,用,用户提前预,防,防,多级维,系,系,有效地,防,防止用户流,失,失。,流失异动用户,营销捆绑,日常维系及,异动监控,办理,未办理,模型匹配,低网龄用户,流失高危用户,是否流失,流失,未流失,1,1,2,一级匹配和,维,维系;二,级,级匹配和维,系,系。,1,2,正常低网龄,用,用户细分、,预,预警及维系,框,框架,精准营销模,型,型,新增用户细,分,分模型,用户价值,在网时长,渠道偏好,促销偏好,用户号码,消费特征,用户清单,话费余额,新增网用户,流,流失模型,商务高端用,户,户群,长途话务突,出,出群,本地话务突,出,出群,本地低端用,户,户群,数据业务发,烧,烧群,漫游突出用,户,户群,数据业务兴,趣,趣群,本地话务偏,好,好群,在网异动用,户,户,流失高危用,户,户,长途话务突,出,出群,本地话务突,出,出群,本地低端用,户,户群,漫游突出用,户,户群,数据业务突,出,出群,本地话务偏,好,好群,当月新增用,户,户,其他新增用,户,户,营销案,用户流失预,警,警和细分建,模,模过程,流失现状分,析,析,流失原因分,析,析,流失用户特,征,征分析,流失预警建,模,模目标沟通,确,确定,流失细分模,型,型目标沟通,确,确定,根据建模要,求,求和现有数,据,据情况,构,思,思、沟通和,确,确定建模数,据,据提取需求,提取,09,年,1-10,月新增用户,在,在,1-10,月的自然属,性,性和消费行,为,为数据,提取,09,年,10,月新增用户,在,在,10,月的日消费,行,行为数据,数据质量审,核,核,数据探索,非正常用户,的,的剔除。根,据,据渠道养卡,和,和跳蚤用户,识,识别模型提,取,取异常用户,数据抽样。,确,确定建模用,户,户集合,建模衍生变,量,量计算。根,据,据提取的基,础,础数据宽表,计,计算衍生变,量,量,建模变量筛,选,选,特征建模分,析,析,卡方分析,方差分析,双变量分析,Pearson,相关分析,wald,显著性检验,量重要性分,析,析,建模变量数,据,据转换,对数变换,标准化变换,确定建模用,户,户集,确定建模用,户,户数据集,采用,TwoStep,聚类算法,,建,建立用户细,分,分模型,月数据用户,细,细分模型(,高,高价值 用,户,户和在网,2,月及,2,月以上的新,增,增用户细分,日数据用户,细,细分模型(,在,在网,1,月新增用户,细,细分),业务解释聚,类,类结果,调,整,整模型参数,和,和建模变量,,,,直到得到,满,满意结果,确定建模用,户,户集,确定建模用,户,户数据集,采用逻辑回,归,归和决策树,算,算法建立流,失,失预警模型,在网,2,月新增用户,流,流失预警模,型,型,在网,2,月以上新增,用,用户流失预,警,警模型,在网,1,月新增用户,流,流失预警模,型,型,采用生存分,析,析算法建立,高,高价值用户,流,流失预警模,型,型,模型的评估,提升图、收,益,益图,混淆矩阵。,准,准确率和查,全,全率,模型的优化,建模训练集,比,比例,异常值处理,建模变量,建模方法,模型参数,显著性检验,方,方法,显著性检验,变,变量剔除阈,值,值,树的深度和,页,页节点记录,个,个数,数据提取,数据清洗,数据审核,数据集成,数据挖掘宽,表,表构建,缺失数据处,理,理,极值数据处,理,理,错误数据处,理,理,冗余数据处,理,理,数据统计错,误,误审核,数据源错误,审,审核,数据统计口,径,径审核,数据准备确,保,保建模数据,的,的完整性、,可,可用性和完,整,整性,提取建模所,需,需数据,数据准备,筛选建模变,量,量、根据模,型,型要求进行,数,数据变换,建模准备,经分数据,挖掘宽表,变量转换,变量筛选,健康度建,模指标库,变量清洗,用户细分采,用,用凝聚层次,聚,聚类算法,选择,初始化,更新,结束,计算包含每,对,对样本间距,离,离(如欧氏,距,距离)的相,似,似矩阵,把,每,每个样本作,为,为一个簇,使用相似矩,阵,阵查找最相,似,似的两个簇,将两个簇合,并,并为一个簇,,,,簇的个数,通,通过合并被,更,更新;同时,更,更新相似矩,阵,阵,将两个,簇,簇的两行(,两,两列)距离,用,用,1,行(,1,列)距离替,换,换反映合并,操,操作。,当所有样本,都,都合并成一,个,个簇或满足,指,指定的簇的,数,数目时,整,个,个过程结束,。,。,层次聚类可,以,以分为两种,:,:凝聚的方,式,式和分割的,方,方式,凝聚,是,是一种至底,向,向上的方法,,,,将每一条,记,记录看作一,个,个类,然后,根,根据一些规,则,则将他们聚,合,合成越来越,大,大的类,直,到,到满足一些,预,预先设定的,条,条件。,1,2,3,4,执行,n-1,次步骤,2,和步骤,3,网龄2月及,以,以上新增用,户,户细分模型,采用,SPSS,及,CLEMENTINE,作为数据分,析,析与聚类建,模,模工具,算法为,Two Step,聚类算法,使用细分矩,阵,阵,按照语,音,音消费行为,和,和数据业务,消,消费行为两,次,次聚类的方,法,法分别聚类,,,,多维聚类,的,的方法较传,统,统单维聚类,方,方法,聚类,后,后的用户细,分,分特征更明,显,显,聚类数据集,为,为,2009,年,1-9,月新增用户,入,入网后第二,个,个月,且第,二,二月状态正,常,常的用户的,基,基础数据和,消,消费行为数,据,据,数据在聚类,前,前需进行标,准,准化变换和,极,极值处理,本地通话次,数,数,长途通话次,数,数,计费通话时,长,长,漫游通话次,数,数,ARPU,低端,中低端,长途突,出,出,本地突,出,出,漫游突,出,出,商务,GPRS,流量,新业务,费,费,新业务,使,使用种,类,类数,彩信条,数,数,短信条,数,数,新业务,费,费占比,使用,少,占比高,兴趣,短信突,出,出,上网突,出,出,发烧友,细分群,主,主要消,费,费行为,特,特征(,网,网龄=2个,月,月)-1,序号,细分群名称,细分群特征,规模占比,1,商务高端用户群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;,ARPU,最高为,240,元,/,户以上,交往圈最大,本长漫语音话务均高,且每次通话时长较长,2.4%,2,漫游突出用户群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;,ARPU,为,85,元,/,户左右,经常去外地,漫游话务突出,本地及长途话务较少,且漫游通话频次最高,3.9%,3,长途话务突出群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;,ARPU,为,120,元,/,户左右,交往圈中有大量外地号码,长途话务突出,漫游很少,且长途通话频次最高,7.6%,4,本地话务突出群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;,ARPU,为,120,元,/,户左右,交往圈主要集中在本地,本地话务突出,长途漫游较少,且本地通话频次最高,4.7%,5,本地话务偏好群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;,ARPU,为,67,元,/,户左右,交往圈主要集中在本地,通话时长相对较低,但本地话务相对突出,长途漫游很少,14.8%,6,本地低端用户群,语音和数据业务消费行为均较低,用消费户行为相对均衡;,ARPU,较低为,30,元,/,户左右,很少去外地,漫游和长途时长比例最低,平均每次通话时长最短,33.5%,序号,细分群名称,细分群特征,规模占比,7,短信突出用户群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;,ARPU,为,40,元,/,户左右,数据业务消费占比高于,50%,,主要使用短信业务,且短信上行条数最高,8.0%,8,GPRS,突出用户群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;,ARPU,为,30,元,/,户左右,数据业务消费占比高于,50%,,,GPRS,流量高,其他数据业务使用较少,8.1%,9,数据业务兴趣群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;,ARPU,为,20,元,/,户左右,订购数据业务种类最多,但消费不高,数据业务费用占比高于,50%,13.3%,10,数据业务发烧群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;,ARPU,为,65,元,/,户左右,订购数据业务种类最多,且数据业务消费最高, 占比高达,67%,3.9%,细分群,主,主要消,费,费行为,特,特征(,网,网龄=2个,月,月)-2,网龄1,月,月新增,用,用户细,分,分模型,采用,SPSS,及,CLEMENTINE,作为数,据,据分析,与,与聚类,建,建模工,具,具,算法为,TwoStep,聚类算,法,法,使用细,分,分矩阵,,,,按照,语,语音消,费,费行为,和,和数据,业,业务消,费,费行为,两,两次聚,类,类的方,法,法分别,聚,聚类,,多,多维聚,类,类的方,法,法较传,统,统单维,聚,聚类方,法,法,聚,类,类后的,用,用户细,分,分特征,更,更明显,聚类数,据,据集为,2009,年,10,月,125,日入网,,,,,11,月,1,日之前,未,未流失,的,的用户,从,从入网,当,当日至,月,月底的,日,日均消,费,费行为,数,数据,数据在,聚,聚类前,需,需进行,标,标准化,变,变换和,极,极值处,理,理,低端,中低端,长途突,出,出,本地突,出,出,商务,占比占,比,比,高,使用少,兴趣,上网突,出,出,发烧友,日均本,地,地通话,次,次数,日均长,途,途通话,次,次数,日均漫,游,游通话,次,次数,日均计,费,费通话,时,时长,日均,GPRS,流量,日均彩,信,信条数,日均短,信,信条数,新业务,使,使用,种,种类数,新业务,费,费占比,序号,细分群名称,细分群,特征,规模占比,1,漫游突出用户群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,100,元,/,户左右,经常去外地,漫游话务突出,本地及长途话务很少,且漫游通话频次最高,3.0%,2,长途话务突出群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,100,元,/,户左右,交往圈中有大量外地号码,长途话务突出,基本无漫游,且长途通话频次最高,4.5%,3,本地话务突出群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,75,元,/,户左右,交往圈主要集中在本地,本地话务突出,基本无漫游,长途很少,且本地通话频次最高,7.7%,4,本地话务偏好群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,55,元,/,户左右,交往圈主要集中在本地,通话时长相对较低,但本地话务相对突出,基本无漫游,长途很少,12.6%,5,本地低端用户群,语音和数据业务消费均较低,且二者消费相对均衡;入网当月,ARPU,为,25,元,/,户左右,主要在本地活动,本、长、漫通话时长均为最低,基本无数据业务使用量,36.7%,细分群,主,主要消,费,费行为,特,特征(,网,网龄1,个,个月)-1,序号,细分群名称,细分群,特征,规模占比,6,数据业务突出群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,30,元,/,户左右,订购数据业务种类最多,且数据业务消费占比高, 高达,79%,21.3%,7,GPRS,偏好用户群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,54,元,/,户左右,,GPRS,消费最高,远高于其他群,且数据业务消费占比高, 高达,77%,9.2%,8,短信突出用户群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;入当月,ARPU,为,80,元,/,户左右,数据业务消费占比为,65%,左右,日平均发送短信,10,条左右,主要使用短彩信业务,且短信和彩信上行条数均为最高,4.9%,细分群,主,主要消,费,费行为,特,特征(,网,网龄1,个,个月)-2,新增用,户,户中的,流,流失用,户,户超过,四,四分之,三,三的用,户,户生命,周,周期不,超,超过四,个,个月,,不,不具有,完,完整的,生,生命周,期,期特征,COX,生存分,析,析模型,,,,隐含,了,了一条,假,假设,,即,即在时,间,间越长,,,,其离,网,网的可,能,能性就,越,越大,,这,这样一,来,来,是,否,否离网,和,和在网,时,时间应,该,该是正,相,相关的,,,,,COX,模型在,拟,拟合的,时,时候,,会,会在这,个,个约束,之,之下,,所,所以其,对,对数据,的,的拟合,没,没有,LOGIT,效果好,因此对,新,新增用,户,户离网,预,预警,,采,采用,LOGIT,回归模,型,型或决,策,策模型,新增用,户,户中的,流,流失用,户,户有,76%,在入网,后,后的四,个,个月内,流,流失,流失用,户,户的,76%,是在入,网,网后的,四,四个月,内,内流失,分别有,22%,和,23%,的流失,用,用户在,入,入网后,的,的第一,个,个月和,第,第二月,内,内流失,数据来,源,源:,09,年,1,月,-10,月新增,用,用户,流失用,户,户定义,:,:当月,停,停机,,且,且连续,停,停机,60,天以上,用,用户,到,2009,年,11,月仍未,开,开机用,户,户,网龄举,例,例:,3,月入网,,,,,3,月流失,的,的用户,,,,网龄,为,为,0,个月,流失用,户,户的在,网,网时长,分,分布,决策树,预,预测模,型,型:决,策,策树是,以,以实例,为,为基础,的,的归纳,学,学习算,法,法,它,着,着眼于,从,从一组,无,无次序,、,、无规,则,则的实,例,例中推,理,理出以,决,决策树,表,表示的,分,分类规,则,则。它,采,采用自,顶,顶向下,的,的递归,方,方式,,在,在决策,树,树的内,部,部节点,进,进行属,性,性的比,较,较,并,根,根据不,同,同属性,值,值判断,从,从该节,点,点向下,的,的分支,,,,在决,策,策树的,叶,叶节点,得,得到结,论,论。,逻辑回归预,测,测模型:也,称,称定性变量,回,回归,类似,于,于线性回归,,,,但是目标,字,字段使用字,符,符型字段而,不,不是数值型,字,字段。,Logistic,回归建立一,组,组方程,把,输,输入属性值,与,与输出字段,每,每一类的概,率,率联系起来,。,。一旦生成,模,模型,便可,用,用于估计新,记,记录属于某,类,类的概率。,概,概率最大的,目,目标类被指,定,定为该记录,的,的预测输出,值,值,。,逻辑回归算,法,法具有训练,集,集和测试集,预,预测准确率,的,的差异是最,小,小的优点,能给出用户,属,属于某类型,概,概率,可精,确,确控制用户,群,群大小,对有缺失值,的,的记录不能,给,给出预测概,率,率,模型自变量,之,之间可能存,在,在多重共线,性,性干扰,业务可解释,性,性较决策树,差,差,优点,缺点,逻辑回归算,法,法具有训练,集,集和测试集,预,预测准确率,的,的差异是最,小,小可以精确,控,控制筛选用,户,户群大小的,优,优点,同,时,时我们采用,缺,缺失值处理,、,、相关性分,析,析可以规避,算,算法的缺点,,,,优先选用,逻,逻辑回归算,法,法。,比较模型预,测,测效果,选,择,择预测效果,较,较佳分类算,法,法,模型,比较,结论,正常低网龄,用,用户流失采,用,用预警分类,算,算法,在网2月新,增,增用户流失,预,预警模型,采用,SPSS,和,CLEMENTINE,作为数据分,析,析和建模工,具,具,分别采用逻,辑,辑回归算法,和,和决策树算,法,法建模,比,较,较模型预测,效,效果,确定,使,使用逻辑回,归,归算法,基本情况,语音通话情况,数据业务使用情况,品牌,ARPU,余额,套餐名称,本地通话次数,长途通话次数,漫游通话次数,数据业务费用,数据业务消费占比,数据业务使用种类数,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,建模时间窗,口,口,测试时间窗,口,口,入网月份,取数月份,流失月份,流失观察月,份,份,建模变量,建模结果,余额,通话次数,套餐名称,本地被叫次,数,数,欠费金额,本地主叫次,数,数,网内通话对,端,端数,网外通话对,端,端数,彩铃订购标,志,志,通话时长大,于,于,5,分钟标志,多次充值标,志,志,欠费标志,ARPU,大于,0,标志,长途通话次,数,数,漫游通话次,数,数,新业务费,通话标志,包打套餐标,志,志,手机报费用,本地主叫通,话,话标志,拨打,10086,次数,重入网标志,所有的数据,经,经过对数变,换,换和标准化,变,变换,消除,不,不同变量和,不,不同月份对,模,模型的影响,逻辑回归算,法,法使用的方,法,法是进入法,,,,模型调整,变,变量的依据,是,是回归参数,的,的,Wald,检验,模型,拟,拟合优度的,评,评判标准时,是,是,-2,对数似然值,,,,值越小,,拟,拟合效果越,好,好,模型的结果,为,为对数流失,风,风险比的线,性,性拟合表达,式,式,应用模,型,型时输入为,用,用户当前在,建,建模变量上,的,的值,输出,为,为用户的流,失,失概率,下图展示了,建,建模变量的,重,重要性(调,整,整后的实际,建,建模变量),变量重要性,用户集:,09年07,月,月入网、08月仍然正,常,常的用户,;,模型筛选用,户,户:,通过模型筛,选,选出的用户,集,集中20%,的,的用户,,其中,,包含了用户,集,集中,52.2%,的,9,月流失用户,;,;,模型筛选用,户,户,9,月、,10,月和,11,月的流失率(模型准确,率,率)分别为,16%,、,34%,和,48%,,比用户集,中,中用户的流,失,失率(不使,用,用模型筛选,的,的准确率),提,提升度分别,为,为,2.4,、,2.5,和,3.2,倍。,52.2%,*,提升度,=,模型筛选用,户,户流失率,/,用户集中用,户,户流失率,考察模型筛,选,选用户三个,月,月流失情况,,,,模型准确,率,率为,48%,在网2月以,上,上新增用户,流,流失预警模,型,型,分别采用逻,辑,辑回归算法,和,和决策树算,法,法建模,比,较,较模型预测,效,效果,确定,使,使用逻辑回,归,归算法,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,建模时间窗,口,口,测试时间窗,口,口,建模变量,基本情况,语音通话情况,数据业务使用情况,品牌,ARPU,余额,套餐名称,月数据,时间段变化趋势数据,月数据,时间段变化趋势数据,本地通话次数,长途通话次数,漫游通话次数,本地通话次数波动率,长途通话次数波动率,漫游通话次数波动率,数据业务费用,数据业务消费占比,数据业务使用种类数,数据业务费用波动率,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,建模结果,余额,本地被叫通,话,话次数,欠费金额,本地被叫次,数,数波动率,通话标志,通话时长大,于,于,5,分钟标志,多次充值标,志,志,其他费用,本地主叫次,数,数波动率,新业务费,通话次数,月租费,ARPU,彩铃订购标,志,志,长途通话次,数,数,漫游通话次,数,数,本地主叫次,数,数,所有的数据,经,经过对数变,换,换和标准化,变,变换,消除,不,不同变量和,不,不同月份对,模,模型的影响,回归分析方,法,法和参数设,置,置同在在网,2,月新增用户,流,流失预警模,型,型,模型的结果,为,为对数流失,风,风险比的线,性,性拟合表达,式,式,用户余额、,本,本地被叫通,话,话次数、欠,费,费金额、本,地,地被叫次数,波,波动率、通,话,话标志、通,话,话时长大于,5,分钟标志变,量,量重要,变量重要性,模型预警20%的正常,用,用户,包含61%的下,月,月流失用户,用户集:,09年0,6,月,(包括,06,月)以前,入网、08,月,月仍然正常,的,的用户,;,模型筛选用,户,户:,通过模型筛,选,选出的用户,集,集中20%,的,的用户,,其中,,包含了用户,集,集中,61.4%,的,9,月流失用户,;,;,模型筛选用,户,户,9,月、,10,月和,11,月的流失率(模型准确,率,率)分别为,26.7%,、,36%,和,43%,,比用户集,中,中用户的流,失,失率(不使,用,用模型筛选,的,的准确率),提,提升度分别,为,为,3.4,、,2.7,和,2.3,倍。,61.4%,*,提升度,=,模型筛选用,户,户流失率,/,用户集中用,户,户流失率,在网1月新,增,增用户流失,预,预警模型,在网,1,月新增用户,没,没有月数据,,,,只有日数,据,据,由于系,统,统只保留最,近,近,3,月的日数据,,,,,9,月的日数据,不,不完整,,11,月的新增用,户,户不能判定,用,用户流失,,只,只能取,10,月新增用户,的,的日数据为,建,建模数据集,用户的样本,量,量小,考虑,到,到决策树算,法,法如使用交,叉,叉验证,能,一,一定程度上,弥,弥补样本量,小,小的不足,,采,采用决策树,算,算法作为预,警,警建模算法,建模时间窗,口,口,建模变量,基本情况,语音通话情况,数据业务使用情况,品牌,ARPU,余额,套餐名称,日均数据,时间段日数据,/,变化趋势数据,日均数据,时间段变化趋势数据,本地通话次数,长途通话次数,漫游通话次数,本地通话次数波动率,长途通话次数波动率,漫游通话次数波动率,短信条数,彩信条数,GPRS,流量,短信条数波动率,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,入网时间在,10,月,125,日的用户从,入,入网当天直,到,到,10,月底的日数,据,据,建模结果,余额,品牌,手机报费用,套餐名称,日均长途通,话,话次数,月租费,日均本地被,叫,叫通话次数,充值次数,日均漫游通,话,话次数,包打套餐标,志,志,本地通话次,数,数波动率,手机邮箱标,志,志,新业务费,多次充值标,志,志,彩铃订购标,志,志,手机报订购,标,标志,本地主叫次,数,数波动率,重入网标志,外网通话对,端,端数波动率,通话大于,5,分钟标志,通话标志,短信发送条,数,数波动率,模型使用了,交,交叉验证,模型的结果,为,为决策树,,应,应用模型后,的,的输出为用,户,户流失的置,信,信度,用户余额、,品,品牌、手机,报,报费用、套,餐,餐名称、日,均,均长途通话,次,次数、月租,费,费、日均本,地,地被叫通话,次,次数变量重,要,要,变量重要性,模型预测效,果,果评估,由于没有,11,月的数据可,用,用于测试,12,月流失情况,,,,使用建模,数,数据集评估,模,模型拟合效,果,果,从收益图来,看,看,模型筛,选,选了,20%,的,10,月新增用户,,,,包含了,50%,的,11,月流失用户,筛选,40%,的的,10,月新增用户,,,,包含了,74%,的,11,月流失用户,74%,50%,模型应用流,程,程,新增用户和,高,高价值用户,当前在网用,户,户,定义候选用,户,户,识别正常用,户,户,渠道养卡用,户,户识别模型,跳蚤用户识,别,别模型,筛选流失预,警,警用户,用户细分模,型,型,根据不同用,户,户特征,采,用,用适宜的挽,留,留策略,了解用户特,征,征,在网,1,月新增用户,流,流失预警模,型,型,在网,2,月新增用户,流,流失预警模,型,型,在网,2,月以上新增,用,用户流失预,警,警模型,高价值用户,流,流失预警模,型,型,高价值用户,用,用户细分模,型,型,在网,1,月新增用户,细,细分模型,在网,2,月以上新增,用,用户细分模,型,型,维,系,系,方,案,案,正常低网龄,用,用户维系措,施,施,正常低网龄,用,用户维系,在网异动用,户,户,流失高危用,户,户,财务捆绑:,预,预存话费送,话,话费(高额,度,度),用户忠诚度,计,计划,网龄营销(,财,财务捆绑),服务捆绑,用户归位,,主,主动引导用,户,户归位至适,合,合其自身消,费,费的品牌和,资,资费套餐;,优惠补卡;,账户低余,额,额时充值,提,提醒;,主卡付费,+,亲情网,同一细分,群,群的流失,高,高危用户,和,和在网异,动,动用户采,用,用同一类,型,型的捆绑,政,政策,但,在,在力度上,会,会有所差,异,异。,业务捆绑,:,:预存送,本,本地长途,通,通话分钟,数,数,业务捆绑,:,:预存送,本,本地通话,分,分钟数(,高,高额度),财务捆绑,:,预存话费,送,送话费(,中,中低额度,),),业务捆绑,:,:专项预,存,存,-,高价值数,据,据业务套,餐,餐优惠,业务捆绑,:,:专项预,存,存,-,短信套餐,捆,捆绑,业务捆绑,:,:专项预,存,存,-GPRS,套餐捆绑,业务捆绑,:,:预存送,漫,漫游主叫,通,通话分钟,数,数,业务捆绑,:,:专项预,存,存,-,数据业务,套,套餐优惠,业务捆绑,:,:预存送,本,本地通话,分,分钟数(,低,低额度),商务高端,用,用户群,长途话务,突,突出群,本地话务,突,突出群,本地低端,用,用户群,数据业务,发,发烧群,短信偏好,用,用户群,GPRS,偏好用户,群,群,漫游突出,用,用户群,数据业务,兴,兴趣群,本地话务,偏,偏好群,全用户,谢,谢,谢 !,9,、,静,静,夜,夜,四,四,无,无,邻,邻,,,,,荒,荒,居,居,旧,旧,业,业,贫,贫,。,。,。,。2022/12/182022/12/18,Sunday,December18,2022,10,、,雨,雨,中,中,黄,黄,叶,叶,树,树,,,,,灯,灯,下,下,白,白,头,头,人,人,。,。,。,。2022/12/182022/12/182022/12/18,12/18/20222:24:25AM,11,、以,我,我独,沈,沈久,,,,愧,君,君相,见,见频,。,。2022/12/182022/12/182022/12/18,Dec-2218-Dec-22,12,、故,人,人江,海,海别,,,,几,度,度隔,山,山川,。,。2022/12/182022/12/182022/12/18,Sunday,December18,2022,13,、乍,见,见翻,疑,疑梦,,,,相,悲,悲各,问,问年,。,。2022/12/182022/12/182022/12/182022/12/18,12/18/2022,14,、他乡,生,生白发,,,,旧国,见,见青山,。,。18,十,十二月20222022/12/182022/12/182022/12/18,15,、比,不,不了,得,得就,不,不比,,,,得,不,不到,的,的就,不,不要,。,。,。,。十二,月,月222022/12/182022/12/182022/12/18,12/18/2022,16,、行,动,动出,成,成果,,,,工,作,作出,财,财富,。,。2022/12/182022/12/18,18 December 2022,17,、做前,能,够,够环视四周,;,;做时,你,只,只能或者最,好,好沿着以脚,为,为起点的射,线,线向前。2022/12/182022/12/182022/12/182022/12/18,9,、没有失败,,,,只有暂时,停,停止成功!,。,。2022/12/182022/12/18,Sunday, December 18,2022,10,、很多事情,努,努力了未必,有,有结果,但,是,是不努力却,什,什么改变也,没,没有。2022/12/182022/12/182022/12/18,12/18/20222:24:25 AM,11,、成功就是,日,日复一日那,一,一点点小小,努,努力的积累,。,。2022/12/182022/12/182022/12/18,Dec-2218-Dec-22,12,、世间成,事,事,不求,其,其绝对圆,满,满,留一,份,份不足,,可,可得无限,完,完美。2022/12/182022/12/182022/12/18,Sunday,December18,2022,13,、不知香,积,积寺,数,里,里入云峰,。,。2022/12/182022/12/182022/12/182022/12/18,12/18/2022,14,、意志坚,强,强的人能,把,把世界放,在,在手中像,泥,泥块一样,任,任意揉捏,。,。18 十,二,二月 20222022/12/182022/12/182022/12/18,15,、楚塞三,湘,湘接,荆,门,门九派通,。,。十二月222022/12/182022/12/182022/12/18,12/18/2022,16,、少年十,五,五二十时,,,,步行夺,得,得胡马骑,。,。2022/12/182022/12/18,18 December2022,17,、,空,空,山,山,新,新,雨,雨,后,后,,,,,天,天,气,气,晚,晚,来,来,秋,秋,。,。,。,。2022/12/182022/12/182022/12/182022/12/18,9,、,杨,杨,柳,柳,散,散,和,和,风,风,,,,,青,青,山,山,澹,澹,吾,吾,虑,虑,。,。,。,。2022/12/182022/12/18,Sunday,December18,2022,10,、,阅,阅,读,读,一,一,切,切,好,好,书,书,如,如,同,同,和,和,过,过,去,去,最,最,杰,杰,出,出,的,的,人,人,谈,谈,话,话,。,。2022/12/182022/12/182022/12/18,12/18/20222:24:25AM,11,、越是,没,没有本,领,领的就,越,越加自,命,命不凡,。,。2022/12/182022/12/182022/12/18,Dec-2218-Dec-22,12,、越是,无,无能的,人,人,越,喜,喜欢挑,剔,剔别人,的,的错儿,。,。2022/12/182022/12/182022/12/18,Sunday, December 18,2022,13,、知人,者,者智,,自,自知者,明,明。胜,人,人者有,力,力,自,胜,胜者强,。,。2022/12/182022/12/182022/12/182022/12/18,12/18/2022,14,、意志,坚,坚强的,人,人能把,世,世界放,在,在手中,像,像泥块,一,一样任,意,意揉捏,。,。18,十,十二月20222022/12/182022/12/182022/12/18,15,、最,具,具挑,战,战性,的,的挑,战,战莫,过,过于,提,提升,自,自我,。,。十二,月,月222022/12/182022/12/182022/12/18,12/18/2022,16,、业,余,余生,活,活要,有,有意,义,义,,不,不要,越,越轨,。,。2022/12/182022/12/18,18December2022,17,、一,个,个人,即,即使,已,已登,上,上顶,峰,峰,,也,也仍,要,要自,强,强不,息,息。2022/12/182022/12/182022/12/182022/12/18,MOMODA POWERPOINT,Lorem ipsum dolor sit, eleifend nulla ac, fringilla purus. Nulla iaculis tempor felis amet, consectetur adipiscing elit. Fusce id urna blanditut cursus.,感谢,您,您的,下,下载,观,观看,专家,告,告诉,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 营销创新


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!