某运营商数据挖掘项目汇报

上传人:633****35 文档编号:253020801 上传时间:2024-11-27 格式:PPTX 页数:38 大小:1.10MB
返回 下载 相关 举报
某运营商数据挖掘项目汇报_第1页
第1页 / 共38页
某运营商数据挖掘项目汇报_第2页
第2页 / 共38页
某运营商数据挖掘项目汇报_第3页
第3页 / 共38页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2021/2/8,#,某运营商数据挖掘项目汇报,_,新增用户维系,2010,年,3,月,新增用户维系基本流程,1,、采用生存分析法,对有流失倾向的用户进行提前预警,并可根据用户流失概率的高低划定预警级别,流失高危用户群,在网异动用户群,正常用户群,异动预警监控,1,、维系策略方案生成,渠道养卡监管措施,重入网与反复用户管控措施,正常低网龄用户维系措施,2,、维系方案实施,营销案实施流程,维系渠道,维系方式,维系策略及方案,1,、维系情况反馈,2,、目标达成情况,3,、维系效果评估:,渠道养卡识别及监管,重入网与反复重入网,正常低网龄用户维系,维系效果评估,1,、新增用户分群:,渠道养卡,重入网与反复重入网用户,正常低网龄用户细分,根据正常低网龄用户偏好进行细分,新增用户分群,建立新增用户维系闭环管理体系,准确分群,分级预警,制定针对性的维系策略和方案并实施,实现新增用户保有。,渠道养卡识别与监控,重入网与反复重入网管理,正常低网龄用户维系,新增用户维系,柳州渠道养卡行为特征及监控思路建议,产品:,渠道养卡一般选择无月租或最低月租的产品,以降低养卡的成本,研究发现柳州,2,种类型产品均被渠道选择使用,ARPU,:,渠道养卡号码消费额一般较低,研究发现柳州养卡号码月均消费一般低于,15,元,主叫时长:,渠道养卡号码主叫时长非常低,研究发现柳州有,70%,以上无通话行为,有通话行为用户主叫时长主要集中在,3,分钟以内,用户状态:,研究发现柳州渠道养卡新增号码停机流失高峰出现在入网后的第,1-3,个月,消费情况:,同一个渠道发展的养卡号码中,出现多个号码消费行为一致的情况,如多个号码入网当月和次月消费完全一致,激活,IMEI,:,养卡号码在激活时,一般用同一个手机激活,因此养卡号码中大量号码的激活,IMEI,一致,柳州渠道养卡行为特征,制定疑似养卡渠道的判断规则:从渠道发展用户的产品、,ARPU,、用户状态进行判断,当用户数占比符合一定标准后,即判断为疑似养卡渠道;,制定疑似养卡号码的判断规则:从用户消费情况、激活,IMEI,等进行判断,符合一定标准的号码为疑似养卡号码;,分析疑似养卡渠道的养卡号码量,计算养卡号码占其当月新发展的比,并按各渠道此比例排序,养卡行为监控思路建议,通过研究发现柳州渠道养卡行为特征及监控思路建议如下:,以上判断标准,都以同一渠道发展的用户作为判断基础数据;,判断步骤是首先判断疑似养卡渠道,在判断其为疑似养卡渠道后,统计其疑似养卡号码数量,对养卡号码的判断模型是对渠道养卡违规行为进行分析的基础,需要在执行中进一步分析、调研完善优化判断规则,提升判断准确率。,疑似养卡渠道和养卡号码判断规则,疑,似,养,卡,渠,道,产品:,渠道新增用户中,,30%,以上的用户都为两广情零听计划或都市“零听”计划二,该渠道为疑似养卡渠道,主叫时长,:渠道新增用户中,,50%,以上或,100,人以上的用户入网当月和次月主叫时长在,3,分钟内,该渠道为疑似养卡渠道,用户状态:,渠道新增用户中,入网后在第,3,个月,,30%,以上的用户状态为停机流失,该渠道为疑似养卡渠道,疑,似,养,卡,号,码,消费情况,:,a.,出现,5,个或以上号码号码入网当月和次月主叫时长都在,3,分钟内;,b.,或出现,5,个或以上号码号码入网当月和次月消费在,5,元以内;,c.,或出现,2,个以上号码入网当月或次月应收费完全一致,,这些号码为疑似养卡号码,激活情况:,a.,出现,5,个或以上号码号码激活,IMEI,一致,;,b.,或,2,个或以上号码登记身份证号一致,这些号码为疑似养卡号码,ARPU,:,渠道新增用户中,,30%,以上或,100,人以上的用户入网当月和次月,ARPU,低于,5,元,该渠道为疑似养卡渠道,渠道养卡识别与监控,重入网与反复重入网管理,正常低网龄用户维系,新增用户维系,重入网与反复重入网(跳蚤)用户识别规则,N,N+1,N-6,N-4,N-5,N-2,N-3,N-1,新入网激活月,新入网激活后第,1,月,新入网激活月前半年的存量用户历史,IMEI,库或身份证库,N,月在网用户,区分新增和存量用户,判断重入网用户,判断新入网用户的有效,IMEI,或身份证号码,N,月新入网用户中的重入网和反复重入网用户名单,剔除无效,IMEI,或身份证号码,生成、维护历史有效,IMEI,库或身份证号库,重入网:,新用户,IMEI,或身份证号与历史,IMEI,或身份证号码能够匹配(,6,个月以内)。如,,9,月新入网用户,IMEI,或身份证号与,3,月到,8,月用户,IMEI,或身份证号码库匹配后,得到,9,月新入网用户中重入网用户。,反复重入网(跳蚤用户):,重入网用户在,6,个月以内重入网,2,次及,2,次以上的用户。,识别规则:,通过对新入网用户使用手机的,IMEI,号(或身份证号码)与存量用户的,IMEI,号历史库(或身份证号码历史库)进行分析识别出重入网和反复重入网用户。,为了提高分析结果的准确率,每月定期对上月新入网的用户(上月入网并激活的用户)进行分析。分析示意如下:用户在,N,月入网并激活(有话单产生),则在,N+1,月(计算月)对,N,月入网并激活的所有用户进行重入网分析。,用户重入网主要原因分析,产品,价格,促销,/,宣传,渠道,产品线过长,产品重叠较多,目标用户群存在较多交叉,不同品牌及资费存在内部竞争,产品价格调整比较频繁,而且在价格调整过程中没有考虑产品体系间的平衡问题,预存费用低,用户入网门槛不高,使其可以轻易弃卡,新入网促销活动优惠力度过大,品牌及资费资费套餐互转门槛过高,停机保号、套餐互转等宣传不足,部分社会渠道迫于指标压力或利益驱动,诱导用户换卡,社会渠道虚假激活,通过养卡恶意套取酬金,追求经济收益,受入网优惠的吸引,换取吉祥号码,欠费,竞争对手以低资费、大力度的优惠活动吸引用户,但整体质量未能让用户满意,从而使用户在短暂离(移动)网后重新入网,公司内部,竞争对手,用户,服务,补卡成本高,手续复杂,补卡不如买新卡,欠费提醒不及时,欠费后被停机,选择重入网,从产品、促销、渠道、传播、服务等多方面入手加强重入网与反复重入网管理,降低重入网比率,重入网与反复重入网管理措施,加强入网促销活动管理,减少促销活动对在网用户的干扰;,提高入网首次预存费用,增加在网时长;,用户忠诚度管理:网龄营销。,产品,/,促销,传播,渠道,服务,加强(社会)渠道掌控,规范渠道行为,减少系统性离网行为。,采用户外广告、报纸等大众媒体及营业厅、,10086,短信、网站、,WAP,等自有媒体体开展网龄营销、优惠补卡及带号转品牌、套餐、停机保号等的传播。,加强欠费管理,减少无效欠费;,主卡付费,+,亲情网;,账户低余额时充值提示;,优惠或免费补卡;,推荐带号转品牌或带号转套餐。,渠道养卡识别与监控,重入网与反复重入网管理,正常低网龄用户维系,新增用户维系,正常,低,低网,龄,龄用,户,户维,系,系基,本,本策,略,略,剔除,了,了渠,道,道养,卡,卡用,户,户和,反,反复,重,重入,网,网用,户,户后,所,所获,得,得的,正,正常,低,低网,龄,龄用,户,户是,新,新增,用,用户,流,流失,控,控制,的,的重,点,点。,运,运用,数,数据,挖,挖掘,方,方法,,,,识,别,别出,不,不同,流,流失,预,预警,级,级别,的,的用,户,户,,针,针对,高,高危,用,用户,和,和异,动,动用,户,户分,别,别采,取,取针,对,对性,的,的营,销,销捆,绑,绑手,段,段进,行,行维,系,系,,同,同时,结,结合,网,网龄,营,营销,,,,延,长,长用,户,户生,命,命周,期,期。,正常,低,低网,龄,龄用,户,户分,群,群,用户,重绑,:,:,针对,高,高危,用,用户,在,在网,黏,黏性,已,已很,弱,弱的,特,特点,,,,采,取,取较,大,大力,度,度的,营,营销,捆,捆绑,策,策略,,,,以,返,返还,周,周期,短,短的,财,财务,捆,捆绑,和,和力,度,度较,大,大的,业,业务,捆,捆绑,为,为主,,,,以,服,服务,捆,捆绑,为,为辅,。,。,力保,:,:,针对,异,异动,用,用户,尚,尚处,于,于流,失,失犹,豫,豫期,、,、还,具,具有,一,一定,黏,黏性,的,的特,点,点,,维,维系,策,策略,将,将以,强,强化,用,用户,的,的业,务,务黏,性,性为,重,重点,,,,以,业,业务,捆,捆绑,和,和较,长,长返,还,还周,期,期的,财,财务,捆,捆绑,为,为主,,,,以,服,服务,捆,捆绑,为,为辅,。,。,全用,户,户常,规,规保,有,有(,不,不研,究,究),。,。,细分,用,用户,群,群,基本,策,策略,流失,高,高危,用户,在网,异,异动,用户,相对,稳,稳定,用户,多级,预,预警,,,,多,级,级维,系,系,在模,型,型挖,掘,掘的,基,基础,上,上,,准,准确,判,判别,正,正常,低,低网,龄,龄用,户,户的,流,流失,倾,倾向,,,,根,据,据用,户,户流,失,失概,率,率的,高,高低,分,分别,实,实施,针,针对,性,性的,维,维系,策,策略,和,和措,施,施,,对,对可,能,能流,失,失的,用,用户,提,提前,预,预防,,,,多,级,级维,系,系,,有,有效,地,地防,止,止用,户,户流,失,失。,流失异动用户,营销捆绑,日常维系及,异动监控,办理,未办理,模型匹配,低网龄用户,流失高危用户,是否流失,流失,未流失,1,1,2,一级,匹,匹配,和,和维,系,系;,二,二,级,级匹,配,配和,维,维系,。,。,1,2,正常,低,低网,龄,龄用,户,户细,分,分、,预,预警,及,及维,系,系框,架,架,精准,营,营销,模,模型,新增,用,用户,细,细分,模,模型,用户,价,价值,在网,时,时长,渠道,偏,偏好,促销,偏,偏好,用户,号,号码,消费,特,特征,用户,清,清单,话费,余,余额,新增,网,网用,户,户流,失,失模,型,型,商务,高,高端,用,用户,群,群,长途,话,话务,突,突出,群,群,本地,话,话务,突,突出,群,群,本地,低,低端,用,用户,群,群,数据,业,业务,发,发烧,群,群,漫游,突,突出,用,用户,群,群,数据,业,业务,兴,兴趣,群,群,本地,话,话务,偏,偏好,群,群,在网,异,异动,用,用户,流失,高,高危,用,用户,长途,话,话务,突,突出,群,群,本地,话,话务,突,突出,群,群,本地,低,低端,用,用户,群,群,漫游,突,突出,用,用户,群,群,数据,业,业务,突,突出,群,群,本地,话,话务,偏,偏好,群,群,当月,新,新增,用,用户,其他,新,新增,用,用户,营销,案,案,用户,流,流失,预,预警,和,和细,分,分建,模,模过,程,程,流失,现,现状,分,分析,流失,原,原因,分,分析,流失,用,用户,特,特征,分,分析,流失,预,预警,建,建模,目,目标,沟,沟通,确,确定,流失,细,细分,模,模型,目,目标,沟,沟通,确,确定,根据,建,建模,要,要求,和,和现,有,有数,据,据情,况,况,,构,构思,、,、沟,通,通和,确,确定,建,建模,数,数据,提,提取,需,需求,提取,09,年,1-10,月新,增,增用,户,户在,1-10,月的,自,自然,属,属性,和,和消,费,费行,为,为数,据,据,提取,09,年,10,月新,增,增用,户,户在,10,月的,日,日消,费,费行,为,为数,据,据,数据,质,质量,审,审核,数据,探,探索,非正,常,常用,户,户的,剔,剔除,。,。根,据,据渠,道,道养,卡,卡和,跳,跳蚤,用,用户,识,识别,模,模型,提,提取,异,异常,用,用户,数据,抽,抽样,。,。确,定,定建,模,模用,户,户集,合,合,建模,衍,衍生,变,变量,计,计算,。,。根,据,据提,取,取的,基,基础,数,数据,宽,宽表,计,计算,衍,衍生,变,变量,建模,变,变量,筛,筛选,特征,建,建模,分,分析,卡方,分,分析,方差,分,分析,双变,量,量分,析,析,Pearson,相关,分,分析,wald,显著,性,性检,验,验,量重,要,要性,分,分析,建模,变,变量,数,数据,转,转换,对数,变,变换,标准,化,化变,换,换,确定,建,建模,用,用户,集,集,确定,建,建模,用,用户,数,数据,集,集,采用,TwoStep,聚类,算,算法,,,,建,立,立用,户,户细,分,分模,型,型,月数,据,据用,户,户细,分,分模,型,型(,高,高价,值,值,用,用户,和,和在,网,网,2,月及,2,月以,上,上的,新,新增,用,用户,细,细分,日数,据,据用,户,户细,分,分模,型,型(,在,在网,1,月新,增,增用,户,户细,分,分),业务,解,解释,聚,聚类,结,结果,,,,调,整,整模,型,型参,数,数和,建,建模,变,变量,,,,直,到,到得,到,到满,意,意结,果,果,确定,建,建模,用,用户,集,集,确定,建,建模,用,用户,数,数据,集,集,采用,逻,逻辑,回,回归,和,和决,策,策树,算,算法,建,建立,流,流失,预,预警,模,模型,在,网,网,2,月,新,新,增,增,用,用,户,户,流,流,失,失,预,预,警,警,模,模,型,型,在,网,网,2,月,以,以,上,上,新,新,增,增,用,用,户,户,流,流,失,失,预,预,警,警,模,模,型,型,在,网,网,1,月,新,新,增,增,用,用,户,户,流,流,失,失,预,预,警,警,模,模,型,型,采,用,用,生,生,存,存,分,分,析,析,算,算,法,法,建,建,立,立,高,高,价,价,值,值,用,用,户,户,流,流,失,失,预,预,警,警,模,模,型,型,模,型,型,的,的,评,评,估,估,提,升,升,图,图,、,、,收,收,益,益,图,图,混,淆,淆,矩,矩,阵,阵,。,。,准,准,确,确,率,率,和,和,查,查,全,全,率,率,模,型,型,的,的,优,优,化,化,建,模,模,训,训,练,练,集,集,比,比,例,例,异,常,常,值,值,处,处,理,理,建,模,模,变,变,量,量,建,模,模,方,方,法,法,模,型,型,参,参,数,数,显,著,著,性,性,检,检,验,验,方,方,法,法,显,著,著,性,性,检,检,验,验,变,变,量,量,剔,剔,除,除,阈,阈,值,值,树,的,的,深,深,度,度,和,和,页,页,节,节,点,点,记,记,录,录,个,个,数,数,业务与数据 分析,数据准备,建模准备,细分模型,预警模型,模型评估和优化,数,据,据,提,提,取,取,数,据,据,清,清,洗,洗,数,据,据,审,审,核,核,数,据,据,集,集,成,成,数,据,据,挖,挖,掘,掘,宽,宽,表,表,构,构,建,建,缺,失,失,数,数,据,据,处,处,理,理,极,值,值,数,数,据,据,处,处,理,理,错,误,误,数,数,据,据,处,处,理,理,冗,余,余,数,数,据,据,处,处,理,理,数,据,据,统,统,计,计,错,错,误,误,审,审,核,核,数,据,据,源,源,错,错,误,误,审,审,核,核,数,据,据,统,统,计,计,口,口,径,径,审,审,核,核,数,据,据,准,准,备,备,确,确,保,保,建,建,模,模,数,数,据,据,的,的,完,完,整,整,性,性,、,、,可,可,用,用,性,性,和,和,完,完,整,整,性,性,提,取,取,建,建,模,模,所,所,需,需,数,数,据,据,数,据,据,准,准,备,备,筛,选,选,建,建,模,模,变,变,量,量,、,、,根,根,据,据,模,模,型,型,要,要,求,求,进,进,行,行,数,数,据,据,变,变,换,换,建,模,模,准,准,备,备,字段过滤,变异系数,标准差,最大类别数,最小类别数,数据探索,数据分布,双变量分析,正态性检验,相关性分析,卡方分析,方差分析,相关分析,自相关分析,建模筛选,通过建模分析字段的重要性,决策树模型,信息增益旁别,逻辑回归模型,回归系数显著性检验,数据变换,标准化变换,对数变换,正态变换,经,分,分,数,数,据,据,挖,掘,掘,宽,宽,表,表,变,量,量,转,转,换,换,变,量,量,筛,筛,选,选,健,康,康,度,度,建,建,模,指,指,标,标,库,库,变,量,量,清,清,洗,洗,用,户,户,细,细,分,分,采,采,用,用,凝,凝,聚,聚,层,层,次,次,聚,聚,类,类,算,算,法,法,选,择,择,初,始,始,化,化,更,新,新,结,束,束,计,算,算,包,包,含,含,每,每,对,对,样,样,本,本,间,间,距,距,离,离,(,(,如,如,欧,欧,氏,氏,距,距,离,离,),),的,的,相,相,似,似,矩,矩,阵,阵,,,,,把,把,每,每,个,个,样,样,本,本,作,作,为,为,一,一,个,个,簇,簇,使,用,用,相,相,似,似,矩,矩,阵,阵,查,查,找,找,最,最,相,相,似,似,的,的,两,两,个,个,簇,簇,将,两,两,个,个,簇,簇,合,合,并,并,为,为,一,一,个,个,簇,簇,,,,,簇,簇,的,的,个,个,数,数,通,通,过,过,合,合,并,并,被,被,更,更,新,新,;,;,同,同,时,时,更,更,新,新,相,相,似,似,矩,矩,阵,阵,,,,,将,将,两,两,个,个,簇,簇,的,的,两,两,行,行,(,(,两,两,列,列,),),距,距,离,离,用,用,1,行(,1,列)距,离,离替换,反,反映合,并,并操作,。,。,当所有,样,样本都,合,合并成,一,一个簇,或,或满足,指,指定的,簇,簇的数,目,目时,,整,整个过,程,程结束,。,。,层次聚,类,类可以,分,分为两,种,种:凝,聚,聚的方,式,式和分,割,割的方,式,式,凝,聚,聚是一,种,种至底,向,向上的,方,方法,,将,将每一,条,条记录,看,看作一,个,个类,,然,然后根,据,据一些,规,规则将,他,他们聚,合,合成越,来,来越大,的,的类,,直,直到满,足,足一些,预,预先设,定,定的条,件,件。,1,2,3,4,执行,n-1,次步骤,2,和步骤,3,网龄2,月,月及以,上,上新增,用,用户细,分,分模型,采用,SPSS,及,CLEMENTINE,作为数,据,据分析,与,与聚类,建,建模工,具,具,算法为,TwoStep,聚类算,法,法,使用细,分,分矩阵,,,,按照,语,语音消,费,费行为,和,和数据,业,业务消,费,费行为,两,两次聚,类,类的方,法,法分别,聚,聚类,,多,多维聚,类,类的方,法,法较传,统,统单维,聚,聚类方,法,法,聚,类,类后的,用,用户细,分,分特征,更,更明显,聚类数,据,据集为,2009,年,1-9,月新增,用,用户入,网,网后第,二,二个月,,,,且第,二,二月状,态,态正常,的,的用户,的,的基础,数,数据和,消,消费行,为,为数据,数据在,聚,聚类前,需,需进行,标,标准化,变,变换和,极,极值处,理,理,本地通,话,话次数,长途通,话,话次数,计费通,话,话时长,漫游通,话,话次数,ARPU,低端,中低端,长途突,出,出,本地突,出,出,漫游突,出,出,商务,GPRS,流量,新业务,费,费,新业务,使,使用种,类,类数,彩信条,数,数,短信条,数,数,新业务,费,费占比,使用,少,占比高,兴趣,短信突,出,出,上网突,出,出,发烧友,细分群,主,主要消,费,费行为,特,特征(,网,网龄=2个,月,月)-1,序号,细分群名称,细分群特征,规模占比,1,商务高端用户群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;,ARPU,最高为,240,元,/,户以上,交往圈最大,本长漫语音话务均高,且每次通话时长较长,2.4%,2,漫游突出用户群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;,ARPU,为,85,元,/,户左右,经常去外地,漫游话务突出,本地及长途话务较少,且漫游通话频次最高,3.9%,3,长途话务突出群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;,ARPU,为,120,元,/,户左右,交往圈中有大量外地号码,长途话务突出,漫游很少,且长途通话频次最高,7.6%,4,本地话务突出群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;,ARPU,为,120,元,/,户左右,交往圈主要集中在本地,本地话务突出,长途漫游较少,且本地通话频次最高,4.7%,5,本地话务偏好群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;,ARPU,为,67,元,/,户左右,交往圈主要集中在本地,通话时长相对较低,但本地话务相对突出,长途漫游很少,14.8%,6,本地低端用户群,语音和数据业务消费行为均较低,用消费户行为相对均衡;,ARPU,较低为,30,元,/,户左右,很少去外地,漫游和长途时长比例最低,平均每次通话时长最短,33.5%,序号,细分群名称,细分群特征,规模占比,7,短信突出用户群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;,ARPU,为,40,元,/,户左右,数据业务消费占比高于,50%,,主要使用短信业务,且短信上行条数最高,8.0%,8,GPRS,突出用户群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;,ARPU,为,30,元,/,户左右,数据业务消费占比高于,50%,,,GPRS,流量高,其他数据业务使用较少,8.1%,9,数据业务兴趣群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;,ARPU,为,20,元,/,户左右,订购数据业务种类最多,但消费不高,数据业务费用占比高于,50%,13.3%,10,数据业务发烧群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;,ARPU,为,65,元,/,户左右,订购数据业务种类最多,且数据业务消费最高, 占比高达,67%,3.9%,细分群,主,主要消,费,费行为,特,特征(,网,网龄=2个,月,月)-2,网龄1,月,月新增,用,用户细,分,分模型,采用,SPSS,及,CLEMENTINE,作为数,据,据分析,与,与聚类,建,建模工,具,具,算法为,TwoStep,聚类算,法,法,使用细,分,分矩阵,,,,按照,语,语音消,费,费行为,和,和数据,业,业务消,费,费行为,两,两次聚,类,类的方,法,法分别,聚,聚类,,多,多维聚,类,类的方,法,法较传,统,统单维,聚,聚类方,法,法,聚,类,类后的,用,用户细,分,分特征,更,更明显,聚类数,据,据集为,2009,年,10,月,125,日入网,,,,,11,月,1,日之前,未,未流失,的,的用户,从,从入网,当,当日至,月,月底的,日,日均消,费,费行为,数,数据,数据在,聚,聚类前,需,需进行,标,标准化,变,变换和,极,极值处,理,理,低端,中低端,长途突,出,出,本地突,出,出,商务,占比占,比,比,高,使用少,兴趣,上网突,出,出,发烧友,日均本,地,地通话,次,次数,日均长,途,途通话,次,次数,日均漫,游,游通话,次,次数,日均计,费,费通话,时,时长,日均,GPRS,流量,日均彩,信,信条数,日均短,信,信条数,新业务,使,使用,种,种类数,新业务,费,费占比,序号,细分群名称,细分群,特征,规模占比,1,漫游突出用户群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,100,元,/,户左右,经常去外地,漫游话务突出,本地及长途话务很少,且漫游通话频次最高,3.0%,2,长途话务突出群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,100,元,/,户左右,交往圈中有大量外地号码,长途话务突出,基本无漫游,且长途通话频次最高,4.5%,3,本地话务突出群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,75,元,/,户左右,交往圈主要集中在本地,本地话务突出,基本无漫游,长途很少,且本地通话频次最高,7.7%,4,本地话务偏好群,语音消费行为相对数据业务消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,55,元,/,户左右,交往圈主要集中在本地,通话时长相对较低,但本地话务相对突出,基本无漫游,长途很少,12.6%,5,本地低端用户群,语音和数据业务消费均较低,且二者消费相对均衡;入网当月,ARPU,为,25,元,/,户左右,主要在本地活动,本、长、漫通话时长均为最低,基本无数据业务使用量,36.7%,细分群,主,主要消,费,费行为,特,特征(,网,网龄1,个,个月)-1,序号,细分群名称,细分群,特征,规模占比,6,数据业务突出群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,30,元,/,户左右,订购数据业务种类最多,且数据业务消费占比高, 高达,79%,21.3%,7,GPRS,偏好用户群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;入网当月,ARPU,为,54,元,/,户左右,,GPRS,消费最高,远高于其他群,且数据业务消费占比高, 高达,77%,9.2%,8,短信突出用户群,数据业务消费行为相对语音消费行为更为突出,为用户主要行为属性;入当月,ARPU,为,80,元,/,户左右,数据业务消费占比为,65%,左右,日平均发送短信,10,条左右,主要使用短彩信业务,且短信和彩信上行条数均为最高,4.9%,细分群,主,主要消,费,费行为,特,特征(,网,网龄1,个,个月)-2,新增用,户,户中的,流,流失用,户,户超过,四,四分之,三,三的用,户,户生命,周,周期不,超,超过四,个,个月,,不,不具有,完,完整的,生,生命周,期,期特征,COX,生存分,析,析模型,,,,隐含,了,了一条,假,假设,,即,即在时,间,间越长,,,,其离,网,网的可,能,能性就,越,越大,,这,这样一,来,来,是,否,否离网,和,和在网,时,时间应,该,该是正,相,相关的,,,,,COX,模型在,拟,拟合的,时,时候,,会,会在这,个,个约束,之,之下,,所,所以其,对,对数据,的,的拟合,没,没有,LOGIT,效果好,因此对,新,新增用,户,户离网,预,预警,,采,采用,LOGIT,回归模,型,型或决,策,策模型,新增用,户,户中的,流,流失用,户,户有,76%,在入网,后,后的四,个,个月内,流,流失,流失用,户,户的,76%,是在入,网,网后的,四,四个月,内,内流失,分别有,22%,和,23%,的流失,用,用户在,入,入网后,的,的第一,个,个月和,第,第二月,内,内流失,数据来,源,源:,09,年,1,月,-10,月新增,用,用户,流失用,户,户定义,:,:当月,停,停机,,且,且连续,停,停机,60,天以上,用,用户,到,2009,年,11,月仍未,开,开机用,户,户,网龄举,例,例:,3,月入网,,,,,3,月流失,的,的用户,,,,网龄,为,为,0,个月,流失用,户,户的在,网,网时长,分,分布,决策树,预,预测模,型,型:决,策,策树是,以,以实例,为,为基础,的,的归纳,学,学习算,法,法,它,着,着眼于,从,从一组,无,无次序,、,、无规,则,则的实,例,例中推,理,理出以,决,决策树,表,表示的,分,分类规,则,则。它,采,采用自,顶,顶向下,的,的递归,方,方式,,在,在决策,树,树的内,部,部节点,进,进行属,性,性的比,较,较,并,根,根据不,同,同属性,值,值判断,从,从该节,点,点向下,的,的分支,,,,在决,策,策树的,叶,叶节点,得,得到结,论,论。,逻辑回,归,归预测,模,模型:,也,也称定,性,性变量,回,回归,,类,类似于,线,线性回,归,归,但,是,是目标,字,字段使,用,用字符,型,型字段,而,而不是,数,数值型,字,字段。,Logistic,回归建,立,立一组,方,方程,,把,把输入,属,属性值,与,与输出,字,字段每,一,一类的,概,概率联,系,系起来,。,。一旦,生,生成模,型,型,便,可,可用于,估,估计新,记,记录属,于,于某类,的,的概率,。,。概率,最,最大的,目,目标类,被,被指定,为,为该记,录,录的预,测,测输出,值,值,。,逻辑回,归,归算法,具,具有训,练,练集和,测,测试集,预,预测准,确,确率的,差,差异是,最,最小的,优,优点,能给出,用,用户属,于,于某类,型,型概率,,,,可精,确,确控制,用,用户群,大,大小,对有缺,失,失值的,记,记录不,能,能给出,预,预测概,率,率,模型自,变,变量之,间,间可能,存,存在多,重,重共线,性,性干扰,业务可,解,解释性,较,较决策,树,树差,优点,缺点,逻辑回,归,归算法,具,具有训,练,练集和,测,测试集,预,预测准,确,确率的,差,差异是,最,最小可,以,以精确,控,控制筛,选,选用户,群,群大小,的,的 优,点,点,同,时,时我们,采,采用缺,失,失值处,理,理、相,关,关性分,析,析可以,规,规避算,法,法的缺,点,点,优,先,先选用,逻,逻辑回,归,归算法,。,。,比较模,型,型预测,效,效果,,选,选择预,测,测效果,较,较佳分,类,类算法,模型,比较,结论,正常低,网,网龄用,户,户流失,采,采用预,警,警分类,算,算法,在网2,月,月新增,用,用户流,失,失预警,模,模型,采用,SPSS,和,CLEMENTINE,作为数,据,据分析,和,和建模,工,工具,分别采,用,用逻辑,回,回归算,法,法和决,策,策树算,法,法建模,,,,比较,模,模型预,测,测效果,,,,确定,使,使用逻,辑,辑回归,算,算法,基本情况,语音通话情况,数据业务使用情况,品牌,ARPU,余额,套餐名称,本地通话次数,长途通话次数,漫游通话次数,数据业务费用,数据业务消费占比,数据业务使用种类数,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,建模时,间,间窗口,测试时,间,间窗口,入网月,份,份,取数月,份,份,流失月,份,份,流失观,察,察月份,建模变,量,量,建模结,果,果,余额,通话次,数,数,套餐名,称,称,本地被,叫,叫次数,欠费金,额,额,本地主,叫,叫次数,网内通,话,话对端,数,数,网外通,话,话对端,数,数,彩铃订,购,购标志,通话时,长,长大于,5,分钟标,志,志,多次充,值,值标志,欠费标,志,志,ARPU,大于,0,标志,长途通,话,话次数,漫游通,话,话次数,新业务,费,费,通话标,志,志,包打套,餐,餐标志,手机报,费,费用,本地主,叫,叫通话,标,标志,拨打,10086,次数,重入网,标,标志,所有的,数,数据经,过,过对数,变,变换和,标,标准化,变,变换,,消,消除不,同,同变量,和,和不同,月,月份对,模,模型的,影,影响,逻辑回,归,归算法,使,使用的,方,方法是,进,进入法,,,,模型,调,调整变,量,量的依,据,据是回,归,归参数,的,的,Wald,检验,,模,模型拟,合,合优度,的,的评判,标,标准时,是,是,-2,对数似,然,然值,,值,值越小,,,,拟合,效,效果越,好,好,模型的,结,结果为,对,对数流,失,失风险,比,比的线,性,性拟合,表,表达式,,,,应用,模,模型时,输,输入为,用,用户当,前,前在建,模,模变量,上,上的值,,,,输出,为,为用户,的,的流失,概,概率,下图展,示,示了建,模,模变量,的,的重要,性,性(调,整,整后的,实,实际建,模,模变量,),),变量重,要,要性,用户集,:,:,09年07月,入,入网、08月,仍,仍然正,常,常的用,户,户,;,模型筛,选,选用户,:,:,通过模,型,型筛选,出,出的用,户,户集中20%,的,的用户,,其中,,,,,包含了,用,用户集,中,中,52.2%,的,9,月流失,用,用户;,模型筛选,用,用户,9,月、,10,月和,11,月的流失,率,率(模型准,确,确率)分别为,16%,、,34%,和,48%,,比用户,集,集中用户,的,的流失率,(,(不使用,模,模型筛选,的,的准确率,),)提升度,分,分别为,2.4,、,2.5,和,3.2,倍。,52.2%,*,提升度,=,模型筛选,用,用户流失,率,率,/,用户集中,用,用户流失,率,率,考察模型,筛,筛选用户,三,三个月流,失,失情况,,模,模型准确,率,率为,48%,在网2月,以,以上新增,用,用户流失,预,预警模型,分别采用,逻,逻辑回归,算,算法和决,策,策树算法,建,建模,比,较,较模型预,测,测效果,,确,确定使用,逻,逻辑回归,算,算法,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,建模时间,窗,窗口,测试时间,窗,窗口,建模变量,基本情况,语音通话情况,数据业务使用情况,品牌,ARPU,余额,套餐名称,月数据,时间段变化趋势数据,月数据,时间段变化趋势数据,本地通话次数,长途通话次数,漫游通话次数,本地通话次数波动率,长途通话次数波动率,漫游通话次数波动率,数据业务费用,数据业务消费占比,数据业务使用种类数,数据业务费用波动率,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,3,月,4,月,5,月,6,月,7,月,8,月,9,月,10,月,11,月,建模结果,余额,本地被叫,通,通话次数,欠费金额,本地被叫,次,次数波动,率,率,通话标志,通话时长,大,大于,5,分钟标志,多次充值,标,标志,其他费用,本地主叫,次,次数波动,率,率,新业务费,通话次数,月租费,ARPU,彩铃订购,标,标志,长途通话,次,次数,漫游通话,次,次数,本地主叫,次,次数,所有的数,据,据经过对,数,数变换和,标,标准化变,换,换,消除,不,不同变量,和,和不同月,份,份对模型,的,的影响,回归分析,方,方法和参,数,数设置同,在,在在网,2,月新增用,户,户流失预,警,警模型,模型的结,果,果为对数,流,流失风险,比,比的线性,拟,拟合表达,式,式,用户余额,、,、本地被,叫,叫通话次,数,数、欠费,金,金额、本,地,地被叫次,数,数波动率,、,、通话标,志,志、通话,时,时长大于,5,分钟标志,变,变量重要,变量重要,性,性,模型预警20%的,正,正常用户,,,,包含61%的下,月,月流失用,户,户,用户集:,09年0,6,月,(包括,06,月)以前,入网、08月仍然,正,正常的用,户,户,;,模型筛选,用,用户:,通过模型,筛,筛选出的,用,用户集中20%的,用,用户,,其中,,包含了用,户,户集中,61.4%,的,9,月流失用,户,户;,模型筛选,用,用户,9,月、,10,月和,11,月的流失,率,率(模型准,确,确率)分别为,26.7%,、,36%,和,43%,,比用户,集,集中用户,的,的流失率,(,(不使用,模,模型筛选,的,的准确率,),)提升度,分,分别为,3.4,、,2.7,和,2.3,倍。,61.4%,*,提升度,=,模型筛选,用,用户流失,率,率,/,用户集中,用,用户流失,率,率,在网1月,新,新增用户,流,流失预警,模,模型,在网,1,月新增用,户,户没有月,数,数据,只,有,有日数据,,,,由于系,统,统只保留,最,最近,3,月的日数,据,据,,9,月的日数,据,据不完整,,,,,11,月的新增,用,用户不能,判,判定用户,流,流失,只,能,能取,10,月新增用,户,户的日数,据,据为建模,数,数据集,用户的样,本,本量小,,考,考虑到决,策,策树算法,如,如使用交,叉,叉验证,,能,能一定程,度,度上弥补,样,样本量小,的,的不足,,采,采用决策,树,树算法作,为,为预警建,模,模算法,建模时间,窗,窗口,建模变量,基本情况,语音通话情况,数据业务使用情况,品牌,ARPU,余额,套餐名称,日均数据,时间段日数据,/,变化趋势数据,日均数据,时间段变化趋势数据,本地通话次数,长途通话次数,漫游通话次数,本地通话次数波动率,长途通话次数波动率,漫游通话次数波动率,短信条数,彩信条数,GPRS,流量,短信条数波动率,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,入网时间,在,在,10,月,125,日的用户,从,从入网当,天,天直到,10,月底的日,数,数据,建模结果,余额,品牌,手机报费,用,用,套餐名称,日均长途,通,通话次数,月租费,日均本地,被,被叫通话,次,次数,充值次数,日均漫游,通,通话次数,包打套餐,标,标志,本地通话,次,次数波动,率,率,手机邮箱,标,标志,新业务费,多次充值,标,标志,彩铃订购,标,标志,手机报订,购,购标志,本地主叫,次,次数波动,率,率,重入网标,志,志,外网通话,对,对端数波,动,动率,通话大于,5,分钟标志,通话标志,短信发送,条,条数波动,率,率,模型使用,了,了交叉验,证,证,模型的结,果,果为决策,树,树,应用,模,模型后的,输,输出为用,户,户流失的,置,置信度,用户余额,、,、品牌、,手,手机报费,用,用、套餐,名,名称、日,均,均长途通,话,话次数、,月,月租费、,日,日均本地,被,被叫通话,次,次数变量,重,重要,变量重要,性,性,模型预测,效,效果评估,由于没有,11,月的数据,可,可用于测,试,试,12,月流失情,况,况,使用,建,建模数据,集,集评估模,型,型拟合效,果,果,从收益图,来,来看,模,型,型筛选了,20%,的,10,月新增用,户,户,包含,了,了,50%,的,11,月流失用,户,户,筛选,40%,的的,10,月新增用,户,户,包含,了,了,74%,的,11,月流失用,户,户,74%,50%,模型应用,流,流程,新增用户,和,和高价值,用,用户,当前在网,用,用户,定义候选,用,用户,识别正常,用,用户,渠道养卡,用,用户识别,模,模型,跳蚤用户,识,识别模型,筛选流失,预,预警用户,用户细分,模,模型,根据不同,用,用户特征,,,,采用适,宜,宜的挽留,策,策略,了解用户,特,特征,在网,1,月新增用,户,户流失预,警,警模型,在网,2,月新增用,户,户流失预,警,警模型,在网,2,月以上新,增,增用户流,失,失预警模,型,型,高价值用,户,户流失预,警,警模型,高价值用,户,户用户细,分,分模型,在网,1,月新增用,户,户细分模,型,型,在网,2,月以上新,增,增用户细,分,分模型,维,系,系,方,案,案,正常低网,龄,龄用户维,系,系措施,正常低网,龄,龄用户维,系,系,在网异动,用,用户,流失高危,用,用户,财务捆绑,:,:预存话,费,费送话费,(,(高额度,),),用户忠诚,度,度计划,网龄营销,(,(财务捆,绑,绑),服务捆绑,用户归位,,,,主动引,导,导用户归,位,位至适合,其,其自身消,费,费的品牌,和,和资费套,餐,餐;,优惠补卡,;,;,账户低余,额,额时充值,提,提醒;,主卡付费,+,亲情网,同一细分,群,群的流失,高,高危用户,和,和在网异,动,动用户采,用,用同一类,型,型的捆绑,政,政策,但,在,在力度上,会,会有所差,异,异。,业务捆绑,:,:预存送,本,本地长途,通,通话分钟,数,数,业务捆绑,:,:预存送,本,本地通话,分,分钟数(,高,高额度),财务捆绑,:,预存话费,送,送话费(,中,中低额度,),),业务捆绑,:,:专项预,存,存,-,高价值数,据,据业务套,餐,餐优惠,业务捆绑,:,:专项预,存,存,-,短信套餐,捆,捆绑,业务捆绑,:,:专项预,存,存,-GPRS,套餐捆绑,业务捆绑,:,:预存送,漫,漫游主叫,通,通话分钟,数,数,业务捆绑,:,:专项预,存,存,-,数据业务,套,套餐优惠,业务捆绑,:,:预存送,本,本地通话,分,分钟数(,低,低额度),商务高端,用,用户群,长途话务,突,突出群,本地话务,突,突出群,本地低端,用,用户群,数据业务,发,发烧群,短信偏好,用,用户群,GPRS,偏好用户,群,群,漫游突出,用,用户群,数据业务,兴,兴趣群,本地话务,偏,偏好群,全用户,谢,谢,谢 !,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 营销创新


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!