CPDA考试 移动客户细分聚类

上传人:xgs****56 文档编号:8927271 上传时间:2020-04-02 格式:DOC 页数:4 大小:26.27KB
返回 下载 相关 举报
CPDA考试 移动客户细分聚类_第1页
第1页 / 共4页
CPDA考试 移动客户细分聚类_第2页
第2页 / 共4页
CPDA考试 移动客户细分聚类_第3页
第3页 / 共4页
点击查看更多>>
资源描述
一 假如你是某移动运营商的数据分析师 结合用户通话行为数据 通过数据分析为 用户推荐相应套餐或者结合用户现有套餐优化套餐 提供个性化套餐 从而对客户进 行精准营销 增加客户粘性 运营商收集到的数据包含下列字段 变量名称 变量标签 Customer ID 用户编号 Peak mins 工作日上班时间电话时长 OffPeak mins 工作日下班时间电话时长 Weekend mins 周末电话时长 International mins 国际电话时长 Total mins 总通话时长 average mins 平均每次通话时长 根据客户行为数据 进行数据的预处理 可以自行根据现有变量构造新变量进行分析 预处理之后选择适合变量进行分析 分析算法自行选择 写出分析思路和过程 通过 数据分析对客户进行细分 并为运营商提供客户精准营销的相关建议 请写出分析的 流程并刻画最后细分之后的客户的特点和相应的营销建议 K Means 据类的步骤 1 确定所有聚类变量 聚类因子 2 数据预处理 分类变量数值化 处理缺失值 分析是否存在共线性等 若只有两 个变量共线则用比值法 较多变量共线用主成分分析进行降维 3 确定聚类个数并用处理后的聚类因子进行聚类分析 若未说明则需要尝试不同的 聚类个数 3 4 5 6 7 从中选择平均轮廓系数较大且结果易于分析解释的模 型 4 分析聚类效果和聚类结果 类中心点和每个类等 5 结合实际情况分析每类的意义等 聚类分析处理共线性时不能直接删除 可用比值替代或主成分分析等来消除共线性 案例分析 观察数据类型 检查数据是否具有缺失值 数据类型为数值型 原始数据没有缺 失值 我们把数据导入 DATAHOOP 平台 在展示分析中进行异常值分析 分析结果如下 表 Peak mins OffPeak mins Weekend mins 上四分位 1382 1 426 825 74 875 中间值 1030 2 274 05 44 4 下四分位 700 2 154 425 25 05 异常值个数 6 5 5 International mins Total mins average mins 上四分位 389 03 1781 3 4 2075 中间值 294 075 1370 85 2 73 下四分位 221 2275 1094 925 2 1 异常值个数 13 11 36 由上面可以得到异常值的个最多的具有 36 个 在数据总体样本中占比比较大 所以不处理 异常值 这些异常值有可能是数据中一些特殊的类 进行相关系数矩阵分析 分析得到的相关系数矩阵如下 Peak mins OffPeak mins Weekend mins International mins Total mins average mins Peak mins 1 0 121 0 1448 0 6915 0 9415 0 0367 OffPeak mins 0 121 1 0 0247 0 262 0 4425 0 0094 Weekend mins 0 1448 0 0247 1 0 1282 0 2006 0 1066 Internationa l mins 0 6915 0 262 0 1282 1 0 7123 0 034 Total mins 0 9415 0 4425 0 2006 0 7123 1 0 0364 average mins 0 0367 0 0094 0 1066 0 034 0 0364 1 观察相关系数矩阵中有一个相关系数为 0 9415 该系数比较大 所以我们要处理 我们用 比值替换法 把两个变量做比 得到的比值替换其中的一个变量 我们在数据中重新插入 一列为 得到他们的变量比值 替换 Peak mins 变量 得到新的变量 我们把新 Peak minsTotal mins 的数据导入 DATAHOOP 中求出相关系数矩阵 OffPeak mins Weekend mins International mins Total mins average mins Peak mins Total mins OffPeak mins 1 0 0247 0 262 0 4425 0 0094 0 4771 Weekend mins 0 0247 1 0 1282 0 2006 0 1066 0 0079 Internationa l mins 0 262 0 1282 1 0 7123 0 034 0 3939 Total mins 0 4425 0 2006 0 7123 1 0 0364 0 4492 average mins 0 0094 0 1066 0 034 0 0364 1 0 0116 Peak mins To tal mins 0 4771 0 0079 0 3939 0 4492 0 0116 1 得到的相关系数矩阵中的相关系数没有大于 0 85 所以解决了共线性 我们可以直接进行 K Means 聚类 聚类的参数在有聚类的个数为 5 进行标准化 初始中心点选择的次数要大 最大迭代次数也要大 然后进行 K Means 聚类 运行结果如下 平均轮廓系数 0 2467 该平均轮廓系数是比较小 平均轮廓系数越接近于 1 越好 实际案例里面我们有可能我们 得不到太大的轮廓系数 聚类效果是不明显 聚类不是太明显 但聚类是有区别的 我们 研究该聚类的区别 类别 类中心点坐标 样本个 数 0 0 6972 0 00146 0 10973 0 08154 0 15909 0 786669 191 1 0 469649 0 07189 1 4365 1 293804 0 04352 0 473255 89 2 0 03111 0 5675 0 53938 0 48712 3 645248 0 10716 18 3 0 721084 0 237837 0 25106 0 18959 0 11827 0 83047 175 4 1 37056 0 98922 2 12987 2 30509 0 4263 1 80452 25 我们得到上面表格的类中心点坐标是经过我们标准化的 我们还原成原来的数据 得到原 始的分类 然后求每一类的平均值 总结如下表 Peak mi ns OffPeak mi ns Weekend mi ns International m ins Total mi ns average mi ns 0 1068 37 6 300 1317 53 96551 315 5413 1422 473 3 599579 1 1305 87 2 349 0611 57 77315 366 6326 1712 706 3 592437 2 1078 46 7 300 9404 52 69453 314 994 1432 102 4 008122 3 1068 29 1 300 6339 53 96841 315 9593 1422 893 3 602067 4 52 6952 39 37861 18 23432 15 56027 110 3081 2 785264 对类进行特征分析 0 类 总通话 Total mins 较长 下班通话时间 Offpeak mins 最长 上班通话时间 Peak mins 比较长 命名为中端客户 1 类 总通话 Total mins 长 上班通话时间 Peak mins 长 周末通话时间 Weekend mins 较长 国际通话时间 International mins 长 命名为高端用户 2 类 总通话 Total mins 较长 上班通话时间 Peak mins 仅次于第一类 周末通话 时间 Weekend mins 居中 国际通话时间 International mins 居中 命名为中端用 户 3 类 在各项中均较低 命名为不常使用用户 4 类 平均每次通话时间 average mins 最长 命名为长聊用户 综上 根据以上客户细分的结果和特征分析 移动产品开发部门有针对性的开发设计套餐 品类 满足不同类型的客户的实际需求 增加客户黏性 提高客户的满意度 最终提高客 户的生命周期价值
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!