常见数据分析方法及案例.ppt

上传人:sh****n 文档编号:7435043 上传时间:2020-03-21 格式:PPT 页数:8 大小:425.50KB
返回 下载 相关 举报
常见数据分析方法及案例.ppt_第1页
第1页 / 共8页
常见数据分析方法及案例.ppt_第2页
第2页 / 共8页
常见数据分析方法及案例.ppt_第3页
第3页 / 共8页
点击查看更多>>
资源描述
常用的数据分析方法及案例 吴志坚2011 7 26 目录1 分析思路2 报表分析3 在A B测试4 用户数据画像 分析思路1 业务导向 目标和方法关系 2 结果完整 体检报告 结论 数据 分析 建议 3 螺旋上升4 逻辑严密 测试你的逻辑 抽样问题 电信12580客户细分项目 项目目标 电信想具体分析12580的客户特征 如性别比例 使用12580频次等 数据基本情况如下 2千万不同客户 电话号码 产生全量1亿条电话记录 抽样方法如下 从1亿记录随机抽取2万条电话记录 发现里面包含1 9万客户 电话号码 这1 9万客户对应全量记录里面一共产生100万条电话记录 用这100万条电话记录构成抽样分析的样本 请问上述抽样是否有问题 问题出在哪里 如何解决 回答要点 抽样后样本平均每个用户有50条电话记录 不符合实际情况 全量样本中平均每个用户有5条电话电话记录 原因主要是这个抽样方法是针对于电话记录的随机 对用户不随机 多电话记录的用户被抽中的可能性大 正确抽样方法是 从全量记录里面抽取全量不同的用户 然后在用户里面随机抽取2万用户 在用这2万用户去匹配电话记录 构成样本 数据敏感 目标明确 逻辑严密 用户是否使用soso和年龄有关么 结论 有关系 从年龄分布上看 小于18岁用户中不活跃用户的占比最大 而用户的年龄越大 重度活跃用户的比例越高 报表分析 简单 有效 说明 1 a btest 为了验证某种方案是否更优 采取分组测试方法 2 如何保证测试有效性 参照系稳定 数据充分 3 测试指标 不仅仅是数量 还有质量 4 联盟网吧案例 各个联盟网吧的分组指标如下 分组 识别差异 分析差异 优化 用户画像1 画像对象 qq用户 2 通过qq号码 将用户的属性和行为关联起来 寻找用户的特征 3 数据只有对比才能说明问题 给数据寻找参照系 网吧用户画像1 背景 了解网吧用户特征 用以网吧联盟战略参考 2 通过qq号码 判断用户是否在网吧ip登录 3 部分特征如下 2011年2月全量网吧用户1 43亿 qq用户约6 6亿 其中男性70 女性30 男女比例显著高于腾讯全量用户 2011年1月数据 男56 2 女42 9 网吧整体用户年龄分布与腾讯总体相比更加年轻 24岁以下用户占78 腾讯全量用户为53 5 2011年1月数据 量大 男性化 年轻化 如何应用特征 Thanks QA
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!