互联网大数据分析之《用户画像分析》课件

上传人:文**** 文档编号:242756976 上传时间:2024-09-02 格式:PPT 页数:60 大小:1.82MB
返回 下载 相关 举报
互联网大数据分析之《用户画像分析》课件_第1页
第1页 / 共60页
互联网大数据分析之《用户画像分析》课件_第2页
第2页 / 共60页
互联网大数据分析之《用户画像分析》课件_第3页
第3页 / 共60页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,内部资料, 请勿外传,*,用户画像分析专题分享,用户画像分析专题分享,统计学基础,集中量:求和、平均数、中位数、众数、,差异量:全距、标准差、方差、最小值、最大值、标准误,分布:正态分布、峰度系数、偏度系数、正偏态、负偏态、高狭峰、低阔峰、离散变量、连续变量,统计学基础 集中量:求和、平均数、中位数、众数、,目 录,用户画像研究概述,用户画像研究流程,用户画像方法与案例演示,目 录用户画像研究概述用户画像研究流程用户画像方法与案例演示,用户画像概述,用户画像概述,用户画像概述,数据挖掘,典型个体定性描述,群体定量分类统计,用户画像概述数据挖掘典型个体定性描述群体定量分类统计,一、群体用户定量描述统计,一、群体用户定量描述统计,群体定量分类统计各类用户性别构成,群体定量分类统计各类用户性别构成,群体定量分类统计各类用户年龄构成,群体定量分类统计各类用户年龄构成,群体定量分类统计各类用户年龄构成,群体定量分类统计各类用户年龄构成,用户年龄分布图,用户年龄分布图,二、个体用户定性描述,二、个体用户定性描述,男,岁,中专或以下学历,保安,年工作经验,月收入在元以下,知识层次较低,理解表达能力较差。性格内向,不爱说话,但是在网上却很活跃,是个很有代表性的用户。使用年,没有电脑,由于工作性质特殊(用户的职业为保安),所以用户每天使用手机登陆及手机网来打消无聊的时间,或下班去网吧上网。他的同事大都年龄较大,一般都是把打牌和喝酒作为娱乐活动,这是他所不喜欢的,与他同龄的同事大都喜欢把上网作为娱乐。他对电脑使用较为生疏。认为看上去不错,如果能把的功能都加上再稳定些就更好了。与相比,更习惯使用。,访谈发现:.对于广大低端用户来说,易理解、简单、方便、快捷是他们最需要的,也是他们不用的原因之一;.用户对依赖性很大,这样的用户希望的功能更强大,真正实现一站式在线生活。,典型用户个体描述案例,来源:一次 用户访谈用户画像,男,岁,中专或以下学历,保安,年工作经验,月收入在元以,典型用户个体描述,女,岁,高中,学生,理解表达能力较好,性格对陌生人内敛对朋友外向活泼,不喜欢动脑,什么都喜欢方便的,最好只按一下就全部搞定的。使用年,现实的社交圈基本局限在同班同学,但是网上却有很多不认识的好友,喜欢认识不同类型的人。虽然网龄较高但是与很多女孩子一样依然是个电脑白痴女,她喜欢操作越简单越方便越好。访谈过程中她说的最多的一句话就是“我个人比较懒!”,最怕麻烦,就是太麻烦才不用的。对于电脑游戏喜欢互动性好,但是操作简单的,比如劲舞团、大话西游等。,访谈发现:,很多女用户虽然使用电脑多年但是依然是个电脑白痴,对她们来说所有操作如果超过两步就会晕!对于设置性操作她们基本没有使用过,她们只使用初始化设置,希望在修改设置方面更简单!,该用户的另一个特点就是“懒”,稍微有点麻烦或困难,她们就会懒得做,懒得想,如果有傻瓜式,全自动式操作就很适合她们。,来源:一次 用户访谈用户画像,典型用户个体描述 女,岁,高中,学生,理解表达,三、用户画像数据挖掘,三、用户画像数据挖掘,数据挖掘,付款用户,【,对应分析,】,数据挖掘付款用户【对应分析】,用户,【,聚类分析,】,用户【聚类分析】,用户,【,聚类分析,】,特征得到的启发,高认同用户,低介入用户,新进用户,的核心用户的画像:,岁男女,丰富使用各类业务业务的龄较长的活跃用户,定期换装,可拉动、改变的用户,岁男女,龄(年)和使用历史较短,定期换装,通过提升品牌满意度,增强其付费使用的信心,令这些用户改变(即令其从不付费使用到付费使用)的可能性较低:,龄长,使用历史较长,但仍不付费使用,亦较少使用其它业务,换装频率不固定,用户【聚类分析】特征得到的启发高认同用户 新进用户的核,用户画像流程,用户画像流程,用户画像流程,研究,目的,确定目标用户,用户,抽样,数据,整理,数据整理统计挖掘,结论,展示,用户画像流程研究确定目标用户用户数据数据整理统计挖掘结论,20,提取用户,20提取用户,抽样的几个概念,是所要研究的对象的全体。例如,考察,XX,农场用户体验,目标总体就是所有的,XX,农场的用户。抽样总体是用于从中抽取样本的总体。,总体,Population,从目标总体(,Population,,或称为母体)中抽取一部分个体作为样本(,Sample,),通过观察样本的某一或某些属性,依据所获得的数据对总体的数量特征得出具有一定可靠性的估计判断,从而达到对总体的认识。,抽样,Sample,在抽样之前,总体应划分成抽样单位,抽样单位互不重叠且能合成总体,总体中的每个个体只属于一个单位。抽样框是一份包含所有抽样单元的名单。,抽样框,抽样的几个概念是所要研究的对象的全体。例如,考察XX农场用户,抽样过程,定义总体(母体),确定抽样框,确定抽样方法,决定样本量,实施抽样计划,抽样与数据收集,回顾抽样过程,抽样过程定义总体(母体) 确定抽样框 确定抽样方法 决定样本,抽样方法,从总体,N,个单位中随机地抽取,n,个单位作为样本,使得每一个容量为样本都有相同的概率被抽中。特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。,简单,随机,抽样,simple random sampling,等距抽样。将总体中的所有单位按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。先从数字,1,到,k,之间随机抽取一个数字,r,作为初始单位,以后依次取,r+k,、,r+2k,等单位。这种方法操作简便,可提高估计的精度。,系统抽样,systematic sampling,将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。从而保证样本的结构与总体的结构比较相近,从而提高估计的精度。,分层抽样,stratified sampling,将总体中若干个单位合并为组,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。抽样时只需群的抽样框,可简化工作量,缺点是估计的精度较差,整群抽样,cluster sampling,抽样方法从总体N个单位中随机地抽取n个单位作为样本,使得每一,抽样效度与信度,分半信度,将同一批用户随机分成两组,计算关键指标的占比、相关系数。,复本信度,同一总体中随机抽取多个样本进行比较,内部一致系数,同质,抽样效度与信度分半信度将同一批用户随机分成两组,计算关键指标,一个教师的话,我不止一次给我的市场调研课学生说过,你们利用人人网之类做问卷调查基本是无效的,当个作业也就算了。,你们心里要明白,所谓物以类聚人以群分,利用社交网络的做出来的问卷,没有随机性可言。包括你在、之类上传问卷给朋友请他们帮忙。缺乏随机性的样本,那就没有代表性。就好像小区的人,无法代表全体市民,你的朋友,无法代表全体学生。,摘自:魏武辉的,一个教师的话 我不止一次给我的市场调研课学生说过,,数据整理,数据整理,数据整理,极端值处理;,心理学研究把超过,2,个标准差之外的值剔除,。,数据检查,没有观测到,有明显错误,缺失值处理,例如:年龄分段、选择处理等,数据分组,数据整理极端值处理;心理学研究把超过2个标准差之外的值剔除。,数据检查,用户选择,用户年龄取值范围:岁岁,数据检查用户选择用户年龄取值范围:岁岁,用户年龄占比分布,岁岁 占比合计:,用户年龄占比分布岁岁 占比合计:,用户画像数据挖掘实例演示,对应分析,聚类分析,用户画像数据挖掘实例演示对应分析,用户画像方法 “对应分析”实例演示,用户画像方法 “对应分析”实例演示,对应分析数据格式整理,对应分析数据格式整理,互联网大数据分析之用户画像分析课件,互联网大数据分析之用户画像分析课件,加权个案,加权个案,对应分析过程,对应分析过程,对应分析,定义行范围(用户类别),对应分析定义行范围(用户类别),对应分析,定义列范围(用户特征),对应分析定义列范围(用户特征),对应分析结果图,对应分析结果图,减少用户特征,减少用户特征,互联网大数据分析之用户画像分析课件,用户画像方法 “聚类分析”实例演示,用户画像方法 “聚类分析”实例演示,人群划分,矮,胖,胖,高,矮,瘦,瘦,高,人群划分矮胖矮瘦,聚类分析,组内差异,组间差异,概念,根据数据本身结构特征对数据进行分类的方法,聚类分析,通过聚类分析,可以把数据分成若干个类别,使得类别内部的差异尽可能的小,类别外部差异尽可能大。,聚类分析组内差异组间差异概念根据数据本身结构特征对数据进行分,聚类分析的种类,层次聚类法,非层次聚类法,K-,均值聚类法,二阶聚类法,样本量,连续变量,首选方法,聚类分析的种类层次聚类法非层次聚类法K-均值聚类法二阶聚类法,数据检查,样本选择:,年龄: ( , ),笔数:,金额:,数据检查样本选择:,47,两步聚类分析,47 两步聚类分析,聚类分析结果,聚类分析结果,用户画像在工作中的实际应用,抽样依据,用户拉新,用户挽留,产品定位,产品优化,用户画像在工作中的实际应用抽样依据用户拉新用户挽留产品定位产,来源; 平台,中国微博用户市场图谱:年微博用户将突破亿,来源; 平台,中国微博用户市场图谱:年微博用户将突破亿,可以看看的几个网站,统计专业网站:,大社区:,中文官方网站:,淘宝用户体验设计:,:,图研所:,可以看看的几个网站统计专业网站:,人群,人群,人群,人群,人群,人群,星座与气质用户画像,星座与气质用户画像,品牌画像,颜色维度,品牌画像颜色维度,甲壳虫乐队发型变化图表,甲壳虫乐队发型变化图表,可以读读的几本书,¥,¥,¥,¥,可以读读的几本书¥,收集数据的十个原则,一、思考研究问题之初,也要开始思考回答问题需要收集的数据类型。,二、在思考数据类型的时候,也要思考从何处获得数据。,三、保证你用于收集数据的表格简单容易。,四、始终记得对数据文件进行备份,并存储在不同地方。已经丢失,&,即将丢失。,五、不要依赖他人收集或转换数据。,六、计划详细的何时何收集数据的日程表,七、只要有可能,就为你的项目培育可能的数据来源。,八、尽力追踪遗漏了的测试或者访谈对象。,九、永远不要销毁你的原始数据。,收集数据的十个原则一、思考研究问题之初,也要开始思考回答问题,谢 谢 !,谢 谢 !,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!