关联规则简介与Apriori算法课件

上传人:文**** 文档编号:252314657 上传时间:2024-11-14 格式:PPT 页数:35 大小:2.92MB
返回 下载 相关 举报
关联规则简介与Apriori算法课件_第1页
第1页 / 共35页
关联规则简介与Apriori算法课件_第2页
第2页 / 共35页
关联规则简介与Apriori算法课件_第3页
第3页 / 共35页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,关联规则简介,关联规则简介与Apriori算法关联规则简介,关联规则,丶关联规则(Association rules)反映一个事物与,其他事物之间的相互依存性和关联性。如果两个或,者多个事物之间存在一定的关联关系,那么,其中,个事物就能够通过其他事物预测到。首先被,Agrawal,mielins ki and swan在1993年的,SIGMOD会议上提出,关联规则挖掘是数据挖掘中最活跃的硏究方法之,典型的关联规则发现问题是对超市中的购物篮数,据(Market Basket)进行分析。通过发现顾客放,入购物篮中的不同商品之间的关系来分析顾客的购,买习惯。,案例,“尿布与啤酒”的故事,丶美国的沃尔玛超市对一年多的原始交易数据进行了详细的,分析,得到一个意外发现:与尿布一起被购买最多的商品,竟然是啤酒。借助于数据仓库和关联规则,商家发现了这,个隐藏在背后的事实:美国的妇女们经常会嘱咐她们的丈,夫下班以后要为孩子买尿布,而30%40%的丈夫在买完,尿布之后又要顺便购买自己爱喝的啤酒。有了这个发现后,超市调整了货架的设置,把尿布和啤酒摆放在一起销售,从而大大增加了销售额。,关联规则简介关联规则简介与Apriori算法关联规则简介,1,关联规则,丶关联规则(Association rules)反映一个事物与,其他事物之间的相互依存性和关联性。如果两个或,者多个事物之间存在一定的关联关系,那么,其中,个事物就能够通过其他事物预测到。首先被,Agrawal,mielins ki and swan在1993年的,SIGMOD会议上提出,关联规则挖掘是数据挖掘中最活跃的硏究方法之,典型的关联规则发现问题是对超市中的购物篮数,据(Market Basket)进行分析。通过发现顾客放,入购物篮中的不同商品之间的关系来分析顾客的购,买习惯。,关联规则,2,案例,“尿布与啤酒”的故事,丶美国的沃尔玛超市对一年多的原始交易数据进行了详细的,分析,得到一个意外发现:与尿布一起被购买最多的商品,竟然是啤酒。借助于数据仓库和关联规则,商家发现了这,个隐藏在背后的事实:美国的妇女们经常会嘱咐她们的丈,夫下班以后要为孩子买尿布,而30%40%的丈夫在买完,尿布之后又要顺便购买自己爱喝的啤酒。有了这个发现后,超市调整了货架的设置,把尿布和啤酒摆放在一起销售,从而大大增加了销售额。,案例,3,案例,70%购买了牛奶的顾客将倾向于同时购买面包,某网上书店向用户推荐相关书籍,互联网:碎片化生,喧哗一一网络时代的,字化生存,浅:互网如,长理论2.0(超经,世导是平的,南的常识李开,案例,4,案例,在买了一台PC之后下一步会购买?,!,出R,FHT,H无所,案例,5,案例,在保险业务方面,如果出现了不常见的索赔要求组,合,则可能为欺诈,需要作进一步的调查,在医疗方面,可找出可能的治疗组合;,在银行方面,对顾客进行分析,可以推荐感兴趣的,服务等等,案例,6,关联规则基本模型,什么是规则?,规则形如如果.那么.(Gf6hen),前者为条件,后者,为结果。例如一个顾客,如果买了可乐,那么他也会购买,果汁。,如何来度量一个规则是否够好?有两个量,置信度,(Confidence)和支持度(Support。假设有如下表的购买,记录,关联规则基本模型,7,关联规则基本模型置信度,顾客,项日,橙汁,可乐,2牛奶,橙汁,空气清洁器,橙汁,洗洁精,橙汁,洗洁精,可乐,空气清洁器,置信度表示了这条规则有多大程度上值得可信。设条件,的项的集合为A,结果的集合为B。置信度计算在A中,同,时也含有B的概率(即:A,then b的概。即,Confidence(AB=PBA。例如计算“如果 Orange则,Coke的置信度。由于在含有“橙汁”的4条交易中,仅,有2条交易含有“可乐”。其置信度为0.5。,关联规则基本模型置信度,8,关联规则基本模型支持度,顾客,项日,橙汁,可乐,2牛奶,橙汁,空气清洁器,345,橙汁,洗洁精,橙汁,洗洁精,可乐,空气清洁器,支持度计算在所有的交易集中,既有A又有B的概率。例,如在5条记录中,既有橙汁又有可乐的记录有2条。则此,条规则的支持度为25=04,即 Support(AB=P(AB,现在这条规则可表述为,如果一个顾客购买了橙汁,则有,50%(置信度)的可能购买可乐。而这样的情况(即买了橙,汁会再买可乐)会有40%(支持度)的可能发生。,关联规则基本模型支持度,9,关联规则的相关概念,定义1项目与项集,设|=i1,i2,im是m个不同项目的集合,每个,k(k=1,2,m)称为一个项目(tem),项目的集合称为项目集合(teaset),简称为项集,。其元素个数称为项集的长度,长度为k的项集称,为k-项集(k-teaset),关联规则的相关概念,10,关联规则简介与Apriori算法课件,11,关联规则简介与Apriori算法课件,12,关联规则简介与Apriori算法课件,13,关联规则简介与Apriori算法课件,14,关联规则简介与Apriori算法课件,15,关联规则简介与Apriori算法课件,16,关联规则简介与Apriori算法课件,17,关联规则简介与Apriori算法课件,18,关联规则简介与Apriori算法课件,19,关联规则简介与Apriori算法课件,20,关联规则简介与Apriori算法课件,21,关联规则简介与Apriori算法课件,22,关联规则简介与Apriori算法课件,23,关联规则简介与Apriori算法课件,24,关联规则简介与Apriori算法课件,25,关联规则简介与Apriori算法课件,26,关联规则简介与Apriori算法课件,27,关联规则简介与Apriori算法课件,28,关联规则简介与Apriori算法课件,29,关联规则简介与Apriori算法课件,30,关联规则简介与Apriori算法课件,31,关联规则简介与Apriori算法课件,32,关联规则简介与Apriori算法课件,33,关联规则简介与Apriori算法课件,34,关联规则简介与Apriori算法课件,35,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!