资源描述
精选优质文档-倾情为你奉上利用图像挖掘技术进行消费者行为分析摘要在本文中,我们将讨论如何将图像挖掘系统应用到销售交易数据中,以便了解消费者行为。首先,现有的研究,消费者行为分析的顺序购买模式进行检讨。然后,我们提出一个有向图像保留时间信息在购买序列代表复杂的客户购买行为和应用图挖掘技术分析频繁出现的模式。通过这篇文章,展示了健康的食用油分析图像挖掘技术如何帮助我们理解复杂的购买行为。1. 介绍在日本,“健康”相关产品已成为一个主要的消费者和产业,也是近年来人们关注的焦点。因为健康相关产品具有高附加值的事实,这是可以理解的,谁不是靠降价来吸引客户的促销摸索发现的食品零售商,健康相关产品的确是一个非常有吸引力的购买消费群。然而,这些零售商正试图提出有效的食品菜单,以吸引高价值客户数量不断增加,他们的商店发现自己面临着两难境地,并试图提取这些消费者的特点以及其复杂的采购行为。简单地分析这些消费者的购物篮的内容是不够的,还需揭示他们的采购模式和生活方式。众多的产品时,在同一时间购买的产品之间的关系,绘制出的特征,这也是必要的。在本文中,我们目前的应用程序通过使用图表挖掘技术了解的机会,保健食品的热潮,购买历史数据分析,从消费者行为的角度来看,创建触发器并进行讨论和沟通的未来情景。至目前为止,我们已经开发出了各种各样的分析方法,可用于分析消费者的购买次数数据。例如,我们开发了EBONSAI1 2这种使用的方式来进行分类数据的时间序列分析和序列分析技术能够成功地发现消费者购买方式的特征提取。然而,尽管有可能分析序列模式的有限的产品组设计,还是不可能通过序列模式分析来解决上面提到的问题。我们从多个采购模式购买的产品提取的特点,伴随着他们的购买序列,它将成为必要。在我们的研究中,我们提出建议,从购买的产品组,表示为图中的结构化数据的时间序列中提取的特征模式。图形结构是有效和有用的数据和现象来表达复杂的形式。已经有几个algorisms的采矿图,它们被用来分析化学化合物和医疗数据。我们相信,通过将这些图挖掘技术应用到营销领域将有可能发现新的含义,传统形式的技术无法检测。在本文中,我们应用图挖掘技术分析FSP超市的数据,通过零售商和专家受雇于各种厂家的互动,试图发现新的机遇。2 利用图形挖掘技术分析消费者使用行为2.1 图形挖掘图形挖掘是一种从各种图形结构数据用于提取特征模式技术4。图形结构是一个很好的方式表示和解释复杂的数据形式和现象,但其计算的复杂性,因为其强大的表现力一直是个难题,提取特定的模式。然而,最近的发展已经使人们有可能执行一个完整的搜索,提取所有的子图在一个合理的计算时间。 AGM算法3是一种最先进的图形挖掘算法,能够处理两种反应/无向和有色/无色图。图形挖掘研究虽然仍处于发育阶段,有相当数量的研究已经开展了关于其实用性。例如,图形挖掘是从化合物数据中提取模式。在化工领域的化学物质的分子结构中一直使用图形结构来表示,因此图形挖掘是天然的分子分析一个挑战最频繁的应用领域是。事实上,图形挖掘技术能够从导致致癌的有机氯化合物成功提取有意义的子结构。虽然各种类型的工作现正在使用图形挖掘,但是据我们所知,我们是第一家申请图形挖掘技术的商业和营销领域。我们已向图形挖掘技术的POS数据,其中包括客户的ID已经在零售行业积累,以调查申请图挖掘营销研究领域的可能性。2.2 图形结构和消费者行为根据表1,包括客户ID信息的POS数据,我们试图使用图形结构表达消费者的购买行为。在表1中所示的数据是一个详细记录着单个消费者购买色拉油后的销售记录。在购买色拉油,客户ID:12次走访卖场,从不同的类别,并购买了多个产品。表1:包括ID信息的POS数据示例ID日期类别产品码价格区间12004.01.27色拉油健康昂贵12004.02.02鸡蛋有机鸡蛋昂贵12004.02.02牛奶命运牛奶昂贵12004.02.02蛋黄酱半草本植物平价12004.02.12鸡蛋有机鸡蛋昂贵12004.02.12面包棕色小麦面包昂贵12004.02.12牛奶不贵22004.03.03色拉油日新油平价图1:图表结构化数据和采购行为使用的曲线图,使得它可以在极端的详细购买信息有关的产品的组合物,在何时何地一次购买多个产品洁具表达。图1显示出的客户ID:1的购买行为使用的图表结构。图形显示根据购买“健康Okona色拉油”。在接下来的访问(6天)到店的消费者购买“有机鸡蛋”,“命运奶”和“半香草”,箭头连接这些项目代表采购序列。上述采购连接各产品的边缘,标签粘贴,表明之间的间隔。 “有机鸡蛋”和以下访问到店里购买“Honeboso奶”是由箭头连接在同一类别上次访问购买的产品,而这些也贴显示的天数自上次购买之日起已经过去了。此外,挂钩类产品,如“糙米面包”未购买前面访问的色拉油。在该曲线图中包含的数据包括不仅同时购买的产品级别的信息,而且还有时间序列的信息,关于所购产品的组的多个购买和信息,使得能够从这些信息中提取特征的图案,可导致发现传统方法无法获得的新知识。3 分析色拉油市场消费者的行为3.1 色拉油市场关键字,“健康”是最强大的消费和工业导向的关注在日本的食品和食品相关市场的干将之一。在持续的通缩之中,根据关键字“健康”的产品销售高价购买,并认为暂且将继续扩大在这一领域的市场增长。项目带动增长起到了很大的作用,是一个“健康”的形象下,由制造商销售的色拉油产品。虽然这个产品是一个新来的色拉油市场,它已经占据了超过10的市场份额,我们将继续看到中发挥了“健康”方面,几乎所有的有关厂商的产品不断涌入使得整体市场的重要组成部分。在本文中,我们提到这组产品是根据关键字“健康”作为面向健康色拉油销售。色拉油市场是由17个健康为导向的色拉油产品和16个色拉油正常类型组成,健康为导向的色拉油产品在整体色拉油市场的市场占有率超过30。虽然有一些明显的产品具有较强的名牌上诉,但基本上这些以健康为导向的色拉油产品有一个很大的切换,我们觉得这是作为一个单一的消费类板块的用户可以适当考虑这些产品。基本分析表明,当消费者购买其他类型的更普通色拉油,相比该分部拥有几个特殊的特性,包括使用油本身在较小的数量比他们的同行和其他类型的失衡的倾向也出现在其他用户他们购买的产品为好。我们还发现,只有购买这些健康为导向的色拉油产品,消费者购买健康为导向的色拉油产品之间存在一个消费的部分。在本文中,我们将参照前一组“健康用户”,后者为“双用户”,一般“健康用户”购买色拉油价格高,而“双用户”表现出极高的响应色拉油出售。然而,当与普通用户相比,这些都倾向于购买产品的高价格,不包括色拉油的产品和购买的产品出售的比例是低的。此后的分析我们把注意力集中在这三个消费群体组成的“健康用户”,“双用户”和“普通用户”。3.2 预处理和数据转换利用FSP关东地区的大湄公河次区域(一般量贩店)的数据涵盖了1年的期间,从2002年7月至2003年6月。在此期间购买色拉油分别高于平均水平与2979“健康用户”(包括类别的总量超过66)的购买主要健康为导向的色拉油产品,3437“双用户”(包括的不到66以健康为导向的总色拉油)购买健康为导向的色拉油产品及其他产品,不购买任何健康为导向的色拉油产品12,088“普通用户”。我们进行了分析,发现“健康用户”和“双用户”后1个月内他们的健康为导向的色拉油产品采购中的采购行为的特点。从50产品组的主要食品种类,我们提取数据,鸡蛋,牛奶,面包和蛋黄酱,色拉油,因为其强大的关系。我们的价格区分为每个产品的市场价格与这些产品相关的组到高价格带,中间价格带和价格低区的行列。我们也打破了1个月的分析周期分为3个10天的周期,在上述期间内所购产品组进行了分析。3.3 提取具有特殊特征的消费者行为模式当我们使用图形挖掘技术分析上述数据时,我们发现几个特征方面的购买行为,产品采购和价格区域。1)“健康用户”倾向购买高价格带产品在每个3期“健康用户同时购买高价格带产品,跨越不同类别的比例约10至15,相对高于5的人认为与”双用户“。此外,当“双用户”相比,人们发现,许多用户更“健康”往往使连续购买高价格带产品类别的面包,蛋,奶,如图2所示。在“双用户”中发现 10.8,比“健康用户”的消费者购买高价格带产品之间的3个类别,3个时期的6倍或以上,大大超过了4.7的比例。“健康用户”没有表现出倾向购买产品具有低频率购买,如在高价位区的色拉油,但也倾向于购买物品,如面包,鸡蛋或牛奶中的高频率购买高价位区。这使得“健康用户”成为一个非常有吸引力的一个零售商和制造商。在我们的会议与专家的建议,这些产品组的基础上提出来以创建一个新的消费市场,并且我们已经启动了一个项目,而且是这样做的。图2:健康用户的倾向2)详细说明这些类别的重要性我们发现,这两种类型的用户表现出继续购买产品的高价位区的类别中的格局,在第10天一个以健康为导向的色拉油产品购买后购买。在前面的章节中,我们碰到一个规则,这表明“健康用户”具有一种强烈的倾向,购买高价位区所有类别的产品,同时我们也验证了“双用户”还具有购买倾向特别高价格区,他们倾向于继续购买这些。“双用户”这种趋势并不源于一个以健康为导向的色拉油产品的购买,而是被认为是更像是一个拥有忠诚于一个特定的类别进行试购买一个以健康为导向的色拉油市场上销售的产品消费者。特别是大比例的“双用户”继续购买牛奶的天价区,这可以说是真正的“健康用户”。色拉油是购买频率低于牛奶或鸡蛋,因此它可能是消费者购买这些产品往往可能往往也不会付出太多的关注色拉油产品。4结论在本文中,我们进行了初步的尝试,涉及图形挖掘在营销领域的消费者行为分析,购买历史,现实世界中工业数据转换成图形结构。用图形的结构化数据来代表消费者的行为,使得它可以有效地传达信息,具有时间序列属性和在多个购买设置购买多个产品组之间存在特定的关系。通过提取图形挖掘色拉油市场消费行为分析所发现的模式,我们能够定义一些特征模式。图形开采至今没有被应用到分析消费者的行为。我们的结果是令人鼓舞的,我们希望这是一个有价值的初始步骤向一种新型的消费行为分析,了解的机会,购买历史数据。我们的工作是未来的发展方向目前的情况后,参与者之间的沟通过程中了解的特定事件,通过使用图挖掘应用和性能进行评估的业务行动从各个流程出现。参考文献1. Hamuro, Y., Kawata, H., Katoh, N., Yada, K.: 一个机器学习算法分析字符串模式有助于从购买历史查询简单,可解释的业务规则.在探索科学的研究进展.LNAI Vol.2281.施普林格出版社,柏林海德堡纽约(2002)565-575.2. Hamuro, Y., H., Katoh, N., Ip, E. H., Cheung, S. L., Yada, K.: 结合信息融合与字符串模式分析:预测未来的购买行为的一种新方法(五).托拉(主编):在数据挖掘中的模糊和软计算研究信息融合. Vol.123.施普林格出版社.柏林海德堡纽约(2003)161-187.3.Inokuchi, A., Washio, T., Motoda, H.: 从图形数据中基于Apriori算法挖掘频繁子结构.PROC.欧洲第四会议上原则和实践数据库中的知识发现.(2000) 13-23. 4.Inokuchi, A., Washio, T., Nishimura, Y., Motoda, H.: 挖掘频繁结构图的总体框架.PROC.主动矿业国际研讨会.(2002) 23-30.专心-专注-专业
展开阅读全文