基于OLAP技术的图书销售智能分析系统

上传人:321****fg 文档编号:154060874 上传时间:2022-09-20 格式:DOCX 页数:60 大小:432.77KB
返回 下载 相关 举报
基于OLAP技术的图书销售智能分析系统_第1页
第1页 / 共60页
基于OLAP技术的图书销售智能分析系统_第2页
第2页 / 共60页
基于OLAP技术的图书销售智能分析系统_第3页
第3页 / 共60页
点击查看更多>>
资源描述
目 次次1绪论331.1引引言31.2WWEB环环境下的的OLAAP技术术的背景景和历史史现状332系统设设计的技技术创新新42.1数数据仓库库技术442.2OOLAPP 技术术62.3数数据挖掘掘的技术术62.4OOLAPP与数据据挖掘的的关系773系统解解决方案案83.1在在WEBB环境下下OLAAP 技技术的研研究83.2在在WEBB环境下下OLAAP 技技术的实实现方案案94图书销销售分析析系统的的总体设设计和实实现1114.1系系统的功功能1114.2数数据源设设计1224.2.1数据据库设计计124.2.1.11数据库库逻辑设设计1224.2.1.22数据库库结构设设计1334.2.2图书书销售 Anaalyssis Serrvicces 设计1774.2.2.11数据源源设计1174.2.2.22本系统统设计的的挖掘模模型1884.3系系统界面面设计1194.3.1会员员信息分分析界面面设计1194.3.2系统统图书分分析窗体体设计2275总结335参考文献献361 绪论1.1 引言随着在数数据库中中存储的的数据越越来越多多,人们们已经不不满足于于仅仅用用计算机机来实现现业务的的电子化化,而希希望从已已有的数数据中提提炼出信信息服务务于决策策人员。在在这种情情况下。OOLAPP作为一一种强有有力的分分析和决决策工具具,被越越来越多多的没、部部门使用用,同时时在OLLAP技技术上也也进行了了许多工工作。但但是主要要工作都都是集中中在如何何有效对对数据进进行分析析上。OOLAPP的数据据仓库是是为了解解决能从从大量的的数据中中得到有有用的信信息而做做出了很很大的贡贡献。对于一个个企业而而言,每每天都要要面临着着大量的的决策问问题,随随着企业业市场竞竞争的加加剧和信信息社会会需求的的发展,企企业从大大量数据据中提取取所需的的各类信信息就显显得越来来越重要要了,传传统的数数据库技技术是单单一的数数据库资资源,他他适合操操作型事事务处理理,但对对分析型型处理的的能力较较弱。近近几年来来,在信信息技术术领域兴兴起并日日益成熟熟的数据据仓库技技术以其其面向主主题组织织、存储储海量信信息,以以及在线线分析支支持组织织机构管管理决策策等优秀秀功能成成为和应应用的热热点。数据仓库库系统的的基本功功能是:数据获获取、数数据存储储和管理理、信息息的访问问。其最最终目的的是把分分散的、不不利于访访问的数数据转换换成集中中、统一一、随时时可用的的信息,即即为了决决策目标标将不同同形式的的数据集集合成为为一种特特殊的格格式,建建立起一一种新的的数据存存储体系系,使数数据操作作环境与与数据分分析环境境相到分分离。数数据仓库库利用了了计算机机和信息息技术(IIT)的的最新发发展,把把那些大大量的,分分散的企企业数据据进行集集成,并并从中把把企业决决策所需需要的信信息分离离出来,借借助OLLAP利利用存储储在数据据仓库中中的数据据,去进进行各种种分析操操作,并并以较为为直观易易懂的形形式将结结果返回回给用户户,能更更加有效效地支持持企业的的分析和和决策,从从而提高高决策的的质量与与速度。1.2 WEB环环境下的的OLAAP技术术的背景景和历史史现状WWW(WWorlld WWidee weeb)技技术的问问世,给给Intternnet带带来了新新的活力力,也得得到全世世界的认认可和信信赖。随随着WEEB的普普及,人人们之间间的信息息沟通更更加的快快捷和方方便。WWEB上上的访问问数据库库也得到到了日益益广泛的的应用,使使数据库库技术不不断地发发展和更更新。近近年来,随随着企业业信息化化的飞速速发展。企企业拥有有大量业业务数据据,但难难以及时时有效的的利用数数据信息息用来给给管理者者做决策策工作。数数据仓库库技术的的运用使使这个问问题迎刃刃而解,数数据仓库库正是由由数据库库演化而而来是为为了更好好的处理理和维护护WEBB上的庞庞大的访访问数据据和企业业中的业业务数据据。不仅仅如此,数数据仓库库技术还还有另一一方面的的用处即即使如何何让经营营管理者者更好的的使用数数据信息息来做决决策工作作,从而而给企业业管理者者或经营营者带来来经济效效益。为为了实现现这样的的目的还还要把OOLAPP技术运运用于数数据仓库库技术上上面。OOLAPP技术作作为一种种强大有有力的分分析和决决策工具具,被越越来越多多的企业业管理者者和经营营者使用用。为了了在OLLAP技技术上得得到更有有效的数数据信息息,并使使用了体体系结构构即是CC/S结结构。在在C/SS体系结结构中使使用OLLAP技技术已经经暴露出出很多问问题。为为了解决决这样的的问题而而进行对对WEBB环境下下的OLLAP技技术的研研究和实实现。在数据库库发展的的早期,因因为数据据量不大大而使数据据库技术术的查询询功能和和操作功功能没得得到明显显的区分分。但是是随着数数据库规规模的扩扩大,人人们对数数据的要要求也有有了其他他的想法法,比如如想取得得以往的的历史数数据来做做决策工工作使在在激烈的的社会经经营中取取得胜利利。管理理者或经经营用户户要想拿拿到这样样的历史史性有用用处的数数据信息息必须经经过复杂杂的查询询才能得得到,特特别是那那些高层层人员更更需要这这样有决决定性的的数据信信息来做做决策工工作。在在数据仓仓库中使使用OLLAP技技术正好好让这样样工作得得到满足足。但是是现在传传统的基基于C/S结构构的OLLAP体体系结构构却带来来很多问问题。传传统的基基于C/S结构构的OLLAP体体系结构构,其基基本流程程是由熟熟悉数据据库结构构的系统统管理员员对数据据库结构构进行分分析,根根据其业业务知识识将数据据库中的的表及字字段映射射为多维维结构,构构造由多多维结构构构成的的超立方方体,然然后根据据用户分分析员在在使用过过程中的的要求对对多维视视图进行行修改,从从而再次次构造超超立方体体,如此此循环往往复。这这种结构构在使用用过程中中暴露出出了不少少的问题题:如首首先,顾顾客使用用一次而而要进行行一次安安装和配配置,使使维护工工作量大大大的增增加。其其次,对对存放在在顾客端端的报告告的修改改也是很很复杂的的。再者者,其安安全性也也是很薄薄弱的。OOLAPP技术是是一种对对数据进进行多维维查询的的工具,主主要是给给管理者者和经营营者等决决策性人人员使用用的,所所以需求求是多变变性的。CC/S结结构不适适应需求求的多变变性所带带来的要要求,而而有足够够灵活性性的Innterrnett/Inntraanett的3层层结构适适应了OOLAPP技术对对需求的的多变性性的要求求。2 系统设计计的技术术创新2.1 数据仓库库技术根据数据据仓库概概念的含含义,数数据仓库库拥有以以下四个个特点:(1)面面向主题题。操作作型数据据库的数数据组织织面向事事务处理理任务,各各个业务务系统之之间各自自分离,而而数据仓仓库中的的数据是是按照一一定的主主题域进进行组织织。主题题是一个个抽象的的概念,是是指用户户使用数数据仓库库进行决决策时所所关心的的重点方方面,一一个主题题通常与与多个操操作型信信息系统统相关。(2)集集成的。面面向事务务处理的的操作型型数据库库通常与与某些特特定的应应用相关关,数据据库之间间相互独独立,并并且往往往是异构构的。而而数据仓仓库中的的数据是是在对原原有分散散的数据据库数据据抽取、清清理的基基础上经经过系统统加工、汇汇总和整整理得到到的,必必须消除除数据源源中的不不一致性性,以保保证数据据仓库内内的信息息是关于于整个企企业的一致的的全局信信息。(3)相相对稳定定的。操操作型数数据库中中的数据据通常实实时更新新,数据据根据需需要及时时发生变变化。数数据仓库库的数据据主要供供企业决决策分析析之用,所所涉及的的数据操操作主要要是数据据查询,一一旦某个个数据进进入数据据仓库以以后,一一般情况况下将被被长期保保留,也也就是数数据仓库库中一般般有大量量的查询询操作,但但修改和和删除操操作很少少,通常常只需要要定期的的加载、刷刷新。(4)反反映历史史变化。操操作型数数据库主主要关心心当前某某一个时时间段内内的数据据,而数数据仓库库中的数数据通常常包含历历史信息息,系统统记录了了企业从从过去某某一时点点(如开开始应用用数据仓仓库的时时点)到到目前的的各个阶阶段的信信息,通通过这些些信息,可可以对企企业的发发展历程程和未来来趋势做做出定量量分析和和预测。企业数据据仓库的的建设,是是以现有有企业业业务系统统和大量量业务数数据的积积累为基基础。数数据仓库库不是静静态的概概念,只只有把信信息及时时交给需需要这些些信息的的使用者者,供他他们做出出改善其其业务经经营的决决策,信信息才能能发挥作作用,信信息才有有意义。而而把信息息加以整整理归纳纳和重组组,并及及时提供供给相应应的管理理决策人人员,是是数据仓仓库的根根本任务务。因此此,从产产业界的的角度看看,数据据仓库建建设是一一个工程程,是一一个过程程。如图图2.1.1所示示。图2.11.1数数据仓库库体系结结构图数据源:是数据据仓库系系统的基基础,是是整个系系统的数数据源泉泉。通常常包括企企业内部部信息和和外部信信息。内内部信息息包括存存放于RRDBMMS中的的各种业业务处理理数据和和各类文文档数据据。外部部信息包包括各类类法律法法规、市市场信息息和竞争争对手的的信息等等等;数据的存存储与管管理:是是整个数数据仓库库系统的的核心。数数据仓库库的真正正关键是是数据的的存储和和管理。数数据仓库库的组织织管理方方式决定定了它有有别于传传统数据据库,同同时也决决定了其其对外部部数据的的表现形形式。要要决定采采用什么么产品和和技术来来建立数数据仓库库的核心心,则需需要从数数据仓库库的技术术特点着着手分析析。针对对现有各各业务系系统的数数据,进进行抽取取、清理理,并有有效集成成,按照照主题进进行组织织。数据据仓库按按照数据据的覆盖盖范围可可以分为为企业级级数据仓仓库和部部门级数数据仓库库(通常常称为数数据集市市)。 OLAPP服务器器:对分分析需要要的数据据进行有有效集成成,按多多维模型型予以组组织,以以便进行行多角度度、多层层次的分分析,并并发现趋趋势。其其具体实实现可以以分为:ROLLAP、MMOLAAP和HHOLAAP。RROLAAP基本本数据和和聚合数数据均存存放在RRDBMMS之中中;MOOLAPP基本数数据和聚聚合数据据均存放放于多维维数据库库中;HHOLAAP基本本数据存存放于RRDBMMS之中中,聚合合数据存存放于多多维数据据库中。前端工具具:主要要包括各各种报表表工具、查查询工具具、数据据分析工工具、数数据挖掘掘工具以以及各种种基于数数据仓库库或数据据集市的的应用开开发工具具。其中中数据分分析工具具主要针针对OLLAP服服务器,报报表工具具、数据据挖掘工工具主要要针对数数据仓库库。2.2 OLAPP 技术术联机分析析处理(OOLAPP)主要要有两个个特点,一一是在线线性(OOn-LLinee),表表现为对对用户请请求的快快速响应应和交互互式操作作,它的的实现是是由Clliennt/SServver这这种体系系结构来来完成的的,二是是多维分分析(MMultti-ddimeensiionaal),这也是是OLAAP技术术的核心心所在。OOLAPP的在线线性体现现在于用用户的交交互响应应和快速速响应,多多维性则则体现在在它建立立在多维维视图的的基础上上,对数数据进行行由浅到到深的分分析。OOLAPP的用户户是企业业中的专专业分析析人员及及管理决决策人员员,他们们在分析析业务经经营的数数据时,从从不同的的角度来来审视业业务的衡衡量指标标是一种种很自然然的思考考模式。例例如分析析销售数数据,可可能会综综合时间间周期,产产品类别别,分销销渠道,区区域分布布,客户等多多种因素素来考虑虑。这些些分析角角度虽然然可以通通过报表表来反映映,但是是每一个个分析的的角度可可以生成成一张报报表,各各个分析析角度的的不同组组合又可以生生成不同同的报表表,使得得IT人人员的工工作量相相当大,而而且往往往难以跟跟上管理理决策人人员思考考的步伐伐。所以以OLAAP的多多维性较较好地满满足了企企业管理理人员的的需要。管管理人员员可对OOLAPP进行操操作,即即对多维维数据集集中的数数据进行行切片,切切块,旋旋转,上上卷和下下钻操作作,以对对数据进进行分析析,让用用户多角角度、多多侧面地地去观察察数据仓仓库中的的数据,从从而深入入了解数数据仓库库中数据据所蕴含含的信息息,并找找出隐含含在数据据中的商商业模式式。根据综合合性数据据的组织织方式的的不同,目目前常见见的OLLAP主主要有基基于多维维数据库库的MOOLAPP及基于于关系数数据库的的ROLLAP两两种。MMOLAAP是以以多维的的方式组组织和存存储数据据,ROOLAPP则利用用现有的的关系数数据库技技术来模模拟多维维数据。在在数据仓仓库应用用中,OLAAP工具具一般是是数据仓仓库应用用的前端端工具,同同时OLLAP工工具还可可以配合合数据挖挖掘进行行使用,增增加决策策分析预预测功能能。数据仓库库的基本本任务是是使用获获得的数数据来进进行大量量的分析析,以生生成支持持用户制定定战略决决策的信信息。为为了让数数据仓库库能作有有意义的的分析,数数据必须须以某种种方法被被映射,以以便用户户能利用用一些数数据来分分析随着着时间变变化各商商业维度度的关键键指标的的数值。2.3 数据挖掘掘的技术术数据挖掘掘是一种种数据分分析工具具,它从从大量的的、不完完全的、有有噪声的的、模糊糊的、随随机的数数据中提提取人们们感兴趣趣的数据据模式、数数据的普普遍关系系及其隐隐含在其其中的、人人们事先先不知道道的、但但又是潜潜在有用用的信息息和知识识,提取取的知识识表示为为概念、规规则、规规律、模模式等形形式,其其目的是是帮助决决策者寻寻找数据据间潜在在的关联联,发现现被忽略略的要素素,而这这些信息息对预测测趋势和和决策行行为将起起到一定定的支持持作用。数据库中中的数据据挖掘是是一个多多步骤的的处理过过程,这这些步骤骤有:(1)数数据定义义阶段,主主要了解解相关领领域的有有关情况况,熟悉悉背景知知识,弄弄清楚用用户决策策分析对对信息的的要求。(2)数数据提取取阶段,根根据要求求从数据据库中提提取相关关的数据据。(3)数数据预处处理阶段段,主要要对前一一阶段产产生的数数据进行行再加工,检检查数据据的完整整性及数数据的一一致性,对对其中的的噪音数数据进行行处理,对对缺损的的数据进进行填补补。(4)数数据挖掘掘阶段,主主要是运运用选定定的知识识发现算算法,从从数据中中提取出出用户所所需要的的知识,这这些知识识可以用用一种特特定的方方式表示示或使用用一些常常用的表表示方式式。(5)知知识评估估阶段,将将发现的的知识以以用户能能了解的的方式呈呈现,根根据需要要对知识识发现过过程中的的某些处处理阶段段进行优优化,知知道满足足要求。2.4 OLAPP与数据据挖掘的的关系(1)OOLAPP与数据据挖掘都都属于分分析型工工具,两两者的区区别在于于:数据挖掘掘的分析析过程是是自动的的,用户户不必提提出确切切的问题题,只需需用挖掘掘工具去去挖掘隐隐藏在海海量数据据中的模模式并预预测未来来的趋势势,这种种方式有有利于发发现未知知的事实实,但缺缺乏引导导的数据据挖掘,往往往所发发现的许许多模式式实用性性很差。OLAPP是一种种自上而而下、不不断深入入的验证证型分析析工具,它它常常以以用户的的假设为为基础对对数据查查询与分分析,进进而提取取出相关关的信息息。所以以OLAAP在数数据分析析方面存存在着一一定的局局限性,即即数据仓仓库的结结构设计计的模式式不同决决定了OOLAPP对数据据的分析析效果与与分析层层次;同同时由于于OLAAP是用用户驱动动的,用用户对所所分析问问题认识识和理解解程度在在一定程程度上会会影响到到最终的的分析结结果。从对数据据分析的的角度看看。OLLAP位位于较浅浅的层次次;由于于数据挖挖掘可以以发现OOLAPP所不能能发现的的更为复复杂而细细致的信信息,因因而处于于相对较较高的层层次。(2)OOLAPP与数据据挖掘的的相互作作用体现现在以下下几个方方面:OLAPP与数据挖挖掘同作作为数据据分析工工具,二二者相比比互有优优劣。数数据挖掘掘结果的的无法预预测性及及挖掘结结果是否否有效等等不足,决决定了数数据挖掘掘需要另另外一个个分析工工具作辅辅助,对对其结果果进行验验证。OOLAPP是针对对多维数数据库而而开发的的分析工工具,可可以对多多维数据据进行较较为全面面的映射射。所以以在数据据仓库的的基础上上,OLLAP与与数据挖挖掘有了了结合的的可能,即即数据挖挖掘的结结果可以以通过OOLAPP进行验验证,数数据挖掘掘在有验验证的前前提下,其其挖掘结结果将呈呈现螺旋旋式上升升的过程程,逐步步从模糊糊、混沌沌走向清清晰、客客观,进进而表现现为有价价值的知知识。成功的数数据挖掘掘需要对对数据进进行探索索性的分分析。挖挖掘所需需的数据据范围也也许只是是数据仓仓库的一一部分,在在此意义义上,OOLAPP对多维维数据的的钻取、旋旋转等操操作同样样可以应应用于数数据挖掘掘的过程程中,作作为基于于数据仓仓库挖掘掘的引导导步骤。3 系统解决决方案3.1 在WEBB环境下下OLAAP技术的的研究长久以来来,对数数据库的的操作都都有两种种不同的的应用方方式。一一种是日日常的对对数据的的操作型型应用,另另一种是是对数据据的查询询型应用用。这两两种应用用有着很很大的区区别,如如表3.1.11。操作型应应用查询型应应用涉及的表表或字段段不多涉及大量量的表和和字段以增删操操作为主主,查询询量少不修改数数据,但但进行大大量的查查询以业务人人员使用用为主,主主要是细细节信息息面向管理理人员或或决策人人员,关关注汇总总信息和和导出信信息使用当前前数据可能用到到大量的的历史信信息表3.11.1两两种应用用的区别别在数据库库发展的的早期,因因为数据据量不大大,查询询型应用用和操作作型应用用的区别别还不太太明显。但但随着数数据库规规模的逐逐渐增大大,人们们希望利利用已经经有的历历史数据据来使自自己在激激烈的竞竞争中取取胜,分分析人员员经常是是希望从从多个不不同的角角度来观观察一个个或多个个指标的的值,并并且希望望从中找找到这些些指标之之间的关关系,这这些要求求导致查查询复杂杂度越来来越高,特特别是这这些查询询请求是是分析人人员在分分析过程程中根据据显示的的数据而而实时产产生的。这这样的要要求是业业务系统统无法胜胜任的。而而OLAAP技术术就能够够解决这这样的查查询要求求。OLAPP操作最最主要的的一点是是要给分分析人员员提供一一个多维维数据超超立方体体,分析析人员不不需要了了解实际际的数据据库结构构,他所所看见的的是与其其习惯的的企业逻逻辑结构构相似的的多维结结构。根根据他所所关注的的目的的的不同,在在多维结结构内今今昔感多多维操作作,如钻钻取、上上挖、漂漂移、切切片、切切块等。数数据库管管理人员员的责任任就是根根据企业业的组织织结构和和实际使使用人员员的要求求,在已已经有的的数据仓仓库上构构造多维维数据库库及多维维视图。传统的基基于C/S结构构的OLLAP体体系机构构,其基基本流程程是由熟熟悉数据据库结构构的系统统管理员员对数据据库结构构进行分分析,根根据其业业务知识识将数据据库中的的表及字字段映射射为多维维结构,构构造由多多维结构构构成的的超立方方体,然然后根据据用户分分析人员员在使用用过程中中的要求求对多维维视图进进行修改改,从而而再次构构造超立立方体,如如此循环环往复。这这种结构构在使用用过程中中暴露出出了不少少的问题题:(1)在在每一个个客户端端都要安安装和配配置多维维查询软软件。维维护工作作量很大大;(2)报报告内容容要根据据使用者者在使用用过程中中碰到的的要求进进行修改改,因此此要维护护客户端端的报告告内容一一致也是是很复杂杂的;(3)因因为报告告存放在在客户端端。因此此可能会会被修改改,从而而安全性性也很不不好。出现这些些问题的的根本原原因是没没有注意意到OLLAP的的特殊性性:OLLAP作作为一个个多维查查询工具具,不同同于传统统的业务务系统,主主要是给给管理和和决策人人员使用用的,需需求是多多变的,所所以ITT人员不不可能依依次设计计出符合合分析人人员要求求的超立立方体,需需要在使使用过程程中根据据要求对对超立方方体不断断进行调调整和修修改,但但是这种种多变性性是C/S结构构所不能能适应的的。而且且有基于于Intternnet/Inttrannet的的3层结结构才具具有足够够的灵活活性。WEB服服务器负负责完成成浏览器器与OLLAP服服务器,数数据仓库库系统之之间的通通信连接接。如图图3.11.1所所示。一一般来说说,WEEB服务务器通过过使用CCGI脚脚本、WWEB服服务器AAPI、应应用APPI和数数据库AAPI等等,管理理浏览器器的通信信。在浏浏览器端端,通过过HTMML、DDMX、AActiiveXX控件、CC#.NNET来来完成与与用户的的交互截截面和控控件。在实现基基于WEEB的OOLAPP应用时时,往往往采用自自顶向下下的设计计。首先先要确定定用户如如何在浏浏览器中中的到报报表信息息,然后后再给出出一系列列的过程程完成基基于浏览览器的OOLAPP操作。这这些过程程应当包包括发布布信息,提提供HTTTP对对数据库库或应用用服务器器的动态态数据请请求,设设计支持持分析功功能的界界面。在客户端端基于WWEB浏浏览器的的OLAAP报表表被分为为几个层层次,其其中包括括没有分分析功能能的静态态报表和和能够进进行分析析的OLLAP应应用界面面,如维维的旋转转,数据据的钻取取等。另另外,特特别要提提到的是是,标准准的HTTML界界面缺乏乏操作的的灵活与与方便。CC#.NNET和和ActtiveeX控件件的使用用会大大大提高用用户截面面的友好好程度,用用户通过过简单的的操作就就可以完完成“旋转”、“钻取”的操作作。数据仓库系统OLAP服务器WEB服务器客户浏览器CGII APPIC#.NNET、ActiveX 控件图3.11.1基基于WEEB的OOLAPP结构图图3.2 在WEBB环境下下OLAAP技术的的实现方方案OLAPP专门用用于支持持复杂的的决策分分析,支支持信息息管理和和业务管管理人员员决策活活动的一一种决策策分析工工具。它它可以根根据分析析人员的的要求,迅迅速、灵灵活地对对大量数数据进行行复杂的的查询处处理,并并且以直直观的、容容易理解解的形式式将查询询结果提提供给各各种决策策人员,使使他们迅迅速、准准确地掌掌握企业业的运营营情况,了了解市场场需求。而而要进行行OLAAP多维维数据分分析就需需要根据据分析需需求,同同时结合合数据仓仓库中的的数据结结构和特特点建立立OLAAP多维维模型。以以超市销销售系统统为例子子,并对对该例子子的OLLAP销销售多维维模型进进行了设设计,如如图3.2.11。时间编号年季度月日食品编号时间编号客户编号食品名称销售数量销售额平均价格食品编号食品类别编号食品名称客户编号区域编号客户名称食品类别编号食品类别名称区域编号省市销售事实实表 食食品维表表食品类别别维表客户维表表区域维表表时间维表表 图3.2.11 超市市销售分分析的OOLAPP模型从图中可可以看出出在超市市销售分分析的OOLAPP模型中中有一个个销售事事实表,在在该事实实表中每每个元组组只存储储了一些些指向各各个维表表的指针针(即外外键,时时间编号号、食品品编号、客客户编号号等)和和一些相相应的测测量数据据(度量量值),销销售数量量、销售售额和平平均价格格,而与与这些外外键相对对应的主主键则分分别存放放不同的的维表中中(时间间维表、客客户维表表、食品品维表等等)。对对事实表表的查询询就是获获取指向向维表的的指针,当当对事实实表的查查询与对对维表的的查询结结合起来来的时候候,就可可以检索索大量的的信息。一个完整整的基于于WEBB的OLLAP销销售分析析系统由由三方面面组成。第第一,提提取、清清洗数据据组成数数据仓库库;第二二利用OOLAPP引擎建建立相应应的销售售分析的的OLAAP立方方体;第第三使用用前端开开发工具具,在WWEB上上访问OOLAPP立方体体中包含含的对象象和集合合。这里里选用了了SQLL SEERVEER 220055 Annalyysiss Seerviicess作为数数据仓库库支撑平平台,SSQL SERRVERR 20005的的Anaalyssis Serrvicces 是一个个管理多多维数据据集的服服务器,数数据源并并抽取数数据,实实现高效效地将客客户数据据加载到到客户数数据仓库库中;服服务器支支持MDDOLAAP、RROLAAP和HHOLAAP三种种存储模模式,用用户自己己定义使使用的存存储模式式,定义义各个维维度并建建立销售售多维数数据集,从从而完成成整个销销售过程程。4 图书销售售分析系系统的总总体设计计和实现现4.1 系统的功功能本系统的的功能可可以划分分为会员员分析和和图书分分析两大大部分(如图44.1.1图书书小时分分析系统统功能结结构图。图书销售分析系统会员分析图书分析分析会员级别分析会员消费分析会员类型分析图书推荐销售趋势分析销售关联分析图书销量分析图书定价分析图4.11.1图图书销售售分析系系统功能能结构图图其中会员员分析是是对书店店注册会会员的信信息进行行分析,具具体功包包括:(1)会会员级别别分析:根据会会员的个个人信息息来预测测该会员员最有可可能成为为哪级会会员。(2)会会员消费费分析:根据会会员的个个人信息息来预测测该会员员在书店店的消费费类型。(3)会会员类型型分析:根据会会员的个个人信息息和消费费记录来来对会员员进行自自动分类类。(4)图图书推荐荐:根据据会员的的以往购购书记录录来向推推荐其他他可能感感兴趣的的图书。其中图书书分析则则是对书书店图书书的信息息进行分分析,具具体功能能包括:(1)销销售趋势势分析:根据图图书的历历史销售售信息来来预测未未来的销销售额。(2)图图书销量量分:根根据图书书的基本本信息来来预测其其销量。(3)销销售关联联分析:分析哪哪些图书书经常会会被一同同销售。(4)图图书定价价分析:根据图图书的基基本信息息来估算算定价。4.2 数据源设设计4.2.1 数据库设设计4.2.1.1 数据库逻逻辑设计计根据系统统的需求求分析定定义系统统中的实实体,并并采用EE-R图图来(如如图2.2.11图书销销售E-R图)表表现实体体之间的的逻辑关关系。在在关系图图中主要要有会员员和图书书两个实实体,会会员买书书的一些些情况和和推荐书书的情况况。图书书中包含含了图书书的销售售量等相相关信息息。会员会员号姓名入会时间级别生日地区地址性别电话邮箱积分图书国际标准图书号图书号光盘书名存储量出版社出版日期价格上架时间页数条码号买书推荐书销售数据销售量会员号销售时间推荐数据书号类型折扣情况级别折扣率NNNN级别号 图4.22.1图图书销售售E-RR图4.2.1.2 数据库结结构设计计在逻辑设设计的基基础上,进进行了结结构设计计,数据据库的设设计主要要有五个个数据表表和三个个视图,下下面分别别对五个个数据表表和三个个视图进进行说明明。(1)会会员表:主要是是记录会会员的姓姓名、性性别、地地址、电电话号码码、会员员号、会会员的级级别、会会员的入入会时间间。这些些对视图图进行查查询有很很大用处处,同时时对分析析进行预预测提供供了可靠靠的信息息资源。(2)图图书表:主要是是记录图图书的名名字、出出版社、出出版时间间、国际际标准图图书号、内内带光盘盘、存储储量、上上架日期期、条码码、价格格、书的的页数(3)买买书的记记录表:主要记记录会员员买书的的情况,里里面记录录会员的的会员号号、买书书的时间间、买书书消费额额。(4)折折扣表:主要是是记录会会员的级级别所打打的折扣扣。表内内包括级级别和折折扣率。(5)图图书销售售情况表表:主要要记录图图书销售售的情况况。主要要记录图图书号、图图书的销销售额、图图书销售售的数量量、图书书销售的的折扣。(6)图图书视图图:主要要是进行行图书与与会员的的综合查查询,它它包含了了图书的的基本信信息和销销售情况况汇总。(7)图图书销售售视图:主要是是对图书书的销售售情况的的综合查查询,它它包含了了图书的的销售细细明信息息。(8)图图书每周周销售视视图:主主要是对对图书进进行每周周的销售售情况的的综合查查询,它它包含了了图书每每周销售售销量的的信息。以下是五五个数据据表:表表4.22.1会会员表、表表4.22.2图图书表、表表4.22.3买买书的记记录表、表表4.22.4折折扣表、表表4.22.5图图书销售售表。列名数据类型型允许空IDIntNameeNvarrchaar(220)LeveelsSmalllinntYRegTTimeeSmallldaatettimeeYGendderBitYBirtthdaaySmallldaatettimeeYDegrreeNvarrchaar(220)YAreaaNvarrchaar(220)YAddrresssNvarrchaar(2256)YTeleephooneNvarrchaar(550)YEmaiilNvarrchaar(550)YScorreIntY表4.22.1会会员表列名数据类型型允许空IDIntISBNNNchaar(110)NameeNvarrchaar(2256)CateegorryIDDIntYAuthhorNvarrchaar(1100)YPresssNvarrchaar(550)YPubllishhDatteSmallldaatettimeeYPricceSmalllmooneyyPageesSmalllinntYBarccodeeNchaar(113)CDBitYStorrageeIntYShellfDaateSmallldaatettimeeY表4.22.2图图书表列名数据类型型允许空IDIntCusttomeerIDDIntYSumSmalllmooneyyYTimeesmallldaatettimee表4.22.3买买书的记记录表列名数据类型型允许空LeveelsIntDisccounntFloaat表4.22.4折折扣表列名数据类型型允许空IDIntSelllIDIntBookkIDIntNumbberIntDisccounntFloaatYSumSmalllmooneyyY表4.22.5图图书销售售表以下是三三个视图图表:表表4.22.6图图书视图图、表44.2.7图书书销售视视图、表表4.22.8图图书每周周销售视视图。列别名表输出排序类型型排序顺序序分组依据据筛选器IDBookkY 升序1Grouup BByNameeBookkYGrouup BByCateegorryBookkCattegooryYGrouup BByPresssBookkYGrouup BByPricceBookkYGrouup BByRageesBookkYGrouup BByCDBookkYGrouup BByNumbberSelllNummberrSelllIteemYSumSumSelllSummSelllIteemYSumShellfDaateBookkYGrouup BBy表4.22.6图图书视图图表4.22.6图图书视图图的综合合查询的的内部代代码为:SELEECTTTOP(1000)PERRCENNT ddbo.Boook.IID, dboo.Boook.Namme, dboo.BoookCCateegorry.CCateegorry, dboo.Boook.Preess, dbbo.BBookk.Prricee, ddbo.Boook.PPagees, dboo.Boook.CD,SUM(dboo.SeellIItemm.Nuumbeer)AASSeellNNumbber,SUMM(dbbo.SSelllIteem.SSum)ASSeellSSum, dbbo.BBookk.ShhelffDatteFROMM ddbo.Boook IINNEER JJOINNdbo.BoookCaateggoryy ONN dbbo.BBookk.CaateggoryyID = ddbo.BoookCaateggoryy.IDD INNNERR JOOINdbo.SelllIttem ON dboo.Boook.ID = ddbo.SelllIttem.BoookIDDGROUUP BBY ddbo.Boook.IID, dboo.Boook.Namme, dboo.BoookCCateegorry.CCateegorry, dboo.Boook.Preess, dbbo.BBookk.Prricee, ddbo.Boook.PPagees, dboo.Boook.CD,dbo.Boook.SShellfDaateORDEER BBY ddbo.Boook.IID列别名表输出排序类型型排序顺序序分组依据据筛选器IDSelllIteemYIDSelllIDSelllYCusttomeerIDDSelllYTimeeSelllYBookkIDSelllIteemYISBNNBookkYNameeBookkYPresssBookkYPricceBookkYNumbberSelllIteemYDisccounntSelllIteemYSumSelllIteemY表4.22.7图图书销售售视图表4.22.7图图书销售售视图的的内部代代码和关关系图(图图2.22.2图图书销售售关系图图):SELEECT dbbo.SSelllIteem.IID, dboo.Seell.ID AS SelllIDD, ddbo.Selll.CCusttomeerIDD, ddbo.Selll.TTimee, ddbo.SelllIttem.BoookIDD, ddbo.Boook.IISBNN, ddbo.Boook.NNamee, ddbo.Boook.PPresss, dbbo.BBookk.Prricee, ddbo.SelllIttem.Nummberr, ddbo.SelllIttem.Disscouunt, dbbo.SSelllIteem.SSumFROMM dboo.Seell INNNER JOIIN dboo.SeellIItemm ONN dbbo.SSelllIteem.SSelllID = ddbo.Selll.IID IINNEER JJOINN dboo.Boook ON dboo.Boook.ID = ddbo.SelllIttem.BoookIDD图4.22.2图图书销售售关系图图列别名表输出排序类型型排序顺序序分组依据据DATEEPARRT(wweekk,dbbo.sselll.Tiime)WeekkY升序1Grouup BByIDBookkY升序2Grouup BBySumSelllSummSelllIteemYSum表4.22.8图图书每周周销售视视图表2.22.8图图书每周周销售视视图的内内部代码码为:SELEECT TOOP (1000) PPERCCENTT DAATEPPARTT(weeek, dbbo.SSelll.Tiime) ASS Weeek, dbbo.BBookk.IDD, SSUM(dboo.SeellIItemm.Suum) AS SelllSuumFROMM dboo.Seell INNNER JOIIN dboo.SeellIItemm ONN dbbo.SSelll.IDD = dboo.SeellIItemm.SeellIID IINNEER JJOINN dboo.Boook ON dboo.SeellIItemm.BoookIID = dbbo.BBookk.IDDGROUUP BBY DDATEEPARRT(wweekk, ddbo.Selll.TTimee), dboo.Boook.IDORDEER BBY WWeekk, ddbo.Boook.IID 设设计好了了以上的的表和视视图是为为了对其其中的数数据进行行预测和和分析,这这些创建建给以后后的实现现部分做做了很好好的铺垫垫。4.2.2 图书销售售 Annalyysiss Seerviicess 设计计4.2.2.1 数据源设设计 在数据据源设计计运用了了数据挖挖掘技术术,首先先用“数据源源向导”将数据据中表2.22.1会会员表、表表2.22.6图图书视图图、表22.2.7图书书销售视视图、表表2.22.8图图书每周周销售视视图加入入项目的的数据源源试图中中。其中中会员表表中存储储了书店店注册会会员的基基本个人人信息;同时为为了支持持数据的的分析,设设计中还还要向会会员表中中增加两两个计算算列。两两个计算算列分别别为Agge和DDayCConssumee。它们们的表达达式分别别为“YEAAR(GGETDDATEE()-YEAAR(ddbo.Cusstommer.Birrthdday)”和“CASST(SScorre AAS DDeciimall)/DDATEEDIFFF(DDAY,ReggTimme,GGETDDATEE()”是用来来计算会会员的年年龄和会会员的积积分除以以其注册册天数以以得到该该会员的的日平均均消费金金额。合合理地使使用计算算列,能能够大大大方便挖挖掘结构构和挖掘掘模型的的创建,同同时避免免修改源源数据库库中的基基础表格格和视图图。在AAnallysiis SServvicees项目目中也需需要向图图书表中中加入两两个计算算器分别别DayySelllNuumbeer和DDaySSelllSumm,计算算表达式式为:“SelllNuumbeer/DDATEEDIFFF(DDAY,SheelfDDatee,GEETDAATE()”、“SelllSuum/DDATEEDIFFF(DDAY,SheelfDDatee,GEETDAATE()”。它们们是用来来计算图图书日均均销量。为了对会会员购书书的有关关信息进进行挖掘掘,在数数据源视视图中还还应将会会员表和和图书销销售视图图关联起起来。如如图4.2.33数据源源视图图图书销售售图。如图4.2.33数据源源视图图图书销售售图数据源的的设计对对以后数数据挖掘掘起到决决定的作作用。在在本设计计中使用用了多个个数据挖挖掘的方方法。这这些方法法大大方方便了界界面的分分析和预预测。管管理者通通过预测测的信息息知道内内部图书书销售的的各个情情况和了了解会员员的相关关活动信信息。4.2.2.2 本系统设设计的挖挖掘模型型(1)贝贝叶斯挖挖掘模型型:是用用来对会会员级别别的分析析。主要要运用了了“Miccrossoftt Naavee Baayess”挖掘技技术对数数据源视视图中的的会员表表作为事事例对LLeveels和和DayyConnsumme列作作为可预预测列进进行预测测。(2)决决策树挖挖掘模型型:来分分析会员员的消费费水平最最有可能能处在哪哪个区间间,主要要运用“Miccrossoftt 决策策树”挖掘技技术对数数据源视视图中的的会员表表作为事事例对LLeveels进进行忽略略,而对对DayyConnsumme进行行可预测测。(3)聚聚类分析析挖掘模模型:是是用来分分析会员员的年龄龄和学历历进行分分析。是是忽略AAreaa、Leevells、GGendder,而Agge和DDegrree作作为输入入列对DDayCConssumee进行预预测。(4)关关联规则则挖掘模模型:用用于分析析会员与与图书之之间的关关联,进进而向会会员推荐荐其他可可能感兴兴趣图书书。在设设计中用用会员表表作为事事例表嵌嵌套图书书销售表表,Geendeer、AAge、DDegrree、AAreaa作为输输入列,BBookkSelll进行行预测。(5)时时序挖掘掘模型:是用于于图书的的分析,用用每周销销售视图图来做事事例,IID和 Weeek作为为输入键键对SeellSSum进进行预测测。(6)神神经网络络挖掘模模型:是是预测新新书的销销量,图图书表作作为事例例,Caateggoryy、Prresss、Prricee、Paagess和CDD列进行行输入,对对DayySelllNuumbeer进行行预测。(7)顺顺序分析析挖掘模模型:用用于实现现图书销销售的关关联分析析,会员员表作为为事例,图图书销售售表销售售表作为为嵌套表表,对NNamee进行预预测。(8)线线性回归归挖掘模模型:是是对图书书价格的的预测,图图书表作作为事例例,Paagess为输入入列,对对Priice进进行预测测。4.3系系统界面面设计4.3.1会员员信息分分析界面面设计对于会员员信息分分析的WWinddowss窗体设设计视图图如图44.3.1所示示。在对对应的窗窗体类CCusttomeerAnnalyysissForrm.ccs中定定义了如如下成员员字段:prottecttedSSqlCConnnecttionn _cconnnDattabaase;prottecttedAAdommdCoonneectiion _coonnAAnallysiis;prottecttedAAdommdCoommaand _cmmd;其中前两两个数据据连接对对象分别别指向SSQL Serrverr数据库库BoookSeell和和Anaalyssis Serrverr数据库库,后一一个数据据命令对对象则用用于在AAnallysiis SServvicees数据据库上执执行DMMX查询询对象的的创建都都在窗体体的构造造函数中中完成:publlic CusstommerAAnallysiisFoorm(SqllConnnecctioon cconnnecttionnDattabaase, AddomddConnnecctioon cconnnecttionnAnaalyssis) _connnDaatabbasee = connnecctioonDaatabbasee; _connnAnnalyysiss = connnecctioonAnnalyysiss; _cmdd = _coonnAAnallysiis.CCreaateCCommmandd(); IInittiallizeeCommponnentt(); 窗体在初初始化和和关闭将将打开和和关闭相相应的数数据连接接;窗体体的初始始化过程程同时还还使用SSQL数数据命令令将所有有会员的的ID号号载入到到“会员编编号”组合框框(cmmbcuustoomerrID)中中:privvateevoiid CCusttomeerAnnalyysissForrm_LLoadd(obbjecct ssendder, EvventtArggs ee) SqlCCommmandd cmmd1 = nnewSSqlCCommmandd(SEELECCT DDISTTINCCT ID FRROM Cuustoomerr OORDEER BBY ID, _coonnDDataabasse);SqlDDataaReaaderr reeadeer1 = ccmd11.ExxecuuteRReadder();whille (reaaderr1.RReadd() cmbbCusstommerIID.IItemms.AAdd(reaaderr100); rreadder11.Cllose
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 市场营销


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!