毕业设计论文电子商务推荐系统关键技术研究2

上传人:痛*** 文档编号:67523491 上传时间:2022-03-31 格式:DOC 页数:40 大小:349KB
返回 下载 相关 举报
毕业设计论文电子商务推荐系统关键技术研究2_第1页
第1页 / 共40页
毕业设计论文电子商务推荐系统关键技术研究2_第2页
第2页 / 共40页
毕业设计论文电子商务推荐系统关键技术研究2_第3页
第3页 / 共40页
点击查看更多>>
资源描述
本科生毕业论文(设计) 题 目: 电子商务推荐系统关键技术研究 学 系: 信息科学系 专 业: 计算机科学与技术 学生姓名: 学 号: 06052067 指导教师: (职 称)二 年 月表一 毕业论文(设计)开题报告论文(设计)题目:电子商务推荐系统关键技术的研究(简述选题的目的、思路、方法、相关支持条件及进度安排等)目的:随着互联网的普及和信息技术的日新月异,网络信息不断膨胀,电子商务规模不断扩大,为用户提供越来越多的商品选择。然而用户面对大量的商品信息往往会束手无策,经常迷失在大量的商品信息空间中。信息超载增加了用户购买所需商品的难度,用户在找到自己需要的商品之前,必须浏览大量的无关信息。因此,用户对个性化信息服务的要求越来越高。为了满足用户需求,电子商务推荐系统应运而生。不过,随着推荐系统的应用普及,出现了许多问题与挑战,包括:推荐质量、推荐实时性、数据稀疏性、冷启动等。针对这些问题,本文着重对推荐系统及其关键的推荐技术进行了研究。思路与方法:(1)查阅相关资料,对于目前推荐系统的发展进行一番研究。(2)对于推荐系统的关键推荐技术以及各种技术所遇到的问题进行研究。(3)分析推荐系统的推荐算法,以此来对推荐系统达到感性上的认识。相关支持条件:主要利用学校提供的各种网络数据库资源,以及Google学术搜索引擎等进行论文检索,同时可以在图书馆查阅相关书籍。进度安排:2009年11月2010年 1 月:阅读论文,查阅相关资料,明确选题;2010年 1 月2010年 2 月:研究推荐算法、分析推荐算法;2010年 2 月2010年 3 月:撰写论文初稿;2010年 3 月2010年 4 月:对论文初稿进行修订,完成论文终稿。学生签名: 年 月 日指导教师意见: 1、同意开题( ) 2、修改后开题( ) 3、重新开题( ) 指导教师签名: 年 月 日表二 毕业论文(设计)过程检查情况记录表指导教师分阶段检查论文的进展情况(要求过程检查记录不少于3次):第1次检查学生总结:开始撰写论文,整体思路大致已经完成。指导教师意见:第2次检查学生总结:论文架构重新调整,思路进一步完善。指导教师意见:第3次检查学生总结:论文内容进行了调整,对算法部分进行了更加规范的描述,使论文整体上更加符合要求。指导教师意见:第4次检查学生总结:论文细节处有错误或缺陷,排版有些许问题,进行了查漏补缺,在衣杨老师孜孜不倦的教导下完成了正式的版本。指导教师意见: 学生签名: 年 月 日指导教师签名: 年 月 日总体完成情况指导教师意见:1、按计划完成,完成情况优( )2、按计划完成,完成情况良( )3、按计划完成,完成情况中等( )4、基本按计划完成,完成情况及格( )5、完成情况不及格( )指导教师签名: 年 月 日表三 本科毕业论文(设计)成绩评定表(试行)学生姓名学号专业成绩优 秀 良 好 中 等 及 格 不 及 格 比例成绩分级(10090分)(8980分) (7970分)(6960分)(60分)选 题 有相当强的理论与实践意义。选题有比较强的理论与现实意义。选题有一定的理论或实践意义。选题意义不大但无不妥之处。选题不当,没有意义。20%创 新 与 论 证1.用新方法进行调查研究,采用的资料较新,研究结果有独创性。2.论证思路清楚,逻辑性强;专业知识比较扎实;遵守学术规范,研究所得结论可靠。1.研究方法及视角有一定新意。2.论证思路较清楚,有一定的逻辑性;结论比较可靠。1.研究方法及视角均无创新,但尚能从他人的观点中发现问题。2.论证基本清楚,结论有一定可靠性。1.研究方法及视角均无创新之处,所得出的结论无明显价值。2.论证不够严密,超过20%的篇幅表述不清楚。1.研究方法及视角水平均一般,所得出的结论无价值。2.论证不严密,超过40%的篇幅表述不清楚。50%写 作 水 平条理清晰,文字流畅;有丰富的文献材料、充足的理论依据和数据。条理较为清楚,文字流畅;有文献材料、充足的理论依据和数据。文字流畅;有一些文献材料、理论依据和数据。文字尚算流畅;文献材料、理论依据和数据较少。基本概念不清、错别字多;文献材料、理论依据和数据少。20%格 式 规 范格式正确,完全符合学术规范及学院的要求,打印规范清晰。格式正确,符合学院论文格式的要求,打印清晰。格式正确,基本符合格式要求,打印规范清楚,但个别地方有错漏。格式大部分符合论文格式的要求,并有少量错漏。格式不符合论文格式要求,打印不清晰,错漏较多。10%指导教师签名成绩(按百分制评分):学术诚信声明本人所呈交的毕业论文,是在导师的指导下,独立进行研究工作所取得的成果,所有数据、图片资料均真实可靠。除文中已经注明引用的内容外,本论文不包含任何其他人或集体已经发表或撰写过的作品或成果。对本论文的研究作出重要贡献的个人和集体,均已在文中以明确的方式标明。本毕业论文的知识产权归属于培养单位。本人完全意识到本声明的法律结果由本人承担。本人签名: 日期: 电子商务推荐系统关键技术研究摘要 随着Internet的迅速发展和电子商务的普及,电子商务系统中的信息“超载”现象越来越严重。 电子商务系统在为用户提供越来越多的选择的同时,其结构也变得更加复杂。面对商品信息的“海洋”,用户经常会迷失在其中,无法顺利找到自己需要的商品。在准确识别客户消费偏好的基础上,电子商务推荐系统可以向客户提供商品信息和建议,模拟销售人员帮助客户完成购买过程,帮助用户找到他们真正所需购买的商品。近年来虽然电子商务推荐系统在理论和实践中都得到了很大发展,然而电子商务推荐系统仍面临着一系列挑战。针对电子商务推荐系统面临的主要问题,本文对电子商务推荐系统中推荐系统体系结构和推荐算法等核心技术进行了研究。首先,对推荐系统的结构进行了研究。推荐系统主要分为输入、处理和输出这三个部分,各个部分都担任着推荐系统的重要角色,通过这方面的研究为后面的工作提供了基础。其次,对推荐系统的模型进行了研究。由于不同的模型适合不同的推荐系统,以此来适合不同的环境和条件。通过这方面的研究能够使推荐系统更加能发挥作用。最后,对推荐算法进行了研究。目前电子商务推荐系统的方法可有基于内容的、协同过滤的、数据挖掘的以及混合型等等。针对这几种推荐方法,本文都进行了详细的介绍和研究。希望通过这些研究为后续新方法的推出给与一些指导。关键词 推荐系统;个性化推荐;协同过滤;推荐模型;电子商务Abstract With the rapid development of Internet and the popularization of E-commerce, the phenomenon of overload in the information of E-commerce systems is more and more serious. At the same time of E-commerce system provides users with more choices, its structure has become more complex. Facing with the “Ocean” of product information, users often get lost so that they cannot be successful in finding what they needs. In accurately identifying customers on the basis of consumer preferences, E-commerce recommendation system can provide customers with product information and recommendations. Analog sales staff to help customers complete the purchase process to help users find what they really need. In recent years, although the E-commerce recommendation system in theory and practice have been great development, however, E-commerce recommendation system still faces a series of challenges. According to the main problems of the E-commerce recommendation system, this atricle will study the system architecture of E-commerce recommendation system and core technologies such as recommendation algorithms.Firstly, this atricle will study the recommended structure of the system. Recommendation system can be divided into three parts which are input, processing and output.All parts of the recommendation system serves as an important role. Through the research in this area provides the basis for later work.Secondly, this atricle will study the model recommendation system. Because different models suit for different recommendation systems. Whats more, it will suit for different environments and conditions. Through the research in this area can make recommendation system better able to play a role in the society.Finally, this atricle will study the recommendation algorithm. At present there are many E-commerce recommendation system approachs, such as content-based, collaborative filtering based, data mining based and mixed-based, and so on. This atricle will carry out a detailed introduction and study for the types of recommended methods. Hoping that through these studies it will give some guidance to the follow-up of the new ways introduction.Key words Recommendation System;Individualized Recommendation;Collaborative Filtering;Recommendation model;Electronic Commerce目 录1 绪论131.1 研究背景131.2 电子商务推荐系统的意义131.3 电子商务推荐系统的研究状况与研究内容141.3.1 电子商务推荐系统的研究状况141.3.2 电子商务推荐系统的研究内容151.3.3 电子商务推荐系统的实例介绍151.4 本文的主要工作和安排172 电子商务推荐系统的研究182.1 电子商务推荐系统的组成182.1.1 电子商务推荐系统的输入部分182.1.2 电子商务推荐系统的输出部分192.1.3 电子商务推荐系统的处理部分202.2 电子商务推荐系统的模型研究212.2.1 基于服务器端的强耦合系统CISR222.2.2 基于客户端的强耦合系统RCIS242.3 其它类型的推荐系统253 电子商务推荐系统的推荐算法263.1 基于内容的推荐算法263.2 基于协同过滤的推荐算法273.2.1 基于邻居用户的协同过滤算法273.2.2 基于项目的协同过滤算法303.3 基于数据挖掘的推荐算法313.3.1 关联规则挖掘313.3.2 关联规则推荐算法333.4 混合推荐算法344 总结与展望364.1 本文总结364.2 工作展望36参考文献:38致谢401 绪论1.1 研究背景 Internet的迅猛发展将人类带入了信息社会和网络经济时代,对企业发展和个人生活都产生了深刻的影响。一方面,基于Internet的虚拟企业不再需要像传统无力环境下的企业那样进行实体投资,企业与顾客、供应商等建立起更直接的联系,电子商务模式为企业发展提供了更多的机会;同时,Internet的发展正在极大地改变着人们的生活,人们不出家门就可以随心所欲地得到自己想要的商品,网上购物的经历让人们感受到电子商务带来的惊喜。 然而事实上,电子商务的应用远没有挖掘出来,这其中固然有硬件设施滞后、用户观念未改变等原因,更有企业服务不到位的原因。电子商务的发展模式对企业服务提出了许多新要求,包括商品的质量保证、送货及时、商品选购舒适、退货方便等,其中,最为突出的一个问题就是商品选购的个性化推荐问题。 由于供应链和物流的发展,在电子商务的虚拟环境下,商家在网上所能提供的商品种类和数量非常的多,单用户不可能通过一个小小的计算机屏幕很方便发现自己感兴趣的商品,用户既不愿意花太多时间漫无边际地在网上寻找商品,也不可能像在物理环境下那样检查商品的质量。在这样的背景下,用户就急需要电子商务系统具有一种类似采购助手的功能来帮助其选购商品,它能更据用户的兴趣爱好自动地推荐给每个用户可能感兴趣且用户满意的商品,其根本目的是使用户在这种虚拟购物环境下能方便快速地得到自己所需要的商品。 在这种环境下,推荐系统(Recommender Systems)应运而生,它根据用户的兴趣爱好推荐符合用户兴趣爱好的对象,也称为个性化推荐系统(Personalized Recommender Systems)1。1.2 电子商务推荐系统的意义 网络泡沫使人们对电子商务逐渐变得理性。在沉寂了几年之后,电子商务又重新受到企业实践和理论研究的关注,日益流行起来。推荐系统作为一种新的电子服务,是网络营销的有效手段。因此电子商务推荐系统已成为电子商务的研究热点。电子商务推荐系统能够有效地留住顾客,防止顾客流失,提高销售额,受到越来越多的关注。电子商务推荐系统具有重大的研究意义,具体表现在以下方面2。首先,它把网站浏览者转变为购买者。登录网站的顾客有时仅仅是浏览,并没有确定的购买意图。如果网站能够投其所好地向顾客推荐商品,那么他们也会加入到购买者的行列。根据日本NTT、三菱综合研究所、法政大学经营学部小川孔辅研究室所共同进行的网络购物意见调查发现,如果有使用经验的消费者发表推荐信息,将会使其他消费者的购买欲望增加。其次,它提高电子商务网站的交叉销售能力。电子商务推荐系统能够发现顾客所购买商品的内在关联性,从而进行相关推荐、捆绑销售等多种形式的促销方式,增加销售额。再次,它能够提高顾客对电子商务网站的忠诚度。电子商务推荐系统把顾客从信息海洋中解救了出来,增加了顾客网上购物的舒适感和满意度,从而提高了顾客的忠诚度。最后,电子商务推荐系统能够优化电子商务网站。根据Web日志数据分析用户的行为模式,推荐超级链接列表,或者动态地生成可能的网页超链接,尽可能迎合每个用户的浏览兴趣并且不断调整网站链接结构,以适应用户浏览兴趣的变化,是每个用户在浏览网站时都有该网站的唯一用户的感觉。1.3 电子商务推荐系统的研究状况与研究内容1.3.1 电子商务推荐系统的研究状况 随着互联网的普及和电子商务的发展,推荐系统逐渐成为电子商务IT技术的一个重要研究内容,得到了越来越多研究者的关注。其中包括第7届国际人工智能联合会议IJCAI01把E-Business& the Intelligent Web作为一个独立的研讨小组。同时,第十五届人工智能会议AAAI-98、第一届知识管理应用会议PAKM、1996年协同工作会议CSCW96等也纷纷开始将电子商务推荐系统作为研究主题。还有ACM从1999年开始每年召开一次电子商务的研讨会,其中关于电子商务推荐系统的研究文章占据了很大比重。从1999年开始此协会的数据挖掘特别兴趣组SIGKDD小组设立WEBKDD讨论组,主题集中在电子商务中的WEB挖掘技术和推荐系统技术,而ACM下面的信息检索特别兴趣组SIGIR在召开的第24届研究和发展会议上,开始专门把推荐系统作为一个讨论主题。近年来我国也比较重视Internet智能推荐方面的研究工作,自然科学基金也曾资助过“面向电子商务的客户偏好分析与个性化分析系统”、“电子商务个性推荐系统及应用研究”。31.3.2 电子商务推荐系统的研究内容 电子商务推荐系统的研究内容和研究方向主要包括:45 1.实时性的研究:网站数据量越来越大,系统越来越难以处理,如何在规定的时间内处理并响应用户的输入对于推荐系统的推荐质量有了很大的制约因素。 2.推荐质量的研究:由于数据的稀疏性,如何有效地利用数据,提高用户推荐质量,不能给用户推荐了他不喜欢的商品,这是对推荐系统的可靠性的要求。 3.多推荐技术的运用研究:由于各类技术只能在某一方面运用效果较好,而电子商务的各种环境是不尽相同的,如何能根据不同用户的需求,在不同的条件下选用最有效的技术予以推荐时推荐系统自我提升的一个重要指标。 4.用户隐私保护的研究:由于推荐系统需要用户的资料输入,在进行分析推荐时不可避免会涉及用户的隐私资料,如何在提高推荐服务的同时而又有效保护的用户的隐私值得进行深入研究。 5.数据挖掘技术在推荐系统的中应用研究:由于推荐技术不断发展,各种数据挖掘技术包括关联规则挖掘、聚类分析挖掘、贝叶斯挖掘等在推荐系统中都得到了广泛的应用。如何充分利用这些技术来实现推荐系统成为研究的主流方向。 6.推荐系统的可视化研究:由于技术的发展,所涉及的用户是越来越广泛的,为了方便用户使用推荐系统,友好的可视化服务界面必不可少,这一方向的研究是提高推荐系统的实用性的一条重要途径。1.3.3 电子商务推荐系统的实例介绍 推荐系统研究至今,已经较广泛地应用到网络方面,现在介绍几个比较有名的实例。671.Firefly是早期基于Agent技术开发的电子商务门户网站,它充当搜索引擎,帮助顾客在Internet网络中搜索海量商品信息,提供价格比较机制,从而减少顾客互联网上的购物时间。它提供推荐鼓舞的内容涉及电子产品、电子书籍、服饰、汽车和各种生活消费品,目前在北美地区仍然得以广泛使用。 2ACF:Active Collaborative Filtering系统是Carnegie-Mellon大学开发的主动协同过滤推荐系统,用于电子文档推荐。ACF系统通过指针实现协同过滤推荐服务,指针包含指向电子文档的超链接、电子文档的上下文信息以及用户撰写的电子文档评论。在ACF系统中,用户可以通过主动的方式将创建的指针推荐给其他可能感兴趣的用户,也可以将创建的指针保存在系统中供其他用户查看。ACF系统也只适用于用户群体比较小的场合。 3. GroupLens:由MIT开发的自动协同过滤推荐系统。用于新闻组信息推荐。GroupLens系统通过用户的评分信息自动搜索用户的最近邻居,然后根据最近邻居的评分信息产生最终的推荐结果,适合于用户数量比较大的场合。GroupLens系统具有极好的开放性,用户可以通过GroupLens系统提供的API函数向GroupLens服务器提供评分信息,请求推荐结果。同时,GroupLens系统提供三种客户端工具Emacs Gnus、NN和NewsWatcher达到上述目的。4. MovieLens:是Minnesota大学开发的研究型自动协同过滤推荐系统,用于推荐电影。与GroupLens不同,MovieLens系统是一个基于Web的推荐系统,系统通过浏览器的方式进行用户评分数据收集与推荐结果显示,用户使用更加方便。5.Ringo:由MIT媒体实验室开发的研究型协同过滤推荐系统,用于提供个性化的音乐推荐服务。Ringo系统可以向用户推荐用户最喜欢的音乐,预测用户最不喜欢的音乐,也可以预测用户对特定音乐的评分。6.Video Recommender:是Bel1Core开发的协同过滤推荐系统,用于电影推荐。Video Recommender系统通过电子邮件的方式收集用户评分数据,提供推荐服务.在Video Recommender系统中,不仅可以预测用户最喜欢的电影,也可以预测用户对特定电影的评分。在Video Recommender系统提供推荐结果时,同时向用户提供用户最近邻居的电子邮件联系方式,以及用户与最近邻居的相似度等信息。7.Firctionlell Commerce是英国Frictionless公司开发的商务网站,与Firefly不同的是,它能够利用多属性决策分析机制综合考虑产品的各种属性,为客户提供最佳推荐服务。但是,这种推荐系统中的Agent软件不能代表买方的利益,自动与商家进行智能谈判。推着Internet网上商务交易竞争的加强,这种推荐模式也必须改进。8. FAB:是Stanford大学数字图书馆项目组开发的基于内容的过滤和协同过滤的复合型推荐系统,用于推荐Web页面。其特点是综合了基于内容过滤的推荐和协同过滤推荐的优点,同时支持两种类型的推荐服务。FAB系统主要包括页面收集代理,个人推荐代理和中心路由器.页面收集代理从Web上收集特定主题的页面,个人推荐代理从特定主题中选择用户感兴趣的页面推荐给用户。个人推荐代理根据文档内容信息建立用户的用户档案,然后根据用户档案之间的相似性搜索用户的最近邻居。产生的推荐结果可以基于用户档案中的文档内容信息,也可以基于用户最近邻居的评价信息(协同过滤)。1.4 本文的主要工作和安排 电子商务推荐系统越来越得到普及,为了更加深入了解,本文的主要工作如下。 第一章,主要阐述了电子商务推荐系统的产生背景、它所具有的意义、当今对它的研究内容和研究状况以及举了几个当今应用到电子商务推荐系统的实例。 第二章,主要说明对电子商务推荐系统的体系结构进行了研究,它包括输入、处理和输出这三个部分,此外,还对电子商务推荐系统的模型进行了探讨。 第三章,主要是对电子商务推荐系统的个性化推荐算法进行了研究,包括基于内容的、基于协同过滤的、基于数据挖掘的等等。 第四章,主要是全文的总结与展望。首先是阐述一下本文所写的内容,然后针对本文提出了电子商务推荐系统以后的发展方向。2 电子商务推荐系统的研究2.1 电子商务推荐系统的组成电子商务推荐系统主要由三个部分组成,它们分别是输入(Input)部分、推荐方法(Recommendation method)部分、输出(Output)部分,各部分都各自担任着重要的角色。2.1.1 电子商务推荐系统的输入部分输入部分主要负责对用户信息的收集和更新。当用户进行浏览或者做某些操作时,推荐系统就会收集这些数据。而输入可来自客户个人和社团群体两部分,其中客户个人输入(Targeted Customer Inputs)主要指目标用户,在目标用户被推荐之前,他们都要被对一些项目进行评价,以表达自己的偏好,这样才能给他们予以适当的推荐。而这些方式包括显式浏览输入、隐式浏览输入、关键词和项目属性输入以及用户购买历史等。社团群体输入(Community Inputs)主要指集体形式的评价数据,包括项目属性、社团购买历史、文本评价、等级评分。这些方式的区别如下:6891. 显式浏览输入:也就是将用户的浏览行为作为推荐系统的输入,这是一种主动的收集方式,用户是有目的的向推荐系统提供自己的兴趣爱好。例如,网站提供多部电影的评分等级供用户进行评分,用户可以选择自己喜欢的电影进行评分,推荐系统根据用户的选择向用户提供适当的推荐结果。2. 隐式浏览输入:将当前用户访问网站的浏览行为作为推荐系统的输入,与显示浏览输入不同,这是一种被动的收集方式,用户的浏览行为与访问普通网站没有区别,他们并不知道推荐系统的存在。用户当前正在浏览的网页、用户选购的商品、用户的浏览路径等都可以作为隐式浏览输入的信息。3. 关键词和项目属性输入:用户在搜索引擎中输入关键字进行搜索时将把这些关键字作为推荐系统的输入,或者将用户正在浏览的商品类别等作为推荐系统的输入。这种类型的输入不同于用户随意浏览的行为,用户输入的目的在网站上搜索自己感兴趣的东西。4. 用户购买历史输入:推荐系统可以把用户购买商品的历史记录作为输入,推荐系统通常认为用户购买了该种商品就表示喜欢。不过这并不是十分准确,通常加一个时间来进行限制,例如一个星期或者一个月该种商品被购买的数量,这样更能符合实际来为别的用户进行推荐。5. 用户评价文本输入:用户购买商品后可以对该种商品进行评价,推荐系统并不对这些信息进行分析,这些信息是给用户看的,用户可以通过看别的用户的评价来判断该种商品的好坏。6. 用户评分输入:将用户对产品的数值评分数据作为推荐系统的输入。电子商务推荐系统列出一系列产品让用户评分,用户的评分可以是一个数值,数值的大小表示用户对该产品的喜好程度,也可以是一个布尔值,0代表不喜欢,1代表喜欢。通过用户提供的评分数据,使得电子商务推荐系统可以为用户提供个性化的推荐服务。7. 用户注册信息输入:用户在该网站注册一个账号时,推荐系统可以把注册信息作为一种输入,包括用户的年龄、性别、职业等,用户也可以明确地表达自己的喜好兴趣。这类信息是推荐系统收集到的原始信息,通常推荐的结果并不是十分准确。8. 产品信息输入:这是商家对产品的性能和作用等进行的描述,推荐系统只负责记录,用户可以通过浏览这些信息来进行判断。2.1.2 电子商务推荐系统的输出部分输出部分主要负责在系统获得输入信息后,把推荐内容输出给用户。不同的推荐系统有不同的输出方式,主要包括相关信息输出、个体评分输出、个体评价文本输出、相似项输出、Top-N输出、电子邮件输出等,它们的区别如下:111. 相关信息输出:这种方式是推荐系统中最为普通的一种输出,推荐系统根据用户表现出来的行为特征或网站的热门信息排行情况向用户产生信息推荐。相关信息输出可以对热门的信息进行简单排序来向用户进行推荐,也可以基于对用户的行为特征进行深入分析,从而提炼出用户的行为模式来对同类别的用户进行推荐。2. 个体评分输出:这就是向用户提供该商品的评分高低,通过这样直观的方式可以让用户更能够进行自我判断。3. 个体评价文本输出:这是别的用户对该种商品的评价,通过阅读别人对该种商品的评价,用户可以更准确把握该种商品的好坏。4. 相似项输出:就是向用户提供别的用户购买该种商品后还购买了哪些商品,或者通过对商品属性的分析,向用户推荐该商品相类似的商品。5. Top-N输出:就是向用户提供前N种最受欢迎的产品信息,这也是一种比较常见的输出方式。6. 电子邮件输出:电子商务推荐系统通过邮件的形式向用户提供产品的最新信息。这种输出的方式可以吸引用户再次访问电子商务站点,从而达到保留用户,防止客户流失的目的。2.1.3 电子商务推荐系统的处理部分 推荐方法模块就是推荐系统的处理部分,它是推荐系统的核心部分,负责把输入的信息转换成将要推荐的输出,决定着推荐系统的性能优劣。推荐方法模块以推荐技术和算法为技术支撑。关于推荐系统的处理,人们提出了多种不同的实现方式,总的来说主要有下面几种:基于规则的方式、基于内容过滤的方式、基于协作过滤的方式、基于人口统计的方式和基于流行度的方式等。2 (1)基于规则的方式 基于规则的实现方式是很直观的,利用规则可以向不同的顾客提供针对性的推荐。这些规则可以是自己定制的,也可以通过数据挖掘技术才得到,通常后者更加常用。通过收集多个数据源的数据,进行一些必要地预处理,以此来发掘出有用的信息。而挖掘技术通常采用关联规则、聚类、决策树等。其中使用最广泛的就是获取商品之间的关联规则分析历史购买事务数据库很可能发现购买一种或者一类商品的顾客同时比较倾向于购买另外一种或一类商品,也就是哪些商品经常被同时购买。 (2)基于内容过滤的方式 基于内容过滤的技术来源于信息检索,其基本思想就是利用商品的某些特征来过滤某些信息,它的步骤通常就是抽取合适的产品特征信息,用这些特征表示商品,系统自动学习顾客的兴趣习惯和特征,产生推荐方案。其优点就是不需要其他用户的数据,只需要用户的偏好等信息就可以了。不足之处就是由于需要产品可以编码,而某些产品只能抽取其中的某些内容,如文字或者图像,并不能进行编码,所以这些产品就不能被推荐。由于没有使用到别的用户的数据,因此推荐的准确度可能不是很高。 (3)基于协作过滤的方式 协作过滤也称为社会过滤,是最早被成功使用的一种方法,能够在推荐系统中寻找用户之间的相关性。它首先建立用户的偏好矩阵,然后计算被推荐用户和系统其他用户之间的相似性,以此来找到相似用户的偏好,最后向用户进行推荐。它的优点就是解决了基于内容过滤推荐的很多问题,可以利用用户之间的关系来进行推荐,也不局限于用户和商品的特征内容的形式。其不足就是冷开始、稀疏性、偏向性和可扩展性。冷开始就是推荐系统在刚开始的时候很难找到与被推荐用户相似的偏好来进行匹配。稀疏性就是用户对于某些产品评价所形成矩阵往往是稀疏的,这样很难找到评价相同产品条目的用户。偏向性就是推荐系统很容易向用户推荐常见的热门的产品,而对于新上市的产品或者不是很畅销的产品往往被忽略掉。可扩展性就是随着顾客和商品条目的大幅增加,系统能否解决复杂问题的能力受到了巨大的考验。而解决上述问题有很多方法,例如用关联规则、内容分析和分类方法来解决稀疏性和偏向性问题,用聚类分析、贝叶斯网络方法等可以解决可扩展性问题。 (4)基于人口统计的方式 推荐系统通过统计各种用户数量,试图分辨该被推荐用户所属的种类,以此来向用户提供推荐建议,这是一种非常有效的方式,同时也是企业市场细分的重要依据之一。 (5)基于流行度的方式 这是一种非常直观和普通的一种方式,通过向用户提供近期最受欢迎的产品来最为一种推荐,虽然简单,但非常实用。不过由于它忽略了用户的偏好等信息,所以这不是一种个性化的推荐方式。以上这些方法都已经被广泛应用了,当然其中存在着或多或少的问题,但随着研究的深入,通过组合的方式,这些问题有很大程度上都有所改善。2.2 电子商务推荐系统的模型研究 电子商务推荐系统就是利用电子商务网站所收集到的信息进行分析,向用户提供一定的商品信息和建议,帮助用户决定应该选取哪些产品,模拟销售人员帮助客户完成购买过程,其模型如图2.1所示。10图2.1 推荐系统模型 运用不同的推荐算法需要不同的模型,而模型和算法结合得好,能够使推荐准确度大大增加。通常认为一个完整的推荐系统应该完成以下几个部分的功能: 第一,与用户进行一对一的交互,即对用户正确的Web请求信息进行响应以及能够向该用户传送系统产生的推荐结果; 第二,获取和维护用户的个性化信息或者被推荐站点的结构以及内容等信息; 第三,获取并管理用户的在线访问信息(应用该信息才能动态地产生推荐); 第四,针对不同的用户或者同一用户的不同行为,根据系统维护的用户个性化信息以及用户的在线访问信息,应用推荐算法产生推荐结果。以上面的说明为基础,根据推荐系统实现以上功能的服务器端和客户端的松耦程度,可以从体系结构的角度将所有的推荐系统分为5类,分别是基于服务器端的强耦合系统CISR(Client Internet Server Recommendation)、基于服务器端的松耦合系统CIRS(Client Internet Recommendation Server)、基于客户端的强耦合系统RCIS(Recommendation Client Internet Server)、基于客户端的松耦合系统CRIS(Client Recommendation Internet Server)和零耦合系统CIRIS(Client Internet Recommendation Internet Server)。102.2.1 基于服务器端的强耦合系统CISR2.2.1.1 体系结构这种体系结构如图2.2所示,是目前推荐系统中最常采用的一种。10图2.2 CISR系统体系结构在这种体系结构中,Web服务器和推荐系统一般都在物理上的同一台机器上。推荐系统所需要的信息以及与用户的交互等操作都要经过Web服务器,即用户主要是通过Web服务器来进行交互的,推荐系统把Web服务器收集来的用户的信息直接使用或者通过Web服务器提供的接口与用户进行交互。2.2.1.2 推荐原理 图2.3是一个具体的CISR结构的推荐系统的体系结构。采用这种体系结构的推荐系统一般包括两个主要部分:离线挖掘部分和在线推荐部分。10 离线部分对Web服务器的日志文件进行预处理来得到用户访问的特殊文件,推荐系统对这些特殊文件进行数据挖掘以此得到用户的访问模式。 在线部分包括推荐引擎和HTTP服务器。其中HTTP服务器负责与用户进行交互,将用户的访问请求生成该用户的动态会话文件,推荐引擎根据该动态会话文件和离线部分得到的用户访问模式生成推荐信息,最后由HTTP服务器把这些推荐信息发送到用户所浏览的页面供用户浏览。图2.3 基于服务器端的强耦合系统CISR2.2.1.3 结构分析 在这种体系结构中,Web服务器完成了大部分的主要工作,包括收集用户的个性化信息、把推荐信息发送给用户看等等,而推荐系统只完成了前面所述的第二和第四项功能。 由此可知道此体系结构一定要先建立HTTP服务器与用户进行交互,通过该HTTP服务器推荐引擎才能获取用户与Web服务器交互的信息,这样才能生成推荐结果给用户。这样基于服务器端的强耦合系统存在的问题是个性化信息的收集完全由Web服务器来完成,Web服务器需要巨大的开销,系统的通用性和可移植性较差等。2.2.2 基于客户端的强耦合系统RCIS2.2.2.1 体系结构这种体系结构也是目前最常采用的一种架构方式,结构图如图2.4。图2.4 RCIS的体系结构在这种体系结构中,推荐系统收集的用户信息完全要通过客户机才能得到,也就是客户机是与用户交互的主体,推荐系统使用收集得来的数据通过客户机实现推荐功能。2.2.2.2 推荐原理 此类系统通常由代理服务器、学习器、分类器和推荐器组成。其中代理服务器通过Web浏览器与用户进行交互,学习器为代理服务器提供用户访问模式,分类器将获取的用户访问模式进行分类,推荐器用于生成推荐信息,如图2.5。图2.5 基于客户端的强耦合系统RCIS代理服务器接收来自用户浏览器发来的Web页面的访问请求,接着把该请求的相关信息发到Web服务器中,同时还将该请求信息发送到学习器和推荐器。学习器对用户的访问信息运用Web挖掘方法来生成用户的访问模式,推荐器根据用户的请求信息和学习器产生的用户访问模式来产生推荐信息。接着推荐器把推荐信息发给代理服务器供用户进行浏览。102.2.2.3 结构分析在这种结构中,需要设置代理服务器,并且需要将所有的程序安装在客户端,这增加了客户端的要求,同时,这也相应地减少了服务器端的压力,这能够使服务器应对更多的服务请求,提供更迅速的推荐结果。2.3 其它类型的推荐系统 在基于服务器端的松耦合系统CIRS中,个性化推荐系统独立于Web服务器和客户机并且靠近Web服务器一侧,通常情况下与Web服务器位于相同的局域网内。在基于客户端的松耦合系统CRIS中,推荐系统运行于局域网的某台主机上,此主机为该局域网内的所有需要个性化服务的一批特性的主机提供面向Internet的个性化推荐服务。而基于零耦合系统CIRIS的推荐系统将来可能出现在另一种应用于基于Web的通用个性化推荐系统,用户通过Internet访问推荐网站,同时这些推荐网站也面向那些没有个性化推荐功能的传统网站,这些传统网站只需向推荐网站购买个性化推荐服务即可,自身不用做任何改动。103 电子商务推荐系统的推荐算法前面已经简单介绍了推荐方式,下面就重点介绍一些推荐算法。推荐算法可以分为基于内容的推荐14、基于协同过滤的推荐13、基于数据挖掘的推荐16和混合推荐15等。3.1 基于内容的推荐算法 基于内容的推荐来源于信息检索技术,它是信息过滤技术的延续与发展。内容过滤主要采用人工智能、概率统计和机器学习等技术进行过滤。算法中把每个用户的信息需求表示成向量空间中的一个用户向量,并通过对文本集内的文本进行分词、标引、词频统计加权等过程来生成一个文本向量,然后计算用户向量和文本向量之间的相似度,主动将相似度高的文本发送给该用户模型的注册用户。用户在接收到文本信息后,可以对新信息进行兴趣评价,比如可以评价为相关和不相关。在此基础上,过滤系统可以利用反馈信息对用户模型进行修改和维护,在用户和系统的互动中提高获取信息的效率和质量。 算法中对于表达每个对象时采用了一组属性值,每一组属性值确定了该对象的类型。而过滤时使用一种被称为“欧几里得距离”或最近邻居的概念来确定这些对象的相似性,通过相似性的高低来进行过滤。设对象X、Y,对象属性为(P1,P2,Pn),则X、Y属性分别是(P1x,P2x,Pnx)和(P1y,P2y,Pny),那么X和Y欧几里得距离为: (3.1) 由式(3.1)计算各个对象之间的欧几里得距离,把距离最近的推荐给相关用户即可。 虽然基于内容过滤的推荐方式比较简单和有效,但也存在着一些问题:(1)不能区分商品信息的品质和风格,并且随着信息数量的剧增,属于同一主题的信息也在增加,从长远考虑内容过滤的效率和质量会降低;(2)不能为用户发现新的感兴趣的信息,只能发现和用户已有兴趣相似的信息;(3)过滤方法单一,匹配计算不准确,有时会导致过滤结果很不准确,存在许多不感兴趣的信息。3.2 基于协同过滤的推荐算法 协同过滤也称为“社会过滤”,它是通过用户与用户之间的关系来产生的过滤的。它与基于内容过滤的算法有很大的不同的就是它不需要分析对象的特征属性,对推荐对象没有特殊要求,因此能处理非结构化的复杂对象。由于此特点,协同过滤是应用最广泛和最成熟的推荐技术19。 协同过滤算法主要有基于内存的协同过滤算法和基于模型的协同过滤算法这两类。其中基于内存的协同过滤算法先用统计的方法得到具有相似兴趣爱好的邻居用户,再基于邻居进行计算以此来得到相似用户进行推荐。而基于模型的协同过滤算法就先用历史数据得到一个模型,再用此模型进行预测来进行推荐。基于内存的算法由于要在线完成,所以对整个用户数据库运算时的性能要求比较高,而基于模型的算法的建模过程虽然可以离线完成,但由于建模过程比较复杂,本身耗时较长,所以只能周期性对模型进行更新,导致模型相对于原始用户数据而言具有一定的滞后效应。以协同过滤的两个基本思想(兴趣相近的用户可能会对同样的商品感兴趣和用户可能较偏爱与其已购买的东西相类似的商品)为基础,Sarwar等人把基于内存的过滤算法分为基于邻居用户的协同过滤算法和基于项目的协同过滤算法,从某一程度来讲弥补了基于模型的算法只能比较适合大型电子商务推荐系统的尴尬情况,同时也把基于协同过滤的方法发挥到最大作用。3
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 成人自考


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!