资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,个性化服务及协同推荐,报告人:陈华,个性化服务及协同推荐 报告人:陈华,1,提纲,定义,过程和流程,体系结构,个性化搜索引擎的分析,实现重点,提纲定义,2,定义,个性化服务是 针对不同用户提供不同服务(服务策略和服务内容,服务模式)。,协同推荐通过兴趣相近的用户对资源的评价向用户推荐。,定义 个性化服务是 针对不同用户提供不同服务(服务策略和服务,3,过程和流程,信息找人,过程和流程信息找人,4,不同的用户由于背景知识、兴趣爱好等不同,需要信息往往不同。,个性化信息检索是指根据用户的兴趣和特点检索,返回与用户需求相关结果。上图显示了个性化检索系统的基本结构。,个性化服务及协同推荐课件,5,体系结构,个性化服务系统通常包括四个层次,体系结构个性化服务系统通常包括四个层次,6,1用户信息收集,用户访问Internet的过程产生以下7种信息:,用户输入的查询关键词。,用户维护的Bookmark。,用户浏览的页面。,用户浏览行为,用户在页面驻留时间,对页面的操作(保存、打印、页面存入Bookmark),对鼠标和键盘的操作等。,服务器日志。,用户下载、保存的页面和资料等。,用户手工输入的其他信息。,1用户信息收集,7,2用户建模模块,个性化服务系统收集到 用户信息 后,将 用户信息 提交给 用户建模模块 处理。用户建模模块 根据收集到的信息 构建用户模型。,3个性化服务模块,个性化服务模块提供具体的个性化服务,如个性化推荐、个性化信息检索等。将匹配的内容或网站推荐给用户。,2用户建模模块,8,4用户,用户是个性化服务的享用者,同时用户的反馈也可调整个性化服务系统。,如用户可以直接修改可视化的用户模型(用户对个性化内容的选择),以调整个性化服务系统的性能。,4用户,9,个性化搜索引擎的分析,策略大体上有三种:,1协同过滤策略,协同过滤是基于这样的假设:,为一用户找到他真正感兴趣的好方法是首先找到与此用户有相似兴趣的其他用户,然后将他们感兴趣的内容推荐给此用户。,协同过滤的基本出发点是:,(1)用户是可以按兴趣分类的;,(2)用户对不同信息的评价包含用户的兴趣信息;,(3)用户对一个未知信息的评价将和其相似(兴趣)用户的评价相似。,个性化搜索引擎的分析策略大体上有三种:,10,2通过点击特征提供个性化服务,当 相似用户 查询 相同词 时,向用户返回相似用户点击次数比较高的URL的集合。,3通过用户自定义提供个性化服务,比较常见。用户在交互界面上填入自己期望结果类别和不愿看到的结果类别,通过自定义来限制搜索的结果。,2通过点击特征提供个性化服务,11,实现重点用户和资源矩阵,数据可以用m*n阶矩阵来表示,m个用户,n个项目,Rij代表第i个用户对项目的评分。,实现重点用户和资源矩阵数据可以用m*n阶矩阵来表示,m个用,12,计算相似用户,计算时,首先找到两个用户共同评分过的项目集,然后计算两个向量的相关系数。,其中,I i,j是用户i和j 共同评分过的项目集;Ri,c是用户i对项目c的评分;是用户j对资源的平均评分。,计算相似用户计算时,首先找到两个用户共同评分过的项目集,然后,13,假设目标用户为I,计算完I和其他用户的相似度后,按大小排序,选择前N个作为I的最近邻。,考虑了邻居的多寡问题,如果对每个用户都设定同一个N,那样如果一个用户的邻居很少,则相似度很小的用户也参与到对目标用户的推荐工作中,这样势必造成推荐质量的下降。设定一个相似度阈值S,大于S的才有资格参与到推荐工作中。,假设目标用户为I,计算完I和其他用户的相似度后,按大小排序,,14,向量表示,矩阵表示的话,清楚明了,但是一个用户资源的访问量与总资源比起来,太微不足道了,所以这个矩阵中的值绝大部分为空,浪费了很多空间和计算时间,所以准备尝试用单纯的向量表示,即用n2数组表示,第一行表示访问文件号,第二行表示文件访问次数。这样计算复杂一点,但是总体来讲,还是节约了时间空间。,向量表示矩阵表示的话,清楚明了,但是一个用户资源的访问量与总,15,
展开阅读全文