资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,1,唯一的检索系统,-,patentics,patentics,.com,Patentics,创新,Patentics,.com,为当今世界上仅有可以自动理解全世界专利的第一个超大型概念搜索引擎,;,在搜索(包括专利)历史上的首次,,Patentics,的自动计算排序结果,与全世界专利审查员递交,PCT,的,X/Y/A,搜索报告进行大规模比对;,统计测试比对包括全部,USPTO2000-2009,年递交,PCT,共,133,126,篇,(,英文);,EPO2000-2009,年递交,PCT,共,122,301,篇,(,英文);,JPO2000-2009,年递交,PCT,共,114,953,篇,(,英文);,KIPO2001-2009,年递交,PCT,共,16,839,篇,(,英文);,SIPO2004-2009,年递交,PCT,共,15,522,篇,(,中、英文)。,2,核心思想,“R/”:,将检索结果根据某个语义来,排序,。可以在检索结果非常多的情况下将最相关的文献呈现到最前面。是与传统检索系统的主要区别;大幅提升检索效果的主要手段。,第一步:不输入任何检索要素,直接对数据库中的所有结果排序。大量统计分析表明有,50%,的案子能够很容易获得对比文件。,R/CN101091890 and,di,/2007-07-26,sipo,审查员给出的,X,对比文件(,CN1857239),排在第一位。浏览1篇文献即可获得对比文件,完成检索需要5分钟。,第一类任务(,50%,案子,),5,第一步:,r/cn101079912 and,di,/20070711,,直接对所有专利排序,,假设,,感觉排在前面的专利不太合适,无法用作对比文件。,注:受传统系统限制,,PCT,检索报告,用了,10,个以上的关键词来限定,第二类任务(,40%,案子,),6,第二步:只需要使用一个关键词“气味”,获得21222篇文献,然后系统自动根据与本案的语义相关度排序,审查员给出的,X,对比文件(,CN1727009;CN1568083;CN1484163,)都排在,第一屏,。约40%的案子可以用这样的简单策略完成检索。这类检索平均耗时1小时。,7,第三类任务(,10%,案子,),第一步:直接对所有专利排序,假设,感觉排在前面的专利不太合适,无法用作对比文件。,第二步:增加一个关键词作为限定,假设,感觉排在前面的专利还是不太合适。,第三步:再增加一个关键词,,PCT,检索报告中给出的对比文件位于前列。,8,成为唯一选择的原因,唯一选择是只用这个,而不需要再使用其他检索系统。,唯一选择是所有案子都用,而不是部分案子用。,唯一选择是所有用户都可以用,而不是有很高检索经验的人用。,9,成为唯一选择的原因,数据量,6,256,574,篇美国授权,/,申请全文,:1971/4/132009/12/8,2,943,534,篇中国发明,/,实用申请全文,:1985/9/102009/12/2,1,270,475,篇,EP,申请全文,:1978/12/202009/7/22,1,275,752,篇,WO,申请全文,:1978/12/72009/7/9,29,406,252,篇,42,国英文摘要,:1900/1/22009/7/30,并实时更新。,多于,SIPO+EPO+USPTO+,出版社全文,10,成为唯一选择的原因,任何系统漏检的原因检索要素是漏检之源。检索要素用于从全部数据中划分出一部分数据,任何的考虑不周都会导致一部分合适的结果没有被划分进入。遗憾的是,考虑不周无法避免。,成为唯一选择的原因,审查员检索过程:,基本检索要素,防盗,手机,霍尔元件,关键词,防盗,报警,手机,钱包,范围 距离,霍尔,磁性 磁场 磁体,电压,分类号,G08B13/14,G08B13/14B,G08B13/14P,G08B13/22,审查员在常规检索系统中,需要将多个检索要素相与,从而将检索结果限定到可阅读的范围,。,“钱包”的各种表达形式,已经导至漏检的可能性不可避免!,12,成为唯一选择的原因,漏检的计算传统系统中为了将检索结果限定到合理的范围需要多个检索要素的组合。四个检索要素是非常常见的:,检索要素,A*,检索要素,B*,检索要素,C*,检索要素,D,熟练检索员:,90%*90%*90%*90%=66%,(漏检,34%,),普通检索员:,80%*80%*80%*80%=41%,(漏检,59%,),13,成为唯一选择的原因,Patentics,的原理:,有了语义技术以后,就不需要将检索结果限定都合理的范围,所以不用很多检索要素。不用或用很少的检索要素,通过语义对大量文献排序,最相关的就会呈现在所有结果的最上面。,14,成为唯一选择的原因,PATENTICS,绝大部分案子不需要任何检索要素(约50%)或只用一个检索要素(约40%),很少一部分需要用多个检索要素(约10%)。避免漏检的能力成倍提高。,理论上的最坏极端情况(几乎不会出现):常规检索系统用几个检索要素,我们也用几个。漏检的可能性相同。,15,成为唯一选择的原因,浏览效率提高,常规系统的检索结果是根据公开时间排序的,即使获得,100,个结果,也许可用的结果会在,70,位,则需要浏览,70,个才发现;,而,PATENTICS,通过语义排序后,最相关的在最前面,浏览效率大大提高。,案例:,CN1989859,特别用于运动鞋的内靴,权1:一种内靴,特别地用于运动鞋诸如滑雪鞋、直排轮旱冰鞋或滑冰鞋,包括前部(2)和后部(6),前部覆盖使用者的脚趾和前脚部分,后部在脚弓到脚跟的区域延伸;前部(2)通过一个或多个相互连接波纹带(14)连接到后部(6),波纹带(14)在静止位置具有最大伸长量。,成为唯一选择的原因,审查员的检索过程:(,bellow or bellows or flexible or deformable)and (inner or inside)and(A43B5/16 OR A43B5/04 OR A43B5/18)/IC,对比文件是:,EP0308368(,同族,US4893417),,,US4268931,成为唯一选择的原因,在,patentics,中,也可用,同样的检索式检索所有中,/,英文专利;,如果是根据公开日排序的话,该对比文件出现在280多位;,而同样的检索结果,根据该案的语义排序,该对比文件出现在第6位。仅仅需要浏览1/50的文档。浏览效率提高50倍。,(,B/bellow or B/bellows or B/flexible or B/deformable)and (B/inner or B/inside)AND ICL/(A43B5/16 OR A43B5/04 OR A43B5/18)AND R/CN1989859 AND DI/20051229,其实,我们不输入任何检索要素也能获得该对比文件!,也仅需要浏览13篇即可获得,浏览效率是传统方法的20多倍!,节省传统复杂检索表达式的尝试、浏览过程,检少漏检可能!,更多,X,文献可能在这里,即那些在传统方法中可能漏检的,中国公开号直接输入,直接选英文库,?,21,成为唯一选择的原因,对用户的要求常规系统需要组合多个检索要素,每个检索要素中还包括一个或多个关键词和,/,或分类号,难度很大。,Patentics,:如果直接输入公开号获得对比文件,不需要任何经验的人都会;如果需要一两个检索要素的,通过今天的培训都会。,22,成为唯一选择的原因,通过实测来证明,Patentics,的正确性!,通过实测来给用户信心!,大量统计数据证明,1,分析了,SIPO2004-2009,所做的,15522,个,PCT,检索,其中的中文,XY,对比文件,我们的机器自动对所有,300,多万篇中国专利排序,不需要任何人的智慧,就能容易获得很多对比文件。效果是非常惊人的。,http:/www.,patentics,.com/doc/contest-0-,cn,.,pdf,统计测试结果,全部:,6603,个,X,引用;命中:,4051,个,(61%),;,没有命中:,2552,个,(39%),;,TOP 1:,395,个,5.98%,第一位置,TOP 20:,1674,个,25.35%,第一屏,TOP 100:,2831,个,41.0980%,前,5,屏,TOP 400:,4051,个,61.35%,前,20,屏,不需任何检索策略,尽输入一专利公开号,,,Patentics,智能排序引擎,能实现,;,6%,可能排序第一位置的是审查员心目中的,X,文献;,25%,可能在第一屏发现,X,文献;,41%,可能在前五屏发现,X,文献!,23,24,成为唯一选择的原因,证据证明,2,:传统系统存在大量漏检,,patentics,能帮助改善,很多,SIPO,复审委的无效决定中给出的新对比文件,在,patentics,中位于前列;,http:/www.,patentics,.com/help/,intelligentcn,.,htm,很多,EPO,的,B1,中没有的而在,B2,中无效请求人提交的对比文件,在,patentics,中位于前列;,http:/www.,patentics,.com/,bbs,/,viewthread,.,php,?,tid,=26&extra=page%3D1,很多,SIPO,的,PCT,检索中只给出了,A,,而,EPO,给出的,XY,,在,patentics,中位于前列。,http:/www.,patentics,.com/,bbs,/,viewthread,.,php,?,tid,=27&extra=page%3D1,25,全面解决问题的方法,基础模式:用检索要素限定范围或不限定范围,and r/,排序基准,26,全面解决问题的方法,排序基准:就是你想让什么样的文献排在最上面,如果是查新检索,我们当然希望与案子最相关的在最上面,所以排序基准就是该案子的整个文档,排序基准的文本内容越多,排序效果越好;,普通检索建议直接用公开号做排序基准;,如果是,PCT,检索还没有文本,那么可以手工输入摘要或权利要求等内容作为排序基准;,在英文库也可以用中国专利作为排序基准。,27,全面解决问题的方法,用检索要素限定范围或不限定范围;,能限定范围就限定范围,主要采用关键词(常规检索系统具有的检索功能,,patentics,都具有,各种分类号,连词符,截词符等都可以用);,无法限定范围或不想限定范围就什么都不做,不限定就是对所有文献排序,取,400,个最相关的排出。,28,全面解决问题的方法,推介的方法:,1,)先不限定范围,直接用公开号对所有专利排序,看看排在前面的是否直接能用,有的话检索结束。,2,)然后,采用,B/,关键词,and r/,公开号限定出一个范围,可能是几万篇或几千篇,再用案子排序。,29,全面解决问题的方法,关键词选择原则:不一定要是发明点原则是要能有一定的限定功能,且尽可能不导致漏检,通俗的说就是我想要的对比文件中一定会出现的词。,30,全面解决问题的方法,中国专利公开号:,CN1728450,用于移动终端的天线支架,优先权日,20040721,检索员通过分析申请,认为对比文件中必须包含这两个词:,antenna,和,rotatable,用这两个关键词在美国申请和美国专利库中获得公开日在,20040721,前的,5251,项结果。常规检索系统中,检索员还必须进一步限定。否则无法阅读。如果用户需要增加移动电话这个检索要素,所以输入了关键词,MOBILE,。就会导致,US5771466,的漏检,,US5771466,中没有用,MOBILE,这个词,而是“,Portable radio transceiver,”。检索要素越多,漏检的可能越大。而,PATENTICS,不需要进一步限定,可以将获得的,5251,项结果根据,CN1728450,来排序。即:,(B/antenna
展开阅读全文