OrientX40系统开发报告

上传人:daj****de2 文档编号:148997931 上传时间:2022-09-06 格式:DOCX 页数:31 大小:593.05KB
返回 下载 相关 举报
OrientX40系统开发报告_第1页
第1页 / 共31页
OrientX40系统开发报告_第2页
第2页 / 共31页
OrientX40系统开发报告_第3页
第3页 / 共31页
点击查看更多>>
资源描述
OrientX4.0系统开发报告XML GroupJuly 25, 2009TCP/IP IllustratedStevensW.Addison-Wesley65.95XML Keyword SearchKeyword: Stevens, Addison-WesleyTCP/IP IllustratedStevensW.Addison-Wesley65.95Advanced Programming in the Unix environmentStevensW.Addison-Wesley65.95Advanced Programming in the Unix environmentStevensW.Addison-Wesley65.95 OrientX4.0已完成的工作-xml文档的sax解析-XML文档的D ewey编码-存储和索引-SLCA算法的实现 OrientX4.0已完成的工作-xml文档的sax解析-XML文档的D ewey编码-存储和索引-SLCA算法的实现OrientX4.Q系统结构$入乂简介 SAX (Simple API for XML) SAX是一种解析XML文件的技术。-使用事件基础来处理XML文件,目前大部分XML 解析器除了支持DOM外,都会一并支持SAX解析。 SAX是一组程序接口。-可以将XML文件视为字符串流的数据,在读取 XML元素时触发一系列事件,只需撰写所需的 事件处理程序,就可以分析或取得XML元素。XML文件在经过SAX解析后,产生一系列事 件,我们可以建立事件处理程序来处理这些事件。XML文件characters (TCP/IP) startDocument 事件 startElement 事件-attribute a;-a.getLength();-a.getQname();-a.getValue(); Characters 事件 endElement 事件 endDocument 事件 TCP/IP Illustrated Stevens W, Addison-Wesley 65.95 bibbookStevensW. OrientX4.0已完成的工作-xml文档的sax解析-xml文档的D ewey编码-存储和索引-SLCA算法的实现OrientX4.Q系统结构Dewey编码 int dewey51=0,1, 1,.,1对元素、属性、属性值、文本进行编码举例bibbook0.00.0.2year 0.0.0title 0.0.1publis I 0.0.3price0.0.4T 0.0.0.01994authorTCP/IPlastfirstAddison65.950.0.1.00.0.2.00.0.2.10.0.3.00.0.4.0W.Stevens0.0.2.0.00.0.2.1.0Stevens W.编码举例初始情况:intdewey51=0,-1,-1,-1,,-1start: bib (1,0,start: book(2,0,0,start: year (3,0,0,0,start:1994(4,0,0,0,0,end:1994 3,0,0,0,0,-1,.end: year 2,0,0,0,-1,-1start: title(3,0,0,1, TCP/IP Illustrated Stevens W. Addison-Wesley 65.95 OrientX4.0已完成的工作-xml文档的sax解析-xml文档的D ewey编码-存储和索引-SLCA算法的实现OrientX4.Q系统结构编码的组织目标:给出要查询的关键字迅速找到对应 的D ewey编码 hash倒排表存储编码几点要注意的问题-关键字的分割无意义关键字-Hash冲突解决倒排表结构DeasvCodeLk I *IfcwEyC( delistDtvryCiKJr NcdrEJtwtyCodeNodeDqw pyQqdNMlncwcyCj)dcL.iyt /Sfew/PqwiryCcKfcNcnlc图 hash inverted list key: Stevens; Deweycode: 0.0.2.0.0. hash(Stevens)=(S*31+t)*31+.)/Nhash=552 key: Stevens; Deweycode: 0.1.2.0.0 hash(Stevens)=552 key: xxx, 0.1.3.0 hash(xxx)=552一些问题关键字的分割-文本结点 q-属性值结点-可能含有扑关键字-选择合适的分隔符:空格,逗号,冒号,意义不大的关键字-定冠词-连词 OrientX4.0已完成的工作-xml文档的sax解析-xml文档的D ewey编码-存储和索引-SLCA算法的实现OrientX4.Q系统结构SLCA的实现Naive方法-对所有关键字的组合求LCA-从结果中去掉祖先结点-剩余的就是SLCA结点Key S Stevens: 0.0.2.0.0,0.1.2.0.0Key A Addison-Wesley: 0.0.3.0,0.1.3.0Key S Stevens: 0.0.2.0.0, 0.1.2.0.0Key A Addison-Wesley: 0.0.3.0, 0.1.3.0(a) node0.0.2.0.0bib 0book 0.0book 0.1Key S Stevens: 0.0.2.0.0, 0.1.2.0.0Key A Addison-Wesley: 0.0.3.0, 0.1.3.00TF0FF2FF0FF0FF(a) node0.0.2.0.0S ASA0T2F0F_0_J2TF0FF0FF0TF0FF0FT3FF0TF0FFbib(b) node0.0.3.0publisher 0.0.3.0.0.2 author0.1publisherbookauthorbook 0.0price0.0.2.0 lastfirstAddison0.0.3.0last first65.950.1.3.00.0.2.0.0StevensW.0.1.2.0.0Stevens W.Key S Stevens: 0.0.2.0.0, 0.1.2.0.0Key A Addison-Wesley: 0.0.3.0, 0.1.3.0SA0TF0FF2FF0FF0FF(a) node0.0.2.0.00TF2FF0FF0FFS A2TF0FF0FF0TF0FF(b) node0.0.3.00TT0FFreport 0.0 as a0TF0FF2FF1FF0FF(c) node0.1.2.0.01TF0FF0FT3FF1TF0FF(d) node0.1.3.01TT0FF0 F Freport 0.1 as a slcaThanks
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸设计 > 毕设全套


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!