一种自动获取xpath生成爬虫脚本的方法及系统

上传人:daj****de 文档编号:213052444 上传时间:2023-05-24 格式:DOCX 页数:1 大小:13.04KB
返回 下载 相关 举报
一种自动获取xpath生成爬虫脚本的方法及系统_第1页
第1页 / 共1页
亲,该文档总共1页,全部预览完了,如果喜欢就下载吧!
资源描述
(19 )中华人民共和国家知识产权局(12 )发明专利申请(10)申请公布号CN107943838A(43)申请公布日2018.04.20(21) 申请号 CN201711034452.1(22) 申请日 2017.10.30(71 )申请人北京大数元科技发展有限公司地址100094北京市海淀区西北旺东路10号院新兴产业联盟大厦4层4-17室(72 )发明人姬永杰;陈国强汪长勇;任建新(74 )专利代理机构北京天悦专利代理事务所(普通合伙)代理人田明(51) Int.CI权利要求说明书说明书幅图种自动获取xpath生成爬虫脚本的方法及系统(57)摘要本发明公开了一种自动获取xpath生成爬 虫脚本的方法及系统,所述方法包括以下步骤: (1)通过url地址打开网页,遍历网页中所有的 a标签;(2)取出每个a标签对应的xpath路 径;(3)按xpath路径相同划分为一组;然后,统 计分组后a标签个数;(4)取出每组中的一个a 标签,打开该链接网页;(5)对于步骤4中每个被 打开的网页,统计网页中的a 标签个数以及文字 个数;(6)取出文字个数最多且a标签个数最少
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸设计 > 毕设全套


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!