海量邮件对比去除重复的解决方案.doc

上传人:wux****ua 文档编号:8877183 上传时间:2020-04-01 格式:DOC 页数:2 大小:16.50KB
返回 下载 相关 举报
海量邮件对比去除重复的解决方案.doc_第1页
第1页 / 共2页
海量邮件对比去除重复的解决方案.doc_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述
海量邮件对比去除重复的解决方案最近有个北京的做邮件营销的朋友,他手里很多个几百万的数据,需要做去除重复处理。他要求我能够帮它忙。以下是我在摸索中的一些解决方案,供大家参考:1:自己写程序来实现:能够实现,但涉及的技术非常繁琐:1) 集合预算知识2) 多线程处理3) 文本文件读写操作4) 集合或数组的基本操作然后软件调试2:寻找市场上成熟的去除重复的软件。发现现成的软件满足不了要求,订制开发的话,软件公司的报价比较高,一个工作日需要1000元以上。3:利用SQL脚本去除重复User 目标数据库1) 查询a,b中重复的邮件:也即 a交bSelect mail from a where mail in (select mail from b )2) 查询a中有,b中没有的邮件,也即a差bSelect mail from a where mail not in (select mail from b )3) 查询b中有,a中没有的邮件,也即b差aSelect mail from a where mail not in (select mail from b )4) 查询a,b都有的邮件,也即a并b: 执行过程中发现:内存占用:1.3G CPU占用:99%Select col001 from a UnionSelect col001 from b 这种方法对计算机的硬件配置要求比较高,内存要求2G 以上结果发现:方案3是快速可行的解决方案,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!