智动网页内容采集器更新日志

时间:2012年02月16日 点击:973

2019-5-10:1.96发布:

增加了支持TLS1.2,SSL3加密采集内核

2019-5-8:1.95发布:

增加了全局设置:合并HTTP请求COOKIE功能,可选

该功能默认合并,可以设置不合并避免个别网站检查新COOKIE限制采集

2014/11/17:1.93发布:

去除内置浏览器自动加http前缀,需要手动添加,排除特殊前缀无法打开问题
测试时获取的HTML自动清除WINDOWS不识别无意义字符,解决windows显示时HTML内容不全问题

2014/6/25:1.92发布:
增加采集规则JS方式提取时中当前网址参数JsLocUrl
保存内容模板插入标记时不再复制标记再插入,而是直接插入

2014/6/19:v1.91发布:
修复对非正规格式网页自动识别网页编码BUG
清除标记增加,清除首尾空行标记
启动最新反馈系统
启用最新资讯界面
启用最新系统内核

2012/7/31: v1.9发布:
软件内置网址更新为www.zdexe.com
采用全新的智动软件控件UI
增加用户反馈到EMAIL功能
增加将初始化链接直接设置作为最终内容页处理功能
加强内核功能,支持关键词搜索替换POST内的关键词标记
优化采集内核
优化断线拨号算法
优化去重复工具算法
修正拨号显示IP不正确BUG
修正遇出错关键词暂停或拨号时没有重新采集出错页面的BUG
修正限定内容最大值为0时,最小值无法正确保存BUG

2011/8/30 v1.8发布:
菜鸟福音,加入easy智能采集模式可以输网址就可采到内容
增强错误日志功能,可批量导出采失败网址
日志可以设最大容量,超过则自动删除
增加规则版本项目
修正获取登录COOKIE不全问题
修正自动关机,自动关软件冲突问题
修正采集内核BUG
HTTP底层内核优化,避免采集网页卡死问题
 
2011/8/2 v1.7发布:
增加重复内容清除工具
增加默认保存目录按钮
修正程序窗口标题显示及主窗口显示延时问题
修正保存文件时自动重命名路径非法字符BUG
优化待采内容清重复内核
优化待采网址数过多时占CPU高,耗时高等问题

2011/5/15 v1.6发布:
增加反防采集设置搜索几页拨号换IP
增加反防采集设置搜索遇到出错标拨号记换IP
修正测试时没有设置用户头BUG
修正等待任务启动过慢BUG
修正采集链接规则以JS脚本方式时不能返回多个网址BUG
 
2011/4/21 v1.5发布:
增加内容分页可以设置分隔符号
增加采集任务完成自动关机,自动关闭软件设置
增加加入过滤长度不够的内容,可以自己设,长度小于多少的不要,0为不限
增加增加清除标记“规则化文章”可自动清除文章中除了图片和段落符以外的HTML标记
修正等待任务不会自动启动BUG
 
 
2011/4/9 v1.4.2发布: 
初始化文本框可填网址数长度增加
修正部分网页不能自动识别编码BUG
修正采集卡死BUG,该更新十分重要,采内容过多时经常出现,一定要更新哦
 
2011/3/24 v1.4.1发布: 
修复暂停采集出错采集BUG
修复任务重复启动出错BUG
修复转为完全网址不正确BUG

2011/2/20 v1.4发布:
内容链接采集没有引用全局设置的客户端BUG修正
处理链接采集规则严重BUG修正(该BUG引起部分规则出错时,内容采不全)

2011/1/18 V1.3发布:
数据类型更新,不再兼容旧版数据,有旧版采集规则的请手动转换,或保留1.3以前版本采集使用
加入超强大的自定义JavaScript脚本提取内容功能
增加更简单强大的采集分页内容功能(去除了以前繁琐的实现方式)
增加错误信息管理器,更方便的查看和管理您的错误信息
降低最大测试采集链接数默认值
增加清除标记库:去除链接和链接文字
强化清除标记网址正则匹配
优化内核,减少对不必要页面的获取,加快了采集速度


2010/12/16:
可略过链接采集设置,直接以初始化链接为最终采集目标,是采集规则更灵活
多条内容采集分隔符以输入为准更人性化
 
2010/7/19:
发布智动网页内容采集器v1.1.6版本
修正相对地址转绝对地址BUG
测试时最大采几页控制

2010/6/30:
发布智动网页内容采集器v1.1.5版本
文件重复时可选自动重命名
修正最终结果加入链接BUG
修正多规则BUG

2010/6/28:
发布智动网页内容采集器v1.1.4版本
过滤标记列表竖向显示
增加默认保存文件目录
智动资讯可选显示
修正部分BUG

2010/6/1:
发布智动网页内容采集器v1.1.3版本
修正线程并发写文件保存BUG

2010/5/31:
发布智动网页内容采集器v1.1.1~1.12版本
修正了模版为空不保存网页源码的BUG
v1.12:
修正内部BUG
修正线程并发BUG
修正快捷键冲突BUG

2010/05/28:
发布智动网页内容采集器v1.1.0版本
更新内容:
1、修改了链接采集方式,适应所有复杂规则采集
2、保存内容采用固定文件名时可以进行修改
3、复制时可以修改任务名称
4、增加相同文件标题处理方式
5、增加清除网址规则、清除QQ、电话号码等规则
6、修正补全为完全地址时图片链接补全BUG
7、修正内置IE打开源码为乱码BUG
8、修正内置IE中文URL为乱码BUG
 
2010/05/23:
发布智动网页内容采集器v1.0.0版本

赞助商链接

相关内容

联系我们

联系方式