懒人采集器

全新一代的浏览器采集,给你不一样的采集体验!

更新日期:2024年07月22日     查看版本更新日志

下载新版懒人采集器

win

Windows(64位)

支持 Windows 7及以上版本

CPU 4核8G,磁盘空闲不少于10G

下载 (v4.0.2)
win

macOS

支持 macOS10.15 (Catalina)及以上版本

磁盘空闲不少于10G

下载 (v4.0.1)
win

Linux(64位)

支持X64的Linux内核的操作系统

ARM或龙芯CPU的用户可联系作者免费设配

下载 (v4.0.1)

下载旧版懒人采集器

旧版懒人采集器(V3.2.9.2)    立即下载

V3.2.9.2及更低版本的懒人采集器仅支持Windows系统,系统要求
以上两个组件缺一不可,请务必安装完整,否则将无法正常运行。

版本更新日志

4.0.2(2024-09-07)
新增验证码识别画布大小调整,某些网站验证码显示不全时可以调整画布大小解决

4.0.1
懒人采集器4(跨平台版)使用全新架构重新开发,支持Windows系统、Mac系统、Linux系统,任务规则全功能免费使用,不限制导出数据数量,免费版本任务每次运行30分钟

3.2.9.2(2024-09-07)
新增验证码识别画布大小调整,某些网站验证码显示不全时可以调整画布大小解决

3.2.9.1
修复预登录部分网站后出现闪退等问题
 
3.2.9.0
新增运行日志列表管理
修复部分文本框控件右键菜单复制粘贴问题
优化http或json引擎数据请求功能,修复某些网页请求提示“协议冲突”错误
 
3.2.8.0(2022-05-14)
可选择预执行功能适用于第一页还是所有分页
更改json引擎默认编码为UTF-8,修复首次切换至json引擎不加载数据问题
新增post模式下快速粘贴和编辑Headers按钮
其他一些bug修复
 
3.2.7.3
修复xpath中出现单引号时模拟鼠标点击方式无效问题
 
3.2.7.2
可选择预执行功能适用于第一页还是所有分页
更改json引擎默认编码为UTF-8,修复首次切换至json引擎不加载数据问题
新增post模式下快速粘贴和编辑Headers按钮
其他一些bug修复
 
3.2.7.1(2022-05-10)
修复​循环点击测试按钮无效问题
 
3.2.7.0
新增预执行操作-循环点击功能
优化网页列表和分页的自动识别功能
生成列表XPath时自动加上列表元素的class属性参数
运行日志显示每页采集数据
修复手动设置分页高亮显示细节问题
增加手动设置分页错误提示
修复部分网站使用自动识别分页时不能自动停止分页问题
 
3.2.6.1
新增字段默认取值方式改为InnerText
 
3.2.6.0
升级Chrome内核,支持网页视频
优化自动识别列表算法
 
3.2.5.3
升级Chrome内核
新增超级鹰打码,删除已失效的超级云、联众打码
 
3.2.5.2
修复联众打码配置界面显示不完整问题
 
3.2.5.1
采集完成自动发布时,只发布最新采集的数据
修复某些任务编辑窗口无法关闭问题
 
3.2.5.0
修复网站发布接口提交数据不能包含&符合问题
 
3.2.4.9
优化编译,修复某些组件系统兼容性问题
 
3.2.4.8(2021-09-01)
修复新版js中调用字段内容无效问题
 
3.2.4.7(2021-09-01)
修复MySql的SSL连接问题
 
3.2.4.6
升级MySql组件,修复某些新版数据库连接出错问题
 
3.2.4.4
优化自动识别下一页功能
修复网页文本框选择元素无效问题
修复http和json引擎代理问题
...
 
3.2.4.3
优化自动识别下一页功能
修复网页文本框选择元素无效问题
修复http和json引擎代理问题
 
3.2.4.2(2021-08-06)
修复单条模式自动生成字段xpath无效问题
 
3.2.4.1
修复上个版本选择字段等问题
 
3.2.4.0
新增网页加载延迟选项
优化规则编辑器线程及网页加载判断问题
修复个别规则最小化运行出错问题
改进软件编译加密方式
其他一些细节改进
 
3.2.3.1
一、新增三个非常实用的js函数
1.读取字段内容:context.getFieldValue("字段名")
2.读取变量内容:context.getVarStr("变量名")
3.写入变量:context.setVarStr("变量名","变量值")
可在js代码中直接读写用户变量,获取其他字段内容并赋值给js变量,字段内容不受换行或引号影响(之前js中标签式引用字段{=字段名=}不适合复杂内容,已弃用)。
二、新增字段值保存至变量功能
 
3.2.2.0
改进列表选择功能
简易采集配置支持POST参数
右键元素XPath中显示当前同类元素数量,列表XPath,一键应用到当前列表
一些细节修复
 
3.2.0.1
改进自动生成字段算法
修复简易采集文件选择框内容保存问题
 
3.2.0.0
改进广告过滤算法,提高过滤效率
进一步优化规则编辑器,提高网页载入及运行速度
修复简易采集窗口有自定义下拉框时保存出错问题
 
3.1.6.0
修复简易模式下修改关键词及预登陆相关问题
简易采集窗口自适应大小
其他一些细节改进
 
3.1.5.0
修复新版Json引擎选择列表无效问题
修复http引擎任务运行问题
单行模式下选中字段数据时高亮显示网页元素
 
3.1.3.0
改进保存登录状态、XPath生成,支持http重定向等功能
 
3.1.2.0
优化规则编辑器
生成XPath中增加子元素列表XPath
修复网站预登陆无效问题
其他一些细节修复
 
3.1.1.0
新增右键菜单-生成XPath功能
提升规则编辑器速度
修复多值字段高亮显示问题
修复3.x版运行窗口最小化时出错问题
 
3.1
修复3.0加密引发的某些错误
改进元素选择、元素高亮虚线框自适应窗口大小
独立设置规则的网页超时时间,优化采集效率,提供采集稳定性
其他一些功能改进和修复
 
3.0
使用Chrome浏览器内核,提升网页兼容性,提高采集速度。
重写和优化所有浏览器相关功能,支持一键选择列表等功能。
默认使用新的安装目录,不要直接安装在2.x火狐内核版目录内,可和旧版同时使用。
兼容旧版规则,把旧版Tasks复制到新版目录里就可以快速导入全部规则。
 
2.8.2.2(2021-04-17)
修复post参数中包含中括号内容时被误当做关键字解析问题
 
2.8.2.1(2021-04-16)
新增Json和Http引擎下源码处理功能
 
2.8.2.0(2021-04-06)
使用.net4.7编译,需要升级.net framework至4.7以上
支持非浏览器引擎模式下提取当前URL信息
新增引用字段、随机字符、时间字符、时间戳等(附加前后缀,文件下载)
改进下载地址url地址判断规则
其他一些细节修复
 
2.8.1.0
自动解码json中被js编码的字符,避免json解析出错
优化json节点树的显示速度
修复某些任务不停止时直接关闭会出现错误提示
 
2.8.0.0
运行环境更改为.net4.6,低版本.net用户请手动升级至4.6或以上版本
新增起始地址列表标签、文件标签,URL编码标签等,支持单击选中和编辑标签
简易模式界面支持配置列表参数和文件选择框
改进递增数字和关键字标签写法,旧版规则如有用到需要重新编辑此标签
选择框架页列表时可选择是否自动载入框架页
修复https下载出错问题
 
2.7.3.1
修复上个版本起始页多网址批量运行问题
改进去重策略
 
2.7.3
新增变量选择-系统变量(桌面目录、软件目录、时间戳)
文本框支持高亮显示变量标签
 
2.7.2
修复脚本命令里写值出错问题
 
2.7.1
新增自动升级功能
运行窗口里新增拦截请求历史记录
使用多标签显示运行日志、采集数据、拦截请求
其他优化和修复
 
2.7
升级浏览器内核,兼容更多网站
新增视图菜单-任务列表
修复个别字体加密的网站创建列表无响应问题
修改HTTP请求网址显示方式
优化广告过滤效果
修复网站预登陆相关问题
其他一些细节修改
 
 
2.6
新增验证码识别功能,支持多种打码方式
新增Z-Blog发布接口
新增网站发布接口模板参数管理功能(一键另存或删除模板)
提高各种数据导出方式的导出速度
Excel导出方式默认格式更改为xlsx文件
自动过滤列表中的空行
修复post模式下起始网址为空时无法打开设置页
修复其他一些细节问题
 
2.5
优化列表智能算法,可自动识别各种网页列表
新增多列表切换,可以一键切换选择一个页面中的不同列表
新增POST采集方式
新增数据列表左侧行标题菜单(一键添加或排除某种类型的行)
新增页面载入等待界面
选中字段时自动滚动到高亮元素位置
禁用OCSP,提高网页兼容和载入速度
其他一些细节优化
 
2.4.1
使用json或http引擎运行时不显示浏览器窗口
修复上个版本出现的脚本点击测试按钮无效问题
 
2.4
新增自动保存任务日志、任务日志保存天数设置
新增广告屏蔽,支持使用通配符自定义广告屏蔽规则
新增浏览模式按钮,切换到此模式下可正常点击和操作网页
新增查看请求功能,可查看所有请求,快速添加到广告屏蔽窗口
初始化测试网址按钮移动到左侧
浏览器脚本切换按钮移动到左上角
多线程载入规则编辑窗口中的多层网页,修复其中一些细节问题
减小规则编辑窗口宽度,美化图标
 
2.3.3
优化规则编辑器载入速度
修复数据处理中某些项目保存空值无效问题
改进网页载入超时显示时间不准确问题
 
2.3.2
加强json字符解析能力
改进打开编辑窗口时出现的一些细节问题
修复数据处理中内容截取和正则提取细节问题
修复规则和字段名称中包含特殊字符时无法正常采集问题
 
2.3.1
深入采集可用于非href字段
 
2.3
文件下载支持自动下载html中引用的图片、本地化下载地址、本地路径前缀
新增本地采集数据一键发送至VG信息库功能
新增变量功能
新增全局设置:选项-下载时跳过已存在的文件
修复网站发布接口gbk编码发送时可能出现乱码问题
修复新建或改名时多次保存会产生多个副件问题
内存优化,减少内存占用
其他细节调整
 
2.2
改进瀑布流分页列表提取方式,仅提取新加载的列表,大大提高效率
 
 
2.1
新增编辑面板里的停止按钮、初始化测试网址按钮
新增字段表头拖拽排序功能
新增程序退出时自动清除浏览器缓存选项
新增添加新元素按钮
新增编辑器数据列表右键复制和深入指定链接功能
修复页面超时设置无效问题--
优化规则编辑和运行效率
 
懒人采集器2.0
新增起始网址标签功能,支持关键字标签和递增数字标签
新增在线采集市场,包括大量简易模板,可一键创建采集任务
新增共享数据下载服务,采集规则、数据需求申请服务
新增数据处理-HTTP请求
新增数据处理-正文提取
新增数据处理-执行C#代码
新增数据处理-执行JavaScript
新增脚本命令-执行Js代码
新增网站发布接口
新增采集窗口“导出数据”按钮(采集完成时显示)
新增运行器独立Cookie和缓存功能
改进网页载入完毕判断机制
升级网站会员中心,新增金币充值、支付宝实时到账支付等功能
升级客户端密码加密方式(需重新登录)
其它一些细节修改
 
1.2
修复无法打开某些使用了不受认可证书的网站问题
正则匹配--
起始页批量编号支持变量字符--
 
1.1.4.4
修复某些加载较慢的页面采集失败问题
 
1.1.4.3
优化json字符解析器
 
1.1.4.2
运行日志里显示请求间隔时间,修复在多起始网址里无效的问题
 
1.1.4.1
 
1.1.4.0
自动生成字段时不再每个链接都自动创建url字段
新增复制粘贴任务功能
修复某些网页显示不完整问题
导出任务时添加默认文件名
新增POST请求--
完善http引擎多线程运行--
 
1.1.3.0
兼容解析一些非标准格式的json数据
新增右键菜单复制json树节点文本
其他一些细节修改
 
1.1.2.0
改进自动识别网页列表的算法
删除任务时自动停止并从运行列表里移除
 
1.1.1.0
修复新建任务时未能正常开启js导致部分网页显示不正常问题
新增一键删除列表和字段配置菜单