/简体中文 /
/简体中文 /
/简体中文 /
/简体中文 /
/简体中文 /
/简体 /
火车采集器是一款功能强大的数据采集软件,使用该软件可以轻松地在网页上获取所需的资源,如文本、图片、文件等。该软件还支持远程下载图片文件,检测文件的真实地址,采集防盗链,采集数据直接入库,模仿人工发布等。
1、通用性强
无论新闻、论坛、视频、黄页、图片、下载类网站,只要通过浏览器能看到的结构化的内容,通过指定匹配规则,都能采集到您所需要的内容。
2、稳定、高效
五年磨一剑,软件不断更新进步,采集速度快,性能稳定,占用资源少。
3、扩展性强、适用范围广
自定义web发布,自定义主流的数据库的保存和发布,自定义本地php及.net外部编程接口处理数据,让数据都能为你所用。
1、规则自定义 - 通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。
2、多任务,多线程 - 可以同时进行多个信息获取任务,每个任务可以使用多个线程。
3、所见即所得 - 任务采集过程所见即所得,过程中遍历的链接信息、采集信息、错误信息等都会及时的反映在软件界面中。
4、数据保存 - 数据边采集边自动保存到关系数据库中,并且数据结构能够自动适应,软件可以根据采集规则自动创建数据库,以及其中的表和字段,也可以通过导库方式灵活的将数据保存到客户已有的数据库结构中。
5、断点续采 - 信息收集任务可以在停止后从断点开始继续采集,从此你用不再担心你的采集任务意外中断了。
6、网站登录 - 支持网站Cookie,支持网站可视化登录,即使登录时需要验证码的网站也能采集。
7、计划任务 - 通过这个功能可以让你的采集任务定时、定量或者一直循环执行。
8、采集范围限制 - 可以根据采集的深度和网址的标识来限制采集的范围。
9、文件下载 - 可以将采集到的二进制文件(诸如:图片、音乐、软件、文档等等)下载到本地磁盘或者采集结果数据库中。
10、结果替换 - 可以将采集的结果根据规则替换成你定义的内容。
2021-03-15
火车采集器V9.30版
1、优化标签数据处理中字符替换。
2、对文件探测无效导致文件下载失败问题优化。
3、处理用户名包含特殊符号不能登录问题。
4、修复数据管理批量操作数据有异常弹窗提示。
5、修复二级代理卡死问题。
6、完善自动获取cookie失败问题。
7、发布到word,自动转义“<”、“>”为“《”、“》”。
8、修复:勾选发布选项,采集最大数无效。
9、修复oracle链接问题。
10、支持oss存储。
11、修复:下载地址后面有斜杠,下载文件时无后缀名。