分类

火车采集器(LocoySpider) V9.30.20210315最新版

火车采集器(LocoySpider) V9.30.20210315最新版

大小:33.77 MB

语言:简体中文运行环境:Win ALL

类别:安全软件时间:2022-07-02

火车采集器(LocoySpider)是一款专业的功能强大的网络数据/信息挖掘软,火车采集器(LocoySpider)功能非常强大,界面简洁明晰、操作方便快捷,设计得很人性化。火车采集器(LocoySpider)通过灵活的配置,您可以很轻松的从网页上抓取文字、图片、文件等任何资源。

火车采集器(LocoySpider) v9.30.20210315最新版

火车采集器(LocoySpider)功能介绍

1、通用性强

无论新闻、论坛、视频、黄页、图片、下载类网站,只要通过浏览器能看到的结构化的内容,通过指定匹配规则,都能采集到您所需要的内容。

2、稳定、高效

五年磨一剑,软件不断更新进步,采集速度快,性能稳定,占用资源少。

3、扩展性强、适用范围广

自定义web发布,自定义主流的数据库的保存和发布,自定义本地php及。net外部编程接口处理数据,让数据都能为你所用。

4、支持所有网站编码

完美支持采集所有编码格式的网页,程序还可以自动识别网页编码。

5、多种发布方式

支持目前所有主流和非主流的CMS,BBS等网站程序,通过系统的发布模块能实现采集器和网站程序间的完美结合。

6、全自动

无人值守工作,配置好程序后,程序将依据您的设置自动运行,完全无需人工干预。

7、本地编辑

本地可视化编辑已采集的数据。

8、采集测试

这是其它任何同类采集软件所不能比的,程序支持直接查看采集结果并测试发布。

9、管理方便

使用站点+任务方式管理采集节点,任务支持批量操作,再多的数据管理也很轻松。

火车采集器(LocoySpider)软件特色

1、规则自定义

通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。

2、多任务,多线程

可以同时进行多个信息采集任务,每个任务可以使用多个线程。

3、所见即所得

任务采集过程所见即所得,过程中遍历的链接信息、采集信息、错误信息等都会及时的反映在软件界面中。

4、数据保存

数据边采集边自动保存到关系数据库中,并且数据结构能够自动适应,软件可以根据采集规则自动创建数据库,以及其中的表和字段,也可以通过导库方式灵活的将数据保存到客户已有的数据库结构中。

5、断点续采

信息采集任务可以在停止后从断点开始继续采集,从此你用不再担心你的采集任务意外中断了。

6、网站登录

支持网站Cookie,支持网站可视化登录,即使登录时需要验证码的网站也能采集。

7、计划任务

通过这个功能可以让你的采集任务定时、定量或者一直循环执行。

8、采集范围限制

可以根据采集的深度和网址的标识来限制采集的范围。

9、文件下载

可以将采集到的二进制文件(诸如:图片、音乐、软件、文档等等)下载到本地磁盘或者采集结果数据库中。

10、结果替换

可以将采集的结果根据规则替换成你定义的内容。

11、条件保存

可以根据某个条件来决定那些信息保存,那些信息过滤。

12、过滤重复内容

软件可根据用户设置和实际情况对重复内容和重复网址自动删除重复内容。

13、特殊链接识别

运用此功能可以将用JavaScript动态生成的链接或其他更古怪的连接识别出来。

14、数据发布

可以通过自定义接口,将已采集的结果数据发布到任意的内容管理系统和指定数据库中。现在已支持的目标发布媒体包括:数据库(access, sql server,my sql,oracle) ,静态htm文件。

15、预留编程接口

定义多个编程接口,用户可以在事件中利用PHP,C#语言进行编程,扩充采集功能。

火车采集器(LocoySpider)安装教程

1.在本站下载并解压压缩包,点击"火车采集器9.9版安装程序.exe"文件,进入安装程序,点击下一步。

火车采集器(LocoySpider) v9.30.20210315最新版

2.阅读许可协议,选择"我接受许可证协议中的条款",点击下一步。

火车采集器(LocoySpider) v9.30.20210315最新版

3.选择安装位置,默认:"D:火车采集器V9",也可以点击浏览,自己选择安装位置,确定后点击安装,LocoySpider安装完毕。

火车采集器(LocoySpider) v9.30.20210315最新版

火车采集器(LocoySpider)更新日志

2021-03-15

火车采集器V9.30版

1.优化标签数据处理中字符替换。

2.对文件探测无效导致文件下载失败问题优化。

3.处理用户名包含特殊符号不能登录问题。

4.修复数据管理批量操作数据有异常弹窗提示。

5.修复二级代理卡死问题。

6.完善自动获取cookie失败问题。

7.发布到word,自动转义"&lt;"、"&gt;"为"<"、">"。

8.修复:勾选发布选项,采集最大数无效。

9.修复oracle链接问题。

10.支持oss存储。

11.修复:下载地址后面有斜杠,下载文件时无后缀名。

同类推荐