蜂集采集器用户触发以及定时任务工作模式介绍
采集器的运行模式有两种:用户触发和定时任务(进入蜂集-系统配置-系统设置即可看到运行模式)。
用户触发
用户触发是蜂集采集器默认的工作模式。这种模式下,采集器的运行依赖用户访问。这里的用户可以是正在浏览网站的访客、搜索引擎蜘蛛或者监控机器人。只要有用户访问,采集器就可以自动工作。
如果您的网站有大量蜘蛛访问,即可使用用户触发。但如果您的网站是一个新站,还没有任何蜘蛛访问,这种方式就不适合您,定时任务模式或许更适合您。
定时任务
如果您安装了主机面板,设置定时任务十分方便,那么我们更推荐您使用定时任务模式。
这种模式优点有个:
- 采集稳定,不依赖用户访问触发。
- 减少wordpress的负担,彻底消除对用户访问的影响
蜂集定时运行模式设置
首先进入 蜂集-系统配置,将运行模式设置为定时任务,如下图:

接着下面会显示定时任务的接口。定时访问这个接口即可。定时访问该接口有多种方式,这里列举几个比较常见的设置方法。
宝塔面板定时任务
如果你安装了宝塔面板,那么设置非常简单。点击菜单的计划任务,选择访问URL。如下图:

执行周期选择1分钟,url地址填写上面给出的定时任务访问接口即可。
如果你没有面板,那么使用crontab即可。
如何设置定时采集
蜂集的采集任务可以设置采集间隔,也就是定时采集。可以针对正文抓去间隔设置1年以内的任意间隔。
比如你希望采集器每隔5秒采集一次,那么正文间隔就设置为5秒。
如果你希望一天能采集24篇文章,那么把采集间隔设置为1小时即可,是不是十分方便呢。

你可能还喜欢下面这些文章

发布模块是用来将自定义的采集的字段转化为符合wordpress要求的文章字段的模块,转换之后可直接发布为文章。在没有新增自定义的采集字段的时候都可以使用默认发布模块,默认发布模块只保证标题,正文有值即可发布。

要了解这种现象出现的原因,需要了解一下定时发文的工作模式。定时发文依赖站长工具箱里面的定时任务库,而定时任务需要有访问才会被触发。如果你的网站确实是一个新站,那么可以使用主机面板提供的定时任务来访问网站的首页或者 http://你的网站地址/

这是一款可以让你的WordPress网站实现不关站备案的插件,不影响收录,蜘蛛访问,也不影响搜索引擎带来的流量。如下图所示但是蜘蛛是可以访问的,并且如果是从搜索引擎跳转过来的,页面也是可以访问的。

wordpress支持采集吗?wordpress本身并没有采集功能,不过可以通过插件来实现采集功能,目前wordpress上比较好的采集插件是imwprobot(蜂集采集),可以实现全自动采集,虚拟主机也可以运行。首先需要安装网站采集插件,前

从1.3.6.2之前,运行模式是用户访问或者蜘蛛访问会触发采集,不过对于没有用户访问的新站来说这并不友好,于是后续的版本的蜂集增加了进程模式!当前的进程在windows和linux上均可使用,不过windows上没有测试,可能会存在一些问题,

众所周知,规律发文无论对用户还是对搜索引擎都十分友好。wpap就是是一款能让你的wordpress自动定时发布文章的插件。首先下载并安装站长工具箱插件。然后再下载并安装定时发文插件

文章发布时候可自动将文章推送到多个搜索引擎,蜘蛛访问更勤。当您安装插件时已经存在许多文章时,可使用推送历史文章批量推送到搜索引擎。记录每种搜索引擎每天的推送数量,可以图表展示。