蜂集采集器发布模块是什么

更新于 2022年7月3日 说明书

发布模块是将采集的字段转化为符合wordpress要求的文章字段的模块,转换之后可直接发布为文章。

在新建发布模块的时候,可以看到左侧有标题、正文、分类目录等信息,这个时候将采集的字段填写到右侧的内容框即可。

采集的时候会通过发布模块将采集的字段发布到wordpress中。

有时候我们希望正文是源网页中很多部分拼接起来,比如源站点中存在下载地址,而我们采集的时候想要将下载地址加入到正文中。这个时候采集的时候就需要content和download两个字段保存正文和下载地址,而发布的时候则需要将这两个字段合并到正文字段。

发布模块的拦截功能

发布模块另一个重要的作用在于根据条件拦截发布。举几个例子。

例子一:比如我们不希望采集到的空的文章,就可以使用最小长度来拦截这种文章被采集到。比如设置最小长度为10,那么源站中正文长度小于10的文章都不会被采集到。

例子二:我们不希望采集的内容包含某些词汇(可能是一些违禁词或者广告词),那么可以在不能包含中设置不能包含的词汇。这样源站点中包含我们设置的词汇的文章就不会被采集下来。

默认发布模块是什么?

很多时候,我们并不需要那么复杂的规则,只需要设置一些简单的分类和作者信息即可。这个场景下每个任务新建一个发布规则显得太复杂,因此任务中有一个默认发布模块。在没有新增自定义的采集字段的时候都可以使用默认发布模块,默认发布模块只保证标题,正文有值即可发布。

默认发布模块的分类可以是采集中的分类,也可以是任务中设置的分类。

你可能还喜欢下面这些文章

蜂集采集器用户触发以及定时任务工作模式介绍蜂集采集器用户触发以及定时任务工作模式介绍

考虑到大量用户使用的linux面板可以很容易设置定时任务,因此在蜂集1.6.5版本增加了定时任务模式。执行周期选择1分钟,url地址填写上面给出的定时任务访问接口即可。

wordpress支持采集吗wordpress支持采集吗

wordpress支持采集吗?wordpress本身并没有采集功能,不过可以通过插件来实现采集功能,目前wordpress上比较好的采集插件是imwprobot(蜂集采集),可以实现全自动采集,虚拟主机也可以运行。首先需要安装网站采集插件,前

蜂集采集器,一款全自动的wordpress采集插件蜂集采集器,一款全自动的wordpress采集插件

imwprobot(蜂集)是一款wordpress采集插件。有什么功能1. 全自动无人值守,支持定时采集2. 可自动同步目标站的更新3. AI自动关键词、自动摘要生成4. 直接发布到wordpress,不需要额外的接口支持5. 正文图片和缩略

自动图片插件入门教程自动图片插件入门教程

欢迎使用WordPress自动图片插件。进入正文图选项,开启文章配图,如下:这个设置稍微麻烦一点,如果您是WordPress资深用户且不希望配图消耗磁盘空间,建议尝试使用该高级特性。

蜂集采集器如何对采集到的内容进行关键词替换蜂集采集器如何对采集到的内容进行关键词替换

通常情况下,采集到的内容不一定符合我们的要求,需要对数据进行一些加工才能使用。使用蜂集的可以进行任意关键词替换。内容替换操作可以将左边的词替换为右边的词,支持文本和正则表达式。

wordpress智能自动摘要插件:wpaewordpress智能自动摘要插件:wpae

目前wordpress的摘要大多数由主题提供。一直以来没有一款插件可以智能提取正文的关键内容作为摘要,于是自己动手做了一个,命名为wpae(wordpress auto excerpt)。

蜂集采集器快速入门蜂集采集器快速入门

这是一篇帮助您快速入门“蜂集采集器”的文章,如果您刚开始接触采集器,建议一定要认真仔细读本文,这将会对您迅速上手采集器大有裨益。现在可以添加任务,采集模块和发布模块选择我们刚才建立的模块,如下图:

蜂集添加自动采集任务蜂集添加自动采集任务

蜂集采集器是一款全自动的采集器,本文将介绍蜂集采集器添加自动任务。设定作用任务名称为任务设置一个名字入口URL采集插件抓取的第一个网页,也就是采集入口采集模块这个任务都会使用这里绑定的采集模块去采集发布模块这个任务都会使用这里绑定的发布模块去