蜂集采集器,一款全自动的wordpress采集插件

蜂集 一款wordpress全自动采集插件

全自动采集,和wordpress深度集成!丰富网站内容,怎么能没有一个采集器呢?

下载: 需要两个插件同时下载

wordpress站长工具箱 wordpress蜂集采集器

imwprobot(蜂集)是一款wordpress采集插件。它能在服务端自动运行而不需要额外电脑环境以及人工监督,是一款丰富站点内容的采集神器。

这里推荐我的又一款采集器,无需规则,自动采集!WordPress无需规则聚合采集器,或者可以直接下载

wordpress站长工具箱 wordpress聚合采集

蜂集简介

imwprobot(蜂集)是imwpweb开发的一款功能强大的全自动的智能采集插件。蜂集就可以采集绝大部分网页内容内容,功能强大,使用简单。

有什么功能1. 全自动无人值守,定时采集
2. 自动同步目标站的更新
3. AI自动关键词、自动摘要生成
4. 直接发布到wordpress,无需额外的接口支持
5. 正文图片和缩略图均可本地化
6. 每个任务中的文章图片均可设置独立水印
7. 采集到的内容均支持正则和css选择器替换
8. 翻译采集到的内容
可以采集哪些站1. 新闻资讯站
2. 文章范文站
3. BBS论坛
4. 博客站点
5. 资源站、下载站
支持哪些采集规则1. 正则表达式
2. XPath规则
3. JQuery选择器(CSS选择器)
代理支持1. HTTP代理
2. Socks5代理
哪些主机可以运行没有环境限制,虚拟主机都可运行
蜂集特色

简介&用法

如果不想看过多的介绍,可以直接点击右侧导航栏的 “下载&安装”直接定位到下载和安装区域或者滑动到最底部进行下载。

任务页

功能模块显示蜂集所有的功能,是蜂集的主要入口。

任务列表区显示所有的任务,包括运行中的和暂停中的任务。

任务编辑区展示的是对任务进行修改,删除,查看任务下面等待采集的文章等操作。

任务状态区展示的是任务的状态,任务通常有三个状态,暂停中,运行中以及等待调度运行。等待调度的时候会展示任务还有多久开始运行。

日志区展示的是当前的采集日志,可以快速查看当前的任务运行状态,方便观测任务进度。

1.采集模块

采集模块的职责是将网页内容整理成结构化的数据。一张网页上的数据是一片文本,里面的数据是不能直接发布到wordpress的,需要提取出标题,正文,分类,图片等等信息才能发布到我们的wordpress。没错,采集模块做的事情就是根据规则提取数据

采集模块基本信息页面

四步骤导航区展示的是编写规则需要经历的四个步骤:

  1. 填写基本信息,也就是给规则起个名字。
  2. 编写列表规则,也就是提取列表页面的文章url地址。
  3. 编写内容规则,也就是提取内容页的标题,内容,分类等数据。
  4. 测试抓取,可以测试编写的规则是否正确,如果正确则可以保存,一个规则就写好了。
采集模块列表规则页面
采集模块内容规则页面

采集模块支持一些预置的过滤器,过滤文章中不需要的内容,比如链接(包括文字链),比如列表,比如一些风格不好的html代码,以及一些干扰性的文字,这些都是无法在本地直接完成的,需要服务端才能够执行。

发布模块

发布模块负责的是将采集的内容通过一定的规则转换成符合你当前wordpress支持的字段。

任务模块

任务模块是执行的最小单元。通过添加任务模块,一个新的采集任务就完成了!

下载&安装

采集器依赖wp扩展(imwpf) 和 蜂集(imwprobot)。注意:必须先安装并且启用imwpf之后才能安装蜂集采集器!(重要的事情需要加粗飘红)

第一步:下载wp扩展,通过wp后台安装并且启用。

第二步: 下载蜂集采集器,通过wp后台安装并且启用。

wordpress站长工具箱 wordpress蜂集采集器

使用教程

教程导航:http://www.imwpweb.com/tag/imwprobot-course

视频教程:https://www.bilibili.com/video/BV1kg4y1q7pZ

附录

imwpf框架介绍

你可能还喜欢下面这些文章

WordPress伪原创插件wppo,支持5118、奶盘WordPress伪原创插件wppo,支持5118、奶盘

wppo是一款集成了多方的伪原创插件。伪原创之后信息将会显示在文章编辑框下方。如果还没有伪原创展示的信息如下图:先下载并且安装站长工具箱,再下载并安装伪原创插件

wordpress自动别名插件,支持生成拼音链接或MD5链接wordpress自动别名插件,支持生成拼音链接或MD5链接

发布文章、页面、分类、标签时自动根据算法生成别名使用文章ID的16位MD5值作为postname,生成的链接就是类似这样的:这种就没什么好说的了,通过拼音生成的链接就是文章标题的全拼,比如这样:

wordpress智能自动摘要插件:wpaewordpress智能自动摘要插件:wpae

目前wordpress的摘要大多数由主题提供。一直以来没有一款插件可以智能提取正文的关键内容作为摘要,于是自己动手做了一个,命名为wpae(wordpress auto excerpt)。

wordpress文章自动配图、缩略图插件:wpacwordpress文章自动配图、缩略图插件:wpac

现在写点文章不配图总觉得文章质量不太高。于是萌生了写一款文章自动配图的插件的想法。文章页自动加一张图比较简单,从候选集中选择一张图片拼接在正文中即可。又比如在图片中添加文章标题,摘要或者自定义的文字。

北冥,一款wordpress关注微信公众号查看隐藏内容的插件北冥,一款wordpress关注微信公众号查看隐藏内容的插件

北冥插件是imwpweb开发的一款关注可复制、可查看隐藏内容的插件,想要为公众号涨粉不可错过哦~想要流量私域化,成本最低的方式就是让用户关注你的公众号,手段就是通过关注可以查看隐藏内容,复制内容。

wordpress多本小说主题 imwpnovelswordpress多本小说主题 imwpnovels

功能更强的wordpress小说主题imwpnovels,让创建小说站点更简单!小说阅读页面支持无限制的字体缩放,支持护眼模式,页面模式,在使用静态缓存下刷新无闪烁的特性,用户体验极佳。

wordpress自动关键词插件wpkws,长尾词聚合必备wordpress自动关键词插件wpkws,长尾词聚合必备

网站获取流量需要依靠长尾词,但我们不可能把所有的长尾词都堆在标题或者正文中。现在我开发了一款能自动匹配长尾词的插件wpkws,他的功能是找到和文章相似的长尾词,自动添加为标签。

WordPress自动写作插件 - WPGPTWordPress自动写作插件 – WPGPT

WPGPT简介WPGPT是一款基于ChatGPT的WordPress自动写作插件。辅助写作如何使用在简介中您已经看到了,WPGPT在编辑器中增加了生成提纲和生成文章两个按钮。

好看 (0) 很好看 (0) 非常好看 (0)