2023年12月第四周更新:图片本地化、蜂集采集器

更新于 2023年12月23日 更新日志

这周更新了两个插件:蜂集采集器和图片本地化。

图片本地化插件更新

图片本地化插件增加了压缩和优化功能,如下图:

自动保存的外部图片的时候,可以自动压缩图片。

这个功能很实用,测试体积可减少50%左右,图片质量却没有太大变化。强烈推荐大家启用!

另一个是增加了定时任务接口。有朋友反馈说本地化图片太慢,浏览器一直开着也不是办法,希望我增加一个定时任务。

想了想,可以直接把接口暴露出来,用定时任务访问即可。

蜂集采集器插件更新

蜂集采集器本周更新了两个功能:

  1. 列表规则支持XPath
  2. 手动添加链接支持2个通配符的笛卡尔积(我也不知道怎么描述这个功能了,总之牛!)

增加XPath规则

xpath主要用来采集XML内容的。比如RSS采集我们一般用XPath去抓他的列表链接。

像抓取微信公众号,一般可以用抓取rss的方式来采集。

手动添加链接更新

现在填写的输入支持两个占位符(或者叫模板变量),分别是{1}和{2}  (原先是用*号)。通过占位符我们可以组合出很多链接。

生成的链接列表如下:

这歌功能应该是相当实用的。

大家可以在官网下载这两个插件,如果安装了可以直接在wordpress后台更新。

蜂集采集器直达链接

蜂集采集器,一款全自动的wordpress采集插件 蜂集采集器,一款全自动的wordpress采集插件

imwprobot(蜂集)是一款wordpress采集插件。蜂集简介imwprobot(蜂集)是imwpweb开发的一款功能强大的全自动的智能采集插件。发布模块发布模块负责的是将采集的内容通过一定的规则转换成符合你当前w

图片本地化直达链接

WordPress图片自动本地化插件wpasi介绍与下载 WordPress图片自动本地化插件wpasi介绍与下载

使用wpasi非常简单,只需要在WordPress后台安装并启用插件,发布文章时会自动将文章内的所有图片本地化。插件支持一键本地化历史文章,如下图:该插件可以配合自动发文插件一起使用,文章自动发布时,图片就可以自动本地化

你可能还喜欢下面这些文章

WordPress文章自动配图、缩略图插件:wpacWordPress文章自动配图、缩略图插件:wpac

2、自动生成的图片并非真实在磁盘中的图片,而是动态生成的,如果保存到磁盘会占用大量空间,这个空间没必要浪费,因此修改主题代码,直接将缩略图的地址改为wpac自动生成的缩略图地址是一个非常好的方案。

WordPress图片自动本地化插件wpasi介绍与下载WordPress图片自动本地化插件wpasi介绍与下载

使用wpasi非常简单,只需要在WordPress后台安装并启用插件,发布文章时会自动将文章内的所有图片本地化。插件支持一键本地化历史文章,如下图:该插件可以配合自动发文插件一起使用,文章自动发布时,图片就可以自动本地化。

WordPress自动内链插件wpkal,网站全自动增加锚链接必备插件WordPress自动内链插件wpkal,网站全自动增加锚链接必备插件

什么是内链内链,顾名思义就是在同一网站域名下的内容页面之间的互相链接(自己网站的内容链接到自己网站的内部页面,也称之为站内链接)。自动内链工作原理简单来说,我们设定一些词表以及词表对应的链接,比如词是wordpress插件,链接是http。

蜂集设置采集分页列表方法蜂集设置采集分页列表方法

首先我们需要找到分页链接和其他链接不一样的地方,例子中的分页的链接都有“page”这个单词而其他的链接都没有这个单词,那么我们在列表规则中的链接包含框填上“page”,这样就可以采集到所有的翻页链接,如下图:填写完了之后,我们将测试的链接填入

蜂集采集如何进行全站采集蜂集采集如何进行全站采集

比如我们使用首页测试一下抓取,可以看到下面抓取了很多链接我们再用内部文章页面测试抓取,可以看到下面依然有新的链接第二步:设置正文规则如果你懂XPath或者正则,那么写一个抓取正文的规则是一件很容易的事情。

wordpress怎么设置固定链接wordpress怎么设置固定链接

请查看更详细的设置教程:wordpress如何设置固定链接。登录wordpress后台,点击后台设置栏目下的“固定链接”按钮。wordpress提供了6种链接形式供我们选择。

WordPress 添加链接WordPress 添加链接

在本章中,我们将学习在WordPress页面中添加链接。以下是在WordPress中添加链接的简单步骤。在WordPress中创建的页面列表将显示如下所示的屏幕。在这里,我们将在关于我们页面中添加链接。

如何编写蜂集的采集模块如何编写蜂集的采集模块

测试采集当所有的规则都编写完毕之后,我们需要验证一下采集器是不是可以根据该规则正确采集,进入测试抓取Tab,填写链接和页面层级,点击抓取测试,查看效果,如下图:如果对采集器有使用上的疑惑,可以到蜂集采集交流群(群号在采集器的关于我们中可以找到