百万文章去重插件更新至2.0
很久之前开发过一个文章去重插件,由于需要生成文章指纹,而生成指纹又依赖分词。
分词的速度是比较慢的,因此去重插件用起来体验不太好。
具体的表现就是发布文章速度比较慢,其实不是寻找重复文章比较慢,而是分词比较慢。
仔细一下,其实生成文章指纹并不需要那么精确的分词。一些简单的分词器就可以,毕竟我们要的指纹而不是分词。
因此2.0版本移除api分词,使用一个简单的本地分词器分词。
这样一来很多非常有用的功能都可以添加啦!一起来看看2.0版本都增加了哪些功能吧!
一、文章后台增加文章指纹

文章指纹是64位的二进制串,我转成字符串展示在后台方便排查问题。当你觉得两个文章非常相似的时候,插件又没有去重,可以联系作者看看文章指纹的差别。
二、文章保存草稿也可以排重
这个功能某个用户催了很久了。由于之前一直用的是API分词,速度太慢。如果每次保存草稿都分词,必定会影响使用体验。
这次改为本地分词,因此这个功能也可以加上了。
还没有下载的朋友可以在这里下载:WordPress文章去重插件simp,支持巨量文章查重
你可能还喜欢下面这些文章

//demo.imwpweb.com/wpnovo/多设备支持主题支持PC和移动端界面,独立设置,互不干扰。移动端首页(右)图:小说页面PC端和移动端的展示付费订阅主题支持付费订阅功能,支持付费单章订阅、整本小说订阅模式。

什么是内链内链,顾名思义就是在同一网站域名下的内容页面之间的互相链接(自己网站的内容链接到自己网站的内部页面,也称之为站内链接)。自动内链工作原理简单来说,我们设定一些词表以及词表对应的链接,比如词是wordpress插件,链接是http

这款插件的核心功能就是一点:找出文章中的违禁词、敏感词等措辞不当的词语,替换成你设置的更合适的词或者直接替换“*”号。请注意,需要同时下载站长工具箱和违禁词屏蔽插件,安装插件时也需要两个插件同时安装。

2、自动生成的图片并非真实在磁盘中的图片,而是动态生成的,如果保存到磁盘会占用大量空间,这个空间没必要浪费,因此修改主题代码,直接将缩略图的地址改为wpac自动生成的缩略图地址是一个非常好的方案。

wprec利用相似度算法计算每篇文章之间的相似度,找到与当前文章最相似的一些文章,展现在文章底部作为相关文章。我们知道,相关推荐插件推荐的原理是根据当前文章的特征(文章的高权重标签),从文章库中召回相关文章,再根据相关性评分,最后选出To