如何用浏览器获取XPath规则,蜂集XPath使用指南

更新于 2021年3月29日 说明书

蜂集采集器现在内置了一个非常方便的匹配规则——XPath!XPath的方便之处就在于可以用浏览器直接提取出来。

如何用浏览器提取XPath

使用chrome浏览器打开你想采集的网址。进入浏览器的开发者模式(windows系统按F12,MAC系统按cmd+option+i)。点击页面节点选择按钮(方框半包住箭头的按钮),然后到右侧的源代码栏,点击右键,就可以看到copy full xpath

为了避免div层级变化,可以用copy XPath来代替copy full XPath。

测试XPath

把提取到的XPath复制到规则中

点击测试抓取

由于有些占站点做了防盗链,直接采集时候可能图片不会展示,不过采集下来的时候,图片会自动本地化,此时图片可以展示。

到此,你就学会了使用浏览器提取xpath方法。

你可能还喜欢下面这些文章

wordpress多本小说主题 imwpnovelswordpress多本小说主题 imwpnovels

功能更强的wordpress小说主题imwpnovels,让创建小说站点更简单!小说阅读页面支持无限制的字体缩放,支持护眼模式,页面模式,在使用静态缓存下刷新无闪烁的特性,用户体验极佳。

如何获取网站的Cookie如何获取网站的Cookie

第一步:使用chrome浏览器,打开目标网站。比如: www.imwpweb.com第二步:点击鼠标右键-检查。将会打开浏览器的开发者模式,切换到网络tab,再刷新网页。

wordpress文章自动配图、缩略图插件:wpacwordpress文章自动配图、缩略图插件:wpac

现在写点文章不配图总觉得文章质量不太高。于是萌生了写一款文章自动配图的插件的想法。文章页自动加一张图比较简单,从候选集中选择一张图片拼接在正文中即可。又比如在图片中添加文章标题,摘要或者自定义的文字。

蜂集采集器,一款全自动的wordpress采集插件蜂集采集器,一款全自动的wordpress采集插件

imwprobot(蜂集)是一款wordpress采集插件。有什么功能1. 全自动无人值守,支持定时采集2. 可自动同步目标站的更新3. AI自动关键词、自动摘要生成4. 直接发布到wordpress,不需要额外的接口支持5. 正文图片和缩略

蜂集采集器2.4版本发布蜂集采集器2.4版本发布

这次发布增加了一些非常有用的功能。采集模块增加了翻译功能,目前支持中英互译,如下图:增加一种新的发布模板变量格式增加了发布模块和采集模块的宽度,以减少输入框的拥挤。

WordPress聚合采集插件, 内置ChatGPT引擎, 无规则自动采集WordPress聚合采集插件, 内置ChatGPT引擎, 无规则自动采集

插件可根据导入的关键词,自动从设定的数据源采集并组合数据。后台截图功能介绍多数据源采集支持任意多个数据源组合采集。采集的内容可顺序或者随机组合成一篇文章多种数据查找算法根据数据源特性,可选择第一篇或者随机选择。无需规则采集无需写规则,自动从数

自动图片插件入门教程自动图片插件入门教程

欢迎使用WordPress自动图片插件。进入正文图选项,开启文章配图,如下:这个设置稍微麻烦一点,如果您是WordPress资深用户且不希望配图消耗磁盘空间,建议尝试使用该高级特性。

蜂集采集如何进行全站采集蜂集采集如何进行全站采集

今天给大家带来一个超级简单的抓取全站的教程,文末有小福利哦~以lz13为例,它所有的文章链接都以.html结尾,所以我们的网址包含规则里写上.html,为了不让蜘蛛乱爬,我们限制蜘蛛在这个站点内爬行,因此网址还需要包含lz13.cn,规则就是

好看 (0) 很好看 (0) 非常好看 (0)