如何用浏览器获取XPath规则,蜂集XPath使用指南

更新于 2020年9月26日 说明书

蜂集采集器现在内置了一个非常方便的匹配规则——XPath!xpath的方便之处就在于可以用浏览器直接提取出来。

如何提取XPath

打开chrome浏览器,然后打开你想采集的网址,进入浏览器的开发者模式(windows为f12,macos为cmd+option+i), 点击页面节点选择按钮(方框半包住箭头的按钮),然后到右侧的源代码栏,点击邮件,就可以看到copy full xpath

为了避免div层级变化,可以用copy XPath来代替copy full XPath。

测试XPath

把提取到的XPath复制到规则中

点击测试抓取

由于有些占站点做了防盗链,直接采集时候可能图片不会展示,不过采集下来的时候,图片会自动本地化,此时图片可以展示。

好看 (0) 很好看 (0) 非常好看 (0)
赞赏

微信赞赏支付宝赞赏