如何用浏览器获取XPath规则,蜂集XPath使用指南

更新于 2021年3月29日 说明书

蜂集采集器现在内置了一个非常方便的匹配规则——XPath!XPath的方便之处就在于可以用浏览器直接提取出来。

如何用浏览器提取XPath

使用chrome浏览器打开你想采集的网址。进入浏览器的开发者模式(windows系统按F12,MAC系统按cmd+option+i)。点击页面节点选择按钮(方框半包住箭头的按钮),然后到右侧的源代码栏,点击右键,就可以看到copy full xpath

为了避免div层级变化,可以用copy XPath来代替copy full XPath。

测试XPath

把提取到的XPath复制到规则中

点击测试抓取

由于有些占站点做了防盗链,直接采集时候可能图片不会展示,不过采集下来的时候,图片会自动本地化,此时图片可以展示。

到此,你就学会了使用浏览器提取xpath方法。

好看 (0) 很好看 (0) 非常好看 (0)
赞赏

微信赞赏支付宝赞赏