蜂集采集器jQuery选择器采集教程
现在蜂集采集器默认的采集规则使用了更容易使用的jQuery选择器。这篇教程教大家如何使用jQuery表达式采集网页内容。
在教程开始之前,我们需要先简单学习一下jQuery表达式。
主要学习有四种:
1. id选择器: #id1
根据id属性为id1的节点
2. class选择器: .class-name
选择class属性为class-name的所有节点
3. 节点选择器: element
选择名为element的所有节点
4. 层级选择器: #id1 .class-name
选择id属性为id1下面的所有class为class-name的节点
以下面的html为例子
<!doctype html>
<html lang="en">
<head>
<meta charset="utf-8">
<title>demo</title>
</head>
<body>
<div class="container">
<div id="notMe"><p>id="notMe"</p></div>
<div id="myDiv">
<a href="http://www.imwpweb.com">imwpweb</a>
</div>
</div>
</body>
</html>
使用id选择器 “#myDiv”选择的节点则是
<div id="myDiv"><a href="http://www.imwpweb.com">imwpweb</a></div>
使用class选择器”.container”选择的节点则是
<div class="container">
<div id="notMe">
<p>id="notMe"</p>
</div>
<div id="myDiv">
<a href="http://www.imwpweb.com">imwpweb</a>
</div>
</div>
使用层级选择器”#myDiv a”
<a href="http://www.imwpweb.com">imwpweb</a>
先导教程就是如此简单,jQuery选择器十分清晰。那么开始采集器的jQuery选择器教程吧!
列表规则
首先学习列表规则。所谓列表规则就是从目标网页中获取文章列表的规则。只有采集到了文章列表,我们才能进一步采集文章内容。
下图就是一个列表规则,表达式是 “.list a”

根据我们上面学习的jQuery表达式,”.list a”的含义就是选择 class为list容器下面的a元素,也就是list下面所有的链接。这个链接就是我们的文章列表。如果不会查看网页源代码,可以前往:如何查看网页源代码教程中学习。
内容规则
内容规则指的是我们采集的文章所需要的规则,包含:标题,正文,分类等。我们需要为每个字段设置相应的规则!
在标题采集中,我们的jQuery选择器是h1,表示采集的是目标网站的<h1>标签中的内容。一般标题都是h1。

同样,正文,分类我们都可以此类推。填写相应的jQuery选择器即可采集。如果不会查看网页源代码,可以前往:如何查看网页源代码教程中学习。
你可能还喜欢下面这些文章

wpac是一款wordpress自动配图插件,可以丰富文章内容,对提升排名有很大帮助。p style=”font-size:18px;”>你可能还喜欢下面这些文章<p>{excerpt}<

WordPress怎么增加文章排序方式?实现过程也比较简单,一个是构造链接,另外一个是使用query_posts来改变一下主循环就可以了。 $orderby, ‘order’ =>

有没有办法在 WordPress 循环代码中获取多个项目: if ($count<a href=”https://stackoverflow.com/questions/19303556/wordpress-loop-how-to-co

让WordPress一个页面显示全部分类的文章cat=’ . $cat->php echo $cat->a href=”<$cats = get_categories(array(‘include’ =>

一个理想的相关文章推荐插件应该是什么样子的?wprec就是一个能够提升用户体验,提升搜索引擎排名的相关文章推荐插件!插件的后台在 WP工具箱-文章推荐,进入即可看到设置。