设置OutWit软件的采集规则
时间:2022-02-17 12:27:01 | 来源:网络推广
时间:2022-02-17 12:27:01 来源:网络推广
大家都知道百度指令domain:是查询百度相关域的,相关域其实就是一种外链资源,虽然这种外链的权重较低,但发布的难度较小,容易操作,适合广大草根网站使用。
言归正传,首先我们需要用到OutWit Hub light,这款功能强大、操作简洁的采集软件,下载地址:安装好之后,需要用到左侧树状结构中几个功能(如下图所示),下面一一介绍:
① page 为默认的主体界面,也就是正常访问的网页效果。
guess 为软件自动分析页面得出来的结果,在这里不太建议使用,因为机器得出的结果还是不太准确。
③ scraped 为设定自定义采集规则之后生成的结果,也就是scrapers⑤生成出来的结果。
④ source 为页面的源代码,相当于平时使用浏览器打开网页时,右键查看源代码的效果。
⑤ scrapers 为设置自定义采集规则的项目。
如上图所示,选到scrapers后,采集规则有7种属性,在这里需要用到的只有3项,分别是description、marker before、marker after,用过火车头的童鞋应该一眼就能看明白,不懂的同学也不用担心,按照表格进行填写就可以
marker before的1到3行中依次填入
href=
target=_blank
- a href=
marker after的1到3行中依次填入
target=_blank
/a/h3
target=_blank class=m 百度快照/a
⑥ 这里设置触发该采集规则的url,按图所示输入百度首页域名即可
⑦ 采集规则设定好之后,不要忘记save
⑧ Save时会提示你,给该采集规则设定一个名称
到此,我们的采集规则就写好了。