很久没用过火车头采集器了。

想到做 WordPress 批量建站群 SEO 的时候,经常会登入火车头采集器采集各大相关 WordPress 站群网站的资讯内容。

而且当时采集的风格很流行,到处都是各种采集站,尤其是小说站和文章站。

很容易采集到几十万的文章,WordPress 站群网站权重 4 。

虽然现在大部分 WordPress 站群网站都很少采集,但是采集还是无处不在,因为一些所谓的原创 WordPress 站群网站,文章内容很可能是采集后再加工制作的。

所以掌握一种采集技巧对 SEO 站长还是很有帮助的。

以下分享火车头批量采集建站的使用方法,供新手 SEO 参考。

一、火车采集器网址规则设定。

开启火车头采集器,点选新建建立一个新任务,填写一个任务名,设定采集网址规则,分别设定列表页面采集规则和文章页面所在页面规则,分为以下两个步骤。

(1)新增开始网址,点选新增,选择批量/多页,在地址格式中设定需要采集的网页链接,点选新增和完成。

这一步的目的是建立栏目分页链接。

(2)获取多级网址,点选新增,选择网址获取选项,新增提取网址的规则,熟练使用后建议使用结果网址过滤功能,将需要包含的网址和不必要的网址写进去,可以测试规则是否填写正确,然后储存。

这一步的目的是建立每一栏下的文章页面链接。

二、设定火车头采集器的内容规则。

设定采集内容规则,可在页面上填写文章页面链接进行测试,分别设定标题采集规则和内容采集规则,也可分为两步。

(1)双击标题标签,一般网页的标题都是标签,所以这个步骤可以预设,如果需要的话可以设定内容过滤,以及内容替换。

(2)双击内容标签,内容提取规则与第一步的第二步多级网址获取方法相同。

此处为获取内容,因此是检视内容页面的原始码,在此页面上找到正文内容,在正文首段撷取一小段通用代码,该代码也将出现在所有文章页面上,通常的表现形式是以 article 标签为起点,为结束。

还可设定内容过滤,内容替换,标签过滤等,过滤掉不必要的资讯。

如果没有图片,可以勾选过滤掉 img 图片标签。

三、火车头采集器内容采集。

释出内容设定,勾选需要启用的释出方式,储存即可,然后在任务列表中右键单击任务名,点选开始任务等待采集完成。

注意,火车头采集器释出内容有两种方式,一种是网上释出到 WordPress 站群网站,需要新增发布配置。

初学者不建议直接释出到 WordPress 站群网站,建议勾选第二个储存在本地。

对于档案模板,可以检视预设模板,然后选择 TXT 格式。

结论:火车头采集器功能非常强大,除了采集文章还可以采集视讯等,火车头采集器的使用规则并不难,根本不需要懂任何程序设计之类的语言,只要能看懂一些常用的简单代码,操作一两次基本就能完全掌握,是一个很棒的 SEO 工具。

身为 WordPress 批量建站群的 WordPress 站群网站优化人员,我们采集文章后可以对内容进行修改和调整,使内容更完善,同时也能大大提高 SEO 人员的工作效率。