很久沒用過火車頭採集器了。
想到做 WordPress 批次建站群 SEO 的時候,經常會登入火車頭採集器採集各大相關 WordPress 站群網站的資訊內容。
而且當時採集的風格很流行,到處都是各種採集站,尤其是小說站和文章站。
很容易採集到幾十萬的文章,WordPress 站群網站權重 4 。
雖然現在大部分 WordPress 站群網站都很少採集,但是採集還是無處不在,因為一些所謂的原創 WordPress 站群網站,文章內容很可能是採集後再加工製作的。
所以掌握一種採集技巧對 SEO 站長還是很有幫助的。
以下分享火車頭批次採集建站的使用方法,供新手 SEO 參考。
一、火車採集器網址規則設定。
開啟火車頭採集器,點選新建建立一個新任務,填寫一個任務名,設定採集網址規則,分別設定列表頁面採集規則和文章頁面所在頁面規則,分為以下兩個步驟。
(1)新增開始網址,點選新增,選擇批次/多頁,在地址格式中設定需要採集的網頁連結,點選新增和完成。
這一步的目的是建立欄目分頁連結。
(2)獲取多級網址,點選新增,選擇網址獲取選項,新增提取網址的規則,熟練使用後建議使用結果網址過濾功能,將需要包含的網址和不必要的網址寫進去,可以測試規則是否填寫正確,然後儲存。
這一步的目的是建立每一欄下的文章頁面連結。
二、設定火車頭採集器的內容規則。
設定採集內容規則,可在頁面上填寫文章頁面連結進行測試,分別設定標題採集規則和內容採集規則,也可分為兩步。
(1)雙擊標題標籤,一般網頁的標題都是標籤,所以這個步驟可以預設,如果需要的話可以設定內容過濾,以及內容替換。
(2)雙擊內容標籤,內容提取規則與第一步的第二步多級網址獲取方法相同。
此處為獲取內容,因此是檢視內容頁面的原始碼,在此頁面上找到正文內容,在正文首段擷取一小段通用程式碼,該程式碼也將出現在所有文章頁面上,通常的表現形式是以 article 標籤為起點,為結束。
還可設定內容過濾,內容替換,標籤過濾等,過濾掉不必要的資訊。
如果沒有圖片,可以勾選過濾掉 img 圖片標籤。
三、火車頭採集器內容採集。
釋出內容設定,勾選需要啟用的釋出方式,儲存即可,然後在任務列表中右鍵單擊任務名,點選開始任務等待採集完成。
注意,火車頭採集器釋出內容有兩種方式,一種是網上釋出到 WordPress 站群網站,需要新增釋出配置。
初學者不建議直接釋出到 WordPress 站群網站,建議勾選第二個儲存在本地。
對於檔案模板,可以檢視預設模板,然後選擇 TXT 格式。
結論:火車頭採集器功能非常強大,除了採集文章還可以採集視訊等,火車頭採集器的使用規則並不難,根本不需要懂任何程式設計之類的語言,只要能看懂一些常用的簡單程式碼,操作一兩次基本就能完全掌握,是一個很棒的 SEO 工具。
身為 WordPress 批次建站群的 WordPress 站群網站最佳化人員,我們採集文章後可以對內容進行修改和調整,使內容更完善,同時也能大大提高 SEO 人員的工作效率。