採集已經成為了建站的規則。講究點的會帶上版權標記文章出處,不講究的為了捏造一個偽原創來欺騙蜘蛛,甚至乾脆亂改一通,往上一傳。
  一個地方網站在當地小有人氣,每天分類資訊都被好多個本地網站採集貼上。更有甚者,有人竟用採集程序直接獲取網站的內容。我不反對別人從我的網站複製內容來豐富他的網站。原因有三:
  一、這是對我網站的認可,複製我網站的內容,説明他對我的網站資訊和人氣的認可。而這種認可和複製行為並無惡意。
  二、這種行為本身,也是我網站價值的一個提升:有助於站內資訊的傳播,對於到我網站裏發佈資訊的人來説,可以達到更多的效果。
  三、我們作為比較成功的站羣站長,應該幫助後進的同學。要有個學長的樣兒~!我的態度是:如果我們成功了,那就更要有一個成功者的風度~!

  我特別厭惡採集程序,我的網站就曾多次被採集程序騷擾,它的可惡之處就在於沒有人工參與,自動完成所有資訊的複製。完全不尊重別人的勞動,而且時間全盤複製,實在太不厚道了。我也曾遇到這樣的網站直接採集我的網站內容。針對其採集程序,我規納了幾種防採集的兩種方法
  一、加入干擾代碼:寫一個生成字母和數字的小程序,然後隨機生成一串字元,將這段字元放於標題或內容文字的前一個 html 元素之中。舉例説一下吧:
原碼:

這裏是標題 這裏是要採集的內容

改後:

這裏是標題 這裏是要採集的內容

加入了 id 值這個干擾因素之後,採集程序基本就歇菜了。
  二、封鎖相關服務器的 ip 地址,這個比較狠,基本就是不允許訪問了。但這個很有針對性,只有您知道某個網站在採集您的程序時有效。
  關於防採集程序,有幾種方法是在網上介紹的,比如判斷一段時間內 ip 訪問次數,這個千萬不能用,會把搜索引擎的蜘蛛也給誤傷到。還有諸如指令碼加密,更不太適合,也不利於搜索引擎收錄。總之一句話,不管是採集者和被採集者,做一個大家都喜歡的站羣站長,才會做出人氣,做大家都喜歡的站羣站長,也一定是有風度的站羣站長。不論您是採集者還是被採集者。
附:隨機字串生成代碼

‘fcount 為要生成的字元數量,引用時<%=Fcj(6)%>,即生成 6 個小寫字母的字串
Function Fcj(fcount)
 Ftemp=””
 For Fi=1 to fcount
  Ftemp=Ftemp&Rnd_Chr()
 Next
 Fcj=Ftemp
End Function
Function Rnd_Chr()
Randomize
Rnd_Chr = Chr(Int((122 – 97 + 1) * Rnd + 97))
End Function,我們可以通過下面的方法對付他!

  我們應該怪百度嗎? 我覺得不應該,這種算是比較人性化的一種權重辨別模式! 當然也有一些站羣站長利用這些來採集別人的文章,要知道任何事情都難以,有人利用這個漏洞是在正常不過的事情了。當然任何事情都會有解決的辦法,關鍵是不要灰心喪氣,我們的網站遲早也會有權重高的一天,那麼我們是不是要去抄襲別人的文章了? 作為一個有過這種遭遇的人我不會這樣做! 相信您們也不會。