採集已經成為了建站的規則。講究點的會帶上版權標記文章出處,不講究的為了捏造一個偽原創來欺騙蜘蛛,甚至乾脆亂改一通,往上一傳。
一個地方網站在當地小有人氣,每天分類資訊都被好多個本地網站採集貼上。更有甚者,有人竟用採集程式直接獲取網站的內容。我不反對別人從我的網站複製內容來豐富他的網站。原因有三:
一、這是對我網站的認可,複製我網站的內容,說明他對我的網站資訊和人氣的認可。而這種認可和複製行為並無惡意。
二、這種行為本身,也是我網站價值的一個提升:有助於站內資訊的傳播,對於到我網站裡釋出資訊的人來說,可以達到更多的效果。
三、我們作為比較成功的站群站長,應該幫助後進的同學。要有個學長的樣兒~!我的態度是:如果我們成功了,那就更要有一個成功者的風度~!
我特別厭惡採集程式,我的網站就曾多次被採集程式騷擾,它的可惡之處就在於沒有人工參與,自動完成所有資訊的複製。完全不尊重別人的勞動,而且時間全盤複製,實在太不厚道了。我也曾遇到這樣的網站直接採集我的網站內容。針對其採集程式,我規納了幾種防採集的兩種方法
一、加入干擾程式碼:寫一個生成字母和數字的小程式,然後隨機生成一串字元,將這段字元放於標題或內容文字的前一個 html 元素之中。舉例說一下吧:
原碼:
改後:
加入了 id 值這個干擾因素之後,採集程式基本就歇菜了。
二、封鎖相關伺服器的 ip 地址,這個比較狠,基本就是不允許訪問了。但這個很有針對性,只有您知道某個網站在採集您的程式時有效。
關於防採集程式,有幾種方法是在網上介紹的,比如判斷一段時間內 ip 訪問次數,這個千萬不能用,會把搜尋引擎的蜘蛛也給誤傷到。還有諸如指令碼加密,更不太適合,也不利於搜尋引擎收錄。總之一句話,不管是採集者和被採集者,做一個大家都喜歡的站群站長,才會做出人氣,做大家都喜歡的站群站長,也一定是有風度的站群站長。不論您是採集者還是被採集者。
附:隨機字串生成程式碼
‘fcount 為要生成的字元數量,引用時<%=Fcj(6)%>,即生成 6 個小寫字母的字串
Function Fcj(fcount)
Ftemp=””
For Fi=1 to fcount
Ftemp=Ftemp&Rnd_Chr()
Next
Fcj=Ftemp
End Function
Function Rnd_Chr()
Randomize
Rnd_Chr = Chr(Int((122 – 97 + 1) * Rnd + 97))
End Function,我們可以透過下面的方法對付他!
我們應該怪百度嗎? 我覺得不應該,這種算是比較人性化的一種權重辨別模式! 當然也有一些站群站長利用這些來採集別人的文章,要知道任何事情都難以,有人利用這個漏洞是在正常不過的事情了。當然任何事情都會有解決的辦法,關鍵是不要灰心喪氣,我們的網站遲早也會有權重高的一天,那麼我們是不是要去抄襲別人的文章了? 作為一個有過這種遭遇的人我不會這樣做! 相信您們也不會。