對百度搜尋引擎友好的網站結構 我們在做網站結構相關 SEO 站群工作時,都應該考慮以下四個問題: 1,Baiduspider 能不能找到所有網頁 2,Baiduspider 是否知道哪個網頁是重要的 3,Baiduspider 能否順利提取網頁內容 4,Baiduspider 能否在網頁中提煉有用資訊
下面講的內容便是解決前兩個問題的: 一,友好的網站結構 1,扁平 or 樹型:一說到網站結構,大家都會提到扁平結構和樹型結構,言必稱 “結構扁平化”,這些指的是物理結構,即基於內容聚合的目錄及檔案位置決定的結構。其實對於百度搜尋引擎來說,只要結構合理、有邏輯性、內容有規律可循都可以,都是友好的。 2,連結結構:相對於物理結構,就要說到邏輯結構:即透過內部連結形成的連結結構,邏輯結構才是搜尋引擎關注的。對於一個網站來說,網頁僅僅可以透過頁——目錄 1——目錄 2 一層一層 follow 到是遠遠不夠的,一個優秀的連結結構應該是網狀的。 1)頁連結應該鏈向重要的頻道頁,頻道頁再鏈向下面的節點頁或普通頁面。同時,頻道頁、節點頁和普通頁面都應該可以鏈回到頁 2)無論哪些頁面之間互相連結,都需要一個描述恰當的錨文字 3)連結不要放在 JS 、 FLASH 等搜尋引擎不可見的位置,使用圖片做連結入口應該完善 alt 標籤 *百度搜尋引擎目前僅支援對部分 JS 和 FLASH 進行解析,絕大多數放在 JS 和 FLASH 裡的連結都是獲取不到的 4)為重要頁面留更多入口。百度搜尋引擎認為,獲得更多內部投票的網頁相對來說更加重要 5)“離頁越近” 的網頁,越容易受到百度重視。這個 “近” 指的是頁面離頁的點選距離。即使 URL 所在目錄層級較深,只要在頁有入口,百度也認為這是一個非常重要的頁面。 6)不要產生可怕的孤島頁面。雖然百度在提交入口、社會化挖掘方面做了許多工作,但連結抓取依然是百度獲得新頁面的重要渠道 二,透過導航讓百度更好地認識站點 對於多使用者,導航要解決的問題是:我在網站的什麼位置,我想看上一級、甚至上上一級更多內容的入口在哪裡;對於 spider,導航要解決的問題是:這個頁面屬於哪個領域,要表達的主題是什麼。所以說,清晰的導航系統不僅有助於提高多使用者體驗,對 SEO 站群的意義也是重大的,所有 SEO 站群做得出色的網站基本都擁有清晰明確的導航。 1,導航內容搜尋引擎可見:有網站的導航對多使用者來說美觀友好,對百度來說卻是不可見的。目前百度還不能搞定所有的 JS 和 FLASH,保險起見,還是使用 HTML 的好。圖片雖然美麗,作為導航也是對搜尋引擎不友好的行為。 2,導航穩定:導航內容應該是相對固定的,不要讓導航成為 “捲軸” 。 3,重要網頁儘可能地在導航處可以 follow 到:百度認為主導航中出現的連結,其重要性僅次於網站頁,所以應該儘量將站內的頁面在主導航中安排個位置。當然,主導航上也不可能放過多的內容,哪些連結可以上主導航還需要 SEO 站群人員進行平衡。 4,巧用麵包屑導航:上面說到,導航對於多使用者來說,解決了 “想看上一級、甚至上上一級更多內容” 的問題,這個導航指的就是麵包屑導航。麵包屑導航可以使結構複雜龐大的大中型網站變得清晰輕盈,在 spider 進行頁面解析時會著重檢視麵包屑導航內容,強烈建議使用。 三,合理的 domain 結構 除了在網站建設的時候站群站長會思考到底使用二級域名還是子目錄,在網站運營的過程中,也會考慮是否要把子目錄的內容拆分成二級域名。因為很多 SEO 站群人員認為二級域名相對獨立,其頁會得到百度的重視,能獲得更好的排位——其實這是一個片面的錯誤觀點,百度會透過很多指標對同 domain 下的二級域名和子目錄進行重要程度判斷,並沒有武斷地認為誰天生就會比誰強一些。 當 SEO 站群認為站內結構已經阻礙了網站高速發展就會考慮改版,常見的改版便是將子目錄移出主站點、單獨形成二級域名。但大家都知道,改版肯定會對站點的收錄排名和流量造成影響,一定要謹慎。那麼在什麼情況下才真的需要將子目錄換成二級域名呢?其實只有一點:即子目錄的內容足夠豐富,且與主域的主題關聯性不強! 四,url 結構很重要 1,url 結構規律化:同一個網頁有不同 url,會造成多個 url 同時被多使用者推薦導致權值分散;同時百度終選擇展現的那個 url 不一定符合您的預期。站點應該儘量不把 sessionid 和統計程式碼等不必要的內容放在 url,如果一定要這樣做可以透過 robots 禁止百度抓取這些非規範 url 。 2,知名能讓多使用者從 url 即可判斷出網頁內容,便於蜘蛛解析的同時便於多使用者間傳播。 3,url 儘量短。 ●蜘蛛喜歡:http://tieba.baidu.com.com/f?kw=百度 ●蜘蛛不喜歡:http://tieba.baidu.com/f?ct=&tn=&rn=&ln=&cn=0&kw=百度&rs2=&un=&rs1=&rs5=&sn=&rs6=&nvselectvalue=0&oword=百度&tb=cn 4,不要新增蜘蛛難以解析的字元,如 http://mp3.XXX.com/albumlist/234254;;;;;%B9&CE%EDWF%.html http://news.xxx.com/1233,242,111,0.shtml 5,動態引數不要太多太複雜,目前百度對動態 url 已經有了很好的處理,但是引數過多過複雜的 url 有可能被蜘蛛認為不重要而拋棄。