对百度搜索引擎友好的网站结构 我们在做网站结构相关 SEO 站群工作时,都应该考虑以下四个问题: 1,Baiduspider 能不能找到所有网页 2,Baiduspider 是否知道哪个网页是重要的 3,Baiduspider 能否顺利提取网页内容 4,Baiduspider 能否在网页中提炼有用资讯
下面讲的内容便是解决前两个问题的: 一,友好的网站结构 1,扁平 or 树型:一说到网站结构,大家都会提到扁平结构和树型结构,言必称 “结构扁平化”,这些指的是物理结构,即基于内容聚合的目录及档案位置决定的结构。其实对于百度搜索引擎来说,只要结构合理、有逻辑性、内容有规律可循都可以,都是友好的。 2,连结结构:相对于物理结构,就要说到逻辑结构:即通过内部连结形成的连结结构,逻辑结构才是搜索引擎关注的。对于一个网站来说,网页仅仅可以通过页——目录 1——目录 2 一层一层 follow 到是远远不够的,一个优秀的连结结构应该是网状的。 1)页连结应该链向重要的频道页,频道页再链向下面的节点页或普通页面。同时,频道页、节点页和普通页面都应该可以链回到页 2)无论哪些页面之间互相连结,都需要一个描述恰当的锚文字 3)连结不要放在 JS 、 FLASH 等搜索引擎不可见的位置,使用图片做连结入口应该完善 alt 标签 *百度搜索引擎目前仅支持对部分 JS 和 FLASH 进行解析,绝大多数放在 JS 和 FLASH 里的连结都是获取不到的 4)为重要页面留更多入口。百度搜索引擎认为,获得更多内部投票的网页相对来说更加重要 5)“离页越近” 的网页,越容易受到百度重视。这个 “近” 指的是页面离页的点选距离。即使 URL 所在目录层级较深,只要在页有入口,百度也认为这是一个非常重要的页面。 6)不要产生可怕的孤岛页面。虽然百度在提交入口、社会化挖掘方面做了许多工作,但连结抓取依然是百度获得新页面的重要渠道 二,通过导航让百度更好地认识站点 对于多用户,导航要解决的问题是:我在网站的什么位置,我想看上一级、甚至上上一级更多内容的入口在哪里;对于 spider,导航要解决的问题是:这个页面属于哪个领域,要表达的主题是什么。所以说,清晰的导航系统不仅有助于提高多用户体验,对 SEO 站群的意义也是重大的,所有 SEO 站群做得出色的网站基本都拥有清晰明确的导航。 1,导航内容搜索引擎可见:有网站的导航对多用户来说美观友好,对百度来说却是不可见的。目前百度还不能搞定所有的 JS 和 FLASH,保险起见,还是使用 HTML 的好。图片虽然美丽,作为导航也是对搜索引擎不友好的行为。 2,导航稳定:导航内容应该是相对固定的,不要让导航成为 “滚动条” 。 3,重要网页尽可能地在导航处可以 follow 到:百度认为主导航中出现的连结,其重要性仅次于网站页,所以应该尽量将站内的页面在主导航中安排个位置。当然,主导航上也不可能放过多的内容,哪些连结可以上主导航还需要 SEO 站群人员进行平衡。 4,巧用面包屑导航:上面说到,导航对于多用户来说,解决了 “想看上一级、甚至上上一级更多内容” 的问题,这个导航指的就是面包屑导航。面包屑导航可以使结构复杂庞大的大中型网站变得清晰轻盈,在 spider 进行页面解析时会着重检视面包屑导航内容,强烈建议使用。 三,合理的 domain 结构 除了在网站建设的时候站群站长会思考到底使用二级域名还是子目录,在网站运营的过程中,也会考虑是否要把子目录的内容拆分成二级域名。因为很多 SEO 站群人员认为二级域名相对独立,其页会得到百度的重视,能获得更好的排位——其实这是一个片面的错误观点,百度会通过很多指标对同 domain 下的二级域名和子目录进行重要程度判断,并没有武断地认为谁天生就会比谁强一些。 当 SEO 站群认为站内结构已经阻碍了网站高速发展就会考虑改版,常见的改版便是将子目录移出主站点、单独形成二级域名。但大家都知道,改版肯定会对站点的收录排名和流量造成影响,一定要谨慎。那么在什么情况下才真的需要将子目录换成二级域名呢?其实只有一点:即子目录的内容足够丰富,且与主域的主题关联性不强! 四,url 结构很重要 1,url 结构规律化:同一个网页有不同 url,会造成多个 url 同时被多用户推荐导致权值分散;同时百度终选择展现的那个 url 不一定符合您的预期。站点应该尽量不把 sessionid 和统计代码等不必要的内容放在 url,如果一定要这样做可以通过 robots 禁止百度抓取这些非规范 url 。 2,知名能让多用户从 url 即可判断出网页内容,便于蜘蛛解析的同时便于多用户间传播。 3,url 尽量短。 ●蜘蛛喜欢:http://tieba.baidu.com.com/f?kw=百度 ●蜘蛛不喜欢:http://tieba.baidu.com/f?ct=&tn=&rn=&ln=&cn=0&kw=百度&rs2=&un=&rs1=&rs5=&sn=&rs6=&nvselectvalue=0&oword=百度&tb=cn 4,不要新增蜘蛛难以解析的字元,如 http://mp3.XXX.com/albumlist/234254;;;;;%B9&CE%EDWF%.html http://news.xxx.com/1233,242,111,0.shtml 5,动态引数不要太多太复杂,目前百度对动态 url 已经有了很好的处理,但是引数过多过复杂的 url 有可能被蜘蛛认为不重要而抛弃。