一、 site 语法设定的初衷是为了完成精准查询    大多数人,会使用不带关键字的 site 语法来进行录入量调查。这是一种办法,但很禁绝确。 site 语法设定的初衷,其实是希望多用户能够设定束缚查询规模,完成愈加精准的查询。    1.对来自查询引擎的流量进行监控。这是直接和实质的。若是流量没有大的动摇,而 site 下的数值发作巨集大动摇,这只能阐明 site 查询成果数的禁绝确性。    2.对站内 url 进行抽样监控。有些 url 现已被查询引擎录入了,那么取出一个调集,作为录入情况监控集;每天的新 url 尚未被录入,也能够对其进行索引情况的监控。指令码是很简单写的,这种根据抽样的评价也是很有用的。    3.由查询引擎供给的计算东西。咱们能否大概供给类似计算东西,当前还在评价中。    二、查询成果中 URL 后边的时刻戳不用过分重视    前面从前说过,咱们内部也对成果页上的时刻戳(在 url 后边)很纠结,有方案整改。实践上有的查询引擎早现已把这个时刻戳去掉了,而代之以网页更新的实践时刻。    这个时刻戳已然给内部人员也带来了困惑,那么对人和多用户,显见也是有困惑的。所以,我的主张是不用过分重视这个时刻戳。若是希望看到准确的 spider 行动,直接的手法是剖析网站日志。    三、 site 语法查询的检索成果只能阐明网页被录入    信任咱们在用 site 语法查询成果数时,也看到了查询成果上方的 “找到的关联网页数是预算值,不代表实在成果数,仅供参阅的提示” 的提示,咱们的查询成果数预算演算法是对正常多用户的关键字检索而描绘,没有对 site 语法检索做过优化,它得出的查询成果数只能做为一个参阅,主张重视网站从百度取得的流量有没有变化更直接。    site 语法查询的检索成果,更多情况下类似随机的排序,除了阐明这些网页现已被录入以外,不能阐明任何疑问。  四、 site 查询只要主页的缘由    网站用 site: 查询,只要主页录入,请问是什么机制形成的?    1,新站点,具体内容还没来得及抓取和索引。    2,老站点,由于种种缘由被严峻赏罚了,人圈俗称 “拔毛” 。    后者的严峻赏罚机制,咱们希望逐步演化为更合理的鉴别和处置。实践上如今的情况,比之四、五年前,现已人性化多了。    尽管百度当前有多个方法能够查询到网站索引数量,不过在重视这些数量的一起要知道网站在查询引擎中的用途仍是尽量以从查询引擎来的流量为要参阅,究竟咱们做查询引擎优化不只是为了在录入数量上有所新增,而是更多的从查询引擎中获取流量,究竟录入数量的新增也就意味着提高了取得流量的时机,但也不能盲目。