一、 site 語法設定的初衷是為了完成精準查詢 大多數人,會使用不帶關鍵字的 site 語法來進行錄入量調查。這是一種辦法,但很禁絕確。 site 語法設定的初衷,其實是希望多用户能夠設定束縛查詢規模,完成愈加精準的查詢。 1.對來自查詢引擎的流量進行監控。這是直接和實質的。若是流量沒有大的動搖,而 site 下的數值發作巨集大動搖,這隻能闡明 site 查詢成果數的禁絕確性。 2.對站內 url 進行抽樣監控。有些 url 現已被查詢引擎錄入了,那麼取出一個調集,作為錄入情況監控集;每天的新 url 尚未被錄入,也能夠對其進行索引情況的監控。指令碼是很簡單寫的,這種根據抽樣的評價也是很有用的。 3.由查詢引擎供給的計算東西。咱們能否大概供給類似計算東西,當前還在評價中。 二、查詢成果中 URL 後邊的時刻戳不用過分重視 前面從前説過,咱們內部也對成果頁上的時刻戳(在 url 後邊)很糾結,有方案整改。實踐上有的查詢引擎早現已把這個時刻戳去掉了,而代之以網頁更新的實踐時刻。 這個時刻戳已然給內部人員也帶來了困惑,那麼對人和多用户,顯見也是有困惑的。所以,我的主張是不用過分重視這個時刻戳。若是希望看到準確的 spider 行動,直接的手法是剖析網站日誌。 三、 site 語法查詢的檢索成果只能闡明網頁被錄入 信任咱們在用 site 語法查詢成果數時,也看到了查詢成果上方的 “找到的關聯網頁數是預算值,不代表實在成果數,僅供參閲的提示” 的提示,咱們的查詢成果數預算演算法是對正常多用户的關鍵字檢索而描繪,沒有對 site 語法檢索做過優化,它得出的查詢成果數只能做為一個參閲,主張重視網站從百度取得的流量有沒有變化更直接。 site 語法查詢的檢索成果,更多情況下類似隨機的排序,除了闡明這些網頁現已被錄入以外,不能闡明任何疑問。 四、 site 查詢只要主頁的緣由 網站用 site: 查詢,只要主頁錄入,請問是什麼機制形成的? 1,新站點,具體內容還沒來得及抓取和索引。 2,老站點,由於種種緣由被嚴峻賞罰了,人圈俗稱 “拔毛” 。 後者的嚴峻賞罰機制,咱們希望逐步演化為更合理的鑑別和處置。實踐上如今的情況,比之四、五年前,現已人性化多了。 儘管百度當前有多個方法能夠查詢到網站索引數量,不過在重視這些數量的一起要知道網站在查詢引擎中的用途仍是儘量以從查詢引擎來的流量為要參閲,究竟咱們做查詢引擎優化不只是為了在錄入數量上有所新增,而是更多的從查詢引擎中獲取流量,究竟錄入數量的新增也就意味着提高了取得流量的時機,但也不能盲目。