一、流量資料分析流程是怎樣的?  在進行流量資料分析前,我們得知道流量資料如何獲取?常見的網站流量有哪些型別?如何區分真假流量?  1.1 流量資料的獲取  流量資料獲取主要分 3 類:網站日誌檔案、打點、 JS 頁面標記。它們的區別如下:

  現在大多數公司都是用 JS 頁面標記來獲取資料。 JS 頁面標記是指在頁面端嵌入 JS 標記代碼,JS 代碼會將一些需要統計的資訊以 URL 引數的形式附帶在請求地址的後面。而 JS 頁面標記輸出的是執行過 JS 代碼的日誌請求記錄。  日誌輸出的 IP 地址、訪問時間戳、訪問地址路徑、訪問來源、 UserAgent 用於我們準確分析流量。  1.2 流量資料的分類
  知道流量資料如何獲取後,那麼常見的流量型別有哪些呢?通常,我們將網站的流量分為三大類,分別是直接流量、推介流量和搜索引擎流量,如圖:

  搜索流量:是指訪問者通過點選搜索結果訪問網站產生的流量;  推介流量:是指訪問者通過點選其他網站的連結訪問網站產生的流量;  直接流量:是指訪問者直接輸入域名訪問網站產生的流量;  1.3 直接流量的分類及分析  假如發生 referer 資訊的丟失,推介流量便會被系統算做直接流量;當訪問者先通過搜索引擎或標記連結訪問網站後,再次直接訪問時,這部分也會被記錄為之前的訪問來源,算做直接流量。由於直接流量的複雜性,我們在分析前得弄清直接流量的分類組成和對應的分析法。  1.3.1 直接流量的分類
  直接流量通常包含以下三大類的流量,如圖:

  瀏覽器位址列:訪問者在瀏覽器位址列中直接輸入網址產生的流量;  瀏覽器收藏夾:訪問者點選書籤中收藏的網站 URL 產生的流量;  丟失來源資訊:各種沒有或丟失來源資訊的流量,包括 Flash 廣告、工具、彈窗廣告等;  1.3.2 直接流量的分析方法  由於瀏覽器位址列、瀏覽器收藏夾、丟失來源資訊這三個產生流量的原因和特點不同,分析方法也不同。下面針對這三類直接流量來分別探索其不同分析方法。  1 、瀏覽器位址列—流量分析法  針對瀏覽器位址列產生的流量,一般從 LandingPage 、頁面訪問路徑進行分析。  1)LandingPage:由於大部分是網站的頁,如果 LandingPage 不是網站頁的那部分流量,大部分都不是瀏覽器位址列產生的流量。  2)頁面訪問路徑:當發現網站的直接流量變高,或者質量變差等異常現象,一般以網站頁為起點,通過路徑分析發現問題。  2 、瀏覽器收藏夾—流量分析法  網站中的任何一個頁面都可能被訪問者收藏,並再次訪問。分析方法如下:  對收藏行為和來自瀏覽器收藏夾的流量進行標記,然後在報告中過濾出這部分的流量;  進行新老訪客分析。一般使用收藏夾訪問網站的多用户大都屬於回訪多用户,如果大部分新增流量都是新訪多用户時,這部分流量一般有問題。  3 、丟失來源資訊—流量分析法  丟失來源資訊的分析方法一般有 3 類:  URL 增加標記;  站內搜索關鍵詞分析(先將直接流量分類,然後關注直接流量使用站內搜索的情況,以及關鍵詞的變化);  使用跳出率指標來分析,因為純正的直接流量是網站忠誠度高的那類訪客。  1.4 如何區分真假流量  知道流量資料的分析流程及方法後,那麼對於現在常見的虛假網站流量該如何區分呢?怎麼辨別虛假流量去保證廣告效果呢?虛假流量通常是通過程序或者人為產生的。  1.4.1 真假流量的特徵  1)虛假流量的特徵:  目的性:虛假流量的產生一定和某個目的有關;  規律性:特定的目的會使虛假流量一定帶有規律性。  2)真實流量的特徵:  自然性:真實流量在各個維度的表現都是自然的;  多樣性:網民的喜好不同,行為也一定是多樣的。  1.4.2 如何區分真假流量  知道真實和虛假流量的特徵後,那麼如何辨別呢?通常,辨別虛假流量是通過判斷流量產生的時間/地理位置/網絡屬性/跳出率,訪客進入頁面的路徑/點選分佈圖/重合度/忠誠度去分析的。  1)流量產生的時間  真實的流量一般分佈在全天的各個時間段,即使有訪問高峯,在流量曲線圖中一般也為平滑曲線。而虛假流量卻是人為控制的,在曲線圖中的表現是流量暴增。  2)流量的地理來源  通常訪客是來自各個不同的地理位置,而虛假流量很難使用多個 IP 來產生流量,所以如果流量集中來自一個地區就比較可疑了。  3)流量的網絡屬性  真實流量下,訪客網絡的接入方式應該是千差萬別的,而虛假流量的接入一般比較單一。所以,如果訪客接入方式只提供 1-2 種服務提供商的名稱就比較可疑了。  4)流量的跳出率  真實流量下,訪客可能在任何時間跳出,如果跳出率比較集中在某一個時間段,則要重點分析那個時間段的流量地理來源以及流量的網絡屬性了。  5)進入入徑& 點選分佈圖  通常,由於廣告活動會有一個登入頁面,所以流量入口只有一個。真實訪客進來後會點選不同的連結,可能在任何一個頁面離開,而虛假流量的訪問路徑與離開頁面一般都相同。  6)訪客忠誠度分析  通常來説,一定數量的訪客訪問網站後是會對網站進行回訪的,即使數量很少。所以,真實流量會有訪客再次回訪的行為產生,而虛假流量一般是不會有回訪的,對於那些沒有回訪的流量一般是異常的。  7)訪客重合度分析  對於不同的流量渠道,可以使用訪客重合度分析法判斷是否為虛假流量。一般,當某個渠道在短時間內有較高訪客重合度時候,就需要進一步檢查流量的質量了。  二、如何進行網站流量的質量分析?  知道了哪部分才是網站的真實流量,那麼對於這部分真實流量的質量該如何評估呢?我們去評估網站流量的質量是因為只有保證有質量的流量,才能為企業帶來價值。
  網站的質量分析一般是按照質和量兩個維度來衡量的,如下圖所示:

  量:X 軸,指網站獲得的訪問量;  質:Y 軸,指可以促進網站目標的事件次數,例如商品瀏覽、註冊、購買等行為。  將流量按照它們在這兩個維度上的表現展示在座標軸上,不同的流量就會有不同的位置相對應,如果把流量的成本用圓圈的大小表示,則可把流量表示在四個象限的位置描述成四種不同的流量:  象限的流量:質高量高。這是網站的核心流量,對於這部分流量保持即可。建議降低獲取流量的成本;  第二象限的流量:質高量低。這部分流量是網站的忠誠多用户,它們有很高的質,但數量較少。建議提高這部分流量的數量;  第三象限的流量:量還可以但質較低,並且獲取流量的成本也比較高;  第四象限的流量:量高質低。這部分流量要提高質。建議使用細分的方法。  總結:這樣整個網站流量資料分析的流程就很清晰了,先分清流量資料的種類,再按照需求去獲取流量資料,再去分析這些流量資料的真假以及質量好壞。有了這些後再去甄別該選用什麼樣的資料分析工具,根據他們的優劣以及自身的需要去選擇,從而保證網站流量的質量為企業帶來價值。