一、流量資料分析流程是怎樣的? 在進行流量資料分析前,我們得知道流量資料如何獲取?常見的網站流量有哪些型別?如何區分真假流量? 1.1 流量資料的獲取 流量資料獲取主要分 3 類:網站日誌檔案、打點、 JS 頁面標記。它們的區別如下:
現在大多數公司都是用 JS 頁面標記來獲取資料。 JS 頁面標記是指在頁面端嵌入 JS 標記程式碼,JS 程式碼會將一些需要統計的資訊以 URL 引數的形式附帶在請求地址的後面。而 JS 頁面標記輸出的是執行過 JS 程式碼的日誌請求記錄。 日誌輸出的 IP 地址、訪問時間戳、訪問地址路徑、訪問來源、 UserAgent 用於我們準確分析流量。 1.2 流量資料的分類
知道流量資料如何獲取後,那麼常見的流量型別有哪些呢?通常,我們將網站的流量分為三大類,分別是直接流量、推介流量和搜尋引擎流量,如圖:
搜尋流量:是指訪問者透過點選搜尋結果訪問網站產生的流量; 推介流量:是指訪問者透過點選其他網站的連結訪問網站產生的流量; 直接流量:是指訪問者直接輸入域名訪問網站產生的流量; 1.3 直接流量的分類及分析 假如發生 referer 資訊的丟失,推介流量便會被系統算做直接流量;當訪問者先透過搜尋引擎或標記連結訪問網站後,再次直接訪問時,這部分也會被記錄為之前的訪問來源,算做直接流量。由於直接流量的複雜性,我們在分析前得弄清直接流量的分類組成和對應的分析法。 1.3.1 直接流量的分類
直接流量通常包含以下三大類的流量,如圖:
瀏覽器位址列:訪問者在瀏覽器位址列中直接輸入網址產生的流量; 瀏覽器收藏夾:訪問者點選書籤中收藏的網站 URL 產生的流量; 丟失來源資訊:各種沒有或丟失來源資訊的流量,包括 Flash 廣告、工具、彈窗廣告等; 1.3.2 直接流量的分析方法 由於瀏覽器位址列、瀏覽器收藏夾、丟失來源資訊這三個產生流量的原因和特點不同,分析方法也不同。下面針對這三類直接流量來分別探索其不同分析方法。 1 、瀏覽器位址列—流量分析法 針對瀏覽器位址列產生的流量,一般從 LandingPage 、頁面訪問路徑進行分析。 1)LandingPage:由於大部分是網站的頁,如果 LandingPage 不是網站頁的那部分流量,大部分都不是瀏覽器位址列產生的流量。 2)頁面訪問路徑:當發現網站的直接流量變高,或者質量變差等異常現象,一般以網站頁為起點,透過路徑分析發現問題。 2 、瀏覽器收藏夾—流量分析法 網站中的任何一個頁面都可能被訪問者收藏,並再次訪問。分析方法如下: 對收藏行為和來自瀏覽器收藏夾的流量進行標記,然後在報告中過濾出這部分的流量; 進行新老訪客分析。一般使用收藏夾訪問網站的多使用者大都屬於回訪多使用者,如果大部分新增流量都是新訪多使用者時,這部分流量一般有問題。 3 、丟失來源資訊—流量分析法 丟失來源資訊的分析方法一般有 3 類: URL 增加標記; 站內搜尋關鍵詞分析(先將直接流量分類,然後關注直接流量使用站內搜尋的情況,以及關鍵詞的變化); 使用跳出率指標來分析,因為純正的直接流量是網站忠誠度高的那類訪客。 1.4 如何區分真假流量 知道流量資料的分析流程及方法後,那麼對於現在常見的虛假網站流量該如何區分呢?怎麼辨別虛假流量去保證廣告效果呢?虛假流量通常是透過程式或者人為產生的。 1.4.1 真假流量的特徵 1)虛假流量的特徵: 目的性:虛假流量的產生一定和某個目的有關; 規律性:特定的目的會使虛假流量一定帶有規律性。 2)真實流量的特徵: 自然性:真實流量在各個維度的表現都是自然的; 多樣性:網民的喜好不同,行為也一定是多樣的。 1.4.2 如何區分真假流量 知道真實和虛假流量的特徵後,那麼如何辨別呢?通常,辨別虛假流量是透過判斷流量產生的時間/地理位置/網路屬性/跳出率,訪客進入頁面的路徑/點選分佈圖/重合度/忠誠度去分析的。 1)流量產生的時間 真實的流量一般分佈在全天的各個時間段,即使有訪問高峰,在流量曲線圖中一般也為平滑曲線。而虛假流量卻是人為控制的,在曲線圖中的表現是流量暴增。 2)流量的地理來源 通常訪客是來自各個不同的地理位置,而虛假流量很難使用多個 IP 來產生流量,所以如果流量集中來自一個地區就比較可疑了。 3)流量的網路屬性 真實流量下,訪客網路的接入方式應該是千差萬別的,而虛假流量的接入一般比較單一。所以,如果訪客接入方式只提供 1-2 種服務提供商的名稱就比較可疑了。 4)流量的跳出率 真實流量下,訪客可能在任何時間跳出,如果跳出率比較集中在某一個時間段,則要重點分析那個時間段的流量地理來源以及流量的網路屬性了。 5)進入入徑& 點選分佈圖 通常,由於廣告活動會有一個登入頁面,所以流量入口只有一個。真實訪客進來後會點選不同的連結,可能在任何一個頁面離開,而虛假流量的訪問路徑與離開頁面一般都相同。 6)訪客忠誠度分析 通常來說,一定數量的訪客訪問網站後是會對網站進行回訪的,即使數量很少。所以,真實流量會有訪客再次回訪的行為產生,而虛假流量一般是不會有回訪的,對於那些沒有回訪的流量一般是異常的。 7)訪客重合度分析 對於不同的流量渠道,可以使用訪客重合度分析法判斷是否為虛假流量。一般,當某個渠道在短時間內有較高訪客重合度時候,就需要進一步檢查流量的質量了。 二、如何進行網站流量的質量分析? 知道了哪部分才是網站的真實流量,那麼對於這部分真實流量的質量該如何評估呢?我們去評估網站流量的質量是因為只有保證有質量的流量,才能為企業帶來價值。
網站的質量分析一般是按照質和量兩個維度來衡量的,如下圖所示:
量:X 軸,指網站獲得的訪問量; 質:Y 軸,指可以促進網站目標的事件次數,例如商品瀏覽、註冊、購買等行為。 將流量按照它們在這兩個維度上的表現展示在座標軸上,不同的流量就會有不同的位置相對應,如果把流量的成本用圓圈的大小表示,則可把流量表示在四個象限的位置描述成四種不同的流量: 象限的流量:質高量高。這是網站的核心流量,對於這部分流量保持即可。建議降低獲取流量的成本; 第二象限的流量:質高量低。這部分流量是網站的忠誠多使用者,它們有很高的質,但數量較少。建議提高這部分流量的數量; 第三象限的流量:量還可以但質較低,並且獲取流量的成本也比較高; 第四象限的流量:量高質低。這部分流量要提高質。建議使用細分的方法。 總結:這樣整個網站流量資料分析的流程就很清晰了,先分清流量資料的種類,再按照需求去獲取流量資料,再去分析這些流量資料的真假以及質量好壞。有了這些後再去甄別該選用什麼樣的資料分析工具,根據他們的優劣以及自身的需要去選擇,從而保證網站流量的質量為企業帶來價值。