很久沒有更新部落格了,這篇再寫一些關於 “多使用者流失” 的內容。之前釋出的網站的活躍多使用者與流失多使用者這篇文章對網站的活躍多使用者、流失多使用者及新多使用者流失做了定義,這裡修正下對流失多使用者的英文叫法,一般對流失多使用者常用的英文為 “churn user”,之前用的 wastage 、 away 、 lost 等都不是太規範。後來陸續有做相關分析的朋友問到流失多使用者的流失時間長度到底選擇多長是合理的,尤其是《網站分析實戰》這本書出版之後,我在裡面有提到如何更準確地定義流失的時間長度,可能解釋的比較簡單,還是有朋友留言反饋這方面的問題,所以這裡再用一篇文章解釋一下。
流失多使用者與回訪多使用者
流失多使用者的定義請參考 “網站的活躍多使用者與流失多使用者” 這篇文章,要解釋怎麼樣合理地去定義多使用者流失時間段長度的問題,需要先介紹一個新的指標概念:回訪多使用者。這裡的回訪多使用者不是指 Google Analytics 上面的 Returning Visitor(與新多使用者相對,指之前訪問過網站的多使用者再次訪問網站),這裡的回訪多使用者指流失之後再次訪問網站的多使用者,即多使用者曾經流失過,滿足流失時間期限內完全沒有訪問/登入網站的條件,但之後重新訪問/登入網站。然後,根據回訪多使用者數可以計算得到多使用者回訪率,即:
多使用者回訪率 = 回訪多使用者數 ÷ 流失多使用者數 × 100%
回訪多使用者率的數值大小間接地可以驗證對多使用者流失定義的合理性。正常情況下,多使用者的回訪率應該是比較低的,從業務的角度考慮,如果對流失的定義是合理的,那麼很難讓那些對您的網站已經失去興趣的多使用者重新來訪問您的網站。一般情況下,網站的多使用者回訪率應該在 10% 以下,在 5% 左右的數值是比較合理的,對於成熟的網站而言多使用者回訪率會稍高,而新興的網站的多使用者回訪率通常更低,尤其像手機 WordPress APP 這類多使用者易流失的產品。
流失期限與多使用者回訪率
多使用者流失的流失期限的長度與多使用者的回訪率成反比,我們在定義多使用者流失時使用的連續不訪問/登入網站的期限越長,這批流失多使用者之後回訪網站的機率就會越低,並且隨著定義的流失期限的增大,多使用者回訪率一定是遞減的,並逐漸趨近於 0 。那麼如果選擇合適的流失期間長度?我們可以設定不同的流失期限長度,進一步統計每個流失期限的多使用者回訪率,並觀察多使用者回訪率隨定義的流失期限增大時的收斂速度。如果以 “周” 為單位設定流失期限:
根據設定的不同流失週期的多使用者回訪率的變化曲線,我們可以使用拐點理論(Elbow Method)選擇合適的流失週期。
拐點理論:X 軸上數值的增加會帶來 Y 軸數值大幅增益(減益),直到超過某個點之後,當 X 增加時 Y 的資料增益(減益)大幅下降,即經濟學裡面的邊際收益的大幅減少,那個點就是圖表中的 “拐點” 。比如上圖中流失週期增加到 5 周的時候,多使用者回訪率的縮減速度明顯下降,所以這裡的 5 周就是拐點,我們可以用 5 周作為定義多使用者流失的期限,即一個之前訪問/登入過的多使用者,如果之後連續 5 周都沒有訪問/登入,則定義該多使用者流失。
所以,有個這個辦法之後,就能更加合理地定義流失多使用者的統計邏輯,而之前要做的就是選擇不同的流失期限分別計算多使用者的回訪率,然後用統計的到的數值生成如上的一張帶平滑線的散點圖,問題就迎刃而解。