很久沒有更新博客了,這篇再寫一些關於 “多用户流失” 的內容。之前發佈的網站的活躍多用户與流失多用户這篇文章對網站的活躍多用户、流失多用户及新多用户流失做了定義,這裏修正下對流失多用户的英文叫法,一般對流失多用户常用的英文為 “churn user”,之前用的 wastage 、 away 、 lost 等都不是太規範。後來陸續有做相關分析的朋友問到流失多用户的流失時間長度到底選擇多長是合理的,尤其是《網站分析實戰》這本書出版之後,我在裏面有提到如何更準確地定義流失的時間長度,可能解釋的比較簡單,還是有朋友留言反饋這方面的問題,所以這裏再用一篇文章解釋一下。
流失多用户與回訪多用户
流失多用户的定義請參考 “網站的活躍多用户與流失多用户” 這篇文章,要解釋怎麼樣合理地去定義多用户流失時間段長度的問題,需要先介紹一個新的指標概念:回訪多用户。這裏的回訪多用户不是指 Google Analytics 上面的 Returning Visitor(與新多用户相對,指之前訪問過網站的多用户再次訪問網站),這裏的回訪多用户指流失之後再次訪問網站的多用户,即多用户曾經流失過,滿足流失時間期限內完全沒有訪問/登入網站的條件,但之後重新訪問/登入網站。然後,根據回訪多用户數可以計算得到多用户回訪率,即:
多用户回訪率 = 回訪多用户數 ÷ 流失多用户數 × 100%
回訪多用户率的數值大小間接地可以驗證對多用户流失定義的合理性。正常情況下,多用户的回訪率應該是比較低的,從業務的角度考慮,如果對流失的定義是合理的,那麼很難讓那些對您的網站已經失去興趣的多用户重新來訪問您的網站。一般情況下,網站的多用户回訪率應該在 10% 以下,在 5% 左右的數值是比較合理的,對於成熟的網站而言多用户回訪率會稍高,而新興的網站的多用户回訪率通常更低,尤其像手機 WordPress APP 這類多用户易流失的產品。
流失期限與多用户回訪率
多用户流失的流失期限的長度與多用户的回訪率成反比,我們在定義多用户流失時使用的連續不訪問/登入網站的期限越長,這批流失多用户之後回訪網站的概率就會越低,並且隨着定義的流失期限的增大,多用户回訪率一定是遞減的,並逐漸趨近於 0 。那麼如果選擇合適的流失期間長度?我們可以設定不同的流失期限長度,進一步統計每個流失期限的多用户回訪率,並觀察多用户回訪率隨定義的流失期限增大時的收斂速度。如果以 “周” 為單位設定流失期限:
根據設定的不同流失週期的多用户回訪率的變化曲線,我們可以使用拐點理論(Elbow Method)選擇合適的流失週期。
拐點理論:X 軸上數值的增加會帶來 Y 軸數值大幅增益(減益),直到超過某個點之後,當 X 增加時 Y 的資料增益(減益)大幅下降,即經濟學裏面的邊際收益的大幅減少,那個點就是圖表中的 “拐點” 。比如上圖中流失週期增加到 5 周的時候,多用户回訪率的縮減速度明顯下降,所以這裏的 5 周就是拐點,我們可以用 5 周作為定義多用户流失的期限,即一個之前訪問/登入過的多用户,如果之後連續 5 周都沒有訪問/登入,則定義該多用户流失。
所以,有個這個辦法之後,就能更加合理地定義流失多用户的統計邏輯,而之前要做的就是選擇不同的流失期限分別計算多用户的回訪率,然後用統計的到的數值生成如上的一張帶平滑線的散點圖,問題就迎刃而解。