熱線電話:13121318867

登錄
首頁精彩閱讀數據分析-時間序列的趨勢分析
數據分析-時間序列的趨勢分析
2015-12-29
收藏

數據分析-時間序列的趨勢分析

無論是網站分析工具、BI報表或者數據的報告,我們很難看到數據以孤立的點單獨地出現,通常數據是以序列、分組等形式存在,理由其實很簡單,我們沒法從單一的數據中發現什么,用于分析的數據必須包含上下文(Context)。數據的上下文就像為每個指標設定了一個或者一些參考系,通過這些參照和比較的過程來分析數據的優劣,就像中學物理上的例子,如果我們不以地面作為參照物,我們無法區分火車是靜止的還是行進的,朝北開還是朝南開。

在實際看數據中,我們可能已經在不經意間使用數據的上下文了,趨勢分析、比例分析、細分與分布等都是我們在為數據設置合適的參照環境。所以這邊通過一個專題——數據的上下文,來總結和整理我們在日常的數據分析中可以使用的數據參考系,前面幾篇主要是基于內部基準線(Internal Benchmark)的制定的,后面會涉及外部基準線(External Benchmark)的制定。今天這篇是第一篇,主要介紹基于時間序列的趨勢分析,重提下同比和環比,之前在網站新老用戶分析這篇文章,已經使用同比和環比舉過簡單應用的例子。

同比和環比的定義

定義這個東西在這里還是再嘮叨幾句,因為不了解定義就無法應用,熟悉的朋友可以跳過。 數據分析-時間序列的趨勢分析,互聯網的一些事

同比:為了消除數據周期性波動的影響,將本周期內的數據與之前周期中相同時間點的數據進行比較。早期的應用是銷售業等受季節等影響較嚴重,為了消除趨勢分析中季節性的影響,引入了同比的概念,所以較多地就是當年的季度數據或者月數據與上一年度同期的比較,計算同比增長率。

環比:反應的是數據連續變化的趨勢,將本期的數據與上一周期的數據進行對比。最常見的是這個月的數據與上個月數據的比較,計算環比增長率,因為數據都是與之前最近一個周期的數據比較,所以是用于觀察數據持續變化的情況。

買二送一,再贈送一個概念——定基比(其實是百度百科里附帶的 數據分析-時間序列的趨勢分析,互聯網的一些事 ):將所有的數據都與某個基準線的數據進行對比。通常這個基準線是公司或者產品發展的一個里程碑或者重要數據點,將之后的數據與這個基準線進行比較,從而反映公司在跨越這個重要的是基點后的發展狀況。

同比和環比的應用環境

其實同比、環比沒有嚴格的適用范圍或者針對性的應用,一切需要分析在時間序列上的變化情況的數據或者指標都可以使用同比和環比。

但是我的建議是為網站的目標指標建立同比和環比的數據上下文,如網站的收益、網站的活躍用戶數、網站的關鍵動作數等,這類指標需要明確長期的增長趨勢,同比和環比能夠為網站整體運營的發展狀況提供有力的參考。

還有個建議就是不要被同比和環比最原始或者最普遍的應用所束縛?。和染褪墙衲昝總€月或每季度的數據與去年同期比,環比就是這個月的數據與上個月比。對于方法的應用需要根據實際的應用的環境,進行合理的變通,選擇最合適的途徑。所以同比和環比不一定以年為周期,也不一定是每月、季度為時間粒度的統計數據,我們可以根據需要選擇任意合適的周期,比如你們公司的產品運營是以周、半月、甚至每年的特定幾個月為周期循環變動,那完全可以將這些作為同比的周期。

特別對于互聯網這個瞬息萬變的環境,常用的年與年之間的同比,以季度或月為粒度的統計可能不再合適,為了適應快速的變化,以月為周期、周為周期的同比,以天為粒度、小時為粒度的統計數據進行環比將變成常見的方式,因為要適應這種快速的變化,我們需要做出更迅速的決策和調整,當然數據要適應這種快速決策的需要。

應用實例

同比和環比被廣泛地應用于各個領域,在Google的圖片中搜索同比和環比會有豐富的包含了同比環比的圖表顯示在你的眼前,所以這里只舉個簡單的例子:因為很多的互聯網產品的數據變化情況會以“周”為周期進行波動(周末會出現明顯的上升或者下降趨勢),所以這里以一周的數據為例來看下同比和環比的展現效果。還是虛擬數據,為了展示上的需要而臨時設定的:

  周一 周二 周三 周四 周五 周六 周日
上周收益 113 134 123 145 137 196 187
本周收益 129 122 134 149 146 215 208
同比增長 12.40% -9.84% 8.21% 2.68% 6.16% 8.84% 10.10%
環比增長 -44.96% -5.74% 8.96% 10.07% -2.05% 32.09% -3.37%

數據分析-時間序列的趨勢分析,互聯網的一些事

從圖中可以看出數據在一周中的變化趨勢,周中和周末之間存在明顯的差異,周末的收益會有明顯的上漲,在使用同比的時候需要抓到這類數據的周期性的變化規律,讓數據的對比能夠更加有效地反映數據的變化。同時在Excel里面可以直接為一組基于時間序列的數據繪制趨勢線,正如圖中的虛線所示,本周收益在一周中的變化趨勢就顯得非常明顯,這里用的是指數的擬合,Excel的趨勢線提供了線性、指數、對數、冪等回歸分析的方式,同時也包含多項式和移動平均等趨勢分析的方法。

最后看看我們經常在使用的網站分析工具里面有沒有同比和環比的功能呢?這里以Google Analytics和百度統計為例截了兩張圖,首先看下百度統計登錄進去后的網站概況:
數據分析-時間序列的趨勢分析,互聯網的一些事

百度統計默認就為我們提供了一個比較環境,上方表格中是今天與昨天的數據對比及變化情況,還提供了預測的功能;下方的折線圖顯示的是每小時數據的變化,提供前一天或者上周的同一天(百度可能已經意識到網站大部分會存在以周為變化周期的趨勢,所以很多地方都提供了以周為單位的參考數據)的每個整點的數據對照,同時可以選擇不同的時間區間和各類指標。再看看Google Analytics的Dashboard:
數據分析-時間序列的趨勢分析,互聯網的一些事

Google不像百度那樣一進去就能看到對照數據,需要我們手工去選擇,在時間區間的選擇界面提供了“Compare to Past”的勾選按鈕,如果默認是近一個月的數據,那么參照數據就是再往前推一個月的每日變化數據,Timeline的選擇面板做得非常炫,可以自定義地選擇任何有效的時間區間,當然也同樣提供不同的參考指標,鼠標移到圖中相應日期的點后會顯示具體的數據及差異的大小。

同比和環比是最簡單直觀的基于時間序列的趨勢分析方法,通過觀察關鍵指標的變化情況來洞察網站的發展和運營情況,同時衡量目標的實現程度。所以這篇文章的主題是使用趨勢分析的方法來為網站的目標設定數據的上下文,下一篇將主要針對KPI指標進行數據上下文的選擇和設定。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢