
數據分析入門之隨筆記
數據的一面是銀彈(Silver Bullet):無所不能,增長黑客(Growth Hacking),決策分析(Decision Making);數據的另外一面是鏡子(Reflection):可以看清楚很多茍且和遠方的田野。如何發現利用數據的價值,就是數據分析的目標。
數據分析的重要性可以分為兩點:
第一是幫助核心業務(Business)成長,找到和驗證業務增長點
第二是有效的業務推動(Marketing),提高推廣的效率(ROI)。
我把營銷(Marketing)作為獨立的數據分析角度,因為數字營銷極度依賴于數據分析,并且有一些通用的分析模型,它同時也是一個非常大的產業,它是各個軟件巨擘必爭之地。
最近十幾年,數據的收集和處理能力大大提升,越來越多的傳感器和數據收集,許多大公司的數據正在從TB級別走向PB級別?;ヂ摼W公司之間的模式競爭,也轉戰到對于數據價值的挖掘的能力上,很多時候也就是速度和效率的競爭。不要迷信數據,更不要忽視數據。很多時候,數據是你業務的指南針和護城河。
數據量快速增長,數據分析人才緊缺,數據分析工具依賴性,數據分析服務的強需求都反映了公司從粗放型到精細化的轉型。
1.什么是數據分析(Data Analysis)?
為了理解數據分析,首先理解一下數據的概念。管理學家羅素·艾可夫在1989的《 “From Data to Wisdom”,Human SystemsManagement 》提出了DIKW體系體系,這是關于數據、信息、知識及智慧的一個模型,完美詮釋了四者的關系。Data(數據)->Information(信息)->Knowledge(知識)->Wisdom(智慧)。
2. 數據分析的技術
技術上就是以發現有用信息,知識和洞察為目的,進行數據收集,處理,清晰,過濾,以支持決策制定。有好幾概念有些混淆,花點時間解釋一下:
a. 數據挖掘(Data Mining):數據挖掘是以預測為目標的數據建模和知識探索的一個子學科,好多年前,它一直是一個熱門的研究生專業,直到信息檢索專業的出現。
b. 商務智能(Business Intelligence):BI是一個利用數據的聚合(Aggregation)和分片(Slice)的能力,進行業務監控和洞察發掘。
數據分析也是一種藝術(Art),所謂藝術就是結合技術,想象力,經驗和意愿的綜合因素的平衡和融合。數據分析也是一個經驗和想象力的融合:它涉及到數學算法,統計分析,工具和軟件工程的一種結合,最后的目的是解決業務的問題,幫助人從數據中獲得智慧。
下面列了幾個常用的分析技術范式:
1. 統計模型:利用統計模型處理數據的方法
2. 探索式(exploratory):不設定假設目標,自由發掘和探索
3. 穩定性(Stability ofResults):分析結果的穩定性評估,又是進行交叉驗證。
4. 假定驗證(HypothesisTesting):預先設定好結論,通過測試校驗結論
下面是涉及到算法,工程,統計等的相關技術,每一種細分技術都是一個大學問,好的數據科學家,可以游曳穿行其中,找到數據中有價值的洞察。
3.數據從業者的職業名稱
從事數據的工作者,歷史上我見識過了不少名稱,包括“數據分析師”,“數據經理”,“運營分析師”,“軟件工程師”,“算法工程師”,“策略分析師”,“數據科學家” 等等。其中最酷的名字還是LinkedIn發明的“數據科學家(Data Scientist)”,這個名稱也被Forbes評為本世紀最”性感“的工作了。我估計,這是全世界最多的科學家團體了,小時候總覺得科學家必須白發蒼蒼才行的,現在很多同學剛畢業就是”數據科學家“,很讓人羨慕。
數據分析實際上是三個方面的融合,包括數據,工程和業務。數據是智慧的原礦石,工程是采礦機,業務是指北針,只有三個方面融合起來,才能最有效的發現數據的價值。我相信一個好的數據分析師必須有工程背景,必須對數據敏感,而且愿意主動解決業務問題。
4.數據分析公司的生態圈
數據分析的的公司非常多,大大小小,林林總總。有小而美的硅谷創業公司,有老牌大公司的老樹新花。很多創業公司的市值一路飆升到無法接盤的狀態。例如,Palantir估值已經到了200億美元,但是最近可持續的收入卻不斷減少,引來不少麻煩。
我把數據分析公司分為三類:
第一類是基礎服務提供者,主要提供一些軟件工具,Hadoop和Spark的生態公司,幫助數據基礎架構的建設,也包括一些數據可視化公司。
第二類是通用分析服務提供公司,包括Palantir,IBM的Watson Analytics,SAS, Google Analytics 等等,這類公司提供數據分析服務或者工具,利用專家背景,系統規模和數據資源,幫助解決客戶的問題,特別是很多老牌公司通過收購傳統數據分析公司,快速重新包裝成新的高大上產品。
第三類是專注行業的數據分析公司,例如生物信息,市場營銷分析等等。
5.三種常見的業務分析模型:
GrowthHacker,AARRR,LTV
看完了欣欣向榮的數據分析行業,是不是感到有些熱血沸騰。不過我們還是要回到現實的的,落地的數據分析任務。大部分互聯網公司,面臨的業務增長的壓力,都希望通過數據分析來提升競爭力。其中,有三種常見的業務運營增長模型。
1. 黑客文化的Growth Hacker
2. 經典的AARRR漏斗模型
3. 游戲中的LTV模型
1) 增長黑客(Growth Hacker)的數據和分析
GrowthHacking,它指的是一種用戶增長的方式,簡單說就是通過某些手段和策略幫幫助公司形成快速成長,通常是數據驅動的方法。對創業公司、特別是初創公司來說,在沒有廣告預算、市場營銷活動以及市場推廣專員的情況下,GrowthHacking 也可以獲得良好的效果。
2) AARRR模型
AARRR是Acquisition、Activation、Retention、Revenue、Refer,這個五個單詞的縮寫,分別對應這一款移動應用生命周期中的5個重要環節。每一個環節都有些關鍵指標,可以進行數據分析,找到提升的機會。
3) 生命周期價值(LTV)模型:
LTV是LifeTime Value,它是游戲行業用于衡量用戶價值的一種方式和模型。LTV是指在一定時間內,某一客戶可能為企業帶來的利潤額.顧客終身價值是指企業在獲得新顧客后的一段時間內,每一位顧客的平均利潤凈現值。由于游戲有很強的時間相關性,因此LTV會累計一段時間的數據。
6. 幾個有特點的數據分析工具
從公司類型上來說,數據分析公司簡單可以分為兩類:1傳統大型IT公司 2互聯網創新公司。很多傳統大公司都涌入數據分析行業,大多都是希望利用自己的客戶,硬件和軟件優勢,通過數據分析轉型成SaaS服務提供商,例如IBM,Oracle等。另外一個就是互聯網創新公司,大量數據科學家形成了大大小小數據分析創業公司,
數據分析從來就是一個熱門詞,像人工智能一樣,從來都吸引眼球;很多時候,數據被濫用成了一把上方寶劍,誰不服就用數據砸誰。實際上,數據告訴你的更多的眼前的茍且,而我們需要思考的更多的是詩和遠方。數據分析可以給我提供很多的數字,但卻無法代替的人的思考:如何簡化問題?如何抽象和分解復雜?如何排除萬難?數據分析只會讓工作更加有意思和挑戰!
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25