
如何系統學習數據分析
很多學習數據分析的同學也都有這樣一種困惑‘為什么學了那么多工具,還是不會數據分析?’,原因無外乎兩個,一是只學到了碎片的知識,沒有建立知識之間的連接,無法形式自己的知識體系,二是缺乏實踐,導致無法形成‘知行合一’的工作技能。
知識超載和碎片化
當代人都面臨兩個問題-信息超載和知識碎片化。
信息超載老話題不多說了,講幾個數據:
全世界每天有4000本書出版,超過4億個字;
紐約時報一天的文字量等于牛頓同時代的人一生的閱讀量;
一個專業領域,每天大概有200個公眾號正在注冊,有近1000篇文字正在產生
過去雜家、博物家在現代社會已經不可能存在,即使有,也干不過谷歌度娘。
結論1:知識的儲存能力,人類早就被電腦完勝了,知識的搜索和鏈接能力,才是學習的核心競爭力。
另一個趨勢也很明顯:知識碎片化。這個碎片化從3個方面開始
首先時間和空間被打碎,移動手機允許你在三站地鐵里聽完一本書;
其次被打碎的是信息,如果你翻知乎、今日頭條或者某個博客,你并不會像看一本書一樣,知道前面一章講什么的,后面即將講什么,除了標題黨,你根本對下一個博客、內容毫無預期,只能被動接受;
最糟糕的其實是知識結構碎片化-你并不知道是誰,在什么情況下,針對什么問題講的這句話。所有的信息缺乏了上下文,就是廢話。
比如說有段時間我刷管理類的文,你會發現在雷軍、傅盛、彼得德魯克、吳伯凡、馬云、吳曉波各位大佬針對同一個問題講的內容完全不同。到底信哪個?其實雷軍講的是互聯網行業;傅盛講的是小企業逆襲,他正在做投資;彼得德魯克用管理在講哲學;吳伯凡老師在講中西方文化;馬云老師在對大眾勵志;吳曉波其實是用管理談財經-更重要的是,他們講話的場合,時間點和對象你一無所知。
結論2如果一個人沒有搜索能力,他不會知道背景;沒有思考能力,不會知道為什么-這樣單純知道一句話,比不知道更糟糕。
把前面兩個結論放一塊,結果很清晰時間空間碎片化確實能夠提高學習的效率(其實也干不過電腦),而信息碎片化和知識結構碎片化帶來的,則是學習效率的倒退和焦慮之源因為他毀掉你的主動搜索能力和主動鏈接的能力,也就是深度思考的能力。
這就是碎片化的陷阱,極大的提高了并沒有什么卵用的信息,而降低了最重要的獨立思考的能力。
知識可以零售嗎?
最近的問答類APP非?;?,先是知乎4月份在其微信公眾號悄然上線了【值乎】,而后果殼網在5月份不甘示弱,上線了【分答】并且后來居上,用戶活躍一下子超越了【值乎】。
【分答】是一款付費語音問答產品,它的規則非常簡單,有三種角色設定:回答者、提問者、偷聽者?;卮鹫咧恍枵f明自己擅長的領域,然后設置付費問答的價格,價格規定在1-500元之間,感興趣的用戶可以作為提問者付費后對回答者進行<=50字的文字提問,然后回答者通過<=60s的語音來回答問題。在此過程中,其他用戶可以作為偷聽者通過1元的付費來‘偷聽’回答者的語音回答。被‘偷聽’一次,提問者和回答者可以各得0.5元。
【分答】吸引人的地方有兩個,一個是提問和回答能賺錢,讓知識不再是免費的分享,真正做到了書中自有黃金屋;一個是明星效應,或者說是網紅效應?!痉执稹恳婚_始能夠點爆市場,看它的卡司就知道了。
有亞洲首富之子同時也是國民老公的王思聰,有各類綜藝大咖如《最強大腦》的帥氣教授魏坤琳、《奇葩說》第一季冠軍馬薇薇、《邏輯思維》創始人羅振宇等,還有演藝界的明星佟大為、汪峰等,這樣強大的陣容,讓【分答】在上線20幾天的時候,就拿到一億美金的估值,而國民老公王思聰,僅僅回答了25個問題,短短的25分鐘時間,就賺了11萬多。
在一片喧囂,全民歡騰過后,靜下心想一想,以‘知識的零售平臺’為目的的【分答】一類的問答社區,真的能達到傳播知識,提升能力的效果?
如果說【知乎】的一問多答,干貨至上的模式,收獲的是多角度的價值觀、人生觀以及知識體系;【果殼】的科技報道,收獲的是科技的不為人知的小細節,是滄海遺珠。那么【分答】一類的60s的語音回答,收獲的或許只是跟明星的親密接觸,以及搞一個大新聞賺錢的欲望的滿足。為什么這么說呢?
首先,對于答題者來說,60s的時間僅足夠講1、2個笑話,對于一個知識點來說根本不足以講透,所以這60s的回答不是用來提供知識的;
其次,對于提問者來說,提問字數限制在50個字以內,提問的東西只能非常直接,根本無暇顧及問題的背景。因此在【分答】上經常出現以下的問題: 如果非要二選一做你的女朋友,你選XXX還是XXX,為啥? 你和XXX的性福生活是真是假? 你多久啪啪啪一次,最近的一次啪啪啪是什么時候和誰?
最后,對于提問者來說,提問的目的不再是單純的希望獲得知識,而是想獲得更多的人偷聽,從而達到賺錢的目的,這樣的目的,不利于知識的正向分享。
我們都有這樣的經歷,在上學的時候,準確而準時地劃重點的老師會往往被同學們點贊。曾幾何時,劃重點成為課堂最激動人心和最令人期待的一刻。在信息爆炸時代,尤其如此,最重要的不是增加信息,而是篩選和刪除信息。
任何學習知識,都是相互聯系,相互作用的。因此第一步就是找出各部分間的直接聯系,把網絡結構初步地建立起來。但是有些部分和其他部分并不一定能夠建立直接的聯系,那么還需要發掘第二層、第三層關系。 要明確各部分之間的關系,以及綜合運用。 學習是先模糊概括,再逐漸在大框架下逐步明晰細節、完善結構、針對缺陷和不足專攻的學習方法。
行動學習理論認為,人要掌握一門技能,需要有10%的時間學習知識和信息,70%的時間練習和踐行,還有20%的時間與人溝通和討論。這個原則叫做721原則。
碎片化學習對于10%的信息接收非常有用,而剩下獨處練習的70%和討論的20%,則需要留出大量時間來系統學習——碎片化學習永遠只是系統化學習的輔助。你需要留出足夠多整塊時間學習。
所謂系統學習法,是指把所學內容當成是一個系統看待,力求從大方向出發指導學習,這樣,在學習的時候不是按部就班按章節行進,而是先模糊概括,再逐漸在大框架下逐步明晰細節、完善結構、針對缺陷和不足專攻的學習方法。
如何系統學習數據分析?
在學習數據分析之前應該明白幾點
數據初期的準備通常占整個數據挖掘項目工作量的70%左右。
數據分析師本身融合了業務知識、統計學和計算機等學科,并不是新的技術。
數據分析更適合業務人員學習(相比技術人員學習業務來的更高效)
數據分析項目通常需要重復一些毫無技術含量的工作。
職業規劃
以數據分析師為例,先看一下國內知名互聯網數據分析師的招聘要求:
計算機、統計學、數學等相關專業本科及以上學歷;
具有深厚的統計學、數據挖掘知識,熟悉數據倉庫和數據挖掘的相關技術,能夠熟練地使用SQL;
三年以上具有海量數據挖掘、分析相關項目實施的工作經驗,參與過較完整的數據采集、整理、分析和建模工作;
對商業和業務邏輯敏感,熟悉傳統行業數據挖掘背景、了解市場特點及用戶需求,有互聯網相關行業背景,有網站用戶行為研究和文本挖掘經驗尤佳;
具備良好的邏輯分析能力、組織溝通能力和團隊精神;
富有創新精神,充滿激情,樂于接受挑戰
前三個屬于硬件要求,一般而言,有專業基礎(計算機、統計學、數學等相關專業)入行需要3個月以上的學習。對于非專業背景的同學,入行的時間可能需要的更長,建議給自己預留6-12月的時間。而要成為一個熟手(企業用工需求最多)則需要2-3年以上的行業經驗。
從業務開始
學習一門技術要和行業靠攏,沒有行業背景的技術如空中樓閣。技術尤其是計算機領域的技術發展是寬泛且快速更替的(十年前做網頁設計都能成立公司),一般人沒有這個精力和時間全方位的掌握所有技術細節。但是技術在結合行業之后就能夠獨當一面了,一方面有利于抓住用戶痛點和剛性需求,另一方面能夠累計行業經驗,使用互聯網思維跨界讓你更容易取得成功。不要在學習技術時想要面面俱到,這樣會失去你的核心競爭力。
大數據是技術工具,最終的應用需要深入理解業務企業的業務場景和商業模式,甚至有人說不懂業務就不要談大數據,可見領域知識的重要性。值得一提的是,近幾年在頂尖科學雜志《Nature》與《Science》上發表的大數據文章都是來自行業專家,而并非計算機專家,這從另外一個方面反映了業務知識的重要性。
get技能
數學知識
數學知識是數據分析師的基礎知識。對于初級數據分析師,了解一些描述統計相關的基礎內容,有一定的公式計算能力即可,了解常用統計模型算法則是加分。對于高級數據分析師,統計模型相關知識是必備能力,線性代數(主要是矩陣計算相關知識)最好也有一定的了解。
分析工具
對于初級數據分析師,玩轉Excel是必須的,數據透視表和公式使用必須熟練,VBA是加分。另外,還要學會一個統計分析工具,SPSS作為入門是比較好的。對于高級數據分析師,使用分析工具是核心能力, SPSS/SAS/R至少要熟練使用其中之一,其他分析工具(如Matlab)視情況而定。
編程語言
對于初級數據分析師,會寫SQL查詢,有需要的話寫寫Hadoop和Hive查詢,基本就OK了。對于高級數據分析師,除了SQL以外,學習Python是很有必要的,用來獲取和處理數據都是事半功倍。當然其他編程語言也是可以的。
勤于學習
大數據時代的知識,沒有像印刷時代對知識結構視為必須具備的‘基礎’知識,知識是非線性的,可以自由組合、切割,處于一種分散和游離的狀態。未來,你必須具備快速自學和捕捉知識的能力,學習將從一個‘知識儲備,學以致用’的過程,向‘知識構建,用時再學’的過程轉變,學習將是一個持續的,乃至終身學習的過程。為此你需要具備一種快速而靈活的學習方式
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24