
CDA數據分析師 出品
編譯:Mika
【導讀】
統計學在我們的日常生活中無處不在,它有助于我們更好地了解世界,并做出更好的決策。
在今天的內容里,我們將帶你用十分鐘了解:統計學到底是關于什么的一門學問。
歡迎來到這個充滿未知、謬論和假設的世界,統計學的世界里不僅有博弈、思想實驗還有擲硬幣實驗…
等你看完今天的內容,你就知道統計學有何用?該如何用?
在日常生活我們常常會遇到有關統計的問題時,你知道該如何思考。
統計學在日常生活中有很大的用處:
統計就是理解,并運用數據。
下面就讓我們開始回答“什么是統計學”這個問題。
關于英式下午茶有一段軼事。
在20世紀20年代的劍橋,一位女士認為:牛奶是先加還是后加,這會影響茶的口感。
當時的天才們立馬開始思考,該如何驗證她的猜想。
于是,他們將8杯茶的順序打亂。想看看她能否品嘗出每一杯是先加奶,還是先加茶。
但就算她嘗出不同了,那又能說明什么呢?
因為她答對和答錯的可能性相同。而且即使她確實品出區別了,還有可能是她將錯就錯得到的。
如何判斷她是否是品茶專家呢?運氣好和舌頭靈的界限在哪兒?
眾人一籌莫展時,輪到Ronald A. Fisher出場了。
Fisher的一生為統計學做出了大量奠基工作。
這些知識能幫我們在猶豫時作出決定,不只是品茶實驗。Fisher創造性地提出實驗設計法 ,使統計學成為一門嚴謹的科學。
盡管Fisher本人沒有給出茶實驗的結果。但這個故事的結局就是,那位女士正確的區分出了所有的茶。
現在,我們要引出相關但不同的兩個統計學概念了。
我們說統計學的領域就是收集和分析數據的實踐活動。我們認為統計學就是數據的總和。
為了回答“什么是統計學”,我們應該先問“統計學有什么用”。
假設你為了期末考試熬夜復習。早上醒來,發現你倒在書桌上就睡著了,臉上還沾著枕漢堡的殘渣。
你會想,我為什么要吃這種東西?快餐控制了我的生活嗎?然后你說服了自己,我只是圖方便罷了。
但你也很糾結,你在想當中深層次的原因。
接著你上網搜“快餐消費” ,找到一份相關的調查問卷。
你做的第一件事可能就是問自己感興趣的問題。例如,你可能會問:
......
這些問題都挺不錯的。
但我們有一個更重要的問題要問:統計學能解決這些問題嗎?
我之前說過統計學只是工具,不能所有臟活累活都給它干。
為了回答“為什么有人會吃快餐”這個問題,你可以讓他做一份問卷。但你沒法保證他們是如實作答的。
可能是因為自己累得不想做飯,才沉迷快餐的;或者他們也不知道為什么要吃快餐。
有了調查的結果后,你可以得出最可能的結論是:人們吃快餐只是圖省事,或者人們平均一周吃5次快餐。
但你并沒有研究人們為什么會吃這么多。
你求出的叫“代理變量” ,與所求有關,但并非其自身。
為了回答“為什么周末吃快餐更多”或者“一周兩次也讓我壓力山大” ,我們就不僅要知道吃快餐的人數,這個問卷里有了,而且還要知道是在一周的哪幾天吃的。
而且我們給“壓力”具體化。
借助統計學,很容易回答 “為什么人們在周末吃的多”。
但是 “吃快餐是否與壓力大有關” 卻無法直接回答。
類似這樣有趣的問題無法直接用統計學來解釋。而“吃快餐的人每周工作時長是否超過80小時” 這種問題是可以回答的。
回答上述問題的工具可分為兩種:描述統計與推理統計。
描述統計描述了數據的基本情況。描述統計一般是研究數據的中段在哪兒。
統計學家稱之為,集中趨勢的度量,以及數據分布特征的度量。它們根據大量不直觀的數據,通過分析和總結,希望得到有價值的信息。
假設你在當地的華夫餅生產工廠干了兩年。終于有一天,你研究出了金棕色的,十分美味的華夫餅。
現在,你想漲漲工資。這是你應得的,沒人能做出這么好吃的華夫餅。
但你打算漲多少?
加1000元嗎?
還是5000元呢?
你知道自己有點本事了,但不知道其他華夫餅工人的工資。
你在網上搜索了一番,發現一家專業的華夫餅論壇,當中有一位叫“華夫探”的用戶貼出了華夫餅工人的工資表。
瀏覽了一串數字后,你知道了別的冷凍華夫餅公司的女工是否比你賺得多。還能看出你比剛來的新人多賺多少。
但你還是看不出公司里或者行業中價格的整體情況。
因為這里有幾千個華夫餅工人的數據。你看見的是一串離散的點,而不是圖樣。你還是不知道應該向老板開價多少。
這里就用到描述統計學了。
可以算出自己公司里工人的平均工資,以及每人相對于平均工資的分布。
你可以看出CEO的工資與剛進公司的新人工資的差距,是大還是???你的工資與它們兩者相比如何。你可以算出行業中你所在職位的工資平均值,觀察這個范圍的兩端。
有了這些數據,你再向老板開價的時候就有底氣了。
盡管描述統計學很有用,但是只能提供基本信息。
推理統計學能給出推理結論,推理統計學能對手中的數據進行延伸推論。
假設你有一個裝滿鹽水太妃糖的糖果桶,有粉色的、白色的、黃色的。
如果你想知道每種顏色有多少塊,你可以慢慢數:一塊、兩塊、三塊...
這會給你描述統計學的數據,但是誰有那閑工夫?;蛘吣阕ヒ淮蟀烟?,就數這些就行了。
這就用到推理統計學了。
如果桶里的糖混合均勻的話,你一把抓的也足夠多。你可以借助推理統計的原理,用“樣本”估計總體。
我們用推理統計來完成更復雜的工作,可以讓我們驗證一個想法或者假設。
例如,回答“在美國,30歲以下的人吃的快餐更多嗎”這種問題。我們不需要讓所有人都來回答這個問題。
假設有人說他們的最新益腦維他命產品能提升智商,你會跟風搶購嗎?
如果他們告訴你:A組的20人吃了一個月后,平均智商提升了2個點 。而B組的沒有吃的20個人,平均智商只提升了1個點。
現在呢?開始動心了吧?
推理統計讓你可以判斷出,兩個樣本的智商是否發生了變化。
當然,作為個體你可以拒絕相信。也不要因為標桿的不同而大驚小怪。
不同問題標準也不同,“為什么我的貓更喜歡某一種貓糧” 或 “這種藥能治好肺癌嗎”。
說服你買新款治癌藥,比說服你換一種貓糧要難得多。這也是理所當然的。
經過推理統計的測試仍存在一定程度的不確定性。
畢竟答案要么是“是”或者“否”。
你的工作就是排除不確定因素,獲取有價值信息。
如果統計學是超級英雄,那么他的絕招就是——拿不準。而他的口號就是“我會犯錯,但不能不做”。
統計學是工具,它幫助我們理解世界中的龐大信息。像眼睛和耳朵能濾除外界無用的刺激,給我們呈現出最好的世界一樣。
統計學為我們抽取世界中有益的數據,描述統計學使我們能讀懂數據。
雖然失去了個體數據信息,推理統計學讓我們處理存在不確定性的數據。
但它不是萬能的,它們是來幫忙的,不是來打工的。它們幫我們看清了不確定性,但沒有排除不確定性。
再拿工具來比喻,統計學就像電鋸,不理解原理的話,不僅無用還可能有害。我們必須要知道什么能做,什么不能做。
同時我們還要知道,統計學不好會讓我們吃虧上當。
而電鋸用不好會導致美國全年的3.6萬起傷人事件,其中81%是撕裂傷。你知道其實沒什么人死于電鋸嗎?也會有,但非常少有。95%的傷者是男性,這不能說明男人用不好電鋸。
…...
總之,統計學有所為,有所不為。我們學習統計學就要理解這當中的差異。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25