
大數據時代要識數
怎么樣才算識數,怎么才能做到識數,在羅輯思維的【得到】APP上開設付費專欄《硅谷來信》的吳軍博士給出了自己的理解和建議。
大約從4年前開始,我們就說進入了大數據時代,大約從2年前開始,它的應用越來越普及,使得我們社會運行的效率(很多大公司賺錢的效率)大大提升。
在思維上,我們也接受了數據驅動的思維方式。在這樣一個時代,我們都必須做到識數,而不是看到一個數據后,給出情緒化的反應。
幾個月前,王健林說的“掙一個億”的小目標,經常被大家拿來調侃。因為在大家的眼里,一個億是一個巨大無比的數字,甚至近乎一個天文數字。即便在人均GDP為五萬元的美國,95%以上的人一輩子是掙不到一億人民幣的。
但是對一個國家而言,一個億就是一個非常小的數字了。比如中國政府的債務。根據國際貨幣基金組織提供的數據,截止到2016年3月底,是28萬億人民幣。
哇,25萬億耶,是不是永遠都還不清了?
其實,一個億,對任何一個國家來說,都不是什么了不得的數字,對中國來說,一萬億都只是一小顆花生米而已。因為中國當時的GDP大約是68萬億人民幣,債務占到GDP的41%左右。
41%,都快接近一半了,那這個債務水平算不算高呢?
對一個年收入10萬的家庭來說,40%的債務,即4萬的債務確實很高。但是對于中央政府(有些國家叫聯邦政府),或者像中國這樣可以得到中央撥款支持的地方政府,這個比例非常低。
美國聯邦政府的國債到今天累計已經達到21萬億美元(大約相當于146萬億人民幣),占其GDP的125%,這個還不算州政府借的一些錢呢。
日本的國債占GDP的200%,法國占100%,英國占90%,意大利占130%,并且都在上升。只有德國占73%左右,但是也比中國高得多。
怎么樣,這樣一比較,中國算是非常非常低的吧?其實,越是經濟不太好的國家,債務水平反而越低。比如俄羅斯,債務只占了GDP的不到20%。
對中國這樣的國家,什么算是大數呢?十萬億或者一百萬億!100萬億,用數字表示就是100,000,000,000,000,也就是1后面14個零。如果用小時來度量宇宙的年齡,宇宙到今天大約是100萬億小時。
我們不僅對大數字要敏感,對小數字也應如此。吳軍老師說,一位離開Google到某個電商公司負責廣告業務的員工有一天跟他抱怨說,他的老板對0.8%的廣告點擊率相當不滿意,覺得太低了。當時,正好北大光華管理學院的一位統計學教授也在場,他開玩笑地說“你回去和他講,他怎么不上天呢?”
實際上,0.8%的點擊率對互聯網展示廣告來說已經很高了,因為整個行業的水平大約是0.4%。搜索廣告的點擊率要高很多,但也只有2%。因此,數據的大和小完全要看場景,在互聯網廣告這個場景下,即使不到1%,也是很大的數字。
比廣告點擊率更小的數字是支付系統的出錯率。在這個行業,千分之一都是很大的數了。因為這個領域最關鍵的事控制被欺詐的概率,如果做不到千分之一,就不用在這個行業混了。
一般來講,這個行業的欺詐率是用基點(也就是萬分之一,即0.01%)來衡量的。大部分信用卡公司和銀行都能講欺詐率控制在幾個基點這樣的數量級。支付寶因為有大數據支持,大約能做到一個基點以下,這就使得其他產品難以和他競爭。
與大和小相比,有些時候“準確率”(或者比率)這樣的概念更是隨著應用場景的不同,標準相差很多。
比如語音識別,如果準確率達不到95%,可用性就不是很好。而對于指紋識別,如果做不到99%以上,就沒有太大的意義。
我們經??吹竭@樣的洗滌劑廣告,能夠殺死99%的細菌。事實上,對那些細菌特別多的東西,殺死99%是遠遠不夠的。因為細菌的繁殖在合適的環境里繁殖速度很快,一天下來可以繁殖上萬倍。但是,如果一個過濾器能夠過濾掉99%的PM2.5顆粒,在室內大致可以滿意了。
那我們怎么知道每一個領域數字的大和小呢?怎樣才能不被人忽悠呢?吳軍老師說可以從三個層次培養自己對數字的敏感性。
首先,不要一看到別人給的數字,就被唬住了。對它既要關注,也要留個心眼。要牢記數字的大小和場景密切相關。
其次,對于很多事情要有大致的概念,不需要了解細節,但在數量級上要有常識。比如我們在報紙上經??吹健昂勒眱蓚€字,標題黨常常用它來吸引眼球。其實只要把那個價錢放到一個地區和當地的房價或者收入水平做一個對比,就能大致做出判斷了。
數量級的概念也就是10的多少次方,一個數量級的差距就是差10倍。
最后,我們看到一個數字,在下結論之前,最好問一下自己,它的參照物是什么,凡事大小多少都需要有參照物,在互聯網發達的今天,這些參照物并不難找。
對數字敏感,很多時候是我們不吃虧,乃至事業成功的基礎。
最后,拜托你幫我個忙,如果你覺得這篇文章對你有所啟發,歡迎轉發到朋友圈讓你的朋友們也看看。謝謝你!
我把每一次的寫作都當作一次分享的機會,希望借此遇見更好的自己。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25