
大數據所能做到的三大錯誤假設_數據分析師
大數據似乎已經火到不行了。根據《華爾街日報》最近的一篇報道:缺乏經驗的數據科學家每年卻指揮著價值高達30萬美元的大數據項目。顯然,我們已然大步邁進了大數據時代。
然而,鑒于這一領域的相關工具和一系列實踐方案都是如此的新穎,對于當下的我們來說,重新審視我們關于大數據所能夠幫助我們解決的相關問題的假設是至關重要的,或許更重要的是幫助我們捋清那些事情是大數據所無法做到的。本文中,我將為大家總結企業對于大數據所能夠幫助企業業務解決的三大最為普遍的錯誤假設。
大數據不能預測未來
大數據以及與之相關的一系列分析工具,評論,科學實驗和可視化并不能告訴你將來會發生什么事。為什么呢?因為您企業所收集的數據完全來自過去。我們尚不具備能夠從未來收集數據和價值的能力。
我們可以基于這些數據,分析過去發生了什么狀況,試著總結出企業的相關決策和業務行與最終結果之間的聯系和趨勢,然后可以使用猜測的方法,在相似的情況下,如果做出某個類似的決定,預估將發生的類似的結果。但我們并不能預測未來。
許多管理人員和企業妄圖通過收集了大量數據來預測未來。這顯然是一個壞主意,因為未來總是在變化。正如我們的理財顧問所始終強調的那樣:“過去的表現并不能保證未來的結果?!边@句格言同樣適用于大數據。
并非試圖預測未來,我們使用大數據來優化和改善當下的現實狀況。分析現在所發生的事情、以便能夠基于目前的事件建設性的改善后果。利用這些數據來發現如何提出恰當的問題。不要嘗試將大數據作為一個預知未來的水晶球。
大數據不能代替您或您企業的價值
大數據可能會能夠幫助您更容易和更清晰的看清和梳理各種不同決策選擇的優勢和缺點,但數據本身并不能幫助你如何解釋為什么您或您的企業要進行某些決策。
數據可以勾勒出各種各樣的趨勢圖,既可以通過數據本身,也可以通過可視化軟件的輔助。你的員工可以針對任何給定的問題創建許多預計的情況,但這些研究結果只能說是一種投影。作為企業的CIO,其工作就是要協調各種IT資源和人員來為企業的業務部門的需求服務,而這實際上是與數據對于企業的價值意義相調和的。
例如,假設你的企業是一家汽車制造商。你的大數據源和工具告訴你某些車輛模型有缺陷,而修復尚待制造的車輛需要花費幾美分的成本,但如果是對已經售出被顧客購買的車輛以及已經在生產過程中的車輛進行修理,其成本費用就會大大增加。因此,數據科學家會建議只解決目前仍在汽車生產裝配線上的車輛,而不去理會那些已經售出的,因為數據可能顯示,這樣的成本會超過了可能造成的全面賠償的成本。
(注意,如果你一直關注通用汽車點火開關的新聞故事背景的話,您對于此情況可能有所耳聞,覺得聽起來很熟悉。然而,這里僅僅是一個假設的例子,而我們要進一步強調,沒有證據表明大數據在通用汽車召回事件中起了作用。)
因為您的公司有產品質量是工作的第一首位,安全是最重要的這樣的價值聲明。雖然數據信息表明,產品召回是不值的,但是您企業仍然打電話給客戶,執行了啟動召回的流程。您企業這樣做無疑是明智的,但這并不是受大數據控制的。
因此要務必記住,有時正確的答案似乎是錯誤的,因此,這就表明我們看問題的角度是很重要的。請務必確保你選擇了正確的看問題的角度。
大數據不能解決非量化的問題
俗話說:當你僅有的一把工具是錘子時,所有的東西看起來都像是釘子。一旦你開始使用大數據來預測和解決業務問題方面取得了一些成功,不可避免地會有一種誘惑:每當您的業務或項目決策遇到問題,就會“尋求大數據”。
如前所述,數據可以給你呈現更多更好的選擇,也許,其能夠幫助您明確每項選擇可能會導致發生什么。雖然,有時候通過數據分析所提供的選擇并不是最好的,而這時,就是要讓個人發揮作用的時候了。
為什么呢?因為個人的行為幾乎是不可能量化的。每個人都有自己的一套特殊情況,自己的小宇宙,自身的原因和背景。因此將某個數學應用到一個單一的個體是不可能的。相反,我們必須考察一組個體,通過這樣的學科來研究具有相似特征的人群。只有這樣才能觀察到適用于整個集團的行為的發展趨勢。
這實際上不是一個大數據的問題。而是一個統計方面的問題。我能夠想到的最簡單的例子是信用評分,其是通過打破消費者的分組,并分析個人的還款,借款歷史各組數據進行匯總的。
比如說,如果某人的信用評分是720分,這一分數實際上的意思是,由他過去的還款記錄所形成的一組統計數據(具體取決于特定的信用評分等標準)。
信用評分不作任何聲明有關個人。他或她可能從未違約,也可能進行嚴重的犯罪,所以,沒有我們通過統計數據預測未來的行為。
信用分數不能預測一個人的行為。一個信用評分805的借款人可能準備違約也可能不借一分錢了,而評分只有590的借款人可能是一名財務狀況良好的醫生,并沒有其他有爭議的債務賬單。這種現象就是為什么一些金融機構不會基于有風險的貸款進行定價的原因了。
人類的行為是無法預測的。不要以為數據可以預測他們的行為的錯誤。大數據和人是一種不穩定的組合。文章來源:CDA數據分析師培訓官網
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25