熱線電話:13121318867

登錄
首頁精彩閱讀數據分析師:數據過大將妨礙分析洞察
數據分析師:數據過大將妨礙分析洞察
2016-03-31
收藏

數據分析師:數據過大將妨礙分析洞察

大數據對使用者來說看似意味著好的洞察,但過量的數據并不一定帶來更好的洞察,統計學家Nate Silver這樣認為,他是美國最著名的數據分析師?!皵祿吭酱?,人們可以用來證明他們所想的結果的證據就越多”,他說。

大數據不僅僅在政治上應用,得到許多有趣的結論,在醫學領域和地震預測,研究人員更希望利用大數據得出有趣的結論,而不是什么消息都沒有。在真正的洞察中,大數據會帶來許多“虛假的相關性”,那些看似互相關聯的數據,其實只是干擾數據。

Nate Silver由此提出了四條建議,幫助使用者獲得更好的洞察。

1.概率性思考而非絕對性化思考

正如調查中也會出現誤差一樣,不要懼怕預測中的不確定性,不確定性是重要的和科學的。如果忽略了事物的不確定性會導致嚴重后果。Nate Silver指出,在1997年時,國家氣象局預測,Grand Forks的Red River的洪水水位是49英尺,因此鎮上的防洪堤被設計成能承受51英尺的洪水。不幸的是,國家氣象局在分析時并未將通過過去的數據得出的正負9英尺誤差算進去,洪水達到了54英尺,Grand Forks被淹沒。

現在國家氣象局更加關注不確定性,這在預測中非常重要。

2.明確你的出發點,明白你的弱點

Nate Silver以一個性別歧視實驗為例,一份女性名字和男性名字的簡歷,即使被調查人明確表示他沒有性別歧視,但他潛意識更可能歧視女性的簡歷。而知道自己有性別歧視傾向的人會采取一定辦法來抵消它的作用。

3.在得出結論前,了解數據所在的真實情況,理論聯系實際。換句話說,能夠準確預測San Diego的天氣,并不代表可以同樣準確預測Buffalo的天氣。

就好比,預測一個穩定的經濟環境比動蕩、蕭條的經濟環境容易得多,這也解釋了為什么許多預測者大都對經濟衰退毫無準備,因為預測模型是基于1986-2006的數據創建的,那段時間經濟異常穩定。

4.嘗試和錯誤是有幫助的。

預測模型總是在錯誤中緩慢成長的,就像生活中的許多事情:“你應該懷疑奇跡般的結果”。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢