熱線電話:13121318867

登錄
首頁職業發展大數據分析:大數據小數據,有用的就是好數據
大數據分析:大數據小數據,有用的就是好數據
2016-03-10
收藏

大數據分析:大數據小數據,有用的就是好數據

大數據到底有多大?

在 2001 年,道格 · 萊尼(Doug Laney)寫下了一篇具有開創性意義的文章。在這篇文章中,萊尼描繪了一直困擾著他的客戶的一個數據問題。萊尼的客戶受困于體量(Volume)過于龐大的數據,這些數據正在以爆發式的速度(Velocity)增長,同時數據所呈現的形式也非常多樣化(Variety)。萊尼的體量、速度和多樣化理論得到了廣泛認可,并被稱為「大數據的三重奏」。

遺憾的是,許多人并沒有抓住萊尼的重點。他在文章中所描述的是大數據所蘊含的問題,而不是優勢。

想要收集大數據其實并不容易,而且收集和使用的成本往往非常高昂。與此同時,在一般情況下大數據和具體商業問題的關聯度其實并不明顯,遑論大數據往往不能滿足品質標準的要求。況且在面對大數據時,管理數據所投入的資源并不能在分析、二次研究以及執行等環節中使用。由此看來,大數據對于許多人而言其實并不是一個祝福。相反,大數據有可能會嚴重攤薄企業在數據分析環節所需要的資源。

數據2

大數據思維

和其他問題相比,某些問題往往會顯得更加重要,而某些問題則往往會顯得更為復雜。但即便是在解決那些非常重要或復雜問題的時候,我們也不一定需要體量龐大的數據。

我最喜歡的例子之一是載人航天計劃,你只需要考慮想要活著將人送到太空所需要的所有信息和計算,就不難理解這是一個多么復雜的問題。載人航天任務所涉及的數據包括:

宇航員的身體狀況和醫學信息

地理測量學(航天器的位置)和重力場

氣象學,云層量和輻射平衡

大氣物理學

磁場強度

宇宙射線和輻射捕獲量

電磁輻射(紫外線、X 射線和伽瑪射線

這份清單只是所需清單中的一小部分,但它所包含的信息量已經非常龐大。甚至連筆者本人也不清楚這些信息到底意味著什么,他只是從一份老舊的 NASA 文件中找到這份清單。(有誰知道行星際介質的測量方法嗎?)

載人航天計劃所需要的數據到底有多少?與之匹配的計算能力又該有多少?這兩個問題的答案你能猜出來嗎?

筆者曾有幸和「水星計劃」(Mercury Project,美國第一個載人航天計劃)的編程人員露西 · 西蒙 · 拉科夫(Lucy Simon Rakov)進行會談,她向我描述了項目所使用的電腦。據拉科夫描述,盡管項目中的電腦性能非常強大,但內存卻只有 300 千字節。你沒有看錯,不是「艾字節」,不是「拍字節」,也不是「兆字節」,而是「千字節」!

換而言之,只要你足夠聰明,你就可以憑借內存極小的設備將航空器送上太空,要知道 300 千字節的內存甚至連存儲一張大一點的圖片也不夠。由此看來,小小的空間其實也大有所為!

盡管如此,大數據有時會變得相當寶貴,與其價值相比,處理中的煩惱和成本甚至也變得不值一提。

大數據有什么好處?

大數據可以針對用戶提供定制化的細節數據,有了這些數據,你可以作出更加明智的決策。實際上,有了大數據的幫助,你在頃刻間即可完成上千項決策。

如果說你可以一個接著一個地觀察用戶,你會更了解他們的習慣、喜好和需求。你會更了解如何和他們相處。只要數據的準確度和質量得當,大數據可以讓你以定制化的方式與用戶保持親近,就像對待朋友一樣。

你可以通過分析數據中的節為用戶提供個性化服務,客戶可以從你身上獲得類似于亞馬遜(Amazon)或者 Netflix 的針對性服務。更加顯著的例子是在線婚戀網站的配對服務。

我需要大數據嗎?

除非你已經可以在工作中善用日常更小級別的數據,否則大數據對你而言還言之過早。更重要的是,不論面對的是大數據還是小數據,最重要的是你可以善用數據,并將其轉化成自己的強力武器。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢