
大數據需要建立規則和標準_數據分析師
作為在上世紀90年代就提出可穿戴設備概念的潘特蘭教授,在大數據方面也享有卓著聲譽,但他對大數據的看法,站在互聯網業者的角度來看略顯保守。因為他最為人稱道的幾個研究方向并非大數據的應用,而是個人數據采集規則,大數據安全和隱私等。不過這些在我們眼里看上去遠比不上大數據發展優先的主題,并不妨礙他成為大數據領域首屈一指的專家。
潘特蘭的學生中牛人輩出,有發明谷歌眼鏡的,也有發明面部識別技術的。潘特蘭本人則較為熱衷于為大數據采集和應用制定規則,設立標準,甚至還在世界經濟論壇這種重大場合為政治及經濟人物提供各種與此有關的建議,可以看得出,大數據的規則和秩序是他更為看重的主題。這在當前整個社會對大數據的狂熱情緒下,似乎顯得有些違和,但誰也不敢肯定,幾年后這未必就不是一個至高議題。
與那些喜歡做美食但自己不吃的廚師一樣,潘特蘭作為可穿戴設備教父,自己是不戴可穿戴設備的。雖然沒有明說,但他對產自IT界的各種可穿戴設備所表現出的鄙夷,還是能夠令人清晰感知到的。吃飯的時候他曾表達過這樣的意思:不要相信那些現有的可穿戴設備,未來的大數據與之沒有半點關系。而在現場視頻中對各種市面上常見的可穿戴設備進行測試時,結果也確實與其態度有所吻合,所有加入測試的設備無一幸免地暴露出數據上的偏差,外觀不錯的小米手環誤差率竟然達到了15%。
潘特蘭將這些設備稱之為簡單、劣質,而他自己認可的可穿戴設備標準,則完全以用戶體驗為導向。他認為,那些設備光是能將人的步速和心跳頻率測出來,本質上是沒什么用的,用戶需要讓這些設備告訴自己,今天他的身體到底好不好,有沒有什么欠缺,該如何進行調理等等。他所說的這種我們從未見過的場景,我想就是可穿戴設備和大數據緊密結合的產物了,很遺憾這種產品目前還沒問世。
大數據的四個階段,采集、存儲、分析、應用,目前的發展水平似乎仍停留在采集階段,但對此已有分歧了。大公司喜歡把合理訴求和自我訴求巧妙混合在一起,然后拿出來說事兒,他們對數據的渴望是貪婪的,恨不得能采集的都采集到,然后實現數據互通,最終實現產品化和商業化。
但要注意到的問題是,數據采集和使用仍然是應該有邊界的。就拿BAT來說,騰訊把聊天記錄作為大數據樣本,阿里把交易信息作為大數據樣本,百度把越權抓取的非公開信息作為大數據樣本,從法理上來說都是存在一定風險的。個人網上信息的所有權在過去并不是個問題,未來一定會是個問題。
潘特蘭為此提出的解決方案,則更顯人性化,基于用戶角度去考慮問題,較少考慮商業因素。他認為,每個人都有權使用自己的數據,選擇進入或者退出網絡,或者選擇是否分享給別人。只有用戶對數據應用和安全放心了,不覺得會有什么問題了,才會有真正的大數據。
其實很容易理解這些話的含義,大公司對數據的擷取是主動的,而用戶對數據的被收集則是被動的,這對于一個未來的龐大產業而言,不可能不是一個問題。英國微電影“黑鏡“中有個場景,在一個人出車禍死后,系統自動搜集此人在各種社交網絡上的發言和分享,類似于人肉搜索,然后基于這些數據模仿出其語言,再通過逼真的模擬語音,實現與未亡人進行跨陰陽兩界對話的效果。這個場景相當令人震撼,也相當令人擔憂。
如果大數據應用到這個地步,必然會出現不良后果,這會反過頭來損害大數據產業的發展。潘特蘭說的那些話意思在于,你讓用戶自己去選擇個人數據的應用,賦予其主動權,這才是對大數據發展更有好處的事情。
例如,用戶如果認為自己的身體數據并沒什么隱私問題,你給他退出的權利,他會主動給你上傳更多的優質數據,而這些數據是公司們想通過技術手段收集,也收集不來的??纱┐髟O備與這種兼顧了用戶權利的數據結合,才會達到他心目中的理想效果。
其實我一直都有個看法,通過大數據預測未來是一件不靠譜的事情,不管你的應用技術如何發達,IT設備如何高效,這本質上是一種違背能量守恒定律的臆想,如永動機一樣永遠不能實現。不過,在預測未來之外,大數據可做的事情其實要比我們想象的更多,如石油帶動能源革命一樣,會對未來的人類生活產生重大影響。
這個事情需要有序推進還是野蠻生長,著實是值得深思的問題。由于數據維度的不同,文化習慣的差異,大數據之間未來發展到應用階段時,會呈現出嚴重的不同步現象,出現失真,解決這個問題的關鍵,在于規則和標準。而為大數據建立規則和標準,似乎正是潘特蘭教授真正心向往之的一件事,因為他知道,這可能會影響到一個革命性產業在未來的走向。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
2025 年,數據如同數字時代的 DNA,編碼著人類社會的未來圖景,驅動著商業時代的運轉。從全球互聯網用戶每天產生的2.5億TB數據, ...
2025-05-27CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25