
大數據、小模式、深影響
我今天想跟大家分享的是大數據以及大數據所延伸出來的商業價值??赡苡行┤藭栠@樣的問題,我所代表的學院——牛津大學互聯網研究院主要的工作職責是什么?我想說,我本身是牛津大學信息哲學與信息倫理學的教授,能在這里和大家一起見證騰訊互聯網與社會研究院的成立,是一件非常了不起的事情。因為我認為人類開發數據技術是多年來在古老的地球上開出來的一朵鮮艷的花。其實這個技術在很多年前就已經有了,它深深根植于我們的生活中,它就是哲學。
什么是大數據?大數據是由三個“V”組成的——速度(Velocity)、種類(Variety)和數量(Volume)?,F實是大數據一直在變化——速度變得更快,數量變得更多,種類也變得更多樣,每一天、每一周都是如此。但是大數據有沒有局限?這三個“V”是否會不斷地增長?數據會有它的限制嗎?
2013年,全中國一共產生了0.8ZB(約8億TB)的數據,到2020年會變成35ZB,這是快速的增長。而我們的記憶到底能存多少數據?我們的記憶是沒有極限的,因為它是動態發展的,這跟數據的增長有關系。
我剛才所講的是大數據的一些歷史。突然有一天我們發現大數據會變成一種資產。什么時候會變成一種大資產呢?如果要選擇具體的一天,大概是在2012年,世界經濟論壇宣布大數據成為一種新的經濟資產,就像貨幣或者黃金一樣。毫無疑問,這種經濟的增長速度是非??斓?。我從經濟論壇上也聽到了很多知名的經濟學家對于大數據的看法,大家都同意這是一個全新的局面。
現在是什么組成了大數據?不僅僅是速度、種類和數量,還應該有價值(Value)——從三個“V”變成四個
“V”。這四個“V”已經陪伴了我們很長時間,這就是為什么我們今天要來參加這個論壇,討論大數據。
為什么大數據如此重要呢?對于我這個哲學家來說,大數據的價值是什么?所謂大數據的價值,是以小的格局和小的形式來體現的,這是什么意思呢?我們看到的就是一些小的數據一點點連接在一起,那么到底多大規模的數據才會出現一個可辨別的形式?可以說,你的眼睛無法辨別這種小模式,除非這些小模式連接起來。如果說你有足夠的能力,有足夠的數據,你才能發現這些數據連在一起或許是一臺電話;如果不太了解技術,你可能就看不到這個電話的形式。
可見,大數據是最敏感的,當這些小的敏感線條連接在一起,你馬上就會發現“小模式”決定了一半的數據都是垃圾,但是你不知道是哪一半,只有不斷地收集這些數據才能做出判斷。
首先就是大數據和小模式與我們隱私之間的關系。當然,還會有新的問題,那就是預測。我們發現有足夠的數據,再加上智慧小模式的匹配,計算機就知道你會定什么樣的行程,在你買之前它已經知道你要買牙膏了。計算機可以告訴我們,今天要做什么,但是它不會告訴我們為什么要這樣做。當然還有來自廣告的壓力,以及那些日益具有說服力的工具,都可以說服你什么是最好的。這些都會影響到我們的自由,對個人而言,這些都是風險。
但是它們并非不可解決的風險,如果我們能夠注意到,這些風險就能被解決。當然,這里不僅僅有風險,還有很多優勢。當我們談到大數據的時候,我們要記住大數據是有價值的,它有知識和技術的價值,讓我們可以更好地去了解這個世界。從衛生、技術、教育到醫療的研究,幫助我們深化對世界的理解。我們當然也可以去思考大數據給我們帶來的經濟和商業價值。例如,企業、企業家利用數據可以創造經濟價值,確保未來的一代人會比現在的一代人生活得更加美好。因此,我們需要思考大數據在經濟上的價值。
今天我們聚集到這里,還要關注大數據的社會價值,也就是怎么樣利用大數據提高社會的價值,怎么樣改善你的企業運營,怎么樣改善交通運輸,以及怎么樣預測和改善將來的健康問題。大數據是一個非常好的工具,它可以幫助我們改善生活,給我們帶來希望。
我們應該利用什么樣的戰略來獲得大數據的好處,避免風險呢?對于大數據,要利用什么樣的價值戰略呢?我想,要設定這樣一個戰略是比較容易的,但是實施起來比較難。大數據可以確保我們避免出現傷害,也可以預防傷害或者去除傷害,并創建福祉。
我給大家解釋一下這一點,大家可以思考一下醫生給他的患者做什么?醫生要盡量防止他的患者出現一些傷痛,希望他變得更加健康和強壯。大數據對整個社會來說也可以幫助我們這樣做——防止和去除傷痛,而且最重要的是可以去改善成百上千萬人的生活。
歷史的車輪一直在往前行進,我們無法阻止它往前走,我們確實發揮著作用,不管是大的還是小的,是作為機構還是個人,我們的作用就是為了確保未來社會的順利發展。而同時數據的價值、量和速度都會增大增強,就有可能會出現信息過載的問題,出現太多的噪音。面對這樣的情形,我們可以做什么呢?
這時,我們就要確保這樣一個噪音缺口是盡可能小的,才能充分利用大數據的價值,同時又不會給整個社會體系造成過載,這就是我們這個研究院的一個非常重要的責任。
當然我也要強調一下我們本身的哲學理念。大家可以去思考一下大數據有上萬億個,我們有這么多信息,也知道這些是或者不是的問題是不 斷增加的。要找到答案,并從中找到信息,我們就必須要去確定正確的問題,也就是要問什么樣的問題,才能擠出水分,通過大數據確定小模式。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25