
大數據最核心的價值是什么_數據分析師
有這樣一段話:社交網絡,讓我們越來越多地從數據中觀察到人類社會的復雜行為模式。社交網絡,為大數據提供了信息匯集、分析的第一手資料。從龐雜的數據背后挖掘、分析用戶的行為習慣和喜好,找出更符合用戶“口味”的產品和服務,并結合用戶需求有針對性地調整和優化自身,就是大數據的價值。 那大數據的核心價值到底是什么?
“很多人還沒搞清楚什么是PC互聯網,移動互聯網來了,我們還沒搞清楚移動互聯的時候,大數據時代又來了?!薄R云卸任演講
本文嘗試從三大產業的角度將大數據的核心商業價值分類討論。
首先例舉一些大數據的典型應用,然后解釋大數據的定義,最后總結大數據的價值。
我們知道:
空白處你會填上什么?歡迎大家討論。但是目前可以預測的是,數據和內容作為互聯網的核心,不論是傳統行業還是新型行業,誰率先與互聯網融合成功,能夠從大數據的金礦中發現暗藏的規律,就能夠搶占先機,成為技術改革的標志。
大數據挖掘商業價值的方法主要分為四種:
大數據的類型大致可分為三類:
從理論上來看:所有產業都會從大數據的發展中受益。但由于數據缺乏以及從業人員本身的原因,第一、第二產業的發展速度相對于第三產業來說會遲緩一些。
1985年,我國國家統計局明確地把我國產業劃分為三大產業:
第三產業即除第一、第二產業以外的向全社會提供各種各樣勞務的服務性行業,主要是服務業。其中第三產業可具體分為兩大部門:一是流通部門;二是服務部門。再細分又可分為四個層次:
我們可以看出,由于某些客觀原因,相對于第一產業和第二產業來說,第三產業憑借自身的優勢,大多匯聚了當前最海量的數據以及大批的科研中堅力量。接下來讓我們看一些典型例子,當前新形勢下與三大產業密切相關的大數據應用。
(1).第一產業
孟山都是一家美國的跨國農業生物技術公司,其生產的旗艦產品抗農達,即年年春(Roundup)是全球知名的嘉磷塞除草劑,長期占據市場第一個位置。該公司目前也是基因改造(GE)種子的領先生產商,占據了多種農作物種子70%–100%的市場份額,而在美國本土,更占有整個市場的90%。已經統治了生物工程種子業務超過十年。
孟山都首先發起“Green Data Revolution”運動,建立農業數據聯盟(Open Ag Data Alliance)來統一數據標準,讓農民不用懂“高科技”也能享受大數據的成果。典型的應用如農場設備制造商John Deere與DuPont Pioneer當前聯合提供“決策服務(Decision Services)”,農民只需在駕駛室里拿出平板電腦,收集種子監視器傳來的數據,然后將其上傳給服務器,最終服務器返回化肥的配方到農場拖拉機上。
The Climate Corporation為農民提供Total Weather Insurance (TWI)——涵蓋全年各季節的天氣保險項目。利用公司特有的數據采集與分析平臺,每天從250萬個采集點獲取天氣數據,并結合大量的天氣模擬、海量的植物根部構造和土質分析等信息對意外天氣風險做出綜合判斷,然后向農民提供農作物保險。前不久從Google Ventures、Founders Fund等多家公司獲得超過5000萬美元的風險投資。 2013年被孟山都收購。
Solum目標是實現高效、精準的土壤抽樣分析,以幫助種植者在正確的時間、正確的地點進行精確施肥。農戶既可以通過公司開發的No Wait Nitrate系統在田間進行分析即時獲取數據;也可以把土壤樣本寄給該公司的實驗室進行分析。2012年獲得Andreessen Horowitz 領投的1700萬美元投資后,已累計融資近2000萬美元。
了解更多:
大數據對于農業的發展會帶來什么影響?或具體到對農場經營會有什么啟示或者帶來什么樣的變化?
(2).第二產業
2013年9月,工業和信息化部發布了《關于印發信息化和工業化深度融合專項行動計劃(2013-2018年)》的通知。明確提出推動物聯網在工業領域的集成創新和應用:
實施物聯網發展專項,在重點行業組織開展試點示范,以傳感器和傳感器網絡、RFID、工業大數據的應用為切入點,重點支持生產過程控制、生產環境檢測、制造供應鏈跟蹤、遠程診斷管理等物聯網應用,促進經濟效益提升、安全生產和節能減排。
大數據的業務多是數據驅動型,具有數據量大、種類多、實時性高的特點。工業企業對數據的記錄以往看來主要分為兩種方法:傳統的紙筆和Excel電子表格記錄。這些操作起來看似簡單的數據管理方式為企業生產及質量監控埋下了巨大的隱患,也讓數據挖掘無從談起。
隨著信息化與工業化的融合發展,信息技術滲透到了工業企業產業鏈的各個環節。例如Sensor、RFID、Barcode、物聯網等技術已經在企業中得到初步應用,工業大數據也開始逐漸得到積累。企業中生產線高速運轉時機器所產生的數據量不亞于計算機數據,而且數據類型多是非結構化數據,對數據的實時性要求也更高。因此工業大數據所面臨的問題和挑戰很多,所以通用電氣公司(General Electric)的副總裁兼全球技術總監William Ruh認為相對于工業大數據來說,工業互聯網(Industrial Internet)才是當前急需的,因為大數據本身并沒有讓信息的提取更加智能,業務比數據本身更加重要。他舉了一個核磁共振成像掃描的例子:
Here’s an example. An MRI scan is the best way to see inside the human body. While effective in helping to diagnose multiple sclerosis, brain tumors, torn ligaments and strokes, the data produced by an MRI machine is disconnected from the person that needs it the most.
At a very simplistic level, there are many individuals working as a team to make the scan happen. A nurse administers medications or contrast agents that may be needed for the exam; an MRI technologist operates the scanner; and a radiologist identifies the imaging sequences to be used and interprets the images. This information is then given to the nurse, who then passes it to the primary doctor to review and take action accordingly. This is Big Data, but it is not making information more intelligent.
又如在工業中,壓力、溫度等數據的特點是需要語境才能理解的。燃氣輪機排氣裝置上的溫度讀數與一臺機車的內部溫度是完全不同的。燃氣輪機改善熱敷需要使用非常復雜的算法運行模型。在筆記本電腦上,一個典型的查詢要獲得答案一般需要三個星期。在基于大數據的分布式系統上發布同樣的查詢執行一種計算只需要不到一秒鐘。
德國漢德技術監督服務有限公司的前身是德國鍋爐檢驗協會(簡稱TüV)早在1869年,德國鍋爐檢驗協會就承擔了德國國內所有鍋爐運行安全的檢驗工作,保證了鍋爐生產的安全。漸漸的,德國鍋爐檢驗協會取得了德國政府的授權,開展對其他產品的檢驗工作,從采礦,電力系統開始,到壓力容器,機動車輛,醫療設備,環境保護,宇航工業,醫療產品等等,現在的德國漢德技術監督服務有限公司已經成為了許許多多產品的安全代號。主要體系認證包括企業質量管理體系,生產環境體系,生產碳排放方案等。TüV當前從建筑綠色標準體系方面提出了對于大數據能源管理的探索,以微軟新總部,蒂森克虜伯電梯總部為例,在整個項目實施中引入大數據能源管理,在建筑的設計規劃階段、施工階段、運營階段等多個階段通過數據化的能源管理系統,實現建筑的低碳、綠色、智能。
Wonderware作為系統軟件涉及的專業企業,對于大數據的計算和運用是從比較“IT”的角度出發的。Wonderware 的實時數據管理軟件能夠提供一個工廠所需要的從建立到報廢的所有實時數據。目前已經退出移動版本,工程總監在手機上就能夠隨時隨地監控設備的運行狀況。目前全球超過三分之一的工廠應用Wonderware公司的軟件解決方案。
了解更多:
大數據在電力行業的應用前景有哪些?
(3).第三產業
這一個部分的內容比較多。這里只提出一些典型的應用例子,歡迎補充。
When the program, a remake of a BBC miniseries, was up for purchase in 2011 with David Fincher and Kevin Spacey attached, the folks at Netflix simply looked at their massive stash of data. Subscribers who watched the original series, they found, were also likely to watch movies directed by David Fincher and enjoy ones that starred Kevin Spacey. Considering the material and the players involved, the company was sure that an audience was out there.
一般來說盈利性質的商業公司和企業都不會輕易泄露自己的數據、建模方法和分析過程,所以還有很多大家不知道的神秘應用潛伏在黑暗里,如同《三體》中的”黑暗森林法則“。
宇宙就是一座黑暗森林,每個文明都是帶槍的獵人,像幽靈般潛行于林間,輕輕撥開擋路的樹枝,竭力不讓腳步發出一點兒聲音,連呼吸都必須小心翼翼:他必須小心,因為林中到處都有與他一樣潛行的獵人,如果他發現了別的生命,能做的只有一件事:開槍消滅之。在這片森林中,他人就是地獄,就是永恒的威脅,任何暴露自己存在的生命都將很快被消滅,這就是宇宙文明的圖景,這就是對費米悖論的解釋。
大數據(Big Data)是指“無法用現有的軟件工具提取、存儲、搜索、共享、分析和處理的海量的、復雜的數據集合?!睒I界通常用4個V(即Volume、Variety、Value、Velocity)來概括大數據的特征。
看看專家們怎么說。
不是隨機樣本,而是全體數據;不是精確性,而是混雜性;不是因果關系,而是相關關系。
大數據時代下的核心,預測分析已在商業和社會中得到廣泛應用。隨著越來越多的數據被記錄和整理,未來預測分析必定會成為所有領域的關鍵技術。
從數據的類別上看,“大數據”指的是無法使用傳統流程或工具處理或分析的信息。 它定義了那些超出正常處理范圍和大小、迫使用戶采用非傳統處理方法的數據集。
了解了大數據的典型應用,理解了大數據的定義。這時相信在每個人的心中,關于大數據的價值都有了自己的答案。
2010年《Science》上刊登了一篇文章指出,雖然人們的出行的模式有很大不同,但我們大多數人同樣是可以預測的。這意味著我們能夠根據個體之前的行為軌跡預測他或者她未來行蹤的可能性,即93%的人類行為可預測。
Limits of Predictability in Human Mobility
A range of applications, from predicting the spread of human and electronic viruses to city planning and resource management in mobile communications, depend on our ability to foresee the whereabouts and mobility of individuals, raising a fundamental question: To what degree is human behavior predictable? Here we explore the limits of predictability in human dynamics by studying the mobility patterns of anonymized mobile phone users. By measuring the entropy of each individual’s trajectory, we find a 93% potential predictability in user mobility across the whole user base. Despite the significant differences in the travel patterns, we find a remarkable lack of variability in predictability, which is largely independent of the distance users cover on a regular basis.
而大數定理告訴我們,在試驗不變的條件下,重復試驗多次,隨機事件的頻率近似于它概率?!坝幸幝傻碾S機事件”在大量重復出現的條件下,往往呈現幾乎必然的統計特性。
舉個例子,我們向上拋一枚硬幣,硬幣落下后哪一面朝上本來是偶然的,但當我們上拋硬幣的次數足夠多后,達到上萬次甚至幾十萬幾百萬次以后,我們就會發現,硬幣每一面向上的次數約占總次數的二分之一。偶然中包含著某種必然。
隨著計算機的處理能力的日益強大,你能獲得的數據量越大,你能挖掘到的價值就越多。
實驗的不斷反復、大數據的日漸積累讓人類發現規律,預測未來不再是科幻電影里的讀心術。
最終,我們都將從大數據分析中獲益。
四、結束語。
Here’s the thing about the future.關于未來有一個重要的特征
Every time you look at it,每一次你看到了未來
it changes because you looked at it.它會跟著發生改變 因為你看到了它
And that changes everything else.然后其它事也跟著一起改變了
數據本身不產生價值,如何分析和利用大數據對業務產生幫助才是關鍵。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25