
我們的時代是數據日益滲透生活的時代,大數據與人們的生產生活有著越來越密切的關系。近期來,不少讀者向本報反映,希望了解關于大數據的許多問題,我們從中梳理了六個問題,組織專業記者,深入采訪業內專家,努力探尋答案,以滿足廣大讀者的探問。
剛剛閉幕的2017中國國際大數據產業博覽會又為火熱的大數據產業添了一把火,博覽會簽約金額達167億余元,簽約意向金額為256億元左右。這一全球首個以大數據為主題的展會,再一次撩起了大數據的神秘面紗,展示了大數據的大能量,一個通過加工處理數據來創造價值的產業正在迅猛發展。
什么是大數據 有一個故事,說的是一位顧客訂購披薩時,披薩店可以立即調出這位顧客的許多信息,比如送披薩上門必有的家庭、單位等地址和電話,顧客的消費習慣從而推薦適合他的披薩種類,顧客名下的銀行卡透支情況從而確定他的支付方式,甚至顧客要自取披薩時,還能根據顧客名下車輛的停放位置預估他的到店時間等等。
從這個故事,我們可以看出大數據的一些關鍵特征,比如容量大、類型多、關聯性強、有價值等等?!按髷祿且愿呷萘?、多樣性、存取速度快、應用價值高為主要特征的數據集合,正快速發展為對數量巨大、來源分散、格式多樣的數據進行采集、存儲和關聯分析,從中發現新知識、創造新價值、提升新能力的新一代信息技術和服務業態?!惫ば挪啃畔⒒蛙浖諛I司副司長李冠宇接受經濟日報·中國經濟網記者采訪時說。
僅僅規模大不是大數據
大數據,顧名思義,“大”該是應有之義?!按髷祿亩x最初與容量有關系?!崩罟谟罘治稣f,業界有幾種對大數據的定義,其中一個共同點就是數據的容量超出了原有的存儲、管理和處理能力。
正如中國電子信息產業發展研究院副院長樊會文接受記者采訪時指出的,大數據概念產生就是因為數據量和數據類型急劇增加,以至于原有的數據存儲、傳輸、處理以及管理技術不能勝任,需要全新的技術工具和手段。
信息技術日新月異,大數據的定義也在發生變化。工信部賽迪研究院軟件所所長潘文說,數據即時處理的速度(Velocity)、數據格式的多樣化(Variety)與數據量的規模(Volume)被稱為大數據“3V”。但隨著近幾年數據的復雜程度越來越高,“3V”已不足以定義新時代的大數據,準確性(Veracity)、可視性(Visualization)、合法性(Validity)等特性又被加入大數據的新解,從“3V”變成了“6V”。
對于“多大容量的數據才算大數據”,潘文說,大數據的規模并沒有具體的標準,僅僅規模大也不能算作大數據。規模大本身也要從兩個維度來衡量,一是從時間序列累積大量的數據,二是在深度上更加細化的數據。
李冠宇說,比如一份現在看起來很小的數據,但是縱向積累久了也可以變成大數據,橫向與其他數據關聯起來也可能形成大數據。而一份很大的數據如果沒有關聯性、沒有價值也不是大數據。
運滿滿研究院院長徐強認為,“大”是必要條件,但非充分條件?;谝苿踊ヂ摼W用戶規模紅利,國內平臺型企業比較容易獲取大量數據,但數據不是越多越好,無用數據就像噪音,會給數據分析、清洗、脫敏和可視化帶來負擔。
這也正如阿里巴巴集團董事局主席馬云在某次演講中說的:“很多人以為大數據就是數據量很大,其實大數據的大是大計算的大,大計算+數據,稱之為大數據?!?/span>
“水漲船高”的大數據
今年麥收時節,在雷沃重工的全國“三夏”跨區作業信息服務中心,顯示屏的全國電子地圖上有許多大小不一、顏色不同的圓圈,這是每個區域正在作業的收割機。智能化的收割機會自動獲得許多數據,包括機器運行情況、收割量、小麥含水量等,數據傳回后臺匯總后,總體收割情況一目了然。
“大數據概念正是來自信息技術的飛速發展和應用,特別是隨著云計算、物聯網、移動互聯網的應用,數據量迅猛增長。數據來源有兩種,一種與人有關,比如政府、企業等為人們服務時產生的數據;另一種與物有關,在移動泛在、萬物互聯時代,物聯網應用的浪潮將帶動數據量爆發式增長?!崩罟谟钫f。
這也就不難理解,為何當下數據產生的速度如此之快。正如樊會文所分析的,一方面,信息終端大面積普及,信息源大量增加;另一方面,基于云計算的互聯網信息平臺快速增長,數據向平臺大規模集中。
大數據與云計算、物聯網、人工智能等新一代信息技術之間相互影響、相互促進、相互融合。徐強說,運滿滿通過車聯網設備和信息平臺,每天獲取3TB至4TB的數據,運用先進的大數據算法模型,實現了智能車貨匹配、智能實時調度等。
樊會文認為,云計算是硬件資源的虛擬化,而大數據是海量數據的高效處理。簡單來說,云計算是大數據的基礎,有了云計算才能大量集中數據從而產生大數據。同時,大數據也支撐了云計算應用創新,帶動云計算發展。
人工智能的核心在于大數據支撐。圍棋人工智能程序“阿爾法狗”打敗柯潔,離不開大數據的支持?!按髷祿夹g能夠通過數據采集、分析等方式,從海量數據中快速獲得有價值的信息,為深度學習等人工智能算法提供堅實的素材基礎。反過來,人工智能技術也促進了大數據技術的進步。兩者相輔相成,任何一方技術的突破都會促進另外一方的發展?!迸宋恼f。
核心價值在于應用
剛剛過去的“6·18”再次掀起網購熱潮。網購消費者基本都被精準推送過廣告信息,如曾瀏覽過電飯煲的消費者,很長一段時間內會在登錄頁面后看到各品牌電飯煲信息。
阿里、京東、360等互聯網平臺接觸消費者眾多,也因此獲得了很多數據。但是正如精準推送一樣,不對這些數據進行處理、挖掘就沒法產生價值。比如雷沃收割機傳回的數據進行匯總后還要分析處理,從而得出對收割作業乃至整個農業都有意義的結論才是這些數據的價值所在。
“大數據作為重要的基礎性戰略資源,核心價值在于應用,在于其賦值和賦能作用,在于對大量數據的分析和挖掘后所帶來的決策支撐,能夠為我們的生產生活、經營管理、社會治理、民生服務等各方面帶來高效、便捷、精準的服務?!崩罟谟顝娬{。
我們正在步入萬物互聯時代。華為預測,到2025年,物聯網設備的數量將接近1000億個。工信部統計數據顯示,目前我國網民數量超過7億,移動電話用戶規模已經突破13億,均居世界第一。
“全球數據總量呈現指數級增長,企業級用戶擁有的數據量在快速增加?;ヂ摼W的社會化生產出巨量數據?!狈畷恼f。
大數據產業也因此有了穩步增長的基礎。據潘文介紹,2016年我國大數據核心產業規模達到3100億元,按照工信部今年年初發布的《大數據產業發展規劃(2016—2020年)》,預計到2020年將達到1萬億元的規模。
“2016年,我國兩批次8個國家級大數據綜合試驗區開始建設,大數據集聚發展布局初步形成,各區域特色化發展態勢初現。以阿里巴巴為代表的大數據企業不斷創新,開源技術成為大數據技術創新和產業進步的重要力量。大數據在金融、電信、交通等行業領域不斷深化應用,催生著新業態,加速著產業升級?!迸宋恼f。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25