熱線電話:13121318867

登錄
首頁職業發展大數據成為信息科技新關注點
大數據成為信息科技新關注點
2017-12-16
收藏

大數據成為信息科技新關注點

最近,在信息科技領域,繼云計算之后,“大數據”一詞成為媒體爭相追逐的焦點。對此,中國工程院院士、中科院計算技術研究所首席科學家李國杰接受《中國科學報》記者采訪時說:“科技界應高度關注大數據研究這一新的發展方向,從大數據應用中發現挑戰性的科學問題,推動以大數據為基礎的第四科學范式,促進形成新型交叉學科:網絡數據科學?!?

信息社會的變化
“60年前數字計算機使得信息可讀,20年前因特網使得信息可獲得,10年前搜索引擎爬蟲將互聯網變成一個數據庫,現在Google及類似公司處理海量語料庫如同一個人類社會實驗室?!痹诮照匍_的香山科學會議第424次學術討論會上,李國杰引用美國《連線》雜志主編安德森的一段話作為他演講的開場白。
維基百科定義:“大數據是指無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合?!薄按髷祿本哂袛祿看?、種類多和速度快等特點,涉及互聯網、經濟、生物、醫學、天文、氣象、物理等眾多領域。
國際數據公司(IDC)的數字宇宙研究報告稱,2011年全球被創建和被復制的數據總量為1.8ZB,并預測到2020年,全球將擁有35ZB的數據量。
“數據成本下降促使數據量急劇增長,而新的數據源和數據采集技術的出現使數據類型增多,” 李國杰告訴記者,“各種非結構化的數據又增加了大數據的復雜性?!?
2012年3月29日,美國政府撥款2億美元啟動“大數據研究和發展倡議”計劃。李國杰認為,這是一個標志性事件,說明繼集成電路和互聯網之后,大數據已成為信息科技關注的重點。
重視大數據提出的技術挑戰
針對美國有關大數據研究的計劃,李國杰對記者說,這項大數據計劃最為重視的是數據工程而非數據科學,主要考慮大數據分析算法和系統的效率。對我國而言,大數據工程的技術挑戰也應當得到重視。
幾百年來,科學研究一直在做“從薄到厚”的事情,把“小數據”變成“大數據”。李國杰認為,現在要做的則是“從厚到薄”,要把“大數據”變成“小數據”?!霸S多數據是重復的或者沒有價值的,未來,我們的任務不是獲取越來越多的數據,而是數據的去冗分類、去粗取精?!彼f。
他進一步指出,現有數據中心技術難以滿足大數據的應用需求,整個IT架構的革命性重構勢在必行。首先,存儲能力的增長遠遠趕不上數據的增長,設計最合理的分層存儲架構已成為信息系統的關鍵。其次,數據的移動已成為信息系統最大的開銷,信息系統需要從數據圍著處理器轉改變為處理能力圍著數據轉。此外,高擴展高可用的數據分析技術、新的數據表示方法、高通量計算機等都是亟待解決的技術問題。
基本科學問題仍未達成共識
盡管學術界已注意到大數據帶來的科學挑戰,但對一些基本的科學問題仍未形成共識。
許多學者認為,計算機科學是關于算法的科學,數據科學是關于數據的科學。有些學者試圖將“數據”當成一個“自然體”來研究,即“數據界”。
然而,在李國杰看來,脫離各個領域的“物理世界”,作為客觀事物間接存在形式的“數據界”的共性問題還不清楚。
他認為,不同于數據挖掘和統計學,從事大數據研究的學者應當更重視統計分布背后的知識和規律。
“大數據”的復雜性主要來自個體之間的聯系?!皵祿澈笫蔷W絡,網絡背后是人,研究網絡數據實際上是研究人組成的社會網絡?!崩顕苤赋?,“‘網絡數據科學’應是從整體上研究社會的一門科學,其重點是研究數據背后的社會網絡?!?
因此,大數據已成為聯系人類社會、物理世界和信息空間的紐帶,需要構建融合人、機、物三元世界的統一的信息系統。
李國杰呼吁,大數據研究正在形成熱潮,學術界需保持清醒?!笆紫纫鞔_大數據研究最有價值的應用領域,理清楚數據科學的邊界和研究對象。只有明確了要研究的科學問題,網絡數據科學才會走上良性發展的軌道?!彼f。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢