熱線電話:13121318867

登錄
首頁職業發展大數據三問:大數據“熱”的冷思考
大數據三問:大數據“熱”的冷思考
2016-10-29
收藏

大數據三問:大數據“熱”的冷思考

大數據概念的形成和發酵,在當今社會引發了人們無限的遐想和期待,也受到普遍的歡迎和推崇,甚至有人不斷編造出關于大數據無所不能的種種現代神話。這種令不少人癲狂、著迷的東西是否真的“法力無邊”,我們不妨試發三問。

大數據的特點在“大”,是否越大越好?

回答是不一定。

人類對世界的認識,首先是感知信息。但問題在于,人類許多方面的感知能力卻不如普通動物,比如人的嗅覺不如狗,聽覺不如貓,視覺不如鷹等等。

難道高級動物竟然比不上低等動物?顯然不是。奧秘在于人類相對普通動物而言,長處在思維。思維之花乃是生物進化的杰作,人類憑借思維之利器,便可以通過科學技術手段,根據需要延長自身的器官,最后實現各方面能力都遠在一般動物之上。在此過程中,關鍵是計算機技術的發展,得以替代人的部分邏輯思維,能夠進行大規模數據的快速處理,從而使得我們在面對大數據時,不至于心懷畏懼。

20世紀以來科技領域看起來碩果累累,但真正具有顛覆性意義的發現卻如鳳毛麟角,甚至不及19世紀。問題何在?數字化的數據固然有利于從中發現規律,但這類數據在整個大數據庫中所占份額極小,何況還有一個魚龍混雜問題。至于那些尚未數字化的數據,尤其是那些似是而非、眾說紛紜的數據,顯然并非越多越好。

事實上,就人類認識而言,也有減材加工與增材加工兩種方式。毛澤東在《實踐論》中所說的去粗取精、去偽存真、由此及彼、由表及里的認識過程,其實就是講的真理性認識有增有減的過程。當年第谷觀察天象,所做工作就是增加數據;而開普勒總結天體運行規律,所做工作則屬刪繁就簡。如果說數據的增加意味著真理性認識的增加,那么數據的減少則意味著真理性認識的深化和升華,何嘗不值得我們同樣為之喝彩?

大數據 的亮點在“數”,是否萬物皆數?

回答是不可能。

數字的發明,是人類抽象思維能力發展的產物。而發現數字之間的某些關聯,曾經更使人類欣喜若狂,畢達哥拉斯甚至據此作出了“萬物皆數”的斷言。大數據之所以吸引人們眼球,噱頭就在“數”上,似乎一切化歸于數,就可萬事大吉,適合數字化生存的時代要求了。

應該看到,世界在演化的進程中,特別是生命體和人類社會誕生后,正負二分的表征法就變得越來越不適用了,無論是模擬仿真技術的興起,還是復雜化方法的運用,都說明這種建立在非此即彼的認識論基礎上的進位法,其實是形而上學思維方式在信息時代的反映。

由此可見,所謂的數據其實有兩類,一類是可以實現數字化的數據,人類可以輕而易舉地將它的處理任務付之電腦,進而從中發現規律、把握規律。而另一類不可數字化或者說很難實現數字化的數據,則還是必須依靠人腦的判斷與解讀。1948年美國的“驢象”之爭中,蓋洛普的配額抽樣方法以及其他民意調查機構之所以遭遇“滑鐵盧慘敗”,就是因為過于迷信數據,而這種建立在數字基礎上的所謂“科學”方法,其實經實踐檢驗后被發現并不科學。過去這些年來,定量評估在世界各地盛行,人們動輒以各式各類指標體系肢解復雜事物和系統,最后鬧出許多笑話,正說明現代的數字崇拜照樣是此路不通。

大數據的基點在“據”,是否據實逼真?

回答是不見得。

信息技術的推廣應用同樣是一把雙刃劍,它在為人們提供無限便利的同時,也為數據造假及其傳播洞開了方便之門。據《環球科學》2014年12月載文,生物科技風投資本家有一個經驗法則:一半公開發表的科研成果都無法復制,這還是最樂觀的估計。2012年,生物科技公司安進發現,在關于癌癥研究的53項重大成果中,只有6項可被復制。稍早前,拜耳制藥公司的一個團隊重新開展了67篇有重要影響的論文所做過的實驗,最終成功的卻只有四分之一。本世紀最初10年,應用于臨床的研究專利大約有8萬份被撤銷,因為它們都是錯誤的。

面對如此龐大的虛假數據,你還會相信大數據即未來石油的神話嗎?美國科學計量學家普賴斯曾在上世紀50年代就得出科學知識呈指數增長的結論,其依據是各國期刊文獻的數量增長。此后,有關知識爆炸的說法甚囂塵上?,F在回頭看,普賴斯的判斷未免草率,因為期刊文獻數量與人類知識量顯然是不能畫等號的,否則就會得出撤銷某些期刊就是限制知識增長的荒唐結論。

總之,科學的發展在深刻改變人類生產生活方式的同時,也制造了許多令人目不暇接的神話。當泥沙俱下且呈雪崩式的大數據襲來時,我們更應保持一個清醒的頭腦,用中國的古訓來說,就是要防止以目廢心。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢