熱線電話:13121318867

登錄
首頁職業發展大數據歷史背景、價值取向與哲學意蘊
大數據歷史背景、價值取向與哲學意蘊
2016-07-03
收藏

大數據歷史背景、價值取向與哲學意蘊

1 歷史背景

1.1數字化、網絡化和智能化

廣義地看,人類正在經歷第五次信息革命,或者叫第五次與信息相關的革命。過去四次依次是語言的產生、文字的創造、造紙和印刷術的發明,以及電報、電話和電視的發明。第五次信息革命,也就是我們正在經歷的數字化浪潮,對應于1946年第一臺電子數字計算機(ENIAC)的誕生。

無論與前幾次信息革命相比,還是與始于18世紀的工業革命相比,僅經過69年發展的當代信息革命都還處于襁褓期,但卻已經體現出不同以往的特質。

過去的信息革命主要是表意形式和傳播載體的演進、表意對象局限于思想或經思想認知的世界,而我們現在卻在經歷信息處理效能的本質性提升、表意對象擴大到廣袤無垠的客觀世界;

工業革命主要是沿著放大和延伸體力、轉換外界能量為人所用、創造豐裕物質世界的方向發展,某種程度上以壓抑心理訴求和精神發展為代價,而我們現在卻不斷通過智能系統放大和延伸智力、解放大腦,將人的個性化需求置于融合的核心。

此次革命的第一個突破性進展在于數字化,其后續發展取得的成果都有賴于從模擬到數字的驚險一躍。一方面,數字化編碼(比特)使得信息的搜集、存儲、處理、分發具有了前所未有的效率,從而放大了信息的力量和作用范圍;另一方面,數字化使得信息從其附著物上分離出來,得以獨立于實物、空間和時間而存在,逐步擺脫附庸于物質的地位。

早期,人們用“互聯網上沒有人知道你是一條狗”來形容其與實體世界的割裂,而今卻已經是“互聯網上沒有人不知道你不是一條狗”的時代。這是網絡世界的變遷,也是繼數字化之后信息革命的第二個階段。

網絡化源于電話網絡,但大成于互聯網。它在人與人之間、物與物之間、人與物之間建立無處不在的連接,使得信息可以廣泛實時共享,從而打破信息孤島,迅速擴大數字世界的疆域和縱深。由于網絡的自我擴散性質,我們先后迎來用戶爆炸、應用爆炸和數據爆炸,一個動態的、全局的、充滿活力的數字世界呈現在眼前。與上一階段的數字局域網相比,仿佛一個個隱藏在叢林里的原始部落被整合為書同文、車同軌、初具氣象的文明世界。

網絡化進程尚未結束。2010年之前,互聯網的發展主線是信息&內容互聯網和人際互聯網,在終端和網絡基礎設施滲透升級驅動下的應用創新。但是,如果要把互聯網從數字世界延伸到實體世界乃至更遠,就需要看第二個十年的發展了。這就好比完成了直流電向交流電的轉換之后,電力的遠程傳輸能力極大增強,新建工廠無需局限于發電廠附近,工業化的基礎才真正奠定?,F在,我們正處于第二個十年的中段,O2O已經開啟了服務互聯網的發展主線,并將與物聯網一起將互聯網發展帶入新階段。

盡管如此,下一階段的特征已初現端倪。這就是智能化。智能的原意是指人改造物質、轉換能量和處理信息的綜合能力。智能化是人類智能的軟件實現、外化和放大,也是一種對系統資源綜合利用的能力,能基于現場情景或主觀意圖,靈活、自動實現相關資源的組織、擴展、配置和動作執行。

現在小到智能手表、智能藥丸,中到智能家居、智能工廠,大到智慧城市、智慧地球,還包括智能管道、智能手機、智慧醫療等等,背后都有兩個特征:一是資源利用的最優化,二是體驗和效用的最大化。某種程度上,智能化深刻影響社會生產生活的方方面面,乃是當前人類發展面臨資源瓶頸的必然選擇。(此段不夠精到,此處保持原文修改另文發布)

1.2 大數據作為一個歷史階段

大數據承上啟下,在網絡化向智能化的過渡期舉世矚目,乃理所當然。

如果沒有網絡基礎設施可供數據傳輸,如果沒有網絡基礎設施支持云計算(實質是網絡計算)運行,如果沒有網絡終端的多樣化和平民化,如果沒有互聯網應用的快速創新,如果沒有物聯網逐步普及…數據量不可能出現如此快速的增長。實際上,網絡效應是一種趨同效應,會強迫所有的節點滿足某種標準,否則就無法從中獲益。

這種最一般的標準就是“數字化”?,F在,互聯網從線上走向線下,會快速推動實體世界數字化,從而產生更多的數據。比如,很多人可能都以為社交網絡如Facebook或微信已實現了Internet of People。實際上,社交網絡中的人是作為主體存在的,只算實現了Internet for People。只有可穿戴式設備引發“量化自我”運動后,人才作為一個客體被接入了互聯網,成為一個不斷采集數據并向云端傳輸數據的節點。這才開啟了人的“數字化”,人作為客體世界的一份子向數字世界遷移。

雖然人工智能的學科歷史可追溯到數字計算機的發明,但一直沒有取得令人信服的成就。網絡化的不斷深入與數據的快速增長改變了這一局面。

在一些案例里,互聯看起來比數據量重要,比如,智能汽車在發生交通事故時,它能與保險公司實現連接,通過照片和汽車自己提供的數據(包括當時的車速、胎壓等)自動進行索賠,并一次性提交所需資料。

在另一些案例里,數據量似乎比互聯重要,比如,為了給保險產品定價,Climate公司的平臺匯總250萬個地點的氣象測量數據和各個主要氣候模型的天氣預報,同時綜合1500億個土壤觀測記錄,生成出10萬億個天氣模擬數據點。

對前者而言,數據的實時性更重要,其智能體現在對環境變化的響應,仿佛一個能夠迅速判斷形勢的指揮家;對后者而言,數據的累積量更重要,其智能體現在對事物規律的深刻洞察,仿佛一個歷經滄桑的智者。這兩種智能并行不悖,我們都需要。實際上,智能汽車持續采集的數據會積累巨大的數據量從而產生新的應用場景,而我們也可設想,后者的天氣保險未來可和前者的車險一樣實現自動理賠。

智能是互聯和數據共同作用的結果——互聯是數據的互聯,數據是互聯的數據,大數據是廣泛互聯、逐步沉淀的海量數據。這時,網絡將不僅僅是大數據產生的原因,更是大數據發揮價值的手段。

總之,大數據肇始于數字化、成長于網絡化、應用于智能化,是在移動互聯網、云計算、物聯網等新技術、新業態發展的必然結果,代表第五次信息革命迄今為止的綜合成就,目前還只能說處于襁褓期。認識到網絡化正在向智能化進階,我們會將關注點從“大數據怎么來”轉移到“大數據如何用”,從“大數據技術”轉移到“大數據商業”,從“大數據資源”轉移到“大數據資產”,把大數據作為下一階段的奠基者去構筑更高的大廈。

2 大數據定義

2.1 大數據的技術特征與價值邏輯

當被問到什么是大數據時,大多數人都會提到3V特征。但是,這種描述性的定義并不能揭示其最重要的屬性,也不包含任何價值取向,遠不足以指導我們把握大數據的本質。這種定義視大數據為棘手的技術挑戰而非巨大的價值機遇。Vendor們非常喜歡這個定義,因為每個V背后意味著要增加相應的IT預算,而它們也成了淘金熱中的賣水人。

大數據首先指應該指數據本身及其內在規定性,之后才談得上其特征描述。而后者至少包括兩個層次的內涵:一是大數據的技術特征,二是大數據的價值邏輯,前者是后者的手段,而兩者共同實現大數據的內在規定性。

技術方面的內涵應囊括大數據采集、存儲、計算、分析等全環節。在這個范疇內,3V闡釋了何謂大數據之“大”,但在此之外,至少還需要增加一個V,即Vast,指數據來源的廣泛性。在談到戰略性新興技術時,大數據通常與云計算、物聯網等詞匯同列。實際上,物聯網、云計算都可劃歸大數據的技術譜系,分指大數據的采集手段和計算手段。

在闡述大數據的價值邏輯之前,我想談談大數據的外部性、多歧性和社會化

外部性是一個經濟學術語,通俗地說就是可以不付出額外成本所能獲得的收益。

開放數據并不會給數據所有者增加額外成本,但二次開發可以形成巨大的經濟價值,會極大地激發創新潛力。麥肯錫的研究表明,開放數據將在7個行業創造3-5萬億美元的經濟價值。這個價值里面很大一部分體現為社會福利,但確有數十家企業基于開放數據建立了價值10億美金的業務模式。由于隱私、泄密等顧慮,除了政府這種以社會福利為宗旨的機構,大部分盈利性組織包括標榜開放的互聯網公司,都對真正意義上的數據開放持謹慎態度。盡管如此,這并不能否定外部性作為大數據的普遍特征

多歧性是指對于數據的價值判斷沒有統一的標準,俗話說此之蜜糖彼之毒藥。

擁有數據的組織越來越多,組織擁有的數據越來越多,數據所有者開始感受到了對外變現的壓力。從數據所有者的角度,多歧性至少體現在兩個方面,一是潛在客戶如何看待其內部數據的價值是不確定的;二是內部數據與哪些數據相結合便能釋放出化學反應也是不確定的。外部性表明上述價值和化學反應十之八九存在,但多歧性表明這兩者都難以被數據所有者把握。這一性質有助于理解,為何信息不對稱無處不在、永不可能徹底消除。大數據不斷流向信息缺失的那一面,從而不斷創造價值。

社會化描述的是數據創造價值的過程,也即數據由自然個體到社會個體的轉變過程。

這就好比人的社會身份不斷轉換疊加,為人子、為人夫、為人父、為人所雇、為人所附、為國之公民、為人之摯友,直至死去。個體必須經過社會化才能使外在于自己的社會行為規范、準則內化為自己的行為標準,大數據的內在價值轉化為客觀價值的過程也是這么一個過程。和人的發展一樣,數據也需要不斷轉換場景和立場,而每次轉換都需要因地制宜、細致扮演好相應的角色,不斷與其他數據(角色)建立聯系并相互影響,才能實現個體價值的最大化。從結果看,大數據是高大上的,但從過程看,卻充滿了不確定性和瑣碎,這一點也與社會上的成功人士類似

根據這三大特征,我們認為-在價值邏輯上,大數據之大指的是不斷增強數據的透明性(Transparency)、不斷擴大數據的共享范圍(Scope)、不斷提升數據的流動性(Liquidity),在更大范圍內降低信息不對稱以創造更大的價值(Value)。

2.2 大數據的終極價值

這個大價值是什么——把人的主體性和智能外化在一個數字與實體無縫融合的世界中。

首先,大數據以人的主體性為內核。尊重人的主體性,就是從人的內在尺度出發來把握物的尺度,讓物化的外部世界適應人,而不是人適應物化的外部世界。在這種視角下,所有數據都可歸為三類,一是關于人本身及人的行為的數據,二是關于行為誘因的數據,三是關于行為結果的數據。第一類數據也就是通常所謂個人數據,因體現了人的主體性被珍視。大數據把主體性置于核心,就是說第二類數據和第三類數據都因與第一類數據關聯而有意義。在智能汽車的例子中,汽車胎壓、事故照片雖然不屬于個人數據,但分別屬于誘因數據和結果數據。在Climate的例子中,土壤的數據屬于行為誘因數據,搜集它有助于人決策是否購買天氣保險,而當土壤數據用于評估該地區污染情況時,它又屬于行為結果數據。

其次,大數據為智能化賦能。只有把外部世界改造成智能系統,人的主體性才能被外化。大數據就是實現這一目標最重要的生產資料,既是勞動對象又是生產工具。大數據首先是勞動對象,并且不同于以往的勞動對象,它把人自身連同客觀世界都數據化了。這是智能化的必然要求,因為智能化要實現外部世界對人主體性的“跟隨”,就必須使其置于同一系統內。如何發揮人的主體性這個內核對上述系統的指揮作用,就需要訴諸大數據作為生產工具的那一面。聚眾成智,“聚”對應的是互聯網[1],“眾”對應的是作為勞動對象的大數據,“成”對應的是作為生產工具的大數據,核心是大數據分析,“智”就是智能化。

最后,大數據承載實體和數字世界融合。只有當實體世界和數字世界成為可統一操作的對象,人的主體性才算完整。以大數據為核心形成的反饋經濟,歸根到底就是實體世界與數字世界之間的反饋映射。具體來看,一是生活側與生產側之間的反饋,這是C2B之所指,里面大數據主要是指消費側的數據驅動生產流程;二是物聯網與生產服務互聯網的反饋,這是工業互聯網之所指,智能機器采集的大數據通過高級分析,以云服務的形式將分析結果應用到生產流程中去;三是物聯網與生活服務互聯網的反饋,這是可穿戴設備、智能家居、車聯網、移動健康等領域之所指,采集并利用大數據分析定制各種生活服務

2.3 大數據與王陽明

我們生在一個好的時代,曾經只能從哲學上構建的概念,現在可以切切實實地觸及和享有。比如萬物互聯(IoE),再比如大數據。

把大數據和王陽明聯系起來,并不是要給已經過熱的大數據貼上更高大上的標簽,而是試圖把哲學論斷對應到我們能具體把握的產業實踐,并反過來深挖哲學論斷對實踐的指導意義。實際上,當人人都把“大數據時代”掛在嘴邊,卻對這個時代背后的哲學思想毫無興趣時,其實很悲哀的事情。

王陽明的這句話分為3段,順序是有講究的。

第一段是描述默認狀態,對于任意事物客體(花),你看它是異常,不看它是正常,默認狀態下人與花同歸于寂。關鍵詞是寂,指主客兩忘的狀態,并不是指這個花不存在了;

第二段是打破默認狀態,當你來看此花時,此花作何反應呢?關鍵詞是明白,既指花的“明白”顏色被人所感知,當形容詞用,也指花感知到了人在看它并從寂的狀態中出來,當動詞用;

第三段是結論,此花不在你心外,花為你而盛開,這句話通常被用作唯心主義的罪證。

王陽明主張心即理、心外無物、心物一元,若得知后世有人稱其為唯心主義一定會欣然允之。但我想說的是,讓此花為你而盛開,讓事物按照人的個性化需求呈現出不同的面貌,正是大數據追求的目標,也是它所驅動的世界的價值觀。

我們在類比這三段時,不妨倒著來讀。

王陽明說此花不在心外,我想說大數據以人為本

以人為本就是尊重人的主體性,就是從人的內在尺度出發來把握物的尺度,讓物化的外部世界適應人,而不是人適應物化的外部世界。類似的話馬云在數博會現場說到過——IT時代把人變成了機器,而DT時代把機器變成了智能化的人。站在資本主義、工業文明的對立面,馬克思和芒福德早已深刻批判過把人異化為機器的罪惡,馬云無非是在DT時代的語境下重復這一觀點罷了。

王陽明那時還沒有機器,“花”指代的是全部的物化世界,應該說要比馬克思和芒福德更徹底,直指數字與實體世界完全融合之后的狀態。所有數據都可歸為三類,一是關于人本身及人的行為的數據,二是關于行為誘因的數據,三是關于行為結果的數據。第一類數據也就是通常所謂個人數據,因體現了人的主體性被珍視。大數據把主體性置于核心,就是說第二類數據和第三類數據都因與第一類數據關聯而有意義。

王陽明說此花明白起來,我想說大數據為智能化賦能

現在來看王陽明那朵花似乎并不難理解,不過是智能馬桶、智能炒鍋、智能筷子、智能地毯之外的另一個智能物體而已。它可能自身具備傳感器能夠察覺到你在看它,或者它能夠接受并解析來自于你的腦電波,至于腦電波如何來,可能是某種可穿戴式設備通過藍牙連接,也可能它直接讀取。

王陽明肯定無法理解這些,他用“明白”一詞描述那花可能就是擬人的修辭,但現在看來這完全可以實現,這種能力就是智能。智能就是能夠識別“你來看此花”時的場景,然后根據你的特征做出響應(明白)。這個特征,在王陽明那里就是心,在我們這里就是個人數據。個人數據、場景數據是實現智能不可或缺的原材料,所以我說大數據為智能化賦能。這個智能化了不得,不僅看花的人爽,養花的人也爽,看花的人爽是因為個性化,養花的人爽是因為高效省油,綠色環保,沒有一點浪費。Smart is New Green。

王陽明說同歸于寂,我想說大數據無在亦無不在。

無在亦無不在就是說你感知不到它的存在但它實際上無處不在,感知不到非是不能而是無需,一旦需要就會進入第二段所描述的狀態。仿佛On demand,大數據一直垂手而立等待召喚,但絕不讓你因其存在有絲毫局促。所以,大數據實際上是一種無遠弗屆的自然狀態,萬事萬物都在其籠罩范圍內。在王陽明看來,心外無物,大數據應該是類似于心的這種存在了。

我無意深入探討王陽明的心學,從目前的實踐來看,更貼切的理解大數據即信息,信息無處不在,亙古就在那里,技術的進步都只是抽離進而認識它的工具而已。王陽明啟示我們,這個進程實際上沿著兩個維度來進行的,一個是主體維度,一個是客體維度,外部世界是一個大宇宙,人自身是個小宇宙,對于兩者的數字化都還處于初級階段,但未來兩者可能同構同歸。

綜上,泛在-智能-人本這是一個手段-目的鏈。泛在回答的是大數據怎么來,智能回答的是大數據怎么用,人本回答的是大數據服務于什么目標。注意,我們并沒有說王陽明預見到了大數據,而是說他描繪的是大數據驅動的世界,最核心還的是其中蘊含的哲學關懷。泛在、智能和人本盡管處于手段目的鏈的不同環節,但相對于現實都是未來展望式的描述,大數據發展之路才剛剛開啟。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢