
正確的理解,是玩轉大數據的前提
眼下,無論是高校還是科研機構,以“大數據”為關鍵詞的研討會一撥接著一撥,云計算、物聯網、智能終端……這些新概念串燒著出現,仿佛“大數據(數據分析師)”正撬動著一個非“技術宅”免進的新世界。
到底什么是大數據的真面目?英國帝國理工學院終身教授、帝國理工數據科學研究所所長郭毅可給出的卻是一個舉重若輕的解釋?!按髷祿紫炔皇歉拍?,而是一種現象、一種新發現的資源。就如同人類發現了新的石油一樣——對大數據的發掘意味著可以創造財富,也正因此,大數據(數據分析師認證)會引發一系列的技術革命?!?
9個月前,郭毅可接過上海大學的聘書,成為該校計算機學院院長。而在剛剛過去的2015年,這位學者走進更多中國人的視線,乃是因為國家主席習近平在訪英時參觀了郭毅可在帝國理工的研究所并聽取了他的關于大數據研究的報告。這位學者是如何玩轉大數據的,在上海大學計算機學院,本報記者獨家專訪了郭毅可教授。
大數據牽引計算機發展新方向:過去的支流將是今后的主流
對于大數據,學界說法很多。按照郭毅可的看法,大數據其實一直存在,只是發展至今,它成為一種像電、石油一般可以創造財富和價值的資源時,開始引發上、下游的一系列技術革命。
由此,各種玄乎的、計算機專家碰頭時如數家珍的新概念,在郭毅可的解讀中變得十分容易理解。比如,大數據的生成需要各種儀器,所以物聯網、醫療基因測序等得以生成各種數據的儀器設備便風生水起。再如,對大數據這種“資源”進行處理,需要大規模使用計算機,“云計算”、智能終端的重要性得以凸顯,它們不僅處理數據,也同時輸送數據,繼而產生新數據。
“在大數據所引發的一系列技術革命中,最為重要的是它對計算機科學的發展方向產生了根本性的影響?!惫憧烧f,因為處理大數據的客觀需要,計算機的“產出”正在發生改變。過去,計算機主要被用于模擬、高性能計算以及處理管理信息,而現在,計算機則被看作是大數據產品的生成器。所以,在計算機業界,包括高效的數據處理技術、機器學習等,眼下都成了最熱門的研究方向。
“更直白地說,步入大數據時代,整個計算機科學的研究重點和使用方法都變了——計算機更向“智”的方向發展?!惫憧蛇@樣解釋個中緣由:因為要把數據生成為各種產品,這本應是人的“工作”——人通過觀察做出反應和決策。而觀察的行為,其本質是收集數據,反應和決策則會產出新的數據?!斑@就是為什么類腦計算機、人工智能會從過去的計算機科學的支流變成今天的主流?!惫憧烧f。
受聘上海大學計算機學院院長后,郭毅可專門囑咐工作人員做了一件小事:在學院大樓門口處,緊挨著計算機學院的Logo,全新安裝了一個寫著“智”字的銘牌?!八懈说闹悄芟嚓P的,都將是計算機科學要研究的領域?!弊鳛橐幻嬎銠C學院的教授,他試圖用這一個字來解釋大量學生們心中糾纏的關于“計算機科學應該學什么”的疑惑。
大數據研究:比起賺錢,更值得研究的是民生項目
和傳統的高校計算機系教授稍有不同,聽郭毅可談他的研究方向,對“大數據”一竅不通的外行人都會覺得新鮮。而他的研究項目合作者中,除了理工科的教授,還有不少從事社會科學研究的學者和各路企業界的人士。最近,他正興致勃勃地和一些媒體界的人士接觸,探討用數據可視化的新形式拍紀錄片,研究目標說來很有趣:讓一些“高大上”的政治話題,也能被平頭百姓輕松接受。
以中國的“一帶一路”戰略為例。除了讓國民理解“一帶一路”帶來的諸多益處,如何也同時向沿線的外國民眾解釋好中國的“一帶一路”?按照郭毅可的見解,與其干巴巴地宣傳政策,不如讓數字來說話。比如,修通一條鐵路后,能為沿線的國家新增多少就業率,會讓當地文盲率降低多少、人口預期壽命增長多少。
從專業角度來講,這類“數據可視化”的研究是郭毅可目前最感興趣的研究方向。作為學者,他堅信一點:數據除了可以賺錢、創造財富,更大的價值在于服務民生。
去年10月,習近平主席造訪英國理工,參觀該校的數據科學研究所時,郭毅可用數據可視化的方式,分析了中國人口遷移的情況,“一帶一路”政策的國際影響力、個性化醫療的推廣以及上海地鐵的負載分布和應急辦法等。
實際上,因為這條公共新聞的披露,很多圈內人才恍然大悟:原來上海地鐵運營狀況的“大數據”,被送去了帝國理工做分析!
為什么不是上海本地的高校而是帝國理工更受上海地鐵公司的青睞?郭毅可“嘿嘿”一笑,坦然作答:“要知道,倫敦的地鐵可是世界上最古老的,我們‘玩地鐵’可以玩出很多精彩的東西?!?
事實上,這輕描淡寫的一句中,隱藏著很多信息。如郭毅可接受本報記者采訪時所言,在帝國理工的數據科學研究所,他經常要接待主動捧著數據上門的“客戶”。很多在一些國內同行看來被機構、組織所壟斷、難以得手的數據,卻頻頻對郭毅可所在的研究所“開綠燈”。由此反觀,最近兩年間,奔著大數據的美好前景,國內很多大學和研究機構都忙著掛牌成立大數據研究機構。但真實的情況往往是,這邊才揭牌,那頭抱怨就來了:堂堂數據研究院,卻苦于手上無數據,必須要自己找尋研究方向。
“沒有數據的大數據研究院毫無意義?!惫憧芍毖圆恢M:大數據研究,關鍵是要讓數據產生價值。因此,“與其抱怨自己拿不到數據,不如好好思考一下,你的研究能夠為數據擁有者解決什么問題?!?
【獨家對話】大數據時代,計算機系應辦成教育特區
就業率這種指標,怎么能用來作為計算機系的KPI?!
文匯報:有人做過統計,在中國的理工科大學中,開設專業最多、錄取人數最多的就是計算機專業。所以在不少省市教育主管部門發布的高校本科專業預警名單中,計算機專業這兩年頻頻上榜。作為上海大學新任的計算機學院院長,您對這樣的情況怎么看,怎么評價?
郭毅可:請問現在是什么時代?“大眾創新、萬眾創業”、“互聯網+”!請問在高校,哪個專業和它們最對口?答案肯定是計算機專業。所以誰要是說計算機專業沒前途,我肯定不認同。關鍵的問題在于,高校的計算機專業有點跟不上形勢發展,這個我們必須要承認,要拿出解決的方案。
但在此之前,我要指出一點,把計算機專業列入本科預警名單似乎不太合理。
我們首先要問,統計學意義上的“計算機專業”到底指什么?如果把那些從事計算機制造的納入統計,那么專業就業率低,或許可以理解;但事實上,目前響應“互聯網+”,在互聯網上工作的人都在從事計算機科學。所以,拿“就業率”這個指標去作為大學計算機專業的KPI(關鍵績效指標),實在太不合理了。計算機專業辦得好不好?需要用創業率去考核,而不是學生的簽約率。
無論是在美國還是英國,一流大學計算機系最拔尖的學生基本上都去創業了,二流的去了金融機構。如果今天我們的高校還在拿簽約率、進500強企業作為衡量計算機專業辦得好不好的標準,這種陳舊的管理觀念真是要改一改了。
計算機專業不是授課授出來的,而是打拼出來的
文匯報:正如您所說,大數據時代的到來對計算機科學產生了根本性的影響。計算機科學發展如此迅猛,大學教育應該怎么辦?
郭毅可:計算機科學發展正在迎來最好的時期。已有一些科學家預言,未來25年內(數據分析培訓),計算機將達到人腦水平,當然,這會對人類社會的發展產生多方面的影響和沖擊,但是這也是計算機科學發展歷史上第一次接近到理想的邊緣——和人一樣,具有智慧。
所以大學目前需要應對的危機并不是計算機科學的危機,而是計算機專業辦學的危機??紤]到計算機迅猛的發展態勢,大學計算機學院需要辦成一個教育特區,需要定制課程和教育方案。打個最簡單的比方,我回國后發現,很多大學計算機系的學生花了很多時間在聽課、聽滿堂灌的大課。我覺得很奇怪,因為在帝國理工,計算機系學生上課的時間很少,都是小班授課,老師講課速度極快,學生們更多的時間是在實驗室里做各種項目??傊痪湓?,計算機專業不是授課授出來的,而是打拼出來的。
中國高校對老師的要求是“全才”,而我們也需要同時用好“偏才”
文匯報:理想的教學,關鍵在師資。您回國后出任學院院長,對本土教師有何評價?按照您的改革設想,一旦學院課程改革啟動,本土教師能夠承擔起重任嗎?
郭毅可:我無法對中國大學教師的總體水平作評價,但就我在上海大學擔任院長的這9個月的時間,在接觸了大量老師后,我覺得我們的師資非常棒,不管是本土培養的還是國外回來的,水平并不差。而眼下的關鍵問題是,要讓老師專注地做他們真正有興趣的事情,而不是為了滿足各種指標、考評的需要,讓他們忙得團團轉。
要說論文、科研指標,世界上所有的大學其實都有KPI考核。帝國理工也一樣,但除了校長對外會介紹各類指標的完成情況外,教授群體本身不會太在意。
什么是真正一流的大學?在我看來,就是要凝聚一批學者,他們以為人類做出重大貢獻、產生讓人類銘記的研究為目標。有了這樣一批學者當老師,繼而把做科研的樂趣傳遞給年輕的學生,讓他們覺得青春時代受到很好的教育——這樣的大學就是一流大學。
從國外回來,我一個比較明顯的感受是,中國很多高校對老師的要求是“全才”,希望老師科研教學樣樣好,而我們的很多老師或許是出于知識分子的尊嚴,每天忙著“達標”,過得有點累。實際上,能夠成為“全才”當然好,但有時候“全才”也意味著各方面發展比較平均。與之相應,在某些方面具有能力特長的偏才,高校也應該學會揚長避短,承認差異,給他們以同樣寬闊的發展平臺。
無論是對學校、對院系還是對教師的考核,KPI是一種有效的方法,但與此同時,它也有不合理之處。因為KPI是“一刀切”的指標體系,是會謀殺個性的。在這一方面,我們不妨拿出點中國人的傳統智慧,比如借鑒一下陰陽理論。如果KPI是“陽”,那我們還需要設計一個更富彈性的評價機制去加以平衡、綜合。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25