
北京焦灼?上海頹廢?大數據如何解讀城市性格?
城市如人,在形成的過程中也會顯現出獨特的性格。具有特殊文化品格和精神氣質的城市,無疑是最具吸引力而叫人難忘的。但你是否想過,如何用大數據深度探尋一個城市專屬的性格特色,了解城市心理?在1月4日的數據俠線上實驗室,DT君邀請到城市象限的地產業務總監張希煜,她通過挖掘分析歌詞、豆瓣、點評等多維數據,對城市性格特征進行輪廓側寫,有趣生動地為我們講述了如何用大數據解密城市性格。
何謂城市性格?
說到城市性格,也許大家會覺得城市性格是一個復雜且充滿神秘的話題。首先,我將從人的性格研究開始講。因為這是所有科學研究當中最為通俗化的內容,任何一個人有可能不知道某個專業領域的研究,但他一定知道關于人的性格科學或偽科學的研究,比如大家接觸到最多的星座、血型、八字的研究。
我把人的性格研究劃分成了成因研究和表現研究兩個部分。
從成因研究上來看,這三個類型對城市性格研究有較大的借鑒意義,可以借鑒到分析城市性格的類型化研究中去。
一是星座、血型、八字類的迷幻研究,它的一大特點是會充分折疊一切可以觀測的現象,能在折疊中尋找出凸顯話題性的方式,從而訊速博取大家的關注,形成共鳴。這可以對應到文人作家是如何描述城市特點的,他們會提取一些非常抽象的內容,以一種比較具有感染力但不全面的方式去表達,從而形成對一個城市的簡單感性的描述。
二是神經生理觀能類的降維研究,人的性格和腦功能、生理結構、神經系統有很大的關系,這類研究是把高度復雜、多維的結構還原到較單純的物理基礎內容,從而去探究它的成因和表現的過程。對應到城市研究,就像是通過城市空間有形可見的物理功能性元素,去探究城市性格的表現。
三是生活史社會影響類的溯源研究,主要針對如何挖掘過去的事情,包括環境變化是如何影響性格形成的。這可以對應到我們對城市文化溯源、發展歷程的研究中。
個體間的區別促生個性,對城市來講也是這樣——由于氣候、歷史、建筑、習俗、方言、食性等等諸多不同,城市才會有血肉有靈魂,謂之“城市性格”。研究一個城市的城市性格,不可避免地要去做一個全面的分解。
我們認為城市性格是從物理到心理的。
其中城市空間是我們所在城市性格展示的空間載體,包括了建筑元素和交通元素;城市場景由我們的交互過程、認知、情感、行為建構;另一方面,我們也是城市個體化的成員,集聚成群體化的方式去呈現城市性格,我個人認為城市成員是城市性格最為核心的內容。
所以綜上所述,城市性格是一種城市特性的集合,是在城市空間和城市場景的影響之下,城市成員所表現出來的特點和特征。
城市性格與大數據間的碰撞融合
類比人的性格,我們通過行為情感和認知反映關注城市性格特質,而大數據是作為城市性格的素材。
這個素材主要是三個層面:
一是社交網絡類的信息網站上提供的廣泛文本信息,它和我們一般接觸到的純數據最大的區別是,文本信息是一種信息量大且折疊程度高的信息,其中的分析內容有很大的空間可以去主觀操作、創作。
二是社交網絡類網站提供的對某一個信息傳播方式及傳播范圍的指向性數據,這為我們提供了觀測每一個貢獻信息的人之間關系的方式。我們可以通過這些用戶是否對同一件事情發表評論、是否參與同一個活動、是否分享了類似的內容等途徑去構建用戶之間的關系。
三是對象關系,主要是通過挖掘用戶與用戶之間、參與者與參與者之間的內在聯系,比如通過豆瓣同城,可以將關注同一類或同一個活動的用戶建立成一個群組,這樣他們就有了一個維度上聯系。
在基于種種途徑去挖掘城市性格時,實際上是在建立一個更為豐滿的城市感知。
通過和其他傳統城市感知方式來對比,當我們去試圖建立城市性格時,實際上是在挖掘一個城市發展的內部動機。那么它的源頭是什么?這是一個很好的視角,因為如果去對比一些傳統的研究方式,大家很容易發現如果僅僅是以建立因果聯系就去做發展預判,會導致對城市的預測是扁平的。
焦灼的北京 VS 頹廢的上海
談到各個城市的性格,很多人會第一時間想到上海與北京。它們是近代以來中國的兩個最大的都市,一南一北,互為“他者”,無論是城市形態、社會分層,還是城市景觀、文化風格,都呈現出鮮明的對比。
對北京和上海的比較,永遠是大家樂此不疲的話題。那么對生活在這兩個城市的人來說,他們所懷的城市情感是怎樣的呢?
為了找到答案,我們團隊在去年5月做了一個研究:通過挖掘北京和上海歌詞文本信息探測其城市情感,我從中節選了一些研究結果展示。
我們提取了“離開”和“留下”兩個對立性的詞語作為指向詞,用以評估兩座城市,大家通過詞頻可以明顯看到,相比于上海,北京是一座在離開和留下之間非常糾結掙扎的城市。
這張圖是類比語言學研究方式后建立的詞庫:
我們通過詞庫來對比兩座城市詞性的相似和異同,最后建立了一個形容詞列表。從中我們發現北京會有更多積極的詞語,描述感情更為激烈,色彩更為明確;而上海會更多地使用一些私人化的詞匯,表現更多的是朦朧的情感。
另外關于歌詞,我們建立了一個詞與詞之間聯系的主成員分析圖表,具體如下圖:
我們團隊也在試圖去建立一個基于文化地圖之上的城市詞頻地圖,希望能夠挖掘到更為廣泛的語料信息,通過詞與詞之間的關聯,挖掘城市背后的故事,目前還在起步階段。
選餐廳:北京追網紅,上海覓小眾
俗話說“民以食為天”,飲食也是構成城市性格必不可少的一部分。我們通過分析大眾點評的數據做了關于兩座城市推薦餐廳的研究,其中數據主要是從大眾點評上的社區推薦上爬取了大家推薦的不同商鋪信息和傳播情況。
通過對比北京和上海的推薦數據,我們發現在北京大家更傾向于去推薦人氣餐廳、網紅餐廳、爆款餐廳,而在上海大家更喜歡推薦小眾、有特色的餐廳,且推薦的接受度比北京要高一些。
當然這只是我們巨大研究鏈條當中小小的一環,但從這個小細節上可以看到兩座城市的性格差異。北京更傾向于追求人氣、熱鬧的消費氛圍,但上海相對于北京而言,更看重小眾、獨立、私人化的消費氛圍。
比文化:北京愛歷史,上海重商業
文化是時間的沉淀,更是城市永恒的追求,一個具有特殊文化品格和精神氣質的城市,無疑是最具吸引力而叫人難忘的。那么北京和上海在城市文化上相比又如何呢?
我們爬取了豆瓣同城上的數據,這些數據內容包括在城市范圍內發生的文化活動的名稱和性質、參與者的發生時間、消費門檻、文字描述等信息。
我們利用這些數據做了關于活動特性、活動參與者、活動發生地點等分析。以下兩張地圖是根據北京和上海豆瓣同城上的活動數據(活動距離商圈、文明古跡、老城區等的距離)進行的分析。
通過這兩張地圖可以明顯發現,北京的文化活動距離歷史街區、文化遺產更近一些,而上海的文化活動更靠近一些商業機構和商圈?;谶@一結果可以猜測,北京的文化活力、文化內容更為明顯地受到了其歷史文化的影響;而上海更為核心的發展動力是其商業文化或是商業動機。
下面這一張圖是關于活動類型的對比:
我們依據活動內容的描述將其劃分成兩個類別,第一類是傳統文化類的活動,包括京劇表演、手藝表演、城市文化資源分享等;另外一類是創業類的活動,主要是工作坊、演講培訓、游戲等。
那么從比例上,大家可以發現北京的傳統文化活動明顯高于創業類文化活動,而在上海這個數值上則很接近。這更明顯的反映,商業文化對于文化活動在上海的滲透,也從側面表現出上海的城市性格更傾向于追求一種價值的分享,而北京更多的是關于文化體驗、傳承的分享。
小區名:北京喜復古,上海崇洋氣
除了情感、飲食和文化,北京和上海在小區命名上也存在著很大的差異。
我們對比了不同城市住宅小區的命名,通過把小區名稱、小區位置、小區類型、房價規模等數據提取出來進行一系列研究。從中我們發現了一些很有意思的成果,下面節選了北京和上海的兩個小片段。
北京(尤其是在2005年以后)的小區,在命名上喜歡田園風或是中國風,而上海則更偏愛國際經典情,下圖列表上有幾個例子:
大家可以看到像耕天下、禮士閣以及江南山水、揚州水鄉這種“CP感”明確的小區名字越來越多;而在上海則會看到更多舶來詞,如城市經典高迪、莫奈莊園、硅谷商墅等。
這些名字也反映出了所在城市居民的價值取向,我們研究了兩種類型名字在整個城市小區中的占比情況,可以看到相對來說北京用田園復古風的命名會更多一點,上海則用國際風的命名會稍多一點。
第二張圖是關于兩種風格房價的對比,由于涉及到房價數據,數據比較敏感,所以很難橫向對比,我們是通過對比這一類型房子均價大概是全市均價的多少倍數得到的。很容易發現在北京,以復古風命名的小區明顯會賣得更貴一些,而上海則是相反。
以上只是城市象限研究的一部分,但我們的研究不止這些,目前我們還有一個腦洞是關于如何通過城市地名的命名方式去挖掘城市的性格,觀察胡同街道名稱、橋梁道路名稱、水系名稱等數據,從中發現城市的價值取舍、希望寄托、外來文化、紅色文化等對城市的影響。
舉例來說,通過看全國有多少紅旗街、紅旗路以及分布在全國的哪些地區;又或者通過對比北京胡同和上海弄堂的命名,從而發現當中寄托了城市什么樣的愿景;還有歷史傳流下來的文化圖騰的命名方式……這些都能讓我們發現各個城市的性格特點。
關于我的分享就到這里,希望能給大家帶來啟發。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24