
CDA數據分析師 出品
編譯:Mika
【導讀】
Jer Thorp是來自加拿大溫哥華的藝術家和教育家,目前居住在紐約。他的可視化藝術實踐中探索了科學和藝術之間的多重邊界。在本文中他分享了數據背后所蘊含的令人意想不到的重量。
今天我想跟大家聊聊兩件非常振奮人心的內容,你們可能已經猜到是什么了,那就是數據和歷史。
我不是個歷史學家,我不是來跟你們講歷史定義的,而是想讓你們通過一個框架看待歷史。
當我們創造歷史,或是撰寫歷史文獻時,我們是在把過去發生的事銜接在一起變成一個故事。
讓我先來講一個我自己的故事。和大多數年齡相仿的計算機工作者一樣,我曾是個善于社交、受歡迎的年輕人,而且擅長運動的年輕人。和大多數年齡差不多的同行一樣,我深受蘋果公司的影響。
但是注意看我選的這個商標,左邊那個蘋果,不是右邊那個。我深受右邊那個蘋果的影響,就像每個人一樣。但是左邊那個蘋果,看看這標志,是個彩虹,但是順序是錯的!真不知道蘋果公司是怎么想的。
但對蘋果公司我不想說太多,我想跟你們說一個機器的事兒。我現在回過頭來想,真是不可思議??!那是一個周三,是我大概12歲的時候,我還沒有電腦。到了周四,我就有了一臺電腦。
你能想象這變化嗎?翻天覆地的變化。沒有事物可以像電腦那樣改變我們的生活。
但我其實也不想聊電腦的事兒,我想聊聊電腦上的一個程序。程序的創始人不是左邊那個,右邊那個才是。大家知道右邊那人是誰嗎?從來都沒人知道,這是比爾·阿特金森。多虧比爾·阿特金森做的很多事,才有了我們現在每天在電腦上看到的東西。
▲ 喬布斯和HyperCard的開發人員比爾·阿特金森
但是我想重點說說比爾寫的一個程序叫做 HyperCard。HyperCard 曾是蘋果電腦的附贈品,為蘋果電腦使用者設計的,在電腦上編程時用。
▲ HyperCard
如今聽起來很瘋狂,這些程序不是我們如今使用的app。app是有很大的預算和傳播度的,而這些程序只是很小的程序。有人用它來記錄當地籃球賽的比分,有人用來整理論文,有人用來做古典音樂的教學,或者計算奇怪的天文日期。
當然還有一些是藝術項目,這是我最喜歡的一個叫做“If Monks Had Macs”,是個非線性探索環境。
▲ If Monks Had Macs
HyperCard讓我感激我能生在這個時代,讓我有機會使用HyperCard。Hypercard是最后一個電腦自帶的,設計給用戶編程的附贈品。如果你告訴電腦的發明者們有那么一日,所有人都有了電腦,卻沒人知道如何編程,他們一定會覺得你瘋了。
讓我們快進幾年,我最初的職業是藝術家。我用電腦創作一些小玩意兒,比如研究植物的生長系統。還有在這個例子中,我用像素間的顏色互換來模擬經濟模式,調查這些系統是如何運作的,我樂在其中。
這個項目使我開始從事數據相關的工作,我對這些圖像的美觀性也很感興趣,這是伊朗和伊拉克。這個看起來像個鐘表,叫做“鐘表圖”。這是另一個鐘表圖的例子,在“希望”上疊加“絕望”。實際上是在“希望”上疊加"危機”,“希望”只有三次被"危機"覆蓋。
這一系列紐約時報作品的巔峰是幾年前,我嘗試把一整年的新聞整合到一張圖中。于是這一整年的新聞人物,以及他們之間的關系都在這一張圖里了。
推特可視化案例-「剛剛到達」
由此,我對更活躍的系統產生了興趣。這個項目叫“剛剛到達”。我看人們發推特“我剛飛到夏威夷!”——你們懂的,人們總是不經意地在推特上談到這些?!拔艺娴牟皇窃陟乓?,但我剛到夏威夷“。
▲ 推特可視化項目--「剛剛到達」
然后我開始描繪人們的旅程,希望可以利用社交網絡和背后的數據建立個模型來跟蹤人們的動向。對流行病學家來說,這將是十分寶貴的信息。
推特可視化案例-「互道早安」
這是個類似的項目——它更有趣。在推特上看世界各地的人們互道早安。順便說一句,我才知道在溫哥華西岸的人真的比東岸的人起床晚,互相道早安也晚,東岸的人也更有冒險精神。
▲ 推特可視化項目「互道早安」
再給你們看一個項目,這個可能更實用,我試圖把開普勒項目的數據做成更易懂的圖像。我剛才給你們看的所有作品,都是做著玩的。
聽起來有點奇怪,但這就像HyperCard。我自己創造一些工具,然后我可以和一些人分享。但都是為了自己開心,做著玩的。
所以其實很難給這些工具明確的定位,我的創作介于科學、藝術和設計之間。從HyperCard開始直到今天,我都在建立可視化工具來幫助我理解各種系統。
如今我在紐約時報工作,我是個數據藝術家。工作期間,我接觸到很多有趣的項目。
今天會給你們看其中兩個。第一個是和馬克·漢森一起做的,馬克是加州洛杉磯的統計學教授和傳媒藝術家。馬克來時報時提過一個有趣,而又似乎顯而易見的問題。當人們在網上傳播信息時,信息是如何從A傳到B,或從A傳到B、C、D的?
我們都知道人們在網絡上分享信息,卻不知道傳播過程中發生了什么。所以我們決定創造工具來探索這個問題,這個工具叫做Cascade。
我們看這些系統時,一件事導致另一些事,我們稱之為建立Cascade。這些Cascade是逐漸發生的,所以我們的跟蹤建模也需要一段時間。
▲ Cascade
很多人都在傳播紐約時報上的信息,因此Cascade看起來其實是這樣的。這是個常見的Cascade,最左下方是第一個事件,當信息從一個人傳播到另一個人時,這個點向上沿y軸延伸 y軸是分離程度。同時向x軸延伸 x軸是時間。
現在我們可以從很多角度看這個問題,這是線型角度,這個是把線型堆疊,成為這樣的立體角度。
今天,時報每個月發表約7000篇文章,所以建立這個工具時很重要的一點是,把它建成一個可探索的模型,這樣人們可以在大量數據中挖掘他們需要的信息。
就像是給人們提供了一輛車,在這大量的數據中暢通無阻,這樣人們可以在大量數據中挖掘他們需要的信息。
實況中的Cascade 看起來是這樣的。
不得不說,這是一個重要的時刻。那么久以來,我們接受了太多假新聞。所以當我們第一次看到這一幕時,就好像考古學家把灰塵從恐龍骨架上抖落一樣。
我們發現了并第一次看到,這些網絡共享信息的結構。拿恐龍來打比方好像挺合適的,因為我們是在對這些事之間的關聯,做概率性的推測。當我們看著這些碎片信息做出假設時,我們盡力確保它們的嚴謹性。
推特是故事的一部分,敘事的一部分。我們在創建歷史,但它們不過是短暫的歷史。
這些大型的Cascades往往是最有趣的,當然有些小型的Cascades 也是很有意思的。這是我很喜歡的一個 叫“rabbi cascade”。是拉比們(猶太教學者) 圍繞紐約時報中的一篇文章的對話。
實際上,宗教工作者休息時間非常有限,周六和周日他們好像不太能放假。
于是在這個Cascade里,有一群拉比在談論一個紐約時報發表的故事。其中一個拉比給自己取的推特用戶名很厲害叫“ The Velveteen Rabbi” (注:Velve teen Rabbit/絨布小兔子是一本英國兒童讀物,此處取名去掉了t)。如果沒有這個初步工具,我們永遠不會找到這些信息,這些信息只會停留在某些角落,永不得見天日。把信息整合,然后建立敘事性結構,創作歷史,我發現了無窮的樂趣。
我兩年前搬到紐約,在紐約人人都有一個故事,是關于發生在2001年9月11日的那個重大事件。我自己的那個故事有些復雜,因為我花了很多時間在曼哈頓的9/11事件紀念碑。
9/11事件紀念碑的核心理念在于那些紀念碑上的名字,不是按字母順序排列,也不是按年份排列,而是通過可以體現遇難者之間的關系的方式排列。弟兄和弟兄一起,同事和同事一起,所以這個紀念碑考慮了種種連接,這些人曾經在生活中的連接。
▲ 9/11事件紀念碑
我和一個叫做Local Projects的公司合作,做了一個算法軟件,來幫助建筑師們決定這個紀念碑的排列方式。
一共有將近3000個名字,將近1500個鄰接的請求。這些連接的請求,所以這是一個很密集的故事和敘事,需要在一個紀念碑上呈現。我和Jake Barton一起制作了這個軟件,讓建筑師可以首先制作一個可以滿足所有請求的布局,然后在某些地方做改動,從而可以表達他們想要的故事。
我想在我們這個社交網絡統領的時代,這個紀念碑是個與時俱進的概念。因為這些現實中的社交網絡,在紀念碑中能夠得以呈現。最令人感動的就是前去紀念碑,看到這些人的名字是如何彼此相鄰,來呈現他們在世時的生活的。
▲ 9/11事件紀念碑
那么,這些對于我們的生活有什么影響呢?
我不知道你們還記不記得,今年春天出了這么一件事,飽受爭議。人們發現在iPhone上,還有在電腦上,有大量定位信息被儲存。
蘋果公司回應說,這些定位信息跟你們無關,而跟你們居所的無線網絡有關。所以這跟你們無關,而是跟你們在哪有關。
這是很寶貴的數據,對研究者來說 這些移動數據像金子一樣寶貴。于是我們想到:有多少人都在用iPhone???在座的有多少人用iPhone?所以在這個房間里,就有研究者們很喜歡的大量的定位信息。
于是我們創造了一個叫做Open Paths的系統,它可以讓人們上傳iPhone的數據,并與研究人員建立代理關系來共享這些數據,把這些信息貢獻給有需要的人。
Open Paths的初步模型很成功,我們收到了成千套的數據。我們制作了一個界面,讓人們可以看到自己的生活是如何展開的。從這些被你忽視在手機里的蛛絲馬跡中。我們沒有想到這個體驗會是這樣感人。
我上傳數據的時候心想,沒什么大不了的;我知道我住在哪;我知道我在哪上班;通過這個我能看到什么?
結果我看到了我來到紐約,走下飛機的那一刻,那一晚去吃泰餐的餐館,想象著紐約新生活的開始。我遇到女友的那一天,這是拉瓜迪亞機場,這是在阿姆斯特丹大道上的泰國餐廳,這是我遇到我女友的時候。
你們看到了嗎?我第一次講這些故事和我第二次講的時候,有什么區別?
我們不經意間,把這些信息放在了人類語境中,通過把信息放在生活語境中,信息就產生了意義,這非常非常重要。
因為我們的歷史被保存在這些手機里,從這個角度來看這個人類語境的角度。
首先,我們可以更好理解我們,分享的是哪一類的信息,但如果我們可以把其他信息也放在人類語境中。我想很多事情都會被改變,因為它能自動讓在這些系統的人們身臨其境,這會導致最基本的尊重。
在我看來這一點在技術行業中往往是缺失的。當我們在處理一些事情,比如隱私時,如果我們明白數字不僅僅是數字,而是與現實連接在一起的,它們就變得舉足輕重。有了這一層理解,對話就可以變得不同。
你們中多少人曾點過按鈕,許可第三方公司獲取你的定位信息的?很多人吧。第三方公司是開發商,第二方公司是蘋果,可是第一方卻從沒有獲得這些信息!
我想這是因為我們把這些信息看作是抽象的,可以被擱置不顧的,我們沒有把它們放入人類語境中,使它們的價值變得更重要。我請求你們做的事很簡單,從更人類語境的角度看待數據,這真的不難。
當你看到股價時,想一下背后的人類語境。當你看到貸款報告時,想一下背后的人類語境。
很顯然,大數據是巨大的商業。一個產業巨頭在崛起,想一想我們在之前的資源產業中做得如何,我們做得不好。我想一部分問題在于,我們沒有積極參與到有關人文語境的各方面對話中。
我要請求你們做的另一件事是,讓更多人參與到這個對話中,藝術家、詩人、作家讓有人文學科背景的人們加入到討論中。
因為我相信數據世界可以革新我們的生活。這和我們在資源產業、金融產業的嘗試不同。讓我們把人文元素帶到故事中,我相信我們一定能帶著它走向無限潛能的地方。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24