
大腦袋需要大數據
全球各種大腦圖譜計劃正在展開,中國臺灣的計劃似乎有些小。當地科學家正在研究果蠅,通過單個神經元成像逆向編輯其大腦。他們的工作已經以驚人詳細的程度制作了大腦電路的三維圖像。
研究人員僅需要一個計算機鼠標和一個網頁瀏覽器就能追蹤單個細胞并將其縮放回神經束交織的網絡中。這些布線圖看起來像掛毯上五顏六色的線,它們可以非常清晰地表明哪些細胞簇控制具體的行為。通過刺激具體的神經線路,研究人員能夠提示一只果蠅拍打其左翅或是搖頭,這一技能去年11月在美國加州圣迭戈舉行的神經科學年會上導致參會者整個下午特別激動。
但臺灣新竹清華大學神經學家Ann-Shyn Chiang說,即便是對于這樣一個小生物,也耗費了該團隊整整十年以每個細胞10億字節的比率繪制6萬個神經元。這甚至不足果蠅屬大腦神經細胞的一半。若以此推算,利用同樣的方式繪制人腦中的860億個神經元將要花費1700萬年,Chiang在會議上報告說。
其他的技術更加易于處理。2016年7月,一個國際團隊發表了人腦褶皺外層——大腦皮層的圖譜。很多科學家認為這是到目前為止最詳細的人腦連接圖。然而,即便在其最高空間分辨率(1立方毫米),每個立體像素(三維物體最小的可分辨元素)均包含數千萬個神經元。這與以單細胞繪制果蠅神經元連接圖可謂差別懸殊。
所以,在神經生物學的世界里,大數據確實是龐大的數據量。盡管計算機基礎設施和數據傳輸的進步,“大數據”革命數十年前曾席卷基因組學領域,如今神經科學家仍在努力應對他們所在領域的新革命。
有多大
這一部分是因為無論是什么物種,大腦都如此巨大、關聯度如此之高。但它也來自于細胞難處理的維度。哺乳動物的神經元主要延伸(即軸突)是其最小分支(樹突)長度和寬度的20萬倍。如果用意大利面代表樹突,那些神經元自身就超過1公里的1/3,或是4個美式足球場。
在實驗室中,研究人員通過成百上千個重疊的大腦切片圖像堆疊跟蹤其數千個投影,從而繪制每個神經元。以光為基礎的顯微鏡能夠承載0.25~0.5微米的分辨率,這足以跟蹤一個神經元的主體。但想要揭示突觸(通過電子或化學信號流的分鐘信號銜接點),納米成像電子顯微鏡是必需的。更高的像素意味著觀測領域更小和更多圖片。更多圖片意味著更多數據。
“我們不再是應對百萬字節,甚至是千兆字節?!甭迳即壞霞又荽髮W神經成像實驗室負責人Arthur Toga說,“我們應對的是兆兆字節。將它從一個地方挪到另一個地方就是一個問題?!眱烧渍鬃止澋臄祿⑻顫M很多臺式機的硬盤。
Chiang的果蠅團隊對1兆兆字節的圖像進行了梳理,以重建1000個神經細胞——少于果蠅屬大腦的1%。HCP明尼波利斯明尼蘇達大學共同首席研究員Kamil Ugurbil說,為了繪制人類大腦皮層圖像,HCP研究人員分析了來自210名健康青年人的6兆兆字節的核磁共振(MRI)成像數據。實驗室可以從該項目的網站或更大的數據集中下載那些數據,每次下載那些8兆兆字節的文件需要花費200美元。
電生理學研究在計算方面也變得更加吃力。今天,研究人員通常每次記錄數百個神經元。很快,它將會達到數千個;在5年內,將達到成千上萬個,瑞士日內瓦大學神經學家Alexandre Pouget說?!斑@是我們將要發生的跳躍式前進?!?
劍橋哈佛大學神經學家Florian Engert說,如果你記錄小鼠大腦神經元活動20分鐘,那么將會產生約500拍字節的“閃爍”,其中神經細胞放電代表為像素值的變化。
神經學家沒有可以對比的模型,沒有將神經連接和活動行為、記憶或認識相關連的地圖??紤]到大腦巨大的錯綜復雜性,馬里蘭州美國精神健康研究所負責人Greg Farber說,問題“并不在于我們有過多的數據,而是我們遠沒有達到需要解決這個復雜問題的數據”。
搭建橋梁
過去17年,鹽湖城猶他大學研究神經發育紊亂的系統神經學家Julie Korenberg和同事一直研究在恒河猴中繪制大腦邊緣系統。這種靈長類動物大腦有60億個神經元,而人類大腦則有860億個。但在研究模型中,恒河猴與小鼠或果蠅相比同人類血緣關系最近。
Korenberg的團隊正在開發一個三維協調模型,與恒河猴大腦中各種神經成像數據相匹配,這些數據包括從整個大腦MRI連接到單細胞公焦數據以及一些區域的電子顯微鏡亞細胞分辨率。他們在建立“一個讓你在一個圖像上選擇一個點并以另一種分辨率來看這個點的系統”,國立精神衛生研究所(NIMH)影響社會行為和社會認知項目領頭人Janine Simmons說,該機構為Korenberg的研究提供了部分支持。Simmons說,它有些類似谷歌地球,例如,你可以將焦距從40 ×直接轉變為1 ×,但卻不能得到這些變焦尺度之間的層次。
利用20×共焦透鏡繪制恒河猴大腦邊緣系統圖像將需要巨大的數據集,每個動物遠超過600兆兆字節。到目前為止,該團隊已經收集了約100兆兆字節的數據信息,可以通過30太字節的本地服務器與云端儲存連接的聯網儲存設備獲取。Korenberg說,研究人員可以用縮小尺寸的數據集和一臺性能良好的筆記本電腦解決一些問題。但操作大規模的三維共焦數據集需要特別的工作站,即便如此傳遞每個平鋪的圖片也很緩慢。
然而,這項尚待發表的研究“有可能成為連接這一領域最重要的進展”。紐約市西奈山醫院神經解剖學家Patrick Hof說,他曾與Korenberg合作過。例如,Korenberg說,這些數據可以幫助科學家將在特定神經紊亂(如精神分裂癥和自閉癥)中看上去很重要的基因聯系起來,從而了解確切的大腦線路異常。
文化轉變
隨著科學家將可能的范圍向前推動,他們在建立一個計算通道以應對日益加大的工作量,此外還在建立新的工具共享和可視化最終生成的數據。但緩解神經科學家的數據問題,需要的不只是工具研發,還需要文化轉變。很難讓人們“放開他們的數據”,加州斯坦福大學心理學家Russell Poldrack說,他用神經成像研究學習和記憶。它可能會成為“一代人的事情”,他說,千禧一代人“比我們這一代人更喜歡共享編碼和數據”。Poldrack擔心,一流科學家可能會因為科學“與他們認為其應該具有的價值不匹配”而沮喪,并離開這個領域。
但態度在逐漸轉變,首先是那些針對軟件的,其次是數據。傳統上,神經成像實驗室會花費大量時間下載和裝載同樣的β測試軟件?!盀楦鞣N軟件失靈和計算瓶頸開路,編寫大量累贅的編碼以及進行他們自己的數據管理解決方案,以處理同樣的問題”。加州大學戴維斯分校神經科學博士生David Grayson說。更糟糕的是,很多非研究性任務被委托給學生、博士后和年輕科學家。
傳統的學術模式對此沒有幫助。研究人員通常會設置假設,并在其團隊內獨立地考慮自己的想法。在這樣的環境中,研究并未把人帶到一起,而是將他們分散開來,華盛頓西雅圖艾倫腦科學研究所的Hongkui Zeng說?!澳阈枰屪约翰煌?。需要在該領域建立自己的身份,你需要做一些與他人不同的事情?!?
在談到大腦研究時,“完成”是個移動性的目標。對于神經科學工具包來說也是如此。在神經科學學會年會的講話中,Chiang感嘆繪制一只果蠅大腦的一半圖譜居然花費了10年。他們與中國臺灣的物理學家合作,正開始利用一種叫作同步加速器X射線斷層掃描的技術大幅提高數據認知?!八鼉H需要不到10分鐘就繪制一只果蠅的大腦圖像,其中包含數千個高爾基染色單個神經元?!盋hiang說,他的團隊正在小鼠和豬身上嘗試該方法。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25