
大數據是很火,但關鍵要“活”起來_數據分析師
鑒于大數據在IT圈內近乎拽上天的地位,筆者最近一直在閱讀學習《大數據時代》,據說這本書能帶來生活、工作與思維的大變革?!洞髷祿r代》有個核心觀點是大數據依賴的是相關關系,而不是因果關系。它告訴你的是會發生什么,而不是為什么發生。而筆者也想借維克托之口通過本文告訴外界,我們終將會進入一場轟轟烈烈的大數據時代。至于為什么會發生,筆者也想補充一點說,在這個講究“連接”的世界,拋卻那些技術盲,沒有人會逃出數字化世界的魔咒。
本文中,筆者想將這個熱火的三個字帶引到移動大健康領域,探討大數據對這個符合人性“長命百歲”領域的可借鑒與啟迪意義。
核心:大數據的最大本事在于預測
很多人都在聊大數據,其實根本不了解為何身邊人聊它。難道你認為,跟著奧巴馬聊大數據的國家戰略只是很潮么?筆者覺得,大數據的最大本事在于能在問題發生前預測性地給出答案。維克托·邁爾·舍恩伯格用“黑匣子”表述大數據意義的理論非常形象——問題從一個端口進去,中間是一個集合成千上萬數據的“黑匣子”,經過一番計算機工程后,答案從另一個端口出去。
所以,思忖一下大數據對于這個信息化時代的價值便是——它是將充斥世界的海量數據采用數學算法予以“提純”、鉆取并隨后或抽出規律,或處理成有用信息。
運用到大健康上,怎么看?拿咱們極客圈精神領袖喬幫主舉例好了。幫主自罹癌至離世長達八年之久,這幾乎創造了胰腺癌歷史上的奇跡。據悉,喬布斯在抗癌斗爭中支付大量費用對自身DNA和腫瘤DNA進行排序,他得到了包括整個基因密碼的數據文檔。這樣的話,醫生們能基于喬的特定基因組成按所需效果用藥,如果癌癥病變導致藥物失效,醫生可以及時更換另一種藥,喬布斯靠這種獲得所有數據而非傳統樣本的方式將生命延長了好幾年。
筆者認為在探討健康大數據的話題時,首先要明確一個時間節點——患病。在這個時間節點之前,其實是有一系列原因可以表征疾病不是偶然的。比如說基因、環境、生活習慣。在時間點之后,你需要進入常規的醫療診斷流程:1、患者提供各類體征信息;2、醫生獲得體征信息,進行診斷,下處方或提供治療方案;3、藥房開藥給患者或者在醫院進行其它相關治療。
軟硬結合的健康數據采集器應景而生,比如智能血壓儀、血糖儀?;疾∏?,人類用肉眼看不到的隱患,會被機器用計算機工程“瞄準”,帶你用無限接近精準的相似度一步步逼近真相。這是福音,人類不是得了病之后再去采集數據,而是之前就能采集你所有的日常健康數據,這或將該死的病患扼殺在搖籃中,或也能將醫生從醫院機構桎梏中徹底解放。
歧途:單純地量化與呈現數據,然后就沒有然后了
可是呢?如今國內的那群天天叫嚷著大數據的采集器們都在做什么??以筆者熟稔的健康類可穿戴設備為例。加速度傳感器、藍牙模塊,振動馬達、三軸傳感器……采集數據的硬件裝備幾乎都是極好的,那么然后呢?
很多計步器們或在做這件事——“恭喜您,今天又跑了多少萬步,消耗了多少大卡”,這是數據的告知;很多血壓儀們或在做另一件事——“血壓階段曲線顯示,您今日的血壓達到峰值,小心龍/鳳體欠安喲”,這至多還是在數據告知的基礎上添加了數據呈現……然后,大部分可穿戴們就沒有然后了。
而一個完整的數據鉆取挖掘過程是這樣的:基于用戶數據的大數據倉庫→真正的數據中心核心數據資產→基于用戶數據行為分析的數據再利用→讓數據價值得到升華,按照這樣的流程,很多可穿戴系們往往只做到了步驟一、二。
比如,一臺心臟監控儀的心電圖每秒鐘就能產生1000個讀數。但是只有部分的數據是被保存使用的,大部分都束之高閣了。即使這些數據都能在一定程度上表現出病人的情況。當與其他病人的數據一起考慮的時候,它們就能顯現出哪些治療方法是有效的。
好可惜啊,很多機器在剛觸及數據大金礦的表層時就屁顛屁顛地拋開鏟子躺在金礦上呼呼睡懶覺了。
方案:打通 “孤島”之困,讓數據流淌
移動健康的標配模式便是“硬+軟+云”,可千萬別忽視這最后的云儲存,循序漸進地上傳至云端的龐雜數據才是眾兵家廝殺的最終大奶酪。此前,筆者曾在《首輪可穿戴潮:不是賣功能,而是賣可能》一文中已闡明了類似的觀點。你瞧,IT大佬百度為何迫不及待地開通Dulife平臺,旗下又收納了一匹匹健康類可穿戴黑馬PICOOC、MUMU等科技公司產品。原因何在?了解BAT三巨頭的人都清楚:馬云擅布局、馬化騰愛產品、李彥宏懂技術。技術控的李彥宏一直堅信——互聯網倘若想更好地發展,必須靠云。云端數據是“軟”+“硬”最終的果實和結晶。
如果采集器們對辛苦采集的數據不注重利用與反饋,那些漂至云端的大數據終究是不接地氣的、終究是冷冰冰的一組數字堆砌物而已。
臨末還想闡述的一個重點就是前文提及到的“黑匣子”,這里隱藏了外行人難以得知的大數據算法——即機器是如何分析和解讀采集的數據的。
比如,站在一臺智能秤上,它會根據你人體的BMI、體脂率、肌肉量等健康數據經過“黑匣子”處理后,打分,測出你屬于“九重體型”中的哪一種。并且,它還會一對一地給出相應的運動和飲食方案。目前PICOOC Latin正在進行這個步驟。
數字是靈動的,數據終歸也是要雙向流動的。上一步“黑匣子”輸出的答案,或變成了下一步要輸入另一個“黑匣子”的問題。比如Latin智能秤測量后給出運動方案后,下一步由其智能手環來監督貫徹下去,同時將運動結果再次反饋上傳,形成完整的閉環。這充分打通了整個數據產業鏈,讓數據不再只是困于數據庫“孤島”中。
如果讓數據流淌地更兇猛些,或許健康大數據的未來就像某醫藥公司高層所講,體檢機構、藥廠、保險公司以及醫療儀器生產廠家之間建立一個信息匯總以及數據分析平臺,將各個領域的信息孤島連接起來,給消費者和健康行業帶來完全顛覆性的未來。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24