
大數據公司挖掘數據價值的49個典型案例(二)
下篇 數據關聯、數據廢氣和黑暗數據
大數據主要不作因果判斷,主要適用于關聯分析。很多關聯分析并不需要復雜的模型,只需要具有大數據的意識。
很多機構都有數據廢氣,數據不是用完就是被舍棄,它的再利用價值也許你現在不清楚,但在未來的某一刻,它會迸發出來,可以化廢為寶。
黑暗數據就是那些針對單一目標而收集的數據,通常用過之后就被歸檔閑置,其真正價值未能被充分挖掘。如果黑暗數據用在恰當的地方,也能公司的事業變得光明。
35 數據關聯分析
某公司團隊曾經使用來自手機的位置數據,來推測美國圣誕節購物季開始那一天有多少人在梅西百貨公司的停車場停車,進而可以預測其當天的銷售額,這遠早于梅西百貨自己統計出的銷售記錄。無論是華爾街的分析師或者傳統產業的高管,都會因這種敏銳的洞察力獲得極大的競爭優勢。
對于稅務部門來說,稅務欺騙正在日益的被關注,這時大數據可以用于增加政府識別詐騙的流程。在隱私允許的地方,政府部門可以綜合各個方面的數據比如車輛的登記,海外旅游的數據來發現個人的花費模式,使稅務貢獻不被疊加。同時一個可疑的問題出現了,這并沒有直接的證據指向詐騙,這些結論并不能用來去控告個人。但是他可以幫助政府部門去明確他們的審計和其他的審核以及一些流程。
36 數據廢氣
物流公司的數據原來只服務于運營需要,但一經再利用,物流公司就華麗轉身為金融公司,數據用以評估客戶的信用,提供無抵押貸款,或者拿運送途中的貨品作為抵押提供貸款;物流公司甚至可以轉變為金融信息服務公司來判斷各個細分經濟領域的運行和走勢。
有公司已經在大數據中有接近“上帝俯視”的感覺,美國洛杉磯的一家企業宣稱,他們將全球夜景的歷史數據建立模型,在過濾掉波動之后,做出了投資房地產和消費的研究報告。麥當勞則通過外送服務,在售賣漢堡的同時獲得了用戶的精準地址,這些地址數據匯集之后,就變成了一份絕妙的房地產業的內部數據。
37 黑暗數據
在特定情況下,黑暗數據可以用作其他用途。Infinity Property & Casualty公司用累積的理賠師報告來分析欺詐案例,通過算法挽回了1200萬美元的代位追償金額。一家電氣銷售公司,通過積累10年ERP銷售數據分析,按照電氣設備的生命周期,給5年前的老客戶逐一拜訪,獲得了1000萬元以上電氣設備維修訂單,順利地進入MRO市場。
38 客戶流失分析
美國運通以前只能實現事后諸葛亮式的報告和滯后的預測,傳統的BI已經無法滿足其業務發展的需要。于是,AmEx開始構建真正能夠預測客戶忠誠度的模型,基于歷史交易數據,用115個變量來進行分析預測。該公司表示,對于澳大利亞將于之后4個月中流失的客戶,已經能夠識別出其中的24%。這樣的客戶流失分析,當然可以用于挽留客戶。酒店業可以為消費者定制相應的獨特的個性房間,甚至可以在墻紙上放上消費者的微博的旅游心情等等。旅游業可以根據大數據為消費者提供其可能會喜好的本地特色產品、活動、小而美的小眾景點等等來挽回游客的心。
39 快餐業的視頻分析
快餐業的公司可以通過視頻分析等候隊列的長度,然后自動變化電子菜單顯示的內容。如果隊列較長,則顯示可以快速供給的食物;如果隊列較短,則顯示那些利潤較高但準備時間相對長的食品。
40 大數據競選
2012年,參與競選的奧巴馬團隊確定了三個最根本的目標:讓更多的人掏更多的錢,讓更多的選民投票給奧巴馬,讓更多的人參與進來!這需要“微觀”層面的認知:每個選民最有可能被什么因素說服?每個選民在什么情況下最有可能掏腰包?什么樣的廣告投放渠道能夠最高效獲取目標選民?如競選總指揮吉姆·梅西納所說,在整個競選活中,沒有數據做支撐的假設不能存在。
為了籌到10億美元的競選款,奧巴馬的數據挖掘團隊在過去兩年搜集、存儲和分析了大量數據。他們注意到,影星喬治·克魯尼對美國西海岸40歲至49歲的女性具有非常大的吸引力:她們無疑是最有可能為了在好萊塢與克魯尼和奧巴馬共進晚餐而不惜自掏腰包的一個群體??唆斈嵩谧约液勒e辦的籌款宴會上,為奧巴馬籌集到數百萬美元的競選資金。此后,當奧巴馬團隊決定在東海岸物色一位對于這個女性群體具有相同號召力的影星時,數據團隊發現莎拉·杰西卡·帕克的粉絲們也同樣喜歡競賽、小型宴會和名人?!翱唆斈嵝北怀晒Φ貜椭频搅藮|海岸。
在整個的競選中,奧巴馬團隊的廣告費用花了不到3億美元,而羅姆尼團隊則花了近4億美元卻落敗,其中一個重要的原因在于,奧巴馬的數據團隊對于廣告購買的決策,是經過縝密的數據分析之后才制定的。一項民調顯示,80%的美國選民認為奧巴馬比羅姆尼讓他們感覺更加重視自己。結果是,奧巴馬團隊籌得的第一個1億美元中,98%來自于小于250美元的小額捐款,而羅姆尼團隊在籌得相同數額捐款的情況下,這一比例僅為31%。
41 監控非法改建
“私搭亂建”在哪個國家都是一件鬧心的事,而且容易引起火災。非法在屋內打隔斷的建筑物著火的可能性比其他建筑物高很多。紐約市每年接到2.5萬宗有關房屋住得過于擁擠的投訴,但市里只有200名處理投訴的巡視員。市長辦公室一個分析專家小組覺得大數據可以幫助解決這一需求與資源的落差。該小組建立了一個市內全部90萬座建筑物的數據庫,并在其中加入市里19個部門所收集到的數據:欠稅扣押記錄、水電使用異常、繳費拖欠、服務切斷、救護車使用、當地犯罪率、鼠患投訴等等。接下來,他們將這一數據庫與過去5年中按嚴重程度排列的建筑物著火記錄進行比較,希望找出相關性。果然,建筑物類型和建造年份是與火災相關的因素。不過,一個沒怎么預料到的結果是,獲得外磚墻施工許可的建筑物與較低的嚴重火災發生率之間存在相關性。
利用所有這些數據,該小組建立了一個可以幫助他們確定哪些住房擁擠投訴需要緊急處理的系統。他們所記錄的建筑物的各種特征數據都不是導致火災的原因,但這些數據與火災隱患的增加或降低存在相關性。這種知識被證明是極具價值的:過去房屋巡視員出現場時簽發房屋騰空令的比例只有13%,在采用新辦法之后,這個比例上升到了70%。
42 榨菜指數
負責起草《全國促進城鎮化健康發展規劃(2011-2020年)》(以下簡稱“城鎮化規劃”)的國家發改委規劃司官員需要精確知道人口的流動,怎么統計出這些流動人口成為難題。
榨菜,屬于低質易耗品,收入增長對于榨菜的消費幾乎沒有影響。一般情況下,城市常住人口對于方便面和榨菜等方便食品的消費量,基本上是恒定的。銷量的變化,主要由流動人口造成。
據國家發改委官員的說法,涪陵榨菜這幾年在全國各地區銷售份額變化,能夠反映人口流動趨勢,一個被稱為“榨菜指數”的宏觀經濟指標就誕生了。國家發改委規劃司官員發現,涪陵榨菜在華南地區銷售份額由2007年的49%、2008年的48%、2009年的47.58%、2010年的38.50%下滑到2011年的29.99%。這個數據表明,華南地區人口流出速度非???。他們依據“榨菜指標”,將全國分為人口流入區和人口流出區兩部分,針對兩個區的不同人口結構,在政策制定上將會有所不同。
43 天氣賬單
常言道,“天有不測之風云”,遇到過出門旅游、重要戶外路演、舉辦婚禮等重要時刻卻被糟糕的天氣弄壞心情甚至造成經濟損失的情況嗎?全球第一家氣象保險公司“天氣賬單”能為用戶提供各類氣候擔保??蛻舻卿洝疤鞖赓~單”公司網站,然后給出在某個特定時間段里不希望遇到的溫度或雨量范圍?!疤鞖赓~單”網站會在100毫秒內查詢出客戶指定地區的天氣預報,以及美國國家氣象局記載的該地區以往30年的天氣數據。通過計算分析天氣數據,網站會以承保人的身份給出保單的價格。這項服務不僅個人用戶需要,一些公司,比如旅行社也很樂意參與。
一家全球性飲料企業將外部合作伙伴的每日天氣預報信息集成,錄入其需求和存貨規劃流程。通過分析特定日子的溫度、降水和日照時間等3個數據點,該公司減少了在歐洲一個關鍵市場的存貨量,同時使預測準確度提高了大約5%。
44 歷史情景再現
微軟和以色列理工學院的研究人員已開發出一款軟件,能根據過去20年《紐約時報》的文章以及其他在線數據預測傳染病或者其他社會問題可能會于何時何地爆發。
在利用歷史數據進行測試時,該系統的表現十分驚人。例如,根據2006年對安哥拉干旱的報道,該系統預測安哥拉很可能發生霍亂。這是由于,通過此前發生的多起事件,該系統了解到在干旱出現的幾年后霍亂爆發的可能性將上升。此外,該系統根據對2007年初非洲大型颶風的報道,再次對安哥拉發生霍亂做出預警。而在不到一周之后,報道顯示安哥拉確實發生了霍亂。在其他測試,例如對疾病、暴力事件及傷亡人數的預測中,該系統的準確率達到70%至90%。
該系統的信息來自過去22年中《紐約時報》的報道存檔,具體時間為1986年至2007年。不過,該系統也利用了網絡上的其他一些數據,了解什么樣的事件會帶來特定的社會問題。這些信息來源提供了不存在于新聞文章但卻有價值的內容,有助于確定不同事件之間的因果關系或前后關系。例如,該系統能夠推斷盧旺達和安哥拉城市之間所發生事件的關系,因為這兩個國家都位于非洲,有著類似的GDP,其他一些因素也很相似。根據這種方法,該系統認為,在預測霍亂爆發方面,應當考慮國家或城市的位置,國土面積有多少是水域,人口密度和GDP是多少,以及近幾年是否發生過干旱。
負責此項研發工作的Horvitz表示,近幾十年來,世界的許多方面都發生了改變,不過人類的本性和環境的許多方面仍然未變,因此軟件可以從以往的數據中了解事情發生的模式,從而預測未來會發生什么。他表示:“對于回溯更久之前的數據,我個人很感興趣?!?
此類預測工具的市場正在形成。例如,一家名為RecordedFuture的創業公司根據網上的前瞻性報道和其他信息來源預測未來事件,該公司的客戶包括政府情報部門。該公司CEOChristopherAhlberg表示,利用“硬數據”來進行預測是可行的,但從原型系統到商用產品還有很長的路要走。
45 Nike+傳感鞋
耐克憑借一種名為Nike+的新產品變身為大數據營銷的創新公司。所謂Nike+,是一種以“Nike跑鞋或腕帶+傳感器”的產品,只要運動者穿著Nike+的跑鞋運動,iPod就可以存儲并顯示運動日期,時間、距離、熱量消耗值等數據。用戶上傳數據到耐克社區,就能和同好分享討論。耐克和Facebook達成協議,用戶上傳的跑步狀態會實時更新到賬戶里,朋友可以評論并點擊一個“鼓掌”按鈕——神奇的是,這樣你在跑步的時候便能夠在音樂中聽到朋友們的鼓掌聲。隨著跑步者不斷上傳自己的跑步路線,耐克由此掌握了主要城市里最佳跑步路線的數據庫。有了Nike+,耐克組織的城市跑步活動效果更好。參賽者在規定時間內將自己的跑步數據上傳,看哪個城市累積的距離長。憑借運動者上傳的數據,耐克公司已經成功建立了全球最大的運動網上社區,超過500萬活躍的用戶,每天不停地上傳數據,耐克借此與消費者建立前所未有的牢固關系。海量的數據對于耐克了解用戶習慣、改進產品、精準投放和精準營銷又起到了不可替代的作用。
46 沃爾沃的工業互聯網
在沃爾沃集團,通過在卡車產品中安裝傳感器和嵌入式CPU,從剎車到中央門鎖系統等形形色色的車輛使用信息,正源源不斷地傳輸到沃爾沃集團總部?!皩@些數據進行分析,不僅可以幫助我們制造更好的汽車,還可以幫助客戶們獲取更好體驗?!蔽譅栁旨瘓FCIORichStrader說。這些數據正在被用來優化生產流程,以提升客戶體驗和提升安全性。將來自不同客戶的使用數據進行分析,可以讓產品部門提早發現產品潛在的問題,并在這些問題發生之前提前向客戶預警?!爱a品設計方面的缺陷,此前可能需要有50萬臺銷量的時候才能暴露出來,而現在只需要1000臺,我們就能發現潛在的缺陷?!?
47 McKesson的動態供應鏈
在美國最大的醫藥貿易商McKesson公司,對大數據的應用也已經遠遠領先于大多數企業,將先進的分析能力融合到每天處理200萬個訂單的供應鏈業務中,并且監督超過80億美元的存貨。對于在途存貨的管理,McKesson開發了一種供應鏈模型,它根據產品線、運輸費用甚至碳排放量而提供了極為準確的維護成本視圖。據公司流程改造副總裁RobertGooby說,這些詳細信息使公司能夠更加真實地了解任意時間點的運營情況。McKesson利用先進分析技術的另一個領域是對配送中心內的物理存貨配置進行模擬和自動化處理。評估政策和供應鏈變化的能力幫助公司增強了對客戶的響應能力,同時減少了流動資金??傮w來講,McKesson的供應鏈轉型使公司節省了超過1億美元的流動資金。
48 紙牌屋與電影業
《紙牌屋》最大的特點在于,與以往電視劇的制作流程不同,這是一部“網絡劇”。簡而言之,不僅傳播渠道是互聯網觀看,這部劇從誕生之初就是一部根據“大數據”,即互聯網觀眾欣賞口味來設計的產品。Netflix成功之處在于其強大的推薦系統Cinematch,該系統基于用戶視頻點播的基礎數據如評分、播放、快進、時間、地點、終端等,儲存在數據庫后通過數據分析,計算出用戶可能喜愛的影片,并為他提供定制化的推薦。為此他們開設了年Netflix大獎(點擊查看獲獎算法),用百萬美元懸賞,獎勵能夠將其電影推薦算法準確性提高至少10%的人。
未來的電影制作成本將大幅降低,一千粉絲足以使電影成功。還是像《技術元素》里說:“目光聚集的地方,金錢必將追隨?!?
49 點評與餐飲業
美國很多州政府在與餐飲點評網lep展開合作,監督餐飲行業的衛生情況,效果非常好。人們不再像以前那樣從窗口去看餐館里的情況,而是從手機APP里的評論!在中國的本地化O2O點評比如大眾點評、番茄點等等,消費者可以對任何商家進行評判,同時商家也可以通過這些評判來提升自己的服務能力,在環節上進行更大力度的效率優化。
未來的餐飲行業將會由互聯網和社會化媒體上所產生和承載的數據徹底帶動起來,會有越來越多的人加入點評中,餐館優勝劣汰的速度將會大幅加快。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25