
大數據和預測分析:數據是否越多越好_數據分析師
Michael Berry對大數據的浮夸之詞頗不以為然。身為旅游網站TripAdvisor的分析總監,他認為更多的數據未必帶來正面的業務影響,比如大數據和預測分析的例子。
“很多預測分析的應用其實并不需要所有的數據?!盉erry在Predictive Analytics World做主題演講時說到。因此,對于數據科學家來說,重要的不是想著怎樣分析所有的數據,而是看通過哪些數據可以得出真正有價值的結果。那么到底該怎么辦呢?“對于這個問題,沒有直截了當的答案?!盉erry說。
但是,通過每次增加一些數據的方式來測試預測模型的有效性,可以最終確定多少數據是足夠的。比如,當Berry想知道旅游代理商對某家酒店或特定客戶的標準價位時,采用計算平均值的方法:選取兩個取均值,然后是三個…最終在1萬個時均值穩定下來。如果取2萬個,均值肯定會發生變化,但這已經沒有必要了。
“這就是關鍵所在。如果你有足夠的數據,那么單純數量上的增加就不會對結果造成很大的影響?!盉erry說。
如果過多的數據不會帶來本質的不同,那么什么才是關鍵所在呢?“很多方面?!盉erry表示。數據的純凈度、樣本的合理全面以及專注于數據質量和挖掘的人才等,都會導致結果的不同。
這些都是預測分析中的關鍵點,比如指出哪些變量可以使模型更健壯,或者結合哪些來源的數據可以發現新的模式。
“比如風寒效應(wind chill factor)?!盉erry說。結合了實際的溫度和風速,才能切實分析出人體對于外界環境的感受。
Berry并非唯一對當前大數據和預測分析境況有微詞的人。咨詢公司Rexer Analytics的創始人Karl Rexer認為數據科學家們多少都有點迷茫失措。在其2013年對數據挖掘從業者的調查看出,受訪者反饋表明數據規模變得越來越大。但是,當被問及有多少數據被用于真正的分析時,答案和2007年的調查結果并無二致。
這并非證明所謂大數據是一場鬧劇?!皩τ趥鹘y的預測分析建?;?a href='/map/shujuwajue/' style='color:#000;font-size:inherit;'>數據挖掘項目來說,總體的樣本規模并未出現增長?!盧exer說。
將分析術語轉化為業務端所能理解的語言,是一種巨大的挑戰。工資、人力和服務外包提供商Paychex是這樣打破藩籬的:根據業務端的建議來進行描述。
“當我們構建模型時,會舉行一個命名比賽?!盤aychex的建模分析師Tom Kern在本次Predictive Analytics World上表示。Kern的團隊會向用戶發送電子郵件,其中對模型進行了簡短的描述,并且提供一些詞匯供其使用。用戶根據實際工作,創造縮寫詞匯,比如SAM表示銷售預期模型(sales anticipation model),TIM表示領域識別和映射模型(territory identification and mapping model)。
如果業務端用戶的建議最終被采用,其就會收到一個禮物卡。由此,就可以根據諸如銷售人員之類的用戶的期望,從而思考預測模型該做些甚么。
作為全球最大的零售商之一,寶潔公司宣布推出一款新型的低價汰漬洗衣劑,以此來吸引中端客戶。該如何評價這個決策呢?
Shel Smith是市場分析公司Twenty-Ten Inc.的創始人,他的看法是:“如果你發布類似的產品,不僅僅是在獲取新的客戶,其實還在鼓勵已有的客戶替換現有的高價產品?!?/span>
鑒于當前經濟形勢的影響,這種擔憂并非沒有道理。但是,Smith對寶潔的策略持有信心。他認為,寶潔的策略是基于預測模型、海量數據和精準營銷來達成的,可以在獲取新客戶的同時不影響現有品牌的銷量。
“寶潔肯定有很多我們不知道的過人之處,但是在獲取新客戶方面并無什么神秘的?!盨mith表示。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25