
大數據能力需要有漫長積蓄過程,絕非想用就能用
2016年可謂是中國的“大數據之年”,不僅國家推行“大數據戰略”,倡導發展互聯網新經濟,各行各業也都在談論大數據的前景。大數據一時成為了各大企業都爭相推擁的熱詞。
單純從字面理解,大數據描述的是一個巨量數據的概念。而在實際的應用上,“大數據”更類似“光年”一樣,當光指引到時間中,就成為了描述距離的單位,而把海量的有效數據進行有針對性的整合分析時,他就可以對用戶行為進行描述,為我們的生活提供各種各樣的決策和指引。
隨著國家大數據戰略的推行,“數聚”、“精準”等概念紛紛涌現。然而,在各大品牌層出不窮的新玩法下,“大數據”概念被濫用的情況越來越嚴重。筆者之見,“大數據”能力需要有漫長積蓄過程,絕非“想用就能用”。
在品牌宣傳上,大數據的概念常常被有意無意地偷換,主要表現在,“有數據”并不等于大數據。大數據存在5V的特征,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)、Veracity(真實性)。除了存有數據的基本條件外,還需滿足以上五個維度。因此,大數據是一個非常嚴格的概念。
一個企業的大數據實力如何,主要基于其擁有的數據資產的數量和質量,同時也取決于數據的維度,及對海量數據的開發運用能力(內部算法)。因此不少巨頭在不斷擴張自己數據庫容量的同時,也在通過并購整合,拓寬其自身數據資產的覆蓋度和完整度,同時提升自己對數據的運算能力。
以阿里巴巴為例,阿里擁有龐大的用戶群體以及十多年的用戶數據積累。其大數據資產,無論從數量還是質量上,在中國處于絕對領先地位。但究其根本,其主要數據維度主要集中在電商領域。隨著阿里巴巴不斷的跨領域擴張,其大數據維度也隨之豐富起來。UC瀏覽器、高德地圖、優酷土豆、新浪微博等多個領域產品的加入,阿里大數據基于移動信息領域的矩陣逐漸擴展。截至目前,據不完全統計,阿里大數據矩陣至少包含了電商、閱讀、社交、搜索、地圖、視頻、應用、游戲等維度的用戶行為數據,從覆蓋率和完整度上,應該是目前BAT三大巨頭中最具優勢的。
然而,企業收集到“多維度”的數據只是第一步,如何運用、創造價值是接下來面臨的考驗。在數據價值的“落地”上,各個企業也正在積極探索。
移動互聯時代深受“信息過載”的詬病,“如何實現信息與人更為精準的連接”是整個行業未來探索的方向。為了能夠給用戶提供最佳的內容獲取決策,除了需要對數據寬度與厚度進行累積,還需要讓數據變得更加“聰明”。通俗來講,企業需要能夠對用戶產生的每個數據進行統計、分析與開發,并以此幫助用戶做出決策。
以UC為例,從阿里大數據中的高德地圖POI數據可以知道用戶當下處于的特定場景,根據對“時間+地點”的描述分發用戶當下最需要的資訊;此外,在淘寶、神馬搜索、優酷等多維數據的互通下,可以知道用戶對不同類型資訊的需求。此外,UC的算法還能實現根據不同領域按權重繪畫屬于該用戶的用戶畫像,在基本的人群聚類下再繼續進行需求分層。
以上用戶數據的分析及處理,將形成個人定制化數據庫,之后,再根據算法進行精準推送,目前常用的推薦算法有三種:
第一代基于“協同過濾”,即收集大量的用戶瀏覽記錄,通過相似行為進行關聯推薦。由于算法簡介,邏輯清晰,可行性強,這種算法被大多數企業采用,例如今日頭條、天天快報等都是采用的這種算法,但其也存在缺陷。由于獲取數據的手段有限,數據不能夠真實的反應出用戶對信息的需求,很容易讓用戶深陷在自己的“興趣愛好”當中;
第二代基于“搜索”,在分析了用戶的核心興趣點之后,通過隱式搜索的方式,給用戶結果,這是在搜索引擎全面普及后出現的數據算法。但是與第一代算法類似的是,不同的人搜索相同的信息有不同的目的,而不同的時間地點搜同樣的信息也有不同的目的,用同樣的標準衡量用戶行為,容易產生誤判;好處是,對第一代算法所產生的“信息孤島”效應有了較大的減弱,較容易形成興趣圈群。在這方面做得比較好的是一點資訊。
第三代基于“社群+場景”,從“人”的角度,切入到具體的社群,實現“人以群分”;從內容的角度,切入到具體場景,這也是目前算法的發展趨勢,比較典型的是以阿里大數據矩陣為依托的UC頭條。
不過,就目前而言,實現“社群+場景”精準分發還處于一個比較理想的階段,體現在“社群+場景”有一系列苛刻的要求,基礎要滿足的就是精準的用戶畫像繪制。眼下有此能力的恐怕也只有BAT三家。
當然,一個行業的成功除了能夠給用戶帶來改變,自身還應具備優秀的商業化能力,以實現行業的可持續發展。Facebook、Twitter等企業對大數據在信息流里的商業模式早有示范。其中,Facebook移動廣告營收公司總營收的82%(2016年Q1財報),是基于大數據的精準定向廣告流為收入帶來快速增長。而這種模式能夠適用并持續增長,其主要原因是B端與C端的互利,B端的廣告在更為精準、高效推送到用戶外,C端獲取了精準的信息,不會影響用戶體驗。
如以上所列舉的“在高德地圖里形成固定的商圈,在UC頭條相應商圈的資訊就會推送給你”,這樣一次信息與人的精準連接,對用戶來說,帶來是獲取價值信息時間成本的縮??;對內容提供者來說,是潛在受眾價值的挖掘;而對廣告主而言,是高效、精準傳遞受眾的價值實現。在這里面,滿足的是消費測、供給側、商業測三方需求。
大數據時代不止于“大”,企業對數據資產的厚度與深度的積累成為了決定大數據成敗的關鍵,在大數據被日益濫用的今天,筆者更希望在時代大趨勢下,大數據能真正落地,至少不止一個阿里巴巴。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25