
大數據的價值實現之旅_ 數據分析師
大數據開啟了人類數據管理史的一段嶄新旅程。人類想要測量、記錄和分析世界的渴望是驅動大數據技術不斷向前的動力。但如同此前的電子商務、云計算等創新構想一樣,大數據也不得不懷抱變革理想在現實中披荊斬棘。
我們該如何定義我們所身處的信息技術時代?是云計算、社交、移動,還是大數據?相信每位從業者和客戶都會有自己的認知與解讀。一千個人眼中就有一千個哈姆雷特,很多時候是一個放之四海皆準的道理,更何況我們正在經歷一段創新趨勢疊加、創新領域融合的獨特時期。而對于那些想要體會技術創新真正內涵的人士,有一個話題永遠不可回避,這就是技術創新到底會給其受眾帶來怎樣的真實價值?這種價值是否能夠在其被發掘后長期、持續地給予?
本文重點關注大數據技術這一重大技術創新趨勢在企業環境中價值實現的過程。在全民熱議的氛圍中,或許我們可以暫時遠離那些對大數據的定義、技術特征、未來走向的種種爭論,潛心聆聽喧囂中實地探索的腳步。我們希望與您共同探討大數據所能夠開辟的數據價值轉換與兌現路徑,從而為企業高效、合理利用快速增長的業務數據帶來啟發。也希望這些來自中國企業的真實應用案例能夠證明,大數據并不僅僅是一個催生布道師的舞臺,它正在真切地影響著我們的工作與生活。
腳踏實地的大數據
人類的想象力有多豐富,大數據的未來世界就會有多廣博。要讓海量數據資源變成寶貴的商業資產,企業的大數據技術實踐者們需要從現實中起步。
如今,大數據總會與變革作為聯動的詞匯出現。牛津大學網絡學院互聯網研究所治理與監管專業教授維克托?邁爾-舍恩伯格在其著作《大數據時代》一書中,將大數據定義為一次重大時代轉型的開啟者,稱其將會引發一場生活、工作與思維的大變革。
他認為,在大數據時代,人類處理數據的方法和思維模式將被徹底改變,它會呈現出一些前所未有的現象。比方說,人們將會分析更多的數據,而不再依賴于隨機采樣;人們將不再沉迷于對數據分析精確度的追求,轉而關注對趨勢的把握;人們不會再習慣性地追問事情的因果,而是尋找事物之間的相關關系。
無論這些數據處理的未來趨勢最終是否能夠成真,我們都可以從日常的工作和生活中窺探到一些變化的端倪。首先,企業的數據管理范疇正在不斷擴大,在線交易、Web日志、點擊流、傳感器信息、社交媒體數據等都被納入企業的業務數據集。另一方面,我們在生活中會遇到越來越多與數據分析相關的商業創意。例如,各個電子商務、視頻網站中花樣繁多的推薦系統,還有超市中零食與手電筒這樣不明所以、卻能帶來實際銷售增長的擺放組合。
大數據對企業究竟意味著什么?舍恩伯格在《大數據時代》一書中做出了這樣的描述:在大數據時代,數據的價值從它最基本的用途轉變為未來的潛在用途。這一轉變意義重大,它影響了企業評估其擁有的數據及訪問者的方式,促使甚至是迫使公司改變他們的商業模式,同時也改變了組織看待和使用數據的方式。
轉變并不會在一夜之間發生。從多來源的數據采集,到通過深度分析獲取洞察力,之間會是一段并不平坦的征程。毫無疑問,Hadoop等技術的日趨成熟,讓企業用戶可以更方便地、在更大的范圍內收集業務的相關數據,但同時真正的挑戰也會接踵而至。這就是如何高效地處理多來源的海量數據,并且為其找到適合的商業用途。
在過去的一個月里,我們實地探訪了三家正在實際部署大數據應用的企業。它們分別是京東(JD.com)、人人游戲和PPTV聚力。這三家互聯網企業正在用業界前沿的數據管理思維,展開大數據技術的早期實踐。同時,在它們身上也折射出全球互聯網企業利用大數據的實際趨勢。全球范圍內與之業務相類似的在線零售巨頭亞馬遜(Amazon.com)、社交游戲先鋒Zynga、全球最大的在線影片租賃服務商Netflix,同樣處在大數據商業應用的最前沿。相關信息:http://cda.pinggu.org/
另外,我們還特別加入了一個寓技術于體育競技的輕松案例。網球賽場上細致入微的數據統計和分析背后,正是大數據技術的鼎力支持。
遠觀不如近臨。大數據的價值實現之旅已經啟程,改變就在我們的身邊發生!
【導讀】
京東:PB級數據價值發現
擁有一億用戶、營業規模達數百億元的大型網絡零售企業京東(JD.com),在大數據應用領域實現了分布式架構與傳統BI工具的有機融合。
人人游戲:360°客戶視圖很重要
作為國內最大的網頁游戲和智能手機游戲的研發、運營和發行商之一,人人游戲的大數據價值發現從結構化數據集起步,逐步向非結構化數據集延伸。
PPTV聚力:看得見的大數據
在全球擁有超3億活躍用戶群體的網絡電視技術平臺提供商PPTV聚力,正在使用Hadoop、HBase、Hive、Storm等大數據技術打造個性化視頻推薦體驗,優化視頻播放體驗,實現在線廣告的精準投放。
大數據助威網球賽
從舉世矚目的四大滿貫,到已經躋身超級賽事行列的中國網球公開賽,新一代數據分析技術為球迷、球員和教練營造出隨身而行、洞察入微的高科技賽事體驗。
大數據時代企業怎么贏?
如果你的企業希望投身大數據時代,現階段最大的挑戰是為海量業務數據找到商業用途。
京東:PB級數據價值發現
擁有一億用戶、營業規模達數百億元的大型網絡零售企業京東(JD.com),在大數據應用領域實現了分布式架構與傳統BI工具的有機融合。
成立于2004年的京東商城(以下簡稱為京東)在2012年的交易金額突破600億元,相當于每秒就會產生2000元的交易額。在網絡零售市場深耕近十年之后,京東也正式邁入了PB級數據管理的新時代。對企業而言,PB級(1PB=1024TB)的數據管理算得上是衡量其數據規模和管理能力的一個重要標尺。目前,全球PB級數據管理俱樂部已經擁有Facebook、淘寶等重要成員,能夠躋身其中對京東而言是榮譽,也意味著挑戰。
京東副總裁 李曦
針對業務數據快速增長的情況,我們在2012年正式啟動了大數據平臺的搭建。這個自主開發的平臺基于分布式的技術,支持異構數據集市,同時也很好地利用了傳統BI的展現層技術。京東副總裁李曦說。目前,李曦正帶領著300人的技術團隊不斷地改進和完善京東從數據的獲取、平臺搭建、分析到應用的電商全流程業務數據管理工作。在2012年加入京東之前,李曦在美國硅谷工作多年,相繼服務于Siebel、甲骨文、谷歌等公司。
全流程大數據管理
在數據獲取方面,京東對各個購物頻道的交易數據、出入貨數據、逆向物流、用戶瀏覽日志等數據進行了全面的收集,同時也會從互聯網上抓取一些商品價格等業務相關信息。這些數據會被匯總和存儲在京東自主研發的大數據平臺之上。這個平臺支持不同的數據集市,例如分布式的數據集市,或者是甲骨文、MySQL、微軟SQL Server等關系型數據集市。平臺底層的數據存儲和離線批量數據運算由Hadoop實現,流式計算方面則采用的是開源實時數據處理框架Storm。
在承載匯總、存儲和查詢任務的大數據平臺之上是大數據分析層,這一層級主要涉及到一些建模的工作。例如針對用戶、商品、商家、促銷、反作弊、風險控制、精準營銷、運營優化的數據建模等。而這些數據模型最終的分析結果會在應用層得以展現。目前,京東已經能夠向內部和外部用戶提供BI(商業智能)服務。
其中,內部BI系統向從業務員到高級管理者的不同層級數據消費者提供各種門類的業務報表和歷史報表。而對于在京東售賣貨品的商家,京東數據羅盤則可以向他們展現店鋪流量、訂單數量、實時客流等關鍵業務指標,以及節日促銷指數、價格彈性、用戶喜好等分析功能。
談到傳統BI技術在大數據時代所扮演的角色,李曦表示,傳統BI手段在大數據應用環境中仍然有其價值,尤其是在呈現能力方面。他說:京東早期的數據分析建立在傳統BI之上,它所采用的中央集中式模式會在主機應用層面造成瓶頸,但傳統BI數據集中的理念并沒有過時,特別是其功能強大的呈現工具同樣適用于互聯網行業。目前,京東在大數據處理的展現層仍在使用甲骨文BIEE等傳統BI工具。
作為一家電商企業,京東的零售業務數據基本上是結構化的,而用戶訪問行為數據又是非結構化的,因此京東全流程數據匯總實際上是把結構化、半結構化和非結構化數據融合起來的過程。李曦說。他表示,這樣的數據組成結構實際影響了京東的大數據技術選擇。在數據倉庫層面,京東選擇了可擴展性強的分布式架構,而在應用層將相對發達的BI工具加以有效利用,實現了傳統與創新的融合。
大數據價值就在身邊
京東對大數據的利用不僅體現在內部管理和服務商家方面,如果你是一位顧客,只要訪問JD.com就能感受到大數據技術為您營造出的購物體驗。在這里,商品的搜索、推薦都是基于京東大數據平臺的實時匯總和結果推送。比方說搜索的排序就可以基于用戶的點擊習慣、用戶好評度等指標進行個性化定制。站內廣告和聯盟廣告的推送也可以根據相關的指標進行定向發布。
李曦表示,經過近三年的探索,大數據技術的價值正在京東業務運營的不同領域得到逐步的體現?;诖髷祿膮R總與分析,京東正在不斷完善包含電子郵件、短信、廣告等在內的精準營銷體系。站在業務運營優化角度,大數據技術能夠切實提升工作效率,為京東帶來直接的成本節約,并營造出更優的客戶體驗。
人人游戲:360°客戶視圖很重要
作為國內最大的網頁游戲和智能手機游戲的研發、運營和發行商之一,人人游戲的大數據價值發現從結構化數據集起步,逐步向非結構化數據集延伸。
在驕陽似火的七月,人人游戲的詞云應用火熱上線了。所謂詞云,就是先對人人游戲玩家的在線聊天記錄進行分詞,匯總之后對玩家行為進行分析和展現。目前,詞云已經在人人游戲的四款重點游戲中安家落戶,隨后有關玩家情緒的分析功能(通過關鍵詞對應玩家的情緒指數)也將上線。人人游戲運營平臺總監、數據中心負責人王坤表示,詞云應用的上線是人人游戲對大數據的利用從結構化數據集向非結構化數據集延展的重要一步。
人人游戲運營平臺總監、數據中心負責人 王坤
成立于2006年的人人游戲正在努力轉型為一家跨PC、平板電腦和手機終端的多平臺游戲研發、運營和發行商。從2007年推出第一款網頁游戲《貓游記》至今,人人游戲一步步向著這一目標靠近。在此過程中,人人游戲堅持在跨屏技術創新領域的研發投入,同時也積極利用大數據技術優化整體業務運營。
目前,王坤所領導的30余人的技術團隊正致力于從包括游戲日志、玩家行為數據、日常經營數據等在內的大數據集中尋找更好的數據利用和展現途經,同時他們還是大數據應用在企業內部營銷推廣的主力軍。我們要做每個員工的大數據分析,而不僅僅是數據中心的大數據分析。要做好游戲行業的大數據分析,構建360°的用戶視圖非常重要。她說。
從0°到360°
2009年,人人游戲對于業務數據的利用還停留在匯總游戲日志數據,僅用于簡單分析的階段。而在2013年,人人游戲已經基本上完成了基于IBM Cognos的BI系統整體建設。同時,其基于Greenplum社區版的分布式數據倉庫也已初具規模。對人人游戲而言,這些都是獲得360°用戶視圖的必要工作。而360°用戶視圖為其業務運營和決策所帶來的價值則是實實在在的。
BI系統主要是管理結構化的大數據,我們搭建了報表、行動和洞察三位一體的閉環系統,而不僅僅是一個報表系統。王坤說。新的BI系統將人人游戲的業務模型更加清晰地呈現出來,對游戲業務覆蓋用戶獲取、客戶存留、客戶付費的核心流程進行了優化,能夠更準確地為業務決策提供參考。在報表設計方面,王坤所帶領的技術團隊堅持遵循MECE(mutually-exclusive and collectively exhaustive,即相互排斥而又集體窮盡)的分析原則,確保每張報表都有清楚的存在意義。同時,BI系統上線后,企業在開發和運維方面的投入也有所降低。
從結構化大數據到非結構化大數據,數據分析范圍和深度的擴展,讓我們能夠更準確地把握玩家的行為和需求。王坤說。以詞云應用為例,炸金礦是人人游戲旗下亂世天下這款游戲中玩家參與度很高的一個玩法,玩家需要邀請一定數量的友人幫忙炸礦來贏取金幣。但在節假日期間,這款游戲的參與度通常都會下降。通過‘詞云’分析后發現,節假日期間‘求炸’成為玩家的聊天熱詞。我們也因此得知,并不是玩家不愛玩這個游戲,而是玩家在節假日邀請不到足夠數量的友人幫忙炸礦?;谶@樣的分析,我們可以在節假日期間對游戲規則進行調整。王坤說。
大數據的行業價值
每個行業都會有自己的大數據故事。在游戲行業,大數據分析可能不會直接帶來電商網站那樣真金白銀的收入,但其價值同樣會體現在精準營銷、客戶體驗優化等多個層面。王坤說。她指出,全面的大數據分析能夠有效提升玩家的留存率和轉化指標,并且為游戲產品的研發提供指引。而個性化的精準營銷同樣與大數據分析緊密相關,像是針對不同性別、不同年齡、不同地域人群的廣告精準投放,背后都要依靠基于360°用戶視圖的玩家特征分析。
王坤坦言,對人人游戲乃至整個游戲行業來說,大數據的管理與分析仍然是一件體力活。大數據團隊所面臨的最大挑戰是數據的整合,把多來源的結構化、半結構化和非結構化數據整合在一起,很多企業還沒有做到。另外,在企業內部和外部找到大數據的消費者,向他們營銷大數據技術,同樣是一件艱苦的工作。她說。
PPTV聚力:看得見的大數據
在全球擁有超3億活躍用戶群體的網絡電視技術平臺提供商PPTV聚力,正在使用Hadoop、HBase、Hive、Storm等大數據技術打造個性化視頻推薦體驗,優化視頻播放體驗,實現在線廣告的精準投放。
2012年,根據有關統計顯示,在線視頻已經超越社區交友和搜索服務躍升為互聯網第一大應用。PPTV聚力目前全平臺月度活躍用戶達3.4億,每天的活躍用戶超5000萬。這一在線視頻平臺目前每天會產生數10TB包含用戶行為數據、訪問體驗數據等在內的業務數據,針對在線視頻業務運營的實際需要,這些大數據每天會被采集、匯總到一個分布式的技術平臺上,再被應用到不同的業務領域之中。
PPTV聚力技術部總經理 金昀
目前,PPTV聚力已經建成的數百臺服務器規模的Hadoop集群是其大數據技術平臺的核心。在其上運行著Hive開源數據倉庫,基于Storm的分布式實時數據處理框架也已經開始部署。我們每天會從PPTV聚力數億個客戶端和分散在各地幾百個機房的服務器端采集日志數據,匯總到大數據平臺開展數據分析。PPTV聚力技術部總經理金昀說。
金昀所領導的技術部中目前有一個20余人的團隊專門負責開放式大數據平臺的開發和運維,而PPTV聚力全公司的數百名技術人員、產品人員、運營人員、數據分析師都可以從不同的業務角度利用這個開放平臺做業務數據分析以及各種數據密集性的計算任務。畢業于清華大學的金昀曾經參與永新視博(數字電視領域創業企業)的創立,留美后在美國微軟公司服務7年,回國后曾服務于阿里云,2011年加入PPTV聚力。
大數據優化觀看體驗
對PPTV聚力來說,大數據的來源主要包括用戶行為數據、工程技術數據,以及后端的業務運營數據。用戶行為數據主要來自從客戶端和服務器端采集的日志數據,例如哪個訪問者看了哪個視頻、拖動次數等;工程技術數據指的是不同地域用戶觀看視頻的啟動時間、卡頓次數、卡頓等待時長等;后端業務運營數據則包含廣告投放的相關數據信息等。
這些數據組成了PPTV聚力豐富的大數據來源,而大數據的分析結果可以直接應用于商業運營的調優。比如,我們購買了一部影視劇后,可以精確、實時地了解它在不同地區、不同時間段被觀看的次數,以此優化我們后端的運營策略。另外,通過從不同的客戶端所獲取的訪問連接數據,我們可以根據不同地區、不同時段的網絡連接狀況,用最低的成本向用戶交付流暢的觀看體驗。金昀說。
像美國同行Netflix一樣,PPTV聚力也在深入研究個性化的視頻推薦算法。PPTV聚力視頻頁面中的猜你喜歡欄目就是后臺大數據分析的成果。視頻網站的用戶通常不會提供詳細準確的注冊信息,而且用戶登錄率低,我們無法由此直接獲取用戶特征。因此,我們完全要從用戶的歷史訪問行為進行分析和判斷,對其習慣、喜好進行分類和標記,最終實現個性化的視頻推薦。他說。除了頁面內的相關視頻推薦,PPTV聚力還計劃基于大數據技術開發全界面的用戶訪問個性化定制系統。金昀強調,視頻與電商、社交等網絡服務不同,其客戶行為的分析與預測具有獨特的復雜性。用戶觀看行為的頭部效應明顯、長尾效應不足,視頻總數對比用戶數較低,品類多樣性低,而消費成本高,這些都對視頻自動推薦的效果產生了很大的挑戰。""""金昀說。同時他認為移動端視頻和OTT的高速發展將會是個性化視頻推薦的一個重大發展機遇,只有吃透大數據的企業才能真正跟上移動視頻發展的浪潮。
滿足廣告主的奇怪需求
一段廣告,要求讓某一地域的動作片用戶至少觀看三次,但又不能超過5次,否則就不付錢。還有的廣告有三個版本,用戶在觀看的時候不能重復,要遞進推送。這樣嚴苛的要求在傳統的電視廣告平臺上是不可能實現的。金昀說。不過,對于廣告主而言,這些無疑是一種精準營銷的合理設計,大數據分析為PPTV聚力所帶來的另一方面的商業價值也體現于此。
由于無法直接獲取準確用戶的特征信息,PPTV聚力的技術團隊通過對用戶歷史訪問行為的分析自動為其添加特征標簽,并對具體廣告的承接能力進行預測,以滿足不同廣告主的個性化需求。金昀表示,基于大數據技術平臺,PPTV聚力已經在廣告的定向投放、頻次控制等方面建立了相對成熟的策略和流程,并且注重在廣告精準投放的同時,確保用戶的觀看體驗。
大數據助威網球賽事
從舉世矚目的四大滿貫,到已經躋身超級賽事行列的中國網球公開賽,大數據分析技術為球迷、球員和教練營造出隨身而行、洞察入微的高科技賽事體驗。
金秋送爽的九月,北京的網球迷們將會在家門口迎來一項年度盛大網球賽事中國網球公開賽。這項已躋身超級賽事行列的賽事一直站在科技與體育結合的前沿。2006年,中網公開賽成為在美國以外首次使用鷹眼系統的巡回賽。而在2013年,關注此項賽事的網球迷們將可以通過網站和移動終端,享受到先進的賽事數據分析服務。
競賽數據實時分析
一談到網球這項運動,體育迷們總是會被其細致入微的各項技術統計所折服。運動員在場上的每一次揮拍、每一次擊打都可以轉化為數字,用于統計和分析。伴隨著數據種類和來源的擴充,網球賽事數據分析的顆粒度也在不斷細化。事實上,基于大數據技術的賽事數據實時獲取和分析服務已經在四大滿貫賽事中被廣泛采用。
2008年,溫布爾頓網球公開賽(以下簡稱為溫網)引入了IBM SlamTracker平臺。這是一個可以進行實時比分統計和分析的可視化平臺。它可以對每一場比賽的相關統計信息(包括比分、回合數、制勝分、發球速度、發球成功率、擊球類型、擊球數量)等多元數據內容進行采集、分析和分發。球迷、球員和教練均可以通過賽事官方網站,或者手機客戶端了解比賽數據(如附圖所示)。
附圖 溫布爾頓網球公開賽IBM SlamTracker數據分析界面
2012年,SlamTracker還推出了一項名為Keys to the Match的預測功能。通過對近八年來大滿貫賽事近萬場比賽、近4100萬個數據點進行了采集和分析,SlamTracker可以確定球員的制勝模式和風格。在每場比賽開始前,Keys to the Match都會分析雙方球員的歷史交鋒數據,為球員制定出比賽致勝的關鍵指標。比賽開始后,雙方球員的指標會被實時量化,并且與之前制定的關鍵指標進行對照,即時更新球員進展。
如今,SlamTracker早已成為四大滿貫賽事的一項常規數據服務。借助SlamTracker,您不再是一個普通的網球迷,而是一個擁有全面數據洞察視角的超級粉絲。即便未能親臨賽場觀戰,您依然可以收獲獨特而專業的觀賽體驗。而對球員和教練而言,SlamTracker數據分析服務能夠為其賽前針對性部署提供數據參考,也便于賽后分析勝負的原因。
社交輿情感知熱度
在移動互聯的時代,四大滿貫賽事已經不再僅僅是運動的盛宴,同時也演變為全球性的社交節日。2012年的溫網在社交媒體上火爆異常。比賽期間,從溫網官方網站到Twitter網站的流量較上年增加了2.05倍,而在男子決賽期間,每秒有超過100條與溫網有關的微博。而在2013年澳網比賽期間,僅包含#ausope標簽的微博就超過了100萬條。這些社交輿情數據均由IBM Content Analytics系統監測所得。
在2013年的溫網中,賽事組委會利用IBM Content Analytics等工具建立了一個全面的社交輿情視圖,來了解人們在Twitter和Facebook上都在談論哪些和溫網有關的話題。借助分析和自然語言處理技術,系統每秒可分析超過40條微博,并形成社交對話統一視圖。這樣一來,主辦方就可以實時了解全球溫網話題討論熱點,也可以對特定球員的社交影響力做出評估。
某種程度上說,數據分析正在改變網球賽事的組織和互動方式,并催生出新的商業價值。借助社交輿情的監測與分析手段,賽事的主辦者可以從球迷的情感表達中洞悉其情緒走向,并將其用于賽事組織的改進。同時,通過社交媒體數據對公眾輿論的評估,可以幫助賽事贊助商更加全面、準確地了解消費者的喜好、市場趨勢和品牌認知,從而展開精準營銷,使客戶獲得個性化的消費體驗。
大數據時代企業怎么贏?
如果你的企業希望投身大數據時代,現階段最大的挑戰是為海量業務數據找到商業用途。
在Gartner著名的技術成熟度曲線中,備受追捧的大數據技術或許還未攀上期望膨脹的頂峰。而在可以想見的未來,泡沫的幻滅或許會引發一連串的質疑。但對于企業而言,最重要的是不在潮起潮落中迷失自己最初的需求和渴望。無論對技術的追捧與質疑如何激烈,企業的領導者都需要明確業務對數據的真正需求,并且清晰地向IT部門進行表達,從而為多來源的海量業務數據找到真正的商業用途。
業務與IT合力價值發現
過去數年間,私人投資者和風險投資機構都將巨資投入到PB級別結構化與非結構化數據的采集、存儲、治理和分析等新興技術領域。新涌現出的工具讓企業從Web日志、點擊流、社交媒體、視頻和音頻文檔、機器傳感器和微博中提取數據變得前所未有的容易。在技術日臻完善的情況下,現階段企業利用大數據的最大難點在于,讓業務部門與IT部門相互合作,定義到底哪些非結構化和半結構化數據是對企業真正有價值的數據,以及如何對其有效地加以利用。
因此,真正的挑戰并不在于技術,而在于大數據商業價值的發現。這一艱巨的任務需要IT和業務部門合力完成?,F階段,很多企業尚未開始對非結構化數據進行采集和整合,主要原因就是企業的業務管理者不能確認大數據是否能夠為企業帶來實際的商業價值,而并非是出于對創新技術的不信任。
互聯網行業具備天生的大數據應用需求,并且擁有強壯的技術基因,這使得大數據技術的早期實踐者多誕生于此。而在金融、電信、制造、醫療等傳統行業,大數據技術也正在被重點關注,相關的需求梳理已經展開,并且有部分企業進入了初級實踐階段。
以金融行業為例,金融行業解決方案供應商北京先進數通信息技術有限公司研發部總經理完獻忠就表示,國內銀行目前的大數據應用尚處在初級階段,主要集中在歷史數據管理、查詢和使用方面,面向業務的分析應用項目則處于探索和驗證階段。他指出,隨著網上銀行和手機銀行的普及,并且向互聯網銀行的過渡,銀行業傳統上缺乏客戶行為數據的情況正在發生根本的轉變,銀行業具備了通過互聯網數據和機器數據開展有效客戶營銷的條件。
大數據打開大視野
從數據世界邁向大數據世界,技術的繼承與創新將會并存。當Hadoop、MapReduce成為技術創新的明星,有人或許會問:大數據會終結BI嗎?的確,新一代的分布式數據處理技術為用戶帶來了新的洞察力,但它們目前仍不能完全解決傳統BI(商業智能)所能夠解決的問題。我們看到,傳統的BI工具仍被京東這樣的大型互聯網企業所使用,其成熟的展現層技術仍然能在滿足企業大數據分析需求時發揮作用。
PPTV聚力技術部總經理金昀認為,大數據分析可以理解為BI在數據量大規模爆發后的演進成果。很多人認為,傳統的技術無法解決大數據時代的問題。但無論是小數據時代還是大數據時代,企業所面臨的數據管理問題都是相同的,即發掘數據之間的內在聯系,催生新的商業價值。
未來或許會有大數據時代的BI。BI的技術思維仍會存在,雖然數據的采集、存儲和分析方法全都改變了。與傳統BI相比,大數據時代的BI數據集成的范圍會更廣,像用戶行為數據、銷售數據、地理位置信息、團購信息、天氣信息等,都可以被集成到一起,通過新的分析與展現方法產生新的價值。它會帶來更廣、更深邃的洞察力。金昀說。
企業用戶數據視野的拓展同樣有賴于IT與業務之間緊密協作。從想象力的激蕩,到構想在現實環境的落地,注定是一段IT與業務攜手而行的旅程。(文章來源:CDA數據分析師)
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25