
大數據就像煤礦,那“大礦主”BAT 是如何運作金融大數據的
新年開工,李彥宏的內部信就在朋友圈中引發了一波刷屏。李彥宏說,“這樣一個時代,是很明顯的金融創新的新時代” ,這充分表明金融業務將是百度未來的四大方向之一。而他的一句“數據秒殺一切算法”,更是從側面透露了以大數據為代表的人工智能技術將成為百度金融的必殺技。
金融創新很大一部分原因在于大數據和金融之間的結合??v觀BAT、京東、小米、萬達、平安這些把觸角伸到互聯網金融領域的巨頭,無一不是在大數據層面上有所布局。大數據和金融相結合,幾乎已經成為金融領域的通用做法。
金融數據都像是煤礦,價值含量、挖掘成本更重要
談數據必須先談數據的完整度和價值含量。就像煤礦一樣,大數據中的價值含量、挖掘成本比數量更為重要。非結構化數據,就像是有雜質的煤礦,無法直接使用。大數據還需要進行脫敏、提純、結構化,才能變成可以被直接運用于商業層面的有價值的信息。
金融數據作為專業度要求更高的數據尤為如此。對于BAT三家而言,布局其實都比較完整。 2015年年底的時候,阿里集團透露,在阿里數據平臺事業部的服務器上,攢下了超過100PB已處理過的數據。
BAT三家公司,數據體積相差不會太多, 三家幾乎都有LBS、交易、社交等一系列不同維度數據,只是能力有所區別。
比如說,百度有地圖、貼吧、糯米、外賣、Uber、攜程、去哪兒;阿里有高德、微博、口碑、支付寶、飛豬、優酷等;而騰訊有微信、QQ、京東、新美大等。
三家數據核心優勢可以如此簡單劃分
百度:基于搜索而誕生的公共數據、需求數據。百度的優勢在于數據最全面,數據樣本比較復雜,數據的廣度和多樣性上比較強,擁有核心技術和數據礦山,而且是一座富礦。
阿里:基于淘寶天貓業務而誕生的電商數據、信用數據。阿里的核心業務在電子商務上,數據比較聚集,更容易做分析。這種數據類型的優勢在于,更容易變現,挖掘出商業價值。
騰訊:基于微信、QQ誕生的社交數據、關系數據,以及游戲數據,相對較雜。不過,容易分析人們的生活和行為,從里面挖掘出商業、健康等領域的信息。
大數據領域有這樣一種說法——所有的數據都是風險數據。而拍拍貸風險副總裁顧鳴博士之前提出過一個金字塔結構圖。
在這張圖中,征信數據位于金字塔的頂端。往下走是消費數據、運營商數據、社交數據、行為數據以及其他數據。
越是靠近金字塔的頂部,大數據在風控領域的應用就會越直接,獲取數據的難度隨之增加,覆蓋率當然會降低;相反,越是靠近金字塔的底部,大數據在風控方面的應用難度就越大,但是數據的數量和覆蓋率都會變大。
把BAT三家套入這個金字塔結構中就會發現。阿里的數據離變現幾乎只有一步之遙。阿里以電商-支付-信用為三級跳板,針對性很強,數據價值純度高,金融數據的整合上做的也比較完善,缺點是覆蓋面還是不夠。不過,這些年來不斷收購、入股優酷、微博、高德等一系列企業,阿里數據維度其實也在越來越豐富,也在不斷往金字塔的底層下探。
騰訊有社交、行為數據,這些數據不能直接運用,但獲取的信息會更豐富。而騰訊目前的大數據策略是先將產品補全,產品后臺數據打通,形成穩定生態圈。本階段先利用大數據挖掘改進自己的產品。后期有成熟的模式合適的產品,則利用自家的社交及關系數據時,開展對大數據的進一步挖掘。
雖說有人認為百度和騰訊很多數據是非結構化數據,在風控上的運用難度較大,很難直接商業化。不過,這些數據恰恰是金字塔最底層的數據。在普惠金融的環境下,互聯網全域大數據帶來的價值不可忽略。
百度的數據最為全面、完善,覆蓋面最廣?;ヂ摼W環境下,每個人都會在網上留下痕跡。因此,位于底層的互聯網行為數據覆蓋面最廣,維度最多樣,對破解我國數億成年人尤其是草根群體的信用空白難題幫助最大。
表面上看這些數據大多數和金融無關,但如果挖掘得當,能夠通過建立模型,給用戶勾勒出比較準確的畫像。讓那些看似與風險不太相關的數據在互聯網金融風控的場景中體現價值。
四個角度告訴你,金融大數據到底用在了哪些地方
之所以要花這么大的篇幅去談三家的數據來源,主要還是因為今天無論是金融、電商、物流、生活服務等各個領域,其實都離不開維度全面的數據。
因為數據維度越豐富,對用戶粗顆粒的畫像就會越了解。某一個畫像的用戶到底喜歡什么,都可以一清二楚地了解到。企業也能夠面對做很多有針對性的營銷。
尤其是在金融領域,企業對大數據掌握越全面,所能涉及到的業務也會越豐富。BAT數據最豐富,在金融業務領域橫亙支付、貸款、理財、保險、證券、銀行、征信、基金、眾籌等各個領域。而小米、京東、萬達等企業因為體量、數據等相對而言優勢不大,則會在這9個領域中缺失某些領域的布局。
BAT在9個領域的布局,其實都是以大數據為核心串聯在一起的。無論是征信、風控、消費金融、財富管理都或多或少運用到了大數據。
1、大數據征信:在個人征信領域,目前是金融行業面臨的最大問題?;谟脩粼诨ヂ摼W上的消費行為、社交行為、搜索行為等產生的海量數據,其價值并未被充分挖掘,個人征信在大數據的采集和信息挖掘上面仍有很大的想象空間。
阿里的芝麻信用在其中算是最會玩的。芝麻信用幾乎打通了用戶的身份特質,行為偏好,人脈關系,信用歷史,履約能力等各類信息。這恰恰是因為接入了電商、支付、社交等各類數據維度。
2、大數據風控:大數據風控目前應該是前沿技術在金融領域的最成熟應用,相對于智能投顧、區塊鏈等還在初期的金融科技應用,大數據風控目前已經在業界逐步普及。目前,美國基本上都用三大征信局的信息,最傳統的評分基本上都是用FICO來做的。各家平臺會嘗試著用機器學習、神經網絡等大數據處理方法。
國內市場對于大數據風控的嘗試還是比較積極。特別是大公司,可以將移動互聯網的行為和貸款申請人聯系到一起展開大數據風控。百度在風控層面上的進展還是比較突出,百度安全每天要處理數十億網民搜索請求,保護數億用戶的終端安全,保護十萬網站的安全,因此積累了大量的數據。
一個很具體的案例就是,通過海量互聯網行為數據,比如監測相關設備ID在哪些借貸網站上進行注冊、同一設備是否下載多個借貸App,可以實時發現多頭貸款的征兆,把風險控制到最低。
3、大數據消費金融:消費金融對大數據的依賴是天然形成的。比如說消費貸、工薪貸、學生貸,這些消費型的金融貸款很依賴對用戶的了解。所以必須對用戶畫像進行分析提煉,通過相關模型展開風險評估,并根據模型及數據從多維度為用戶描繪一個立體化的畫像。
百度金融的優勢在于,通過基于大數據和人工智能技術為基礎的合作商戶管理平臺,為合作商戶提供涵蓋營銷和金融服務的全面管理方案,降低獲客成本,解決細分行業的微小需求。一方面可以降低風險,另一方面也能提升金融的安全度。
在大數據消費金融的領域中,騰訊和阿里的優勢很大程度上是在渠道層面上的。正如前文所說的,阿里以電商-支付-信用為三級跳板,針對性很強支付寶接入消費金融產品之后會有較強的渠道作用。而在去年12月,騰訊的“微粒貸”已經接入到了微信支付當中。在消費金融的發展速度上,騰訊速度也不差。
4、大數據財富管理:財富管理是近些年來在我國金融服務業中出現的一個新業務。主要為客戶提供長期的投顧服務,實現客戶資產的優化配置。這方面業務在傳統金融機構中存在的比較多。不過因為技術能力不足,大數據財富管理在傳統金融機構中相對弱勢。
財富管理在互聯網公司的業務中也非常流行。螞蟻金服一開始最為簡單的財富管理方式就是余額寶,后來逐漸演化成經過大數據計算智能推薦給用戶的各種標準化的“寶寶”理財產品。百度金融是依托“百度大腦”通過互聯網人工智能、大數據分析等手段,精準識別和刻畫用戶,提供專業的“千人千面”的定制化財富管理服務。
金融大數據的孿生兄弟金融云是地基,未來更具看點
大數據和云計算永遠都是相伴相隨的一對孿生兄弟。金融大數據核心工作包括三方面,即獲取數據、建立模型、模型在實踐中優化、迭代。而對于金融大數據而言,金融云才是它的地基。
打個不恰當的比方,前文中說大數據是煤礦,而金融云其實就是礦井。礦井的安全行、可靠性決定了挖煤的效率和結果。
金融云把底層技術很多問題都解決了。大量金融模型都是金融云所引入的,如客戶模型、產品模型、賬務模型等。同時金融云關注金融本身的嚴謹性和周密性、安全性的考慮。
2016年7月,“騰訊云+未來”峰會上,騰訊云和騰訊金融云都已成為最重點部署的業務。同年9月,百度世界大會金融科技分論壇上,百度金融云正式向業界開放。10月,阿里云棲大會上,阿里金融云負責人則是提出將會和生態合作伙伴、服務聯盟為金融行業量身定制推出云增強服務。
大數據必須要跑在云端,而金融大數據更需要和業內其他企業展開數據、支付、業務等一系列的合作。金融云對可用性、安全性的要求嚴格,比如說對一個高度可控可信的云安全體系而言,基礎環境安全、風控與審計、數據安全三者缺一不可。而金融云在未來的競爭中將發揮越來越重要的作用。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25