熱線電話:13121318867

登錄
首頁精彩閱讀鮑忠鐵:深度商業分析的7大基石
鮑忠鐵:深度商業分析的7大基石
2016-09-12
收藏
本文為TalkingData首席金融行業專家CDAS2016大數據金融分論壇上的分享,已經過嘉賓審核,整理出來,以饗讀者。
----------------------------------------

今天跟大家分享三方面的內容,一個是深度商業分析的七大基石,另外是怎么做客戶洞察和數據的應用,因為我們很多大數據應用在金融行業的初始點就是進行客戶畫像和客戶洞察的,最后講機器學習在金融行業應用實踐。


我先講一個案例,大數據從2012年開始火爆,談到大數據應用,就會講到Target 百貨分析16歲的少女買無香型沐浴露之后,判斷她懷孕了的這個故事。那么這個故事的原因是什么?通過哪些線索和數據分析來判斷這個少女懷孕了呢?詳細我就不詳細介紹了,大家可以看,科學家對懷孕這件事件做了一個預測,設25個指標,根據用戶的購買行為進行打分,如果你超過了某一個分值的話,可能你就屬于高概率懷孕的人群了。


另外,在大數據應用的過程中,很多都是大概率事件,大數據不是百分之百確定的事件,往往談的是一種概率。就像這個女孩子似的,她有很高的概率是懷孕了,當然也有預測失誤的時候,有很大的概率她是不懷孕。我們學概率的時候學過一句話“小概率事件不等于不發生”,這種概率基本上趨近于零,但是它已經發生了。

我們看一下深度商業分析,分析團隊和執行團隊對待數據是不一樣的,執行團隊拿到數據知道該怎么做,正在做什么和未來做什么,分析團隊拿到數據之后他要知道發生了什么,什么正在發生,什么原因在發生?最重要的不是對歷史的回溯,也不是對歷史數據的結論,其實是對未來的一個預測。所以說深度分析的目的就是為了預測未來即將發生的一些商業經營活動。



深度商業分析還沒有一個行業的定義,我們按照我們的一些理解去定義:利用數據和工具找到一些隱藏在數據背后的商業規律,對即將發生的商業行為進行預測,為企業的經營者提供決策支持,這是我們認為是深度商業分析。數據的成熟度有五個階段,一個是數據的采集、一個數據的描述、一個數據的挖掘、一個數據的預測、一個數據的決策,整個數據科學最成熟的階段就是數據的決策,就是AI要做的事情。

一、深度商業分析的七大基石

深度分析有幾個基石:

商業挑戰



在過去一段時間產品沒有很豐富的時候,我們面對的商業挑戰和現在商品過度豐富的情況不一樣,比如說新客戶的獲取、存量客戶的保存、怎么樣面對市場份額,怎么樣提高單客價值,怎么樣提高客戶的體驗和客戶對產品服務的需求。商業挑戰是數據分析的一個入手點,你的數據分析就是從你的商業挑戰、KPI來進行的,這些商業挑戰就是商業分析,或者叫深度商業分析的一個切入口。

第二塊就是數據基石。



過去的科學家統計過,在沒有大數據的時代之前,人類社會中至少有70%的決策沒有數據支撐,也就是只有30%的決策是在數據的基礎上進行的。如果進行了深度的商業分析,數據就是一個基石,可以是自己的數據,也可以是外部的數據,也可以是一些分析后的數據,也可以是行業的數據。無論是哪一種數據,最后歸結到數據應用的成熟度,也就是所謂的決策。

我們提到整個數據應用的決策,是五個階段最重要的。大數據有兩個特點,一個特點就是可以很快地處理海量的實時數據,第二是可以利用實時的處理能力找到一些數據背后的規律,用這些規律做一些模型。數據是整個商業分析的基礎,現在有些企業在做數據分析的時候說我沒有數據,比如制造業或者其他傳統企業,沒有像電商、金融這樣的豐富數據,但是它有一些社交數據、外部數據和銷量數據,這些數據都可以作為數據分析的基石。

第三塊就是分析實施的基石。


在進行分析的過程中,你要考慮處理好哪些數據,比如說你的商業目標是什么?你怎么樣能達到你的商業目標,需要哪些部門支持?需要哪些數據?哪些軟件?大家做數據分析的時候,除了要了解商業挑戰,除了要有數據,還要有一些其他資源。一個成功的企業有兩個成功的要點,一個是業務場景一個是技術場景,如果商業模式特別好,有好的業務場景,但是沒有技術手段去實現這個業務場景,商業模式也不能成功。一個企業既有技術的領先性又有商業模式的領先性才能成功。

第四塊是洞察基石。



分析人員在做深入商業分析的時候,可以用IMPACT的方法論,首先我們要掌控數據,賦予一些數據的標簽,最后是做傳播、觀察,最后再回到確定問題,大數據時代深度商業分析最核心的就要做一個數據閉環,因為有數據支撐的閉環對你整個決策的反饋有很大的支撐作用。

在這里要強調一點,在洞察一個商業機會的時候,我們基于數據的決策,無論在企業里面碰到多大的阻力,還是要提出自己的建議。往往你的建議在很小的環境下,或者在一些很幸運的環境里是可以得到驗證的。我們在一些企業里看到,往往基于數據的決策,基于數據的分析最后被論證是正確的。

第五塊是執行和預算基石。


執行和預算是否完成了目標、展示了成果,怎么增加收益,提升生產力,基本是從這三個緯度。數據的運用在整個中國,或者在世界上基本上集中在兩塊,一個是我們說的精準營銷,或者風控。精準營銷就是類似于有推薦引擎,風控就是今天我們講這些大數據風控。數據對企業的作用也是基于三個方面,一個是增加企業的收入,第二是提高它的效率,降低它的成本,第三就是提高客戶滿意度,如果你的分析從這三方面可以幫助企業的話,你的分析對于企業業務類的場景就可以得到支持。

下一個是知識共享基石。



在做商業分析的時候,企業不是靠一個人,是靠一個團隊,這個團隊有可能是屬于信息中心,也有可能是屬于業務部門,無論是哪個部門,我們歷史上分析的結論、工具、智慧,其實都是要共享的。這樣的話才能為后面的人、后面的商業分析提供一些基礎。有了這樣的共享的話,對企業來說,以后進一步做商業分析、做數據分析之后會減少很多的彎路。

第七個就是創新的基石

商業分析首先是揭示一些邏輯,然后是預測商業行為,最后是優化商業活動。成功的企業在數據分析和商業分析有幾個特征,第一個要聚焦客戶,過去都是以產品為中心,未來一定是以客戶為中心。另一個要做到產品的差異化,第三要做理解和預測市場以及趨勢,第四要執行的迅速,還要鼓勵員工推行分析和創新。

以上講的七個方面都是做深度商業分析的基石,如果按照這個方法論和這個基礎去做的話,相信這個企業在數據文化、數據思維和數據的商業應用上會有提升。

二、客戶洞察和數據應用

接下來就分享一下,在金融企業里面我們做的一些客戶洞察或者是數據應用——我們怎么給企業做客戶畫像。

客戶畫像這個詞在數據應用的中提得比較頻繁。做客戶畫像的時候我分享一些方法,首先要以信用信息和人口信息為主,在金融企業里信用信息代表你消費能力,不同消費能力的人群需要推薦不同的金融產品,屌絲有屌絲的,中產階級有中產階級的,高富帥有高富帥的。

另外就是人口屬性,就是我們的年齡、職業、郵箱、電話號碼,就是人們在這個社會上標識的一些屬性,有了這些屬性之后金融企業可以進行一些營銷。我們認為人口屬性是聯系到這個人的,刻劃這個人的信息,有了人口屬性你可以定義營銷手段是郵件還是短信、還是面對面地觸達。


第二要采用強相關的信息,我們做用戶畫像的時候,或者做一個商業場景的時候,會考慮到信息跟場景之間的相關關系,比如說看這個人的投資偏好,看這個人投資的風險偏好,他的歷史交易行為和收入可以支撐個人的一些投資偏好和風險特征,至于血型、星座跟這個沒多大關系,進行用戶畫像時基本上有一些強相關的信息,不會有弱相關的信息。

最后一個就是定量,金融企業也好,或者是其他企業也好,會有大量的非定量的信息,而我們在進行機器學習和預算的時候,機器只能識別一些量化的信息,如果沒有量化的信息,只是一個描述的信息,比如說白羊座、A型、B型,這對機器信息是無效的。我們會把非量化的轉化成量化信息,比如說年齡21歲—35歲,你可以定為青年。在對不同年齡段的人推薦產品、做風控的時候不一樣,年齡越大的人風險越高,因為他賺錢的可能性會越來越低。所有的這些信息都是為了評他的信用,找到有效的場景。


具體來說,我們畫像的時候會從五類信息對客戶進行畫像,比如說他的人口屬性,知道這個用戶是誰,我們怎么樣聯系這個用戶;另外一個是知道信用信息,知道資產收入、支付,用于風險控制,然后看他的消費習慣和喜好偏好,還有個人興趣,以及社交媒體,大部分不會短時期內改變,社交信息由于不同的場景,比如說上半年是旅游,下半年可能去買房,可能再過幾年結婚,這種社交屬性的信息的話,是需要實時更新的。在用戶畫像的時候,基本上我們采用這五類信息,大家做用戶分析的時候,也會采用這五類信息,只不過前四類是靜態的信息,第五類是動態的信息。

社交信息到底有什么用呢?大家如果在汽車之家,或者在途牛、窮游上發一條信息,這些信息基本上已經被企業拿到了,比如說你認為奧迪A6比較好的時候,其實這個網站已經把你的信息抓給平安了,平安可能會對你提供推銷車險,或者推銷相應的購車的優惠活動。當你在途?;蛘吒F游上發了一條消息,比如說羅馬哪個地方好完,信用卡就會獲取這條信息,給你推一些出游信息。在精準營銷這一塊,很多網站信息聯動都已經達到了,比如說你在京東上看了一個筆記本,網易也都給你推薦出來,因為數據都是打通的。

金融企業做用戶畫像,我們建議做五步,一個是要把畫像相關的數據集中在一起,第二步找到跟業務場景相關的數據。第三對數據進行標簽和分類,如果前三類數據不夠的時候,可能會引用一些外部數據,包括今天匯百川分享的客戶的點擊的數據,你愿意上旅游網站,還是愿意上電商網站,還是愿意上教育網站,這個標簽都是可以拿到的,你的標簽在移動互聯網上也是透明的。最后引用外部數據之后就按照你的業務場景進行篩選數據了,你是找到高富帥,還是找到高風險客戶,都根據場景來選。最后金融企業可以通過大數據管理平臺把數據引用進來,進行標簽化、場景化,進行數據的投放,還有一些應用。

DMP可以認為是阿拉丁神燈,可以幫助你利用數據進行分析。過去金融企業在數字化的過程中采的數據都是做效益提升的,或者是風險控制,現在采了很多行為數據和客戶的外部標簽數據,這些數據主要是做營銷的。


這是我們用DMP的一個場景,我就不具體介紹了。我們可以利用DMP尋找一些貸款客戶、理財客戶、購買學區房的客戶,結合內部數據和外部數據是可以實現的。大家不要對大數據營銷有過高的期望性,實際上在市場好最好的推薦引擎是亞馬遜,亞馬遜整個推薦引擎轉化率也不超過8%,大數據營銷只是一個概率的問題,轉化率其實沒有那么高。

三、機器學習在金融行業的實踐應用

最后一塊,我跟大家分享一下機器學習在金融行業中的應用,我再重復一遍,整個數據科學的成熟度基本上是五個階段,第一個階段就是數據的采集,第二個階段就是數據的表述,就是所謂的標簽化,第三個階段就是數據的挖掘,第四個階段就是數據的預測,第五個階段就是通過數據去做決策。

現在我們還處于一個挖掘的階段,就是聚類分析。過去金融行業都是很強相關的數據,比如說這個人叫什么名字、什么職業、收入多少、學歷是什么,我們對已有的信息進行分類,按照年齡預測他可能未來兩三年會買車、買房,收入有些增加,會出國旅游等。實際上還有另外一些信息,比如他在社交媒體的信息,網站訪問信息和APP上的行為信息、交易信息等。所有的這些信息可以用機器學習,也就是用聚類這種方法進行一些標準的分類。


我們會發現用結構化數據分類的這些人有很大的一個誤差,這是為什么?建議大家有時間可以去關注一個學科,現在比較熱,叫“行為金融學”。這個行為金融學里面透露一個道理,大家在跟外部溝通的時候,每個人內心會隱藏自己的個性。舉個例子,你到金融網點去買理財產品的時候,他讓你會填一個你收入多少,你風險承受程度是多少?你是價值投資者,還是風險投資投資者?如果不拿行為信息,僅僅根據客戶調查的信息的話,很難判斷一個人的投資偏好,或者是個性。

聚類有很多方法,很多模型,比如說基于模型的聚類等等,我基本上選三類以上,根據實際數據的驗證效果來決定哪一個模型更適合。因為你的數據緯度、質量是不一樣的。


基本上,我們首先利用行為信息進行聚類,完全利用行為信息,發現在金融企業里,客戶分三類,一個是僵尸型,注冊之后買一支產品就不動了。第二就是一次性買投資的,可能是家庭主婦,買了投資之后放在那兒就不動了,另外就是投資理財型的,非?;钴S,利用過去結構化發現不了。利用聚類找的這三類客戶之后,針對每一類客戶要提供不同的營銷手段。


這個是決策樹的案例,當摩根收購大通銀行的時候,有600億住房抵押貸款,所有住房抵押貸款的客戶都有兩個風險,一個風險就是說這些客戶不還錢了。第二個風險他提前還款,如果不還款銀行就有壞賬,如果提前還款銀行就沒有得到更多的收益,怎么辦呢?摩根大通請來了一個叫丹尼爾的科學家花了一百多萬美金做了一個分析,能夠提前預測哪些客戶要提前還款,對這一部分客戶就給他推薦一些理財產品,他就會把多余的錢買理財產品,就不會去還他的抵押貸款,銀行就有兩份收益,一是原來貸款給它產生利息,二是新的理財產品也會給它帶來收益。大概運行了一年通過這種決策分析給大通銀行創造了6個億美金的收入。


另外一個是Machine Learning,我們叫Lookalike算法,通過3%的用戶去尋找潛在的客戶,找到之后再給客戶發短信營銷,正常的情況下我們短信營銷打開率只有0.1%,通過Lookalike計算之后,精準營銷的短信打開率達到6.5%,也很另客戶吃驚,通過機器學習這種行為數據找到客戶比他用結構化數據找到客戶可能更真實。


下一個是沃森。沃森2012年開始在美國花旗銀行幫很多金融理財客戶做顧問,DBS也是2014年開始做保險理財的推薦,它會根據掌握的信息去給客戶推薦產品。

當時為什么選沃森呢?因為DBS它有自己一套評估方法,它找到了8個Top 保險理財產品銷售跟沃森進行了三輪測試,分別面對三個客戶,三輪測試之后。DBS的銷售客戶推薦了理財產品,沃森也給客戶推薦了理財產品,經過三輪的PK最后都是沃森勝了,客戶選擇了沃森提供的保險理財方案。機器學習在人工智能這方面有天然的優勢,因為它可以處理海量的信息。沃森也在推中國的市場,但暫時還有些慢,因為在中國我們知道英語是叫邏輯語言,可以根據一些語言行為判斷出你的行為,但是漢語是非邏輯性語言,我們經常開玩笑說“中國隊大敗美國隊”,這句話很難判斷是那一方勝利了。

沃森正在做一些認知學的應用,拿歷史醫療檔案進行一些分析,利用它認知學、人工智能的方式去幫助醫生制定一個好的方案。所以沃森和阿爾法狗是人工智能發展的兩個比較好的案例。

Machine Learning也可以幫助DMP Plus進行的營銷響應、高價值客戶挖掘、客戶挽留、關聯產品分析,這個中國一些大的金融企業已經在做了,比如說一些證券公司。

下面就講講在證券行業的應用,倫敦的證券交易所有40%的金融交易是用量化交易,就是機器自己進行交易的。在國內,我們量化交易的市場這幾年有了提升,大概有30%,美國是70%的基金都是量化交易基金,在美國TOP100的基金基本上第二年很少再進入TOP100了,因為市場競爭非常激烈,沒有一家基金可以長時間保持在TOP100。

約翰·埃爾德建立了一個股票預測的黑盒子,押上了全部身家10年,像一些黑天鵝事件很容易影響股票市場的波動。有一些股票的模型都是用歷史交易去做的,如果用歷史交易預測未來的話有很大的欺騙性。


下面就是UBI,也是UBI在做金融企業深度學習,或者是Machine Learning常用的一種方式,美國有20%的車險市場定價是UBI決定的,就是基于你的價值行為,比如說你的手機上傳感器傳的數據到車險APP之后,它會判斷你的急剎車、急轉彎和行駛道路是否平坦、是否闖紅燈,是否邊開車邊打電話,通過這些數據可以進行一些風控模型的判斷,也會對你的價值行為進行一個評分。但中國暫時UBI還沒有大規模興起,未來是一個很大的市場。


今天的分享大概就到這兒,未來機器學習在金融領域應用是非常廣闊的,希望大家做數據分析的時候,除了做表格了解之外,也再想想怎么樣去預測、去決策,謝謝!

提問:我想問一下封閉性系統和死循環有什么區別?

鮑忠鐵:咱們先把概念搞清楚,看看咱們倆了解的概念是不是一樣,封閉式系統所有的反饋都是在內部,沒有外部,他這個反饋有可能形成死循環,有可能不會形成死循環,反饋沒有波動了,沒有任何的干擾了,所有的數據輸入和數據輸出結果都一樣。

這種現象可以從兩方面解釋,第一個就是你的數據的采集,這種情景做模型分析的時候很少能出現,如果你出現這種的話,我們認為就是你的模型有很大的缺陷,會出現一種死循環。第二就是模型在任何的噪聲,或者說在任何的臟數據的處理下,不要形成死循環,你的模型在設計的時候要抗死循環。

提問:給用戶打標簽,建立用戶畫像之后,其實是對用戶深度地去解讀,我可能去猜測這個用戶的喜好和他的行為習慣做一些推薦,如果我這么做的話,可能會和推薦的多樣性有沖突,有沒有一些方法,針對用戶的多樣性。

鮑忠鐵:這個問題比較簡單一點,她說用戶的深度分析之后,就把用戶定到一個很小的領域,但是我貨架上有一百個產品,我如果給用戶定到一個很小的領域的話,那一百個產品就沒辦法給他了,我只能挑一個商品給他,這樣對我來說是不是一個商業上的損失,做用戶分析就得不償失了。

商業分析的時候,我們最終看到的一個結論,增加企業的收入,其實還是你這個商品的銷售收入,即使你把客戶定到一個很小的領域中,這個客戶到了之后你商品的轉化率比原來提高了。你有兩個選擇,要么沒定他很細的領域給他推薦一百個產品,最后看他的結果,整個收入提高了,你的深入分析就是有效的,如果你的深度分析之后,他定的收入是降低了,那么你的分析就是有問題的。

實際上換一個角度來說的話,你給用戶推薦一百個產品,和給用戶推薦五個產品,用戶的體驗和你推薦的成本是不一樣的。所以從這個角度來說的話,我還是強調,通過深度分析對用戶的精準分析和精準營銷,做精準推薦是一個趨勢,這也是現在電商在做的一個事情。你要有一個平衡點,當轉化率高于多少的時候我就做精準營銷,低于多少的時候我就普通推。

對商業數據分析感興趣的同學可移步至CDA數據分析師微店了解課程:


 (微店二維碼)                       (CDA數據分析師服務號 )

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢