熱線電話:13121318867

登錄
首頁精彩閱讀數據分析實現商業的降維攻擊
數據分析實現商業的降維攻擊
2016-10-08
收藏

數據分析實現商業的降維攻擊

無人敢忽略”數據“在當下商業布局中的重要意義,但是,它的實用性似乎遠在天邊,而它的戰略重要性卻又近在眼前?!?/span>大數據“的投資似乎像一個無底洞,對企業來講,實用意義在哪里?如何與當下的商業模式結合,戰勝”無數據“的傳統的自己?”數據“這個不明覺厲的詞,到底在創造什么樣的價值?

一個案例:數據分析解決了世界難題

對貸款機構來說,有三個問題事關生命線:貸不貸?貸多少?收多少利息?更專業的說法是準入、授信和定價。要答對這三個問題,前提是盡可能全面地了解貸款客戶,但這對傳統的金融機構來說意味著巨大的成本,因而即便壞賬率能控制在某個所謂“健康”的范圍內,這也意味著成堆的資料、繁復的審核和繁重的抵押,也因此,為了規避風險,更多的資金被貸給了“可靠”的大企業。

小微企業的貸款業務是一世界難題,螞蟻小貸通過數據智能與商業場景的結合找到了破解之道。

它和傳統銀行不同:一方面,已經服務了數百萬淘寶賣家,他們的貸款多不過百萬,少的只有幾百元,他們不僅沒有靠譜的抵押,有些甚至連基本的賬目都沒有;另一方面,一次貸款申請提交后,幾秒鐘內系統自動審批就能完成,錢已經到了賣家賬戶上,相應的壞賬率還能顯著低于傳統銀行的水平。

螞蟻小貸這個剛剛創業六年的公司是怎么做到的?

歸功于互聯網,螞蟻小貸能夠分享潛在客戶的諸多數據,比如這些淘寶賣家正在賣哪些商品、生意好不好,又比如賣家經營店鋪勤快嗎、之前有過不誠信的行為嗎,甚至還比如這賣家的朋友們信用度高嗎、他喜歡打網游嗎等等,這些數據的豐富度、準確度遠高于傳統銀行能采集到的貸款者的信息。

在“全面了解客戶”這點上,螞蟻小貸擁有了數據的優勢。這是關鍵的第一步,但又遠遠不夠。如何運用好這些數據?“算法”至關重要。算法在計算機科學中通常指一組包含了有限、明確并有先后順序的指令集合,它被廣泛應用于計算、數據處理和自動推理,例如螞蟻小貸的算法工程師們就建立了一套算法模型來處理這些海量數據,給每位客戶的“信用”打分,從而區分出欠貸不還的“壞人”和準時還貸的“好人”?;谒惴P偷目蛻粜庞梅种?,成為螞蟻小貸回答“貸不貸”這個問題的核心依據。

更為重要的是,和傳統數據分析不一樣,基于在線數據和算法的模型是實時迭代的。

一方面是新數據的不斷涌入,這個信用分并不會“一分定終身”,恰恰相反,客戶的每一單交易、每一次旺旺上線、每一次還款,原則上每時每刻都可以改變這個分值。只是基于成本的考慮和現實的風控需求,螞蟻小貸每天更新一次客戶的信用分,然而這樣的更新頻率已經是傳統銀行所不可想象的了。

另一方面是算法模型的迭代。用一套天才的算法百分百準確地找出“好人”和“壞人”只能是幻想,或許一個被打了很低信用分的客戶及時還款了,一個高分客戶卻反而卷款跑路了,檢驗算法優劣的核心標準就是一條,“客戶后來還款了嗎”,算法必須根據預測和實際結果的差別進行調優。所以事實上,客戶的借還款的數據,會實時反饋到螞蟻小貸的數據池中,多個算法模型據此實時優化——哪些維度的指標應當被納入到或清除出模型、客戶的哪些行為特質應該被賦予更高的權重、在不同的情形下哪些算法模型有更高的準確度,在螞蟻小貸,這些算法模型更新的頻率以“周”計,而即便在傳統金融數據化程度極高的美國,一次更新也往往需要6個月。

簡單地說,依據客戶的全方位數據,螞蟻小貸用一系列算法模型“算出”該不該給一位客戶貸款。然后基于客戶的行為,數據實時更新,而且實時檢驗著螞蟻小貸“算”得“準不準”,算法模型也據此實時優化。

面對每一次客戶的貸款申請,螞蟻小貸都是這樣來回答“貸不貸”這個問題的,同樣的,回答“貸多少”、“收多少利息”這兩個問題也是類似的過程,例如授信額度的確定,這當然比“準入”這件事需要更多的數據,螞蟻小貸的算法工程師們測算出每家店鋪的主打商品的生命周期(是新品正在攢口碑、是正在熱銷、還是即將打折清倉)、每家店鋪的毛利率等等數據指標,加入更多的賣家社會關系數據(因為人以群分),更多的數據意味著對客戶更深的理解,意味著更符合商業本質的算法模型,也意味著對“貸多少錢”這一問題更準確的回答。

在這個過程中,客戶的數據越來越豐富,運用到的參數越來越多,算法模型也越來越靠譜,貸款風險控制的成本越來越低,貸款者的體驗也越來越贊,覆蓋的貸款用戶也越來越廣。整個業務進入高速發展的正循環。用時髦的術語來總結,螞蟻小貸通過基于“大數據”和“算法”的“機器學習”,讓商業變得“智能”,提供了以前無法實現的小微貸款服務,實現了普惠金融的創新。

智能商業取得成功,要做對三件事兒

正如我們在螞蟻小貸的例子中已經看到的,從PC互聯到移動互聯,再到萬物互聯,從云計算到大數據,基于數據和算法的智能化將是未來商業的基礎和最重要的特征。智能商業的效能相對于傳統商業是質的飛躍,是全面超越,這才是所謂“降維”攻擊的基礎。螞蟻小貸在貸款額度之小,貸款客戶數之大,反應速度之快,資金使用效率之高,員工人數之底都達到了傳統小貸企業無法企及的高度,從而在六年內實現了爆炸性成長。

怎樣才能成為這樣高能的智能商業,引領未來的商業浪潮?

如果我們對螞蟻小貸的業務過程做更全面的檢視,會發現它本質上是做了三件關鍵的事:特定商業場景的數據化、忠實于商業邏輯的算法及其優化迭代、將數據智能與商業場景無縫熔合的產品。這三件事融合貫通,相互包含,在反饋閉環中共同進化,未來的智能商業樣貌已經躍然而出。

(一)商業場景數據化的魔力

數據化是螞蟻小貸的整套智能體系的起點。不僅是客戶的經營數據,還有更多維度的數據被記錄、分析、融入,構成了對客戶全方位的描摹。數據初始化是一件高成本和困難的事情,僅僅是最簡單的客戶性別數據就包含了諸如登記身份證的性別、實際經營者的性別、其行為特征顯示出的性別等等十幾套標準,各自都有價值,但傳統方法又無法融合,需要創新的方法才能合理使用。但與此同時,數據化更是一件高收益的事情,例如客戶對經營的投入程度這個直覺上就很有價值的指標,傳統金融機構幾乎沒有任何有效的方法獲取,然而在互聯網的語境下,早上幾點賣家的旺旺上線了、買家的詢問在幾秒鐘內能得到回復,這些數據都清晰地展示著賣家的投入度;再比如賣家的盈利狀況,很多電商賣家都不具備基本的財務技能,賺了多少錢都是“毛估估”,傳統銀行拿到的企業財報更是虛假成風,但螞蟻小貸的數據分析師通過每件商品在批發平臺的價格分布測算出其成本價,進而測算出一家店鋪所賣商品的單件盈利,這一維度的數據盡管未必總是精準,但不啻為衡量貸款者還款能力的重要指標。

“數據化”本質上是將一種現象轉變為可量化形式的過程。它來源于人類測量、記錄和分析世界的渴望,從結繩記事開始,到度量衡來計量長度和重量,到十進制數字的發明,再到復式記賬法使數據直接反映生意的盈虧;隨著現代科學的發展,氣壓、電流、溫度、磁場,更多的現象得以被量化,數據化后浪推前浪的潮涌,事實上成為人類文明前行的核心動力之一。

而隨著計算機技術的出現,尤其是互聯網技術的快速發展,數據化的新一波浪潮更加洶涌澎湃:我們已經看到,自己在互聯網上留下的每一處“足跡”都被數據化地記錄下來,成為谷歌判斷每一個用戶的個性化需求并推送商品廣告的關鍵依據;FaceBook實現了人際關系的數據化,帶來了很多全新的應用,例如通過分析選舉前用戶的行為數據來“計算”選民的投票傾向,成為有史以來最準確的選前民調,都不用加“之一”。我們還看到文字被數據化,地理方位被數據化,身體健康狀況被數據化,情緒感受被數據化,在這一波全新的數據化浪潮中,尤其是當數據本身也在線,從而可以實時使用了之后,這種魔力就更顯著了,如同螞蟻小貸的貸款模型所做到的,關于賣家的每個數據的每次變化,都實時帶來從貸款算法模型到放貸商業決策的變化。

我們今天完成了數據化的部分,只是現實商業世界中的鳳毛麟角。這個時代的創新的重要一環就是如何把一個個商業場景、甚或只是將其中的一個商業環節數據化,其過程本身都潛藏著巨大的商業價值。例如,即使在服裝網購如此繁榮的今天,絕大部分人的身材并沒有數據化,更沒有在線化,新的商業模式的基礎就蘊藏在里面。同樣的,當下最熱門的各種O2O的創業,很大的成本都用在了將某個商業場景數據化上,例如街邊小店的菜單能否在線化,食品質量指標能否數據化;而IOT浪潮中,最核心的就是如何通過芯片,傳感器等,把人,物和我們整個世界逐步的數據化?;ヂ摼W技術使我們終于可以低成本、全方位地記錄數據,而只有當我們擁有了足夠大量、足夠多維度的“大數據”時,才可能真正客觀、真實而深刻地理解我們周遭的環境、事物的本原以及我們自己。

這是激動人心的歷史性的努力。本質上,就如同蒸汽機是我們進入工業文明的第一步、電是我們邁入電氣化的現代工業的第一步,數據化毫無疑問也是我們進入以數據智能為核心的智能商業世界的第一步,也是我們這個時代最重要的創造之一。

有效的數據初始化是大數據創造價值的至關重要的第一步??梢哉f,沒有數據的初始化就沒有后繼的商業創新,而數據初始化的巨大成本能否通過它創造的客戶價值來回報,也就成為當下的海量創業項目能否存活立足的重要考驗。

(二)算法:智能商業的引擎

我們提到算法時,常常接上另一個詞——“引擎”。這是一個奇妙的比喻,因為如果說數據是DT時代的一桶高標號的汽油,則算法就是這臺引擎,讓數據中的能量得以完全地噴發出來,為智能商業的汽車推進加速。

算法在螞蟻小貸業務中的關鍵作用固然不言而喻,同樣的,谷歌的成功也發源于其創始人發明的PageRank算法。搜索是第一個數據和算法驅動的互聯網產品,使我們每個人都得以在海量的互聯網數據中找到最相關的信息。谷歌創造的另一個功能強大的算法是其在線廣告市場引擎——Pay per Click(每點擊付費),每天都有價值十億美元以上的線上廣告通過這一算法投放到最合適的觀眾面前。

在商業的語境下,算法就是一組反映了產品邏輯和市場機制的計算指令的集合。完成了商業場景的數據化之后,算法是提煉數據價值的思路,而DT時代的數據價值就是商業價值。如同谷歌正在做的,我們每個人打開過一些商品的頁面、網購了某件商品,這無疑是數據的金礦,但只有當在線廣告的算法引擎從中挖掘出每件商品的潛在買家、并據此投放廣告時,這座數據金礦的價值才真正被開發出來。

算法是“機器學習”的核心——笨機器用笨辦法,靠著算法的持續優化迭代,變得越來越聰明。即便是一個非常粗糙的算法模型,也可以在實時在線、全本記錄的數據中,通過沒有預判和方向的數據探索,來發現那些廣泛潛伏但我們無以察覺的關系結構,持續優化,并創造性地將其融入商業場景,創造商業價值。

DT時代的智能商業對算法提出了全新的要求:算法的迭代方向、參數工程等等,都必須與商業邏輯、機制設計、甚至是價值觀取向融合為一。當算法迭代優化時,決定其方向的不僅是數據和機器本身的特性,更包含了我們對商業本質的理解、對人性的洞察和創造未來商業新樣貌的理想。

這就是我們稱算法為智能商業的“引擎”而非“工具”的關鍵理由,它是智能的核心?;跀祿退惴?,完成“機器學習”,實現“人工智能”。這是第三次工業革命,計算革命,發展到今天,從量變到質變的飛躍,是數據時代最根本的特征。

(三)產品:“智能化”的支點

智能商業的核心特征就是能主動地了解用戶,通過學習不斷提升用戶體驗。而把用戶,數據和算法巧妙地連接起來的,是“產品”,這也是互聯網時代特別強調產品重要性的根本原因。

產品和數據、算法的互補作用可以形象地比喻成“端+云”?!岸恕本褪钱a品,是與用戶完成個性化、實時海量、低成本互動的端口,它不僅僅直接完成用戶體驗,同時使得數據記錄和用戶反饋閉環得以發生,和“云”互動;而“云”則是數據聚合、算法計算的平臺,它通過算法優化,更好地揣摩用戶需求,提升用戶體驗。

作為“端”的產品,具備三個關鍵的作用:

第一,產品設計本身直接影響用戶體驗。功能是否齊全,界面是否友好,交換是否自然,都是關鍵因素。蘋果公司這十年的成功,特別是iPhone, 充分顯示了這一點;谷歌也是如此,超簡潔的搜索框甫一出現就讓人驚艷,口碑相傳,帶來了早期的高速發展。

第二,它是將“云”上的數據智能傳遞給用戶、為用戶帶來價值的管道。事實上,在智能商業的“云”和“端”之間,客戶的產品體驗絕不僅僅來自于端上的UI互動,而更多地決定于云上的數據智能。例如,用戶在淘寶的體驗,不僅僅是搜索是否好用,類目是否合理,導航是否有效等,更重要的是他能否高效地從幾十億件商品,千萬級賣家中快速找到他需要的商品,甚至還有驚喜,而這取決于“云”上的數據智能。不通過數據和產品的緊密融合,不通過云上的數據智能實時發揮作用,真正意義上的客戶體驗持續提升是根本無法想象的,就好像我們根本無法想象傳統的金融服務能在幾秒鐘內完成對客戶的貸款一樣。

第三,它是用戶通過行為數據向“云”上的數據智能進行反饋、實現數據增殖和算法優化的管道。用戶的真實需求常常是無法直接表達的,但是他們的行動不會騙人。每一次用戶的行動都成為一次數據反饋,算法在這樣一次次的反饋中敏捷迭代,一次次更接近用戶的真實需求。

上傳下達,雙“管”齊下,數據閉環靠產品互動實現,而產品體驗依賴于數據智能,數據和產品合二為一。

因此,智能商業的成功,最關鍵的一步往往是一個極富想象力的創新產品,針對某個用戶問題,定義了全新的用戶體驗方式,同時啟動了數據智能的引擎,持續提升用戶體驗。這樣的智能商業,才是對傳統商業的顛覆,才是真正的“降維”攻擊,勝者一騎絕塵。谷歌超越雅虎、Facebook超越Myspace、Uber顛覆出租車行業等等,無不如此。

(四)智能商業:在反饋閉環中的“三位一體”

數據化、算法加上產品構成了智能商業的三個基石,例如谷歌,其搜索引擎的三大核心,一是網頁內容的數據化,二是基于PageRank的算法引擎,三是谷歌巨大的產品創新——極為簡潔的搜索框和基于相關性排序的結果頁。然而這還不夠,要讓智能商業一天比一天更聰明,還有一樣東西不可或缺——反饋閉環。用戶在搜索結果頁上的每一次點擊(或者一次點擊都沒有)的行為數據被實時記錄、反饋到算法引擎,不僅優化了你的搜索結果,而且優化了任何搜索這個關鍵詞的人得到的搜索結果。

用戶行為通過產品的“端”實時反饋到數據智能的“云”,“云”上的優化結果又通過“端”實時提升用戶體驗,在這樣的反饋閉環中,數據既是高速流動的介質,又持續增殖,算法既是推動反饋閉環運轉的引擎,又持續優化,產品既是反饋閉環的載體,又持續改進功能,在為用戶提供更贊的產品體驗的同時,也促使數據反饋更低成本、更高效率地發生。

一言以蔽之,數據化、算法和產品就是在反饋閉環中完成了智能商業的“三位一體”的。

智能交通體系是另一個例子。以無人駕駛汽車為代表的整體智能交通體系已經不是科幻,谷歌首次實現了根據路況數據設計路線,本質上這是將關于路線選擇的算法在線了,而今天在美國,無人駕駛汽車已經上路試驗,就是汽車這個“端”的全面智能化。在中國,阿里巴巴最新的實踐則是交通的“云”的全面智能化,依據各方面交通數據的整體打通,預測未來一小時里的每一個路口可能的交通狀況,進而對接城市交通指揮系統,有的放矢,在北京這樣復雜的路況下,此套體系的預測準確率超過95%。這其中,數據化、算法迭代和產品同樣在反饋閉環中實現了三位一體。智能交通體系首先以一連串事物的數據化為前提的——包括了地理位置的數據化、車況的數據化、天氣的數據化,紅綠燈、分道線、行人的數據化等等;它還是算法實時優化的結果——不僅是車況本身的優化,更是整體智能交通體系的優化;它當然更離不開從汽車到紅綠燈等種種產品的智能化。它更是眾多數據反饋閉環的集合體——路況數據使車輛實時優化行車路線,周遭環境數據使車輛實時決定行使速度,乘客身體狀況的數據使車輛實時調整車窗開合。

本質上,商業從一開始就是基于某種“反饋閉環”的,了解客戶所需,提供相應的產品或服務。然而不論是發揮商業天份猜客戶需求、抑或通過市場調查聽客戶需求,始終失之于準確,困之于成本。不過,到今天,當客戶可以通過全本實時的數據把他們的需求直接告訴商家時,當商家可以憑借敏捷迭代的算法引擎精確滿足客戶的需求時,當產品借助互聯網的巨大能量成為數據智能和用戶實時互動的端口時,我們終于可以說,我們第一次找到了促使這反饋閉環更低成本、更高效率、甚至是自動運轉的顛覆性工具——它可以被稱作是一部數據智能的“永動機”,只要有在線的互動,有數據的反饋,機器就永不停歇地學習,實時敏捷地優化。

數據、算法、產品在反饋閉環中三位一體,惟其如此,智能商業才能完成對傳統商業的降維攻擊,DT時代的商業躍升才有了發力點。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢