
大數據征信究竟是個什么鬼?能有多神奇?商業化前景存疑
在征信行業的發展過程中,評估模型的依據通常是基于個人的信用歷史和還款表現。這類數據背后的邏輯是以個人過往信用的質量來推斷他未來的信用表現。在新的大數據征信系統中,信用評估的來源更加廣泛,社交網絡與電子商務行為中產生的海量數據,都能給用戶行為提供側面支持。
大數據征信可以通過我們在互聯網上留下的這些“足跡”清晰地描繪出一個人,但如何把控數據源的“量”與“度”,各家機構還在不斷嘗試。更重要的是,最終繪制出的人物“肖像”與個人信用究竟有多大的關聯度,至今仍存有爭議。
此前亦有接近監管部門人士對《第一財經日報》記者表示,個人征信牌照遲遲未能落地,其原因之一也在于監管部門對于大數據征信的商業化應用存有疑慮。尤其,以人臉識別為代表的關鍵技術的可靠性還有待進一步檢驗。
此外,“另一個更重要的癥結在于行政化監管與商業化發展之間的矛盾?!痹撊耸勘硎?,現在個人征信市場的參與者越來越多,遠不止申請牌照的八家機構,如果該市場要商業化發展,那么監管方式就要改進。
大數據征信究竟是個什么鬼?
在FICO中國區總裁陳建看來,征信的本質就是采集和記錄信用信息并在整理加工后提供給決策者,而如今,得益于大數據、云計算、人臉識別、深度算法等技術的進步,征信有了更廣泛的意義和用途。
“只要對消費者的特征描繪和風險判斷有顯著作用的就可以叫征信?!标惤ㄕJ為, 現在一切信息皆可以成為信用數據,經過分析后用于證明一個人或企業的信用狀況。因為數據覆蓋廣、維度多,因此形成了廣義的征信,也就是大數據征信。
陳建表示,有價值的大數據具備幾個因素:第一要覆蓋面廣,用戶足夠多,例如銀聯、電信的數據;第二維度要有效,能夠有效轉為結構化的數據,例如電商的數據;第三信息要穩定。
不過,對于這種日益崛起的征信新業態,今年7月在上海外灘舉辦的“2015上海新金融年會”上,央行征信中心副主任王曉蕾直截了當地提出了疑問,“我不知道你們說的‘征信’是什么”?
央行的征信系統是一個“放貸人之間的信息共享數據庫”,主要采集的數據為身份信息、信貸信息、非金融負債信息三類,以及部分公共信息。因此,王曉蕾對于征信的基本定義為,“從放貸人那里采集借款人信息”。
而另一個“糾結”的概念在于,王曉蕾認為,放貸機構之“征信”是放貸機構基于內部信息的風險管理過程,而征信行業之“征信”是為放貸機構的風險管理提供外部信息支持的活動,征信機構應該是一個純粹的獨立第三方。
如果按照這個界定,我們現在所談到的大數據征信跳脫了傳統“征信”范疇內。不再局限于金融屬性的信息,并且也打破了“采集者與信息產生沒有任何關系”的獨立第三方原則。
例如芝麻信用、前海征信、騰訊征信,一方面它們的數據來源目前還主要來自母公司阿里、平安、騰訊,而另一方面,它們的兄弟公司又涉足放貸業務,例如阿里小貸。
盡管有關大數據征信的定義和效用仍爭議不斷,但對于既無法接入央行征信系統又面臨快速發展的互聯網金融行業而言,利用大數據來幫助判定風險、開拓業務已是必然的選擇。
從應用范圍來看,目前大數據征信已從金融業務向生活服務蔓延。其中,最核心的兩個價值就是:防范欺詐風險和信用風險。簡單來說就是:既要證明“你是你”,還要描述出“你是什么樣的人”。
利用數據證明“你就是你”
無論是在傳統金融領域,還是互聯網金融領域,給客戶做信用評估的前提是必須知道這個人就是他自己。所以,如何利用證明“你是你”是大數據征信首先要解決的問題。
尤其,隨著越來越多的金融業務互聯網化,“反欺詐”面臨的挑戰也日益增大?!吧矸菡J證”的重要性在各項監管文件中反復被強調,而各家機構也在不斷探索如何利用新的技術在網上實現身份的核實。
其中,在指紋、虹膜、人臉識別等一系列生物識別技術中,人臉識別因技術的成熟度和準確率較高,以及其使用的便捷性而被進一步普及。包括騰訊征信、芝麻征信在內的多家個人征信機構都有組建自己的人臉識別技術團隊。
此前,在騰訊征信的北京媒體溝通會上,為騰訊財付通、微眾銀行、騰訊征信等提供圖像和模式識別技術支持的優圖團隊也向大家展示了“人臉識別”在“反欺詐”方面的應用,即如何證明“你是你”。
根據現場的演示,在上傳身份證照片、自拍照片并與公安部的信息進行比對之后,“人臉識別”的另一關鍵步驟是活體檢測,通過讀取隨機的數字串,分析聲音和唇語等信息來防范有人用視頻、照片等方式仿冒用戶。
據了解,在今年國際權威的人臉識別數據庫LFW上,騰訊優圖團隊在人臉驗證測試中達到了 99.65%的準確率。目前,微信的“人臉識別”技術已經在騰訊征信、微眾銀行、微證券開戶等場景中開始試用。
盡管人臉識別的準確率已經達到較高水平,但該項技術的商業化應用才剛剛起步,它的有效性和安全性仍備受質疑。
優圖團隊研發總監黃飛躍也表示,該技術現在還不能說100%地成熟,而是適用于某些特定的應用環境中。其中,金融領域的身份核實條件較好,由于用戶往往是為了通過驗證所以比較配合。
芝麻信用首席科學家俞吳杰表示,整個的反欺詐產品從身份認證到信息驗證再到網絡關聯,每一步的技術含量非常高。以身份認證為例,現在已有很多的途徑,比如信息交叉比對、人臉識別技術、KBA問答認證等。
他以網絡關聯技術為例說明:它能把所有出現過違約行為的身份、手機、設備等關鍵點都在風險庫里面分門別類地保留下來,我們可以通過一層或者多層關聯找出所有的風險點供合作伙伴參考,這對技術和硬件要求都非常高。
數據與信用的相關性到底有多大?
解決了“身份認證”的問題,接下來就要評估你的信用,即描述出“你是什么樣的人”。
在關于大數據征信的文章中,我們經??梢钥吹揭恍┌咐?,如經常半夜上網的用戶可能被認為沒有穩定的工作而降低信用評分,買雙開門冰箱的用戶可能因為有家庭而信用評分較高,微博更新頻繁的用戶可能因為社交活躍而信用評分較高等。
“這些考量因素被過度放大了,也許這只是用戶個人習慣而已。但每一個因素與個人信用的相關性有多大?我們還無法完全解釋,尤其當數據源不足夠豐富時,這些評判便存在欠缺?!敝ヂ樾庞玫募夹g專家景藝亮表示。
冰鑒科技CEO顧凌云在回國前曾領導并開發了Zest Finance前四代風控模型,在他看來,大數據征信的核心并不是對某個變量極其依賴,而是把很多個都只有微小影響的變量通過非線性的算法整合在一起,從而使模型的整體表現更好。
“大數據其實并不一定就是數據量本身大,我們講求的是變量涵蓋的信息維度要多和均衡,然后才是能夠通過淺度學習和深度學習等多種復雜的算法把這些變量更有效地糅合在一起?!彼硎?。
王曉蕾認為,互聯網記錄了借款人以前不可記錄的行為,獲得了以前無法獲取或獲取成本很高的數據,為放貸人了解借款人是誰、有沒有還款能力和還款意愿提供了新的渠道和方法。但是,相關的信息究竟如何使用有待進一步研究驗證。
王曉蕾引用2014年美國政策與經濟研究委員會(PERC)的一項研究結果稱,非金融信息在信貸決策中的作用有限。例如,社交信息對于判斷借款人的還款意愿和能力暫無預測力。
“諸如水、電、煤、有線電視、手機等非金融信息納入征信系統,顯著地提高了薄信用檔案人群的信貸獲得能力,但對于厚信用檔案人群而言,邊際作用不大?!彼硎?。
“只有好樣本,沒有壞樣本是無法建立有效的信用評估機制的?!?宜信至誠征信的董事總經理趙卉表示,電商、支付、社交等數據只能作為信貸審核的參考值,而貸后數據才是強參數。
對于這種論斷,互聯網公司們或是不贊同的。
騰訊征信總經理吳丹告訴記者,從這段時間內測的結果來看,在模型中加入社交數據以后,對它的風控能力有20%~25%的提升,尤其在小額貸款領域。因為,通常一筆幾百塊的借款,違約發生的原因不在于借款人的還款能力而是意愿。
俞吳杰表示,通過大量的研究證明,人的行為數據和他的信用有直接關聯,因為行為很難撒謊。從這段時間公測的結果來看,用戶的芝麻分越高,其貸款的違約率越低,二者呈單調、線性的關系,這也證明了芝麻分在信用評估上的有效性。
不過,僅僅依靠互聯網上的數據并不足以建立一個強大的信用評估體系。顯然,所有大數據征信的市場參與者都深知這一點?!霸谖磥?,把傳統數據和創新數據結合到一起,一定是我們要到達的終點?!敝ヂ樾庞玫目偨浝砗先绱丝偨Y到。
顧凌云告訴記者,風控模型本質上還是對一個人金融還貸能力的預測和評估,所以,盡管Zest Finance大量采用非傳統的信用數據,但在大部分的風險評估模型中,傳統的信用數據(銀行信貸數據)依然占有一定的比重,平均也在40%左右。
大數據征信并非獨立存在,也不是另起爐灶。預判一個人的行為,從任何角度來看,都是非常困難的一件事情。數據對于風險控制的幫助,更多的是集中在量化概率與可能性的判斷之上。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25