熱線電話:13121318867

登錄
首頁職業發展大數據背景下的風控與征信 專訪中科院院士、北大元培學院院長鄂維南教授
大數據背景下的風控與征信 專訪中科院院士、北大元培學院院長鄂維南教授
2018-02-20
收藏

大數據背景下的風控與征信 專訪中科院院士、北大元培學院院長鄂維南教授

訪談:鄂維南,中國科學院院士,北大元培學院院長,普林斯頓大學數學系和應用數學研究所教授。

大數據和大數據技術

王曉蕾(以下簡稱“蕾”):很高興鄂院士在百忙中接受我們的采訪。根據我的初步理解,目前大數據在金融中的運用,主要是通過大數據做風險控制,建立風險模型預測還款可能性,從而決定授信額度和定價。您怎樣看待大數據在風險管理中的應用?

鄂維南(以下簡稱“鄂”):要講清楚這個問題,我們首先要區別一些概念,首先是大數據和大數據技術,前者是指的數據及可用于風險管理的數據問題,后者是指一些諸如機器學習、神經網絡、支持向量機SVM)等大數據算法。

從數據源的角度,我認為,與個人有關的信息從外到里可以分為三層:第一圈是關于個人的所有信息,第二圈是關于個人的所有履約信息,第三圈是信貸履約的信息。在之前傳統的風控中,我們一般利用最里圈的信貸履約信息,加上部分個人基本信息等來預測信貸違(履)約情況。隨著互聯網和信息技術的發展,部分方便可得的外圈信息,對于內圈的履約預測慢慢地被證明有一定的效果,例如打車的履約情況對信貸履約的判斷是一個依據,因此大數據風控隨之逐漸興起。但對于不同圈別數據的跨圈使用,特別是外圈數據往內圈使用的過程中,要特別解決法理約束和本人授權兩個問題,這樣有利于各種數據在風險評估領域中的可持續使用。

王:您這樣說非常清楚。目前,部分放貸機構對替代性數據(Alternative Data)的使用,我的理解就是對非現金化的債務履約信息的使用。當消費者缺乏信貸債務及其履約信息時,可以利用這些水電煤等先消費后付款的信息,通過考察消費者的重復履約意愿和能力來進行信貸風險管理。我們熟知的美國澤斯塔(ZestFinance)金融公司,所使用的“替代性”數據主要包括水電燃氣費等先消費后付款消費信息,當然,信息主體本人授權是一個基本原則。

鄂:以上說的是大數據問題,再從大數據技術角度來看,任何大數據方法用于信用風險的評估,要滿足三個條件:一是明確的,對評分建模的方法論、過程和數據使用上是明確的,對監管、對公眾是應該公開的:二是準確的,建立的模型要對不同風險狀況的人群有區分能力和排序能力;三是穩定的,數據、方法和模型在人群、時間跨度上是穩定的。從傳統的邏輯回歸,到決策樹,再到機器學習等大數據方法的使用,要始終堅持開發出來的模型“明確、準確和穩定”的三大特點。

王:據我了解,有些利用大數據中的機器學習技術開發的模型是明確的,有些是不明確的。

鄂:是的??傮w而言,對于大數據和大數據技術,目前,在風險控制中,可以是在遵守一定規則上開放性使用,但是對于征信領域,在數據的來源上建議適當保守些,這主要是征信對評分開發模型的明確性要求更高。但是盡管如此,在數據的處理方法上,都可以進行不同的嘗試和探索,因為大數據技術的發展,就是將可以使用的信息,包括傳統的信息和現實生活中映射到互聯網的各種信息極大的簡化為一個分數,供放貸機構高效、便捷的使用。

風控與征信之異同

王:按照您剛才說的,我理解是,一些熱門的大數據技術可以做風控、但不能做征信,為什么這么說呢?

鄂:要理解這個觀點,得先從風控和征信的本質特征出發來看。我們知道風控是放貸機構自己的事情,而征信則是第三方機構的信息服務,后者是為前者的風控服務的,對于信息的使用及其借款人對信息的知情權等方面,兩者是有根本性的區別的。所以我剛才講了,大數據技術開發的評分模型可以滿足準確、穩定的要求,但是在明確、可解釋性方面,尚待市場的檢驗。

放貸機構為了風控,可以竭盡所能地收集各類或真實的信息或待證實的噪音,且對借款人作的放貸決策也是完全基于自己的商業目的考慮。但是,征信機構對信息的收集、加工和對外提供,則是完全按照市場和放貸機構認可、信息主體知情的方式進行,征信機構向放貸機構提供的所有針對借款人個人的信息,如基礎性的信用報告,是基于基本客觀事實的匯總,經得起借款人本人質疑、挑戰的,信用報告的內容、流程、流轉過程和使用判斷是受到監管的。

此外,我知道美國的征信機構一般是先提供了經得起檢驗的信用報告,為信息主體本人提供信用報告查詢服務之后,再提供基于信用報告標準化解讀的各類信用評分服務,我想也是有這樣一個明確性要求在里面。為了確保個人信息沒有被濫用,評分流程的基本方法、理念、結果是需要對外披露,并接受監管部門的全程監管的。特別是當放貸機構基于征信機構的服務(如信用報告、個人信用評分),做出了不利于借款人的決策時,如拒絕借貸、提高費率、降低額度等,消費者是有知情權的。

王:非常贊成您的觀點,保護借款人(即信息主體)對征信系統本身及其本人信息被采集使用情況的知情,是征信行業的國際慣例,也是保證第三方征信機構獨立、可信賴地位的基石。

鄂:是的。在大數據的背景下,各種可以預測違約的數據在豐富性、廣度和深度上出現了極大的增加,但是對大數據的使用不會也不應該動搖剛才提到的征信與風控間的基本框架。例如,一些大型互聯網公司,掌握了大量的個人互聯網行為信息,這些信息可以用于公司內部的風險管理和放貸決策,但是如果一旦用于第三方征信,則相關互聯網信息的使用和對外提供,必須經受技術、用戶、法律、認知等社會方方面面的考驗,滿足公平公正合法等基本要求。

王:但是我們目前這方面的法律規定還不太完善。

鄂:沒有法律規定也不一定是可以為之的,征信機構的活動涉及消費者的切身利益,如果因為征信機構的服務,如提供了消費者不知情或認為不準確的信息,導致消費者的金融消費,如放貸、車貸等受阻,我認為消費者也是有權告第三方征信機構的。征信不是鬧著玩的,不建議目前部分機構采取抱著試試看的態度,來看哪些數據和技術可用于風險評估,并遞延到征信服務上,有些事情要事先考慮清楚。

王:在大數據時代,征信機構利用大數據技術對借款人風險水平的預測模型,如果經過市場檢驗是有效的情況呢?

鄂:這是另一個問題,即便是對一群人的模型預測有效,但是用不成熟、不被大家接受的新技術和新方法,對個人進行風險預測并給個人的經濟生活帶來影響,征信機構也有被司法起訴的風險,包括美國費埃哲(FICO)公司當時也是這樣的,模型和技術要有可解釋性,符合社會公眾的可接受度,這樣才能站得住腳。從有效性角度來看,社交網絡信息對于營銷、對于反恐等被證明是有效的,但是對于征信的有效性,還是一個有待證明的另一個問題。

王:大數據在風控運用上的一些創新確實存在,例如,傳統上主要是利用信用信息、財產信息來預測違約,目前依托信息和技術進行了一些創新,如有機構發現借款人手機的被叫時長、朋友圈的信息和違約有一定的關系,而將這些變量作為預測變量入模分析。

鄂:您說的可能是某個機構根據某些信息得出的一個初步結論,可能會被常識支持,但是這僅僅是一些數據環境下的一個判斷,是否經得起檢驗、站得住腳,我認為還不能過早下結論。即便有效,我還是那個觀點,這個結論可以被放貸機構的風控所用,但是否可為征信機構所用,還用待觀察。

王:就我們而言,征信系統一是收集放貸機構等無論怎么努力也基本得不到的信息,如借款人在另一家放貸機構的借款信息,之后供放貸機構共享,二是收集放貸機構等可以采集但是成本較高的信息,如法院判決信息,方法是統一采集、大家共用。征信系統提供的以上兩部分信息都是放貸機構的外部信息一部分,放貸機構風控所使用的信息一定遠遠超過征信機構提供的信息。

鄂:是的,征信機構的信息永遠是放貸機構風控的一個重要信息和工具的來源。其實,目前使用大數據模型中,我認為很多變量是用來驗證信息的真偽的,但是,預測違約率還是用傳統的信貸信息一些核心變量,目前來看,預測未來履約的信息范圍和方法論并沒有真正擴大和突破。

王:非常感謝您的交流。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢