熱線電話:13121318867

登錄
首頁精彩閱讀風控這件事,一半是技術,一半是藝術
風控這件事,一半是技術,一半是藝術
2022-03-24
收藏

作者:小伍哥

來源:小伍哥聊風控

大家好,我是小伍哥,今天跟大家聊個比較深入點的話題,技術好就能做好風控么?

風控算法或風控策略,確實需要很深、很廣泛的技術儲備,但是也需要很高的應用藝術和想象力。風控不像其他業務技術或算法,算法的出現本身就有了比較確定性的場景了,比如推薦,直接套用就行,但是很多算法在風控領域應用的時候,場景需要自己去挖掘和發現。

怎么抽象場景,怎么使用算法,就是一個藝術活了。下面用一個圖異常檢測算法的一個點舉例說明。算法鏈接OddBall-圖異常點檢測

這篇文章,我相信很多讀者看到是圖算法,基本就放棄,認為需要要自己寫很復雜的算法才能部署和實現,其實對這個算法充分理解后,簡單的統計就能用了,難點在于對算法的理解,以及對業務中場景的抽象,我們看看這個算法的一個點。

算法如下:DominantPair(主導邊)這個類型的風險,Dominant heavy links指“主導的邊”,Ego-Net中存在某條邊權重異常大,如下圖所示。

風控這件事,一半是技術,一半是藝術

度量方法:主特征值~總權重,大多數節點Ego-net對應帶權鄰接矩陣中主特征值(principal eigenvalue,即最大特征值)~總邊權重也服從冪律分布,其中系數 λ 表示Ego-net中邊權均勻分布, λ 接近1表示存在DominantPair的情況,衡量的公式如下:

風控這件事,一半是技術,一半是藝術

我們來簡化下這個算法思想:其實一句話,就是一個點有很多個鄰居,某個鄰居權重占所有鄰居總權重的比例特別大

再來個更具體的例子:一個商家一個月賣了10000個訂單,100個消費者,其中一個消費者買了9900單,那這個消費者占比9000/10000=90%,形成了主導邊,那這個商家可能就存在異常。我們其實只要統計商家的總訂單,以及每個商家-消費者維度的訂單聚合,然后相除就解決了,這就是個簡單的SQL計算問題,完全不用什么復雜的寫算法。

風控這件事,一半是技術,一半是藝術

當然,這里的訂單數可以換成金額

訂單換成點擊:可以監控惡意流量什么的

訂單換成領券:可以監控羊毛黨什么的

·········

商家和消費者也可以換成其他的角色,根據自己的平臺設計這種監控指標,我覺得能發現傳統發現不了的異常,因為很少有人這么思考過。

那消費者-換地址關系呢?情況就變了,權重大反而是正常的,小反而不正常,可能是黃牛什么的,因為正常人得地址,相對比較集中,就那個幾個固定的。

風控這件事,一半是技術,一半是藝術

那消費者-充值手機呢?也是同樣的,權重大反而是正常的,小反而不正常,可能是銷贓款或者洗錢什么的。因為正常人,給自己手機充值,或者加幾個家里人和同學什么的,有些賬戶給幾千幾萬人充值,那可能就異常了。

風控這件事,一半是技術,一半是藝術

那這個是不是可以再抽象一點,比如消費者-購物類目關系網絡,按道理,每個人的購物,基本均勻分布在不同的類目,有吃穿的也有用的,如果發現一個用戶,大量購買集中在某些偏門的類目,那是不是有可能這個用戶或者被購買的商家有異常?是不是要買制毒的原材料?是不是在圖謀什么?或者在交易什么?

風控這件事,一半是技術,一半是藝術

每個公司的業務不一樣,但是很多思路,都是可以順著這個算法的結構去思考的,需要充分理解算法,充分理解業務,充分的想象力。

我們看到了異常檢測,看到了圖,但是要更加深入的去看到業務與之匹配的地方,多維度的思考,聯想,并進行應用,才能讓算法產生價值,所以,風控,不僅是技術問題,也是藝術。

風控挖掘的樂趣,大抵也在此了。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢