熱線電話:13121318867

登錄
首頁精彩閱讀風控策略的自動化生成-利用決策樹分分鐘生成上千條策略
風控策略的自動化生成-利用決策樹分分鐘生成上千條策略
2022-02-21
收藏

作者:小伍哥

來源:小伍哥聊風控

本文重點:風控策略挖掘、策略推薦,策略發現,風控策略自動化,決策樹

下面開始正文:

風控策略同學在挖掘有效的風控規則的時候,經常需要基于業務經驗,將那幾個特征進行組合形成風控策略,會導致在特征組合的時候浪費大量的時間,我們有沒有什么方法,替代人工的分析,直接得出策略組合呢,決策樹就是其中的一個選擇,可以實現自動化的挖掘大批量的策略組合。

在眾多的算法中,決策樹整體分類準確率不高,但是部分葉子節點的準確率卻可以很高,因此我們可以提取決策樹的葉子規則,并篩選準確率比較高的葉子節點,作為風控策略挖掘手段,并進行策略推薦,替代人工或者輔助人工,大大提高策略發現的效率于效果。

本文介紹了如何在風控策略中使用決策樹算法來挖掘有效的規則,并會分享自己編寫的提取函數,此套代碼會在極短的時間挖掘上千條規則,快速且有效,目標就是:風控策略自動化,然后干掉自己。

策略節選

一、數據說明及讀取

1、數據集信息

數據從真實場景和實際應用出發,利用個人的基本身份信息、個人的住房公積金繳存和貸款等數據信息,來建立準確的風險控制模型,來預測用戶是否會逾期還款。一共提供了40000帶標簽訓練集樣本,數據僅有一張表,一共有19個基本特征,且均不包含任何缺失值。

2、數據屬性信息

標簽:label是否逾期(是 = 1,否 = 0)。

特征包含以下19個變量,名稱和含義如下。

3、讀取數據

#數據讀取import pandas as pdimport numpy as nppd.set_option('display.max_columns', None)#顯示所有的列path = '/Users/wuzhengxiang/Documents/DataSets/RizhaoGongJiJin/train.csv'train = pd.read_csv(path).fillna(-1)train.columnsIndex(['id', 'XINGBIE', 'CSNY', 'HYZK', 'ZHIYE', 'ZHICHEN', 'ZHIWU', 'XUELI', 'DWJJLX', 'DWSSHY', 'GRJCJS', 'GRZHZT', 'GRZHYE', 'GRZHSNJZYE', 'GRZHDNGJYE', 'GRYJCE', 'DWYJCE', 'DKFFE', 'DKYE', 'DKLL', 'label'], dtype='object')

train.head()#查看前面的數據 id XINGBIE CSNY HYZK ZHIYE ZHICHEN ZHIWU XUELI DWJJLX 日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码