熱線電話:13121318867

登錄
首頁精彩閱讀SAS數據挖掘實戰篇【七】
SAS數據挖掘實戰篇【七】
2016-04-10
收藏

SAS數據挖掘實戰篇【七】



6.5  SAS EM數據挖掘-----預測模型
1  問題定義

目標:建立模型預測貸款申請的信用狀態,選擇最優的模型來預測和減少損失。
數據集:SAMPSIO.DMAGECR
數據集大?。?000
變量數目:21(20個輸入變量,1個目標變量)
變量描述
 
該損失矩陣將產生和第一個損失矩陣相似的決策,但是第二個矩陣產生的統計描述更加容易理解。
在訓練數據集中,
未預測數據:SAMPSIO.DMAGESCR
數據集大?。?5(沒有GOOD_BAD變量)
 
2  創建數據挖掘工程

4  設置目標變量
選擇變量選項卡,右擊GOOD_BAD的模型角色,設置變量角色為target。

5  為GOOD_BAD變量定義目標Profile
目標資料主要定義三種信息
(1) 分類變量的目標級別
(2) 決策矩陣
(3) 先驗概率

在變量選項卡中右擊GOOD_BAD目標變量,編輯目標信息

設置目標事件級別
為GOOD_BAD變量定義決策矩陣
選擇評估信息選項卡,顯示四個預定義的矩陣

6  查看區間變量和類別變量的統計信息
可以發現沒有缺失值,但是AMOUT變量傾斜度過高





創建順序分組變量
選擇目標關聯選項卡,設置變量選擇方法為卡方。
運行節點,查看結果。
在21個變量中,9個是rejected,包括分組變量AGE_GA2Y,將其設置為input

10  創建逐步回歸邏輯模型


12  評估模型

運行評估節點,查看模型比較。從工具菜單中選擇提升圖。

 
13  定義評分數據集

 
打開score節點,選擇如下



15  查看期望損失

 



 

在program選項卡中輸入下面的代碼,顯示信用好的貸款申請者
options nocenter nodate;
data goodapps;
set &_SCORE;
if D_GOOD_BAD_ = 'accept';
run;
proc print data = goodapps lable;
var custid D_GOOD_BAD_ EL_GOOD_BAD_;
title "Good Credit Risk Applicants";
run;


17  創建報告
查看創建的報表,在瀏覽器中查看。
18  關閉工程,完成項目。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢