熱線電話:13121318867

登錄
首頁精彩閱讀畫圖不裝逼,和咸魚有什么區別,風控中兩個看異常分布的圖
畫圖不裝逼,和咸魚有什么區別,風控中兩個看異常分布的圖
2022-02-17
收藏

作者:小伍哥

來源:小伍哥聊風控

畫圖不裝逼,和咸魚有什么區別,風控中兩個看異常分布的圖

今天放假了回家過年了,分享兩個看異常分布的圖,很好看,也很實用。不會用或者不會畫的,隨時私聊我。畢竟現在過年也沒啥事。

一、箱線圖

箱盒圖(也稱盒圖,箱線圖等)是在1977年由美國統計學家John Tukey發明,分析數據需要為定量數據。通過箱盒圖,可以直觀的探索數據特征。

箱盒圖共有兩個用途:1)直觀地識別數據中異常值(離群點);2)直觀地判斷數據離散分布情況,了解數據分布狀態。

畫圖不裝逼,和咸魚有什么區別,風控中兩個看異常分布的圖

箱盒圖共由五個數值點構成,下邊緣,25%分位數(Q1),中位數,75%分位數(Q3),上邊緣。其中:

1)中橫線 = 中位數

2)下邊緣 = Q1 – 1.5 IQR 其中:IQR=75%分位數(Q3)-25%分位數(Q1)

3)上邊緣 = Q3 + 1.5 IQR

特別說明:箱盒圖里面的上邊緣值并非最大值,下邊緣值也不是最小值。

如果數據有存在離群點即異常值,他們超出最大或者最小觀察值,此時將離群點以“圓點”形式進行展示。

#安裝與加載包install.packages('ggplot2') library(ggplot2)#抽樣部分數據 dsmall = diamonds[sample(nrow(diamonds),5000),]#比較基礎的圖形 ggplot(dsmall,aes(x=color,y=price,fill=color))+
geom_boxplot()+
scale_fill_manual(values=c('blue','cyan', 'yellow', 'orange', 'red', 'Cyan1', 'DeepPink1'))+
facet_grid(.~clarity )
畫圖不裝逼,和咸魚有什么區別,風控中兩個看異常分布的圖
ggplot(mpg,aes(x=trans,y=displ,fill=trans))+theme_bw()
+geom_boxplot()+theme(plot.title  =element_text(size=20,face="bold",
color="red", hjust=0.5,vjust=0.5,lineheight=0.01,family="myFont"),  
            #axis.title.x=element_text(size=12,face="bold",color="black",hjust=0.5),      
            axis.title.y=element_text(size=12,face="bold",color="black",hjust=0.5),      
            #axis.text.x =element_text(size=08,face="plain",color="black",angle=90,vjust=0.5,lineheight=0.01,family="myFont"),       
            axis.text.y =element_text(size=08,face="plain",color="black",family="myFont"),      
            panel.grid=element_blank(),      
            panel.background = element_blank(),      legend.position='none')
畫圖不裝逼,和咸魚有什么區別,風控中兩個看異常分布的圖

業務中的一些圖,不同類目的商品價格,不同城市的消費水平等等,基本上能夠一目了然的發現問題。是一個既實用又裝逼的圖,大家可以試試。

畫圖不裝逼,和咸魚有什么區別,風控中兩個看異常分布的圖
畫圖不裝逼,和咸魚有什么區別,風控中兩個看異常分布的圖

二、密度圖

密度圖特別適合對比黑白樣本同樣的特征的分布問題

qplot(carat,data = dsmall,geom = c('density'),
fill = cut,colour = cut)
畫圖不裝逼,和咸魚有什么區別,風控中兩個看異常分布的圖
qplot(depth,data = dsmall,geom = c('density'),fill = cut,
colour = cut,alpha = I(2/10))
畫圖不裝逼,和咸魚有什么區別,風控中兩個看異常分布的圖
qplot(depth,data = dsmall,geom = c('density'),
fill = cut,colour = cut,alpha = I(2/10))
畫圖不裝逼,和咸魚有什么區別,風控中兩個看異常分布的圖

業務中的一些數據對比,為黑白樣本同一個特征的分布對比,可以看到有比較大的不同

畫圖不裝逼,和咸魚有什么區別,風控中兩個看異常分布的圖
畫圖不裝逼,和咸魚有什么區別,風控中兩個看異常分布的圖

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢