2020-06-21
閱讀量:
2085
多分類變量轉成數值標簽的時候,轉成1、2、3 或者 轉成2、4、6,放入模型中的時候有區別嗎?
如果各分類之間沒有順序關系, 比如民族,血型等分類變量,可以轉換成1,2,3.....,這時的1,2,3只是代碼,不考慮數值本身大小的屬性;
如果分類之間又順序關系,比如學歷,職級等,最好不要直接轉換成1,2,3這種,可以嘗試獨熱編碼。






評論(0)


暫無數據
推薦帖子
0條評論
0條評論