2019-02-11
閱讀量:
1826
多元線性模型中可以將分類變量、順序變量作為自變量嗎?
問題描述:
多元線性模型,特別是研究影響因素的模型,例如研究房價的影響因素有哪些,可以將樓層、學區、地鐵這樣的類別變量直接放進模型嗎?為什么不行?
思路解讀:
不能直接放進模型,因為不能合理解釋回歸系數。
舉例來看,當研究“房屋面積”和“房價”的關系時候,我們解讀系數為“每提示一個單位的x,帶來多少的y”
對于順序變量,例如研究“樓層”和“房價”的關系時候,并不能說每增加一個樓層,就提示多少的房價,因為樣本的總樓層數不一致,不能夠拿三層的別墅和二十幾層的公寓的樓層多少,去研究房價變化
對于分類變量,比如研究“宗教信仰”與“幸福感”的關系中,不能說“無信仰者”比“基督教信仰者”多了多少個單位的x,變量各水平之間并不存在能夠運算的單位關系,只能說不等于而已
因此對于分類變量、順序變量,去研究它們和因變量的關系時候,需要做預處理,即啞變量操作






評論(0)


暫無數據
推薦帖子
0條評論
0條評論
0條評論