熱線電話:13121318867

登錄
首頁精彩閱讀回歸診斷和殘差分析
回歸診斷和殘差分析
2016-06-14
收藏
回歸診斷和殘差分析

這節我們來學習回歸診斷和殘差分析,殘差是指實際值減去預測值(實際值預測值)的數值。

數據分析的回歸分析,可以方便地求出殘差。使用表1進行回歸分析。

1、“工具”-“數據分析”,選擇“回歸”,單擊“確定”。

2、彈出“Excel的回歸分析”對話框。選中對話框下方的“殘差”,單擊“確定”(圖1)。

回歸分析的運行結果如表2所示。

殘差分析

接下來,把表2的殘差用直方圖表示。制作直方圖的步驟如下:

1、“工具”-“數據分析”,選擇“直方圖”,單擊“確定”。

2、彈出“直方圖”對話框。在“輸人區域”中選擇殘差這列數據,包括項目名稱。在“接收區域”不做任何操作(“接收區域”的輸入內容不限。不做任何操作時,Excel自動進行計算)。選中“標簽”,在對話框下方選中“圖表輸出”,單擊“確定”(圖2)。

直方圖的輸出結果如表3、圖3所示。

若殘差的直方圖是正規分布圖形,則判斷模型良好。圖3是接近正規分布的圖形。

接下來求殘差的“描述統計”。通過求殘差的“描述統計”,把握“平均值”和“中位數”、  “最大值”、  “最小值”,可知數據的傾向和特征。求殘差“描述統計’的操作步驟如下:

1、“工具”-“數據分析’,彈出“數據分析”對話框(圖4)。選擇“描述統計”,單擊“確定”。

2、彈出“描述統計”對話框。在“輸入區域”中,選擇殘差的區域。包括項目名稱。選中“標志位于第一行”和“匯總統計”,單擊“確定”(圖5)。

輸出結果,如表4所示。

從表4可知,殘差的平均值是0,總和也是0。

回歸模型中出現殘差(誤差)的前提條件是:平均值及總和是0,標準誤差符合正規分布。

接近正規分布時,峰度也接近0。上述表格的峰度是0.38,偏度是0.10.都是接近0的數值,因此可以判斷這是接近正規分布的圖形。刪除“顏色”進行回歸分析和殘差分析

這里故意刪除影響度最大的“顏色”因子進行回歸分析。殘差的直方圖會怎樣變化昵?殘差可能會出現偏頗或偏差,脫離正規分布吧!

圖6是刪除“顏色”因子的殘差直方圖。

與圖3相比,看似只有細微差異,其實正規分布已被打破。因為從視覺上難以看出差異,所以需要求解殘差的描述統計(表5)。

表4和表5的比較結果如下所示(表6)。

表5的中位數是11.49。刪除“顏色”因子進行回歸分析后,產生了偏差。

那么,殘差的標準誤差會發生怎樣的變化呢?從66.53-98.72,而且數據區域擴大,最大值和最小值也變大(變?。???梢?,通過描述統計可以判斷差異的大小。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢