熱線電話:13121318867

登錄
首頁精彩閱讀SPSS統計分析案例:一元線性回歸
SPSS統計分析案例:一元線性回歸
2017-03-05
收藏

SPSS統計分析案例:一元線性回歸

微信號后臺有非常之多的關于回歸分析的留言,作為最常見的統計分析方法,在工作生活中的應用需求量巨大,這兩天已經為大家選好了案例數據,先從一元線性回歸分析開始。

一元線性回歸,顧名思義,僅有一個自變量的回歸模型,研究的是一個因素對結果的影響,可以用于預測,也經常被稱之為簡單線性回歸分析。它的模型表達式為:

Y=a+bX+e

回歸的過程就是要確定截距a和回歸系數b的具體值,當然前提條件是模型具備統計學意義。


看案例:

案例數據很好理解,是常見的銷售數據,反映的是某公司太陽鏡一年12個月的具體銷售情況。試分析當廣告費用為15萬元時,預測當月的銷售量值。

幾乎所有的回歸分析問題,首先都從一個散點圖開始,散點圖能夠快速而且直觀的看到自變量和應變量之間是否包含線性關系,如果圖形上看不出明顯線性關系的話,后續的分析效果也不會太好。

散點圖菜單步驟:圖形→舊對話框→散點圖→簡單算點圖,自變量廣告費用用作X軸,銷售量用作Y軸。

散點圖可以看出,增加廣告投入銷售量隨之上升,一個正相關線性關系,圖示的作用在于讓我們對預測銷售量充滿信心,接下來開始一元線性回歸。

一調出主面板

菜單欄中點擊【分析】→【回歸】→【線性】,彈出線性回歸主功能面板,銷售量作為因變量,廣告費用作為自變量,散點圖顯示二者有較強的線性關系,我們將采取強制【輸入】的方法要求建立一元回歸模型。

二統計按鈕參數設置


默認勾選回歸系數的【估算值】,要求SPSS軟件為我們輸出回歸系數,也就是模型中的參數b,同時默認勾選【模型模擬】,要求軟件幫助我們建議回歸模型是否具有統計學意義。

以上這兩個參數是線性回歸分析必選設置,不能忽略不計。在此基礎上,我們可以根據實際需要選擇其他參數。

本案例勾選【德賓沃森】,要求就模型殘差進行Durbin Watson檢驗,用于判斷殘差是否獨立,作為一個基礎條件來判斷數據是否適合做線性回歸。

三圖按鈕參數設置

上半部分有些復雜,允許我們定制殘差的圖形,作為入門理解,此處建議直接勾選底部【直方圖】和【正態概率圖】,要求軟件輸出標準化殘差圖,同樣用于判斷數據是否適合進行線性回歸。

四保存按鈕參數設置

我們此處分析的目的是為了利用廣告費用來預測銷售量,保存按鈕參數與預測和殘差有關,可以勾選【未標準化】預測值。

在這個對話框上面,有許多參數可選,嚴謹態度出發的話,建議在這里深入學習,本例暫時不討論。

五選項按鈕參數設置

這里建議接受軟件默認選項即可。

主要參數基本設置完成,現在點擊主面板下方的【確定】按鈕,要求SPSS開始執行此次簡單線性回歸分析過程,我們坐等結果。

六主要結果解釋

1、模型摘要表

第三列R方,在線性回歸中也稱為判定系數,用于判定線性方程擬合優度的重要指標,體現了回歸模型解釋因變量變異的能力,通常認為R方需達到60%,最好是80%以上,當然是接近1更好。

本例R方=0.93,初步判斷模型擬合效果良好。

2、方差分析

剛才我們建立的回歸模型是不是有統計意義,增加廣告費用可銷售量這樣的線性關系是否顯著,方差分析表可以回答這些問題。

直接讀取最后一列,顯著性值=0.000<0.01<0.05,表明由自變量“廣告費用”和因變量“銷售量”建立的線性關系回歸模型具有極顯著的統計學意義。

3、回歸系數表

這是有關此處建模的最直接結果,讀取未標準化系數,我們可以輕松寫出模型表達式,如下:

Y=76.407+7.662X

關鍵的是,自變量廣告費用的回歸系數通過檢驗,t檢驗原假設回歸系數沒有意義,由最后一列回歸系數顯著性值=0.000<0.01<0.05,表明回歸系數b存在,有統計學意義,廣告費用與銷售量之間是正比關系,而且極顯著。

OK,現在我們有了回歸模型表達式在手里,心里總會油然沉甸甸的,因為就連小學生都知道,只要把廣告費用的具體值帶入回歸方程式中,就可以輕松計算出對應的銷售量數據。

不急,在開始預測前還有一項關鍵操作,我們需要檢驗數據是否可以做回歸分析,它對數據的要求是苛刻的,有必要就殘差進行分析。

七適用性檢驗

1、殘差正態性檢驗

從標準化殘差直方圖來看,呈一個倒扣的鐘形,左右兩側不完全對稱,有一定瑕疵;從標準化殘差的P-P圖來看,散點并沒有全部靠近斜線,并不完美,綜合而言,殘差正態性結果不是最好的,當然在現實分析當中,理想狀態的正態并不多見,接近或近似即可考慮接受。

2、模型殘差獨立性檢驗

采用Durbin Watson檢驗來判斷,回過頭來再看模型摘要表。

DW=1.464,查詢 Durbin Watson table 可以發現本例DW值恰好出在無自相關性的值域之中,認定殘差獨立,通過檢驗。

實際上關于回歸模型的適應性檢驗還有其他項目,比如異常點、共線性等檢驗項目,本例暫不展開,有興趣的讀者可以自行學習。

根據以上殘差正態性和殘差獨立性檢驗的結果,本例認為案例數據基本滿足線性回歸要求(值得在其他應用中討論,本例僅展示主要過程),所建立的模型可根據擬合質量進行預測。

八預測

通過前面的一系列分析和論證,我們現在已經得到回歸模型的方程式:Y=76.407+7.662X,

我們的預測任務是當廣告投入達15萬元時,太陽鏡的銷售量,具體計算:Y=76.407+7.662*15=191.337,

至此,建立了廣告和銷售量之間的線性回歸模型,并且實施了預測,那么模型的準確性到底如何呢,有待最終實際銷售比對分析。本例結束。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢