
微信號后臺有非常之多的關于回歸分析的留言,作為最常見的統計分析方法,在工作生活中的應用需求量巨大,這兩天已經為大家選好了案例數據,先從一元線性回歸分析開始。
一元線性回歸,顧名思義,僅有一個自變量的回歸模型,研究的是一個因素對結果的影響,可以用于預測,也經常被稱之為簡單線性回歸分析。它的模型表達式為:
Y=a+bX+e
回歸的過程就是要確定截距a和回歸系數b的具體值,當然前提條件是模型具備統計學意義。
看案例:
案例數據很好理解,是常見的銷售數據,反映的是某公司太陽鏡一年12個月的具體銷售情況。試分析當廣告費用為15萬元時,預測當月的銷售量值。
幾乎所有的回歸分析問題,首先都從一個散點圖開始,散點圖能夠快速而且直觀的看到自變量和應變量之間是否包含線性關系,如果圖形上看不出明顯線性關系的話,后續的分析效果也不會太好。
散點圖菜單步驟:圖形→舊對話框→散點圖→簡單算點圖,自變量廣告費用用作X軸,銷售量用作Y軸。
由散點圖可以看出,增加廣告投入銷售量隨之上升,一個正相關線性關系,圖示的作用在于讓我們對預測銷售量充滿信心,接下來開始一元線性回歸。
一調出主面板
菜單欄中點擊【分析】→【回歸】→【線性】,彈出線性回歸主功能面板,銷售量作為因變量,廣告費用作為自變量,散點圖顯示二者有較強的線性關系,我們將采取強制【輸入】的方法要求建立一元回歸模型。
二統計按鈕參數設置
默認勾選回歸系數的【估算值】,要求SPSS軟件為我們輸出回歸系數,也就是模型中的參數b,同時默認勾選【模型模擬】,要求軟件幫助我們建議回歸模型是否具有統計學意義。
以上這兩個參數是線性回歸分析必選設置,不能忽略不計。在此基礎上,我們可以根據實際需要選擇其他參數。
本案例勾選【德賓沃森】,要求就模型殘差進行Durbin Watson檢驗,用于判斷殘差是否獨立,作為一個基礎條件來判斷數據是否適合做線性回歸。
三圖按鈕參數設置
上半部分有些復雜,允許我們定制殘差的圖形,作為入門理解,此處建議直接勾選底部【直方圖】和【正態概率圖】,要求軟件輸出標準化殘差圖,同樣用于判斷數據是否適合進行線性回歸。
四保存按鈕參數設置
我們此處分析的目的是為了利用廣告費用來預測銷售量,保存按鈕參數與預測和殘差有關,可以勾選【未標準化】預測值。
在這個對話框上面,有許多參數可選,嚴謹態度出發的話,建議在這里深入學習,本例暫時不討論。
五選項按鈕參數設置
這里建議接受軟件默認選項即可。
主要參數基本設置完成,現在點擊主面板下方的【確定】按鈕,要求SPSS開始執行此次簡單線性回歸分析過程,我們坐等結果。
六主要結果解釋
1、模型摘要表
第三列R方,在線性回歸中也稱為判定系數,用于判定線性方程擬合優度的重要指標,體現了回歸模型解釋因變量變異的能力,通常認為R方需達到60%,最好是80%以上,當然是接近1更好。
本例R方=0.93,初步判斷模型擬合效果良好。
2、方差分析表
剛才我們建立的回歸模型是不是有統計意義,增加廣告費用可銷售量這樣的線性關系是否顯著,方差分析表可以回答這些問題。
直接讀取最后一列,顯著性值=0.000<0.01<0.05,表明由自變量“廣告費用”和因變量“銷售量”建立的線性關系回歸模型具有極顯著的統計學意義。
3、回歸系數表
這是有關此處建模的最直接結果,讀取未標準化系數,我們可以輕松寫出模型表達式,如下:
Y=76.407+7.662X
關鍵的是,自變量廣告費用的回歸系數通過檢驗,t檢驗原假設回歸系數沒有意義,由最后一列回歸系數顯著性值=0.000<0.01<0.05,表明回歸系數b存在,有統計學意義,廣告費用與銷售量之間是正比關系,而且極顯著。
OK,現在我們有了回歸模型表達式在手里,心里總會油然沉甸甸的,因為就連小學生都知道,只要把廣告費用的具體值帶入回歸方程式中,就可以輕松計算出對應的銷售量數據。
不急,在開始預測前還有一項關鍵操作,我們需要檢驗數據是否可以做回歸分析,它對數據的要求是苛刻的,有必要就殘差進行分析。
七適用性檢驗
1、殘差正態性檢驗
從標準化殘差直方圖來看,呈一個倒扣的鐘形,左右兩側不完全對稱,有一定瑕疵;從標準化殘差的P-P圖來看,散點并沒有全部靠近斜線,并不完美,綜合而言,殘差正態性結果不是最好的,當然在現實分析當中,理想狀態的正態并不多見,接近或近似即可考慮接受。
2、模型殘差獨立性檢驗
采用Durbin Watson檢驗來判斷,回過頭來再看模型摘要表。
DW=1.464,查詢 Durbin Watson table 可以發現本例DW值恰好出在無自相關性的值域之中,認定殘差獨立,通過檢驗。
實際上關于回歸模型的適應性檢驗還有其他項目,比如異常點、共線性等檢驗項目,本例暫不展開,有興趣的讀者可以自行學習。
根據以上殘差正態性和殘差獨立性檢驗的結果,本例認為案例數據基本滿足線性回歸要求(值得在其他應用中討論,本例僅展示主要過程),所建立的模型可根據擬合質量進行預測。
八預測
通過前面的一系列分析和論證,我們現在已經得到回歸模型的方程式:Y=76.407+7.662X,
我們的預測任務是當廣告投入達15萬元時,太陽鏡的銷售量,具體計算:Y=76.407+7.662*15=191.337,
至此,建立了廣告和銷售量之間的線性回歸模型,并且實施了預測,那么模型的準確性到底如何呢,有待最終實際銷售比對分析。本例結束。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25