
SPSS統計分析案例:多項logistic回歸分析
在實際應用中,可能還會碰到因變量是多個分類的情況,并且不包含排序信息。比如視力分為輕度、中度、重度三個水平,此時如果想考察與視力評價有關聯的指標,常用的二項logistic回歸已經無法勝任。
幸好,SPSS軟件為我們提供了多項logistic回歸。
logistic回歸對數據的要求
因變量:分類變量,要求是(含)三個以上分類水平;
自變量:可以是分類變量或連續變量,建議是分類變量;
協變量:必須是分類變量。
概念什么的,先不說,即使說,小兵我也說不清楚,看了案例自然就了解了。用SPSS學統計的好處就是這,辣眼睛的統計原理可以通過案例實踐來逐步理解掌握。
案例數據
該假設數據文件涉及一份880人參于的關于早餐喜好的民意調查,該調查記錄了參與者的年齡、性別、婚姻狀況以及生活方式是否積極,每個個案代表一個單獨的響應者。
調查機構想搞清楚是什么影響著受訪人每天吃什么早餐。因變量“早餐選擇”包括(1=早餐攤點、2=燕麥類、3=谷物類),自變量暫定年齡、婚姻狀況以及生活態度。
分步驟說明
菜單欄中依次選擇【分析】【回歸】【多項logistic】,打開主面板。
因變量、自變量分別按照箭頭指示移入對應的變量框內,然后最為重要的是,點擊【參考類別】按鈕,默認勾選【最后一個類別】。
什么意思呢?大意是指以因變量和自變量的最后一個分類水平為參照,用其他分類依次與之對比,考察不同水平間的傾向。
主面板中,點擊【模型】按鈕,打開【多項logistic回歸:模型】對話框,勾選【主效應】,本例主要考察自變量年齡、性別、婚姻狀況的主效應,暫不考察它們之間的交互作用,然后點擊【繼續】。
主面板中,點擊【統計】按鈕,設置模型的統計量。主要【偽R方】【模型擬合信息】【分類表】【擬合優度】這幾項必選,其他可以默認不勾選。這些參數主要用于說明建模的質量。
主面板中,點擊【保存】按鈕,勾選【估算響應概率】,我們要求SPSS軟件幫我們估算每個個案三類早餐的概率。
其余的參數主要和逐步回歸有關系,本例采用主效應模型,人為指定進入模型的自變量,在其他研究中,可以根據情況選擇逐步回歸。
下主面板底部點擊【確定】按鈕,軟件開始執行此處建模。
多項logistic回歸結果解讀
![]()
個案處理摘要表,列出因變量和自變量的分類水平及對應的個案百分比。建議在此表主要讀取變量分類水平的順序,比如自變量“年齡段”,第一個分類是“低于31歲”,第二個分類是“31-45”,第三個分類是“45-60”,第四個分類是“60歲以上”,尤其是看清楚最后一個分類,因為我們前面參數設置時要求是以最后一個分類最為對比參照組的。誰和誰對比,一定要搞清楚。
模型擬合信息表,讀取最后一列,顯著性值小于0.05,說明模型有統計意義,模型通過檢驗。
擬合優度表,原假設模型能很好地擬合原始數據,最后一列皮爾遜卡方顯著性值0.952,概率較大,說明原假設成立,模型對原始數據的擬合效果良好。
偽R方表,依次列出的3個偽R方值(類似于決定系數)均偏低,最高0.4,說明模型對原始變量變異的解釋程度一般,還有一部分信息無法解釋,結果不算好。
模型似然比檢驗表,我們能看到最終進入模型的效應包括截距、年齡、婚姻狀況、生活態度,而且最后一列顯著性值表明,三個自變量(影響因素)對模型構成均有顯著貢獻,研究它們是有意義的。
參數估計表,列出自變量不同分類水平對早餐選擇的影響檢驗,是多項logistic回歸非常重要的結果。
第二列B值,即各自變量不同分類水平在模型中的系數,正負符號表明它們與早餐選擇是正比還是反比關系。第六列是瓦爾德檢驗顯著性值,此值小于0.05說明對應自變量的系數具有統計意義,對因變量不同分類水平的變化有顯著影響。
比如,早餐攤點和谷物類早餐相比,31-45歲的年輕人更偏向于選擇在早餐攤點吃早餐,這種可能性是60歲以上人的3.7倍;燕麥類和谷物類早餐相比,結婚與否對早餐的選擇沒有差別。
除此之外,我們前面還要求軟件保存了每個個案早餐選擇的概率,返回數據編輯器窗口,具體來看結果。
原始數據最右側新增3個變量,依次為EST1_1、EST2_1、EST3_1,分別對應因變量“早餐選擇”的三個分類水平(早餐攤、燕麥類、谷物類)的響應概率。比如第一個個案,他選擇谷物類早餐的概率為0.55,在三種選擇中數值最大,因此,模型會判定他選擇谷物類早餐,這和原始記錄的真值一致,說明模型判斷準確。
當然,SPSS軟件也輸出了模型預測分類表,如下所示。
模型在預測燕麥類早餐選擇傾向上準確率最高,達到77%,其他兩個早餐選擇的預測略低,模型總體預測準確率為57.4%,表現一般。前面偽R方數據顯示,模型對總體變異的解釋能力不足,這和總體預測準確率結論也一致。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25