
SPSS分析技術:含時間依存性自變量的Cox回歸分析
在介紹Cox回歸模型時,我們提到過Cox回歸模型有一個基本假設,就是納入模型中的自變量不具有時間依存性,也就是自變量對風險函數的影響不隨時間的變化而變化,如果違反這條假設,就需要將時間的影響也納入模型一起考量,這就是具有時間依存變量的Cox回歸模型。
模型原理
在進行生存分析時,有些自變量對風險函數(事件發生概率)的影響會隨時間的變化而變化,這種現象在醫學領域其實非常常見。例如,二次世界大戰以后,很多學者研究美國投放在日本廣島和長崎的兩顆原子彈的核輻射對日本婦女乳腺癌發生率的影響,其中人們接觸到的核輻射量(自變量)會隨時間的推移逐漸減低,這個自變量就不符合Cox回歸模型的假設,此時應該使用考量時間效應的Cox回歸模型。
在上一篇的Cox回歸模型文章中,我們已經知道是否術中放療對風險函數(術后患者的生存時間分布)有顯著性影響,術中放療的患者的平均生命時間比沒有術中放療的患者更長。Cox回歸模型又稱為比例風險模型,因為它對自變量有假設,要求自變量對風險函數的影響不隨時間變化而變化。
在Cox回歸模型中,可以通過圖形來主觀判斷自變量是否符合上面的假設,如下圖所示,在log minus log圖形中,兩條生存曲線是幾乎平行的,可以幫助分析者判斷是否術中放療對風險函數的影響是符合恒定比例假設的。
先回顧一下Cox回歸模型:
具有時間依存自變量的Cox回歸模型可以分成兩種:第一種是自變量的取值不隨時間變化,只是同樣的自變量取值對生存時間分布的影響效應變化了,這種自變量稱為外在時間依存自變量。模型公式可以表示為:
第二種是情況是自變量的取值隨時間的變化而變化,從而使得自變量對生存時間分布的影響發生變化,也就是說該自變量是時間t的因變量,這樣的自變量稱為內在時間依存自變量,例如文章開頭提到的核輻射例子。模型可以表示為:
采用含時間依存自變量Cox回歸模型判斷自變量是否具有時間依存性,通過檢驗上面模型的回歸系數與0是否有顯著性差異,如果回歸系數與0有顯著性差異,說明該自變量具有時間依存性,反之則沒有時間依存性,可以直接使用Cox回歸模型。
在實際生活中,影響風險函數的自變量經常是會隨著時間的改變而改變的,當數據分析者懷疑自變量具有時間依賴性時,那么就意味著這個自變量對風險函數的影響也會隨時間的改變而改變,這時可以用含時間依存自變量的Cox回歸模型來分析。
案例分析
在醫學領域,普遍認為某種疾病的死亡率會受到害怕、壓抑和焦慮等不良心理的影響。眾所周知,在器官移植領域,需要心臟移植的病人必須等到合適的心臟提供者出現才能進入心臟移植程序。如果沒有合適的心臟資源,就需要無限期等待。在人們的主觀意識中,合適的心臟資源出現之前和出現之后,等待心臟移植的病人狀態是完全不一樣的,那么這種心理變化是否會影響生存時間分布呢?美國斯坦福大學曾經針對這個普遍認識進行了一項心臟移植對延長生存時間的研究。數據如下圖所示:
分析思路
等待時間表示在合適的心臟資源出現前,病人的等待時間。如果某個需要心臟移植的病人一直沒有等到合適的心臟資源,那么將等待時間設置為9999,其它等到心臟資源的病人,其等待時間按實際周數填寫。
分析步驟
1、選擇菜單【分析】-【生存分析】-【Cox依時協變量】,在跳出的菜單中按照下圖操作。T_COV_表示構建的隨時間變化的新自變量,這個自變量是通過將原來的自變量X(是否出現合適心臟資源)構建成隨時間變化的新自變量。
很明顯,是否出現心臟資源與等待時間是相關的,那么新自變量X(t)的構建公式為:(T_<等待時間|等待時間=9999)*0+(T_>=等待時間)*1,新自變量可以表示成下面的形式:
2、點擊【模型】按鈕,按照下圖進行操作,和上一篇文章Cox回歸模型的操作過程是完全一致的。
3、點擊確定,輸出結果。
結果解釋
1、模型擬合結果:從結果可知,沒有納入自變量時,模型的-2對數似然值為157.061,納入T_COV_自變量后,模型-2對數似然值為157.051,僅僅減少了0.01,顯著性0.919,大于0.05,說明該自變量對于模型沒有貢獻。
2、回歸系數結果;根據結果可知,新構建的時間依存性自變量X(t)的回歸系數估計值為-0.064,顯著性為0. 919,也就是說回歸系數與0沒有顯著性差異。該結果說明合適心臟資源出現與否對病人的生存時間分布沒有影響。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
2025 年,數據如同數字時代的 DNA,編碼著人類社會的未來圖景,驅動著商業時代的運轉。從全球互聯網用戶每天產生的2.5億TB數據, ...
2025-05-27CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25