
SPSS詳細教程:相對危險度(RR)的計算
一、問題與數據
研究者想探索吸煙與肺癌間的關聯,即吸煙者患肺癌的風險是否比不吸煙者高以及高多少。研究者從一般人群中隨機抽樣700名調查對象建立前瞻性隊列研究。調查對象的吸煙狀態為吸煙或不吸煙。在研究開始時,所有調查對象均未患肺癌。研究者隨訪10年記錄調查對象是否患肺癌。
因此,研究者可以分別得到患肺癌的吸煙者、未患肺癌的吸煙者、患肺癌的不吸煙者和未患肺癌的不吸煙者的人數,據此可以計算吸煙組與不吸煙組的風險差異。
本例中代表吸煙狀態的變量為smoking_status,吸煙賦值為1,不吸煙賦值為2;代表隨訪期肺癌發病與否的變量為lung_cancer,患肺癌賦值為1,未患肺癌賦值為2。
部分數據截圖如下,左側為原始數據,右側為按不同吸煙狀態和患肺癌與否統計的匯總數據。
二、對問題的分析
為計算相對危險度(RR),需要滿足以下假設:
假設1:因變量和自變量均為二分類變量。
假設2:各觀測間相互獨立。
接下來將詳細介紹如何計算相對危險度。
三、SPSS操作
1. 數據準備
如果研究者使用原始數據,則跳過數據準備步驟,直接計算相對危險度;如果使用按不同吸煙狀態和患肺癌與否來統計得到匯總數據,則需要添加權重,步驟如下。
(1)點擊主菜單Data > Weight Cases,如下圖:
點擊后出現Weight Cases對話框,如下圖:
(2)勾選Weight cases by選項,激活 鍵和Frequency Variable: 框,如下圖:
(3)將變量freq選入Frequency Variable框,如下圖:
(4)點擊OK鍵,為數據加權。
2. 相對危險度的SPSS操作
(1)點擊主菜單Analyze > Descriptive Statistics > Crosstabs,如下圖:
點擊后出現Crosstabs對話框,如下圖:
注意:如果使用頻數統計的數據文件,Crosstabs對話框如下圖:
(2)將自變量smoking_status選入Row(s)框,因變量lung_cancer選入Column(s)框,如下圖:
注意:如果使用頻數統計的數據文件,Crosstabs對話框如下圖:
(3)點擊Statistics鍵,出現Crosstabs:Statistics對話框,如下圖:
(4)勾選Risk,如下圖:
(5)點擊Continue鍵,返回Crosstabs對話框。
(6)點擊Cells鍵,出現Crosstabs:Cell Display對話框,如下圖:
(7)勾選Percentanges區域的Row,如下圖:
(8)點擊Continue鍵,返回Crosstabs對話框。
(9)點擊OK鍵,生成結果。
四、結果解釋
1. 描述性統計分析
在報告相對危險度前,研究者應該先查看基本的一些統計量,了解數據特征。本例中在smoking_status*lung_cancer Crosstabulation表,如下圖:
首先,表中可看到在350名吸煙者中患肺癌的人數,如下圖高亮:
隨訪期間29名吸煙者患肺癌,即8.3%(29÷350*100%=8.3%)的吸煙者患肺癌。
注意:表中僅保留了一位小數,SPSS會自動計算相對危險度;如果研究者想得到更多小數位數手動計算的相對危險度,則雙擊smoking_status*lung_cancer Crosstabulation表,如下圖??捎^察到8.3%變為8.285714%。
其次,還能看到350名不吸煙者中患肺癌的人數,如下圖:
隨訪期間9名不吸煙者患肺癌,即2.6%(9÷350*100%=2.6%)的不吸煙者患肺癌。研究者想得到更多小數位數手動計算的相對危險度,也可以如上操作,2.6%變為2.571429%,如下圖:
從smoking_status*lung_cancer Crosstabulation表中可以得到初步結論:與不吸煙者相比,吸煙者患肺癌的風險更高。
研究者可以匯報:本研究隨機抽樣700名調查對象,吸煙者和不吸煙者各350名,吸煙者患肺癌的比例(8.3%)高于不吸煙者(2.6%)。
當然,研究者也可以選擇分別匯報患肺癌的吸煙者、未患肺癌的吸煙者、患肺癌的不吸煙者和未患肺癌的不吸煙者的人數。
2. 相對危險度
相對危險度結果可以在Risk Table表中查看,如下圖高亮顯示。
注意:表中高亮顯示的為“For cohort lung_cancer=Yes”行,不是“For cohort lung_cancer=No”,因為研究者感興趣的是吸煙對患肺癌的影響。
吸煙者患肺癌的相對危險度是3.222,95%置信區間為1.548到6.707。95%置信區間說明研究者有95%的把握說明人群中真實的相對危險度在1.548和6.707間。
如果研究者手動計算相對危險度,則需要吸煙者患肺癌的比例即0.08285714和不吸煙者患肺癌的比例即0.02571429。將兩個比例輸入到相對危險度計算公式,如下圖:
如果相對危險度大于1且95%置信區間不包括1,說明暴露組發生疾病的風險高于非暴露組,是結局的危險因素。本例中相對危險度3.222說明吸煙者患肺癌的風險高出不吸煙者222%。研究者還可以計算超額危險度,公式如下,其中RR為相對危險度。
本例中,超額危險度則為:
如果相對危險度小于1且95%置信區間不包括1,則意味著暴露組患病風險降低,是結局的保護因素。例如,相對危險度為0.34,代表與非暴露組相比,暴露組研究對象發生疾病的風險降低66%,計算如下。負號代表發生疾病的風險降低。
如果相對危險度的95%置信區間包括1,說明暴露組與非暴露組發生疾病的風險差異無統計學意義。
提示:研究者必須把自變量smoking_status選入Row(s),因變量lung_cancer選入Column(s)。如果選反,則會出現如下結果。
上表中相對危險度為1.574,95%置信區間上下限也分別變為1.297和1.910。因此,研究者需注意選對自變量和因變量。
綜上,研究者可以匯報:本研究隨機抽樣700名調查對象,吸煙者和不吸煙者各350名,吸煙者患肺癌的比例(8.3%)高于不吸煙者(2.6%)。與不吸煙者相比,吸煙者患肺癌的相對危險度為3.222(95%置信區間為1.548-6.707)。
五、撰寫結論
如果相對危險度95%置信區間不包括1,可以匯報:
本研究隨機抽樣700名調查對象,吸煙者和不吸煙者各350名,吸煙者患肺癌的比例(8.3%)高于不吸煙者(2.6%)。與不吸煙者相比,吸煙者患肺癌的相對危險度為3.222(95%置信區間為1.548-6.707),且有統計學意義。
如果相對危險度95%置信區間包括1,可以匯報(另外列舉一個例子):
有900名永久性房顫病人隨機分配至兩組,每組450名,一組使用降低腦卒中風險的新藥,另外一組使用常規藥物。使用新藥的房顫病人中11人(2.4%)患腦卒中,使用常規藥物病人24人(4.7%)患腦卒中。與使用常規藥物的房顫病人相比,使用新藥的病人患腦卒中的相對危險度為0.524(95%置信區間為0.256-1.074),沒有統計學意義。
推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業務及數據分析崗位的從業者提升自我。完整電子版已上線CDA網校,累計已有10萬+在讀~
免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25