熱線電話:13121318867

登錄
首頁精彩閱讀生存曲線的估計方法(3):壽命表法
生存曲線的估計方法(3):壽命表法
2020-12-10
收藏

公眾號:丁點幫你

作者:丁點helper

最近的生存分析系列文章都是介紹生存曲線的估計方法的,其中一篇講了如何通過每一例患者的生存時間繪制生存曲線、估計生存率,這種方法被稱為K-M法,是因為該方法最早是由Kaplan和Meier這兩個人提出的;另一篇講了如何理解生存率的95%置信區間。

回顧一下前面講過的例子:為了解肺癌患者接受某種治療后的生存狀況,研究者收集了12名肺癌患者治療后的住院資料。我們將12名觀察對象的生存時間由小到大依次排列,可以計算每個時間點的生存概率,進而計算每個時間點的生存率。

生存曲線的估計方法(3):壽命表法

然而在實際工作中,經常會遇到樣本含量較大的隨訪資料,例如大型的隊列研究。研究人員只會在計劃好的時間點對所有研究對象進行隨訪(例如每年一次),而不會與每個研究對象持續保持聯系,準確記錄結局發生/刪失發生的具體時間。

因此,某些個體的結局/刪失發生在兩次隨訪之間,研究者就不能獲得其確切的生存時間,只能確定生存時間的區間。在這種情況下,可將原始資料按照生存時間分組再進行分析。

下面我們用一個例子來看看這種方法是如何實現的。

案例:為了解塵肺患者的生存期,回顧性調查了某煤礦確診為塵肺的患者1166人,其生存時間列于下表。

生存曲線的估計方法(3):壽命表法

與K-M法相比,這一方法中的生存時間由一個確切時間變為了一個時間區間(上表中的『確診年數 ti』這一列)。

這種變化類似于制作頻數分布表的過程,上表是對1166名患者的生存時間做了一個頻數分布表,比如第一行中的數據就表示,確診為塵肺后,壽命少于2年的有51人。教科書中把這樣整理數據并估計生存率的方法叫做壽命表法。

接下來我們來一步步搞懂上面這張表。

第(1)~(4)列

在背景中講過,本案例中患者確切的生存時間無從知曉,只能知道在哪個區間。所以要想把1166名患者的生存時間整合起來,就需要按照生存時間的區間來整理,也就是統計每個區間的人數。

你可能會問,為什么上表是以2年為一個區間呢?其實這個區間的寬度是根據隨訪時間和觀察例數來確定的,可根據實際情況合理調整。

一般每個區間為半閉半開區間,最后一個區間終點在無窮大。本例分成了22個時間區間。

在確定分組區間之后,就要統計每個區間內的死亡人數di、刪失人數ci以及期初觀察人數ni。第一個時間區間的期初觀察人數是所有的觀察例數;下一個區間的期初觀察例數按以下公式計算:

生存曲線的估計方法(3):壽命表法

,這和之前講過的K-M法是一樣的。

第(5)~(7)列

在計算某一時間區間內的死亡概率時,需要用該區間內的死亡人數除以該區間內的觀察人數,即

生存曲線的估計方法(3):壽命表法

。但是當區間內存在刪失時,這些個體并未觀察至區間的終點,因此這里用期初觀察人數做分母不太妥當。只有當刪失數為0時,區間內有效觀察人數才等于ni。

在一個特定時間區間內,我們假定刪失個體發生的時間是均勻分布的,有的在區間剛開始就刪失了,有的則在區間快要結束時才刪失。把這些刪失個體看做一個整體,相當于一半的個體在區間開始時刪失,而另一半則存活到了區間結束。因此,可以認為區間內的有效觀察人數為:

生存曲線的估計方法(3):壽命表法
生存曲線的估計方法(3):壽命表法

也被稱為期初校正人數。

接下來每一個時間區間的死亡概率和生存概率也就很好計算了:

生存曲線的估計方法(3):壽命表法
生存曲線的估計方法(3):壽命表法

比如第三個區間(

生存曲線的估計方法(3):壽命表法

),66名患者死亡,死亡概率就是:66/1069.5;對應的生存概率就是:1 - 66/1069.5。

上面的計算中,分母是1069.5,這個數值是怎么來的?計算過程如下:

  • 先計算期初人數 = 1166-51-45 = 1070
  • 再計算期初校正人數 =1070 - 1/2 = 1069.5

第(8)~(9)列

接下來的一列就是生存分析中最關心的『生存率

生存曲線的估計方法(3):壽命表法

』這一指標了。和之前講過的一樣,各時間點的生存率就是各區間生存概率的乘積。

生存曲線的估計方法(3):壽命表法
生存曲線的估計方法(3):壽命表法
生存曲線的估計方法(3):壽命表法

......注意各時間區間對應的生存率應是該區間上限時間點的生存率,例如上表中第5個區間 [8, 10)對應的生存率為0.7565,意思是某患者確診為塵肺后預測其活過10年的生存率為75.65%,而不是活過8年的生存率。

最后,再說說為什么要出現表中最后一列『生存率的標準誤

生存曲線的估計方法(3):壽命表法

』。我們這個表中每個區間的生存率都是用樣本計算出來的,要想通過樣本了解總體的情況,或者說想估計總體生存率的95%置信區間,就需要用到

生存曲線的估計方法(3):壽命表法

。具體解釋和計算方法在前文中有詳細介紹。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢