熱線電話:13121318867

登錄
首頁大數據時代生存曲線的估計方法(2):生存率的95%置信區間
生存曲線的估計方法(2):生存率的95%置信區間
2020-11-10
收藏

作者:丁點helper

來源:丁點幫你

生存分析的上一篇文章主要通過一張表格介紹了計算生存率的方法,稱作K-M法,也叫乘積極限法,簡單來講就是將生存概率相乘獲得生存率。

生存曲線的估計方法(1):先看懂這個表,比如,前面我們講過:

好比身高的樣本均數,抽取的第一撥人計算的平均身高和第二撥人的平均身高是有差異的。

因為它們都是樣本統計量,所以會隨著樣本的變化而變化。同樣地,如果我們想象一下,把這些樣本統計量放在一起再求平均數和標準差,那這次得到的這個標準差叫做什么呢?

還記得嗎?叫標準誤。

在學習均數抽樣分布的時候,我們也重點談過的。

因此,類似的,根據樣本計算的生存函數,它也是一個樣本統計量,它也可以被計算標準誤。

理解了這一層,就應該能搞懂上一篇文章中最后一列出現的“生存率標準誤”,如下表第(9)列。

這個“生存率標準誤”的計算公式稍微有些復雜,我們可以不詳細展開。重點是大家要意識到它所代表的含義:

如果單單由一個樣本的生存率去代表總體,會存在誤差(類比用一個城市的平均身高代表全國的平均身高),如何去衡量這個誤差?由此我們就計算了標準誤。

因此,如果搞懂了前面講的樣本均數的標準誤等概念,這里就直接類比即可,可見基本的統計學理論和知識點需要重點掌握。

之所以要大費周章地搞懂“生存率的標準誤”這個概念,是因為在實際應用中,我們可能經常會面臨計算生存率95%置信區間的問題。

同樣地,原理和均數95%置信區間幾乎完全類似。對這個知識點不熟悉的同學可以閱讀我們發的這篇文章。

只要搞懂了置信區間的大邏輯,相信對下面這個生存率的95%置信區間計算公式不會陌生:

因此,我們可以得出:手術后輔助化療的肺癌患者,10個月生存率的95%置信區間為(0.2848,0.8580),或者寫成百分數的形式(28.48%,85.80%)。

講完生存率置信區間的算法,我們再來復習之前介紹過的一個概念——中位生存時間。

如下圖,可以發現,當時間 t=11.124時,對應的生存率是0.5。這表示,當生存時間是11.124個月時,生存函數取值為0.5,從而意味著:

上圖有一個專業的名字,叫K-M生存曲線(對應前文講過的K-M乘積極限法):橫軸是生存時間,縱軸是生存率。

從圖中我們可以看出,K-M生存曲線呈階梯性,隨著生存時間的增加,曲線呈下降趨勢,意味著時間越長,仍然存活的人數越少,生存率越低。如果曲線階梯陡峭,表明下降速度快,往往生存期較短。


——熱門課程推薦:

想學習PYTHON數據分析與金融數字化轉型精英訓練營,您可以點擊>>>“人才轉型”了解課程詳情;

想從事業務型數據分析師,您可以點擊>>>“數據分析師”了解課程詳情;

想從事大數據分析師,您可以點擊>>>“大數據就業”了解課程詳情;

想成為人工智能工程師,您可以點擊>>>“人工智能就業”了解課程詳情;

想了解Python數據分析,您可以點擊>>>“Python數據分析師”了解課程詳情;

想咨詢互聯網運營,你可以點擊>>>“互聯網運營就業班”了解課程詳情; 

想了解更多優質課程,請點擊>>>

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢