R语言 生存分析
生存分析是用来预测特定事件发生的时间的分析方法。它也被称为失效时间分析或生存时间分析。例如,预测癌症患者存活的天数或者预测机械系统故障的时间等。
R包中的 survival 用于进行生存分析。该包中包含了函数 Surv() ,该函数将输入数据作为R公式,并在选择的变量中创建一个生存对象用于分析。然后,我们使用函数 survfit() 创建分析的图表。
安装包
语法
在R中创建生存分析的基本语法如下:
以下是使用的参数的说明:
- time 是跟进时间,直到事件发生。
-
event 表示预期事件的发生状态。
-
formula 是预测变量之间的关系。
示例
我们将考虑上述安装的survival包中的数据集名为“pbc”。该数据集描述了肝脏原发性胆汁性肝硬化(PBC)患者的生存数据点。在数据集中的许多列中,我们主要关心“time”和“status”字段。时间表示患者登记和患者接受肝脏移植或患者去世之间的事件天数。
当我们执行上面的代码时,它产生了以下的结果和图表 −
从上述数据中,我们考虑时间和状态进行分析。
应用Surv()和survfit()函数
现在我们开始应用 Surv() 函数到上述数据集,并创建一个显示趋势的图表。
当我们执行上面的代码时,会产生以下结果和图表:
以上图表中的趋势可以帮助我们预测在一定天数结束时的生存概率。