热线电话:13121318867

登录
首页精彩阅读R语言生存分析
R语言生存分析
2017-07-01
收藏

R语言生存分析

生存分析涉及预测当特定事件将要发生的时间。它也被称为故障时间分析,或死亡时间的分析。例如,预测天的人患有癌症将生存的数量和预测时间时机械系统是要失败。

R中包名为 survival 是用来进行生存分析。这个软件包包含了 Surv()函数,这需要输入数据为一个R公式,被选中的变量分析中创建了一个生存的对象。然后我们使用 survfit()函数来创建一个情节进行分析。

安装软件包

install.packages("survival")

语法

对于R中创造生存分析的基本语法是:Surv(time,event) survfit(formula)

以下是所使用的参数的说明:

time 是跟进时间,直到事件发生。

event 表明出现预期的事件的状态。

formula 是预测变量之间的关系。

示例

我们会考虑 “pbc” 出现在上面已安装了生存包中的数据集。它介绍有关患有肝原发性胆汁性肝硬化(PBC)的人的生存数据点中间出现在数据集中的许多列,我们主要关心的字段 "time" 和 "status". 时间代表患者的登记和更早的患者接受了肝移植患者的或死亡之间的事件之间的天数。

# Load the library.
library("survival")

# Print first few rows.
print(head(pbc))

当我们上面的代码执行,它会产生以下结果及图表:

  id time status trt      age sex ascites hepato spiders edema bili chol albumin copper alk.phos    ast
1  1  400      2   1 58.76523   f       1      1       1   1.0 14.5  261    2.60    156   1718.0 137.95
2  2 4500      0   1 56.44627   f       0      1       1   0.0  1.1  302    4.14     54   7394.8 113.52
3  3 1012      2   1 70.07255   m       0      0       0   0.5  1.4  176    3.48    210    516.0  96.10
4  4 1925      2   1 54.74059   f       0      1       1   0.5  1.8  244    2.54     64   6121.8  60.63
5  5 1504      1   2 38.10541   f       0      1       1   0.0  3.4  279    3.53    143    671.0 113.15
6  6 2503      2   2 66.25873   f       0      1       0   0.0  0.8  248    3.98     50    944.0  93.00
  trig platelet protime stage
1  172      190    12.2     4
2   88      221    10.6     3
3   55      151    12.0     4
4   92      183    10.3     4
5   72      136    10.9     3
6   63       NA    11.0     3

从上面的数据我们正在考虑的时间和状态我们的分析

应用 Surv() 和 survfit() 函数

现在,我们应用 Surv() 函数适用于设置上述数据,并创建一个情节用于显示的趋势。

# Load the library.
library("survival")

# Create the survival object.
survfit(Surv(pbc$time,pbc$status==2)~1)

# Give the chart file a name.
png(file = "survival.png")

# Plot the graph.
plot(survfit(Surv(pbc$time,pbc$status==2)~1))

# Save the file.
dev.off()

当我们上面的代码执行,它会产生以下结果及图表:

Call: survfit(formula = Surv(pbc$time, pbc$status == 2) ~ 1)

      n  events  median 0.95LCL 0.95UCL
    418     161    3395    3090    3853

在上面的图中的趋势,可以帮助我们预测在若干天结束的生存概率。


数据分析咨询请扫描二维码

最新资讯
更多
客服在线
立即咨询