
SPSS分析技术:含时间依存性自变量的Cox回归分析
在介绍Cox回归模型时,我们提到过Cox回归模型有一个基本假设,就是纳入模型中的自变量不具有时间依存性,也就是自变量对风险函数的影响不随时间的变化而变化,如果违反这条假设,就需要将时间的影响也纳入模型一起考量,这就是具有时间依存变量的Cox回归模型。
模型原理
在进行生存分析时,有些自变量对风险函数(事件发生概率)的影响会随时间的变化而变化,这种现象在医学领域其实非常常见。例如,二次世界大战以后,很多学者研究美国投放在日本广岛和长崎的两颗原子弹的核辐射对日本妇女乳腺癌发生率的影响,其中人们接触到的核辐射量(自变量)会随时间的推移逐渐减低,这个自变量就不符合Cox回归模型的假设,此时应该使用考量时间效应的Cox回归模型。
在上一篇的Cox回归模型文章中,我们已经知道是否术中放疗对风险函数(术后患者的生存时间分布)有显著性影响,术中放疗的患者的平均生命时间比没有术中放疗的患者更长。Cox回归模型又称为比例风险模型,因为它对自变量有假设,要求自变量对风险函数的影响不随时间变化而变化。
在Cox回归模型中,可以通过图形来主观判断自变量是否符合上面的假设,如下图所示,在log minus log图形中,两条生存曲线是几乎平行的,可以帮助分析者判断是否术中放疗对风险函数的影响是符合恒定比例假设的。
先回顾一下Cox回归模型:
具有时间依存自变量的Cox回归模型可以分成两种:第一种是自变量的取值不随时间变化,只是同样的自变量取值对生存时间分布的影响效应变化了,这种自变量称为外在时间依存自变量。模型公式可以表示为:
第二种是情况是自变量的取值随时间的变化而变化,从而使得自变量对生存时间分布的影响发生变化,也就是说该自变量是时间t的因变量,这样的自变量称为内在时间依存自变量,例如文章开头提到的核辐射例子。模型可以表示为:
采用含时间依存自变量Cox回归模型判断自变量是否具有时间依存性,通过检验上面模型的回归系数与0是否有显著性差异,如果回归系数与0有显著性差异,说明该自变量具有时间依存性,反之则没有时间依存性,可以直接使用Cox回归模型。
在实际生活中,影响风险函数的自变量经常是会随着时间的改变而改变的,当数据分析者怀疑自变量具有时间依赖性时,那么就意味着这个自变量对风险函数的影响也会随时间的改变而改变,这时可以用含时间依存自变量的Cox回归模型来分析。
案例分析
在医学领域,普遍认为某种疾病的死亡率会受到害怕、压抑和焦虑等不良心理的影响。众所周知,在器官移植领域,需要心脏移植的病人必须等到合适的心脏提供者出现才能进入心脏移植程序。如果没有合适的心脏资源,就需要无限期等待。在人们的主观意识中,合适的心脏资源出现之前和出现之后,等待心脏移植的病人状态是完全不一样的,那么这种心理变化是否会影响生存时间分布呢?美国斯坦福大学曾经针对这个普遍认识进行了一项心脏移植对延长生存时间的研究。数据如下图所示:
分析思路
等待时间表示在合适的心脏资源出现前,病人的等待时间。如果某个需要心脏移植的病人一直没有等到合适的心脏资源,那么将等待时间设置为9999,其它等到心脏资源的病人,其等待时间按实际周数填写。
分析步骤
1、选择菜单【分析】-【生存分析】-【Cox依时协变量】,在跳出的菜单中按照下图操作。T_COV_表示构建的随时间变化的新自变量,这个自变量是通过将原来的自变量X(是否出现合适心脏资源)构建成随时间变化的新自变量。
很明显,是否出现心脏资源与等待时间是相关的,那么新自变量X(t)的构建公式为:(T_<等待时间|等待时间=9999)*0+(T_>=等待时间)*1,新自变量可以表示成下面的形式:
2、点击【模型】按钮,按照下图进行操作,和上一篇文章Cox回归模型的操作过程是完全一致的。
3、点击确定,输出结果。
结果解释
1、模型拟合结果:从结果可知,没有纳入自变量时,模型的-2对数似然值为157.061,纳入T_COV_自变量后,模型-2对数似然值为157.051,仅仅减少了0.01,显著性0.919,大于0.05,说明该自变量对于模型没有贡献。
2、回归系数结果;根据结果可知,新构建的时间依存性自变量X(t)的回归系数估计值为-0.064,显著性为0. 919,也就是说回归系数与0没有显著性差异。该结果说明合适心脏资源出现与否对病人的生存时间分布没有影响。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
SQL Server 中 CONVERT 函数的日期转换:从基础用法到实战优化 在 SQL Server 的数据处理中,日期格式转换是高频需求 —— 无论 ...
2025-09-18MySQL 大表拆分与关联查询效率:打破 “拆分必慢” 的认知误区 在 MySQL 数据库管理中,“大表” 始终是性能优化绕不开的话题。 ...
2025-09-18CDA 数据分析师:表结构数据 “获取 - 加工 - 使用” 全流程的赋能者 表结构数据(如数据库表、Excel 表、CSV 文件)是企业数字 ...
2025-09-18DSGE 模型中的 Et:理性预期算子的内涵、作用与应用解析 动态随机一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明确:TIF 中的地名有哪两种存在形式? 在开始提取前,需先判断 TIF 文件的类型 —— ...
2025-09-17CDA 数据分析师:解锁表结构数据特征价值的专业核心 表结构数据(以 “行 - 列” 规范存储的结构化数据,如数据库表、Excel 表、 ...
2025-09-17Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10