news 2026/6/23 8:34:47

R语言绘制复杂加权数据(nhanes数据)多模型生存分析决策曲线

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
R语言绘制复杂加权数据(nhanes数据)多模型生存分析决策曲线

决策曲线分析(Decision Curve Analysis, DCA)是一种用于评估、比较和优化诊断试验、预测模型或分子标志物临床实用性的统计方法。它由Andrew J. Vickers和Eugene B. Elkin于2006年提出,旨在弥补传统统计指标(如灵敏度、特异度、ROC曲线下面积)在评估模型临床价值方面的不足。


在既往文章,本人介绍了我的ggscidca包,可以用于逻辑回归,生存分析等各种决策曲线绘制,但是据我所知,目前还没有R包能支持复杂加权数据(nhanes数据)生存分析决策曲线,在上篇文章《R语言绘制复杂加权数据(nhanes数据)生存分析决策曲线》我已经介绍了R语言绘制复杂加权数据(nhanes数据)生存分析决策曲线,目前我继续升级了ggscidca包,使得它能进一步支持nhanes多模型生存分析决策曲线,

下面我来演示一下,先导入数据和R包

library(survey)library(ggscidca)library(scinhanes)bc<-read.csv("E:/r/test/nahnesme.csv",sep=',',header=TRUE)bc<-na.omit(bc)


我介绍一下数据,SEQN:序列号,RIAGENDR, # 性别, RIDAGEYR, # 年龄,RIDRETH1, # 种族,DMDMARTL, # 婚姻状况,WTINT2YR,WTMEC2YR, # 权重,SDMVPSU, # psu,SDMVSTRA,# strata,LBDGLUSI, #血糖mmol表示,LBDINSI, #胰岛素( pmmol/L),PHAFSTHR #餐后血糖,LBXGH #糖化血红蛋白,SPXNFEV1, #FEV1:第一秒用力呼气量,SPXNFVC #FVC:用力肺活量,ml(估计肺容量),LBDGLTSI #餐后2小时血糖,factor.FVC是我把肺活量分为了2分类,方便用于测试。

把分类变量转成因子

bc$DMDMARTL<-ifelse(bc$DMDMARTL==1,1,0)bc$RIAGENDR<-as.factor(bc$RIAGENDR)bc$RIDRETH1<-as.factor(bc$RIDRETH1)bc$DMDMARTL<-as.factor(bc$DMDMARTL)bc$oGTT2<-as.factor(bc$oGTT2)

如果做预测模型要拆分成建模集和验证集。我这里拆分一下

set.seed(123)tr1<-sample(nrow(bc),0.7*nrow(bc))##随机无放抽取bc_train<-bc[tr1,]#70%数据集bc_test<-bc[-tr1,]#30%数据集

建立抽样调查函数

bcSvy2<-svydesign(ids=~SDMVPSU,strata=~SDMVSTRA,weights=~WTMEC2YR,nest=TRUE,data=bc_train)

建立生存分析模型

svyfit<-svycoxph(Surv(time,factor.FVC)~RIDAGEYR+RIAGENDR+LBDINSI+RIDRETH1,x=TRUE,design=bcSvy2)

复习一下单个决策曲线模型的内容,绘制复杂加权数据(nhanes数据)决策曲线一共需要2步:

  1. 第一步,把模型变成ggscidca包能够识别的类型
fit<-scisvycoxphmodel(svyfit,username=username,token=token)
  1. 绘制决策曲线
scidca(fit)


绘制多模型的决策曲线其实就是复制单个决策曲线的过程,由两种情况:

  1. 就是同一个模型多个时间点的
fit1<-scisvycoxphmodel(fit=svyfit,timepoint=300,username=username,token=token)fit2<-scisvycoxphmodel(fit=svyfit,timepoint=500,username=username,token=token)fit3<-scisvycoxphmodel(fit=svyfit,timepoint=700,username=username,token=token)

制作数据列表的绘图,如果你既往使用过ggscidca包,是一模一样的,上手0困难

newdat<-list(bc_train,bc_train,bc_train)cox.tcdca(fit1,fit2,fit3,newdata=newdat,timepoint=c(300,500,700))


2. 第二个情况就是多个模型同一个时间点的
###多个模型一个时间点

svyfit1<-svycoxph(Surv(time,factor.FVC)~RIDAGEYR,x=TRUE,design=bcSvy2)svyfit2<-svycoxph(Surv(time,factor.FVC)~RIDAGEYR+RIAGENDR,x=TRUE,design=bcSvy2)svyfit3<-svycoxph(Surv(time,factor.FVC)~RIDAGEYR+RIAGENDR+LBDINSI+RIDRETH1,x=TRUE,design=bcSvy2)

因为模型不同,都要转换一遍

###转换模型fit1<-scisvycoxphmodel(svyfit1,username=username,token=token)fit2<-scisvycoxphmodel(svyfit2,username=username,token=token)fit3<-scisvycoxphmodel(svyfit3,username=username,token=token)

绘图

newdat<-list(bc_train,bc_train,bc_train)cox.tcdca(fit1,fit2,fit3,newdata=newdat,timepoint=c(300))


支持自定义颜色

cox.tcdca(fit1,fit2,fit3,newdata=newdat,timepoint=c(300),lincol=c("#E41A1C","#377EB8","#4DAF4A","#984EA3","#FF7F00"))

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/23 17:52:12

电脑启动太慢怎么解决?从底层优化到专业电脑加速的5大终极策略

为什么刚买的电脑秒开机&#xff0c;用了一年就变成了“老牛拉破车”&#xff1f;很多CSDN的极客朋友习惯直接重装系统&#xff0c;但对于大多数用户来说&#xff0c;重装意味着环境配置丢失、数据迁移麻烦。 其实&#xff0c;电脑加速并不需要大动干戈。电脑卡顿、启动慢的核…

作者头像 李华
网站建设 2026/6/23 0:56:00

我的新能源车企,如何靠六西格玛培训跑赢质量与成本的终极竞赛?

三年前&#xff0c;我们发布了第一款量产车&#xff0c;发布会很成功。但随之而来的&#xff0c;是让我夜不能寐的数据&#xff1a;早期用户反馈的“小毛病”种类超过100项&#xff0c;售后成本是行业平均值的1.5倍。更可怕的是&#xff0c;电池包的核心部件——电池管理系统&a…

作者头像 李华
网站建设 2026/6/23 11:39:11

[创业之路]-734-没有权力的责任是奴役,没有责任的权力是腐败,没有利益的责任是忽悠。管得好,叫责权利统一;管不好,叫利权责倒挂。一流的组织:用责任牵引权力和利益;末流的组织:用利益和权力逃避责任

教科书答案&#xff1a; 责&#xff1a;是事、是目标、结果、责任、担当 权&#xff1a;是人、是达成目标的手段和途径 利&#xff1a;是钱、是目标结果差异的好处、坏处 现实&#xff1a; 责权利 VS 利权责 VS 权利责 利是目标、权是手段、责任靠边 权是目标、利是结果、责是手…

作者头像 李华
网站建设 2026/6/23 17:52:16

基于SpringBoot的自动驾驶数据处理任务众包平台系统毕业设计项目源码

题目简介 在自动驾驶技术研发阶段&#xff0c;海量数据标注 / 处理需求与专业人力不足的矛盾突出&#xff0c;传统数据处理模式存在 “任务分配低效、质量管控难、结算不透明” 的痛点。基于 SpringBoot 构建的自动驾驶数据处理任务众包平台&#xff0c;适配算法研发团队、众包…

作者头像 李华
网站建设 2026/6/23 7:43:09

基于SpringBoot的养老院管理系统毕业设计项目源码

题目简介在养老服务精细化、智能化需求升级的背景下&#xff0c;传统养老院管理存在 “老人照护记录零散、服务调度低效、家属沟通不畅” 的痛点&#xff0c;基于 SpringBoot 构建的养老院管理系统&#xff0c;适配院方管理员、护理人员、老人及家属等多角色&#xff0c;实现老…

作者头像 李华
网站建设 2026/6/23 17:52:27

若是Windows下的HGDB配置参数work_mem>=2GB会导致HGDB服务无法启动

文章目录环境症状问题原因解决方案环境 系统平台&#xff1a;Microsoft Windows (64-bit) 10 版本&#xff1a;5.6.3 症状 Windows下的HGDB&#xff0c;配置参数work_mem>2GB会导致HGDB服务无法启动&#xff0c;如下报错来自于windows的“计算机管理”-“事件查看器”-“…

作者头像 李华