• 傻瓜式临床预测模型软件CoxApp
  • 无需复杂冗长的代码
  • 只需要鼠标点点,
  • 即可轻松完成3分SCI

    1 CoxApp 简介

  • 傻瓜式零代码预后模型构建、评价、验证
  • 涉及批量缺失值的多重插补、倾向性匹配得分PSM、基线资料分析、KM生存曲线绘制、批量单因素Cox回归、多因素Cox回归、森林图自动绘制、逐步回归、Lasso回归、Lasso得分计算、列线图Nomogram绘制、Nomogram评分计算、ROC曲线、DCA曲线、校准曲线、NRI、IDI计算等。下面逐一介绍。
  • CoxApp1.0.1版本 下载链接:https://pan.baidu.com/s/1vgnvqTfTxIrhCKb37scSWw?pwd=m919 提取码:m919
  • 关注微信公众号spss1949回复CoxApp获得CoxApp最新版下载链接。

    2 软件登录

  • 双击应用程序,打开软件。
    CoxApp应用程序
  • 弹出登录界面。输入用户名、密码,点击登录Login即可。
    CoxApp登录界面
  • 登录成功界面
    CoxApp登录成功

    3 样本量计算

  • 切换到样本量计算菜单。
    样本量计算菜单
  • 弹出样本量计算界面。
    样本量计算界面
  • 输入相应指标大小,点击submit,计算样本量,输出结果如下:
    样本量计算结果
    样本量计算的详细操作步骤及结果解读参照B站视频教程,篇幅原因,不再过多罗列。

4 上传数据

  • 切换到上传数据菜单Upload
    上传数据菜单
  • 弹出上传数据界面。
    上传数据界面
  • 点击Upload CSV File中的Browse,导入电脑中的csv数据文件,可导入最大不超过100M的数据。需要注意数据并不会上传到云端,不存在数据泄露风险。
    上传数据界面2
  • 数据上传之后,需要设置分类自变量。在Categroy X的选择框中通过鼠标选择分类自变量。选择完成之后,点击submit。
    分类自变量
    需要注意的是,即使你的数据中不存在分类自变量,也要点击此处的submit,这样软件才知道你的数据中不存在分类自变量。另外对于因变量虽然其也是分类变量,但此处不要选择进来。此处是针对自变量的
  • 之后,我们可以分别切换到View、Names、Summary、Structure界面。查看数据的基本信息。4个界面结果截图如下,不再赘述,详见B站视频:

<上传数据的sum,上传数据的View,上传数据的names,上传数据的str>

5 拆分数据

数据的拆分有两种方法,一种是随机拆分,另外一种是按照数据中的某个二分类资料直接进行拆分。
数据拆分

  • 在数据拆分的Split data选择框中,Split.Random表示随机拆分,此时我们需要通过Set Seed设置种子数,以保证结果的重现性,种子数不同,拆分的数据就不同,这里种子数我设置成了859929351,然后是通过Number:%来设置按照什么比例拆分,一般是按照70%作为训练集,30%作为测试集,设置完成之后点击submit
    随机拆分
  • 在数据拆分的Split data选择框中,Split.by.Variable表示按照数据中的某个二分类资料直接进行拆分,默认样本量大的是训练集,样本量小的是测试集。比如截图中选择了变量Sex,那就会按照性别的不同拆分成两个数据集。设置完成之后点击submit
    变量拆分
    在数据拆分完成之后,在哪里找到拆分后的数据集呢?在下方的截图中,我们可以切换到Trainset界面即显示训练集,共有196个样本。可以通过图中的CSV将数据导出成CSV格式的本地数据,也可以通过图中的Excel导出成Excel格式的本地数据。具体步骤不再赘述。针对测试集,只要切换到Testset即可。

<训练集,测试集>

6 多重插补Mice

若数据存在缺失值,可通过多重插补对缺失值进行填补,针对连续性变量、二分类变量、多分类变量试用不同的算法填补。需要注意的是,多重插补是针对整个数据集进行填补,和训练集、测试集无关。

  • 在菜单界面点击Mice,切换到多重插补界面。
    Mice
  • 自动完成缺失值填补,完整的数据见下。可通过CSV按键或者Excel将插之后的数据集保存本地。
    Mice2

7 倾向性匹配得分PSM

为什么要进行PSM,可能的原因是你的原始数据基线不平衡,需要对不平衡的数据进行PSM,从而得到均衡性的目的。具体原理观看我B站视频。需要注意的是,PSM也是针对整个数据集进行匹配,和训练集、测试集无关。

  • 在菜单界面点击PSM-Table,切换到PSM界面。
    PSM1
  • PSM界面,通过Y选择因变量,必须是二分类,比如病例组和对照组,或者试验组和对照组。通过X选择匹配的协变量。通过1:N Matched:q确定是1比几匹配。通过caliper:确定卡钳值是0.1。点击Submit开始匹配。
    PSM2
  • 匹配之后的数据见下,可通过CSV按键或者Excel将插之后的数据集保存本地。在数据里有一个psm.id表示哪些演剧对象配在一起组成了对子。
    PSM3
  • 匹配之后的数据,共有2183对。两组间的协变量比较,可通过P值或SMD值来判断是否均衡。
    PSM4
  • 在菜单界面点击PSM-Plot,可查看PSM得到的图形。每一幅图形都可以通过右侧的菜单进行细节调整。图形确定无误后可导出成PDF
    PSM5
    PSM6
    PSM7

8 基线资料比较

可以批量进行基线资料的分析,自动化导出训练集、验证集基线信息,以及训练集、验证集比较的表格。

  • 在菜单界面点击Baseline,切换到基线分析界面。
    基线分析1
  • 在基线分析界面,通过Time设置随访时间,通过Status设置随访结局,通过Select Method设置选择自变量的方法,这里面我们按照变量名称来选择,通过X多选框来选择变量名称。通过Nonparametric来选择针对连续性自变量究竟是进行秩和检验还是T检验。Significant P Value来设置alpha=0.05。
    基线分析2
  • 输出结果见下,包含整个数据集的基线信息,训练集的基线信息,验证集的基线信息,训练集和验证集比较的信息。表格中包含描述性统计结果以及差异性比较的P值。可以导出为三线表。需要注意的是,如果选择T检验,罗列的是均数和标准差;如果选择秩和检验,罗列是的中位数、四分位数。

<基线分析3,基线分析4,基线分析5,基线分析6>

9 KM生存曲线

可以绘制不同风格的KM生存曲线,通过右侧的菜单可进行细节调整。注意,针对的是训练集进行分析。

  • 在菜单界面点击KM,切换到KM生存曲线分析界面。
    KM1
  • 在KM生存曲线分析界面,通过Time设置随访时间,通过Status设置随访结局,通过X单选框来选择分类自变量。点击Submit开始分析。
    KM2
  • 首先输出log-rank检验的P值。
    KM3
  • 其次输出两幅KM生存曲线。曲线的颜色、线条等都是可以个性化设置。
    KM4
    KM5

10 Cox回归分析

可以批量进行单因素Cox回归分析,自动对单因素P<0.05的变量进行多因素Cox分析,结果可导出为三线表。注意,针对的是训练集进行分析。

  • 在菜单界面点击Uni-Cox,切换到Cox回归分析界面。
    cox1
  • 在Cox回归分析界面,通过Decimal Digits:指定保留3位小数,通过Significant P Value:设置P<0.05的单因素进行多因素分析。需要注意的是,若Significant P Value:设置为1,将对所有变量进行多因素分析。
    cox2
  • 第一个输出结果是,批量单因素Cox回归的结果。罗列了偏回归系数,标准误、HR值及其95%CI、P值。
    cox3
  • 第二个输出结果是,批量多因素Cox回归的结果。罗列了偏回归系数,标准误、HR值及其95%CI、P值。
    cox4
  • 第三个输出结果是,将批量单因素Cox回归的结果与多因素Cox回归的结果绘制在同一幅表格里。单因素、多因素的HR值及其95%CI、P值。
    cox5
  • 除此之外还可以针对上述的单因素Cox、多因素Cox自动绘制森林图,每一幅森林图的颜色、线条、坐标轴等细节均可以调整。共有5付森林图,可左右查看。

<cox6,cox7,cox9,cox8,cox10>

11 逐步回归

可以进行向前法逐步回归,向后法逐步回归。注意,针对的是训练集进行分析。

  • 在菜单界面点击Stepwise,切换到逐步回归界面。
    step0
  • 输出结果见下。

<step2,step1>

12 列线图Nomogram

可以进行自动进行列线图绘制。注意,针对的是训练集进行分析。

  • 在菜单界面点击Nomogram,切换到绘制列线图界面。
    Nom1
  • 在列线图界面,通过Time设置随访时间,通过Status设置随访结局,通过X多选框来选择自变量名称。通过Time Point来选择哪一些时间点。如果时间点选择的不合适,结果会很差。点击Submit
    Nom2
  • 输出的列线图如下,共有两幅,
    Nom3
    Nom4
  • 可进行颜色、线条、坐标轴等的细节修改。
    Nom5
  • 除此之外,还可以计算各个自变量对应的评分,以及不同时间点的Nomogram总得分、概率等指标。
    Nom6
    Nom7
    Nom8

    13 ROC曲线绘制

    可以自动进行训练集和验证集的ROC曲线绘制。ROC曲线的颜色、线条、坐标轴等可进行个性化设置。

  • 在菜单界面点击ROC-plots,切换到绘制ROC曲线界面。
    ROC1
  • 首先输出训练集的不同时间点的ROC曲线,图上输出AUC及其95%CI区间。
    ROC2
  • 其次输出验证集的不同时间点的ROC曲线,图上输出AUC及其95%CI区间。
    ROC3

    14 校准曲线绘制

    可以自动进行训练集和验证集的校准曲线绘制以及C指数的计算。校准曲线的颜色、线条、坐标轴等可进行个性化设置。

  • 在菜单界面点击Calibration-plots,切换到绘制校准曲线界面。
    CAL1
  • Time Point选择框选择时间点,绘制特定时间点的校准曲线。
    CAL2
  • 以下分别罗列训练集和验证集的校准曲线
    CAL3
    cal4
  • 以下分别罗列训练集和验证集多个时间点的校准曲线
    cal5
    cal6
  • 以下分别罗列训练集和验证集多个时间点的C指数的图形
    cal8
    cal10
  • 以下分别罗列训练集和验证集多个时间点的C指数的数值
    cal9
    cal11
  • 以下分别罗列训练集和验证集总的C指数的数值及其95%CI,以及bootstrap校正C指数
    cal13
    cal14

15 DCA曲线绘制

可以自动进行训练集和验证集的DCA曲线绘制,以及净收益的计算。DCA曲线的颜色、线条、坐标轴等可进行个性化设置。

  • 在菜单界面点击DCA-plots,切换到绘制DCA曲线界面。
    DCA1
  • Time Point选择框选择时间点,绘制特定时间点的DCA曲线。
    DCA2
  • 分别罗列出训练集和验证集的DCA曲线。
    DCA3
    DCA5
  • 分别计算出出训练集和验证集的净收益。可以计算不同时间点的净收益,此处只罗列了1080天的。
    DCA4
    DCA6

16 NRI、IDI计算

可以自动进行训练集和验证集的NRI、IDI指标。

  • 在菜单界面点击NRI&IDI,切换到计算NRI、IDI界面。
    NRI1
  • 在弹出的界面,通过Time设置随访时间,通过Status设置随访结局,通过Model New多选框来选择旧模型的自变量名称。通过Model New多选框来选择新模型的自变量名称。通过cutoff:来选择模型概率的截断值。通过time.point:来选择计算特定时间点的NRI、IDI。点击Submit
    NRI2
  • 分别输出训练集和验证集的分类NRI。
    NRI3
    NRI6
  • 分别输出训练集和验证集的连续性NRI。
    NRI4
    NRI7
  • 分别输出训练集和验证集的IDI。其中M1表示IDI M2表示NRI M3表示中位数差异。
    NRI5
    NRI8

17 计算连续性变量的cutoff

可以在生存分析中寻找连续性变量的最佳截断值,注意,针对的是整个数据集进行分析。

  • 在菜单界面点击cutoff,切换到计算截断值界面。
    cutoff1
  • 在弹出的界面,通过Time设置随访时间,通过Status设置随访结局,通过X来选择连续性变量。点击Submit
    cutoff2
  • 输出结果如下,最佳截断值18713。以及在数据中自动生成新变量。
    cutoff3
    cutoff4

联系方式

傻瓜式零代码临床预测模型

加我微信859929351,获取软件。 ——大鹏

个人微信号859929351,非机器人


大鹏统计工作室
1 声望1 粉丝