- 傻瓜式临床预测模型软件CoxApp
- 无需复杂冗长的代码
- 只需要鼠标点点,
即可轻松完成3分SCI
1 CoxApp 简介
- 傻瓜式零代码预后模型构建、评价、验证
- 涉及批量缺失值的多重插补、倾向性匹配得分PSM、基线资料分析、KM生存曲线绘制、批量单因素Cox回归、多因素Cox回归、森林图自动绘制、逐步回归、Lasso回归、Lasso得分计算、列线图Nomogram绘制、Nomogram评分计算、ROC曲线、DCA曲线、校准曲线、NRI、IDI计算等。下面逐一介绍。
- CoxApp1.0.1版本 下载链接:
https://pan.baidu.com/s/1vgnvqTfTxIrhCKb37scSWw?pwd=m919 提取码:m919
关注微信公众号spss1949回复
CoxApp
获得CoxApp最新版下载链接。2 软件登录
- 双击应用程序,打开软件。
- 弹出登录界面。输入用户名、密码,点击登录Login即可。
登录成功界面
3 样本量计算
- 切换到样本量计算菜单。
- 弹出样本量计算界面。
- 输入相应指标大小,点击submit,计算样本量,输出结果如下:
样本量计算的详细操作步骤及结果解读参照B站视频教程
,篇幅原因,不再过多罗列。
4 上传数据
- 切换到上传数据菜单
Upload
。 - 弹出上传数据界面。
- 点击
Upload CSV File
中的Browse,导入电脑中的csv数据文件,可导入最大不超过100M的数据。需要注意数据并不会上传到云端,不存在数据泄露风险。 - 数据上传之后,需要设置分类自变量。在
Categroy X
的选择框中通过鼠标选择分类自变量。选择完成之后,点击submit。
需要注意的是,即使你的数据中不存在分类自变量,也要点击此处的submit,这样软件才知道你的数据中不存在分类自变量。另外对于因变量虽然其也是分类变量,但此处不要选择进来。此处是针对自变量的。 - 之后,我们可以分别切换到
View、Names、Summary、Structure
界面。查看数据的基本信息。4个界面结果截图如下,不再赘述,详见B站视频:
<,,,>
5 拆分数据
数据的拆分有两种方法,一种是随机拆分,另外一种是按照数据中的某个二分类资料直接进行拆分。
- 在数据拆分的
Split data
选择框中,Split.Random表示随机拆分,此时我们需要通过Set Seed
设置种子数,以保证结果的重现性,种子数不同,拆分的数据就不同,这里种子数我设置成了859929351,然后是通过Number:%
来设置按照什么比例拆分,一般是按照70%作为训练集,30%作为测试集,设置完成之后点击submit
。 - 在数据拆分的
Split data
选择框中,Split.by.Variable表示按照数据中的某个二分类资料直接进行拆分,默认样本量大的是训练集,样本量小的是测试集。比如截图中选择了变量Sex,那就会按照性别的不同拆分成两个数据集。设置完成之后点击submit
。
在数据拆分完成之后,在哪里找到拆分后的数据集呢?在下方的截图中,我们可以切换到Trainset
界面即显示训练集,共有196个样本。可以通过图中的CSV
将数据导出成CSV格式的本地数据,也可以通过图中的Excel
导出成Excel格式的本地数据。具体步骤不再赘述。针对测试集,只要切换到Testset
即可。
<,>
6 多重插补Mice
若数据存在缺失值,可通过多重插补对缺失值进行填补,针对连续性变量、二分类变量、多分类变量试用不同的算法填补。需要注意的是,多重插补是针对整个数据集进行填补,和训练集、测试集无关。
- 在菜单界面点击
Mice
,切换到多重插补界面。 - 自动完成缺失值填补,完整的数据见下。可通过
CSV
按键或者Excel
将插之后的数据集保存本地。
7 倾向性匹配得分PSM
为什么要进行PSM,可能的原因是你的原始数据基线不平衡,需要对不平衡的数据进行PSM,从而得到均衡性的目的。具体原理观看我B站视频
。需要注意的是,PSM也是针对整个数据集进行匹配,和训练集、测试集无关。
- 在菜单界面点击
PSM-Table
,切换到PSM界面。 - 在
PSM
界面,通过Y
选择因变量,必须是二分类,比如病例组和对照组,或者试验组和对照组。通过X
选择匹配的协变量。通过1:N Matched:
q确定是1比几匹配。通过caliper:
确定卡钳值是0.1。点击Submit
开始匹配。 - 匹配之后的数据见下,可通过
CSV
按键或者Excel
将插之后的数据集保存本地。在数据里有一个psm.id表示哪些演剧对象配在一起组成了对子。 - 匹配之后的数据,共有2183对。两组间的协变量比较,可通过P值或SMD值来判断是否均衡。
- 在菜单界面点击
PSM-Plot
,可查看PSM得到的图形。每一幅图形都可以通过右侧的菜单进行细节调整。图形确定无误后可导出成PDF。
8 基线资料比较
可以批量进行基线资料的分析,自动化导出训练集、验证集基线信息,以及训练集、验证集比较的表格。
- 在菜单界面点击
Baseline
,切换到基线分析界面。 - 在基线分析界面,通过
Time
设置随访时间,通过Status
设置随访结局,通过Select Method
设置选择自变量的方法,这里面我们按照变量名称来选择,通过X
多选框来选择变量名称。通过Nonparametric
来选择针对连续性自变量究竟是进行秩和检验还是T检验。Significant P Value
来设置alpha=0.05。 - 输出结果见下,包含整个数据集的基线信息,训练集的基线信息,验证集的基线信息,训练集和验证集比较的信息。表格中包含描述性统计结果以及差异性比较的P值。可以导出为三线表。需要注意的是,如果选择T检验,罗列的是均数和标准差;如果选择秩和检验,罗列是的中位数、四分位数。
<,,,>
9 KM生存曲线
可以绘制不同风格的KM生存曲线,通过右侧的菜单可进行细节调整。注意,针对的是训练集进行分析。
- 在菜单界面点击
KM
,切换到KM生存曲线分析界面。 - 在KM生存曲线分析界面,通过
Time
设置随访时间,通过Status
设置随访结局,通过X
单选框来选择分类自变量。点击Submit
开始分析。 - 首先输出log-rank检验的P值。
- 其次输出两幅KM生存曲线。曲线的颜色、线条等都是可以个性化设置。
10 Cox回归分析
可以批量进行单因素Cox回归分析,自动对单因素P<0.05的变量进行多因素Cox分析,结果可导出为三线表。注意,针对的是训练集进行分析。
- 在菜单界面点击
Uni-Cox
,切换到Cox回归分析界面。 - 在Cox回归分析界面,通过
Decimal Digits:
指定保留3位小数,通过Significant P Value:
设置P<0.05的单因素进行多因素分析。需要注意的是,若Significant P Value:设置为1,将对所有变量进行多因素分析。 - 第一个输出结果是,批量单因素Cox回归的结果。罗列了偏回归系数,标准误、HR值及其95%CI、P值。
- 第二个输出结果是,批量多因素Cox回归的结果。罗列了偏回归系数,标准误、HR值及其95%CI、P值。
- 第三个输出结果是,将批量单因素Cox回归的结果与多因素Cox回归的结果绘制在同一幅表格里。单因素、多因素的HR值及其95%CI、P值。
- 除此之外还可以针对上述的单因素Cox、多因素Cox自动绘制森林图,每一幅森林图的颜色、线条、坐标轴等细节均可以调整。共有5付森林图,可左右查看。
<,,,,>
11 逐步回归
可以进行向前法逐步回归,向后法逐步回归。注意,针对的是训练集进行分析。
- 在菜单界面点击
Stepwise
,切换到逐步回归界面。 - 输出结果见下。
<,>
12 列线图Nomogram
可以进行自动进行列线图绘制。注意,针对的是训练集进行分析。
- 在菜单界面点击
Nomogram
,切换到绘制列线图界面。 - 在列线图界面,通过
Time
设置随访时间,通过Status
设置随访结局,通过X
多选框来选择自变量名称。通过Time Point
来选择哪一些时间点。如果时间点选择的不合适,结果会很差。点击Submit
。 - 输出的列线图如下,共有两幅,
- 可进行颜色、线条、坐标轴等的细节修改。
除此之外,还可以计算各个自变量对应的评分,以及不同时间点的Nomogram总得分、概率等指标。
13 ROC曲线绘制
可以自动进行训练集和验证集的ROC曲线绘制。ROC曲线的颜色、线条、坐标轴等可进行个性化设置。
- 在菜单界面点击
ROC-plots
,切换到绘制ROC曲线界面。 - 首先输出训练集的不同时间点的ROC曲线,图上输出AUC及其95%CI区间。
其次输出验证集的不同时间点的ROC曲线,图上输出AUC及其95%CI区间。
14 校准曲线绘制
可以自动进行训练集和验证集的校准曲线绘制以及C指数的计算。校准曲线的颜色、线条、坐标轴等可进行个性化设置。
- 在菜单界面点击
Calibration-plots
,切换到绘制校准曲线界面。 - 在
Time Point
选择框选择时间点,绘制特定时间点的校准曲线。 - 以下分别罗列训练集和验证集的校准曲线
- 以下分别罗列训练集和验证集多个时间点的校准曲线
- 以下分别罗列训练集和验证集多个时间点的C指数的图形
- 以下分别罗列训练集和验证集多个时间点的C指数的数值
- 以下分别罗列训练集和验证集总的C指数的数值及其95%CI,以及bootstrap校正C指数
15 DCA曲线绘制
可以自动进行训练集和验证集的DCA曲线绘制,以及净收益的计算。DCA曲线的颜色、线条、坐标轴等可进行个性化设置。
- 在菜单界面点击
DCA-plots
,切换到绘制DCA曲线界面。 - 在
Time Point
选择框选择时间点,绘制特定时间点的DCA曲线。 - 分别罗列出训练集和验证集的DCA曲线。
- 分别计算出出训练集和验证集的净收益。可以计算不同时间点的净收益,此处只罗列了1080天的。
16 NRI、IDI计算
可以自动进行训练集和验证集的NRI、IDI指标。
- 在菜单界面点击
NRI&IDI
,切换到计算NRI、IDI界面。 - 在弹出的界面,通过
Time
设置随访时间,通过Status
设置随访结局,通过Model New
多选框来选择旧模型的自变量名称。通过Model New
多选框来选择新模型的自变量名称。通过cutoff:
来选择模型概率的截断值。通过time.point:
来选择计算特定时间点的NRI、IDI。点击Submit
。 - 分别输出训练集和验证集的分类NRI。
- 分别输出训练集和验证集的连续性NRI。
- 分别输出训练集和验证集的IDI。其中M1表示IDI M2表示NRI M3表示中位数差异。
17 计算连续性变量的cutoff
可以在生存分析中寻找连续性变量的最佳截断值,注意,针对的是整个数据集进行分析。
- 在菜单界面点击
cutoff
,切换到计算截断值界面。 - 在弹出的界面,通过
Time
设置随访时间,通过Status
设置随访结局,通过X
来选择连续性变量。点击Submit
。 - 输出结果如下,最佳截断值18713。以及在数据中自动生成新变量。
联系方式
傻瓜式零代码临床预测模型
加我微信859929351,获取软件。 ——大鹏
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。