本文首发于百味科研芝士微信公众号,转载请注明:百味科研芝士,Focus科研人的百味需求 想研究疾病OS,PFS,DFS? 想研究预后如何制作生存曲线? 百味芝士今日为你盘点几款生存曲线制作方法。 第一款:KaplanMeierPlotter数据库 KaplanMeierPlotter数据库这是今天推荐首款生存曲线制作方法,官网(http:kmplot。comanalysis),它是长的这个样子的。 咋一看,KaplanMeierPlotter数据库似乎只能研究6个癌种,小编之前也犯了同样的错误,pancancer(pancreaticcancer,胰腺癌像不像?)。其实,pancancer是画中有画,不信咱打开瞧瞧! 先看看mRNA表达谱,还有不下20个癌种可供研究,而主页上面的五个癌种的信息是比较详细的。同样,也可以查看miRNA表达谱的pancancer,包含的癌种也有20种。 KaplanMeierPlotter数据库的数据来源于GEO(仅限Affymetrix微阵列),EGA和TCGA,缺点是每个数据库每两年更新一次。走起来~ 点击癌种LungCancer,左上的搜索框输入KRAS,默认参数。 下拉页面,点击DrawKaplanMeierPlotter,简单粗暴,出图! 最后,我们看看参数设置吧,在survival这里可以选择患者的总生存期(OS)、首次进展生存期(FP)、再次进展生存期(PPS)。而对于随访时间的终点也可以设置,在Survival菜单下面的Followupthreshold里面。 接着,看看其他参数设置,左上角是探针设置,根据自己的研究选择不同的探针。病理参数里面可以设置病理类型、分级、分期、T、N、M、性别、吸烟史。在治疗分组中,也可以看不同治疗的预后。而数据集里面也囊括了TCGA以及GEO的芯片数据。最后的COX分析也可以选择单因素和多因素分析。 通过参数设置,我们可以分析不同亚组、不同病理参数、不同治疗模式、不同数据集的患者预后,由此也看出来KaplanMeierPlotter数据库的强大。 第二款:SPSS软件 SPSS软件制作生存曲线是最经典的做法,只要你有数据就能做,就是不熟悉SPSS的孩纸会感觉稍稍复杂。直接上数据吧!假定:分组信息(0低表达;1高表达)、存活状态death(0存活;1死亡)、生存时间time(月)。 数据录入完成后,依次点击分析生存函数KaplanMeier 参数设置:time时间,death状态,点击定义事件(终点时间设置为1死亡) 设置检验统计量:对数秩、Breslow 选项里面点击生存函数 直接出图!当然,这个图在SPSS中可以进行简单修改,可以试一试! 第三款:GraphdPadPrism软件 GraphdPadPrism软件是一款超级好用的专业医学绘图软件,在医药生物领域被广泛使用,拥有ROC曲线分析、BlandAltman分析功能以及GraphPadPrism的线性非线性拟合功能,所以,制作生存曲线对它来说只是小菜。 首先,录入数据,注意它与SPSS的输入区别,即实验组(EXP)和对照组(CON)输入在不同的两列中。 点击Graphs中的Data1,右侧即显示制作好的生存曲线。 调色:鼠标双击其中一条曲线,更改颜色后点击OK。 下面是更换颜色后的图,看着还不错 图还行,貌似缺点东西,P值!点击菜单栏中Analyze,选择survivalcurve,然后点击OK。 直接查看P值及其他数据。相比SPSS来说,略显麻烦,但是对图形的修改,还算不错,有机会下次为大家推送GraphdPadPrism。 第四款:UALCAN网站 UALCAN(http:ualcan。path。uab。eduindex。html)主要是基于TCGA数据库中的相关癌症数据进行分析的网站,操作仍然是简单粗暴,先看主页。 开始表演了抖一下Analysis,方框里面根据需要更改。 点一下Explore,继续点Showallgeneexpressioninsamepage,别停!接着点Survival,完事儿! 话说这图出的真惊喜,连续好几张(不试后悔)!必须给五星! 第五款:GEPIA网站 GEPIA在百味里面推送过,官网(http:gepia。cancerpku。cn) 收索框中输入基因,点击SurvivalAnalyze。 跳转页面,在下图红框里面选择一个肿瘤患者数据集,比如LUAD。 点击下方Plot,出图666。 第六款:cbiportal网站 这个网站(https:www。cbioportal。org)大家太熟悉了,不再多说!点击链接直接查看推文:懒人如何分析TCGA数据之cBioportal网站。 第七款:Oncolnc网站 既然是Party,那就再来介绍一个网站好了!OncoLnc,也是一款基于TCGA数据预后分析网站,官网网址:http:www。oncolnc。org。 输入基因名:可以是基因名,也可以输入mRNA,microRNA和lncRNA。 点击Submit后,查看结果页面如下,显示了肿瘤类型、回归系数、P值、基因表达水平等参数。 比如选择肺腺癌后,点击YesPlease!在这个页面比如选择低位4分位和高位4分为的表达量,也就是25:25,当然,也可以选择50:50也就是取中位数。 点击提交,生存曲线就做好了,直接导出PDF保存。 下拉页面,保存生存分析的数据,分析结束。 第八款:R软件 R语言做生存曲线作为今天的压轴方法,在这里以TCGA数据库中的数据为例,分析差异基因表达情况与患者的生存关系。 首先用hash函数从矩阵normalizeExp。txt中提取TOP2A的基因表达量。 将基因表达量与生存文件time文件整合 survival函数制作生存曲线 出图学会了吗? 纵观这些软件或数据库,都各有千秋,根据需要,可以任意选择。小编今天总结了常见的制作生存曲线的八种方法,然而,制作生存曲线的方法远不止这些,小伙伴们,跟帖吧