细胞焦亡纯生信研究,你上车了吗?

细胞焦亡(pyroptosis)是一个程序性细胞死亡的新形式,趁着邵峰院士在Nature上发表关于细胞焦亡的新机制文章的东风,此方向又引发了一轮新的研究热潮。近几年细胞焦亡方向的pubmed发文量以及国自然中标数量也是节节攀升,联合铁死亡成为了细胞死亡领域的一波新的研究风向。

但是在铁死亡的纯生信文章数量迅速增加的形势下,细胞焦亡的纯生信分析类文章显得有点过少了,在查阅了大量文献后,我们发现其原因可能是细胞焦亡相关基因的获得还是基于自己查阅文献总结归纳筛选,没有类似FerrDb开源数据库,但也正因如此,细胞焦亡的纯生信文章仍然能利用常规的预后模型套路来发5+的文章,下面就让我们一起来解析一下这篇文章的套路吧!

摘要

卵巢癌(OC)是一种高度恶性的妇科肿瘤,预后非常差。近年来已证明细胞焦亡是有炎症发生的程序性细胞死亡,但OC中焦亡相关基因的表达及其与预后的相关性尚不清楚。因此,在本研究中作者鉴定到31个差异表达的焦亡调控因子,并根据这些DEGsOC分为两个亚型。利用TCGA队列和LASSO Cox回归方法构建一个7-焦亡相关基因预后特征,将TCGA队列分为高风险组和低风险组,结果显示低风险组OC患者生存率较高,并用GEO队列进行了验证。最后将风险评分作为独立预后因素,并进行了差异基因的功能分析,预示了焦亡相关基因在肿瘤免疫中的重要作用,可用于预测 OC 的预后。

数据来源

*  TCGA数据库:379OC患者的RNA-seq数据;

*  GTEx数据库:88个正常卵巢组织的RNA-seq数据;

*  GEO数据库: RNA-seq数据和临床数据作为额外的验证队列。

焦亡相关基因的获得

作者从之前的文献综述中提取了33个焦亡相关基因(焦亡通用靶标基因),如下图所示:

分析流程

结果

1. 鉴定正常组织和肿瘤组织之间的DEGs

在来自 88 个正常组织(GTEx) 379 个肿瘤组织(TCGA)的数据中分析33个细胞焦亡相关的基因表达水平,最终作者确定了31个差异表达基因(DEG),包括13个下调基因和18个上调基因(图1A)。为了进一步探索焦亡相关基因的相互作用,作者对33个焦亡相关基因进行了PPI分析,结果发现CASP1PYCARDNLRC4NLRP1CASP5NLRP3CASP8AIM2是中枢基因,除CASP1基因外,其余基因均为DEGs(图1B, C)。

2. 基于DEGs的肿瘤分型

为了探究31种细胞焦亡相关DEG的表达与OC亚型之间的联系,作者对 TCGA 队列中的所有379OC患者进行了一致聚类分析,发现当聚类变量k  = 2 时,组内相关性最高,组间相关性较低,表明379OC患者可以根据这31DEGs分为两类(图2A)。聚类热图(图2B)和生存分析(图2C)表明两个簇中的临床特征和患者OS没有明显差异。

3. TCGA 队列中构建焦亡相关基因预后模型

31个焦亡相关DEGs利用单变量Cox回归分析进行初步筛选,再利用LASSO回归分析筛选得到7个焦亡相关基因(图3A – C)。风险分数计算如下:risk score = (−0.187*AIM2 exp.) + (0.068*PLCG1 exp.) + (0.097*ELANE exp.) + (−0.143*PJVK exp.) + (−0.086*CASP3 exp.) + (−0.033*CASP6 exp.) + (0.130*GSDMA exp.),根据风险评分公式计算的中位数,374 名患者被平均分为低风险和高风险亚组(图3D)。主成分(PCA)分析显示,两个亚组可以完全区分开(图3E),并且高风险组的患者生存时间较短且发生死亡的概率更高(图3F),高风险组和低风险组的OS具有显著差异(图3G)。最后通过ROC分析来评估预后模型的敏感性和特异性(图3H)。

4. 预后模型的外部队列验证

来自GEO数据库 ( GSE140082 )的总共380OC患者被用作验证队列,根据 TCGA 队列中的中位风险评分将GEO验证队列分为高、低风险组(图4A)。PCA分析显示GEO队列高、低风险亚组可以较好的分离(图4B),且低风险组的生存率和死亡率较高(图4C)。生存分析表明高风险组和低风险组的生存率具有显著差异(图4D),最后通过ROC分析来证明该预测模型具有良好的预测功效(图4E)。

5. 风险模型的独立预后价值

作者使用单变量和多变量 Cox 回归分析来评估源自基因特征模型的风险评分是否可以作为独立的预后因素。单变量 Cox 回归分析表明,风险评分可作为预测 TCGA GEO 队列中生存率低的独立因素,多因素Cox回归分析表明,风险评分可以作为一个独立预后因子(图5A-5D)。此外,作者将 TCGA 队列的临床特征聚类为热图,发现患者的年龄和生存状况在低风险和高风险亚组之间呈不同分布(图5E)。

6. 基于风险模型的功能分析

为了进一步探索高、低风险亚组之间基因功能和途径的差异,作者利用“limma”R 包通过应用标准 FDR < 0.05 |log 2 FC |来筛选 DEGs,总共确定了 115 DEG,其中高危组有66个基因上调,其余49个基因下调。然后,基于这些 DEG 进行GO富集分析和KEGG 通路分析,结果表明,DEGs主要与免疫反应、趋化因子介导的信号通路和炎症细胞趋化性相关(图6A, B)。

7. 高、低风险亚组间免疫活性比较

在功能分析的基础上,作者采用单样本基因集富集分析(ssGSEA)进一步比较了TCGAGEO队列中16种类型免疫细胞的富集评分和13种免疫相关通路的活性。结果表明,在 TCGA 队列中高危亚组的免疫细胞浸润水平普遍较低(图7A),除 2 IFN 应答通路外,其他 12 条免疫通路在高危组中的活性低于低危组(图7B)。GEO队列中的免疫活性情况与TCGA类似,此外,还发现低风险组中树突状细胞,诱导树突状细胞和巨噬细胞富集程度较高,而2IFN通路下调(图7C7D)。

结论

在这项研究中,作者首先研究了OC和正常组织中33个目前已知的细胞焦亡(焦亡通用靶标基因,在其他癌种中也可以套用哦!)相关基因的 mRNA 水平,发现它们中的大多数是差异表达的。然而,基于 DEG 的聚类分析产生的两个聚类在临床特征上没有显示任何显着差异。为了进一步评估这些焦亡相关调节因子的预后价值,作者通过 Cox 单变量分析和 LASSO Cox 回归分析构建了一个 7 基因风险特征,然后在外部数据集中验证其表现良好。功能分析表明,低危组和高危组之间的 DEGs 与免疫相关通路有关,并比较了低危组和高危组的免疫细胞浸润和激活途径。

结语

本文章的亮点在于作者前期筛选出了焦亡相关基因,利用常规的预后模型套路也能发到5+文章。但此文章没有涉及到风险模型中基因的验证,如果想文章再提升一个档次的话可以考虑加入后续的实验验证部分。如果对细胞焦亡基因的预后模型构建感兴趣的话,我们更换疾病类型,重新查找相关数据,就可以实现文章的复现了。本次细胞焦亡的纯生信分析文章分享和解析就到这里啦,大家一起学习起来吧!

参考文献

Ye, Ying et al. “A novel defined pyroptosis-related gene signature for predicting the prognosis of ovarian cancer.” Cell death discovery vol. 7,1 71. 7 Apr. 2021, doi:10.1038/s41420-021-00451-x

资源下载: