肿瘤生信套路,免疫预后模型结合临床样本验证

喵学姐又来啦,今天带大家来看一篇肿瘤生信常规的免疫相关预测模型套路(虽然文章比较早了)。这篇文章使用从5个数据库收集的乳腺癌患者的数据构建免疫评分模型,并评估了免疫评分模型与预后,化疗和临床特征之间的关系。

标题:基于免疫细胞浸润的免疫评分模型预测乳腺癌的预后和化疗效果

研究背景

肿瘤进展是一个复杂的过程,需要癌细胞,微环境和免疫系统之间的相互作用,从而影响肿瘤的发生和发展。最近的研究表明,免疫系统细胞具有消除病原体,发挥有一定的影响对肿瘤的临床结果。肿瘤浸润淋巴细胞(TIL)占肿瘤浸润免疫细胞(TIIC)的相当一部分。它显示出抑制的TIL在黑素瘤肿瘤的生长和关联具有改善的临床结果。在人类表皮生长因子受体2阳性(HER2 +)和三阴性原发性乳腺癌(TNBC)中,较高的TIL与更好的无病生存期(DFS)和总体生存期(OS)相关。乳腺癌(BC)患者的高度免疫浸润与改善临床结果和治疗应答效果更好有关。然而,尚未有研究考虑肿瘤组织中肿瘤浸润免疫细胞

研究思路


数据来源

作者从数据库TCGA 、GEO、ArrayExpress、ICGC、METABRIC获得乳腺癌(BC)患者的基因表达谱。预后模型的标准如下:数据集包含50多个人类原发性BC样本,显示OS时间和生存状态的系列以及转录组分析作为实验类型。最终包括29个系列(总共6844个样本)用于构建预后模型。

结果

PART.1构建预后免疫评分模型

作者使用分层抽样法,按照7:3的比例将29个数据集分为训练集和验证集。图1A展示了训练集中每个免疫细胞亚群与OS的关系的森林图。基于单因素Cox风险模型的分析结果显示,嗜酸性粒细胞、静息树突状细胞、静息和活化CD4+T细胞、静息肥大细胞、M0和M1巨噬细胞、记忆B细胞等与乳腺癌患者的总生存期(OS)显著相关。随后进行了LASSO Cox回归分析(图1B),最终在log值为-3.231时确定了静息CD4+T细胞、调节性T细胞、gamma-delta T细胞、活化NK细胞、单核细胞和M0巨噬细胞(图1C)。(TIIC)全局。因此必须基于完整的TIIC寻找潜在的生物标志物,以改善BC的预后预测和治疗效果

根据多因素Cox回归分析构建预后免疫评分模型,风险评分=调节性T细胞*2.526-静息CD4T细胞*1.761- gamma-delta T细胞*2.334+活化NC细胞*3.408+单核细胞*2.645+M0巨噬细胞*1.591。根据阈值0.371将训练集的样本分为高风险组和低风险组。根据Kaplan-Meier曲线评估低风险组和高风险组的总生存期(图2A)。低风险组和高风险组的20年生存率分别为37.8%和20%(HR:2.72)(表1)。

PART.2预后免疫评分模型的验证

为了评估预后模型的性能,作者利用验证集、测试集(183例乳腺癌患者)以及合并后的数据集进行分析。根据阈值0.374将验证集和测试集的患者分为两组,并进行Kaplan-Meier分析。在验证集(图2B)、测试集(图2C)以及合并数据集(图2D)中,高风险组的总生存期(OS)显著低于低风险组。此外,合并数据集中,低风险组和高风险组的20年生存率分别为47.8%和30.1%,其相对危险比为2.10(见表1)。

PART.3使用预后免疫评分模型预测化疗效果

为了评估免疫评分与化疗效果之间的关系,研究者应用风险评分公式于TCGA数据集、测试集和METABRIC数据集。根据阈值0.374将这三个数据集分为低风险组和高风险组。在这三个数据集中,低风险组显示出较长的生存期(见图2E-2F)。在TCGA数据集中,接受AC和AC-T化疗的低风险组患者表现出明显的生存优势。此外,无论采用何种化疗方案,低风险组均表现出更好的化疗效果(见图2G)。

PART.4列线图改善预后免疫评分模型

通过单因素Cox回归分析选择OS的独立临床预后因子,结果表明年龄,肿瘤分级和肿瘤淋巴结转移(TNM)分期具有显著相关性(表1)。多因素Cox回归分析表明,风险评分,年龄,肿瘤分级和TNM分期是OS的独立预后因子(表2)。作者整合免疫评分和独立临床预后因子构建列线图(图3A)。

为了评估列线图的预测性能,作者使用训练集,验证集和测试集比较了列线图和TNM分期的C-index(表3)。列线图可以改善预后模型。根据列线图的校准曲线,预测的5年,10年和20年的生存率和实际生存率相差不大(图3B)。决策曲线也表明列线图的预测效果更好(图3C)。

PART.5预后免疫评分模型预测乳腺癌患者的临床特征

在训练集和验证集中进一步研究预后免疫评分与临床特征之间的关系。训练集中,TNM分期,M分类和BC的分子亚型与免疫评分显著相关(图4A)。验证集中,高免疫评分与TNM分期,M分类和BC的分子亚型呈正相关(图4B)。

PART.6预后免疫评分模型预测与T细胞信号转导,免疫检查点,炎症和EMT相关的基因的差异表达

使用预后免疫评分公式计算836个TCGA样本的免疫评分。根据阈值0.374将样本分为低风险组和高风险组。GSEA分析表明低风险组显著富集在T细胞受体信号通路,抗原受体-介导信号通路,和免疫应答活化等通路(图5A)。低风险组免疫检查点CTLA-4,PD-1和PD-L1的表达量显著升高(图5B)。共鉴定到218个差异表达基因(38个上调基因和180个下调基因)。其中MMP9,SPP1,MMP12等基因在高风险组显著上调表达(图5C)。GO富集分析表明,高风险组中的基因主要参与细胞外基质,细胞外结构组织,胶原分解代谢过程,细胞外机制分解等功能(图5D)。

END


作者利用TCGA和GEO等5个数据库中的乳腺癌患者表达谱数据,建立了免疫评分模型,该模型能够准确预测患者的总生存期。并通过验证集进行验证。此外,作者还分析了该预后免疫评分模型对患者化疗效果和临床特征的预测能力。本提出的免疫评分模型为乳腺癌患者预后评估提供了重要的实证支持。

资源下载: