今天给同学们分享一篇生信文章“Identification of metabolic biomarkers associated with nonalcoholic fatty liver disease”,这篇文章发表在Lipids Health Dis期刊上,影响因子为4.5。
结果解读:
识别NAFLD患者的MR DEG
主成分分析(PCA)图显示了在消除数据集之间的批次效应之前和之后的GSE48452和GSE63067(图1A-D)。在合并的数据集中,总共识别出129个NASH和HC患者的DEG。其中100个基因上调,29个基因下调(图2A)。使用热图对这些DEG进行可视化(图2B)。最后,将DEG和948个MRG交集以识别18个MR DEG(图2C)。随后,进行了功能富集分析,以确定NAFLD相关MR DEG的潜在机制。图2D显示了每个分类下的前十个GO术语。结果显示,这些MR DEG主要富集在“类异戊二烯代谢过程”、“酰基甘油生物合成过程”和“脂肪酸代谢过程”中。这些MR DEGs富集的KEGG途径主要包括“类固醇激素的生物合成”以及“脂肪酸和甘油脂代谢”途径(图2E)。最后,构建了MR DEG的PPI网络,该网络包括12个节点(11个上调基因和1个下调基因)和14个边缘(图2F)。PPI网络显示LPL与PLA2G7、ME1、FADS2、ACSL4和DGAT2有相互作用。同时,FMO1与CYP1A1和UGT2A3相互作用。
代谢相关生物标志物的筛选
为了进一步挖掘关键基因,对18个MR DEG进行LASSO回归分析以筛选关键基因,并鉴定出10个特征基因,包括ACSL4、酰胺解结构域1(AMDHD1)、CA14、DGAT2、含有亚麻酸的二甲基苯胺单加氧酶1(FMO1)、IDO2、脂蛋白脂酶(LPL)、(脯氨酸4-羟化酶亚基α1)P4HA1、PKLR和TREH(图3A-B)。同时,使用RF算法鉴定了10个特征基因,包括CYP1A1、UGT2A3、P4HA1、ME1、AMDHD1、PDE11A、PLA2G7、FMO1、LPL和FADS2(图3C-D)。随后,使用这些算法获得了四个交集的基因,AMDHD1、FMO1、LPL和P4HA1(图3E),并将其定义为NAFLD中的代谢相关生物标志物(MRBs)。MRB的AUC值为 > 0.8,因此表明这些MRB具有良好的诊断准确性(图3F)。接下来,进一步验证了外部验证集(GSE89632)中生物标志物的诊断价值,结果与训练集一致(图3G)。随后,列线图(C指数 = 0.95)以进一步探索生物标志物的临床价值(图3H)。校准曲线显示,实际风险和预测风险之间的误差较小,表明列线图模型对NASH样本具有较高的预测精度(图3I)。
免疫浸润和功能富集分析
为了分析NAFLD患者的免疫微环境,在训练队列中比较了两组28种免疫细胞类型的相对丰度。结果显示,八种免疫细胞的丰度存在显著差异,包括活化的和中央记忆的CD4 T细胞、未成熟的和活化的树突状细胞(DC)、效应记忆的CD8 T细胞,肥大细胞、髓源性抑制细胞(MDSCs)和T卵泡辅助细胞(Tfh)(图4A)。图4B显示了MRB和差分ICI之间的相关性。观察到AMDHD1和Tfh细胞之间的显著负相关,以及LPL和活化的CD4 T细胞之间的正相关(图4C)。接下来,对生物标志物进行ssGSEA,以确定AMDHD1、FMO1、LPL和P4HA1在NAFLD中的可能功能。结果表明,AMDHD1主要富集在“细胞质翻译”和“ECM”中 − 受体相互作用’。此外,FMO1主要富集在固有的凋亡和FoxO信号通路中。“染色体分离”和“补体和凝血途径”主要由LPL富集。P4HA1主要富集在“有机酸分解代谢过程”和“神经活性配体受体之间的相互作用”中。
四个基于MRB的PPI网络
构建了一个整合AMDHD1、FMO1、LPL和P4HA1的调控网络,以确定这些MRBs的潜在调控机制。此外,将信使核糖核酸-信使核糖核酸和TF信使核糖核酸配对,构建由25个miRNA、4个信使核糖核酸、41个转录因子、37个节点和51个边缘组成的“信使核糖核酸-miRNA-TF”调控网络(图5)。结果表明,AMDHD1、P4HA1和FMO1可能具有共同的调节因子,如PAD21和CTCF。
验证MRB表达式
分别测定训练集和GSE89632中患者的预后基因表达。结果显示,与训练队列中的HC组相比,NASH组患者的FMO1和LPL表达水平增加,AMDHD1和P4HA1表达水平降低(图6A)。在GSE89632中,与HC组相比,NASH组患者的AMDHD1和P4HA1表达水平显著降低,FMO1和LPL表达水平显著增加(图6B)。最后,使用qRT-PCR测定这些MRB在患者血液样本中的表达。结果与通过分析公开数据库获得的结果一致(图7)。
总结