GSEA的定义
GSEA(基因集富集分析)是一种用于评估基因集在基因表达数据中的富集程度的方法,判断这些基因集对特定表型的贡献程度。
GSEA的用途
生物学研究:帮助理解基因如何在特定条件下调控特定的生物学过程,如癌症发生、免疫、代谢等。
疾病研究:通过基因集合的富集情况,揭示不同疾病或临床状态下的潜在生物学特征,找到生物标志物。
药物开发:分析药物作用下基因集的富集情况,识别药物可能作用的靶点和信号通路。
转录组数据解读:在处理大量基因表达数据时,GSEA可以帮助减少数据维度,聚焦于功能上相关的基因集合,而不是分析单个基因。
GSEA图怎么看?
①富集分数
②指标排名得分
③红色区域表示在上调的基因,蓝色区域表示表达下调的基因,反映了基因在条件下的表达变化趋势。
④黑色线条展示基因集中每个基因出现在基因排序列表中的位置,每一根线条代表基因集中的一个分子,可以看出那些基因再富集评分中贡献最大
⑤富集曲线表示ES评分的过程,绿色曲线的峰值表示基因集的最大富集程度。峰值为正表示富集通路上调,峰值为负表示富集通路下调
⑥每个基因的排名指标得分,表示基因与表型的相关程度。零交叉点是从正变为负的位置,帮助区分正/负相关的基因。
GO、KEGG、GSEA分析之间有什么区别呢?
GO分析基于基因本体,主要用于描述基因和蛋白质的功能。它包括三个主要方面:分子功能、生物过程和细胞组分,更偏向于单个基因的功能归类。
KEGG分析,主要用于探讨基因在特定代谢通路或信号传导通路中的作用,常用于分析差异表达基因在某些已知的生物学通路中的富集。
而GSEA分析可以在不做差异分析的情况下,找到和性状相关的通路\基因集合,可用于任何基因集合,包括GO、KEGG等