什么是热图
热图是一种以颜色的变化来表示数据矩阵或数据集中程度的图表工具。通过颜色的深浅来表示数值的大小,颜色越深表示数值越大,颜色越浅表示数值越小。
在生物信息学中,热图常用于展示基因表达、蛋白质相互作用、代谢途径活性等方面的数据信息。例如,在基因表达研究中,热图可以展示同一基因在不同组中的表达水平,通过色阶变化显示表达量高低。能够直观地展示数据的分布情况,发现数据之间的关联性,并突出显示具有显著特征的数据点。
怎么看懂热图
①横坐标,每一列代表一个样本
②横坐标,每一行代表一个基因
③基因表达水平对标色阶,红色代表高表达,蓝色代表低表达
④代表不同的分组
⑤左边是基因表达模式的聚类分析的树形图,显示了基因的相似性,树枝越短说明基因在不同样本中的表达越相似
⑥不同分组的颜色说明
总结
色阶:用颜色展示表达量,比数字更直观,对比更明显
聚类:本质上是利用多组间两两的差异程度或者相似程度作为依据,对多组值进行层吸聚类,以最终得到样本间聚类的远近关系。
总之就是一句话通过颜色看表达量,通过聚类看关系
其他的一些热图形式
环形热图:将普通聚类热图美化绘制成环形。它与聚类热图相同,常用于呈现多样本基因的差异性表达(RNA-Seq),通过使用颜色由深至浅的变化来清晰地展示多个样本中基因的表达量高低
相关性热图:应用于多组学关联分析,如微生物于环境因子、基因组于代谢物、转录组于性状等等,同时展现组间/组内的相关性分析结果
气泡热图:结合了热图和气泡图的优势,可同时用气泡颜色和气泡大小展示两个维度的数据。适用于基因表达分析中,特别是在RNA测序(RNA-seq)和微阵列(microarray)实验中