百趣代谢组学文献分享:OnPLS方法在哮喘领域应用研究

百趣代谢组学文献分享,本周分享的文献题目为OnPLS-Based Multi-Block Data Integration: A Multivariate Approach to Interrogating Biological Interactions in Asthma,是由日本前桥群马大学创新研究中心Craig E. Wheelock教授课题组在2018年发表于Analytical chemistry上的一篇文章。

1代谢组学文献分享—研究背景

在后基因组时代,随着组学技术发展的日益成熟,多个不同组学之间的联合分析越来越被科研工作者认可接受,以期寻求不同组学间的内在关系和规律趋势。

代谢组学文献分享,基于两个不同组学联合分析已有类似O2PLS等建模方法,但在两个以上不同组学联合分析的方法尚未发现。代谢组学文献分享,鉴于此,本文采用一种全新的多元变量统计模型方法——OnPLS去探索在哮喘病人中不同转录、代谢、脂肪酸、脂类和临床数据间表达变化关系和引发骨密度下降的机理研究。

2代谢组学文献分享—研究方法

样本来源:临床样本(n=22)包括健康组和哮喘组两种。

六类分析数据模块详情见下图:

数据分析:代谢组学文献分享,结合MATLAB 2018a和SciPy工具进行OnPLS方法统计建模,以期发现这六类数据间的含量表达相关性,通过筛选出强相关信息找出哮喘病人口服类固醇治疗前后这些数据的含量变化规律,为后续进一步阐明哮喘病人的发病机制提供有力理论数据支撑。

3代谢组学文献分享—分析流程

通过使用OnPLS方法对上述六类数据分析模块进行统计建模,结合得分图发现样本组间区分差异,然后再利用MB-VIOP指标对关键变量进行筛选,代谢组学文献分享,最后使用可视化和弦图对引起疾病变化的不同模块关键变量进行直观展示和关联分析。

4代谢组学文献分享—结果与讨论

OnPLS的数据结构

globally joint structures:全局多元数据间关系;

locally joint structures:局部多元数据间关系;

unique structures:单个多元数据内在关系;

residual noise structures:系统噪音误差。

OnPLS模型运算参数表

表2. 模型共产生7个成分,2个globally joint成分,5个locally joint成分。其中,脂肪酸、氧化脂类和鞘脂类累计贡献率均超过70%以上,相反,代谢、转录和临床数据表达贡献水平一般。

OnPLS模型相关性图

图为OnPLS模型七个成分的得分值与临床指标数据的spearman相关系数。代谢组学文献分享,红色表示正相关,蓝色表示负相关,透明度和圈的大小反应相关程度的强弱,其中,黑色方框标记的表示p<0.05,显著相关。从图中可以明显发现,除性别与第一成分得分呈现显著负相关外,其它临床指标均与第一成分得分表现为显著正相关关系。

OnPLS模型得分和载荷图

图A. 在H-PCA(hierarchical PCA)模型得分图第一主成分上,正常组和哮喘病组有明显区分,而在第二主成分上,不同性别间则呈现出较明显区分,同时对应第一主成分箱线图也直接表明不同男性患病情况波动较大。

图B. 与之前模型相关性图和得分图结果趋势一致,载荷图中第一主成分和第二主成分上的相关变量对样本分组贡献也比较大,脂类物质的影响尤为显著。

MB-VIOP关键变量筛选

图A中,使用MB-VIOP>1对第一主成分上的六类不同数据筛选处理得出一些关键的变量,其中除转录组数据外,红色标记的变量表示通过卡值差异筛选,考虑到转录组数据量大的原因,本文将第一主成分的转录组数据差异筛选设定为2。

图B中,使用MB-VIOP>1对第二主成分上的五类不同数据筛选处理得出一些关键的变量,其中除转录组数据外,红色标记的变量表示通过卡值筛选,为了进一步减少转录组数据受疾病-性别因素的影响,本文将第二主成分的转录组数据差异筛选提高到了2.5。

注:MB-VIOP:Multi-block Variable Influence on Orthogonal Projections。

第一主成分上关键变量筛选

红色:临床差异信息,灰色:转录组学差异信息,绿色:代谢组学差异信息,黄色:差异鞘脂类,蓝色:差异脂肪酸,橙色:差异氧化脂类,数字:连接度,黄色连线:正相关,紫色连线:负相关,蓝色节点:含量在哮喘病人中上升,红色节点:含量哮喘病人中下降。

图A可以发现,在与影响生理调节重要转录因子NPAS2具有显著相关的五个代谢物中,四个均属于神经酰胺类,值得注意的是,此前未有这方面的报道。代谢组学文献分享,由此推测,神经酰胺类的物质变化可能会对发病产生一定的影响。

第二主成分上关键变量筛选

红色:临床差异信息,灰色:转录组学差异信息,绿色:代谢组学差异信息,黄色:差异鞘脂类,橙色:差异氧化脂类,数字:连接度,黄色连线:正相关,紫色连线:负相关,白色节点:含量在女性组中上升,黑色节点:含量男性组中上升。

图B可以看出,PCDH10和LOC284219与氧化脂类呈现了非常明显的强相关性,进而推断这两个转录因子在患病的情况下,对氧化脂类的代谢具有较大的影响。

5代谢组学文献分享—结论

通过建立OnPLS方法可以有效将多个不同组学的联合起来进行分析。

代谢组学文献分享,结合可视化分析图表和MB-VIOP指标可以实现帮助找到与疾病发生密切相关的一些关键基因,如ATP6,V1G1等,为进一步阐明哮喘病人骨密度下降发病机理提供强有力的理论支持。

6个人观点

本文针对多个不同组学数据联合分析,提供了比较完整的数据分析过程和清晰的关键变量筛选标准。

为了更深入的研究哮喘发病相关机制,文章可考虑从代谢通路,网络互作,分子实验等方法进行后续分析验证。

资源下载: