每个研究生同学都知道读文献的重要性,可文献学习,究竟学什么?如何学以致用?如何借鉴并用来找到自己的研究方向?这些问题相信是绝大部分同学都迷惑的。
本篇,以一个实例为大家展示如何通过文献学习,利用文献中的数据找到自己研究方向。
本文是本月初刚发表在Cancer Discovery(IF=38.27)上的一篇文章,本文作者利用其它文献中的单细胞测序数据,再结合公共数据分析,找到了其课题切入点,并深入研究,最终成功发表。关于这篇文章的整体内容不在此文详述,这里主要介绍他们的思路—利用文献中的单细胞数据,结合公共数据分析,找到自己课题切入点。首先需要知道,一个好课题的确立,需要结合文献背景+前期表型结果+数据分析,能够将这三者统一起来的研究假说,就可以进行立题!按照以上思路,我们看本研究怎么逐步立题的:
-
文献背景:本研究前期通过文献研究发现,胰腺癌肿瘤组织中神经浸润明显,且神经浸润与不良预后显著相关,并且神经浸润周围有显著增多的神经胶质细胞(本文是施旺细胞);
-
前期表型结果:本研究在前期体外细胞实验发现,神经胶质细胞(本文是施旺细胞)可以促进胰腺癌肿瘤的扩散;
基于以上两点,可以提出初步科学假设,即胰腺癌肿瘤组织中,神经胶质细胞(本文是施旺细胞)可能促进肿瘤细胞的转移。
为了进一步增加该科学假说的可靠性,达到可以立题的程度,就需要结合第三点,也就是数据分析。
此时,本研究便通过查找文献,利用其他人已发表单细胞数据,找到了神经胶质细胞(本文是施旺细胞)单细胞数据中的marker基因集合,也就是用来定义施旺细胞及其几个亚群的基因集合(可称之为signature)。拿到了施旺细胞的signature,接着就可以利用单细胞获得的这个signature,在TCGA的bulk RNA-seq数据中,对胰腺癌每个病人打分(score),通过score就可以将病人分为高低两组,然后进行生存分析,确定了施旺细胞越多,胰腺癌病人预后越差。
至此,以上三方面(文献背景+前期表型结果+数据分析)结果实现了相互支持统一,可以立题!确定科学假说:施旺细胞通过促进胰腺癌转移!确定了基本科学假说后,为了进一步推断施旺细胞如何促进胰腺癌转移,作者将施旺细胞和胰腺癌细胞进行共培养,然后对共培养后的施旺细胞进行RNA-seq,通路富集分析提示施旺细胞富集最显著的是轴突形成通路。
于是,科学假说进一步完善:施旺细胞通过形成轴突促进胰腺癌转移!后续整篇文章便围绕证实以上科学假说设计实验,拿到支持结果,最终实现文章整体完成!
小结
本文利用已发表单细胞数据获取定义特定细胞类型的signature,然后在bulk测序数据中进行打分,根据打分可以进行生存分析、差异基因分析及通路富集分析,评估特定细胞类型与疾病表型之间的关系!这一研究思路非常值得借鉴!在当前单细胞数据如此丰富的情况下,只要我们能够花足够的时间,进行文献整理,筛选出一些和疾病表型高度相关的细胞类型,然后利用单细胞数据获取该细胞及其亚型的marker基因(signature),然后结合bulk数据分析,就可以有效筛选出在疾病中可能发挥作用的细胞亚群,再结合初步细胞表型实验进行确证,即可确定科学假说,找到自己的研究方向。