Nat Neurosci | 空间转录组技术揭示背外侧前额叶皮层的空间差异表达

美国约翰霍普金斯大学的研究人员使用空间转录组技术揭示了人脑背外侧前额叶皮层(DLPFC)基因的空间表达图谱，此文章发布在2021年2月Nature Neuroscience上，下面为文章的详解。

文章题目：Transcriptome-scale spatial gene expression in the human dorsolateral prefrontal cortex

发表时间：2021-02-08

发表期刊：Nature Neuroscience

主要研究团队：约翰霍普金斯大学研究团队等

影响因子：24.884

DOI：10.1038/s41593-021-00817-5

研究背景

大脑的空间分区与其功能存在着根本上的联系。这种结构-功能关系在人类大脑皮层的层状组织中尤其明显，其中位于不同皮层的细胞显示出不同的基因表达模式，并显示出不同的形态、生理和连接模式。理解正常的大脑发育以及中枢神经系统疾病需要识别构成大脑的细胞类型，并将细胞类型的功能与结构联系起来。空间转录组技术克服了与sn/scRNA-seq和基于显微镜的空间转录组学方法相关的限制，为提供详细的分子图谱带来了巨大的潜力。

研究样本

样本组成：三个正常成年人的两对空间重复，第一对由两个直接相邻10μm厚的组织切片组成，第二对位于第一对后方300μm，一共12个样本。

采样区域：背外侧前额叶皮层（DLPFC）。

研究策略

研究者将冰冻组织切片放置在芯片的捕获区域内，进行HE染色和成像后，对组织切片进行透化处理，细胞内的mRNA释放，从而被芯片上带有oligo-dT的探针捕获，并且每个探针都带有特异的地址序列，然后以mRNA为模版进行cDNA合成，构建文库后再通过测序，获得基因表达信息的同时，每一条测序reads因带有地址序列，从而能够获得基因表达的位置信息。

研究成果

1. 空间转录组数据产出情况

本研究对12个样本进行测序，平均深度为291.1 × 106个reads，这相当于平均每个位点3,462个唯一分子标识符（UMIs）和1,734个基因。高分辨率组织学图像的独立处理和细胞分割显示平均每个spot包含3.3个细胞。通过在每个组织切片中使用灰质/神经元（SNAP25）、白质/少突胶质细胞（MOBP）和L5 （PCP4）的标记基因，描绘第6层（L6）和相邻白质（WM）之间的边界并识别第L5层，来确认样本方向。

2. DLPFC不同皮层的基因表达

首先为每个空间复制生成聚集的层富集的表达谱，使用“有监督”方法将单个点分配给六皮层或白质。然后通过在每一个空间复制中对该层每个基因的UMI计数求和进行“伪bulk”，以产生层富集的表达谱（图3a）。伪bulk法将12个样本中的47,681个点归纳为76个层聚集分布，消除了稀疏性，极大地提高了基因的UMI覆盖率（图3a）。对这些层富集表达谱的无监督聚类揭示了与层状差异相关的数据中变化的主成分，特别是在白质和灰质之间（图3b），在一对空间复制之间具有高度一致性。

本研究使用了三种策略来执行差异表达（DE）分析：

1）检验六层+WM的平均表达差异（也检验了只包含六层的差异），称为“ANOVA（单因素方差分析）”模型（图3c），估计每个基因的F统计量；

2）检验每一层和所有其他层的表达差异确定层富集基因，称为“富集”模型（图3d）；

3）检验每两层之间（21对）表达差异的基因，称为“成对”模型（图3e）。

3.识别新的层富集基因

将先前发表的层富集基因作为一个基因集，在该研究的层富集DEGs中发现强富集。因为很多标记基因注释多层（例如CCK和ENC1）,使用前面得到的层富集表达谱对每个基因计算“最优”统计模型。例如，CCK（图4c）被注释为L2, L3, L5和L6，并在最优模型中L2, L3,L5, L6与L1, L4和WM进行对比。

本研究的人类DLPFC数据中，只有一部分先前相关的层富集基因出现了高水平和显著差异表达，这主要是由Zeng等人鉴定的。研究进一步证实了许多典型标记基因的层富集，包括CCK （图4c)、（图4d），并根据艾伦脑研究所人脑图谱中公开的单复合体原位杂交数据验证了这些发现。有趣的是，虽然许多基因 [FABP7（图4a）、ADCYAP1、PVALB（图4b）]显示层富集达，但它们没有被艾伦脑研究所的资源归类为层标记，这表明了定量转录组空间方法的效用。

研究发现了以前未被识别为层标记物的基因，包括AQP4 （L1）、HPCAL1 （L2）、FREM3 （L3）、TRABD2A （L5）和KRT17 （L6）。本研究使用smFISH、文献和空间转录技术数据重复验证了这些新的层富集基因表达谱。

4. snRNA-seq的空间定位

从“富集模型”导出的层富集表达谱和差异表达统计用于snRNA-seq数据集的空间定位（图6a）。这里的snRNA-seq数据主要是从人死后颞中回皮层的人工解剖分离皮层的神经元细胞核中获得的，空间组织切片层富集的DEG与这些细胞核来源的层分配相一致（图6b）。

接下来使用层富集的统计数据对人类皮层的三个独立snRNA-seq数据集进行空间定位：

1）使用两个人体DLPFC的5,231个细胞核生成自己的snRNA-seq数据；

2）自闭症谱系障碍（ASD）研究中包括来自31个人体的41个样本前额叶皮层和前扣带皮层104,559个细胞核的snRNA-seq数据；

3）阿尔茨海默病研究中来自48个人体的70,634个细胞核的snRNA-seq数据。

神经胶质细胞亚群和神经元细胞亚型显示出预期的层富集，例如神经胶质细胞亚群在WM中优先表达少突胶质细胞亚型，多种兴奋性和抑制性神经元细胞类型与L2/L3，L4，L5和L6优先表达相关（图6c）。有趣的是，在本研究数据中，由Mathys等人确定的与阿尔茨海默病的临床特征最相关的兴奋性神经元亚类（Ex2，Ex4，Ex6）优先定位于DLPFC的上层。这一发现与Mathys等人的推论—兴奋性神经元亚类Ex4和Ex6优先在深层表达，而兴奋性神经元亚类Ex2没有显示层状富集—形成对比。

5．层富集基因表达谱的临床相关性

最新的SFARI基因数据库证明L2、L5和L6与869个ASD风险基因的富集。WES数据证实了L2和L5与102个具有ASD相关变异的基因的关联。根据临床症状对这些基因进行分层可以细化分层富集，因为ASD显性性状相关的53个基因与L5更富集，而神经发育延迟相关的49个基因与L2更富集。这些风险基因的层富集关联在很大程度上与差异基因富集无关。

（图7a）与SCZD相关的基因也有明显的分层富集。两个大型SCZD数据集中鉴定的DEGs的富集分析，与对照组相比，患者中L1、L2和L3基因的表达增加，WM、L4、L5和L6基因的表达减少（图7b）。研究还评估了TWAS数据。虽然没有观察到任何层富集基因表达的TWAS信号的强富集，但L2和L5的SCZD风险基因表明患者的表达减少（图7b）。

总之，这些分析通过将成人DLPFC的层富集基因表达纳入风险基因的解释，突出了这些数据在临床方面的潜在效用。

6．无监督层富集聚类

基于cytoarchitecture的人工注释识别层富集DEG的“有监督”方法（图8a），在缺乏清晰形态学边界的其他大脑区域或人体组织中不可行。使用手动注释层作为“金标准”（图8a），评估三种方法（“无监督”、“半监督”和“标记基因”）的性能，使用ARI作为性能度量（图8f）。“半监督”方法具有三种方法中最高的ARI。

总结

本研究为广大科学界创造资源以继续探究数据的生物学问题，并扩展当前的神经科学和空间转录组学研究。本研究中提供的数据和代码可以通过spatialLIBD （http://spatial.libd.org/spatialLIBD）获得。

资源下载：

下载地址： http://yemao.in/life?utm_source=sishubiji&utm_term=Nat Neurosci | 空间转录组技术揭示背外侧前额叶皮层的空间差异表达