::: block-1
文献介绍
文献题目: 整个小鼠大脑的单细胞空间转录图谱 \
研究团队: 孙衍刚(中国科学院脑科学与智能技术卓越创新中心)\
发表时间: 2025-03-23 \
发表期刊: Neuron \
影响因子: 14.7(2024年)\
DOI: 10.1016/j.neuron.2025.02.015
:::
摘要
构建涵盖整个哺乳动物大脑的基因、细胞类型及其空间分布的综合图谱,是理解大脑功能的基础。本研究通过 snRNA-seq 和 Stereo-seq 技术,创建了单细胞分辨率的小鼠脑图谱,涵盖 308 个细胞类群(涉及超 400 万个细胞)和 29,655 个基因的空间信息。作者发现了皮层亚区偏好的细胞类群,并探索了它们与脑相关疾病的关联;定位了 155 个在脑干内具有区域特异性表达模式的基因,揭示了 513 个在成年大脑中呈现区域富集表达的长链非编码 RNA。基于空间转录组信息的脑区划分,解析了多个脑区的精细结构。此外,作者还鉴定出 411 个在神经发育过程中呈现明显时空动态变化的转录因子调控子。由此,作者构建了具有全基因组覆盖度的小鼠脑单细胞分辨率空间转录组图谱。
前言
哺乳动物大脑的复杂性体现在多样化的细胞类型及其特异性分布与连接模式上,这为解析行为背后的神经环路机制带来了巨大挑战。作为最广泛使用的动物模型,小鼠脑图谱构建已取得系列成果:包括基于传统细胞构筑特征的解剖学图谱、覆盖约 20,000 个基因的表达图谱,以及揭示脑细胞类型多样性的单细胞转录组图谱。然而,兼具单细胞分辨率和全脑空间信息的小鼠脑图谱仍属空白。
空间转录组学的最新进展为高精度绘制基因表达与细胞类型提供了革命性工具。基于原位杂交(ISH)和原位测序(ISS)的技术(如 MERFISH 和 STARmap)虽具有高捕获效率与空间分辨率,但仅适用于少量预选基因;而 Visium、Slide-seq 等空间条形码技术虽能进行全转录组分析,却缺乏单细胞分辨率。尽管已有研究通过成像或测序技术构建小鼠脑图谱,但兼具全基因组覆盖度和单细胞分辨率的空间图谱仍未实现。
大脑发育受特定转录因子(TFs)调控的遗传程序指导。先前的单细胞 RNA 与空间转录组研究虽揭示了胚胎期小鼠脑的分子异质性,但尚未系统解析具有时间依赖性动态变化或梯度分布特征的发育相关基因。基因表达的时空动态分析对揭示脑发育的遗传调控机制至关重要。此外,大脑在出生后仍持续成熟,但这些阶段的时空基因表达谱尚未充分解析。因此,从胚胎到成年的基因时空动态研究对全面理解脑发育机制不可或缺。
越来越多的证据表明,非编码 RNAs(ncRNAs),尤其是长链非编码 RNAs(lncRNAs)在哺乳动物大脑发育、成熟及疾病等生物过程中发挥重要作用。例如,lncRNA Pnky 被证实对脑发育至关重要;Evf2 可作为 Dlx2 转录共激活因子增强其活性,从而调控神经元分化与迁移。部分 lncRNA 的功能与其脑区富集表达模式高度相关。尽管 bulk 测序研究已对小鼠脑区 lncRNAs 进行表征,但全脑范围内其区域选择性表达模式、以及在调控子与相邻基因对中的潜在调控作用仍缺乏系统解析。
本研究应用具有单细胞分辨率的空间转录组技术 Stereo-seq,结合单核 RNA 测序(snRNA-seq)数据,构建了展示小鼠全脑细胞类型分布的 3D 单细胞转录组图谱(https://mouse.digital-brain.cn/spatial-omics
)。通过整合不同发育阶段数据,作者揭示了基因、基因模块及 TF 调控子的时空动态特征。该综合数据集不仅为小鼠脑研究提供了宝贵的空间图谱资源,更为探索大脑发育、功能及基因调控机制奠定了坚实基础。
研究结果
1. 鼠脑的空间转录组分析
作者采用基于测序、全基因组覆盖且具有高分辨率的空间转录组技术 Stereo-seq,构建了成年小鼠大脑的空间基因与细胞图谱。实验对左侧大脑半球进行 100μm 间隔的冠状面切片(厚度 10μm)(Figure 1A),获得 123 个切片(经质控后,FigureS1;STAR Methods),共检测到 29,655 个基因的表达谱,覆盖 95.5% 的已注释蛋白编码基因和非编码基因。Stereo-seq 绘制的脑区特异性基因分布图与 Allen 脑图谱(ABA)基于原位杂交(ISH)的数据高度一致(FigureS2A)。如先前所述,作者通过单链 DNA(ssDNA)图像界定了单个细胞的边界,在一个小鼠大脑中共鉴定出 4,229,623 个细胞,平均每个细胞含有 1,267 个分子标识符(MIDs)和 668 个检测到的基因(FigureS2B;TableS1)。此外,作者根据细胞构筑特征和 ABA 通用坐标框架(CCFv3)的脑区划分标准,对每个切片进行了人工脑区标注(Figure 1A)。
:::block-1
(A) 小鼠大脑空间转录组构建流程示意图。红色圆圈标记细胞分割中的细胞边界。\
(B) 基于 snRNA-seq 鉴定的 308 个细胞类群分类树,每个类群分配唯一名称和颜色。条形图显示 snRNA-seq 细胞来源区域占比(OB,嗅球;CTX,大脑皮层;HIP,海马;CNU,大脑核团;TH,丘脑;HY,下丘脑;MB,中脑;P,脑桥;MY,延髓;CB,小脑。区域缩写见 Table S10)。气泡图展示神经元中神经递质/调质相关基因在 snRNA-seq 的表达(Slc17a7 和 Slc17a6 为谷氨酸能;Gad1 和 Slc6a1 为 GABA 能;Hdc 为组胺能;Slc6a3 为多巴胺能;Avp 为精氨酸加压素;Gal 为甘丙肽;Hcrt 为食欲素;Tph2 为5-羟色胺能;Slc6a2 为去甲肾上腺素能;Ucn 为尿皮质素;Chat 为胆碱能)。\
(C) 细胞亚类与类群的 UMAP 可视化。\
(D–F) 代表性冠状切片的细胞类群分布总览。(D) 在 1 号小鼠中每隔 1 mm 选取切片(标注切片编号与 Bregma 坐标,单位 mm)。(E-F) 对 (D) 中红框区域的放大显示,蓝框分别标注皮层第 4 层 (E) 和蓝斑核 (F) 边界并进一步放大。谷氨酸能神经元标红,去甲肾上腺素能神经元标粉。比例尺:1 mm、500 μm、50 μm。
:::
考虑到单细胞基因检测数量有限,难以实现精确的细胞类型注释,作者对所有主要脑区进行了单核 RNA 测序(snRNA-seq),以获得全面的细胞注释信息(Figure 1A;Table S1)。通过迭代聚类分析,作者将 378,287 个高质量细胞核划分为 6 个细胞大类、19 个亚类和 308 个细胞 clusters(Figures 1B and 1C;Table S2;STAR Methods)。利用经典标记基因进一步细化注释(Figure S2C),最终鉴定出 262 个神经元类群和 46 个非神经元类群。随机森林分析表明细胞类群分类准确率高达 83.1%(Figure S2D)。此外,作者将这些细胞类群与已发表的两个小鼠脑数据集(Figure S2E)进行比较,结果显示高度一致性。
基于 snRNA-seq 数据集定义的细胞类群,作者采用 Spatial-ID 算法对空间细胞进行注释,成功注释了超过 420 万个高质量细胞(Figures S3A and S3B;STAR Methods)。通过沿前-后轴的 14 个冠状切片,作者展示了代表性细胞类群的空间分布(Figure 1D)。特定细胞类群表现出明显的区域偏好性,例如海马和皮层中的层状分布谷氨酸能神经元(Figure 1E),以及蓝斑核中的去甲肾上腺素能神经元(Figure 1F)。
进一步研究表明,Spatial-ID 在 Stereo-seq 细胞类型注释中具有高度一致性和准确性(Figures S3C-S3F;STAR Methods)。为验证实验的可重复性,作者从第二只小鼠(mouse #2, Figures 1A and S2B)中收集了 72 个冠状切片(320 万个细胞),结果显示不同个体间的细胞类型分布和分子特征具有一致性(Figures S3G–S3I)。此外,作者将 Allen 全脑单细胞数据集与 Stereo-seq 数据整合,评估了不同参考数据集间细胞类型注释的一致性(Figures S4A–S4C),结果与之前基于 MERFISH 的注释相符。
通过整合 123 个冠状切片数据集,作者构建了小鼠全脑细胞类型分布的三维图谱(Figure 1A; Video S1),并开发了一个交互式网站(https://mouse.digital-brain.cn/spatial-omics
,Figure S5),以便研究者探索特定基因和细胞类型的空间分布。
2. 大脑中各种细胞类型的空间分布
作者定量评估了 308 个细胞类群在小鼠全脑 66 个分区中的分布特征(Figure 2A)。大多数细胞类群(尤其是神经元类群)表现出明显的区域偏好性(Figures 2A and 2B;Video S1)。皮层细胞中,绝大多数谷氨酸能兴奋性神经元同时具有区域特异性和皮层层级富集特征(Figure S6A)。通过对比已发表的小鼠大脑皮层数据集(Figure S6B;STAR Methods),作者将 snRNA-seq 鉴定的谷氨酸能神经元划分为 8 个具有层级特异性的皮层细胞群(Figures 2C-2F),其空间分布与标记基因表达模式高度吻合(Figure S6C)。进一步研究发现,特定皮层区域存在显著富集的谷氨酸能神经元亚群(Figures 2G、2H、S6D)。例如:压后皮层(RSP)特异的 L5/6_NP_GLU_61 细胞类群,以及边缘下区(ILA)富集的四个第 6 层细胞类群(L6_N_GLU_63/65/66/69)(Figures 2H, 2I, and S6E)。通过对比 ILA 区富集的 L6_N_GLU 细胞类群与其他 L6_N_GLU 细胞类群的差异表达基因,并结合 123 个脑疾病相关基因集的富集分析,发现 ILA 特异的第 6 层神经元高表达抑郁症相关基因(Figures S6F and S6G),提示该区域神经元可能在情绪障碍中发挥重要作用。
:::block-1
(A) 热图展示了 308 个细胞类群在 66 个脑区的分布情况(Z-score 标准化细胞比例)。\
(B) 8 个代表性细胞类群在小鼠全脑三维模型中的空间分布。\
(C) 热图显示谷氨酸能神经元在各皮层分层的标准化密度(Z-score)。\
(D–F) 谷氨酸能神经元在冠状切片 T73 上的分布(按细胞类群着色)。比例尺:500 μm。(D) 合并视图;(E) 对 (D) 中矩形区域的放大展示(含皮层深度分布信息);(F) 8 个谷氨酸能神经元亚群的分布。\
(G) 8 个谷氨酸能亚群在皮层三大功能网络中的密度分布(误差棒表示所有皮层切片的变异度,数据为 mean±SD)。\
(H) 谷氨酸能神经元在不同皮层区域的标准化密度热图(Z-score)。\
(I) L5/6_NP_GLU_61 和 L6_N_GLU_65 细胞类群在扁平化皮层图(左)及冠状切片 T85/T43(右)的分布。比例尺:1 mm。\
(J–K) 嗅鞘细胞(OEC_275/276)与星形胶质细胞(ASC_279)的分布及标记基因表达。比例尺:500 μm。(J) 分视图;(K) (J) 中矩形区域的合并视图。
:::
对于皮层内的 GABA 能抑制性神经元,根据 Lamp5、Sncg、Reln、Vip、Pvalb、Sst 和 Chodl 基因的表达情况,将 37 个细胞类群归纳为 7 组,这些基因标记了关键的 GABA 能神经元亚型(Figure S6H)。在这些 GABA 能神经元中,Pvalb 和 Sst 神经元在小鼠皮层中占主导地位(Figures S6I-S6K)。与谷氨酸能神经元相比,大多数 GABA 能神经元的层级偏好性较弱(Figure S6L)。然而,有几个细胞类群表现出层级富集特征,例如 Lamp5 神经元富集于浅层,Sst 神经元富集于深层。还发现了区域偏好性(Figure S6M)。例如,Sst 和 Reln 神经元在 ILA 区富集(Figure S6N),这与之前的报道一致。Pvalb 神经元在与外侧和内侧子网络相关的大多数区域(如颗粒岛叶后区 AIp)密度相对较低,但在 RSP 中 更为丰富(Figures S6O-S6Q)。在 Pvalb 细胞类群中,有三个(TE_N_GABA_PVALB_115/116/118)表现出这种模式。
尽管非神经元细胞比神经元分布更广泛,但有些表现出区域富集模式(Figures 1B、2A and S7A-S7C;Table S3)。例如,在 7 个星形胶质细胞类群中,ASC_281(Agt+)富集于非端脑区域,而由于表达 Gdf10 被鉴定为 Bergmann 胶质细胞的 ASC_283 则特异性分布于小脑(Figure S7D)。此外,作者比较了嗅鞘细胞(OECs)和星形胶质细胞在嗅球亚区的空间分布(Figures 2J and 2K)。OECs 与星形胶质细胞共享部分分子特征(Figures S7E and S7F),定位于嗅球的外层。作者发现两个 OEC 类群(OEC_275/276)主要分布在副嗅球(AOB)和主嗅球(MOB),而一个星形胶质细胞类群 ASC_279 在 MOB 中富集(Figure 2J)。在 MOB 及周围区域,ASC_279 富集于肾小球层,而 OEC_276 位于嗅神经层。相比之下,OEC_275 位于这两层之间的边界(Figures 2K)。这些细胞类群的分子特征存在差异,OEC_275 高表达 Kctd12,OEC_276 高表达 Clca3a1,ASC_279 高表达 Islr(Figure S7G)。进一步分析显示,ASC_279 与两个神经元类群(OB_N_GABA_174 和 OB_N_GLU_177)表现出更强的共定位(Figure S7H and S7I),而 OEC_275/276 则没有,这表明与 OECs 相比,ASC_279 与嗅球神经元的相互作用更密切。
为了研究细胞类型与神经系统疾病之间的关系,作者利用标记基因和与 123 种脑疾病相关的基因集,在细胞亚类和细胞类群中进行了富集分析(Figures S8A and S8B)。作者特别关注了帕金森病,其特征是黑质(SN)中多巴胺能神经元的进行性丧失,导致大脑中多巴胺减少。作者的分析揭示了 SN 中两个多巴胺能细胞类群(DIME_N_DOP_224/225)比例的差异(Figure S8C)。此外,这两个细胞类群在帕金森病相关基因集中的富集程度不同,DIME_N_DOP_225 表现出更高的帕金森病相关基因集中的富集程度不同,DIME_N_DOP_225 表现出更高的帕金森病相关基因表达(Figure S8D)。作者发现DIME_N_DOP_225 主要定位于 SN,而 DIME_N_DOP_224 分布更为分散(Figures S8E and S8F)。这些分布偏好可能与不同的脑功能和神经系统疾病有关,为我们理解脑组织结构和指导靶向治疗策略的开发提供了宝贵资源。
3. 脑干中神经元亚型和区域富集基因的分布
脑干对多种生理功能具有关键作用。结合 snRNA-seq 和 Stereo-seq 数据,作者鉴定出 23 个神经元细胞类群,并发现多个细胞类型具有区域特异性分布(Figure 3A)。例如,RH_N_GABA_257、RH_N_GLU_210、RH_N_GLU_240、RH_N_GLU_252 分别特异性分布于斜方体核(NTB)、臂旁核(PB)、三叉神经感觉主核(PSV)和耳蜗核(CN)(Figure S9A)。值得注意的是,NTB 和 CN 均属于听觉相关核团,其对应的 RH_N_GABA_257 和 RH_N_GLU_252 细胞类群均呈现小白蛋白(parvalbumin)阳性表达(Figure S9B)。相比之下,非神经元细胞在脑干中未表现出类似的区域分布特征(Figure 2A)。
:::block-1
(A) 热图显示不同细胞类型在脑干核团中的分布密度。\
(B) 区域选择性细胞类群(红色)与标记基因(蓝色)的空间分布。比例尺:1mm。\
(C) 热图显示 4 个运动核团中富集基因的表达情况。\
(D) RH_N_CHO_233 细胞在 4 个运动核团中 4 个代表性基因的表达分布。比例尺:200um。\
(E) 热图显示 3 个中缝核中基因的选择性表达特征。\
(F) RH_N_SER_229 细胞在 3 个中缝核中 3 个代表性基因的表达分布。比例尺:200um。\
(G) 热图展示 155 个在脑干核团中具有区域偏好性的基因。
:::
运动神经元和神经调质神经元在脑干中呈现显著富集。胆碱能神经元(RH_N_CHO_233)、去甲肾上腺素能神经元(RH_N_NOR_231)和5-羟色胺能神经元(RH_N_SER_229)分别富集于运动核团、蓝斑核(LC)以及中缝核(Figures 3A and 3B; Video S2)。由于脑干运动核团体积小、边界弥散且缺乏不受周边区域污染的转录组数据,解析不同运动核团是否具有独特分子特征一直存在挑战。通过 Stereo-seq 数据,作者揭示了脑干运动核团(包括三叉神经运动核(V)、面神经核(VII)、舌下神经核(XII)和迷走神经背核(DMX))的高度异质性(Figures 3C and S9C)。例如,Nrgn、Ttr、Gal 和 Dag1 等基因在特定运动核团中呈现富集表达(Figure 3D)。基因功能(GO)分析进一步显示这些核团的功能差异(Figure S9D)。此外,不同中缝核中的5-羟色胺能神经元也表现出选择性基因表达模式(Figures 3E and 3F),凸显了具有空间富集特征的胆碱能和5-羟色胺能神经元的基因表达多样性。
脑干区域富集基因对生理功能至关重要。作者进一步鉴定出 155 个基因(STAR Methods)在 22 个脑干核团中高表达(Figures 3G and S9E)。例如,Pth2 和 Sst 在内侧旁丘系核(MPL)富集,与之前报道一致。这些基因主要编码酶类、受体相关蛋白和神经肽(Figure S9F; Table S4)。值得注意的是,参与去甲肾上腺素合成的 Dbh 在 LC 高表达,而与5-羟色胺合成相关的 Ddc 和 Tph2 则在 Ramb 富集。Plpp4、Dpysl3 和 Ache 等酶相关基因集中分布于 DMX。多个神经肽(Nmb、Nps、Pth2、Rln3、Ucn)在脑干呈现区域富集(Video S3)。此外,部分基因表现出亚区富集特征,如 Barhl1 在耳蜗核背侧(dCN)、Hhip 在耳蜗核腹侧(vCN)特异性表达(Figure S9G)。作者的分析不仅提供了 23 个神经元细胞类群的分布图谱,还揭示了脑干中众多具有区域或亚区富集特征的基因。
4. 基于转录谱的大脑区域谱系和基因模块的空间分布
传统的脑区划分主要基于细胞构筑和功能特征,而忽略了转录组特性。借助全脑空间转录组图谱,作者探索了是否能够优化脑区划分方法。具体而言,作者对 #1 小鼠 123 个脑切片的 bin100 数据(100×100 DNB spots,尺寸大小:50μm×50μm;STAR Methods)进行了 BayesSpace 聚类分析(Figure 4A)。研究发现多个 bin100 聚类类群呈现脑区选择性分布特征(Figure S10A)。基于这些区域选择性聚类类群,作者进行了基因导向的脑区划分,最终获得 148 个脑区(Figure S11; STAR Methods)。在 14 个代表性脑切片中,该划分结果与 ABA CCFv3 框架具有高度一致性(Figures 4B and S10B),以 T74 切片为例:通过转录组数据定义的皮层、海马、丘脑及纹状体的尾壳核(CP)等区域,与 ABA CCFv3 的对应区域显示出显著重叠(Figures 4C–4E)。
:::block-1
(A–C) 基于 Stereo-seq bin100 聚类的脑区划分。(A) #1 小鼠 123 个标注切片的整体展示(左)及 14 个代表性切片的 3D 示意图(右)。(B) 14 个代表性切片的可视化(标注切片编号与 Bregma 坐标,单位 mm)。比例尺:1 mm。(C) T74 切片各区域的分离视图。\
(D–E) 分子定义脑区与 ABA CCFv3 的 Jaccard 相似性量化分析。(D) 大尺度脑区(CTX、TH、HIP、CP)。(E) CTX 和 HIP 内部亚区。\
(F) 四个代表性脑区(MOBgr、ACB、CA3sp、IC)的亚区划分。虚线框展示 MOBgr 内外侧亚区的 3D 示意图(上)及特征基因表达(下)。黑线标示 CCFv3 边界。比例尺:500 μm。\
(G) T74 切片中具有显著空间自相关性的基因按模块分组的热图,突出显示 20 个空间选择性基因模块。\
(H–I) 区域偏好性基因模块展示。比例尺:2 mm。(H) 模块评分分布。(I) 模块中代表性基因表达。\
(J) MPL 区域基因模块评分分布及代表性基因 Pth2 表达。比例尺:1 mm。\
(K) 整个丘脑中空间自相关基因模块分组热图。\
(L) 9 个丘脑亚区相关基因模块的 3D 可视化(上)。模块 G1 特写(下)。\
(M) 3D 丘脑中基因模块选择性展示:亚区富集评分(左)与代表性基因表达热图(右),丘脑亚区按内外侧轴排序(垂直箭头指示)。
:::
此外,作者的基因导向脑区划分显示 8 个脑区可进一步细分为更精细的亚区。例如:嗅球的肾小球层(MOBgl)和颗粒细胞层(MOBgr)、尾壳核(CP)可划分为外侧和内侧区域;伏隔核(ACB)和下丘脑外侧区(LHA)具有背侧和腹侧亚区;CA3 锥体细胞层(CA3sp)包含靠近和远离齿状回(DG)的两个亚区;下丘(IC)沿长轴排列有 5 层结构;脑桥中央灰质(PCG)可分为 2 个区段(Figures 4F and S12A–S12H)。作者发现皮层亚区可通过单层空间聚类进行分类,例如在 2/3 层区分初级皮层和联合皮层,并在联合皮层鉴定出 6 个亚区(AId、AIv、AssoD、ORBl、ORBm、ORBvl),在初级皮层识别出 2 个亚层(L2 和 L3)(Figure S12I)。这些结果通过亚区特异性分子标记物的表达得到进一步验证,各脑区标记基因详见 Table S5。通过两只小鼠的共聚类分析评估了划分的可重复性,结果显示 bin100 聚类具有一致的空间模式(Figure S10C),且跨切片的基因表达谱高度相关(Figure S10D)。这些结果表明基于空间转录组特征可以实现脑区划分。
为了探究不同脑区共表达基因如何影响其功能,作者基于 bin100 数据,使用空间变异基因识别方法 Hotspot 对 #1 小鼠 123 个切片进行基因模块(具有相似空间模式的基因群)计算。共鉴定出 2,632 个区域选择性基因模块(Table S5; STAR Methods)。以 T74 切片为例,检测到 50 个模块(Figure 4G),其中 34 个表现出区域选择性(Table S5)。Figure 4H 展示了 12 个模块的分布情况:基因模块22(G22)、G18、G5、G10、G38、G14 富集于皮层的不同分层;G26 富集于梨状皮层(PIR);值得注意的是,G9 和 G11 分别富集于海马的 CA 区和 DG 区;G25(以 Pvalb 为最高自相关系数)位于丘脑网状核(RT),这与已知 Pvalb GABA 能神经元在 RT 的聚集特征一致。基因模块对不同脑区或亚区的选择性也通过其代表基因的分布模式得到证实(Figures 4I and S10E)。GO 分析显示这些模块中的基因与其对应脑区的功能相关,例如G2(纤维束)基因与轴突鞘形成相关,G6(下丘脑)基因与激素分泌相关(Figure S10F)。此外,基因模块分析还能识别 CCFv3 未定义的核团,如 MPL(Figure 4J)。相邻脑切片间空间基因模块的高度相关性验证了该分析的稳定性(Figures S10G–S10J)。
作者进一步在三维空间中分析基因模块分布,重点研究了丘脑 42 个切片。使用 Hotspot 方法,作者在丘脑 3D 结构中发现了 9 个基因模块(Figure 4K)。G1 局限于内侧缰核(MH)和外侧缰核(LH),而其他模块分布在多个亚区(Figures 4L and 4M)。模块评分和基因表达模式显示每个模块具有亚区偏好性,表明丘脑内外侧存在不同的转录组特征(Figure 4M)。
5. 发育大脑中基因表达的时空特征
脑区形成受具有特定时空表达特征的转录因子(TFs)和 genes 组合的调控。作者前期的分析显示部分基因模块具有区域选择性特征,因此作者进一步探究这种特性是否在发育过程中同样存在。为此,作者收集了从小鼠胚胎期到成年期 7 个矢状切片的时空全转录组数据(聚类和注释方法与冠状切片相同)(Figures 5A and S13A),包括已发表的胚胎 12.5 天(E12.5)、14.5 天(E14.5)和 16.5 天(E16.5)数据,以及出生后 7 天(P7)数据,同时新增了 P1、P14、P77 三个发育阶段的数据。
:::block-1
(A) 通过 E12.5-P77 切片的无监督空间约束聚类 (SCC) 生成的细胞类群。比例尺:1mm。\
(B) 热图展示具有高空间自相关性的 TF 调控子按聚类分组(如 C3 和 C6),并与不同的 GO 生物过程相关联。\
(C) 以 P14 矢状脑切片为例,展示 6 个区域选择性 TF 调控子类群的空间分布。比例尺:1mm。\
(D) 热图显示发育过程中皮层、纹状体、丘脑和小脑的 TF 调控子活性。调控子活性通过 AUCell-SCENIC 计算。\
(E) 8 个 TF 调控子在发育皮层、纹状体、丘脑和小脑中的活性可视化。比例尺:1mm。\
(F) 上图:皮层层状-柱状结构的正交可视化示意图。下图:热图显示 4 个示例 TF 调控子沿背腹轴在发育皮层中的空间富集情况。\
(G) 发育皮层中具有头尾梯度分布基因的动态变化可视化。每个基因在各阶段的梯度分布通过辅助散点图展示,黑点表示每个相对头尾位置的平均表达量,红线显示这些点的线性回归。比例尺:1mm。
:::
在前文提到的区域选择性基因模块中,作者发现 7 个矢状切片的 1,368 个小鼠转录因子中有 762 个表达,表明不同脑区存在不同的基因调控网络(即 TF regulons)。使用 SCENIC,作者在成年阶段的 13 个主要脑区中鉴定出 573 个具有区域富集特征的 TF 调控子(Figure S13B),并在 7 个发育阶段共发现 998 个 TF 调控子。此外,作者对每个切片应用 Hotspot 分析,最终获得 150 个聚类类群,每个类群包含一组空间共定位的 TF 调控子(Figure 5B; Table S6)。GO 富集分析发现,每个类群内的调控子与不同的生物学过程相关(Figure 5B),其中 150 个类群中有 144 个定位于主要脑区(Figure 5C),表明这些空间共定位的调控子可能在脑区发育过程中协同发挥作用。
接下来,作者基于 SCENIC 的表达指标研究了这些区域选择性 TF 调控子的活性在发育过程中的变化。在皮层中,68 个 TF 调控子在胚胎阶段表现出更高的活性,而 76 个在出生后阶段活性更高(Figure 5D)。在纹状体中,作者发现 52 个 TF 调控子在早期更丰富,而 56 个在后期更丰富(Figure 5D)。在丘脑和小脑中,作者也分别发现了 77 个和 65 个 TF 调控子的类似模式(Figure 5D)。例如,TFAP2C(全大写字母表示 TF 调控子)在胚胎皮层和发育中的嗅区富集(Figure 5E),其核心基因 Tfap2c 在最近的研究中被认为是决定皮层放射状胶质细胞命运的关键 TF。在纹状体中,PAX9 在胚胎期富集,而 FOXO1 在出生后发育过程中逐渐富集(Figure 5E),这与之前关于小鼠纹状体发育的报道一致。在单个基因层面,作者发现 33 个基因在所有 7 个阶段都保持皮层、纹状体或丘脑的区域选择性,而 385 个基因仅在特定阶段表现出脑区选择性(Figure S13C)。区域选择性调控子和基因的全面动态变化总结在 Table S6 中。
皮层在发育过程中形成层状和柱状结构,这是由转录程序决定的。作者使用 Spateo 研究了发育过程中沿背腹轴或头尾轴的转录调控。在背腹轴分析中,作者发现 206 个调控子表现出与皮层分层相关的分布(Table S6)。例如,ATF4 从浅层逐渐转移到中层(Figure 5F)。TBR1 从浅层转移到深层,这与第 6 层皮层神经元的先成熟一致。NR2E1 从深层转移到浅层(Figure 5F),这与 Nr2e1 在神经干细胞增殖和维持颗粒上层完整性中的重要作用相符。在头尾轴分析中,作者发现 22 个 TF 呈现空间递增或递减梯度(Figure S13D; Table S6)。Lhx2 在胚胎阶段(E12.5、E14.5、E16.5)与 Nfix 类似,沿头尾轴呈现递增梯度,但在出生后阶段(P1、P7、P14、P77)这种模式减弱(Figure 5G)。这与之前报道的 Lhx2 在 E15.5 阶段的梯度分布及其在桶状柱形成中的关键作用一致,而桶状柱形成主要发生在胚胎阶段。作者还发现 134 个非 TF 基因表现出头尾梯度(Figures 5G and S13D; Table S6)。这些 TF 和基因的梯度分布可能参与定义了皮层的组织结构模式。
接下来,作者使用基因集富集评分方法(STAR Methods)研究了几种神经发育事件的动力学。作者的分析显示,三个主要神经发育事件相关基因集在 9 个脑区和 7 个阶段中表现出动态变化(Figures S13E-S13G)。具体而言,参与胶质生成和突触成熟的基因在出生后阶段表现出更高的富集度,而与神经母细胞增殖相关的基因在胚胎阶段富集。参与胶质生成的基因在出生前后开始富集,并在 P14 迅速达到峰值。有趣的是,作者发现与其他区域相比,纤维束和后脑中胶质生成相关基因的富集水平更高,这与最近关于人脑胶质生成的报道一致。此外,参与突触成熟的基因在胚胎阶段初期就开始逐渐富集,并在出生后达到稳定状态(Figure S13G)。
6. 大脑中 lncRNA 的时空谱
在哺乳动物基因组中,只有不到 3% 的基因组被转录成蛋白质编码转录本,而大部分是非编码 RNA(ncRNA),其中一些超过 200bp 的被称为长链非编码 RNA(lncRNA)。尽管之前的研究已经在小鼠大脑中鉴定了一些 lncRNA,但对其空间分布的全面分析仍然缺乏。在已知的 9,580 个小鼠 lncRNAs 中,作者在成年小鼠大脑 Stereo-seq 数据集中检测到 5,834 个 lncRNAs,其中 513 个 lncRNAs 显示出区域富集(Figure 6A; Table S7; STAR Methods)。例如,Gm12688、Gm33651、6330420H09Rik、Gm20649、Hotairm1、Gm14033 分别在嗅球区、纹状体、海马、下丘脑、延髓和小脑中表现出优先表达(Figures 6B and 6C; Video S4)。此外,37 个 lncRNAs 在皮层中显示出层富集分布(Figure 6D),其中 Gm26870、A830009L08Rik、1700047F07Rik、Gm11730、Gm28928 分别富集在 L1、L2/3、L4、L5、L6 层(Figure 6E)。
:::block-1
(A) 14 个脑区中区域富集 lncRNAs 的热图。\
(B-C) 6 个 lncRNAs 的全脑分布(上)和脑切片中的空间表达(下)(标注切片编号和 Bregma 坐标,单位mm)。比例尺:500 μm。\
(D) 37 个皮层层级富集 lncRNAs 的表达热图。(E) 中的示例用红色标出。\
(E) 冠状切片 T75 中 5 个 lncRNAs 的空间分布。比例尺:500 μm。\
(F) 发育皮层中 lncRNAs 的动态表达变化。\
(G) 皮层富集 lncRNAs 在不同发育阶段的时空分布。比例尺:1 mm。\
(H) 纹状体选择性模块的分布及其 lncRNAs 在发育阶段的表达。比例尺:1 mm。\
(I) 纹状体选择性模块在发育阶段的 GO 富集通路。\
(J) 趋同和趋异基因对的 Pearson 相关性分布(右图),左侧为示意图。\
(K) Airn-Mas1 趋同基因对在不同脑区的表达水平。\
(L) Airn-Mas1 基因对在 16 个切片中的空间分布。比例尺:2 mm。\
(M) Gm13944-Zfp385b 基因对在小脑颗粒细胞(CB_GRC_GLU_261)和浦肯野细胞(CB_PKC_GABA_262)类群中的表达。\
(N) Gm13944-Zfp385b 趋同基因对在 T114 切片浦肯野细胞(红色)和颗粒细胞(绿色)中的分布。\
(O) Gm13944(红色)和 Zfp385b(绿色)分别在浦肯野细胞层(PU)和颗粒细胞层(GR)中的表达。比例尺:2 mm。
:::
已知部分 lncRNAs 对大脑发育至关重要。为识别可能参与神经发育的 lncRNAs,作者对 E12.5 至 P77 的 Stereo-seq 数据进行 Hotspot 分析,揭示了 184 个基因模块,其中 160 个表现出脑区偏好性(Table S8),以 P14 数据为例展示(Figures S14A and S14B)。作者随后鉴定出 216 个具有时空动态变化的 lncRNAs(皮层 60 个、纹状体 73 个、丘脑 30 个、小脑 95 个)(Figures S14C and S14D)。例如,A930024E05Rik 在胚胎皮层高度富集,而 AC129186.1 在出生后达到峰值(Figures 6F and 6G)。几个区域富集的 lncRNAs,如 Gm11266(皮层)、D430036J16Rik(纹状体)、Gm2694(小脑)、Gm15577(小脑)也在先前研究中被报道。然而,大多数 lncRNAs 的表达模式仍然未知。有趣的是,一些小脑富集的lncRNAs,如 Gm2694 和 Lhx1os,表现出从 E16.5 开始与小脑发育相吻合的表达模式(Figure S14D)。Gm2694 已被证明可调节小脑中的突触稳定性,表明其在小脑发育中的潜在作用。这些发现表明,表现出时空表达模式的 lncRNA 可能在发育过程中的脑形态发生中发挥重要作用。
同一模块内的基因通常在功能上相关。为了预测 lncRNAs 在发育中的潜在作用,作者对脑区选择性基因模块进行了 GO 功能富集分析。早期阶段模块(E12.5-E16.5)主要与神经元发育相关(Figures 6H, 6I, S14E, and S14F),表明这些模块中的 lncRNA 可能参与大脑发育。在后期阶段(P1-P77),模块富集了与脑区特定功能相关的基因。例如,在纹状体中,出生后模块(包括 36 个 lncRNA)与多巴胺受体信号通路相关(Figures 6H and 6I),而在皮层中,模块(包括 15 个 lncRNA)与突触成熟相关(Figure S14E)。在小脑中,出生后模块(包括 46 个 lncRNA)与平行纤维到浦肯野细胞突触的 GO 术语相关(Figure S14F)。这些发现表明,lncRNAs 可能在后期阶段调节脑区特异性功能。总体而言,具有时空表达模式的 lncRNAs 可能同时参与早期胚胎神经发育和后期神经功能,尽管需要进一步的实验研究来确认它们的作用。
最近的研究表明,lncRNA 的转录与附近基因的转录相关,共享启动子区域。趋异 lncRNAs 与相邻 mRNA 从同一启动子转录但在相反链上,而趋同 lncRNAs 在相反链上朝向相邻 mRNA 转录,通常有重叠。尽管这些 lncRNA-mRNA 对的表达模式已在细胞和组织中研究过,但它们在脑中的空间表达仍然很大程度上未知。为了研究这一点,作者根据转录起始位点之间的基因组距离(STAR Methods),将 lncRNA-mRNA 对分为趋异(2,503 对)和趋同(4,480 对)两组。在对成年小鼠脑的空间转录组分析中,作者鉴定了 3,049 个 lncRNA-mRNA 基因对,其中 1,019 个趋异对和 2,030 个趋同对(Table S9)。作者发现,在不同脑区中,趋异对的表达相关性显著高于趋同对(Figure 6J)。值得注意的是,18 个趋同对表现出拮抗表达模式,例如 Airn-Mas1 对在各种区域中显示出负相关(Figures 6K and 6L)。类似地,Gm45441-Grin2d 对显示出相反的表达水平(Figures S14G and S14H)。进一步分析显示,103 个趋同基因对在不同细胞类型中具有明显的拮抗表达。例如,Gm13944 在浦肯野细胞中比 Zfp385b 表达更高,但在颗粒细胞中表达较低(Figures 6M and S14I)。Stereo-seq 数据证实了这些空间分布差异,Gm13944 在小脑的浦肯野细胞层高表达,而 Zfp385b 在颗粒细胞层富集(Figures 6N and 6O)。在这 103 个基因对中,18 个基因对在不同脑区也表现出拮抗表达趋势,如上所述(Figure S14J)。我们的发现为小鼠脑中 lncRNA-mRNA 对的空间表达模式提供了有价值的见解,突出了它们潜在的调控功能。
讨论
哺乳动物大脑具有极其复杂的组织结构。本研究构建了一个单细胞分辨率的全基因组覆盖小鼠脑空间转录组图谱,包含基因组中大多数基因(包括 lncRNAs)的表达信息。通过利用全转录组的空间表达谱,作者采用空间聚类方法精确划分了全脑各区域,包括若干新发现的亚区。该图谱提供了从胚胎期到成年期的基因表达时空图谱,揭示了众多具有独特时空动态特征的转录因子调控子和长链非编码 RNA。这些发现为理解不同细胞类型间的复杂相互作用及动物行为的神经机制奠定了基础。
1. 各种细胞类型的脑范围分布
作者的研究拓展了对小鼠大脑中多种细胞类型空间组织的认知,揭示了其与脑功能和疾病相关性一致的特定层状和区域分布模式。例如,谷氨酸能神经元在皮层呈现层状分布,而特定细胞类群在特定皮层区域富集。在与情绪和情感障碍相关的 ILA 区,作者发现了富集抑郁相关表达谱的神经元类群,提示其在情绪调节中的潜在作用。近期一项关于猕猴皮层的研究揭示了与视觉系统层次结构相关的细胞构型变异,这支持了皮层区域细胞类型富集在脑功能和疾病中起关键作用的观点。
在脑干中,作者观察到核团富集的细胞类群,如文献记载的 NTB 中甘氨酸能中间神经元和 CN 中谷氨酸能神经元。值得注意的是,这两个细胞类群均为 Pvalb 阳性。Pvalb 中间神经元广泛分布于听觉系统,对声音频率具有良好调谐性,并能增强听觉通路中的时间编码。谷氨酸能和 GABA 能 Pvalb 神经元在听觉核团中的差异分布,暗示了它们在听觉信息处理中的特殊作用。这些发现共同凸显了作者的转录组图谱在注释细胞类型及阐明其在脑功能和病理中作用方面的重要性。
2. 脑区富集的模块和基因表达
尽管通过原位杂交技术(ISH)已检测过大脑中的 mRNA 分布,但这些数据来自不同动物个体,往往影响全脑基因表达模式的分析。基于单只小鼠 123 个冠状脑切片数据,作者的图谱为整合分析(特别是三维分析)提供了可能,尤其在丘脑和脑干核团等区域全面鉴定了脑区选择性基因。
全转录组覆盖使作者能够分析大量研究较少的 lncRNAs。研究发现拓展了现有关于 lncRNAs 脑区/亚区富集的认知,提示这些 lncRNAs 可能对脑区形成至关重要。例如,Airn 与 Mas1 等趋同基因对的拮抗表达暗示潜在功能干扰。作者还鉴定出大脑发育过程中具有时空动态的 lncRNAs,其中部分已被研究:皮层高表达的 A930024E05Rik 对皮层投射神经元分化迁移至关重要,小脑发育相关的 Gm2694 则影响突触密度和运动功能。这些发现为深入解析其功能奠定了基础。
空间转录组数据还能识别小核团神经元的分子差异(如脑干不同运动核团的胆碱能神经元),这是单细胞测序难以实现的。例如,舌下神经核基因与心脏收缩和免疫应答等生理过程相关,与该区域参与围产期肺部炎症和不明原因围产期死亡的研究相符。区域选择性基因的鉴定将促进对这些小核团功能的理解。
3. 基于转录组谱的大脑区域的分析
传统上,脑区边界主要基于细胞构筑特征和功能进行划分。作者的研究基于空间转录组特征定义了 148 个小鼠脑区边界,与 ABA CCFv3 框架高度一致,这支持了脑区划分的转录组基础,与近期研究结论相符。得益于高分辨率的转录组数据,作者的分析能够实现更精细的脑区划分:例如将尾壳核(CP)细分为外侧(CPl)和内侧(CPm)亚区,将伏隔核(ACB)划分为背侧(ACBd)和腹侧(ACBv)亚区——这些细分结构在 ABA CCFv3 中尚未体现。不过,这些精细划分的功能意义仍有待阐明。基于转录组的划分方法有望应用于其他研究较少的物种,为缺乏标准解剖框架的脑或其他器官提供研究基础。
4. 发育中的小鼠大脑转录组的时空分析
本图谱还包含从胚胎期到成年期完整的基因表达时空图谱,其覆盖的基因数量和发育阶段均超越现有研究。这使作者成功鉴定出 411 个具有显著时空动态特征的转录因子(TFs)。例如,TFAP2C 在发育早期皮层富集,参与调控皮层放射状胶质细胞的命运决定。这些 TFs 调控子可能在脑发育中发挥重要作用,为神经发育研究提供了宝贵资源。
进一步分析显示,部分 TF 调控子在特定脑区呈现精细的时空表达模式。在发育皮层中,作者发现 206 个 TF 调控子沿背腹轴呈现层状富集特征,156 个基因在头尾轴呈现梯度分布。例如,Lhx2 表现出头尾梯度分布,与先前研究一致。这种梯度分布模式被认为对亚结构形成至关重要。已有研究证实 Lhx2 参与桶状皮层形成,表明这些具有梯度分布特征的 TFs 调控子和基因可能是塑造皮层结构的关键。本研究显著拓展了先前发现,揭示了数百个在不同发育阶段呈现头尾轴梯度模式的基因,其功能机制尚待实验探索。
总之,本研究构建了小鼠全脑三维单细胞分辨率空间转录组图谱,绘制了基因与细胞簇的空间分布,揭示了包括 lncRNAs 在内的区域选择性细胞类群和基因,并基于转录组分析实现了脑区精确划分。更重要的是,作者鉴定出大量具有时空选择性的 TFs 调控子。该单细胞分辨率小鼠脑图谱的建立,为深入探索小鼠脑生理过程和发育机制奠定了基础。
<center>--------------- 结束 ---------------</center>
<p style="color: gray; font-size: 10px;">注:本文为个人学习笔记,仅供大家参考学习,不得用于任何商业目的。如有侵权,请联系作者删除。</p>
本文由mdnice多平台发布
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。