::: block-1
文献介绍
文献题目: 分子全息图的时空建模 \
研究团队: 邱肖杰(斯坦福医学院)、白寅琪(华大生命科学研究院)、刘石平(华大生命科学研究院)、徐讯(华大生命科学研究院)、马佳义(武汉大学)\
发表时间: 2024-11-11 \
发表期刊: Cell \
影响因子: 45.5(2024年)\
DOI: 10.1016/j.cell.2024.10.011
:::
摘要
量化胚胎发生过程中的时空动态对于了解先天性疾病至关重要。作者开发了 Spateo (https://github.com/aristoteo/spateo-release
),一个 3D 时空建模框架,并将其应用于 E9.5 和 E11.5 的 3D 小鼠胚胎发生图谱,捕获了 800 万个细胞。Spateo 能够实现可扩展、部分、非刚性对齐、多切片细化和网格校正,以创建整个胚胎的分子全息图。它引入了数字化方法来揭示从亚细胞到整个器官的多层次生物学,识别沿新兴 3D 结构正交轴的表达梯度,例如中脑-后脑边界 (MHB) 等次级组织者。Spateo 进一步联合模拟细胞间和细胞内相互作用,以剖析 3D 结构中的信号景观,包括丘脑内限制带 (ZLI)。最后,Spaeo 引入了细胞迁移的“形态矢量场”,并整合空间微分几何来揭示不对称小鼠心脏器官发生等的分子程序,将宏观变化与分子动力学联系起来。因此,Spateo 能够在 3D 空间的分子水平上研究器官生态学。
前言
了解哺乳动物器官发生过程中全胚胎水平的基因表达和细胞间相互作用 (CCI) 的精确时空编排将显着推进发育生物学,并且对人类健康具有巨大潜力。单细胞 RNA 测序 (scRNA-seq)已经能够创建线虫、果蝇、小鼠、和人类胚胎发生的时间分辨细胞图谱。然而,scRNA-seq 方法将胚胎分离成单个细胞,导致空间信息严重丢失。最近出现的空间转录组学 (ST) 方法解决了这个问题局限性,使得胚胎发生的时空分析成为可能,但哺乳动物物种的全胚胎规模时空研究提出了巨大的挑战;此前,鉴于大多数 ST 平台的视野 (FOV) 有限,这些研究仅限于单个时间点、或早期时间点、或单个器官,但直到现在才针对 E9.5 和 E11.5 的整个小鼠胚胎。
此外,虽然随着 3D 重建、空间域数字化、和 CCI 方法的发展,ST 的计算分析取得了巨大进展,但各种挑战阻碍了它们在胚胎规模和 3D ST 数据集。例如,现有的 3D 对齐方法,例如 ST 实验的概率对齐 (PASTE),无法大规模对齐胚胎切片,同时考虑到组织切片上的缺失区域和样品制备过程中引入的组织变形。此外,现有的空间域数字化方法仅限于 2D 形状,但不适用于任何 3D 对象,并且 CCI 模型并非旨在描述 3D 生物结构中不同尺度下运行的许多细胞间和细胞内相互作用。最后但同样重要的是,根据时间分辨 3D ST 数据对 4D 时空动力学(例如形态发生)进行建模仍然是一个开放的挑战。
为了解决这些未满足的差距,在本研究中,作者开发了一个统一的框架,Spateo,它实现了整个小鼠胚胎分子全息图的 3D 时空建模,利用时间分辨的全小鼠胚胎细胞图谱,在小鼠器官发生的两个关键时间点(E9.5 和 E11.5)总共超过 800 万个细胞。请注意,使用自动串行块面成像 (SBFI) 方法改进 3D ST 分析的实验方法以及该大量参考数据集的完整表征将在另一项研究中报告。这项研究重点研究几种新兴的 3D 结构,这些结构的特点是在此阶段快速形成和成熟,包括四腔心脏、脊髓,以及丘脑内限制带 (ZLI) 和中脑-后脑边界 (MHB) 等次级组织者,它们具有特定的基因表达模式和信号景观,控制周围空间区域的细胞命运。
Spateo 具有一套连贯且独特的 3D 感知分析方法。首先,Spateo 推出了一种可扩展且强大的 3D 重建算法,能够通过允许非刚性、部分对齐来精确重建 3D 整个小鼠胚胎;多切片细化;以及使用高斯过程、变分贝叶斯推理等的网格校正。在新的 3D 全小鼠数据集和其他几个 3D 数据集上,Spateo 始终优于 PASTE、PASTE2、Moscot、SLAT、STAlign、SPACEL 在准确性、稳健性和效率方面。Spateo 还具有多尺度空间域分析框架,适用于定义特定的空间轴和研究从单细胞到胚胎水平的生物学水平,使用广义数字化方法通过求解单细胞空间图的势函数方程。作者应用这种方法来表征 ZLI 和脊髓正交轴上的基因表达变化,这通过 2D 分析是不可能实现的。作者鉴定了一系列信号传导和转录因子 (TFs),例如 Slit2 和 Dbx1,其中许多调节 ZLI 和脊髓成熟。为了探究潜在的细胞间通讯和细胞内信号传导,作者进一步开发了一个综合框架,可以对细胞间/细胞内相互作用进行综合建模。作者利用这个框架来揭示和表征 MHB 和 ZLI 组织背后的独特分子网络,涉及 Wnt 家族、Bmp 家族、Fgf8 和 TFs(例如 Foxd1、Cited 和 Id1 等)的关键配体。
为了将宏观细胞形态发生与潜在的微观分子途径联系起来,作者进一步推广了 3D 对齐框架,以允许学习形态测量向量场,该向量场可以准确预测心脏细胞从 3D 重建心脏(胚胎发生过程中出现的最早的器官)的 4D 时空迁移路径。作者发现心脏的不对称迁移可能与心房和心室特异性的 Notch 信号传导有关;分化因子,例如 Tbx2、Id2 和 Tbx20;或形态发生因子,例如 Angpt1、Pitx2 和 Hey2。除了对心脏的单个器官进行时空建模外,作者还对多个器官进行了联合建模,接下来作者揭示了果蝇中肠的形态学收敛以及后肠和唾液腺的扩张,这进一步揭示了导致生殖带回缩的假定形态发生因子,例如 otp、Abd-B 等。最后,为了促进对大量复杂 3D 数据集的交互式探索,作者还开发了 Spateo-viewer,这是一款功能强大的多功能 3D 数据可视化和处理工具,可在 http://viewer.spateo.aristoteleo.com/
免费访问。总的来说,这些综合方法允许在广度和分辨率上深入研究 3D 结构,例如大脑中的小鼠次级组织者(ZLI 和 MHB)、脊髓、四腔心脏和整个果蝇生殖带。
Spateo 促进了单细胞分析的转变——从传统的、还原论的以细胞为中心的焦点转向将组织、器官和胚胎作为一个整体——允许对分子机制进行超精细、多维的空间和时间检查。Spateo 通常适用于任何基于测序或基于成像的 ST 读数,并且可以与 Dynamo(RNA 速度矢量场分析的通用框架)结合使用,以实现细胞命运转变的时空动力学的定量和预测分析。https://spateo-release.readthedocs.io/en/latest/
提供了丰富的教程、工作流程和文档,开源工具包可以在 https://github.com/aristoteleo/spateo-release
找到,欢迎社区贡献。
研究结果
1. Spateo:用于 3D 空间转录组学多级时空建模的多功能工具
为了迎接 3D ST 时代的到来,作者开发了一种多功能工具,用于在全胚胎尺度上进行单细胞分辨率的高级 3D 时空建模。Spateo 工具链具有三大功能模块:数据预处理、核心功能、Spateo-viewer(Figure 1A; Table S1)。Spateo 从灵活的应用程序编程接口 (API) 开始,从不同的 2D 和 3D ST 技术(Figures 1A and S1A)读取不同的数据格式,然后将其转换为单个统一的数据结构。数据预处理模块主要包括单细胞分割和基本 3D ST 数据集探索的功能。Spateo 的主要核心功能模块实现了一套全面的 3D 时空建模方法,下面介绍这些方法,这些将在后续章节中详细讨论。最后,作者开发了 Spateo-viewer,一种用于 ST 的类似于“Google Earth”的网络浏览器 (http://viewer.spateo.aristoteleo.com/
), 可实现直观且交互式的 3D 数据探索和分析。
:::block-1
(A) Spateo 实现 3D 时空转录组建模的三大功能模块:数据预处理(单细胞分割、基本 3D 数据探索);核心功能具有一组新颖的 3D 感知建模方法(3D 对齐、重建、数字化、细胞间相互作用、形态测量、骨干和形态发生分析);Spateo-viewer,3D 空间转录组学的“Google Earth”。每种方法都注明了相关部分。\
(B and C) Spateo 的可扩展、灵活且强大的对齐 (B) 和 3D 重建 (C) 框架(see also Figures 2 and 3)。\
(D) Spateo 允许进行各种基本 3D 空间数据探索。\
(E and F) Spateo 3D 数字化 (E) 和细胞间相互作用 (F) 方法的示意图(see also Figures 4 and 5)。\
(G) 形态分析可量化重建 3D 物体的表面积、体积、高度、长度、宽度和细胞密度(see also Figure 6)。\
(H) 骨干分析使用主曲线定义 3D 对象的骨干,然后识别随骨干函数显着变化的基因,并将骨干聚类到不同的空间域中(see also Figure S8)。\
(I) 形态测量矢量学习和微分几何分析(see also Figure 6)。\
(J) Spateo-viewer 是一款在线或独立浏览器,可实现 3D 空间转录组学的直观和交互式探索。\
(E)-(F) 专为更高级的 3D 下游分析而设计。
:::
在这项研究中,作者利用了来自 E9.5 和 E11.5 胚胎的 3D 全小鼠细胞图谱(Figures S1 and S2; Table S2),其中包含大量切片和细胞、整体较小的胚胎切片间隔以及可比的 RNA 捕获,与早期小鼠胚胎阶段或人类原肠胚胚胎的现有数据集进行比较(Figures S1A–S1C)。此外,作者还利用另一个 3D 果蝇胚胎数据集来证明这种方法的通用性。为了注释这个总共超过 800 万个细胞的大型 3D 小鼠 ST 数据集,作者首先将该数据集与注释良好的 scRNA-seq 图谱共嵌入到一个潜在空间,然后使用分层方法通过经过训练的分类器将细胞类型标签从带注释的 scRNA-seq 数据集转移到 Stereo-seq 数据集。跨越 E9.5 和 E11.5 的所有细胞类型,作者发现 Stereo-seq 数据集与 Qiu et al. (2024) 的 scRNA-seq 参考具有高度对应的匹配 markers 和相似的细胞类型分数(Figures S1D and S1E)。总体而言,作者显示了特定细胞类型的空间分布,例如心肌细胞;E9.5 胚胎数据集中的肝细胞;E11.5 数据集中的中间神经元祖细胞和室管膜细胞;并且相应的标记基因(例如 Myh6、Afp、Eomes 和 Spon1)在胚胎的相应位置富集(Figure S1F)。
为了实现 3D ST 建模,一个主要障碍是一种强大的方法,允许在整个胚胎尺度上将 2D 切片准确、可扩展且稳健地对齐到 3D 结构中。在 Spateo 中,作者开发了一个 3D 对齐框架(Figure 1B, refer to Figures 2 and 3),该框架允许刚性、非刚性、部分、成对对齐;多切片细化(同时对齐多个切片);和网格校正(使用外部参考形状网格增强 3D 重建,例如 Allen Mouse Brain 通用坐标框架或 CCF v3),同时具有高计算效率。一旦 3D 切片对齐,Spaeo 就可以生成点云模型,并通过移动立方体算法创建表面网格模型,并通过网格体素化创建体素模型。创建网格和体素模型后,可以生成任意角度的虚拟切片(Figure 1C, refer to Figures 3 and 4)。接下来,Spateo 的一系列 3D 感知建模策略可用于下游分析(Figures 1D–1I)。对于相对简单的 3D 分析,Spateo 可以用于识别 3D 空间域、检测 3D 中的空间可变基因,以及通过基于 MLP 或基于高斯过程的方法在 3D 空间中插入基因表达(Figure 1D, refer to Figure 6)。重要的是,作者在 Spaateo 中开发了一系列先进的 3D 感知方法,包括 3D 域/表面数字化(Figure 1E, refer to Figures 4 and 5)、CCIs(Figure 1F, refer to Figures 4 and 5)、形态测量和体积测量(Figure 1G, refer to Figure 6)、形态测定主干(Figure 1H, refer to Figure 6)、形态发生预测(Figure 1I, refer to Figure 6)以及通过 Spateo-viewer 的交互式 3D 数据浏览器(Figure 1A, refer to Figure 7)。作者将在以下部分中详细描述每种方法。
总而言之,Spateo 建立了一种用于多尺度时空转录组学建模的多功能工具,适用于整个果蝇,更重要的是,适用于小鼠胚胎规模数据集(Figures 2–7)。
2. 高效、非刚性对齐、多切片细化和网格校正方法来重建整个小鼠胚胎的 3D 分子全息图
全胚胎水平的顺序切片和随后的 ST 分析为我们提供了重建整个 3D 胚胎结构的分子全息图的独特机会。然而,传统的切片和下游文库制备可能会在每个捕获的组织切片中旋转、变换、变形和引入缺失区域。虽然这些问题已被证明可以通过自动化 SBFI 方法得到很大程度上缓解,但是通常需要开发可扩展且稳健的算法来重建 3D 结构,以恢复不同切片中单个细胞的相对空间位置,同时允许同一切片内的局部失真。最近开发了诸如 PASTE 之类的复杂方法来对齐空间截面以进行 3D 重建。然而,全胚胎数据集的独特特征,例如大量的连续组织切片(高达约 100 个切片)和总细胞(高达约 800 万个细胞)、遗漏区域、组织变形和切片之间的间隙连续切片,限制了这些方法的使用,因为它们建立在跨切片的全细胞到全细胞映射的相当不灵活的公式之上;依赖昂贵的基于最佳运输的方法;并对连续切片进行顺序对齐,随着切片数量的增加,误差会累积。
:::block-1
(A) Spateo 概率模型的示意图以及用于对齐空间转录组切片以创建 3D 全胚胎模型的相关变分优化过程。有关 3D 对齐模型和优化过程的详细信息,请参阅 STAR Methods。\
(B) 使用 Spateo 对齐后的 E9.5 和 E11.5 阶段的小鼠胚胎切片示例。每个点都是一个细胞,按其区域标识着色,区域标识或空间域注释从 Cheng et al. 获得。与 (C) 和 (D) 中相同。\
(C) 分别使用基于 OT 的方法(即 PASTE)和 Spateo,对 E9.5(顶行)和 E11.5(底行)阶段的小鼠胚胎 3D 重建结果进行可视化。底部的图例是两个阶段共享的。Spateo(而非基于 OT 的方法)可以准确重建 3D 小鼠胚胎结构。E9.5 和 E11.5 的比例尺分别表示 0.5 mm 和 2 mm 的距离。\
(D) Spateo 的精确 3D 重建揭示了整个胚胎每个主要器官的复杂结构。\
(E) 每个器官相应 markers 的空间 3D 图。
:::
在 Spateo 中,作者介绍了一种强大的方法,该方法使用生成高斯过程方法来制定 3D 对齐问题,该方法包括初始成对对齐模式,然后是用于重建 3D 结构的多切片细化模式,可扩展到整个胚胎数据集约 800 万个细胞,同时解决上述挑战(Figure 2A)。成对对齐的生成过程将坐标系从一个样本(slice A)转换为另一个样本(slice B)(Figure 2Ai)。作者将切片 A 视为模型点,可以通过空间变换 𝒯 生成数据点切片 B。作者还包括了一个异常值模型来解释切片之间常见的部分重叠。从模型点到数据点的生成概率非常灵活,并通过基因表达相似性和空间邻近性来表达。此外,它可以将细胞增殖/凋亡评分作为先验,这样更多的增殖(凋亡)细胞将映射到更多具有一致高(低)概率的细胞,以及具有相同标签(例如细胞类型)和相似图像的细胞特征将被映射到组织切片上。此外,生成模型允许刚性和非刚性变换:刚性变换用于对齐整体框架,而非刚性变换则对齐局部扭曲,由高斯过程建模(Figure 2Aii)。为了减少顺序对齐过程中的误差积累,作者还设计了一个多切片细化模型,通过联合考虑感兴趣切片附近的多个切片(从左或右)来细化对齐(Figure 2Aiii)。Spateo 使用的底层随机变分优化过程依靠坐标上升变分推理(CAVI)来迭代更新变分参数(包括变换以及后验生成概率等)直至收敛,使得算法可靠、速度极快内存效率高,并且可扩展到整个小鼠胚胎数据集(Figure 2Aiv; Video S1; STAR Methods)。
接下来,作者将 Spateo 应用于小鼠胚胎数据,在 E9.5 和 E11.5 时期重建了整个小鼠胚胎的 3D 分子全息图(Figures 2B–2E)。具体来说,作者分别对 E9.5 和 E11.5 胚胎的 90 个切片和 84 个切片进行了多切片细化(Figure 2B),以每两个连续切片的初始成对对齐为指导。重要的是,与基于 OT 的方法相比,Spateo 的对齐框架显着改善了重建的 3D 整个小鼠胚胎结构(Figure 2C),揭示了每个主要器官复杂的 3D 结构以及整个胚胎内相应标记基因的空间分布(Figures 2C–2E; Video S2, organs’ annotations are token from Qiu et al.)。
:::block-1
(A-C) 在广泛的 3D 空间转录组数据集上展示的基准测试,包括 (A) MERFISH 小鼠半脑数据,(B) OpenST 人类转移淋巴结数据,(C) Stereo-seq 猕猴皮层。对于每个面板,左侧是来自不同算法的每个数据集的 3D 可视化,右侧是基准测试指标。每个条形都包含 95% 的置信区间,右侧显示的 p value 表示 Spateo 与其他两种表现领先的算法进行比较的 t 检验结果。STAlign-GT,预配准的 STAlign;pairwise MAE,成对平均误差;CLC,上下文标签一致性;参见 STAR Methods。\
(D) 对网格校正算法进行基准测试。左:执行 Spateo 多切片细化后的 3D 重建结果。虽然组织结构光滑,但可能与实际结构不符。中间:采用网格校正后,原始结构已得到很好的恢复,并与 Allen CCF v3 对齐。右:MERFISH 和 BAR-seq 小鼠半脑上网格校正与其他方法相比的统计结果。"-G",结合多切片细化;"-M",结合网格校正; global MAE,全局平均误差;参见 STAR Methods。\
(E) 在 Stereo-seq E9.5 和 E11.5 小鼠胚胎数据集上,绘制了相对于 CLC 分数的累积分布曲线,表明 Spateo 的 3D 对齐要准确得多。\
(F) 在 Stereo-seq 猕猴皮层数据集上进行的效率和可扩展性基准测试。Spateo-S 表示使用稀疏计算;PASTE2* 表示通过其原始实现使用强力搜索重叠率;请参阅 STAR Methods 中的更多详细信息。\
(G) 采样间隔(左)和采样细胞(中)的稳健性基准测试。左:左列显示 Spateo 对完整胚胎数据的重建结果(上图:E9.5 胚胎;下图:E11.5 胚胎)。右边三列分别展示了仅保留 1/2、1/5 和 1/10 切片时 Spateo 的重建。中间:从左到右的列分别呈现仅保留 20%、10% 和 5%细胞时 Spateo 的重建结果。右:由 Spateo 根据完整和下采样数据重建的 Pearson 相关性线图(蓝色,左 y 轴标签)和平均绝对误差或 MAE(红色,右 y 轴标签)。实线对应于 E9.5 数据,虚线对应于 E11.5 数据。每条线均包含 95% 置信区间。E9.5 和 E11.5 的比例尺分别表示 1 mm 和 3 mm 的距离。
:::
为了对 Spateo 的 3D 重建能力进行定性基准测试,作者首先展示了 Spateo 可以揭示更复杂、更平滑的 3D 胚胎/组织结构,相比于 PASTE 在人类原肠胚 Stereo-seq 数据上,以及相比于 sc3D(一种需要细胞标签信息的 3D 对齐方法)在 E8.5 和 E9.0 小鼠胚胎 Slide-seq 数据上(Figures S3A and 3B)。接下来,作者对 Spateo 与最先进的替代算法进行定量基准测试(Figure 3),包括 PASTE、PASTE2、Moscot、SLAT、STAlign、SPACEL,在具有大量连续切片和细胞数量的多个 3D ST 数据集上,即小鼠半脑 MERFISH 数据集(Figure 3A,129 张切片,930 万个细胞),人类转移淋巴结 OpenST 数据集(Figure 3B,19 张切片,100 万个细胞),猕猴皮层 Stereo-seq 数据集(Figure 3C,119 张切片,3000 万个细胞),小鼠前脑半球 BARSeq 数据集(Figure 3D,40 张切片,120 万个细胞),以及小鼠胚胎 Stereo-seq 数据集(Figure 3E,上面介绍)。这些广泛的基准测试验证了 Spateo 在成对对齐、多切片细化和网格校正方面的领先优势,无论是基于与真实 Allen CCF v3 参考相比的平均绝对误差 (MAE),还是基于细胞类型标签的上下文标签一致性评分(详细信息请参阅 STAR Methods)。接下来,作者评估了 Spateo 以及其他方法在更复杂的对齐情况(例如部分对齐或非刚性对齐)上的性能。作者首先使用 STARMap Plus 数据集(Figure S4Ai)实现了数据模拟策略,其中考虑了三种不同的模拟,即非刚性变形、比例裁剪和手动裁剪(Figure S4Aii–S4Aiv)。然后,作者将此模拟策略用于三个基准测试:非刚性、部分和多切片细化基准测试。在使用矢状和良好的 STARMap Plus 数据集的非刚性对齐基准测试上,Spateo 的成对 MAE 显着降低,并且在不同的畸变水平下始终保持不变(Figure S4B,第一行)。当放大特定区域时,作者观察到复杂的局部结构上切片之间的对齐得到了改善(Figure S4B,第二行和第三行)。接下来,在部分对齐基准测试上(Figure S4C),虽然 SPACEL、PASTE2 和 STAlign 往往会在切片之间显示出明显的未对齐情况,但 Spateo 克服了这一点,正确对齐了重叠区域,同时忽略了非重叠区域。此外,在矢状和良好的数据集的不同重叠率下,Spateo 在部分对齐方面始终优于其他方法(Figure S4C)。最后,作者证明了 Spateo 的多切片细化策略在涉及多个切片时可以继续提高 3D 重建精度(Figure S4D)。
在确定算法的准确性后,作者进一步证明,与替代工具相比,Spateo 显着提高了计算效率和可扩展性(Figure 3F)。Spateo 对于不同的下采样策略也具有鲁棒性(Figure 3G),例如,在不同间隔间隙下对切片进行下采样或以不同比率对细胞数进行下采样。最后,作者验证了 Spateo 在所有主要参数的大范围值下的稳健性(Figure S4E)。
总之,利用其可扩展性、生成模型框架(考虑到部分、非刚性、多切片细化和网格校正),Spateo 能够准确创建小鼠胚胎的 3D 全息图。
3. 一个多尺度、3D 感知数字化和 CCI 框架,用于剖析组织组织的细胞间和细胞内机制
整个 3D 胚胎(Figure 4A)数据集使作者能够研究以前难以完整探测的新兴结构,包括 ZLI(Figure 5)、MHB(Figure S6)和脊髓(Figure S6)。为了全面表征 3D 转录组异质性,能够适应任意 3D 结构并能够跨多个尺度(从亚细胞水平到器官水平)检测空间极性基因的强大算法至关重要。然而,Belayer 等现有方法仅限于 2D 分析,因此不能轻易推广到 ZLI 所在的中空 3D 神经管、ZLI 本身的 3D 环以及蛇形 3D 脊髓的分析。Spateo 引入了一种基于图势函数概念的数字化方法(STAR Methods),该方法使作者能够在任何拓扑复杂的 2D 或 3D 结构中创建任意轴(Figure 4B, upper; STAR Methods)。
:::block-1
(A) 3D 重建的 E11.5 阶段胚胎,按细胞类型着色,并圈出了丘脑内限制带 (i)、中脑-后脑边界 (ii) 和脊髓 (iii) 区域。整个胚胎、ZLI 区域和脊髓的比例尺分别表示 500 μm、200 μm 和 1000 μm 的距离。\
(B) 数字化和细胞间相互作用 (CCI) 模型的示意图(更多详细信息,请参阅 STAR Methods)。\
(C) 下游模型,使用转录因子 (TFs) 的表达、由基因表达构建的加权邻域图、先验知识网络和 Spateo 的空间感知回归框架来预测基因表达作为相应调节配体-受体对表达的函数。\
(D) 示意图描述了如何使用下游模型 (C) 扩展源自配体或基于 L:R 的模型(B,底部)获得的见解,以推断细胞间 (L:R) 相互作用和细胞内(TF-target)调节。\
(E) Spateo(上)和 Belayer(下)在模拟半圆上进行层(左)和列(右)数字化。\
(F) 与 (E) 相同,但适用于模拟梯形。\
(G) Spateo(左)和 Belayer(右)对猕猴皮层的 Stereo-seq 部分进行分层数字化。\
(H) 使用 CosMx 分析的非小细胞肺癌 (NSCLC) 样本的视野 (FOV) 4 中所有细胞的细胞分割图,按细胞类型着色。\
(I) 散点图比较了 COMMOT 预测的细胞间配体:受体相互作用的数量与模型预处理阶段 Spateo 预测的数量。每个点都是一个细胞;x 轴表示来自 COMMOT 数组的非零 L:R 交互的数量,y 轴表示来自 Spateo 数组的非零 L:R 交互的数量。\
(J) 观察到的基因表达与模型预测的基因表达之间的 Spearman 相关性的条形图,将 Spateo 的空间加权模型与使用 COMMOT L:R 数组预测表达的非加权“全局”泊松广义线性模型进行比较。有关详细信息,请参阅 STAR Methods 部分 COMMOT 基准测试。
:::
同时,为了揭示导致基因表达变异的信号传导和调控机制,剖析涉及细胞间通讯和相关下游基因调控的配体-受体或 L:R 相互作用至关重要。然而,现有的 CCI 分析工具大多只考虑可能涉及的配体和受体,而不考虑潜在影响。那些考虑这些影响的工具将 CCI 事件框定为细胞类型接近度而不是信号分子,限制了对可能的分子驱动因素的解释,并返回全局估计值,尽管细胞之间的异质性在具有大量细胞和细胞类型的图案化 3D 结构中变得更加明显。Spateo 利用空间加权建模方法将表达模式与可能的机制 L:R 相互作用联系起来,同时考虑组织区域之间的潜在差异(Figure 4B, lower; STAR Methods),返回每个细胞的预测值。它还将配体-受体和下游基因表达建模为 TFs 的函数,从而创建“TF-gene models”,将细胞间相互作用与细胞内相互作用联系起来(Figures 4B–4D; STAR Methods)。
在将数字化和 CCI 算法应用于 3D 小鼠胚胎数据集之前,作者首先在模拟和多个公共数据集上对它们进行了广泛的验证。Spateo 的数字化能够在两个模拟案例中创建更统一的“层”和“列”(Figures 4E and 4F),代表常见的生物结构,例如大脑的层。它还很好地数字化了具有复杂拓扑结构的猕猴皮层切片的内外层轴(Figure 4G)。该方法生成的连续轴可以实现基因表达极性的多尺度研究(Figures S5A–5D),揭示小鼠大脑中已知的功能标记物的喙-尾(R-C)梯度,例如 Cntnap2、Epha7 和 Nr2f1(Figures S5A and S5B),并实现亚细胞极性分析:例如,识别在细胞核质心或细胞质中核膜附近富集的基因(Figures S5C and S5D)。在 MERFISH 小鼠大脑数据集(Figure S5E)中,作者的数字化成功重现了皮质层以模拟神经元的层状富集,其精度高于 Belayer(Figures S5F–S5I)。这些分析表明,Spateo 的数字化有助于在多个尺度上定义任意空间轴,从而能够对分子和信号异质性进行详细的空间解剖。
作者的空间加权 CCI 模型在预测靶基因表达方面优于类似方法(有关基准测试详细信息,请参阅 STAR Methods),该模型使用 CosMx 对非小细胞肺癌 (NSCLC) 样本进行分析,通过 Spearman 或 Pearson 相关性评估观察到的和模型预测的基因表达(R$^2$ 始终 >0.8)(Figures 4H–4J)。此外,与全局模型相比,Spateo 使用 WNT 家族相互作用进行分析,对于同一家族的配体和受体,报告了更一致的结果(Figures S5L and S5M)。在同一数据集的多个 FOV 中观察到一致、稳健的性能(Figure S5N),并且在使用不同方法收集的各种数据集中也观察到了一致、稳健的性能(Figures S5J–S5N and S5O–S5R)。
总的来说,Spateo 提供了一个通用框架来揭示从细胞到组织到器官的多个生物学尺度上的基因表达极性,并根据区域特异性细胞间和细胞内细胞信号传导的影响来解释这种变化。
4. 中枢神经系统发育的功能生物环路的系统表征
在器官形成过程中,中枢神经系统 (CNS) 中的关键 3D 胚胎结构,例如 ZLI、MHB 和脊髓,具有独特的分子多样性和细胞相互作用。具体而言,ZLI 组织者是大脑组织的关键中心,它会影响邻近细胞采取特定的发育路径,从而塑造丘脑 (p2) 和前丘脑 (p3) 区域。人们对组织者周围表现出的分子模式和细胞间相互作用知之甚少,但新的 3D ST 方法开始允许对整个转录组进行全面分析,从而能够探索 ZLI 的分子特征。最近的 3D 研究已经表征了 E8.5-E9.5 的 ZLI 区域;然而,人们对后期 ZLI 区域的信号传导情况知之甚少。E11.5 小鼠胚胎的全面 3D 细胞图谱的创建以及 3D 数字化和 CCI 建模技术的引入使作者能够广泛而深入地探索 ZLI 和其他组织内复杂的细胞间或细胞内生物环路。
:::block-1
(A) E11.5 阶段上部神经管示意图,标示丘脑内带边界 (ZLI) (红色) 和中脑-后脑边界 (MHB) (浅蓝色) (左)。所分析的间脑环 (i) 和 ZLI 侧翼区域 (ii) 被突出显示,ZLI 细胞为栗色 (中间)。右侧显示了这两个区域之间的不同视图 (i-1 至 i-3 和 ii-1 至 ii-3) 和关系 (用虚线表示)。\
(B) 从两个角度观察的间脑环空间散点图,颜色由背腹数字化值(左)、Shh 表达(中)和 Fgf8 表达(右上)或 Fgf8 对 Sufu 的影响(右下)决定。比例尺表示 200 μm 的距离。\
(C) ZLI 侧翼区域的空间散点图,以喙-尾数字化值着色。比例尺表示 200 μm 的距离。\
(D) ZLI 子集中沿 R-C 轴高度可变的基因的聚类图。\
(E) (从左到右)沿 R-C 轴绘制选定 Wnt 家族配体的表达密度图,沿 R-C 轴绘制选定 Lhx 因子的表达图,沿 R-C 轴绘制选定细胞间相互作用效应的幅度图。ZLI 区域以浅蓝色矩形突出显示。\
(F) 涉及 Bmp7、Sox2、Id1 和 Smad4 的细胞间或细胞内相互作用的示意图。\
(G) ZLI 区域的信号传导图。左图:ZLI 子集中区域的识别。紫色:p2(丘脑)、橙色:ZLI、黄色:p3(丘脑前部)、蓝色:顶板、红色:基底板区域。右图:示意图,显示细胞间相互作用效应(箭头),将配体(三角形)与靶基因(可以是 TFs:正方形,或其他:圆圈)连接起来。绿色区域(围绕 ephrins 和 Bmps/Wnts)表示以类似方式影响基因组的组配体。基因按其富集区域着色(如果在多个区域富集,则使用不同颜色),并根据平均表达确定大小。黑色箭头表示其他研究支持的相互作用,而灰色箭头表示新预测的相互作用。Corr.,相关性;Digi,数字化值;Exp.,表达。
:::
为了表征 ZLI 组织者,作者首先提取了两个子集,其中包含 ZLI、ZLI 侧翼区域和“间脑环”(Figure 5A; Tables S3 and S4)。然后,作者将这些区域数字化,分别定义“背腹”(D-V)和“喙尾”轴(Figures 5B and 5C)。重要的是,ZLI 不会延伸到顶板;事实上,作者发现 ZLI 标记物 Shh 的表达与间脑环顶板中的 Fgf8 表达不同(Figure 5B)。从 CCI 建模中,作者还发现 Fgf8 对 Sufu(Figure 5B,参见“顶板区域”)和 Gli3(未显示)有影响,它们共同构成 Shh 抑制复合物,从而提供了一种控制 ZLI 背侧延伸程度的潜在机制。接下来,作者研究了 ZLI 侧翼区域(Figure 5C),以探究 ZLI 如何作为 p2 和 p3 区域的边界和信号中心。作者确定了 R-C 轴上的三个主要空间可变基因模块(Figure 5D; STAR Methods),作者假设它们对应于丘脑前区 (p3)、丘脑 (p2) 和 ZLI。为了表征基因的空间分布,作者通过可视化它们沿 R-C 轴的富集情况将它们映射到 p2、p3 和 ZLI 域(Figure 5E)。作者发现 Wnt 家族的几种形态发生素在 p2 区域中富集,但 Wnt7b 除外,它反而在丘脑前区富集(Figure 5E)。
为了揭示涉及 Wnt 形态发生素和其他配体的细胞间信号传导情况,作者拟合了 CCI 模型,以预测细胞特异性配体效应(STAR Methods),该效应针对从表现出 R-C 变异性的靶基因中选择的一组靶基因。作者还可视化了沿 R-C 轴预测的相互作用效应的丰富程度(Figure 5E)。注意到许多 Bmp 家族因子对 p2 域中促进干性的 Id1 的影响,作者拟合了 TF 基因模型,以推断配体和这些配体同源受体下游靶基因的 TF 调节因子,以表征 E11.5 P2 区域中驱动干性的因素。除其他外,作者预测 Bmps 受 Sox2 调控,而 Id1 受 Bmp 传感器 Smad4 调控(Figure 5F),这表明 Spateo 能够绘制特定空间域的细胞间/细胞内分子信号传导网络。接下来,作者描述了其他配体(包括 Gdf11、ephrins 和 Shh)信号传导效应的精确定位。作者将每个相互作用效应映射到 p2、ZLI 和 p3 区域以及沿 D-V 轴的基板和顶板域(如果适用)(未显示 D-V 轴)(Figure 5G)。值得注意的是,作者观察到 Wnt7b 对丘脑前/P3 特异性配体(例如 Sema5b、Notch-like Dlk1、Dll2 和 Dll3)和 TF(例如 Foxd1)的调节、上述顶板中 Fgf8 的活性以及 Gdf11 对基板中早期神经元标志物(例如 Dcx 和 Thsd7a)的影响(Figure 5G)。作者还注意到 Wnts 对负反馈调节剂 Axin2 和 Nkd1 的丘脑/P2 特异性上调。此外,作者观察到 Wnt 和 Bmp 配体对多能性维持基因(例如 Id1、Tead1、Mycn、Otx1、Cited2 和 Ybx1)的局部影响(Figure 5G)。过去的扰动研究进一步支持了许多这些观察结果(Figure 5G)。这些结果全面描绘了 ZLI 区域的细胞间和细胞内信号传导景观,涵盖了 E11.5 的多个空间域(p2、ZLI、p3、顶板和基板域)。
作者进一步研究了 MHB 和脊髓的 3D 分子图谱。在 MHB 区域,作者表征了所选配体和靶基因的区域特异性,例如边界神经外胚层中的 Fgf 家族因子(Figures S6A and S6B; Table S5)。作者还研究了发育关键配体 Ptn 和 Cdh2 对各种下游靶标的影响(Figures S6C and S6D)。作者确定了 Ptn 对涉及突触可塑性(例如 Gap43)、轴突生长(例如 Rtn1)等基因的影响(Figure S6C)。作者还揭示了 Cdh2 对 Tox 和 Abcc4 的区域专属影响(Figure S6D)。这些预测的影响与之前的报告一致,进一步验证了 Spateo 在识别生物学意义影响方面的能力。对于脊髓区域,作者首先将沿内侧-外侧轴的横截面整合到中间平面,然后将该整合的脊髓表示数字化以获得 D-V 轴(Figure S6F; Table S6)。作者观察到 Lhx 家族成员(Figure S6G)和其他 TF(例如,Dbx1、Gbx2)(Figures S6H and S6I)在 D-V 轴上存在差异分布,这些成员对脊柱发育都很重要。作者还发现 Slit2 在背端空间富集(Figure S6J)。由于 LIM 域因子(例如 Lhx 家族)有助于控制颅骨中的 Slit2 表达,作者研究了 Lhx 因子是否可能同样影响脊髓中的 Slit2。从 TF 基因建模来看,许多 Lhx 基因和其他同源框因子是 Slit2 的顶级预测调节因子(Figure S6K)。作者确定了 Slit2 信号传导的潜在下游靶点,揭示了与粘附和细胞骨架动力学有关的潜在靶点,这与它在轴突引导中的作用一致(Figure S6L)。总之,这些结果证明了 3D 数字化在识别区域特异性基因表达模式中的应用,以及 CCI 建模在预测 E11.5 时 MHB 区域和脊髓中转录调控和 CCI 之间的微妙相互作用中的应用。
5. 形态矢量场预测心脏迁移路径并描述心腔不对称器官发生背后的分子通路
胚胎和组成器官的形成具有严格控制的形态发生过程的特点。实时成像提供了以高分辨率观察形态发生随时间变化的机会,但它无法将复杂的调控程序与这种形态变化联系起来,因为成像只能测量单个细胞内随时间变化的少数基因。利用作者的多时间点分子全息图,作者不仅可以比较重建的 3D 器官随时间的变化以揭示不同的细胞迁移模式,而且还可以预测每个细胞随时间如何迁移,并最终将宏观形态变化与空间中单个细胞的微观分子表达动态联系起来。
:::block-1
(A) E9.5(上行)或 E11.5(下行)的整个心脏和每个主要解剖结构(即左心室 (LV)、右心室 (RV)、流出道 (OFT)、右心房 (RA) 和左心房 (LA))的 3D 重建模型。\
(B) E9.5(每组左侧条)和 E11.5(右侧条)之间整个心脏 (WH) 或每个主要结构的不同 3D 形态特征的条形图。注释了每个形态特征变化最显著的前两个域。\
(C) E9.5 和 E11.5 心脏之间的 3D 细胞排列图和细胞类型转换矩阵。带箭头的实线表示从 E9.5 到 E11.5 细胞的映射,而带箭头的虚线表示从 E11.5 映射回 E9.5。心脏结构之间的灰线将每个 E9.5 细胞与 E11.5 心脏中最有可能的目标细胞连接起来。右侧的转换矩阵表示从一种细胞类型到另一种细胞类型的转换概率。矩阵的每一行总和为 1。\
(D) 3D 箭形图表示细胞迁移场。细胞用迁移速度的 z 轴分量的值着色。\
(E) 根据迁移矢量场预测的细胞迁移路径的 3D 流线图。\
(F) 极轴上的 2D 条形图说明了心脏五个主要结构(用颜色表示)的细胞的平均迁移方向(不同的八分圆,由左右、上下轴和前后方向定义)和大小(条的长度)。从 (D—F) 中,我们可以看到高斯过程或 GP 和 SparseVFC 都给出了相似的结果,而基于 GP 的矢量场往往更平滑。\
(G) 形态矢量场的微分几何分析揭示了心脏的不对称分化。从上到下:左侧为细胞迁移流线图,流线用迁移加速度、卷曲度和发散度着色;右侧是五个主要结构中相应微分几何量的箱线图。\
(H) 与形态卷曲度、加速度和发散度高度相关的最重要基因(形态发生基因)的 Circos 图。中间的维恩图揭示了与形态卷曲度(白色)、加速度(深粉色)和发散度(蓝色)类别相关的基因集大小和重叠基因数。外环包括所有形态发生基因的基因表达热图,特定于每个形态特性(显示为单独的热图)。热图的行标注了主要的心脏结构,而列标注了基因名称。基因按 q 值排序,每个形态发生类别按顺时针方向增加。热图上每个框的颜色和热图附近的点分别用于指示基因表达水平和 q 值。粗体基因名称是 (I) 中显示的 GO 通路定义的基因集之一,而红色基因名称是 (J) 中可视化的已知形态发生基因。\
(I) 基于所有形态发生基因的 GO 富集分析,与心脏形态发生相关的关键术语的综合 GSEA 评分条形图。\
(J) 重建的 E9.5 3D 心脏细胞中示例基因(以 H 突出显示)的插值基因表达的 3D 散点图。注释了每个类别的最高表达区域。使用透明表面网格来显示重建心脏的 3D 形状。
:::
心脏是哺乳动物胚胎发育过程中最早出现的器官之一,是一种结构高度复杂的器官,通过复杂的迁移过程形成,包括心管成环、分隔和瓣膜形成。为了表征心脏器官形成的细胞迁移模式并揭示潜在的形态发生因素,作者首先分别基于 74 和 64 个切片重建了 E9.5 和 E11.5 时的心脏 3D 模型(Figures 6A and S7A–S7D; Table S7)。作者还证明可以重建两个时间点的所有主要结构,即左/右心室 (LV、RV)、左/右心房 (LA、RA) 和流出道 (OFT)(Figure 6A)。作者观察到两个时间点的每个结构中区域特异性基因的高度特异性。例如(Figures S7B and S7C),Cited1、Cck、Tnc、Angpt1、和 Tbx5 在 E9.5 时在 LV、RV、OFT、RA 和 LA 区域富集,而 Hand1、Hey2、Sema3c、Hcn4、和 Pitx2 在 E11.5 时在相应区域富集。作者的 3D 重建进一步揭示了表面积、体积和细胞数量显著增加,而细胞密度保持相对恒定且结构相似性高,与之前的研究一致(Figure 6B)。
作者应用了用于整个胚胎 3D 对齐的高斯过程方法,将 E9.5 心脏的细胞映射到 E11.5 心脏的细胞(Figure 6C, left)。E9.5 的主要结构(LV、RV 等)以高特异性映射到相应的 E11.5 结构(Figure 6C, right)。重要的是,高斯过程还可以直接返回单细胞迁移的分析形态矢量场,构成一种既能进行 3D 对齐又能学习形态矢量场的统一方法。作者将此类矢量场定义为“形态矢量场”,将细胞从较早的时间点映射到较晚的时间点,揭示物理空间中的细胞迁移模式(Figures 6D–6F; Video S3),其方式类似于作者之前的 RNA 速度矢量场方法,该方法揭示基因表达空间中的细胞命运转变。为了揭示形态发生的潜在潜在调控机制,作者利用随附的转录组数据和可从重建的形态矢量场中分析得出的微分几何量来揭示物理空间中的细胞迁移特性(STAR Methods)。重要的是,对于 3D 形态矢量场,3D 旋度(测量给定点的旋转程度)、加速度、曲率、扭转(量化 3D 物体的扭曲程度)、散度(揭示组织是扩张还是收缩)和 Jacobian 矩阵(Figure S7E)(量化沿一个轴的迁移如何影响沿另一个轴的运动)具有真实的物理意义,并且可以通过找到与这些形态特性显着相关的基因来识别关键的形态发生基因。有趣的是,从作者的微分几何分析中,作者揭示了心脏的不对称迁移模式(Figures 6G and S7E)。例如,作者显示了 RA 具有最高加速度,RV 和 LA 具有最大卷曲度,而 LV 具有最低发散度,这与这些结构形成的时间线一致(Figure 6G):与源自第一个心脏场的 LV 相比,源自第二个心脏场的 LA/RA 和 RV 在较晚的阶段整合到心脏中。此外,它们的可能的祖细胞和不太成熟的状态有助于它们快速扩张/形态发生,与此时的高加速度和卷曲度有关(Figure 6G)。LV 成熟得多,分化能力有限,因此很难对其他结构做出贡献,其特点是发散度最低。接下来,作者检测到一组与形态卷曲度、加速度和发散高度相关的“形态发生基因”,包括已知的细胞迁移标记,例如 Tbx2/Bmp2;对房室管 (AVC) 发育很重要的关键基因;Tdgf1 负责前心管发育;Angpt1 负责右心房形态发生;Pitx2 负责左/右不对称形成;Hey2 负责心室形成(Figures 6H–6J)。这组“形态发生基因”的基因集富集分析 (GSEA) 进一步揭示了与心脏形态发生相关的关键术语,例如肌细胞迁移、心房形态发生和心脏右心室形态发生(Figure 6I)。
总的来说,这些分析表明,Spateo 通过预测细胞迁移的形态发生路径来表征涉及不对称心脏器官发生的分子通路,从而将宏观形态动态与微观表达动态联系起来。
6. 量化果蝇生殖带回缩过程中的体积动力学、表达极性和预测形态发生因素
胚胎发生的特点是特定的“器官发生模式”,即由连续基因调控程序协调的器官形态发生的动态模式。这些基因程序还决定了细胞命运的层次化规范和组织成复杂的 3D 结构和功能单元。除了小鼠之外,果蝇也是一个极好的模型系统,可以研究器官发生模式背后的动力学以及探索形态发生与基因表达之间的关系,因为果蝇的生命周期很快,在胚胎发生过程中形态和基因表达的变化很大但高度有组织。具体来说,从果蝇胚胎的 S11 和 S13 阶段,作者发现虽然这两个时间点的整体胚胎结构非常相似(0.93)(Figures S8A and S8B; Videos S4 and S5),但作者能够确定三种一般的主要器官发生模式:(1) 器官迁移或运动,例如中枢神经系统、羊膜浆膜和肌肉;(2) 器官融合/汇聚,多个部分融合成一个成熟器官,例如中肠;(3) 器官扩张,主要由细胞生长驱动,例如后肠和唾液腺(Figures S8B)。
接下来,作者表征了整个果蝇胚胎中的基因表达极性,首先通过学习一条沿前后 (A-P) 轴穿过生殖带细胞中间的主曲线来量化生殖带的主干 (Figure S8C)。然后,作者使用回归分析确定了沿该主干动态变化的基因,确定了头部特异性基因,例如 Dfd;胸部特异性基因,例如 Scr 和 Antp;以及腹部特异性基因,例如 Ubx、Adb-A 和 Adb-B (Figures S8D-S8F; Table S8)。在插入原始噪声数据后,这些 Hox 基因表达模式得到进一步确认,揭示了与 Berkeley 果蝇基因组计划 (BDGP) 原位数据库一致的表达模式 (Figure S8G)。
与 Figure 6 和 VideoS6 中仅对单个心脏器官进行的形态矢量场分析不同,作者模拟了生殖带内的主要器官,包括中枢神经系统、后肠、中肠、肌肉和唾液腺,考虑到生殖带中发育中的器官相互影响并受到外部物理和生物力学因素的制约(Figure S8H)。分析矢量场显示生殖带尾部的卷曲度(Figure S8I)和加速度(Figure S8J)值较高,表明该区域收缩强烈(Table S9)。为了进一步量化可能驱动这些器官形态发生的基因和基因程序,作者绘制了所有具有非零基因表达的细胞的平均加速度和卷曲度值,这些细胞对应于主干指数的单个基因,作为主干指数的函数(Figure S8K)。有趣的是,已知的形态发生基因,如 peb/hnt、cad、Abd-B 等,被鉴定为具有最高的平均主链值,因此在生殖带尾部富集(Figure S8K)。作者还检测到一系列特征较少的基因,如 CG2930 和 CG31463。基因功能 (GO) 分析也反映了这些检测到的基因在形态发生过程中的重要性,这进一步揭示了与生殖带延伸、胚胎后肠形态发生等相关的通路的富集(Figure S8L)。最后,作者发现,虽然肌肉细胞和神经细胞之间几乎没有空间共定位,但中肠和后肠细胞与肌肉细胞强烈共定位,表明肌肉细胞在这一阶段后肠和中肠细胞的快速迁移中起着关键作用(Figure S8M)。有趣的是,作者还发现 Neo、Fkh 和 COX8 的表达与卷曲度密切相关,证实了它们在调节后肠/中肠细胞迁移中的作用,这对于生殖带回缩和重塑至关重要(Figure S8N)。此外,当作者关注中枢神经系统(Video S7)和中肠(Video S8)时,作者还证明了 Spateo 可以推断细胞迁移路径并识别每个单独区域的形态发生调控子(Figure S9)。
总的来说,这些结果与上一节相结合,强调了 Spateo 如何超越描述性空间分析,利用形态矢量场进行更动态和预测性的 3D 时空建模,从而显著提高我们利用 3D ST 揭示新兴特性背后的调控机制的能力。
7. Spateo-viewer,3D 空间转录组学的“Google Earth”
新兴的 3D 时空解析 ST 数据集的大小和复杂性对如何最好地探索此类数据集提出了巨大的挑战。需要一个类似于“Google Earth”的用户友好型 Web 应用程序,以便能够流畅、交互式地访问 3D 单细胞数据。因此,作者开发了 Spateo-viewer (http://viewer.spateo.aristoteleo.com/
),以实现 3D 基因表达模式的交互式可视化、组织结构和 3D 器官模型的直观浏览以及器官形态发生模式的动画。
:::block-1
(A) Spateo-viewer 的两种访问模式和所需的用户数据对象。Spateo-viewer 是在线部署的,可以通过 https://viewer.spateo.aristoteleo.com/
访问,也可以在本地作为独立应用程序使用。Spateo-viewer 的输入是一个 AnnData 对象,通常用于存储空间转录组学数据集,其中 .obsm 插槽包含空间、UMAP 或其他坐标;.X 插槽包含基因表达值;.obs 包含细胞注释信息。然后可以将 AnnData 对象转换为 VTK 对象,以通过 Spateo 或 Spateo-viewer 的 Reconstructor 生成 .points 和 .point_data 插槽(见下文)。\
(B) Spateo-viewer 的 GUI 界面示意图。左侧显示的是启用 Spateo-viewer 功能的开发人员工具包。\
(C) Spateo Web 应用程序的典型工作流程和重建器或 Explorer。\
(D) Spateo 的 Explorer 允许对 2D 和 3D 空间转录组学数据集使用各种数据探索模式。PC,点云;UMAP,用于降维的均匀流形近似和投影。
:::
Spateo-viewer 是一款多功能工具,可用于交互式切片对齐、3D 数据和模型重建、探索、可视化以及下游体积和形态分析,利用计算机视觉 (CV) 和作者的 Spateo 和 Dynamo 包的强大 3D 库(Figures 7A and 7B)。为了与 CV 生态系统中的工具连接,Spateo 或 Spateo-viewer 首先将单细胞基因组学领域使用的 h5ad 数据格式转换为可视化工具包 (VTK)、PyVista、Vuetify 和 trame 使用的 vtk 文件。具体来说,空间信息、UMAP 或其他坐标信息(来自 .obsm)、感兴趣基因的表达(来自 .X 或 .layers)和细胞注释信息(来自 .obs)将转换为 .points 和 .point_data(Figures 7A)。一旦数据转换完成,就可以在交互式数据浏览器中方便地可视化和操作轻量级 vtk 文件(Figures 7B)。
Spateo-viewer 具有高度模块化的架构和简化的工作流程(Figures 7C and 7D)。具体来说,Spateo-viewer 包含两个主要应用程序:Reconstructor 模块支持切片对齐和 3D 重建(Figure 7C),而 Explorer 模块则有助于 3D 数据探索以及体积和形态分析(Figures 7D)。典型的 Spateo-viewer 工作流程从数据预处理开始。一旦提供预处理的数据,Reconstructor 可用于首先对齐切片以重建 3D 点云,然后可用于创建表面网格,然后为每个单独的组织/器官进行域清理和网格重建。清理后的数据可以导出为 anndata 对象以与其他工具(包括 Spateo 和 Dynamo)交互,然后在 Explorer 中进行进一步分析。Explorer 允许对每个器官进行数据探索和 3D 体积分析(例如,估计长度/宽度/高度/表面积、细胞密度和细胞类型分布)。如果提供来自多个时间点的数据,则可以应用 4D 形态发生分析来了解驱动不同器官时空动力学的分子机制。Explorer 中的数据探索可以在 2D 空间或 3D 空间中进行,不仅可以可视化不同空间域、细胞类型或特定器官的复杂空间分布,还可以可视化 2D 或 3D 物理或简化表达空间中的基因表达。
总而言之,Spateo-viewer 是一款交互式、直观且轻量级的在线应用程序,可用于对新兴的 3D ST 进行 3D 数据操作和可视化。它还高度模块化且可扩展,使其成为一种灵活的工具,可让研究人员添加新的分析模块(Figure S10)。随着 3D ST 的不断扩展,作者相信它将成为该领域不可或缺的工具。
讨论
我们现在正处于空间生物学新时代的黎明,亚细胞分辨率、大视场方法(如 Stereo-seq)理论上可以在 3D 空间中构建时间分辨的胚胎规模数据集。为了全面研究这些数据集,一个可扩展的分析框架至关重要,该框架可以明确模拟 3D 空间中随时间变化的基因表达和信号传导动态。在这里,作者提出了 Spateo,一个用于高级时空建模的 3D 感知基础框架,它包含四个完整阶段:(1) 使用可扩展且精确的算法从连续的 2D 连续切片重建 3D 胚胎和器官模型,该算法允许进行部分、非刚性、多切片细化和网格校正;(2) 构建一个多尺度空间域数字化框架,以研究从单细胞水平到胚胎水平的生物学水平;(3) 利用空间感知回归模型,剖析 L:R 相互作用,并在单细胞分辨率下预测相互作用对 ZLI、MHB 组织者和脊髓等几种 3D 结构基因表达的相关下游影响;(4) 学习描述细胞迁移模式的形态矢量场,并促进识别细胞运动和形态发生的调控机制。
这些创新的 3D 感知时空建模方法推动了一系列原本具有挑战性的发现。在第一阶段,与现有的最先进方法相比,Spateo 的基于高斯过程和变分推理的 3D 对齐方法使我们能够更准确、更稳健地在多个时间点的 3D 空间中重建整个小鼠胚胎的分子全息图。重要的是,Spateo 可以扩展到其他模态,例如 H&E 染色图像和使用现成的图像特征提取器和描述符,例如尺度不变特征变换或 SIFT 和 DIScrete Keypoints 或 DISK 来提取特征点(参见 Spateo 的在线教程)。此外,它可以方便地与其他方法集成,例如,Spateo 可以通过多切片细化和网格校正进一步改进替代工具的初始对齐。在第二阶段,Spateo 的多尺度数字化框架不仅揭示了亚细胞分辨率的细胞核和细胞质富集基因,还揭示了定义次级组织者(如 ZLI 和 MHB 和脊髓)的 3D 信号组织的空间极性基因。为了研究基因表达空间异质性背后的 CCI 和转录调控,在第三阶段,作者进一步开发了一个综合框架来揭示和描述跨越细胞间和细胞内相互作用的独特分子网络,描绘出 ZLI 区域错综复杂的信号景观。最后,在第四阶段,Spateo 学习了形态矢量场,准确预测不对称小鼠心脏器官发生和果蝇生殖带回缩的 4D 时空迁移路径,将宏观细胞形态发生与潜在的微观分子通路联系起来。作者预计未来深入的分子和遗传研究将能够验证这些广泛的预测,从而加深我们对胚胎发生和疾病的理解。
随着空间技术不断成熟并渗透到生物实验室,作者预见到空间技术的各种优化和应用将呈爆炸式增长,Spateo 也将进一步发展。许多单细胞基因组学方法可以转化为空间基因组学方法,包括单细胞多组学;RNA 代谢标记;Perturb-seq 和谱系追踪以实现多视图;以及时空分辨、谱系分辨和扰动分辨的原位和 3D 空间细胞状态动态。作者还预见到在许多情况下应用 Spateo 来了解生物系统的机会,例如,通过生成空间分辨的跨物种细胞图谱并比较不同物种之间器官的 3D 模型,以了解组织结构的进化出现,例如哺乳动物的四腔心脏从无脊椎动物的单腔心脏进化而来。通过进一步优化 3D 形态矢量场方法,作者期待许多独特的机会将调控和功能基因与器官和胚胎水平的形态变化直接联系起来。
Spateo 遵循软件工程的最佳实践,包括允许持续优化的模块化和可扩展的基础架构;未来与 Aristotle GitHub 组织的其他框架集成,Aristotle GitHub 组织是预测基因组学的基础软件生态系统(https://github.com/aristoteleo
),目前包括 Dynamo 和 Dynast(https://github.com/aristoteleo/dynast-release
);以及积极的社区贡献,利用整个领域的专业知识构建统一的软件生态系统,实现对单细胞和 ST 的动态、定量和预测分析。
<center>--------------- 结束 ---------------</center>
<p style="color: gray; font-size: 10px;">注:本文为个人学习笔记,仅供大家参考学习,不得用于任何商业目的。如有侵权,请联系作者删除。</p>
本文由mdnice多平台发布
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。