跳转到内容

空间转录组总览

快速概览

空间转录组学的技术原理、数据结构与标准分析流程

所属板块 分析方向与案例

把基础对象与算法方法重新放回真实分析任务与工作流。

阅读目标 帮助建立阅读上下文

先判断这页与你当前问题的关系,再决定是否深入展开。

建议前置 先建立相关基础对象与方法直觉

建议先建立相关基础对象与方法直觉,再进入本页。

空间转录组学(Spatial Transcriptomics) 是一类在保留组织切片空间位置信息的同时,测量基因表达水平的技术。与单细胞 RNA-seq(scRNA-seq)输出 gene × cell 矩阵不同,空间转录组输出的是 gene × location 矩阵,其中 location 带有二维空间坐标。

spatial transcriptomics workflow
空间转录组把组织切片、显微图像和带空间条码的表达矩阵结合起来,使表达结果可以重新投影回组织结构。

将传统 RNA-seq 的”湿实验”部分与一个预先布置了空间条码(spatial barcode)的捕获玻片结合:

  1. 空间锚定:每个捕获位置(spot)有唯一的 barcode,与物理位置绑定;
  2. 原位捕获:组织切片的 mRNA 在 spot 附近被捕获并逆转录;
  3. 位置还原:测序后将 reads 按 barcode 分组,还原回原始空间位置。

这样,每个测量单位都知道自己来自组织的哪个位置。

许多生物学问题的答案本质上是空间性的:

生物学问题为什么需要空间信息
肿瘤微环境中免疫细胞如何浸润需要知道免疫细胞与肿瘤边界的相对位置
胚胎发育中的基因表达梯度需要沿胚胎轴的位置坐标
神经元之间的连接与通讯需要神经元的解剖位置
感染或炎症的扩散模式需要病灶中心到边缘的空间信息

失去空间上下文后,这些信息可能被细胞群体平均信号掩盖,或在单细胞解离过程中丢失。

1. spot-based 平台(代表:10x Visium)

Section titled “1. spot-based 平台(代表:10x Visium)”

原理:在玻片上预先布置阵列式捕获 spot(典型间距 55–100 μm)。

工作流程

  1. 组织切片(5–10 μm)铺在玻片上;
  2. H&E 或免疫荧光染色成像;
  3. 组织透化使 mRNA 释放到 spot 上;
  4. spot 上的引物捕获 mRNA 并逆转录,附加 spot barcode;
  5. 构建文库并测序;
  6. 将测序数据按 barcode 映射回空间坐标。

关键参数

参数典型值含义
spot 直径55 μm捕获区域大小
spot 间距100 μm相邻 spot 中心距离
每 spot 细胞数1–10 个取决于组织密度
检测灵敏度~1,000–5,000 基因/spot低于单细胞水平

特点:平衡了空间信息与数据质量,是当前最主流的技术路线。

技术分辨率主要特点局限性
Slide-seq10 μm(接近单细胞)磁珠阵列、高通量检测稀疏、需要更高测序深度
Stereo-seq0.5–1 μm(亚细胞)纳米球阵列、极高分辨率数据极其稀疏、分析挑战大
HDST2 μm微孔阵列实验复杂度较高
MERFISH / seqFISH单分子原位杂交、单细胞分辨率通量受限、需预设探针
Xenium单细胞原位分析、亚细胞定位基因 panel 受限

分辨率与稀疏性的权衡:分辨率越高,每个测量单位内的 mRNA 分子越少,数据越稀疏,分析难度越大。

典型的空间转录组数据包含三个互相关联的层:

┌─────────────────┐
│ 表达矩阵 │ gene × spot 的 count 矩阵
│ (gene × spot) │
└────────┬────────┘
spot barcode
┌────────▼────────┐
│ 空间坐标 │ 每个 spot 的(x, y) 坐标
│ (x, y) │ 定义在切片坐标系中
└────────┬────────┘
图像对齐
┌────────▼────────┐
│ 组织图像 │ H&E 或免疫荧光图像
│ (H&E image) │ 用于可视化和注释
└─────────────────┘
格式用途说明
spatial/空间坐标10x 格式,含 tissue_positions_list.csv
filtered_feature_bc_matrix/表达矩阵与单细胞相同的 h5 或 mtx 格式
tissue_hires_image.png高分辨率图像用于可视化
scalefactors_json.json对齐参数图像与 spot 坐标之间的缩放比例
原始数据
reads 比对 → 参考基因组 / 转录组
UMI 计数 → gene × spot 矩阵
质控过滤 → 去除低 UMI、边缘 spot
归一化 → 消除文库大小差异
降维聚类 → PCA + 聚类 / 图嵌入
空间分析 → 空间可变基因、邻域富集
细胞注释 → 去卷积或映射单细胞标签
生物学解释 → 结合组织图像分析
  1. 空间可变基因识别(SVG)

    • 寻找表达呈现空间模式的基因
    • 常用方法:SpatialDE、SPARK、Moran’s I
  2. 邻域富集分析

    • 检测特定细胞类型或基因集是否在空间上聚集
    • 例如:肿瘤-免疫边界处的基因表达变化
  3. 区域注释与分割

    • 基于表达或图像将切片分割为组织区域
    • 例如:肿瘤核心区、浸润区、正常组织区
限制因素影响应对策略
分辨率不足一个 spot 含多个细胞去卷积分析
捕获效率不均不同区域 mRNA 捕获差异标准化、批次校正
切片深度仅测得组织薄片(5–10 μm)多切片重建 3D
组织透化mRNA 可能扩散优化实验条件

空间转录组通常不能替代 scRNA-seq,而是与之互补:

  • scRNA-seq 提供:高分辨率的细胞类型参考图谱
  • 空间转录组提供:这些细胞类型在组织中的空间排布

两者整合是空间转录组分析的标准范式。

  • Ståhl et al., 2016. Visualization and analysis of gene expression in tissue sections by spatial transcriptomics. Science
  • 10x Genomics Visium 官方文档: https/www.10xgenomics.com/products/spatial-gene-expression
  • Svensson et al., 2018. SpatialDE: identification of spatially variable genes. Nature Methods
  • Palla et al., 2022. Squidpy: a scalable tool-kit for single-cell spatial omics analysis. Nature Methods