单细胞 Multiome
单细胞多模态数据(multiome)的技术原理与分析框架,涵盖 RNA+ATAC、CITE-seq 等联合测量方法。
什么是单细胞 Multiome
Section titled “什么是单细胞 Multiome”单细胞 Multiome 指在同一细胞层面同时测量两种或多种分子模态的技术,它与分别测量后再整合有本质区别:
| 维度 | 单细胞 Multiome | 分别测量后整合 |
|---|---|---|
| **细胞对应** | 天然共享细胞索引 | 需要计算匹配或对齐 |
| **数据质量** | 同一细胞的同步测量 | 可能存在批次差异 |
| **分析粒度** | 真正的单细胞分辨率 | 可能是伪 bulk 或估算 |
| **技术平台** | 10x Genomics Multiome 等 | 独立实验平台 |
主要技术类型
Section titled “主要技术类型”| 技术名称 | 测量模态 | 应用场景 |
|---|---|---|
| 10x Multiome | RNA + ATAC | 基因表达与染色质可及性联合分析 |
| CITE-seq | RNA + Protein | 表面蛋白与基因表达联合分析 |
| REAP-seq | RNA + Protein | 类似 CITE-seq 的替代方案 |
| SHARE-seq | RNA + ATAC | 基于分液的低成本方案 |
| SCOPE-seq | RNA + DNA | 单细胞基因表达与拷贝数 |
单细胞 Multiome 能够回答传统单模态无法回答的问题:
调控-表达关联
Section titled “调控-表达关联”在同一细胞中直接观察调控元件(enhancer/promoter)与目标基因表达的关联:
细胞状态的多维刻画
Section titled “细胞状态的多维刻画”同时从转录组和表观组定义细胞状态,提高分型的稳健性。
发育轨迹的连续追踪
Section titled “发育轨迹的连续追踪”观察细胞状态转换过程中,转录变化与染色质开放性的先后顺序。
10x Genomics Multiome 工作流程
Section titled “10x Genomics Multiome 工作流程”- 细胞核分离:提取细胞核(因 ATAC 需要开放染色质)
- 转座酶处理:Tn5 转座酶切割开放染色质区域并添加测序接头
- 凝胶珠包被:细胞核与凝胶珠(Gel Bead)结合
- 分区与 barcoding:在微流控芯片中分区,添加细胞条形码
- 文库构建:分别构建 RNA-seq 和 ATAC-seq 文库
| 模态 | 数据类型 | 稀疏度 | 典型特征数 |
|---|---|---|---|
| RNA | 计数(UMI) | 高(~90% 零值) | 20,000-30,000 基因 |
| ATAC | 二值(peak) | 极高(~95% 零值) | 100,000-200,000 peaks |
| Protein | 计数(ADT) | 中等 | 100-200 抗体靶点 |
RNA 模态:
- QC:过滤低质量细胞、双细胞
- 标准化:log1p、CPM
- 特征选择:高变异基因
ATAC 模态:
- Peak 注释:与基因关联
- 降维:LSI(Latent Semantic Indexing)
- TF motif 富集:chromVAR
策略 1:早期整合(Weighted Nearest Neighbor)
Seurat 的 WNN 方法:
- 各模态独立降维
- 构建联合最近邻图
- 计算模态权重(RNA vs ATAC 贡献)
- 统一聚类与可视化
策略 2:深度生成模型
MultiVI 架构:
- 编码器:分别编码 RNA 和 ATAC
- 联合潜在空间:
- 解码器:分别重建 RNA 和 ATAC
- 优势:可处理缺失模态,提供不确定性估计
| 分析任务 | 方法 | 输出 |
|---|---|---|
| 调控元件-基因关联 | SCENT、Cicero | eQTL-like 关联 |
| TF 活性推断 | chromVAR、SCENIC+ | TF 活性得分 |
| 轨迹推断 | 联合 RNA + ATAC 的伪时间 | 分化路径 |
| 细胞通讯 | 整合表面蛋白(CITE-seq) | 配体-受体对活性 |
| 难点 | 具体表现 | 应对策略 |
|---|---|---|
| 噪声分布差异 | RNA(泊松/负二项)vs ATAC(二值) | 分别建模或使用深度生成模型 |
| 稀疏度差异 | ATAC 比 RNA 更稀疏 | 特征选择、平滑处理、peak 聚合 |
| 模态异步 | 转录变化可能滞后于调控变化 | 时间序列分析、lag correlation |
| 权重设置 | 模态贡献度平衡 | WNN 权重自动学习、人工调参 |
| 用途 | 推荐工具 | 特点 |
|---|---|---|
| 预处理 | Cell Ranger ARC | 10x 官方流程 |
| 整合分析 | Seurat v4+ | WNN、统一可视化 |
| 深度模型 | scVI-tools、MultiVI | 不确定性估计 |
| 调控分析 | Signac、SCENIC+ | ATAC 专用工具 |
| TF 活性 | chromVAR、MAESTRO | motif 富集分析 |