跳转到内容

分析方向与案例

所属板块 分析方向与案例

把基础对象与算法方法重新放回真实分析任务与工作流。

适合谁读 建议在以下阶段阅读

已经建立基础与方法框架,想把它们放回真实分析任务中的读者

建议起点 推荐阅读路径

先看工作流与案例,再按自己的问题进入变异检测、转录组、单细胞或其他专题

这一部分承接前面的基础与方法层,将其重新放回具体分析任务中:DNA-seq、RNA-seq、单细胞、表观组、群体遗传学、长读长、空间组学、蛋白质组学与结构生物信息学等问题,最终都需要通过工作流和案例来理解。

它是整站 6 个主入口之一,用来回答”前面学的那些方法最后到底用在什么地方”。这里不是再讲一遍算法,而是把索引、比对、组装、概率模型、数据格式与参考资源重新放回真实任务边界中。

若只有方法页而无应用层,读者容易陷入”知道术语,但不了解任务边界”的知识碎片化问题。真正的分析工作通常还要求同时理解:

  • 任务的输入输出对象是什么;
  • 哪些方法在该场景下是关键依赖;
  • 数据、注释和参考版本将如何影响解释;
  • 不同应用方向为何提出不同的证据标准与流程设计。
  1. 工作流与案例
  2. 算法总览
  3. 动态规划算法
  4. 图算法
  5. 字符串算法与索引
  6. 概率算法
  7. 变异检测
  8. 转录组
  9. 单细胞组学
  10. 表观基因组学
  11. 群体遗传学
  12. 长读长测序
  13. 空间转录组
  14. 蛋白质组学
  15. 临床变异解释
  16. 结构生物信息学
  17. 多组学整合
  18. 系统发育与进化
  19. 机器学习与基础模型
起点

工作流与案例

以 NGS、RNA-seq 和 metagenomics 为主线,把算法重新放回真实分析流程。

进入子主题
算法

算法总览

系统梳理生物信息学中的核心算法范式:动态规划、图算法、字符串索引与概率模型。

进入子主题
DP

动态规划算法

从序列比对、编辑距离到 HMM 推断算法的完整推导与 worked examples。

进入子主题
图算法

图算法

从基因组组装的 de Bruijn graph 到系统发育树构建的完整图论视角。

进入子主题
索引

字符串算法与索引

从 Trie、Suffix Array 到 FM-index,理解大规模序列搜索与映射的基础设施。

进入子主题
概率

概率算法

从 HMM、贝叶斯方法到 MCMC 采样,理解处理噪声与不确定性的核心方法。

进入子主题
DNA-seq

变异检测

围绕 DNA-seq variant calling,理解 BAM、VCF、过滤与证据质量。

进入子主题
RNA-seq

转录组

聚焦 RNA-seq 中的定量、isoform 归属与 pseudo-alignment。

进入子主题
single-cell

单细胞组学

围绕 scRNA-seq 的建库、UMI、聚类、伪时间与细胞类型注释。

进入子主题
regulation

表观基因组学

理解 ChIP-seq、ATAC-seq 与 DNA 甲基化如何刻画调控层。

进入子主题
population scale

群体遗传学

从 HWE、LD 到 GWAS 和群体结构,理解群体尺度的变异解释。

进入子主题
long reads

长读长测序

围绕 PacBio、Nanopore、SV 与长读长组装建立现代测序视角。

进入子主题
spatial

空间转录组

把表达矩阵重新放回组织切片与空间坐标中,理解邻域与组织结构。

进入子主题
proteomics

蛋白质组学

从肽段质谱峰到数据库搜索、FDR 和蛋白定量,理解蛋白层分析主线。

进入子主题
clinical interpretation

临床变异解释

围绕变异注释、ACMG 框架和 CNV/SV 证据,建立临床解释视角。

进入子主题
structure

结构生物信息学

从蛋白结构层次到 AlphaFold 与结构比对,理解三维结构如何支持功能解释。

进入子主题
integration

多组学整合

把 RNA、表观组、蛋白和单细胞多模态数据放到同一个整合视角中理解。

进入子主题
evolution

系统发育与进化

理解序列差异如何映射成距离、树和进化关系。

进入子主题
ML / foundation models

机器学习与基础模型

从序列深度学习到生物语言模型,理解新一代表示学习方法。

进入子主题