分析方向与案例
这一部分承接前面的基础与方法层,将其重新放回具体分析任务中:DNA-seq、RNA-seq、单细胞、表观组、群体遗传学、长读长、空间组学、蛋白质组学与结构生物信息学等问题,最终都需要通过工作流和案例来理解。
这一部分在全站中的位置
Section titled “这一部分在全站中的位置”它是整站 6 个主入口之一,用来回答”前面学的那些方法最后到底用在什么地方”。这里不是再讲一遍算法,而是把索引、比对、组装、概率模型、数据格式与参考资源重新放回真实任务边界中。
若只有方法页而无应用层,读者容易陷入”知道术语,但不了解任务边界”的知识碎片化问题。真正的分析工作通常还要求同时理解:
- 任务的输入输出对象是什么;
- 哪些方法在该场景下是关键依赖;
- 数据、注释和参考版本将如何影响解释;
- 不同应用方向为何提出不同的证据标准与流程设计。
推荐阅读顺序
Section titled “推荐阅读顺序”- 工作流与案例
- 算法总览
- 动态规划算法
- 图算法
- 字符串算法与索引
- 概率算法
- 变异检测
- 转录组
- 单细胞组学
- 表观基因组学
- 群体遗传学
- 长读长测序
- 空间转录组
- 蛋白质组学
- 临床变异解释
- 结构生物信息学
- 多组学整合
- 系统发育与进化
- 机器学习与基础模型
工作流与案例
以 NGS、RNA-seq 和 metagenomics 为主线,把算法重新放回真实分析流程。
进入子主题算法总览
系统梳理生物信息学中的核心算法范式:动态规划、图算法、字符串索引与概率模型。
进入子主题动态规划算法
从序列比对、编辑距离到 HMM 推断算法的完整推导与 worked examples。
进入子主题图算法
从基因组组装的 de Bruijn graph 到系统发育树构建的完整图论视角。
进入子主题字符串算法与索引
从 Trie、Suffix Array 到 FM-index,理解大规模序列搜索与映射的基础设施。
进入子主题概率算法
从 HMM、贝叶斯方法到 MCMC 采样,理解处理噪声与不确定性的核心方法。
进入子主题变异检测
围绕 DNA-seq variant calling,理解 BAM、VCF、过滤与证据质量。
进入子主题转录组
聚焦 RNA-seq 中的定量、isoform 归属与 pseudo-alignment。
进入子主题单细胞组学
围绕 scRNA-seq 的建库、UMI、聚类、伪时间与细胞类型注释。
进入子主题表观基因组学
理解 ChIP-seq、ATAC-seq 与 DNA 甲基化如何刻画调控层。
进入子主题群体遗传学
从 HWE、LD 到 GWAS 和群体结构,理解群体尺度的变异解释。
进入子主题长读长测序
围绕 PacBio、Nanopore、SV 与长读长组装建立现代测序视角。
进入子主题空间转录组
把表达矩阵重新放回组织切片与空间坐标中,理解邻域与组织结构。
进入子主题蛋白质组学
从肽段质谱峰到数据库搜索、FDR 和蛋白定量,理解蛋白层分析主线。
进入子主题临床变异解释
围绕变异注释、ACMG 框架和 CNV/SV 证据,建立临床解释视角。
进入子主题结构生物信息学
从蛋白结构层次到 AlphaFold 与结构比对,理解三维结构如何支持功能解释。
进入子主题多组学整合
把 RNA、表观组、蛋白和单细胞多模态数据放到同一个整合视角中理解。
进入子主题系统发育与进化
理解序列差异如何映射成距离、树和进化关系。
进入子主题机器学习与基础模型
从序列深度学习到生物语言模型,理解新一代表示学习方法。
进入子主题