跳转到内容

序列表示与索引

当前主题 序列表示与索引

帮助你快速判断当前主题与全站知识图谱的连接方式。

这一页讲什么 快速建立问题边界

学习如何将生物序列组织成可高效计算的结构,理解从朴素扫描到现代压缩索引的算法演进脉络。

建议前置 先建立相关基础对象与方法直觉

建议先建立相关基础对象与方法直觉,再进入本页。

生物信息学的核心任务之一是在海量序列数据中快速找到目标片段。给定一条长达 30 亿碱基的人类参考基因组,如何在毫秒级时间内定位一条 100 bp 的测序 read?这是现代测序数据分析每天都要面对的问题。

本章节按照”表示 → 算法 → 索引 → 应用”的逻辑递进组织:从 k-mer 表示法这一基础工具出发,经过经典字符串匹配算法,到后缀索引结构,再到近似匹配与实际应用。