跳转到内容

关于本项目

想象一位刚进入生物信息学领域的研究生。她手头有测序数据,知道要用 BWA 做比对、用 GATK 做变异检测,但常常遇到这样的困惑:

  • 当 BWA 的比对结果出现偏差时,她不知道是该调整参数还是换用其他工具;
  • 当她读到一篇新论文提出的改进算法时,无法判断这个方法与现有方法的本质区别;
  • 当她想设计一个新的分析流程时,不确定哪些步骤是算法核心、哪些只是工程实现。

这些困惑的根源是一样的:对底层算法原理的理解不足

许多生物信息学教材和实践指南存在两个极端:要么只讲工具使用(“按这个按钮得到那个结果”),要么深入数学证明而缺乏与生物学问题的连接。BioInfo Wiki 尝试走第三条路:以问题为起点,以算法思想为主线,把生物学动机、计算模型和实际工具串成可连续阅读的知识脉络

我们不从”BWA 怎么用”开始,而是先问”为什么需要序列比对”、“比对问题的计算本质是什么”、“不同的比对策略在什么假设下成立”。理解了这些,工具的选择和参数调整就是自然推导的结果。

生物信息学的知识不是孤立的点。动态规划既用于序列比对,也用于 RNA 结构预测;图模型既用于基因组组装,也用于系统发育推断。Wiki 的结构设计强调这种横向连接,让读者能在不同主题间建立关联。

这不是一本”完成”的教科书。生物信息学在快速发展,新的测序技术、新的算法思想、新的生物学问题持续涌现。开源协作机制允许知识库随领域发展而演进。

当前阶段优先建设的知识板块:

层级内容示例
对象层生物学基础对象与数据表示reads、参考基因组、注释、文件格式
模型层抽象计算模型字符串、图、动态规划、概率模型
算法层核心算法方法比对、组装、索引、基因预测、系统发育
流程层实际分析工作流DNA-seq、RNA-seq、宏基因组
资源层数据资源与工具映射数据库、版本选择、工具原理解析

为了保持质量和一致性,以下类型的内容暂不纳入:

  • 工具操作手册:具体的安装步骤、参数列表、命令行示例(这些更适合工具官方文档);
  • 领域全覆盖:生物信息学分支众多,第一阶段聚焦核心算法和主流分析流程;
  • 纯百科词条:不追求术语定义的完整堆砌,而强调概念之间的关系和解决问题的思路。

建议从学习路线开始,先建立整体知识地图,再按需深入具体主题。重点不是记住所有算法细节,而是理解为什么需要这些方法它们解决什么类型的问题

可以通过目录或搜索定位到相关页面。每个主题页面尽量提供:

  • 问题背景与生物学动机
  • 核心算法思想
  • 与工具或流程的连接
  • 前置知识和延伸阅读

参考写作规范贡献指南。我们欢迎:

  • 对现有页面的补充和完善
  • 新的知识点页面(特别是填补知识网络中的空白)
  • 图示、示例和交叉链接的改进

BioInfo Wiki 希望成为:

  1. 中文社区可持续维护的生物信息学知识入口——不仅提供信息,更提供结构化的知识组织;
  2. 教材、课程、论文和实际工具之间的桥梁——帮助读者在不同知识形态间切换;
  3. 协作进化的知识网络——随着领域发展持续更新,而非静态出版物。

本知识库的组织和写作风格参考了以下经典教材:

  • Jones, N. C., & Pevzner, P. A. (2004). An Introduction to Bioinformatics Algorithms. MIT Press.
  • Durbin, R., Eddy, S., Krogh, A., & Mitchison, G. (1998). Biological Sequence Analysis. Cambridge University Press.
  • Cormen, T. H., et al. (2022). Introduction to Algorithms (4th ed.). MIT Press.

组织方式借鉴 OI Wiki 的模式:用清晰的层级结构串起知识点,用社区协作机制持续积累内容。