跳转到内容

蛋白质组学

所属板块 分析方向与案例

把基础对象与算法方法重新放回真实分析任务与工作流。

阅读目标 帮助建立阅读上下文

先判断这页与你当前问题的关系,再决定是否深入展开。

建议前置 先建立相关基础对象与方法直觉

建议先建立相关基础对象与方法直觉,再进入本页。

蛋白质组学(Proteomics)研究的是在特定细胞、组织或生物体中实际表达的蛋白质集合,以及这些蛋白质的丰度、修饰状态和相互作用网络。

与基因组学不同,蛋白质组学面对的是一个动态且复杂的系统:

  • RNA ≠ Protein:转录水平与蛋白质水平的相关性通常只有 0.4-0.6
  • 翻译后修饰(PTM):磷酸化、糖基化等修饰直接调控蛋白质功能
  • 时空特异性:不同细胞类型、不同生理状态下蛋白质组成差异巨大

基于质谱的蛋白质组学产生巨大的数据量,需要算法来解决:

  1. 肽段测序问题(Peptide Sequencing):从质谱图推断肽段序列
  2. 蛋白质鉴定问题(Protein Identification):从数据库中识别产生实验谱的蛋白质
  3. 修饰蛋白鉴定问题(Modified Protein Identification):识别带有翻译后修饰的肽段
  4. 蛋白质定量问题(Protein Quantification):比较不同条件下蛋白质丰度变化

本章系统介绍基于串联质谱(MS/MS)的蛋白质组学数据分析方法:

章节核心问题算法技术
质谱基础理解 MS1/MS2、谱图构建、肽段测序问题谱图图(Spectrum Graph)、动态规划
数据库搜索与 FDR蛋白质鉴定、假阳性控制共享峰计数、Target-Decoy 策略
定量蛋白质组学蛋白质丰度比较Label-free、TMT/iTRAQ
谱卷积修饰肽段检测谱卷积算法
谱对齐精确定位修饰位点动态规划、kk-相似性
谱图图从头肽段测序DAG 最长路径

蛋白质测序的历史早于 DNA 测序。Frederick Sanger 在 1940 年代末通过 Edman 降解法测定了胰岛素的 52 个氨基酸序列,获得他的第一个诺贝尔奖。随着 DNA 测序技术的发展,蛋白质直接测序逐渐被取代,但质谱技术的进步使蛋白质组学在 1990 年代重新兴起。

现代蛋白质组学工作流程由 Matthias Mann 和 John Yates 等先驱建立,核心思想是:

  • 将蛋白质酶解为肽段
  • 用串联质谱(MS/MS)测量肽段碎片
  • 通过数据库搜索或从头测序推断肽段序列
  • 汇总肽段证据鉴定蛋白质并进行定量分析
质谱基础
谱图图 / 肽段测序
数据库搜索与 FDR
谱卷积 → 谱对齐(修饰鉴定)
定量蛋白质组学
  • Sanger, F. (1949). The terminal amino acids of insulin. Biochemical Journal, 45(5), 563.
  • Dancik, V., et al. (1999). De novo peptide sequencing via tandem mass spectrometry. Journal of Computational Biology, 6(3-4), 327-342.
  • Eng, J.K., et al. (1994). An approach to correlate tandem mass spectral data of peptides with amino acid sequences in a protein database. JASMS, 5(11), 976-989.
  • Elias, J.E., & Gygi, S.P. (2007). Target-decoy search strategy for increased confidence in large-scale protein identifications by mass spectrometry. Nature Methods, 4(3), 207-214.