跳转到内容

蛋白质互作预测:从 docking 到网络推断

快速概览

蛋白质-蛋白质相互作用(Protein-Protein Interaction, PPI)是细胞信号传导、代谢调控和免疫反应的核心。计算方法通过分子对接(docking)、界面预测和网络推断,从不同角度预测和理解 PPI。

  • 分子对接(docking):预测两个蛋白质如何结合形成复合体
  • 界面预测:识别蛋白质表面可能参与结合的关键残基
  • 网络推断:从组学数据大规模预测 PPI 网络
  • 结合亲和力评估:量化相互作用强度
  • 实验验证:酵母双杂交、Co-IP、SPR 提供实验证据
所属板块 分析方向与案例

把基础对象与算法方法重新放回真实分析任务与工作流。

阅读目标 帮助建立阅读上下文

先判断这页与你当前问题的关系,再决定是否深入展开。

建议前置 先建立相关基础对象与方法直觉

建议先建立相关基础对象与方法直觉,再进入本页。

蛋白质-蛋白质相互作用(PPI) 是两个或多个蛋白质通过物理接触形成的功能性复合体。计算方法从不同层次预测 PPI:

层次方法分辨率典型应用
原子级别分子对接(docking)Å 级别复合体结构预测、药物设计
残基级别界面预测残基级别关键结合残基识别
网络级别PPI 网络推断系统级别信号通路、疾病机制

PPI 在生物学中无处不在:

  • 信号传导:受体-配体结合、激酶级联反应
  • 免疫反应:抗体-抗原识别、MHC-肽呈递
  • 转录调控:转录因子复合体、co-activator 招募
  • 代谢途径:酶复合体、代谢通道
  • 疾病机制:致病变异如何破坏 PPI

关键认知:理解 PPI 不仅要知道”谁和谁结合”,还要知道”如何结合”(界面、亲和力、动力学)和”结合后做什么”(功能后果)。

对接问题:给定两个蛋白质的三维结构(受体和配体),预测它们如何结合形成复合体。

输入:结构 A + 结构 B输出:复合体 A:B\text{输入:结构 A + 结构 B} \rightarrow \text{输出:复合体 A:B}

graph LR
A[受体结构] --> C[构象采样]
B[配体结构] --> C
C --> D[打分函数]
D --> E[排名]
E --> F[最优结合模式]

探索配体相对于受体的可能结合位姿(pose):

方法原理适用场景
刚体对接两个蛋白质保持刚性,只平移/旋转已知结构变化小
半柔性对接配体柔性,受体刚性常见策略
柔性对接两者都允许构象变化计算成本高,更真实

搜索空间:6 维(3 个平移 + 3 个旋转),加上内部自由度。

评估每个位姿的结合亲和力:

类型原理优缺点
力场打分基于物理势能(van der Waals + 静电)物理基础强,但计算慢
经验打分拟合已知复合体数据快速,但可能过拟合
知识打分基于统计势( observed frequencies)捕捉统计规律
工具特点适用场景
HADDOCK整合实验约束(NMR、mutagenesis)高精度复合体建模
ClusPro快速刚体对接 + 聚类大规模筛选
ZDOCKFFT 加速搜索蛋白质-蛋白质对接
AutoDock主要配体-受体对接药物设计

蛋白质-蛋白质结合界面通常具有以下特征:

特征说明
疏水残基富集疏水作用驱动结合
进化保守界面残基在同源蛋白中保守
平面或凹陷几何互补性
带电残基环静电作用稳定结合
热点残基(Hot Spots)少数残基贡献大部分结合能
方法原理工具示例
基于结构表面可及性、几何特征PIER、Promap
基于进化保守性分析ConSurf
基于机器学习训练分类器SPPIDER、PSIVER
基于能量计算残基结合能贡献Robetta Alanine Scanning

除了原子级别的对接,PPI 研究还在网络级别展开:

问题方法数据来源
蛋白质 A 和 B 是否互作?网络推断酵母双杂交、质谱、共表达
A 通过哪些中间蛋白影响 C?路径搜索STRING、BioGRID
哪些蛋白是关键枢纽(hub)?网络分析度中心性、介数中心性
方法原理规模
酵母双杂交(Y2H)转录因子重建检测互作中等规模
亲和纯化-质谱(AP-MS)共纯化检测复合体大规模
表面等离子共振(SPR)实时检测结合动力学小规模,高精度
Co-IP免疫共沉淀验证性实验
数据库内容规模
STRING预测和实验 PPI 网络> 10 亿互作
BioGRID实验验证 PPI> 100 万互作
IntAct分子互作数据库实验验证
DIP互作数据库curated 数据
指标定义典型范围
Kd(解离常数)平衡时解离/结合速率比nM - μM
ΔG(结合自由能)结合过程自由能变化-5 到 -15 kcal/mol
IC5050% 抑制浓度药物筛选常用
方法精度计算成本
MM-PBSA/GBSA中等中等
自由能微扰(FEP)很高
打分函数低-中
  • PPI 预测从三个层次展开:原子级别(对接)、残基级别(界面)、网络级别
  • 分子对接通过构象采样和打分预测复合体结构
  • 界面识别关键结合残基,特别是热点残基
  • PPI 网络推断揭示系统级别的互作关系
  • 计算预测需要实验验证(Y2H、SPR、Co-IP)