跳转到内容

分子动力学基础:蛋白质运动的计算模拟

快速概览

分子动力学(Molecular Dynamics, MD)模拟通过数值积分牛顿运动方程,追踪蛋白质等生物大分子在原子级别的运动轨迹。它回答的核心问题是:蛋白质如何在三维空间中运动?构象变化如何影响功能?自由能景观如何决定稳定性?

  • MD 模拟基于力场(Force Field):键合项 + 非键合项(van der Waals + 静电)
  • 通过数值积分 Newton 方程,追踪每个原子的轨迹(位置 + 速度)
  • 时间尺度通常为 ns 到 μs,受计算资源限制
  • 应用:构象变化、配体结合、蛋白质折叠、自由能计算
  • 局限性:时间尺度限制、力场精度、采样不充分
所属板块 分析方向与案例

把基础对象与算法方法重新放回真实分析任务与工作流。

阅读目标 帮助建立阅读上下文

先判断这页与你当前问题的关系,再决定是否深入展开。

建议前置 先建立相关基础对象与方法直觉

建议先建立相关基础对象与方法直觉,再进入本页。

分子动力学(Molecular Dynamics, MD) 是一种计算方法,通过模拟原子级别的运动来研究生物大分子的结构动态性和功能机制。

蛋白质的静态结构(如 PDB 文件)只展示了一个瞬间的快照。真实的蛋白质是动态分子,不断经历:

  • 局部振动(键长、键角振荡)
  • 侧链旋转(χ 角变化)
  • loop 区域运动
  • 结构域重排
  • 大规模构象变化

MD 模拟通过数值积分运动方程,追踪这些动态过程。

MD 模拟提供静态结构无法获得的信息

  • 构象变化:蛋白质如何在不同功能状态之间转换
  • 结合机制:配体/药物如何结合到靶标蛋白
  • 稳定性分析:突变如何影响蛋白质折叠和稳定性
  • 自由能景观:不同构象的相对稳定性和转换能垒
  • 时间分辨信息:动力学过程的时间尺度

关键认知:结构决定功能,但动态也决定功能。很多生物学过程(如酶催化、信号传导、药物结合)需要理解蛋白质的动态行为,而不是单一静态结构。

力场是 MD 模拟的物理基础,定义了原子之间的相互作用势能函数:

Etotal=Ebonded+EnonbondedE_{total} = E_{bonded} + E_{nonbonded}

物理意义势能函数
键伸缩(Bond stretching)化学键长度变化谐振子:E=12kb(rr0)2E = \frac{1}{2} k_b (r - r_0)^2
键角弯曲(Angle bending)键角变化谐振子:E=12kθ(θθ0)2E = \frac{1}{2} k_\theta (\theta - \theta_0)^2
二面角扭转(Dihedral torsion)旋转势垒周期函数:E=kϕ[1+cos(nϕδ)]E = k_\phi [1 + \cos(n\phi - \delta)]
物理意义势能函数
van der Waals短程排斥 + 长程吸引Lennard-Jones:E=4ϵ[(σ/r)12(σ/r)6]E = 4\epsilon [(\sigma/r)^{12} - (\sigma/r)^6]
静电相互作用电荷间库仑力Coulomb:E=qiqj4πϵ0rE = \frac{q_i q_j}{4\pi\epsilon_0 r}
力场适用范围开发者
AMBER蛋白质、核酸UCSF
CHARMM蛋白质、脂质、多糖Harvard
OPLS蛋白质、有机小分子Yale
GROMOS生物分子ETH Zurich
graph TD
A[初始结构 PDB] --> B[添加氢原子]
B --> C[溶剂化 Water Box]
C --> D[添加离子 Neutralize]
D --> E[能量最小化]
E --> F[NVT 平衡]
F --> G[NPT 平衡]
G --> H[Production MD]
H --> I[轨迹分析]
步骤目的典型参数
能量最小化消除结构冲突和不良接触最速下降法 + 共轭梯度
NVT 平衡稳定温度(恒定粒子数、体积、温度)100 ps,温度耦合
NPT 平衡稳定密度和压力(恒定粒子数、压力、温度)100 ps,压力耦合
Production生成分析用的轨迹10 ns - 1 μs+

通过数值积分 Newton 方程更新原子位置:

Fi=miai=iEF_i = m_i a_i = -\nabla_i E

常用算法:

  • Verlet 算法r(t+Δt)=2r(t)r(tΔt)+a(t)Δt2r(t+\Delta t) = 2r(t) - r(t-\Delta t) + a(t)\Delta t^2
  • Leap-frog 算法:速度和位置交替更新

时间步长(timestep)通常为 2 fs,受最快振动模式(通常是 H 原子键伸缩)限制。

MD 模拟生成的轨迹(trajectory)包含每个时间步所有原子的位置和速度。常用分析包括:

衡量结构偏离初始构象的程度:

RMSD(t)=1Ni=1Nri(t)ri(0)2RMSD(t) = \sqrt{\frac{1}{N} \sum_{i=1}^{N} |\mathbf{r}_i(t) - \mathbf{r}_i(0)|^2}

  • 低 RMSD:结构稳定
  • 高 RMSD:结构发生显著变化
  • 平台期:系统达到平衡

衡量每个残基的柔性:

RMSFi=1Tt=1Tri(t)ri2RMSF_i = \sqrt{\frac{1}{T} \sum_{t=1}^{T} |\mathbf{r}_i(t) - \langle\mathbf{r}_i\rangle|^2}

  • 高 RMSF:柔性区域(如 loop)
  • 低 RMSF:刚性区域(如 α-helix)
  • 氢键数量随时间变化
  • 特定氢键的存在/断裂
  • 氢键网络分析

识别主导运动模式:

  • 第一主成分(PC1):最大方差方向的运动
  • 第二主成分(PC2):次大方差方向的运动
  • 投影到 PC1-PC2 空间:构象空间采样

模拟蛋白质从无序到有序的折叠过程,验证折叠机制。

研究药物分子如何结合到靶标蛋白,结合亲和力,以及结合/解离路径。

模拟突变如何影响蛋白质稳定性、构象变化或配体结合。

通过热力学积分(TI)或自由能微扰(FEP)计算结合自由能。

  • MD 模拟通过数值积分 Newton 方程,追踪蛋白质原子级别的运动
  • 力场定义原子间相互作用:键合项 + 非键合项
  • 标准流程:能量最小化 → 平衡 → Production → 分析
  • 轨迹分析提取 RMSD、RMSF、氢键、主成分等动态信息
  • 局限性:时间尺度、力场精度、采样充分性