4.2 Superordinate Theme – Dependent Decisions
4.2.2 Subordinate Theme: “…I know what my limits are with a guy…”:
En la dinámica molecular (Molecular Dynamics, MD) se generan las configuraciones sucesivas del sistema integrando las leyes de Newton del movimiento. El resultado es una trayectoria en la que las posiciones y las velocidades de los átomos del sistema varían a lo largo del tiempo de simulación. La trayectoria del sistema se obtiene resolviendo la segunda derivada de la Segunda Ley de Newton, :
d2 xi dt2 =
Fxi
mi (2.8)
donde se describe el movimiento de un átomo de masa mi a lo largo de las coordenadas (xi) con una fuerza determinada (Fi) que viene dada por el campo de fuerzas, y un tiempo t. En el punto inicial de la dinámica, la energía total del sistema es la suma de las energías cinética y potencial para las coordenadas (x0) y velocidades (v0) iniciales:
(2.9) Éste es un método determinista ya que el resultado final es dependiente de la posición inicial de los átomos del sistema (de ahí la recomendación de partir de varias configuraciones iniciales para comprobar que los resultados convergen, así como la necesidad de realizar una minimización previa para evitar que haya gradientes de energía muy grandes que distorsionen el comportamiento del sistema).
La evolución del sistema a lo largo del tiempo se obtendrá mediante integración numérica. Esta integración se realizará en fracciones de tiempo separadas por el valor de $t. La fuerza total de cada partícula en el tiempo t (que se asume que es constante) se calcula como la suma vectorial de las
interacciones con los demás átomos y se determina mediante la derivada de la energía potencial con respecto a las coordenadas:
(2.10) A partir de las fuerzas se puede determinar la aceleración de los átomos de modo que, conociendo sus posiciones y velocidades a tiempo t, podemos calcular sus posiciones y velocidades en la siguiente fracción de tiempo, t+$t. Este proceso se repite sucesivamente para generar la trayectoria completa para todos los átomos del sistema.
Los algoritmos empleados en MD para generar las trayectorias asumen que las propiedades de éstas se pueden aproximar mediante series de Taylor:
(2.11) donde v es la velocidad (primera derivada de las posiciones con respecto al tiempo), a es la aceleración (segunda derivada), c es la tercera derivada, etc. Estas ecuaciones se integran mediante el algoritmo de Verlet (146), que usa las posiciones y aceleraciones a tiempo t y las posiciones en la etapa previa, x(t-$t), para calcular las nuevas posiciones a t+$t, x(t+$).
El tiempo de integración $t elegido es de vital importancia ya que si es demasiado pequeño la trayectoria apenas cubrirá una parte de todo el espacio conformacional, mientras que si es demasiado grande puede provocar inestabilidades debidas a solapamientos energéticos entre átomos. Los movimientos de mayor frecuencia son aquellos que corresponden a la vibración de los enlaces con hidrógenos. Se sabe que estas vibraciones ocurren en la escala del femtosegundo (fs) y su inclusión en el cálculo no haría más que añadir una carga computacional extra innecesaria ya que no influyen en el movimiento global del sistema. Es por ello que se suele fijar la longitud de los enlaces covalentes a sus valores de equilibrio mediante el algoritmo SHAKE (147). De
esta forma se aumenta el tiempo de integración a 2 fs (desde 3l 0,5 o 1 fs habituales) y se acelera la velocidad del cálculo.
Por otra parte, de la misma forma que se aplican aproximaciones para el cálculo de los términos enlazantes, se aplican también para los no enlazantes, ya que son computacionalmente más costosos. En esta aproximación no se tienen en cuenta las interacciones entre dos átomos separados por una distancia mayor a un límite previamente definido (cutoff). Esto afecta fundamentalmente al término electrostático ya que esta interacción es de largo alcance, y la omisión de parte de los pares de átomos del sistema en la simulación puede producir artefactos y conducir a propiedades del sistema no realistas. Para evitar esto se emplean métodos como el sumatorio de Ewald (PME) que permite corregir el sistema al sumar las interacciones con infinitos sistemas réplicas del original. El método se basa en dividir la suma de las interacciones en dos sumatorios: el espacio directo y el espacio recíproco (148).
Puesto que los sistemas son finitos y tienen bordes hay que tener en cuenta que se pueden presentar anomalías en las simulaciones con las moléculas que se encuentran en el borde del área e simulación. Para evitar que éstas experimenten un comportamiento diferente a las demás se aplican condiciones de límite periódico (Periodic Boundary Conditions, PBC) que permiten realizar la simulación como si el sistema no estuviera confinado. Para ello se rodea el sistema simulado en cada una de sus caras por copias exactas de él mismo. Cada partícula en la simulación tiene un duplicado exacto, con las mismas velocidades, en cada celda que la rodea (Figura 24).
De esta forma, aunque un átomo se vaya de la celda de la simulación, éste se reemplaza por otro que entra por la cara contraria, exactamente con la misma velocidad. Así se conserva el número de átomos en la celda original y ninguna partícula sufre los efectos de imponer un límite físico a las caras del sistema simulado. La forma y tamaño de las cajas depende de la geometría del sistema, usándose más frecuentemente cajas cúbicas y octaédricas para la simulación de proteínas y ácidos nucleicos (Figura 25).
Figura 25: figuras geométricas más habituales para la simulación de sistemas macromoleculares en entornos acuosos: cubo y octaedro truncado.
El tamaño de la caja debe ser tal que el soluto no pueda interaccionar con una copia de sí mismo en ninguna de las réplicas, por lo cual debe haber suficiente espesor de disolvente alrededor del soluto en todas direcciones para que la distancia desde cualquier punto de éste hasta cualquiera de sus copias vecinas sea mayor que la distancia límite de corte (cutoff) establecida para el cálculo de las interacciones no enlazantes.
PREPARACIÓN Y EJECUCIÓN DE UNA SIMULACIÓN DE MD
En primer lugar, es necesario establecer una configuración inicial del sistema, que puede provenir de datos experimentales de difracción de rayos X, espectroscopía de RMN, de un modelo teórico o de una combinación de datos experimentales y teóricos.
La asignación de velocidades iniciales a los átomos del sistema, que se ha minimizado previamente mediante MM, se realiza normalmente al azar a partir de una distribución Maxwell-Boltzmann a la temperatura elegida. Finalmente, es preciso mantener fijas algunas de las condiciones de simulación: número de partículas (N), volumen (V), temperatura (T), presión (P) o energía total del sistema (E). En función de sus combinaciones se puede distinguir entre simulaciones microcanónicas (NVE), isotérmico-isobáricas (NPT) y canónicas (NVT) siendo NPT y NVT las más empleadas en MD de proteínas y ácidos nucleicos.
Si se utiliza un formalismo NPT, es necesario ajustar la temperatura y la presión, para lo cual existen distintos métodos. La manera más fácil es aplicar un escalado de velocidades (149) que consiste en multiplicarlas por un factor constante en cada paso de calentamiento. Un método alternativo para mantener la temperatura es acoplar el sistema a un baño térmico externo que se fija a la temperatura deseada (150). El baño actúa como fuente de energía térmica, añadiendo o quitando calor al sistema según sea necesario. Las velocidades se escalan en cada paso en función de la diferencia de temperatura entre el baño y el sistema. Muchos de los métodos usados para el control de la temperatura se emplean también a la hora de controlar la presión. Por lo tanto, la presión puede ser mantenida a un valor constante simplemente mediante un escalado del volumen. Y la alternativa es acoplar el sistema a un “baño de presión” análogo al baño de temperatura.
FASES DE UNA SIMULACIÓN DE MD
Las simulaciones de MD se componen de dos etapas: una fase de equilibrado y una fase de producción. El objetivo del equilibrado es llevar al sistema a un estado de equilibrio a partir de la configuración inicial. Durante esta fase se monitorizan la energía potencial, la temperatura y la densidad hasta que llegan a un valor estable. Una buena técnica para conseguir un equilibrado
óptimo es aplicar restricciones al sistema, liberándolas después lentamente para permitir su adaptación a las condiciones deseadas. Este proceso suele durar entre 200 y 500 picosegundos (ps) aunque en ciertos casos conviene equilibrar el sistema durante varios nanosegundos.
Después de un correcto equilibrado comienza la fase de producción en la que se permite la evolución del sistema, que queda recogida en forma de coordenadas y velocidades. Éstas se almacenan como una trayectoria que será utilizada para el análisis y la obtención de información (Figura 26).
Figura 26: diagrama de flujo de trabajo de una MD.
Cuanto mayor sea el tiempo de simulación, más calidad tendrán los resultados ya que se explorará más espacio conformacional. En general se estima que el tiempo de simulación debería ser al menos 10 veces más largo que la escala temporal del proceso a estudiar. En la práctica esto significa que se tiene que hacer uso de los algoritmos de paralelización y contar con una gran capacidad de almacenamiento en discos. Por ello el uso de supercomputadores ha permitido pasar de simulaciones de 10 ns como máximo a las cada vez más habituales de 1 microsegundo (151-153).
Los resultados que se pueden extraer de la trayectoria de una MD son parámetros que nos darán información acerca de los cambios estructurales que afectan a las moléculas estudiadas. Los comunes a todos los sistemas son las distancias entre átomos, los ángulos, los cambios en torsionales, análisis de la superficie accesible al disolvente (Solvent Accessible Surface Area, SASA), la evolución de las energías y, en el caso de simulaciones de ADN, parámetros helicoidales de esta macromolécula. Pero uno de los parámetros comunes más importantes a la hora de analizar trayectorias de MD es la desviación cuadrática media (Root Mean Square Deviation, RMSD) respecto de una estructura de referencia, que normalmente es, o bien la estructura promedio del colectivo, o bien la estructura de partida. La función que representa la evolución del RMSD con respecto al tiempo es uno de los mejores indicadores del comportamiento global del sistema durante la simulación. Si éste se halla equilibrado, los sucesivos valores del RMSD se mantienen aproximadamente constantes, fluctuando en torno a una o varias conformaciones de equilibrio, de forma que la gráfica de la función será asintótica.
TIPOS DE SIMULACIONES DE MD
El espacio conformacional accesible a las macromoléculas biológicas es enorme y no puede ser cubierto por ninguna de las simulaciones actuales. Los datos experimentales (rayos X, RMN, etc.) indican que las biomoléculas tienden a adoptar conformaciones bastante definidas. Esta información experimental se puede utilizar en una simulación para restringir el espacio conformacional al que puede acceder el sistema, fundamentalmente dificultando la adopción de configuraciones que resultan incompatibles con la información experimental mediante una función de penalización. Cuanto más se aleje de los datos experimentales la configuración simulada del sistema, mayor será el valor de la función de penalización.
Entre los tipos de parámetros que se pueden incorporar para forzar la trayectoria de modo que se satisfaga la información experimental se encuentran:
! Los límites superiores de distancias interatómicas provenientes de medidas NOE (Nuclear Overhauser Effect).
! Los límites para valores que pueden adoptar los ángulos torsionales a partir de datos de acoplamiento J obtenidos por espectroscopía de RMN.
! Las amplitudes de los factores de estructura medidos mediante la difracción de rayos X.
Las simulaciones no se clasifican únicamente en aquéllas con restricciones
(restrained) y sin restricciones (unrestrained). Existen varios tipos de protocolos
empleados en el estudio de sistemas biológicos:
- TEMPLADO SIMULADO (Simulated Annealing) O DINÁMICA MOLECULAR “AMORTIGUADA” (Quenched Molecular Dynamics)
Se realiza una simulación a una temperatura elevada y después se enfría lentamente para llevar el sistema al mínimo local más próximo. La temperatura del sistema no se debe tomar como un valor real; tan solo es un parámetro de control que determina si el sistema puede escapar de ciertos mínimos locales. Este protocolo resulta útil para refinar estructuras procedentes de espectroscopía de RMN o de difracción de rayos X.
- MUESTREO AUMENTADO LOCALMENTE (Locally Enhanced Sampling, LES)
Esta técnica permite aumentar el muestreo de un asa (loop) de una proteína mediante la construcción de múltiples copias de esa región. Las copias no interaccionan entre sí pero interaccionan con el sistema de una forma promediada. Este tipo de protocolo reduce las barreras o las transiciones conformacionales y permite obtener múltiples trayectorias de esta región llevando a cabo una única simulación.
- DINÁMICA MOLECULAR DE INTERACAMBIO DE RÉPLICAS O COPIAS (Replica Exchange Molecular Dynamics, REMD)
Esta técnica es similar a la anterior en cuanto que permite el estudio conformacional exhaustivo de un asa o de una proteína pequeña entera. Se generan varias réplicas de un sistema que no interaccionan entre sí y se simulan a diferentes valores de una determinada variable independiente, que suele ser la temperatura. De esta forma las copias que están “atrapadas” en un mínimo local son capaces de “saltar” a otro mínimo local diferente gracias a los cambios en la temperatura. Para ello el número total de réplicas (N) se simulan en paralelo a diferentes temperaturas, que irán de forma creciente, hasta que la topología de la mitad de éstas (N/2) se intercambia por la topología de sus vecinas y se continúa la simulación bajo las condiciones de estas últimas.
- DINÁMICA MOLECULAR “ACTIVADA”, “SESGADA” (Biased) O GUIADA (Steered)
Mediante la adición de fuerzas externas predeterminadas se reducen las barreras energéticas y se aumenta la probabilidad de obtener configuraciones poco probables de observar en una simulación convencional. Este procedimiento resulta adecuado para estudiar procesos que son intrínsecamente rápidos pero que constituyen acontecimientos raros porque están limitados por una o más barreras de energía.
- FORZADO SOBRE UN MOLDE O PLANTILLA (Template Forcing) O MD DIRIGIDA A UNA ESTRUCTURA DIANA (Targeted Molecular Dynamics)
En este caso se añade un término basado en la desviación cuadrática media, ponderada por la masa, a la función de energía potencial de un conjunto de átomos con respecto a los mismos en una estructura de referencia (el “blanco” o “diana”). En cada paso de MD, el algoritmo realiza un ajuste de mínimos cuadrados para los átomos seleccionados en las dos estructuras. Este método puede resultar idóneo para simular los grandes cambios conformacionales que ocurren en una escala de tiempos de milisegundos.