Logistic Regression - Data Analysis Techniques

RESEARCH METHODOLOGY

6.12 Data Analysis Techniques

6.12.7 Logistic Regression

Después de orientar y posicionar el modelo de MR en el cristal, comienza el proceso de construcción del modelo atómico o trazado de la nueva estructura. Para ello, se calculan mapas de densidad electrónica a partir de los factores de estructura observados experimentalmente y los parámetros del modelo (posiciones atómicas (x,y,z) y factores B). Estos últimos se utilizan para calcular un primer conjunto de fases aproximadas para la estructura. Los mapas de densidad revelan aquellas regiones donde el modelo inicial no representa correctamente la nueva estructura y que deben ser modificadas.

La corrección sistemática de todos los errores implica la iteración entre una fase de construcción automática o manual mediante el uso de programas gráficos, en la que los átomos del modelo de MR son ajustados a las posiciones indicadas en el mapa de densidad electrónica, y una fase de refinamiento.

El refinamiento es un procedimiento matemático en el que se optimizan los parámetros del modelo (el ajuste del modelo trazado) de acuerdo con los datos experimentales. Para la optimización se aplica una función matemática al conjunto de parámetros a refinar que puede ser de mínimos cuadrados (least-square refinement) o de máxima verosimilitud (maximum likelihood). Salvo en aplicaciones específicas, el refinamiento de estructuras macromoleculares se realiza mediante máxima verosimilitud. Cuando solo se varían la posición y orientación del centro de masas de las proteínas (por ejemplo, un cuerpo rígido por cadena o varios cuerpos rígidos, en el caso de que haya diversos dominios por cadena polipeptídica), pero no la posición de los átomos individualmente, se considera un refinamiento de cuerpo rígido, especialmente útil durante la etapa de MR o en etapas tempranas de la resolución estructural. En el caso de que haya múltiples copias de una proteína en la unidad asimétrica, esta redundancia se puede utilizar en forma de restricciones de simetría no cristalográfica, lo que conlleva una reducción efectiva de los parámetros ajustables.

A lo largo del refinamiento se comparan los factores estructurales calculados a partir del modelo con los factores estructurales experimentales, tendiendo en cada uno de los ciclos a minimizar esas diferencias hasta un mínimo. Dichas diferencias se conceptualizan en los R factors (factores R), el R factor de trabajo o cristalográfico (R-

work) y el R-free. En la figura 3.14 se muestran las ecuaciones de estos dos factores. Para

el cálculo del R-free, se separa una fracción de los datos experimentales (el test set, típicamente 5-10% de todas las reflexiones) que nunca se utilizan para el refinamiento. Con este procedimiento estadístico de validación cruzada se evita introducir sesgos durante el refinamiento y construcción del modelo. En cada ciclo de refinamiento – en

el que se empleó el programa phenix.refine (Afonine et al., 2012) de la suite de programas de cristalografía PHENIX – se hizo un seguimiento del mapa de densidad electrónica con la construcción manual y/o automática del modelo cristalográfico. El modelo cristalográfico se completa con la adición de ligandos/cofactores, moléculas de agua, iones y cualquier otro componente del solvente, de la condición de cristalización y/o del crioprotectante. La posición de estas moléculas se puede hacer automáticamente por los programas de refinamiento, con ajustes manuales posteriores.

Al final del refinamiento es necesario validar la estructura con el fin de garantizar la calidad del modelo obetnido. Para ello, se analiza exhaustivamente las características geométricas y estereoquímicas de la estructura y se corrige cualquier desviación significativa de los valores esperados. Por ejemplo, se analiza que las distancias interatómicas obtenidas y los ángulos de enlace estén dentro de unos criterios aceptables. Las medidas de la desviación de las distancias (en Å) y ángulos (en º) de enlace se calculan mediante la desviación cuadrática media (RMSD, Root-Mean-Square

Deviation) frente a valores de referencia de moléculas pequeñas. También se verifica que

los ángulos de torsión del enlace peptídico (Φ y ψ) sean energéticamente favorables y que no existan choques estéricos. Este tipo de validaciones son fácilmente comprobadas gracias al mapa de Ramachandran, el cual muestra conformaciones estables, así como las prohibidas, de los ángulos de torsión de los distintos aminoácidos, las cuales no podrían ser posibles. En la figura 3.15 se muestra el mapa de Ramachandran, mostrando las combinaciones permitidas y prohibidas de los ángulos Φ y ψ del enlace peptídico. Del mismo modo, los valores de los factores B asociados a cada átomo o grupos de átomos de la estructura deben de presentar valores físicamente aceptables.

Figura 3.14. Expresión matemática de los R-factors (R-work y R-free). R representa el R-

factor, mientras que Fhkl es el factor de estructura para las reflexiones hkl, parámetro que

describe como la materia dispersa la radiación indicente (rayos-X en nuestro caso). Se estima en base a las reflexiones observadas (obs) y calculadas (calc).

Estos valores por lo general son menores en las zonas internas de la proteína y mayores en las zonas externas, donde existe un contacto directo con el solvente (Drenth, 2007).

Figura 3.15. Mapa de Ramachandran mostrando las combinaciones permitidas y prohibidas de Φ (Phi) y ψ (Psi) en el enlace peptídico. No todas las combinaciones de los

ángulos son permitidas (estructura derecha), debido a la colisión estérica. Las zonas más favorables se muestran en verde oscuro. Las zonas que se encuentran al límite de la permisividad se muestran en verde claro. Imagen extraída de Berg et al., 2002.

In document An empirical investigation of telephony impact on business performance and regional development: evidence from small businesses in Nigeria. (Page 188-191)