Study I: Neurorehabilitation Scenario
4.4 Discussions
5.2.1 Data collection and experimental protocol
3.8.1 Edición y alineamiento de las secuencias.
Para el análisis de las secuencias nucleotídicas se utilizó un fragmento de 614 pb, de las regiones C2-V5 de la gp 120 de la envuelta viral. Se intentó conseguir al menos 20 PCR individuales en dilución límite de la región C2-V5 del gen env, sin embargo, no pudimos conseguir 20 PCRs positivas en muchas de las muestras analizadas, debido al bajo número de copias de ADN viral asociado a CMSP presente en la cuasiespecie. Las secuencias nucleotídicas obtenidas por dilución límite fueron inicialmente editadas utilizando el programa SeqMan versión 3.61 (Dnastar Inc, Madison, Wis) y alineadas con el programa CLUSTAL X versión 1.8. Los alineamientos fueron posteriormente editados y corregidos a mano para asegurar un marco correcto de lectura. Toda posición en la que no existe información completa para el conjunto de secuencias que forman el alineamiento, “gaps”, fue excluída en posteriores estudios. Todas las secuencias defectivas que presentaban codones de parada producidos por hipermutación o pérdida de fase, fueron también eliminadas.
3.8.2 Análisis filogenéticos
Para realizar los primeros análisis y a modo de screnning, los árboles filogenéticos se reconstruyeron por el método del vecino más proximo (Neighbor- Joining, NJ), utilizando el programa MEGA 3.0 (Kumar et al., 2001). Las matrices de distancia se calcularon mediante el modelo Kimura-2 parámetros, y la robustez estadística de los árboles generados se probó mediante un remuestreo de 1000 réplicas (“bootstrap”). Una vez analizadas todas las secuencias y excluídas las posibles contaminaciones, los árboles filogenéticos se reconstruyeron por el método de máxima verosimilitud (“Maximun-Likelihood”, ML), utilizando el programa Phyml v 2.4.1 (Guindon et al., 2005). Los parámetros utilizados para la reconstrucción filogenética representan la media ponderada, según los pesos asignados por “Akaike information criterion” (AIC), de todos los valores obtenidos en los posibles modelos de sustitución (Akaike, 1974) en Modeltest 3.6 (Posada and Buckley, 2004; Posada and Crandall, 1998).
La robustez estadística de los árboles generados se probó mediante un remuestreo de 1000 réplicas (“bootstrap”). Para enraizar los árboles, se utilizaron como grupos externos las cepas de referencia HXB2-LAI y el aislado de referencia
3.8.3 Cálculo de las distancias genéticas
Las distancias nucleotídicas fueron estimadas mediante el método de máxima verosimilitud (ML) en el programa PAUP4.0b10, utlizando la media ponderada de los parámetros obtenidos por Modeltest 3.6 (Posada and Crandall, 1998). La heterogeneidad de una cuasiespecie viral, se definió como la distancia genética media entre todas las posibles comparaciones de pares de secuencias obtenidas de una misma muestra. La divergencia de la cuasiespecie se definió como la distancia genética media entre todas las secuencias obtenidas de una misma muestra y el ancestro común más reciente del paciente (ACMR). La divergencia anual, se definió como el incremento medio por año de la distancia genética de las secuencias de la cuasiespecie al ACMR de cada paciente.
3.8.4 Reconstrucción del ancestro común más reciente (ACMR).
El ACMR para todas las secuencias nucleotídicas pertenecientes a un mismo paciente, fue inferido utilizando el programa PAUP4.0b10, a partir del árbol filogenético reconstruido por el método de ML en el programa PhyML, utilizando los modelos de sustitución seleccionados por el programa Modeltest. Este ACMR representa el nodo a partir del cual se originan todas las secuencias nucleotídicas de cada paciente.
3.8.5 Análisis de mutaciones
La proporción de mutaciones sinónimas por sitio sinónimo (dS) y no sinónimas por sitio no sinónimo (dN), así como la diferencia entre dN y dS en secuencias de una misma muestra o de muestras distintas dentro de cada individuo, se calcularon por el método “p-distance” (1000 réplicas) modificado de Nei y Gojobori (Nei and Gojobori, 1986) utilizando el programa MEGA versión 3.0 (Kumar et al., 2001).
3.8.6 Secuencias nucleotídicas utilizadas para la construcción de la curva de datación.
Las secuencias nucleotídicas de la región variable V3 del gen env de 171 muestras españolas del subtipo B del VIH-1 fueron obtenidas en nuestro laboratorio desde 1989 hasta 2003. Las muestras provenían de pacientes homosexuales y usuarios de drogas intravenosas (UDIV) del Centro Sanitario Sandoval, (CAM, Madrid), del Hospital Ramón y Cajal (Madrid) y del Hospital General de Navarra.
A partir del alineamiento de dichas secuencias, se generó una secuencia consenso española (SCEsp) que incluía el nucleótido más frecuente en cada posición como se describió anteriormente (Casado et al., 2000). Al mismo tiempo fue inferido el ACMR de las secuencias españolas analizadas (ACMREsp) como se describe en el apartado 3.8.4.
Las muestras fueron luego agrupadas por su año de aislamiento y las distancias genéticas de cada secuencia a la SCEsp o al ACMREsp fueron estimadas por el método de 2-parámetros de Kimura (apartado 3.8.2) y por el método de máxima verosimilitud (ML). Para estos cálculos de distancia genética se utilizó el programa MEGA 3.0 (Kumar et al., 2001). Por último se representó la distancia genética de cada secuencia nucleotídica (eje de ordenadas), con respecto al año de obtención de la muestra (eje abscisas) (Fig. 4.1). De esta forma se obtuvieron dos ecuaciones de la recta, una respecto a la SCEsp y otra respecto al ACMREsp, con las cuales podíamos estimar el año de una secuencia española conociendo su distancia a la SCEsp o al ACMREsp. Para la datación de las muestras de cada paciente se utilizó la secuencia nucleotídica global.
3.8.7. Análisis de los sitios de N-Glicosilación.
El análisis del número de sitios de N-glicosilación, se realizó en un fragmento de 614 pb de la región C2-V5 del gen env de las secuencias nucleotídicas obtenidas a dilución límite, así como en la proteína gp 160 completa de la envuelta viral,
utilizando el program