4. SYSTEM DEVELOPMENT 52
5.4 Test Using the Test Deck Photographs 76
Las secuencias consenso de nucleótidos en formato fasta, fueron alineadas con secuencias de referencia representativas de todos los genotipos/subtipos confirmados hasta el momento (Smith et al. 2013) con el interfaz SSEv1.1 (Simmonds 2012), usando Muscle v3.8.31 (Edgar 2004) y refinando el alineamiento manualmente. El interfaz SSEv1.1 (editor de secuencias simples) posee una serie de programas bioinformáticos integrados, donde las secuencias pueden ser alineadas, anotadas, clasificadas en grupos y analizadas directamente. SSEv1.1 tiene un editor de secuencias para la creación de alineamientos de secuencias, mediante un proceso asistido por la integración de los programas Clustal y Muscle y la eliminación automatizada de indels. Los resultados se pueden dirigir a los archivos de datos tabulados para su exportación a la hoja de cálculo ó programas de base de datos para su posterior análisis. Las secuencias de referencia representativas de todos los genotipos/subtipos confirmados hasta el momento (Smith et al. 2013) fueron proporcionadas amablemente por el Doctor Peter Simmonds, The Roslin Institute, University of Edinburgh, Reino Unido, y se detallan en Anexo VIII.
3.13.1 Filogenia inter individuo
Como las secuencias de referencia corresponden a genomas completos y las secuencias de las amplificaciones obtenidas en esta tesis son más cortas, las secuencias de referencia se recortan de manera que todas (referencia y aislados estudiados) sean de la misma longitud de nucleótidos en el alineamiento, tanto para la región NS3 como para la región NS5B.
Se generaron ficheros de alineamiento de las secuencias obtenidas de las regiones NS3 y NS5B, de los 60 pacientes incluidos en esta tesis, junto a las secuencias de referencia, y éstos se convirtieron mediante Phylemon 2.0 (Sanchez et al. 2011) (http://phylemon.bioinfo.cipf.es) de formato fasta a formato PHYLIP. La construcción de árboles filogenéticos se realiza por inferencia estadística, para ello se requiere de un modelo de evolución molecular de secuencias con el fin de compensar ó corregir las sustituciones no observadas en las secuencias de estudio pero que pueden haber tenido lugar a lo largo de la filogenia, es decir requiere de un modelo de sustitución de residuos (nt ó aa). Los modelos de sustitución nucleotídica, ó modelos
evolutivos, describen la tasa de cambio de un nt a otro y dado que influye sobre los resultados del análisis filogenético, se debe usar el modelo adecuado. Para inferir un árbol filogenético, hay que buscar el modelo de sustitución que mejor se ajuste a nuestros alineamientos de secuencias de estudio. Para ello utilizamos el software jModeltest mediante Phylemon 2.0 (Sanchez et al. 2011) (http://phylemon.bioinfo.cipf.es), que evalúa el ajuste de los datos a los diferentes modelos mediante pruebas estadísticas, eligiendo el modelo que maximice la verosimilitud. Para la inferencia filogenética también se utilizó el criterio de máxima verosimilitud, basado en el uso de un valor determinado (log-likelihood) que evalúa topologías alternativas del árbol filogenético con el fin de encontrar aquella que maximiza este valor. Este método se define por matrices de sustitución que contienen las tasas relativas de ocurrencia de todos los tipos posibles de sustituciones, y nos permite la inferencia de árboles filogenéticos usando modelos evolutivos complejos, estimando los valores de los parámetros del modelo que den el valor más alto de probabilidad. Existen diversos modelos evolutivos que se distinguen por su grado de parametrización, y pueden incluir tres tipos principales de parámetros: 1) parámetros de frecuencia, 2) parámetros de tasa de sustitución, y 3) parámetros de las tasas de variación entre posiciones. El modelo evolutivo utilizado para la construcción de los árboles filogenéticos en este estudio fue el de los parámetros de las tasas de variación entre posiciones, ya que estos incrementan el ajuste entre los modelos y datos, empleando en conjunción los de frecuencia y tasa. Utiliza la distribución gamma (G) para modelar la heterogeneidad de las tasas de sustitución entre diferentes posiciones de un alineamiento, y el parámetro alfa (α) que controla la forma de la distribución gamma.
Elegido el modelo GTR (general time reversible) de sustitución de nucleótidos, una aproximación de la tasa de heterogeneidad de la distribución gamma (+G) bajo el criterio de máxima verosimilitud, y soporte de bootstrap por rama de 1.000 réplicas se procedió a reconstruir el árbol filogenético mediante el software RAxMLv7.2.6 (Randomized Axelerated Maximum Likelihood) (Stamatakis 2006, Stamatakis et al. 2008), que es un programa para la inferencia secuencial y paralela bajo el criterio de máxima verosimilitud (Felsenstein 1981) sobre la base de grandes árboles filogenéticos, con un coste computacional aceptable. Posteriormente los árboles fueron editados con el
software MEGA5.2 (Tamura et al. 2011) utilizando la herramienta Tree Explorer, y con el software FigTreev1.4.0 (2006-2012, Andrew Rambaut, Institute of Evolutionary Biology, University of Edinburgh http://tree.bio.ed.ac.uk/).
3.13.2 Filogenia intra individuo
Las secuencias consenso de nucleótidos en formato fasta, de la región NS3 y NS5B de los clones moleculares de los 10 pacientes seleccionados para este subanálisis fueron alineadas con secuencias de referencia representativas de todos los genotipos/subtipos confirmados hasta el momento con el interfaz SSEv1 (Simmonds 2012), usando Musclev3.8.31 (Edgar 2004) como se ha descrito anteriormente en el apartado 3.12.
Tras la conversión de los alineamienos en formato fasta a formato PHYLIP mediante Phylemon 2.0 (Sanchez et al. 2011) (http://phylemon.bioinfo.cipf.es), se generaron árboles filogenéticos de la región NS3 y NS5B bajo el criterio de máxima verosimilitud con el programa RAxMLv7.2.6 (Randomized Axelerated Maximum Likelihood) (Stamatakis 2006, Stamatakis et al. 2008) con el modelo GTR (General Time-Reversible) de sustitución de nucleótidos, una aproximación de la tasa de heterogeneidad de la distribución gamma y el soporte de bootstrap por rama de 1.000 réplicas. Los árboles fueron editados como se describió en el apartado 3.12.