• No results found

CHAPTER 4: DISCUSSION

4.3 Implications

La enfermedad de Chagas (tripanosomiasis americana) causada por el parásito

Trypanosoma cruzi, afecta a millones de personas en Latino-América, lo que causa importantes problemas sanitarios, económicos y sociales para los países afectados. Está considerada como una de las enfermedades parasitarias tropicales más importantes del mundo, junto con la malaria y la esquistosomiasis. Las enfermedades tropicales se encuentran dentro de lo que la Organización Mundial de la Salud (OMS) denomina “enfermedades olvidadas”, pues causan baja mortalidad (con excepción del paludismo) aunque alta morbilidad, su tratamiento es costoso, ineficaz o inexistente, no son propias del mundo occidental y no son de interés para la industria farmacéutica. También podríamos llamar a la enfermedad de Chagas, la “enfermedad silenciosa”, por sus escasas manifestaciones clínicas, que hacen que la infección se propague, tanto por el aumento de inmigrantes procedentes de zonas endémicas como por la importación de esta enfermedad por personas que eligen destinos exóticos para sus vacaciones.

La base de datos analizada está formada por 1237 moléculas de amplia variedad estructural evaluadas en la base de datos Trypanosoma cruzi (658 activas y 579 inactivas) recopiladas mediante búsqueda bibliográfica, utilizando diversas fuentes como son las tesis doctorales desarrolladas en el Departamento de Parasitología de la Universidad Complutense de Madrid, en el campo de la quimioterapia experimental para el tratamiento de la Enfermedad de Chagas, datos de actividad reportados en artículos científicos, así como recogidos en la base de datos de DNDi (Drug for Neglected Diseases Iniciative). Mediante análisis de conjuntos, la base de datos se dividió en 20 conjuntos o grupos en función de su variedad estructural, a partir de los cuales se retiró de manera aleatoria el 25% de las moléculas que forman parte de la serie de predicción (SP). Ambas series (Serie

de entrenamiento (SE) y serie de predicción (SP)) están constituidas por moléculas activas e inactivas.

Una vez definidas la SE y la SP, se obtuvieron los descriptores moleculares (DM) a partir del software TOMOCOMD – CARDD (Marrero-Ponce et al. 2005). En este caso, los DM calculados fueron de índice lineal, basados en relaciones entre átomos, correspondientes a las matrices: no estocástica (modelos 1-11), estocástica (modelos 12-22), doble estocástica (modelos 23-33) y de probabilidad mutual (modelos 34-44), total y local considerando y no considerando hidrógeno (H), para las 10 propiedades atómicas que implementa el software TOMOCOMD – CARDD (masa atómica, electronegatividad, polarizabilidad, fuerza de Van der Waals (VdW), logP, carga, hardness, PSA, refractividad y softness). El modelo 45 (general) se procesó teniendo en cuenta las variables seleccionadas en cada una de las matrices. A partir de los DM así calculados y mediante análisis discriminante lineal (software STATISTICA v.10) se confeccionaron 45 modelos QSAR de predicción de actividad que forman parte del presente estudio. La base de datos de Trypanosoma cruzi, así como los modelos QSAR de predicción de actividad, forman parte de un proyecto de tesis doctoral, que será presentado también en la Universidad Complutense de Madrid.

Resultados y discusión

Se utilizaron los 45 modelos QSAR para la identificación de compuestos antichagásicos en la construcción del fichero de entrada. La diferencia de las probabilidades (ΔP) de las salidas individuales de cada modelo (variable “y” o probabilidad de que pertenezca a una clase o a la otra) fue utilizada como variable de entrada al software DASDE. La serie de entrenamiento (SE) consta de 929 casos, de los cuales 527 son activos y los 402 restantes inactivos. La serie de predicción (SP) cuenta con 308 compuestos, de ellos 131 inactivos y 177 activos.

A los 45 clasificadores individuales introducidos en el software se les calcularon las medidas de diversidad: Desacuerdo (D), Doble Falta (DF), Coeficiente de correlación, Estadístico Q, Varianza de Kohavi-Wolpert y Medida de Dificultad, obteniéndose los modelos más diversos a través del resultado de la aplicación de la meta heurística para obtener las combinaciones diversas:

1. Modelos más diversos, seleccionando en total 8 modelos: 11, 22, 32, 39, 40, 42, 43, 45.

La figura 7 muestra los valores estadísticos de los modelos más diversos suegún las medidas de diversidad

Figura 7 Valores estadísticos de los modelos más diversos

Luego de tener el conjunto anterior de clasificadores diversos se aplica la meta heurística nuevamente para obtener las combinaciones de ellos que superan la mejor exactitud individual. A cada una de estas combinaciones se le aplicaron las diferentes reglas de combinación para las salidas de los clasificadores.

En la Tabla 5 se muestra la relación de los mejores modelos combinados y las estadísticas correspondientes a cada uno de ellos, señalando aquellos que presentan una exactitud mayor que 92.3% y RFA menor que 8.71, superando estos valores las estadísticas del mejor clasificador individual. El mejor resultado se obtuvo en la primera selección correspondiente a las combinaciones de los modelos 11, 22 y 45 según las reglas de Voto mayoritario y Mediana.

Model Matthews´ C Exactitud Sensibilidad Especificidad RFA

11_22_39_Vote(V) 84.64 92.47 93.55 91.04 8.96 11_22_45_Vote(V) 84.46 92.36 92.79 91.79 8.21 11_22_39_42_45_Vote(V) 84.85 92.57 93.93 90.08 9.2 22_45_Avg(A) 84.01 92.14 92.79 91.29 8.71 11_22_45_Avg(A) 84.22 92.25 92.98 91.29 8.71 11_39_40_45_Avg(A) 84.41 92.36 93.93 90.3 9.7

11_22_32_40_45_Avg(A) 83.99 92.14 93.17 90.8 9.2 22_45_Max(X) 84.01 92.14 92.79 91.29 8.71 22_32_45_Max(X) 83.56 91.93 92.79 90.08 9.2 22_32_40_45_Max(X) 83.75 92.03 93.74 89.8 10.2 11_45_Min(N) 83.77 92.03 93.17 90.55 9.45 11_22_45_Min(N) 83.1 91.71 92.98 90.05 9.95 11_22_39_45_Min(N) 71.4 86.01 39.37 81.59 18.41 22_45_Med(M) 84.01 92.14 92.79 91.29 8.71 11_22_39_Med(M) 84.64 92.47 93.55 91.04 8.96 11_22_45_Med(M) 84.46 92.36 92.79 91.79 8.21 11_22_39_43_Med(M) 84.63 92.47 94.12 90.3 9.7 11_22_39_42_45_Med(M) 84.85 92.57 93.93 90.08 9.2 11_22_39_40_42_45_Med(M) 84.63 92.47 94.12 90.3 9.7

Tabla 5 Resultados para los modelos más diversos

Se puede observar en la Tabla anterior que los mejores resultados se obtienen en las combinaciones que tienen clasificadores individuales relativamente buenos. Además todos los parámetros estadísticos obtenidos en la mejor combinación superan a las obtenidas con el mejor modelo individual (modelo 45 con Matthews´ C 83.8, Sensibilidad 92.6, Especificidad 91.29, RFA 8.71).

En la ¡Error! No se encuentra el origen de la referencia.Figura 8 se puede observar el comportamiento en relación a la exactitud y la RFA de los mejores modelos ensamblado por cada una de las reglas.

Figura 8 Mejores resultados de los mejores modelos ensamblados

Related documents