5.4 Multi-biometric score coherence
7.1.3 Face reference from video
Cuatro prote´ınas del grupoAGC(1CDK, 1O6L, 1OMW, 1H1W) se seleccionaron para modificar sus coordenadas y verificar la robustez del m ´etodo con las representaciones
Figura 28: Extracci ´on de caracter´ısticas y almacenamiento de un tetraedro que conforma parte de la triangulaci ´on 3D de una cavidad. Los identificadores de las interacciones son: AC (enlace de hidr ´ogeno receptor) y AL (alif ´atica hidrof ´obica); mientras que Q1, Q2 y Q3 representan los invarian- tes del tetraedro.
de tetraedros y tri ´angulos del envolvente convexo. Cada una de estas prote´ınas se con- sider ´o como la estructura representativa de un grupo hipot ´etico al que pertenecen otras dos estructuras derivadas de ellas. La informaci ´on detallada se muestra en la Tabla 13. Tabla 13: Conjunto de estructuras utilizadas en la prueba de concepto. Las prote´ınas derivadas se obtuvieron al aplicarles las transformaciones afines de rotaci ´on y traslaci ´on.
Id. Prote´ına Nombre Rotaci ´on Traslaci ´on en ˚A (α, β, γ) (∆x,∆y,∆z) 1 1CDK (0,0,0) (0,0,0) 2 1CDK R1 (π/4,−π/2,0) (0,0,0) 3 1CDK R2 (π/4,0,−π/2) (3,−4,5) 4 1O6L (0,0,0) (0,0,0) 5 1O6L R1 (0,−π/4,0) (−3,12,−6) 6 1O6L R2 (−π/4,0,−π/2) (0,12,0) 7 1OMW (0,0,0) (0,0,0) 8 1OMW R1 (0,0,0) (4,12,−3) 9 1OMW R2 (π/2, π/2, π/2) (0,0,−3) 10 1H1W (0,0,0) (0,0,0) 11 1H1W R1 (0, π/3,0) (4,12,−3) 12 1H1W R2 (0,−π/3,0) (4,12,−3)
La divisi ´onDde cada eje del cubo hash fue igual a 12, tambi ´en se utiliz ´o un factor de escalamientoρigual a 100 para minimizar los errores por redondeo en los c ´alculos de las invariantes. Dos niveles de ruido proveniente de una distribuci ´on uniforme se agregaron a las estructuras para evaluar la respuesta del m ´etodo. El primero tuvo un intervalo de [-0.1 a 0.1] ˚A y el segundo de [-0.5 a 0.5] ˚A. Los resultados de estos experimentos mostraron una adecuada separaci ´on de grupos con el primer nivel de ruido a ˜nadido, pero casi nula con el segundo nivel, en especial con la representaci ´on de tri ´angulos obtenidos de los envolventes convexos de los tetraedros (ver Figura 29).
4.2.3. Resultados y discusi ´on
La Figura 30 muestra la matriz de similitudMSCav. Se distingue al grupoCMGCcomo aquel que presenta los valores m ´as altos de similitud entre sus miembros, pero el que presenta valores m ´as homog ´eneos es el grupo AGC al igual que el grupo AK, aunque este ´ultimo s ´olo tiene dos elementos. En contraste, en el grupoTKno hay un predominio claro de valores en alg ´un intervalo. Es notable que la prote´ına 1B6C tiene similitudes con valores altos con todas las dem ´as prote´ınas, pero esta relaci ´on no es transitiva. La causa de este comportamiento radica en que la cantidad de residuos en la cavidad mayor de 1B6C es significativamente mayor que en todas las dem ´as cavidades mayores de las otras prote´ınas (ver Tabla 10), y por lo tanto haya m ´as tetraedros coincidentes y la m ´etrica de la Ecuaci ´on 11 se incremente.
La Figura 31 muestra los diez tetraedros y tri ´angulos con mayor frecuencia sobre todo el conjunto de prueba, de acuerdo a sus interacciones moleculares. Los pseudocentros con propiedades alif ´aticas (AL) y receptoras (AC) son predominantes en las combinaciones que forman las etiquetas de estos tetraedros y tri ´angulos.
En esta secci ´on se propuso un m ´etodo de caracterizaci ´on geom ´etrica y f´ısico-qu´ımica de estructuras terciarias para comparar pares de cavidades mayores del grupo de prueba formado por prote´ınas de la superfamilia de las cinasas. En la representaci ´on de la matriz de similitudMSCav no se distingue una divisi ´on clara entre las prote´ınas que pertenecen al mismo grupo funcional. Algunas de las razones por las que el m ´etodo no logra los resultados esperados se enuncian a continuaci ´on:
Figura 29: Matrices de semejanza de las estructuras de la Tabla 13 para prueba de concepto.
1. A menudo, los tetraedros y tri ´angulos que conformaron los seccionamientos de las cavidades y sus envolventes convexos, respectivamente, no contienen todos los pseudocentros asociados a los residuos catal´ıticos, es decir, los residuos catal´ıticos quedan dispersos en diferentes tetraedros o quedan dentro del envolvente convexo
Figura 30: Matriz de similitudMSCavobtenida con el m ´etodo de comparaci ´on de tetraedros para las cavidades mayores de las prote´ınas del grupo de prueba (ver Tabla 9).
de la cavidad, el cual est ´a formado por tri ´angulos. Aunque geom ´etricamente la trian- gulaci ´on 3D de Delauny ofrece caracter´ısticas deseables para la caracterizaci ´on y comparaci ´on de cavidades, ´esta pocas veces result ´o en tetraedros que agruparon los puntos relacionados con la actividad catal´ıtica de la cavidad. Adem ´as, frecuen- temente el algoritmo cre ´o tetraedros cuyos v ´ertices ten´ıan una separaci ´on mayor a la que tienen los residuos catal´ıticos.
2. La diversidad en la forma de las cavidades hace que el m ´etodo no detecte adecua- damente regularidades en los tetraedros que se adaptan a la cavidad.
3. La actividad catal´ıtica de algunas prote´ınas se presentan a menudo en sus cavida- des tanto superficiales como internas, en ellas se han identificado residuos con una interacci ´on evidente como la tr´ıada Ser/His/Asp; sin embargo, hay agrupaciones cu-
Figura 31: Proporci ´on de tetraedros y tri ´angulos en el conjunto de prueba utilizado en el m ´etodo de caracterizaci ´on y clasificaci ´on propuesto. La proporci ´on est ´a dada con base en sus propiedades de interacci ´on molecular. (A) Proporci ´on por tri ´angulos. (B) Proporci ´on por tetraedros.
yos residuos aparentemente no tienen un papel clave, pero las cavidades a las que pertenecen los requieren para sus actividades funcionales, tal es el caso de algunas aminopeptidasas o N-acetiltransferasas (Binkowski y Joachimiak, 2008).
4. A pesar de que se redujo la regi ´on a caracterizar, el conjunto de residuos claves en la funci ´on que realiza la prote´ına puede estar distribuido en m ´as de una cavidad.
Pese a que el m ´etodo propuesto no logr ´o agrupar correctamente las prote´ınas del conjunto de prueba en sus grupos funcionales; el principio de conservaci ´on de residuos catal´ıticos ante la presi ´on evolutiva, proporciona una base eficaz para seguir desarrollan- do m ´etodos para la predecici ´on de funciones. Un algoritmo reciente, denominado TIPSA (Triangulation-based Iterative-closest-point for Protein Surface Alignment) (Leif y Jinfeng, 2012), incorpora una b ´usqueda de tetraedros similares entre dos sitios catal´ıticos, carac- terizados mediante una triangulaci ´on de Delaunay en 3D. Este m ´etodo usa el algoritmo H ´ungaro para hallar ´atomos coincidentes que se almacenan como patrones para pos- teriormente hacer comparaciones con regiones de prote´ınas de consulta. El algoritmo alcanz ´o un rendimiento comparable al de los mejores m ´etodos en la literatura, adem ´as de que proporciona el conjunto de ´atomos comunes de forma jer ´arquica. A diferencia del m ´etodo propuesto, el algoritmo TIPSA primero hace un alineamiento de la estructura terciaria de forma global y posteriormente alinea iterativamente los ´atomos de las cavida- des (enfoque local) para generar pseudocentros que representan los residuos con mayor conservaci ´on, esto le da una ventaja sustancial sobre el m ´etodo que se desarroll ´o en el presente proyecto.