Methodologies and data

Los 521 genes cuyas betas son superiores a 1,4 y, al menos, en 9 muestras están fuera del intervalo (Mediana - 1.7 Desviaciones típicas, Mediana + 1.7 Desviaciones típicas) representan el 3,5280% del conjunto de datos, tal y como puede verse en la siguiente tabla.

Imagen 3.35. Fuente: elaboración propia.

Esto significa que el conjunto de formado por los 521 genes explican el 5,759% de la variabilidad en las muestras tumorales. Si todos los genes contribuyeran de manera alícuota a la variabilidad total del tumor, el porcentaje que le correspondería a cada gen sería del 0,006320% y al grupo de los 521 genes sería del 3,5280%. Como puede apreciarse, el valor de esta selección de genes es 1,66672 veces más.

En cambio, estos mismos genes explican el 1,6422% de la variabilidad de las muestras de control 0,46535 veces de lo que explicarían un grupo de 521 genes si la variabilidad se repartiera, como hemos dicho anteriormente, de manera alícuota entre todos los genes de las muestras. Es decir, estos 521 genes explican 3,5288 veces más la variabilidad media en las muestras tumorales que en las muestras de control.

Si los datos iniciales que nos proporciona el Hospital los ordenamos en

función del sumatorio de cada muestra63 obtenemos una distribución de las

muestras en cuanto a su variabilidad, considerando los 14.764 genes. Como puede observarse en la imagen 3.35 las muestras de los controles quedan todas a la izquierda. Esto verifica la hipótesis inicial: cuánto menos variabilidad tengan las muestras mejor.

Se calcula el valor absoluto de cada uno de los genes para evitar que las variabilidades positivas se anulen con las variabilidades negativas. Finalmente se suma el valor absoluto de

Imagen 3.36. En la tabla “VALORES ABSOLUTOS ORDENADOS” puede observarse como quedan ordenadas las muestras teniendo en cuenta la variabilidad de todos los genes. Los controles, cuyo identificador aparece en azul, son los que menos variabilidad presentan y están situados a la izquierda de la tabla.

Fuente: elaboración propia.

Al realizar el mismo proceso una vez se tienen los 521 se obtiene una distribución muy similar a la inicial; lo que indica que los genes seleccionados son representativos del total de genes ya que la muestra escogida distribuye al conjunto de datos como lo hace toda la población (los 14764 genes).

Imagen 3.37. En la tabla “521 GENES ORDENADA” puede observarse como quedan ordenadas las muestras teniendo en cuenta, únicamente, la variabilidad de los 521 genes. Los controles, cuyo identificador aparece en azul, son los que menos variabilidad presentan y están situados a la izquierda de la tabla.

Fuente: elaboración propia.

El laboratorio, utilizando sus propios algoritmos para el filtrado de genes en microarryas en el área de la bioinformática obtiene una selección de genes

de 1722 que ha sido publicada y validada64.

De los 521 genes obtenidos en este estudio, 306 genes coinciden con los genes seleccionados por el grupo de la Dra. Perez-Villamil, lo que representa, aproximadamente, el 60% de los genes.

Imagen 3.38. Gráfico que muestra el número de genes que comparten ambos estudios. El gráfico rojo corresponde con los genes del grupo de la Dra. Pérez-Villamil y el gráfico azul son los genes obtenidos en el estudio de esta Tesis65.

Fuente: elaboración propia.

Al realizar la asociación de genes mediante relaciones jerárquicas para agrupar los subtipos de cáncer de colon en grupos, en función de la expresión de los 521 genes, se han obtenido 6 cluster para los siguientes subtipos de cáncer de colon:

 Grupo 1: cáncer colorectal que presenta bajo nivel de estroma.

 Grupo 2: cáncer colorectal relacionado con inmunoglobinas (no se ha podido aún corroborar)

 Grupo 3: cáncer colorectal que presenta alto en de estroma.

 Grupo 4: cáncer colorectal inestable mucionoso.

Se ha obtenido la siguiente agrupación, mostrada en las imágenes 3.39 y 3.40.

Imagen 3.39. Gráfico del cluster de los 521 genes. Fuente: elaboración propia.

En la Imagen 3.40 observamos los 6 cluster con diferentes colores.

Imagen 3.40. Gráfico del cluster Fuente: elaboración propia.

Imagen 3.41. Sección de la imagen del cluster. Fuente: elaboración propia.

Las filas: Condition e ID de la anterior imagen nos indican la referencia con las que se han nombrado a las muestras. La fila Normal & Tumor indica si la muestra es normal o tumoral (Color azul tumoral, color rojo normal). La fila Grupos BRB recoge la información referente al subtipo de cáncer (el grupo 1 es el color rojo, grupo 2 color azul, grupo 3 color marrón y grupo 4 color gris). La fila k-ras mut revela si el gen k-ras presenta mutación y el tipo de ésta.

Como puede observarse en la Imagen 3.42, el clúster de color verde calsifica por completo al subgrupo 1 de cáncer colorrecta, el que presenta bajos niveles de estroma. El clúster de color azul clasifica al subtipo 2, cáncer colorrectal relacionado con las inmunoglobinas. El clúster de color rojo clasifica al subtipo 3, cáncer colorectal que presenta alto en de estroma.Finalmente, el clúster de color amarillo clasifica al subtipo 4, cáncer de colon inestable mucinoso

Imagen 3.42: Gráfico del clustering efectuado. Fuente: elaboración propia.

Al incluir las muestras normales en el cluster obtenemos lo siguiente:

Imagen 3.42. Imagen del cluster incluyendo las muestras normales. Fuente: elaboración propia.

Imagen 3.43. Imagen del cluster incluyendo las muestras normales. Fuente: elaboración propia.

Como puede apreciarse en las filas Tumor & Normal de las imágenes 3.42 y 3.43 todas las muestras normales, como era de esperar, quedan agrupadas bajo un mismo cluster (color amarillo oscuro en la Imagen 3.43.).

CAPÍTULO

IV.

CONCLUSIONES,

IMPLICACIONES

Y