• No results found

IMPAIRMENTS

In document Inside this report: Strategic report (Page 143-145)

Scope of the audit of the financial statements

98,986 95,570 Current assets

5. IMPAIRMENTS

A continuación varios métodos evolutivos serán presentados cronológicamente (Carballido, Gallo, Dussaut, & Ponzoni, 2015). En todos los algoritmos, los individuos representan biclusters.

Métodos basados en MSR

En Bleuler et al.(Bleuler, Prelic, & Zitzler, 2004), los autores presentan el primer método que aborda biclustering de microarrays por medio de un algoritmo evolutivo. Se adopta una representación binaria de los individuos, y se utiliza mutación independiente y cruzamiento uniforme. Cada individuo representa un bicluster𝐵, representado con una cadena binaria de longitud 𝐼 + 𝐽(donde 𝐼 denota el número de genes y 𝐽 el número de condiciones). Un 1 en la cadena significa que el valor correspondiente se ha seleccionado para el bicluster. La función de aptitud 𝐹se minimiza y se define en casos como sigue:

𝐹(𝐵) =

{

1

|𝐼||𝐽|,

𝑀𝑆𝑅(𝐵) ≤ 𝛿

𝑀𝑆𝑅(𝐵)

𝛿

,

𝑀𝑆𝑅(𝐵) > 𝛿

Para la primera situación un mejor valor de aptitud, calculado utilizando sólo el tamaño del bicluster, se asigna a aquellos individuos que cumplen con la restricción de residuo. Si el bicluster tiene un residuo encima de un umbral dado, entonces se asigna un valor mayor que 1.

65 Diversas variantes fueron presentadas en este trabajo. Se analizan el uso de un Algoritmo Evolutivo (EA por sus siglas en inglés Evolutionary Algorithm) con un solo objetivo, un EA combinado con una búsqueda local (LS por sus siglas en inglés Local Search) (Cheng & Church, 2000) y la estrategia de LS únicamente. En el caso del EA, una novedad de la estrategia consiste en una forma de mantener la diversidad que se puede aplicar durante el procedimiento de selección. Para el caso de la EA hibridado con una estrategia de LS, consideran si el nuevo individuo producido por el procedimiento LS debe sustituir a la persona original, (enfoque de Lamarck) o no (enfoque baldwiniana). En cuanto a la LS como una estrategia independiente, proponen un método no-determinista, donde la decisión se toma en el curso de la ejecución de acuerdo con alguna probabilidad.

Otro enfoque, llamado SEBIpor sus siglas en inglés Secuencial Evolutive Biclustering, fue propuesto por Divina y Aguilar-Ruiz (Divina & Aguilar-Ruiz, 2006). En este trabajo, se presenta un EA donde los individuos(biclusters) también se representan por medio de cadenas binarias. La idea principal es que el EA se ejecuta secuencialmente varias veces. De cada ejecución, el EA obtiene el mejor bicluster de acuerdo a su tamaño, la varianza por fila y factores de solapamiento. Si su MSR es inferior a un umbral dado, entonces el bicluster se añade a un archivo que ellos llaman Resultados. Siempre que este es el caso, el método sigue la pista de los elementos del bicluster con el fin de utilizar esta información para reducir al mínimo la superposición durante la siguiente ejecución de la EA. Utilizan el método de torneo para la selección y se llevan a cabo varias opciones para los operadores de recombinación. La función de aptitud combina los objetivos antes mencionados por medio de una función de agregación no-Pareto para ser minimizados como sigue:

𝐹(𝐵) = 𝑀𝑆𝑅(𝐵)

𝛿

+

1

66 donde:

𝑤

𝑑

= 𝑤

𝑣

(𝑤

𝑟

|𝐼|𝛿

+ 𝑤

𝑐

|𝐽|𝛿

)

teniendo 𝑤𝑣, 𝑤𝑟 y 𝑤𝑐como pesos en volumen, número de filas y número de columnas en el

bicluster 𝐵, respectivamente. Además

𝑝𝑒𝑛𝑎𝑙𝑖𝑧𝑎𝑐𝑖ó𝑛 = ∑ 𝑤

𝑝

(𝑚

𝑖𝑗

)

𝑖∈𝐼,𝑗∈𝐽

donde 𝑤𝑝(𝑚𝑖𝑗) es un peso asociado con cada elemento 𝑚𝑖𝑗 del bicluster y se define como:

𝑤

𝑝

(𝑚

𝑖𝑗

) = {

0,

𝑠𝑖|𝐶𝑂𝑉(𝑚

𝑖𝑗

)| = 0

𝑒

−|𝐶𝑂𝑉(𝑚𝑘𝑙)|

𝑘∈𝐼,𝑙∈𝐽

𝑒

−|𝐶𝑂𝑉(𝑚𝑖𝑗)|

,

𝑠𝑖 |𝐶𝑂𝑉(𝑚

𝑖𝑗

)| > 0

Aquí, |𝐶𝑂𝑉(𝑚𝑖𝑗)| denota el número de biclusters que contienen 𝑚𝑖𝑗. Es importante tener

en cuenta que el peso 𝑤𝑝(𝑚𝑖𝑗) se utiliza para controlar el nivel de solapamiento entre los

biclusters.

Más tarde, Mitra y Banka(Mitra & Banka, 2006) presentaron un Algoritmo Evolutivo Multiobjetivo (MOEA por sus siglas en inglés, Multi-Objective Evolutionary Algorithm) combinado con una estrategia LS (Cheng & Church, 2000). Este método constituye el primer enfoque que implementa un MOEA basado en la dominancia de Pareto para este problema. Los autores basan su trabajo en el NSGA-II (Deb, Pratap, Agarwal, & Meyarivan, 2002), y buscan biclusters con el máximo tamaño y homogeneidad. La representación del

67 individuo es la misma que en los métodos previamente introducidos; utiliza cruce de un solo punto uniforme, mutación de un solo bit y selección por torneo. La estrategia de LS se aplica a todos los individuos con un enfoque lamarquiano sugerido al comienzo de cada lazo generacional.

El BiHEA(Gallo, Carballido, & Ponzoni, 2009) es un EA combinado con una técnica de LS basado en el procedimiento de Cheng y Church (Cheng & Church, 2000), para orientar así la exploración y acelerar la convergencia del algoritmo evolutivo mediante el refinamiento de los cromosomas. La novedad del método de Gallo es que dos mecanismos adicionales se incorporaron en el proceso evolutivo con el fin de evitar la pérdida de buenas soluciones: un procedimiento de elitismo que mantiene los mejores biclusters, así como la diversidad en el espacio genotípico a través de las generaciones, y un proceso de recuperación que extrae las mejores soluciones de cada generación y las copia en un archivo. Este archivo es en realidad el conjunto de biclusters devueltos por el algoritmo. Aunque estos dos mecanismos parecen ser similares entre sí, hay varias diferencias entre ellos. El procedimiento elitista selecciona los mejores biclusters que no se superponen en un cierto umbral, para pasar a la siguiente generación. Estas soluciones pueden ser parte del proceso de selección de las generaciones posteriores permitiendo así la producción de nuevas soluciones basadas en estos por medio del operador de recombinación. Sin embargo, debido a las imperfecciones en el proceso de selección y de la función de aptitud, algunas buenas soluciones pueden estar siendo descartadas a través de las generaciones. Para hacer frente a este problema, se incorpora el archivo, que mantiene los mejores biclusters generados a través de todo el proceso evolutivo. Es importante remarcar que esta "meta" población no es parte del proceso de selección, es decir, la evolución de la población después de cada generación se controla por el proceso de recuperación sin interferir en el proceso evolutivo. En cuanto a la función de aptitud, optimiza los siguientes objetivos:

68 Maximizar

𝑔(𝐺, 𝐶) = |𝐺||𝐶|

𝑘(𝐺, 𝐶) = ∑

𝑔∈𝐺,𝑐∈𝐶

|𝐺||𝐶|(𝑒

𝑔𝑐

− 𝑒

𝑔𝐶

)

2 sujeto a

ℎ(𝐺, 𝐶) ≤ 𝛿

con (𝐺, 𝐶) ∈ 𝑋, 𝑋 = 2{1…𝑚}𝑥2{1…𝑛}siendo el conjunto de todos los biclusters, donde

ℎ(𝐺, 𝐶) =

|𝐺||𝐶|1

∑ (𝑒

𝑔𝑐

− 𝑒

𝑔𝐶

− 𝑒

𝐺𝑐

+ 𝑒

𝐺𝐶

)

2

𝑔∈𝐺,𝑐∈𝐶 es el residuo cuadrado promedio (𝑀𝑆𝑅), y

𝑒

𝑔𝐶

=

|𝐶|1

∑ 𝑒

𝑔𝑐

𝑐∈𝐶

, 𝑒

𝐺𝑐

= |𝐺|1

∑ 𝑒

𝑔𝑐

𝑔∈𝐺

son la media por columna y los valores de expresión medios de (𝐺, 𝐶), y

𝑒

𝐺𝐶

=

1

|𝐺||𝐶|

∑ 𝑒

𝑔𝑐

𝑔∈𝐺,𝑐∈𝐶

es el valor promedio de expresión sobre todas las celdas que están contenidas en el bicluster(𝐺, 𝐶). El umbral definido por el usuario 𝛿 > 0 representa la disimilitud máxima permitida dentro de las células de un bicluster. En otras palabras, el residuo cuantifica la

69 diferencia entre el valor real de un elemento y su valor esperado como se predijo para el correspondiente promedio por fila, promedio por columna, y promedio del bicluster. Otro enfoque evolutivo, denominado GABI(por sus siglas en inglés, Genetic Algorithm Biclustering), se introdujo en Mukhopadhyay et al. (Mukhopadhyay, Maulik, & Bandyopadhyay, 2008). La principal diferencia con el resto de los algoritmos está en la representación de los biclusters. Aquí, cada cadena tiene dos partes, una para la agrupación de los genes y otra para la agrupación de las condiciones. Al igual que en los otros métodos, la función de aptitud utiliza MSR. En este caso, el cálculo se realiza de la siguiente manera:

𝐹(𝐵) =

𝑀𝑆𝑅(𝐵)

𝛿 ∗ (1 + 𝑉𝐴𝑅(𝐵))

Recientemente, en Joung et al. (Joung, Kim, Shin, & Zhang, 2012) presentó un nuevo algoritmo evolutivo probabilístico, llamado PCOBA(por sus siglas en inglés Probabilistic Coevolutionary Biclustering Algorithm). La novedad de este método consiste en el uso de la información estadística global de las dos poblaciones de cooperación, de modo que la capacidad de buscar biclusters es más eficaz. La idea principal es que la estrategia co- evoluciona las dos poblaciones de biclusters para un conjunto de genes y un conjunto condiciones, y se adaptan cooperativamente entre ellos. La función de aptitud tiene por objeto reducir al mínimo el MSR, mientras que busca maximizar la varianza y el volumen del bicluster. Además, la aptitud de un individuo está determinada por el grado de cooperación entre éste y los individuos de la otra población.

70

Métodos basados en VE

El método propuesto en Pontes et al.(Pontes, Divina, Giráldez, & Aguilar-Ruiz, 2007)es un método novedoso que mejora el rendimiento de SEBI mediante la variación de la función de aptitud. La estrategia implementa la función objetivo usando la métrica de error virtual como sigue:

𝐹(𝐵) = 𝑉𝐸(𝐵) + 𝑤

𝑑

+ 𝑝𝑒𝑛𝑎𝑙𝑖𝑧𝑎𝑐𝑖ó𝑛

En este caso, 𝑤𝑑 y la penalización son los definidos previamente para el algoritmo de SEBI.

Esta función de aptitud también tiene que ser minimizada. El resto del algoritmo se implementa de manera similar.

Métodos basados en VET

En Pontes et al. (Pontes, Divina, Giráldez, & Aguilar-Ruiz, 2013) se presenta el Evo-Bexpa

(Evolutionary Biclustering based in Expression Patterns) que constituye el primer método biclustering en el que varios atributos de los biclusters pueden ser particularizado en términos de diferentes objetivos, de esta forma se pueden encontrar biclusters que presentan patrones de escalamiento y corrimiento (Aguilar-Ruiz, 2005)(Zhao, Liew, Wang, & Yan, 2012) simultáneamente.

Cuatro objetivos diferentes fueron individualizados en este enfoque, la medida en que un bicluster sigue un patrón de correlación perfecto, su tamaño, el nivel de solapamiento entre las diferentes soluciones y la varianza promedio. Los objetivos son considerados por

71 medio de la construcción de una función objetivo de agregación. Entonces, es posible especificar la influencia relativa de cada uno durante el proceso de evaluación, permitiendo así que el algoritmo sea configurable. En cuanto al primer objetivo, el VET se calcula como se explicó anteriormente. En las siguientes líneas, se describirán los otros tres términos. En cuanto al volumen de bicluster, se define como sigue:

𝑉𝑜𝑙(𝐵) = (

−𝑙𝑛|𝐼|

𝑙𝑛|𝐼| + 𝑤

𝑔

) + (

−𝑙𝑛|𝐽|

𝑙𝑛|𝐽| + 𝑤

𝑐

)

donde |𝐼|, |𝐽|, 𝑤𝑔 y 𝑤𝑐 son el número de genes, el número de condiciones y los parámetros

configurables para ambas dimensiones, respectivamente. La idea principal de esta ecuación es que utiliza escalas logarítmicas para que pequeños cambios en el número de filas o columnas no tengan un efecto significativo, y además separa los términos para el número de genes y el número de condiciones con el fin de evitar biclusters demasiado desequilibrados y para ser capaz de configurar cada tamaño de cada dimensión independientemente.

La superposición se controla con el siguiente término:

𝑆𝑢𝑝𝑒𝑟𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛(𝐵) = ∑|𝐼||𝐽|(𝑛

𝑖∈𝐼,𝑗∈𝐽

𝑊(𝑏

𝑖𝑗

)

𝑏

− 1)

aquí, 𝑊 es una matriz de pesos (similar a la presentada por Gasch y Eisen(Gasch & Eisen, 2002)), cuyo tamaño es el mismo que el tamaño del microarray, inicializado con valores cero al principio del algoritmo. Cada vez que un bicluster se encuentra, 𝑊 se actualiza incrementando en 1 aquellos elementos que están contenidos en el bicluster. 𝐼 y 𝐽 se refieren a los conjuntos de filas y columnas en 𝐵, respectivamente, y 𝑊(𝑏𝑖𝑗) corresponde

72 al peso de 𝑏𝑖𝑗 en 𝑊. Además, 𝑛𝑏 es el orden del bicluster solución. A grandes rasgos, este

término calcula cuántas veces han aparecido los elementos de𝐵 en cualquier bicluster previo, y divide este valor por el tamaño de 𝐵 y el orden de la solución.

En cuanto a la varianza gen, en general se utiliza para evitar biclusters triviales, prefiriendo aquellas soluciones en las que los genes exhiben tendencias altamente fluctuantes. De acuerdo con esta idea, el término correspondiente está diseñado como sigue:

𝑉𝑎𝑟𝐺𝑒𝑛(𝐵) = |𝐼||𝐽|1

∑ ∑(𝑏

𝑖𝑗

− 𝜇

𝑔𝑖

)

2

𝐽

𝑗=1 𝐼 𝑖=1

como se puede observar, la varianza de un bicluster está dada por la media de las varianzas de todos los genes en el mismo.

En este enfoque se utiliza una estrategia de cobertura secuencial, donde se obtiene un único bicluster cada vez que se ejecuta el algoritmo. Entonces, si se desean n biclusters, el algoritmo evolutivo se debe ejecutar n veces.

73

4.6 Sumario

Este capítulo fue dedicado al concepto de biclustering, explicando en una primera fase el concepto de clustering para luego entender el de biclustering. Luego se desarrolló el concepto de computación evolutiva para sobrellevar la complejidad del problema de encontrar los biclusters. Además se explicó el concepto de un algoritmo multiobjetivo y su utilidad frente a los mono-objetivos. Finalmente se realizó un resumen de varios algoritmos evolutivos diseñados para biclustering agrupados de acuerdo a la forma de evaluar la calidad de los biclusters.

75

In document Inside this report: Strategic report (Page 143-145)

Related documents