• No results found

Cell aggregation implanted in a 3D model gel

8.1 Level Set Method for Interface Advection

8.3.2 Cell aggregation implanted in a 3D model gel

Las Curvas Principales (CP) definidas en los textos clásicos de cálculo, consisten en una generalización no lineal del análisis de las componentes principales y fueron introducidas como curvas lisas, unidimensionales, que pasan en medio de un conjunto multidimensional de datos, proporcionando un buen resumen unidimensional de estas (Figura 4.1). Además de eso, ellas son no-paramétricas y su forma es sugerida por los datos.

Figura 4.1 – Curva Principal para un conjunto de datos de dos dimensiones.

Las CP han despertado bastante interés en la comunidad científica. Diversos trabajos que mejoraron su definición inicial fueron publicados después del trabajo original. Tales trabajos presentan definiciones alternativas y proponen aplicaciones diversas. Dentro de los algoritmos propuestos para la extracción de las curvas, se destaca el k-segmentos no-liso. Este algoritmo se destaca por su

34

robustez en la estimación de las CP, menos susceptibilidad a los mínimos locales y convergencia garantizada.

En general, en la extracción de las CP de un conjunto de datos, el primer componente principal de este conjunto es tomado como punto de partida para la construcción de la curva. A continuación, la curva es alterada sucesivamente hasta que el algoritmo converja y, finalmente, se obtiene la CP.

Matemáticamente, las CP son definidas a partir del concepto de auto consistencia. Para entender este concepto, es necesario definir el índice de proyección de un punto 𝑥𝑖 en una curva 𝑓. Una curva unidimensional en el

espacio 𝑑-dimensional es un vector 𝑓(𝑡) de 𝑑 funciones continuas y una única variable 𝑡, es decir:

𝑓(𝑡) = [𝑓1(𝑡)𝑓2(𝑡) . . . 𝑓𝑑(𝑡)]𝑇 (4.1)

En donde 𝑇 indica transpuesta.

Estas funciones son denominadas funciones de coordenadas y el parámetro 𝑡

está relacionado al ordenamiento a lo largo de la curva.

Sea 𝑥 un vector aleatorio en ℜ𝑑, con densidad de probabilidad ℎ, y el momento de segundo orden finito. Sea 𝑓 una curva lisa en el intervalo cerrado 𝐼 ⊆ ℜ1que no se intercepta a sí misma, es decir 𝑡1 ≠ 𝑡2 ⇒ 𝑓(𝑡1) ≠ 𝑓(𝑡2). El índice de

proyección 𝑡𝑓: ℜ𝑑−→ ℜ1 es definido como:

𝑡𝑓(𝑥) = 𝑠𝑢𝑝{𝑡: ∥ 𝑥 − 𝑓(𝑡) ∥= 𝑖𝑛𝑓 ∥ 𝑥 − 𝑓(𝜇) ∥} (4.2)

Siendo 𝜇 una variable auxiliar definida en ℜ1.

El índice de proyección 𝑡𝑓(𝑥) es el valor de 𝑡 para el cual la CP 𝑓(𝑡) esta más

próxima de 𝑥. Si hubiera más de un valor posible, el mayor de ellos es seleccionado.

La Figura 4.2 muestra el índice de proyección relativo a una CP. Se muestran cinco eventos 𝑥1… , 𝑥5, los cuales proyectan en los puntos 𝑓 (𝑡𝑓(𝑥1)), . . . ,

35

parámetro 𝑡 relativo al punto de la curva más próximo al evento 𝑥𝑖 y por eso, corresponde al valor del índice de proyección de ese punto sobre la curva.

Figura 4.2 – Proyección de los datos en la CP.

La CP es auto consistente, es decir, los puntos que la componen constituyen la media de los datos que en ella se proyectan, conforme a la ecuación 4.3.

𝑓(𝑥) = 𝐸[𝑥|𝑡𝑓(𝑥) = 𝑡], ∀𝑡 (4.3)

La Figura 4.3 muestra un punto 𝑓(𝑡𝑖) auto consistente de una CP para datos en dos dimensiones.

Figura 4.3 – Punto auto consistente de una CP.

Las CP pueden ser aplicadas en tres diferentes enfoques: (i) como técnica de análisis de datos; (ii) como técnica de extracción de parámetros y; (iii) como técnica de detección y clasificación de eventos. En el trabajo propuesto, estos tres enfoques serán aplicados a las perturbaciones eléctricas.

36

La motivación para el uso de las CP radica en su buena capacidad para extraer modelos compactos de los datos y baja complejidad computacional en la fase de operación. Así, se puede representar las perturbaciones por CP y las utiliza para detectar y clasificar cada tipo de perturbación.

4.1.1 ALGORITMO K-SEGMENTOS

Este algoritmo extrae las curvas principales de forma gradual y se destaca, en relación a los demás, por presentar una mayor robustez en la estimación de las curvas, menos susceptibilidad a mínimos locales y convergencia practica garantizada. La extracción de las CP utilizando este algoritmo se efectúa, básicamente, en tres pasos, descritos a continuación.

PASO 0: INSERCIÓN DEL PRIMER SEGMENTO: En la inserción del primer segmento, todos los eventos del conjunto de diseño son considerados. Así, se define un centro correspondiente al valor medio de los datos, y a partir de este centro, se obtiene el primer segmento, en la dirección de la primera componente principal y con longitud de 3/2 del desvío estándar asociado a este componente.

PASO 1: INSERCIÓN DEL SEGUNDO SEGMENTO: En el segundo segmento, se define un nuevo punto a ser tomado como centro y, utilizando el algoritmo k- vecinos más próximos (k-means), se define que eventos pertenecerán al nuevo agrupamiento. Este nuevo agrupamiento está basado en las Regiones de Voronoi, que están compuestas por eventos que están más próximos de otro evento (centro de la región) de uno de los segmentos que componen la curva. A continuación, el primer segmento es recalculado, una vez que el conjunto de eventos que lo define, es decir, su agrupamiento, fue alterado. Los dos segmentos obtenidos son unidos por una línea reta (no-lisa). Para los próximos segmentos, se realizan los mismos procedimientos.

PASO 2: CONVERGENCIA: Se verifica si el algoritmo alcanzo el número máximo de segmentos definido por el usuario o si hubo la convergencia. La convergencia sucede cuando el mayor agrupamiento posible tiene menos de tres segmentos. En caso que no ocurra ninguna de las dos hipótesis, se vuelve al Paso 1.

37

Este proceso de extracción de las CP por el algoritmo k-segmentos no-liso se muestra en la Figura 4.4, donde 𝑘 representa el número de segmentos ya obtenidos y 𝑘_𝑚𝑎𝑥 el número máximo de segmentos que se desea obtener.

Figura 4.4 – Diagrama de flujo simplificado del algoritmo k-segmentos no- liso.

Al final de la extracción, el algoritmo sugiere una determinada cantidad de segmentos para la curva principal. Esta sugerencia se basa en la variación de la longitud total de la curva después de la inserción de un segmento. La longitud total se obtiene a través de la medición de la longitud de todos los segmentos insertados, más la longitud de la conexión entre ellos. Como el algoritmo selecciona las Regiones de Voronoi en orden decreciente, a cada iteración, el segmento insertado es menor que el anterior. Así, habrá un momento en que el segmento insertado no representa una gran modificación en la curva como un todo. De esa forma, el método de extracción sugiere una cantidad de segmentos que resulte de una curva que no está súper entrenada.

El algoritmo k-vecinos más próximos, empleado en la construcción de la curva principal, posibilita el agrupamiento de los datos en las Regiones de Voronoi, siendo que, a cada paso del algoritmo k-segmentos no liso, un nuevo segmento es insertado en la mayor de las regiones. Aparentemente, este procedimiento no parece producir curvas que, de alguna forma, incorporan el concepto de auto

38

consistencia. Sin embargo, dos aspectos hacen de la curva obtenida por el algoritmo k-segmentos no lisa, una curva principal, que son:

 Los segmentos con dirección de la primera componente principal son auto consistentes;

 Si la región es una Región de Voronoi, entonces los 𝑘 puntos pertenecientes a ella son auto consistentes.

Related documents