Combining Systemic and CA frameworks - 7 CHAPTER 7: DISCUSSION

7 CHAPTER 7: DISCUSSION

7.6 Combining Systemic and CA frameworks

Hasta el momento se ha abordado parte de la teor´ıa en la que se fundamentan los sistemas difusos y en definitiva los sistemas difusos adaptativos en labores de clasificación. Sin embargo, como en cualquier aplicación de inteligencia artificial y en general en cualquier área, existe una probabilidad de error, en la que su disminusión depende de la destreza de quien implementa estas técnicas y métodos. Es por esto, que toma relevancia la validación del rendimiento y la evaluación, en este caso, los clasificadores. A continuación, se muestran algunos de estos métodos.

2.3.3.1. Curva ROC

La curva ROC, por sus siglas en inglés (Receiver Operating Characteristic), es una técnica para visualizar el rendimiento de los sistemas clasificadores binarios, mediante la representación gráfica de la sensibilidad frente a la especificidad. Ésta curva ha sido empleada desde hace tiempo en la teor´ıa de la

detección de señales para describir la compensación entre las tasas de acier- tos y las tasas de desaciertos de los clasificadores [35].

Otra interpretación de la gráfica se da, ya que esta vincula la razón de verdaderos positivos (VPR) frente a la razón de falsos positivos (FPR), a partir del margen de discriminación, el cual es el valor que determina cuando un caso es considerado positivo. Esto quiere decir que ROC es una comparación de dos caracter´ısticas operativas (VPR y FPR) que responde a cambios en el umbral de decisión [35], [36].

Sensibilidad

Torres en [37] define la sensibilidad como un par´ametro que se mide dentro de un grupo de sujetos que verdaderamente hacen parte de una clase positiva (enfermos), en el caso de este proyecto se podr´ıa decir, que se refiere al grupo de elementos que en realidad corresponden a los valores t´ıpicos de las compoenentes RGB que representan el color piel. ´Este se calcula mediente el cociente entre verdaderos positivos y el total de elementos dentro de la base de datos que corresponden al color piel. Por lo tanto, es la probabilidad de obtener un resultado positivo cuando el p´ıxel corresponde a una zona con presencia de piel.

Especificidad

La especificidad es un par´ametro medido a lo largo del grupo al cual pertenece la clase negativa de una base de datos, para labores de clasificaci´on binaria. ´

Este es el cociente entre verdaderos negativos y el total de elementos que no corresponden a los valores t´ıpicos de las compoenentes RGB que representan el color piel. Dado esto, este par´ametro es la probabilidad de obtener un resultado negativo cuando la zona de inter´es no corresponde a una zona con presencia de piel [36], [37].

Test con Resultado Binario

Un test con dos posibles resultados da lugar a la siguiente notaci´on. Sea D, la variable determina el estado verdadero de una clase (color piel):

1 presencia de color piel

0 ausencia de color piel (2.10)

Y =

1 positivo para color piel

0 negativo para color piel (2.11)

Los resultados se resumen dentro de la Tabla 2.2.

D=0 D=1

Y =0 Especificidad; V N R = P[Y = 0|D= 0]

F N R=P[Y = 0|D= 1]

Y=1 F P R=P[Y = 1|D= 0] Sensibilidad;V P R =P[Y = 1|D= 1] Tabla 2.2: Resultado de una Prueba Binaria General

Los sub´ındices D y ¯D denotan el estado de piel y no piel. Por ejemplo YD

muestra el resultado del test para un elemento correspondiente a piel.

2.3.3.2. Cross Validation

Cross Validation o Validación Cruzada, es un método estad´ıstico de eva- luación con el cual se busca garantizar la independencia entre los datos de entrenamiento y los de validación, implementados en algoritmos de aprendizaje. En la validación cruzada t´ıpica, la cual es una mejora del holdout method, los conjuntos de entrenamiento y validación deben cruzarse en ron- das sucesivas de modo que cada dato tiene una posibilidad de ser validado en contra. La forma básica de llevar a cabo este, es realizando el cruce k-veces (k-fold cross validation)[38].

Figura 2.7: Esquema General M´etodo K-fold Cross Validation. Fuente: An- dreini, De Falco, Sassu [39]

En la Figura 2.7 se muestra el esquema general del método k-fold cross validation. Los datos se dividen primero en k segmentos del mismo tamaño (o casi igual). Posteriormente, se toman diferentes conjuntos de entrenamiento y validación de tal manera que dentro de cada una de estos, se determine un segmento diferente para su validación, mientras que los segmentos k - 1 restantes se usan para el aprendizaje [38] [39].

El rendimiento de k-fold cross validation está determinado por el error obte- nido al final de cada iteración. El cálculo de este parámetro está dado por:

Err = 1 K K X i=1 Ei (2.12)

Donde,K es el n´umero de iteraciones yEi es el error para cada iteraci´on. Por

lo tanto, lo que describe esta ecuación, es el cálculo de la media aritmética de los errores obtenidos por medio de la sumatoria de losEi valores de error,

los cuales son divididos entre el n´umero de iteraciones [40].

Además del método k-fold cross-validation, existen; elRandom Cross-Validation y uno de los más efectivos pero a la vez con mayor requerimiento en cuan- to a nivel computacional, el Leave-one-out Cross-Validation (LOOCV). Sin

embargo, estas variaciones del m´etodo original no ser´an objeto de estudio en este proyecto.

2.4. Adaptive Neuro Fuzzy Inference System

In document An examination of the ways in which power arises, and is managed, between systemic psychotherapists and parents working together in a social care context (Page 166-168)