5.2. Proposed Framework
5.2.2. Proposed Technological Framework
Una vez realizada la representación mediante un método de extracción de caracte- rísticas, se puede aplicar un algoritmo de clasificación que trabaje en esas caracterís- ticas. Durante las primeras pruebas se utilizaron los clasificadores:
Máquina de soporte vectorial (Vishwanathan y Murty, 2002) Random Forest (Breiman, 1999)
Vecinos cercanos (Dudaet al., 2012)
Estos clasificadores fueron entrenados con las mismas muestras y los mismo tipos de datos; de la misma manera todos los clasificadores fueron probados con las mismas imágenes.
Para la medición y comparación de los clasificadores se obtuvo la exactitud duran- te las pruebas. A continuación se explica la fórmula que se utilizó para realizar este cálculo.
5.3.1. Exactitud
En la medición de un conjunto, la exactitud (accuracy) se refiere a la cercanía de las mediciones a un valor específico. Para el calculo de la exactitud se utilizo una función de Scikit “accuracy score” la cual se calcula utilizando las etiquetas provenientes de
la base de datos y las que se obtuvieron del clasificador. Esta función devuelve la exactitud del subconjunto de prueba de la siguiente manera: Si el conjunto completo de etiquetas que se obtuvieron del clasificador coincide estrictamente con el conjunto verdadero de etiquetas, la exactitud del subconjunto es 1.0; de lo contrario es 0.0.
Para esto se utiliza la siguiente fórmula:
Ecttd(y,yˆ) = 1 n n−1 X =0 1(y=yˆ) (2) Donde:
yson las etiquetas provenientes de la base de datos.
ˆ
yson las etiquetas que se obtuvieron del clasificador. y es el valor verdadero correspondiente.
ˆ
y es el valor pronosticado de la enésima muestra.
nes el número total de muestras utilizadas.
A continuación se muestran los resultados obtenidos de las pruebas con la base de datos y el método de clasificación que se seleccionó.
5.3.2. Pruebas con la base de datos UNBC-McMaster
Utilizando el conjunto de datos de 1224 imágenes de entrenamiento y 1566 imá- genes de prueba, distribuidas en 6 clases, se creó el modelo LBPH, considerando co- mo parámetros del modelo una malla de 8x8 con radio de 1 y vecindad de 8. Con éstos parámetros se obtuvo como representación un histograma global de 16384 ca- racterísticas por imagen. Tomando los histogramas globales como características, se entrenaron clasificadores basados en los algoritmos vecino cercano, SVM y Random Forest. Los mejores resultados se obtuvieron con el clasificador de vecino cercano en- tre las características extraídas, usando LPBH, mientras que los demás clasificadores presentan un comportamiento similar, como se puede observar en la Tabla 8.
Tabla 8.Resultado de los clasificadores.
Clasificadores Resultados obtenidos ( % de exactitud)
Vecino cercano 81.22
RandomForest 77.33
SVM(Pol. 3er grado) 76.05
SVM(RBF) 75.98
SVM(Pol. 2do grado) 75.98
SVM(Sigmoidal) 75.86
Con este conjunto de imágenes, existían algunas en las cuales el detector no en- contraba ningún rostro. De aquí que se realizó una depuración de la base de datos y se realizó un último conjunto de datos, para este último conjunto de datos, se utili- zaron 1500 imágenes para crear el modelo que se usó en los clasificadores (como se mencionó en el capítulo 4), y para las pruebas se usaron 1141 imágenes. Con este conjunto de datos los resultados de los clasificadores mejoraron al estar detectando solamente rostros, como se muestra en la Tabla 9.
Tabla 9.Resultado de los clasificadores.
Clasificadores Resultados obtenidos ( % de exactitud)
Vecino cercano 85.62
RandomForest 78.00
SVM(RBF) 76.42
SVM(Pol. 3er grado) 76.59 SVM(Pol. 2do grado) 76.33
SVM(Sigmoidal) 76.33
Con base en los resultados obtenidos mostrados en la Tabla 9, se seleccionó el cla- sificador de vecinos cercanos para el desarrollo del sistema. Además se utilizó durante las pruebas en tiempo real que se muestran en el capítulo 6. Enseguida se describe el clasificador seleccionado de vecinos cercanos (Dudaet al., 2012).
5.3.3. Método de clasificación supervisada vecinos cercanos
El método de vecinos cercanos, o K-nn por sus siglas en ingles (K nearest neigh- bors), es un método de clasificación supervisada, el cual estima el valor de la función de densidad de probabilidad, o directamente la probabilidad a posterior de que un
elemento pertenezca a la clase Cj a partir de la información proporcionada por un
conjunto de ejemplos. Se obtiene la distancia euclideana entre el elemento y todos
los demás elementos de la base de datos.
d(, j) = v u u t p X r=1 (r , r j)2. (3)
La fase de entrenamiento del algoritmo consiste en almacenar los vectores carac- terísticos y las etiquetas de las clases de los ejemplos de entrenamiento. En la fase de prueba, la evaluación del dato nuevo es representada por un vector en el espacio ca- racterístico. Se calcula la distancia entre los vectores almacenados y el nuevo vector, de acuerdo a la ecuación 3, y se seleccionan los k ejemplos más cercanos. El nuevo
ejemplo es clasificado con la clase que más se repite en los vectores seleccionados.
Figura 16.Método de vecino cercano.
En la Figura 16 se ilustra el funcionamiento de este método de clasificación. En donde se encuentran representadas 12 muestras pertenecientes a dos clases distintas: la clase 1 que está formada por 6 círculos de color azul, y la clase 2 formada por 6 triángulos de color amarillo. En este ejemplo, se han seleccionado tres vecinos, es decir, (k=3). De los 3 vecinos más cercanos a la muestra, representada en la Figura
tanto, la regla 3-nn asignará la muestra a la clase 2. Es importante señalar que si se hubiese utilizado como regla de clasificaciónk=1, la 1-nn, la muestra sería asignada
a la clase 1, pues el vecino más cercano de la muestra pertenece a la clase 1.
En este capítulo se explicaron los algoritmos y métodos que se utilizaron para el desarrollo del sistema de detección de dolor, en las fases de entrenamiento y de cla- sificación. Se explicó brevemente el funcionamiento de cada uno de ellos y como se realizó su selección para su uso en el desarrollo del sistema. Para la detección del ros- tro se eligió el algoritmo de Viola-Jones, para la extracción de características el LBPH y para la clasificación el método de vecinos cercanos.
En el siguiente capítulo se presenta una evaluación del sistema de detección de dolor, con especialistas y sus resultados.