7.3 Experiments
7.4.2 Chapter conclusion
Open Signals daba la posibilidad de guardar las grabaciones como archivos de texto. Estos fueron exportados a MATLAB para hacer el an´alisis de las se˜nales; sin embargo, los tres sensores daban valores entre 0 y 1024, por lo que se utilizaron unas funciones de transferencia para que los datos de cada sensor tuvieran la correcta unidad de medida. A continuaci´on se muestran dichas funciones de transferencia: ACC(g) = 2 ∗ ADC − 208 104 − 1 (5.1) Rango: [−3g, 3g] EM G(mV ) = (ADC 210 − 0.5) ∗ 3.3 (5.2) Rango: [−1.65mV, 1.65mV ] EDA(uS) = ADC 210 ∗ 3.3 − 0.574 0.132 (5.3)
Rango: [−4.4uS, 21uS] Siendo ADC el valor entre 0 y 1024 de cada sensor.
Seguido a esto, se implement´o un filtro digital Chebyshev Tipo II pasa altas utilizado el toolbox Filter Design de MATLAB, para eliminar las contribuciones gravitacionales del aceler´ometro, y centrar las se˜nales de los 3 ejes en 0.
La Figura 5.8 muestra el resultado despues de filtrar las se˜nales:
Figura 5.8: Filtro del aceler´ometro
Antes de hacer el procesamiento de las se˜nales y extraer las caracter´ısticas de estas para implementar el algoritmo de clasificaci´on, se graficaron algunas de ellas y se compararon:
La Figura 5.9 muestra la comparaci´on de las 5 se˜nales entre una persona haciendo un quiz y otra simulando una crisis GTC. Se puede ver que las 5 se˜nales son bastante diferentes, durante una crisis el sensor de EMG muestra la actividad muscular, la conductancia de la piel aumenta, as´ı como se ven los movimientos bruscos involuntarios medidos con el aceler´ometro, mientras que las se˜nales de la persona haciendo el quiz no variaron mucho.
CAP´ITULO 5. TRABAJO REALIZADO 25
Figura 5.9: Comparaci´on de las se˜nales entre una crisis simulada y haciendo un quiz
La Figura 5.10 muestra las se˜nales medidas en dos personas simulando una crisis. Se puede ver que aunque una fue m´as corta que otra, en las dos se evidencian picos bastante altos para las 5 medidas.
Figura 5.10: Comparaci´on de las se˜nales entre dos crisis simuladas
Finalmente, la Figura 5.11 muestra una comparaci´on entre las se˜nales de una persona haciendo ejercicio y otra simulando una crisis, pues hacer ejercicio podr´ıa confundirse por una crisis teniendo en cuenta las se˜nales que se est´an midiendo: va a haber tensi´on muscular, as´ı como movimiento y la persona va a sudar, por lo cual el sensor de actividad electrod´ermica tambi´en mostrar´ıa un aumento. En las im´agenes se puede ver esto; sin embargo, se puede ver que los picos de EMG son mayores, as´ı como la actividad electrod´ermica es mayor durante una crisis que haciendo ejercicio.
Figura 5.11: Comparaci´on de las se˜nales entre una persona haciendo ejercicio y otra simulando una crisis
Ahora bien, dado que los datos de los sensores van a ser analizados en tiempo real, esto se debe hacer en segmentos de tiempo, o ventanas. Existen dos diferentes t´ecnicas de segmentaci´on: ventanas ady- acentes y ventanas superpuestas. Estas ´ultimas utilizan el tiempo de inactividad para adquirir m´as datos para ser procesados, por lo que produce una mejor precisi´on de clasificaci´on.
En cuanto al tama˜no de las ventanas, si estas cuentan con una mayor cantidad de datos, aumenta la precisi´on de clasificaci´on, pero esto implicaria m´as tiempo para recolectar los datos, por lo que se debe hacer un trade-off entre precisi´on y limitaciones de tiempo. En teor´ıa ventanas entre 128 ms y 256 ms contienen suficiente informaci´on para obtener un buen clasificador.
Para este problema en particular, era tan importante la precisi´on del clasificador para detectar crisis en el momento que era, como el tiempo, pues lo ideal era detectar la crisis en el menor tiempo posible. Como se defini´o un rango entre 128 y 256 ms para esto, se decidi´o que la longitud de las ventanas iba a ser de 256 muestras, es decir, se iban a analizar datos cada 256 ms, que es un tiempo corto y adem´as iba a proporcionar una alta precisi´on a la hora de hacer la clasificaci´on.
Adicionalmente, la precisi´on mejora para ventanas superpuestas. Generalmente, el n´umero de mues- tras que se superponen se define como un cuarto del tama˜no de la ventana o menos, por lo que en este caso se determin´o como 64 ms.
No obstante, la precisi´on y exactitud del clasificador no va a depender ´unicamente del tama˜no de estas ventanas, sino de las caracter´ısticas que se obtengan de estas. Estas caracter´ısticas se pueden agrupar en 4 categor´ıas de acuerdo al dominio en el que van a ser calculadas [27]:
1. Caracter´ısticas del dominio del tiempo (TD): Como la media, o la media cuadr´atica (RMS). 2. Caracter´ısticas del dominio de la frecuencia (FD): Como la frecuencia media.
3. Caracter´ısticas del dominio de tiempo-frecuencia (TFD): Como la transformada de Wavelet disc- reta.
CAP´ITULO 5. TRABAJO REALIZADO 27
Teniendo esto en consideraci´on, as´ı como el trabajo desarrollado por Gabriele Bunkheila Signal Pro- cessing for Machine Learning [21] para el procesamiento de las se˜nales de un aceler´ometro para clasi- ficar entre 6 diferentes actividades, se tom´o la decisi´on de extraer las siguientes caracter´ısticas de las ventanas:
• Media.
• Media cuadr´atica.
• Los 6 picos m´as altos de cada se˜nal, as´ı como la posici´on de estos. • El valor central de la autocorrelaci´on de cada se˜nal (energ´ıa). • Los 5 picos m´as altos de la densidad espectral de cada se˜nal.
Esto quiere decir que se extrajeron 20 caracter´ısticas por cada se˜nal, dando as´ı un total de 100 carac- ter´ısticas por cada ventana de tiempo.
La Figura 5.12 muestra c´omo se obtuvieron algunas de estas caracter´ısticas:
Figura 5.12: Caracter´ısticas
En la primera gr´afica se puede ver que se obtienen los primeros 40 picos m´as altos de la se˜nales; luego, se seleccionan los 6 m´as altos, as´ı como las posiciones de estos.
La segunda gr´afica muestra el periodograma o densidad espectral de dos se˜nales de EMG, una de una crisis y otra de una actividad cotidiana. Estas gr´aficas muestran qu´e tan r´apido est´an oscilando estas se˜nales y la forma de estas. Si los picos est´an m´as hacia la izquierda significa que la se˜nal oscila menos, y la amplitud de los picos est´a relacionada a la forma de la oscilaci´on. La densidad espectral de potencia (PSD) muestra a qu´e frecuencias las variaciones son fuertes y a qu´e frecuencias las variaciones son d´ebiles, por lo que se obtuvieron los 5 picos m´as altos de estas gr´aficas.
La ´ultima gr´afica muestra un ejemplo de la autocorrelaci´on de una se˜nal. Esta es una medida de simili- tud entre la se˜nal y la misma se˜nal desplazada una unidad de tiempo; esto resulta de gran utilidad para encontrar patrones repetitivos dentro de una se˜nal, como, la periodicidad de esta o para identificar la frecuencia fundamental de una se˜nal que no contiene dicha componente. El pico central de la gr´afica representa la energ´ıa de esta, y para se˜nales peri´odicas, la ubicaci´on de los picos m´as altos a la derecha del pico central definen la frecuencia fundamental de esta. Dado que las se˜nales se que obtuvieron no fueron necesariamente peri´odicas, para este caso se obtuvo ´unicamente el pico central para cada una de las mediciones.
Las otras dos caracter´ısticas que se obtuvieron fueron la media y la media cuadr´atica, que, como se mencion´o anteriormente, son caracter´ısticas comunes en el dominio del tiempo para este tipo de se˜nales.