Relevance Vector Machine Regression

3.4 Pose Descriptor

3.5.1 Relevance Vector Machine Regression

A continuación se muestran varias pruebas efectuadas para evaluar el desempeño de ACPO como base para un modelo del sistema locomotor. Cabe destacar que este esquema de osciladores acoplados solo provee un mecanismo para la generación de señales de sincronización entre cada una de las patas. No provee de referencias para los ángulos de cada uno de los motores dentro de un pata. Se considera que un ciclo completo para un oscilador se corresponde con un ciclo de locomoción de la pata asociada a dicho oscilador.

La función principal del modelo empleado es la generación de señales de referencia temporales para los ángulos de cada articulación, las cuales describen un modo de caminado en particular en función de la relaci´on de fase entre los vectores de estado qi de cada

una de las patas. Se implement´o el sistema descrito por las Ecuaciones 4.15, utilizando Euler como t´ecnica de resoluci´on de las ecuaciones diferenciales para los vectores ˙qi, con

Euler = 0,001.

Primero se estudi´o el efecto que tienen las variables g, ro y ω sobre el atractor

c´ıclico de un solo ACPO. En las Figuras 4.21(a),4.21(b),4.21(c),4.21(d) se muestran los ciclos l´ımites para 4 casos de ACPO con distintos valores de g; los otros par´ametros se mantuvieron constante (ω = 2π, ro = 1). Se muestran las gr´aﬁcas de las trayectorias

descritas bajo tales condiciones de simulaci´on, empleando un total de 8 puntos iniciales ﬁjos, 4 de ellos ubicados en las cercan´ıas del origen, y los cuatro puntos restantes fuera del c´ırculo de radio ro; la longitud de cada trayectoria corresponde a los primeros 1000

puntos de simulaci´on. En tales gr´aﬁcas se puede apreciar el impacto de g en la velocidad de convergencia del vector de estado q hacia el c´ırculo de radio igual a 1 que describe el ciclo l´ımite del sistema.

Se puede observar que conforme disminuye el valor de g, la trayectoria descrita por el vector de estado tarda cada vez mas en converger al ciclo de radio 1. En la Figura 4.21(d) se

(a) g = 0.1 (b) g = 1

Figura 4.21: Ciclo l´ımite de ACPO en para distintos valores de g

aprecia que el vector q cae en dicho ciclo atractor en apenas una iteraci´on, para los distintos puntos iniciales empleados. El efecto directo de g es escalar la componente tangencial (aproximaci´on) del vector ˙q, al aumentar éste disminuye el tiempo de convergencia. Sin embargo, también se observ´o que para valores muy bajos de g el sistema no converg´ıa, sino por el contrario diverg´ıa del circulo de radio ro. Ésto se observa en las Figuras 4.21(a)

y 4.21(b); en el primer caso la trayectoria del vector de estado crece paulatinamente, alejándose del c´ırculo en el caso de los puntos iniciales que estaban fuera del mismo. Las trayectorias correspondientes a los puntos internos describ´ıan espirales cuyo radio crec´ıan también de manera progresiva. Para la gr´afica correspondiente a un valor de g = 1, se observa que las distintas trayectorias convergen a un zona descrita por un anillo con un

radio promedio igual a 1.2, los cual evidentemente es mayor al radio establecido por ro.

Observando el impacto de la variable g sobre la posible convergencia del vector de estado a un atractor c´ıclico deﬁnido por ro, se desprende la necesidad de usar valores

mayores o igual a 10. No existe la necesidad de identificar el valor exacto que asegura convergencia del sistema, puesto que no se desea operar en torno a una condición cr´ıtica. Para ésto se considera como condici´on suficiente utilizar una constante g con un valor lo suficiente alto como para asegurar convergencia.

En lo que respecta al comportamiento del sistema completo, compuesto por cuatro osciladores acoplados (ver Fig. 4.19), se procedió a estudiar la evolución temporal del mismo ante la ausencia de perturbaciones. Para ello, se fijó un modo de caminado en particular al cual están asociados distintos desfases entre patas, los cuales se dejaron constante durante la simulación. Todos los vectores de estado fueron puestos en cero (qi = [xi, yi]T = [0; 0]T,∀i = 1) excepto para la pata 1 ( Frontal Izquierda); la condición

inicial de dicha pata era el vector qini = [0,1; 0,1]T a ﬁn de que el sistema completo no

partiese de un estado totalmente nulo, caso en el cual permanecer´ıa est´atico en el origen para todos los osciladores. El resto de los par´ametros empleados fueron los siguientes: ω = 2π,ro = 1, g = 50 y λ = 2; la variable que controla los desfases fue colocada en el

valor correspondiente al modo caminado (Pmodo = 0). En la Figura 4.22 se muestra la

evoluci´on temporal de las 8 componentes de los vectores de estado correspondientes a las cuatro patas, para una simulaci´on efectuada con un paso de Euler = 0,001.

Puesto que se escogi´o un valor de Pmodo = 0 correspondiente al modo caminado,

la relaci´on de fases es tal que algunas componentes de los vectores de estados poseen aproximadamente el mismo valor de amplitud para el mismo instante. Por ejemplo, el componente x del ACPO correspondiente a la pata 1 posee la misma forma de onda ( con igual fase ) que la componente y del vector de estado de la pata 2. Este comportamiento se aprecia en la Figura 4.22. Las Figuras 4.23(a)4.23(b)4.23(c)4.23(d) muestran la evoluci´on de los mismos vectores de estado en el plano X− Y .

Figura 4.22: Salidas de CPG-ACPO en funci´on del tiempo, P_modo = 0

En las gráficas de las trayectorias en el plano de los vectores de estado también es posible observar la convergencia del sistema completo a un régimen con desfases entre los vectores de cada pata, iguales a los establecidos como referencia para el modo de caminado ( ver Tablas 4.6(a)4.6(b) ). A fin de poder apreciar la velocidad con la cual el sistema cae en este comportamiento de acoplamiento de las fases, se procedió a graficar los desfases para cada una de las patas. Para ello, se tomo como referencia ( fase cero ) a la Pata 1. En la Figura 4.24 se muestran las gráficas con los desfases en función del numero de iteraciones, para las patas 2,3 y 4; también se colocan los valores de referencia de fase para cada pata. En lo que respecta al módulo de los vectores de estado, se tiene que el sistema tarda un número mayor de iteraciones en converger a un valor final, en este caso de 1,251. La Figura 4.25 muestra la evoluci´on temporal de los m´odulos de q para cada una de las patas. En ambas se puede apreciar que tanto las fases como los módulos de los vectores convergen rápidamente a un estado final, tomando un aproximado de 100 iteraciones para establecerse la amplitud, mientras que la fase se estabiliza en apenas 3 iteraciones. Sin embargo, se nota un error en el valor final de la amplitud ya que el valor de ro = 1 difiere del radio del ciclo final al cual convergen los cuatro vectores de

(a) Pata 1 (b) Pata 2

Figura 4.23: Trayectorias en el plano del vector q para cada pata

estado (1,251). Aqu´ı nuevamente se observa el fen´omeno identiﬁcado en la Figura 4.21(b) asociado al valor de g utilizado. Este resultado se toma en consideraci´on en posteriores implementaciones del presente modelo como sistema de generaci´on de fases de un CPG mas completo.

Por último se estudió el comportamiento del sistema ante la transición de modo de caminado. Para esto se partió con un modo de locomoción dado, y una vez que el sistema se establec´ıa en un comportamiento estable propio de dicho modo, se modificó la variable Pmodo. Dicho par´ametro fue cambiado un total de 3 veces, pasando por caminado, trote,

galope y por ´ultimo de vuelta a caminado. En la Figura 4.26 se muestra la evoluci´on temporal de las variables de los vectores de estado para todas la patas con las variaciones

Figura 4.24: Fases de cada pata en funci´on del tiempo

antes mencionadas para Pmodo. Los dem´as par´ametros del sistema se mantuvieron iguales.

Figura 4.26: Salidas de CPG-ACPO en funci´on del tiempo, Pmodovariable

Se aprecia el ajuste inmediato de las amplitudes de los vectores de estado para cada cambio de la variable Pmodo. Tales ajustes corresponden a transiciones continuas en cada

una de las formas de onda. Sin embargo se sigue observando diferencias entre la amplitud alcanzada por las ondas, y la correspondiente al atractor con radio ro = 1.

Partiendo de las distintas pruebas previamente descritas, donde se observan los comportamientos que exhibe el sistema dinámico que representa un CPG basado en cuatro ACPO interconectados, es posible identificar algunas caracter´ısticas útiles para generación de modos de caminado en un cuadrúpedo. Éstas son las siguientes:

• Es posible establecer referencias de desfase a partir de una variable ´unica (Pmodo),

para un modo de caminado en particular.

• Se encuentra deﬁnido un vector de estado (q) para cada una de las patas, as´ı como su gradiente en todo el plano ( ˙q).

• Es posible ajustar el radio del atractor c´ıclico de cada uno de los osciladores mediante el par´ametro ro.

• Se puede controlar la velocidad de oscilación a través del parámetro ωi.

• La convergencia del vector de estado al atractor c´ıclico puede ser controlada mediante el factor g, que escala la componente de q perpendicular al ciclo de radio ro.

Estas caracter´ısticas pueden ser aprovechadas para modelar el acople de fase entre las patas del robot cuadrúpedo. No obstante, un modelo de CPG-ACPO resulta incompleto al quedar sin solución la coordinación de los movimientos de las articulaciones dentro de cada una de las patas. Aparte, se pudo identificar algunos casos donde el sistema de osciladores acoplados exhibe un comportamiento que afectar´ıa de manera negativa al proceso de locomoción completo. Estos son:

• Para valores de g bajos (entre 0,1 y 1 por ejemplo), el vector de estado para un oscilador ACPO simple NO converg´ıa al atractor c´ıclico deseado. El sistema por el contrario diverg´ıa, aumentado continuamente la amplitud de q: el sistema era inestable.

• El sistema es muy sensible a la resolución de paso en la simulación al usar Euler. A diferencia del caso de las CTRNN, donde un paso de 0,1 resultaba suficiente; pero para el ACPO se necesario un paso de simulaci´on menor o igual a 0,001. Este proble- ma puede ser resuelto mediante el uso de otras técnicas para cálculo con ecuaciones diferenciales.

• El espacio natural de salida de cada vector es una circunferencia descrito por com- ponentes de naturaleza sinusoidal. La generación de señales con diferentes formas de ondas basándose solamente en ACPO aún no ha sido resuelto.

In document Augmentieren von Personen in Monokularen Videodaten (Page 53-56)