• No results found

Relevance Vector Machine Regression

3.4 Pose Descriptor

3.5.1 Relevance Vector Machine Regression

A continuaci´on se muestran varias pruebas efectuadas para evaluar el desempe˜no de ACPO como base para un modelo del sistema locomotor. Cabe destacar que este esquema de osciladores acoplados solo provee un mecanismo para la generaci´on de se˜nales de sincronizaci´on entre cada una de las patas. No provee de referencias para los ´angulos de cada uno de los motores dentro de un pata. Se considera que un ciclo completo para un oscilador se corresponde con un ciclo de locomoci´on de la pata asociada a dicho oscilador.

La funci´on principal del modelo empleado es la generaci´on de se˜nales de referencia temporales para los ´angulos de cada articulaci´on, las cuales describen un modo de cami- nado en particular en funci´on de la relaci´on de fase entre los vectores de estado qi de cada

una de las patas. Se implement´o el sistema descrito por las Ecuaciones 4.15, utilizando Euler como t´ecnica de resoluci´on de las ecuaciones diferenciales para los vectores ˙qi, con

Euler = 0,001.

Primero se estudi´o el efecto que tienen las variables g, ro y ω sobre el atractor

c´ıclico de un solo ACPO. En las Figuras 4.21(a),4.21(b),4.21(c),4.21(d) se muestran los ciclos l´ımites para 4 casos de ACPO con distintos valores de g; los otros par´ametros se mantuvieron constante (ω = 2π, ro = 1). Se muestran las gr´aficas de las trayectorias

descritas bajo tales condiciones de simulaci´on, empleando un total de 8 puntos iniciales fijos, 4 de ellos ubicados en las cercan´ıas del origen, y los cuatro puntos restantes fuera del c´ırculo de radio ro; la longitud de cada trayectoria corresponde a los primeros 1000

puntos de simulaci´on. En tales gr´aficas se puede apreciar el impacto de g en la velocidad de convergencia del vector de estado q hacia el c´ırculo de radio igual a 1 que describe el ciclo l´ımite del sistema.

Se puede observar que conforme disminuye el valor de g, la trayectoria descrita por el vector de estado tarda cada vez mas en converger al ciclo de radio 1. En la Figura 4.21(d) se

(a) g = 0.1 (b) g = 1

(c) g = 10 (d) g = 100

Figura 4.21: Ciclo l´ımite de ACPO en para distintos valores de g

aprecia que el vector q cae en dicho ciclo atractor en apenas una iteraci´on, para los distintos puntos iniciales empleados. El efecto directo de g es escalar la componente tangencial (aproximaci´on) del vector ˙q, al aumentar ´este disminuye el tiempo de convergencia. Sin embargo, tambi´en se observ´o que para valores muy bajos de g el sistema no converg´ıa, sino por el contrario diverg´ıa del circulo de radio ro. ´Esto se observa en las Figuras 4.21(a)

y 4.21(b); en el primer caso la trayectoria del vector de estado crece paulatinamente, alej´andose del c´ırculo en el caso de los puntos iniciales que estaban fuera del mismo. Las trayectorias correspondientes a los puntos internos describ´ıan espirales cuyo radio crec´ıan tambi´en de manera progresiva. Para la gr´afica correspondiente a un valor de g = 1, se observa que las distintas trayectorias convergen a un zona descrita por un anillo con un

radio promedio igual a 1.2, los cual evidentemente es mayor al radio establecido por ro.

Observando el impacto de la variable g sobre la posible convergencia del vector de estado a un atractor c´ıclico definido por ro, se desprende la necesidad de usar valores

mayores o igual a 10. No existe la necesidad de identificar el valor exacto que asegura convergencia del sistema, puesto que no se desea operar en torno a una condici´on cr´ıtica. Para ´esto se considera como condici´on suficiente utilizar una constante g con un valor lo suficiente alto como para asegurar convergencia.

En lo que respecta al comportamiento del sistema completo, compuesto por cuatro osciladores acoplados (ver Fig. 4.19), se procedi´o a estudiar la evoluci´on temporal del mismo ante la ausencia de perturbaciones. Para ello, se fij´o un modo de caminado en particular al cual est´an asociados distintos desfases entre patas, los cuales se dejaron constante durante la simulaci´on. Todos los vectores de estado fueron puestos en cero (qi = [xi, yi]T = [0; 0]T,∀i = 1) excepto para la pata 1 ( Frontal Izquierda); la condici´on

inicial de dicha pata era el vector qini = [0,1; 0,1]T a fin de que el sistema completo no

partiese de un estado totalmente nulo, caso en el cual permanecer´ıa est´atico en el origen para todos los osciladores. El resto de los par´ametros empleados fueron los siguientes: ω = 2π,ro = 1, g = 50 y λ = 2; la variable que controla los desfases fue colocada en el

valor correspondiente al modo caminado (Pmodo = 0). En la Figura 4.22 se muestra la

evoluci´on temporal de las 8 componentes de los vectores de estado correspondientes a las cuatro patas, para una simulaci´on efectuada con un paso de Euler = 0,001.

Puesto que se escogi´o un valor de Pmodo = 0 correspondiente al modo caminado,

la relaci´on de fases es tal que algunas componentes de los vectores de estados poseen aproximadamente el mismo valor de amplitud para el mismo instante. Por ejemplo, el componente x del ACPO correspondiente a la pata 1 posee la misma forma de onda ( con igual fase ) que la componente y del vector de estado de la pata 2. Este comportamiento se aprecia en la Figura 4.22. Las Figuras 4.23(a)4.23(b)4.23(c)4.23(d) muestran la evoluci´on de los mismos vectores de estado en el plano X− Y .

Figura 4.22: Salidas de CPG-ACPO en funci´on del tiempo, Pmodo = 0

En las gr´aficas de las trayectorias en el plano de los vectores de estado tambi´en es posible observar la convergencia del sistema completo a un r´egimen con desfases entre los vectores de cada pata, iguales a los establecidos como referencia para el modo de caminado ( ver Tablas 4.6(a)4.6(b) ). A fin de poder apreciar la velocidad con la cual el sistema cae en este comportamiento de acoplamiento de las fases, se procedi´o a graficar los desfases para cada una de las patas. Para ello, se tomo como referencia ( fase cero ) a la Pata 1. En la Figura 4.24 se muestran las gr´aficas con los desfases en funci´on del numero de iteraciones, para las patas 2,3 y 4; tambi´en se colocan los valores de referencia de fase para cada pata. En lo que respecta al m´odulo de los vectores de estado, se tiene que el sistema tarda un n´umero mayor de iteraciones en converger a un valor final, en este caso de 1,251. La Figura 4.25 muestra la evoluci´on temporal de los m´odulos de q para cada una de las patas. En ambas se puede apreciar que tanto las fases como los m´odulos de los vectores convergen r´apidamente a un estado final, tomando un aproximado de 100 iteraciones para establecerse la amplitud, mientras que la fase se estabiliza en apenas 3 iteraciones. Sin embargo, se nota un error en el valor final de la amplitud ya que el valor de ro = 1 difiere del radio del ciclo final al cual convergen los cuatro vectores de

(a) Pata 1 (b) Pata 2

(c) Pata 3 (d) Pata 4

Figura 4.23: Trayectorias en el plano del vector q para cada pata

estado (1,251). Aqu´ı nuevamente se observa el fen´omeno identificado en la Figura 4.21(b) asociado al valor de g utilizado. Este resultado se toma en consideraci´on en posteriores implementaciones del presente modelo como sistema de generaci´on de fases de un CPG mas completo.

Por ´ultimo se estudi´o el comportamiento del sistema ante la transici´on de modo de caminado. Para esto se parti´o con un modo de locomoci´on dado, y una vez que el sistema se establec´ıa en un comportamiento estable propio de dicho modo, se modific´o la variable Pmodo. Dicho par´ametro fue cambiado un total de 3 veces, pasando por caminado, trote,

galope y por ´ultimo de vuelta a caminado. En la Figura 4.26 se muestra la evoluci´on temporal de las variables de los vectores de estado para todas la patas con las variaciones

Figura 4.24: Fases de cada pata en funci´on del tiempo

antes mencionadas para Pmodo. Los dem´as par´ametros del sistema se mantuvieron iguales.

Figura 4.26: Salidas de CPG-ACPO en funci´on del tiempo, Pmodovariable

Se aprecia el ajuste inmediato de las amplitudes de los vectores de estado para cada cambio de la variable Pmodo. Tales ajustes corresponden a transiciones continuas en cada

una de las formas de onda. Sin embargo se sigue observando diferencias entre la amplitud alcanzada por las ondas, y la correspondiente al atractor con radio ro = 1.

Partiendo de las distintas pruebas previamente descritas, donde se observan los comportamientos que exhibe el sistema din´amico que representa un CPG basado en cuatro ACPO interconectados, es posible identificar algunas caracter´ısticas ´utiles para generaci´on de modos de caminado en un cuadr´upedo. ´Estas son las siguientes:

• Es posible establecer referencias de desfase a partir de una variable ´unica (Pmodo),

para un modo de caminado en particular.

• Se encuentra definido un vector de estado (q) para cada una de las patas, as´ı como su gradiente en todo el plano ( ˙q).

• Es posible ajustar el radio del atractor c´ıclico de cada uno de los osciladores mediante el par´ametro ro.

• Se puede controlar la velocidad de oscilaci´on a trav´es del par´ametro ωi.

• La convergencia del vector de estado al atractor c´ıclico puede ser controlada mediante el factor g, que escala la componente de q perpendicular al ciclo de radio ro.

Estas caracter´ısticas pueden ser aprovechadas para modelar el acople de fase entre las patas del robot cuadr´upedo. No obstante, un modelo de CPG-ACPO resulta incompleto al quedar sin soluci´on la coordinaci´on de los movimientos de las articulaciones dentro de cada una de las patas. Aparte, se pudo identificar algunos casos donde el sistema de osciladores acoplados exhibe un comportamiento que afectar´ıa de manera negativa al proceso de locomoci´on completo. Estos son:

• Para valores de g bajos (entre 0,1 y 1 por ejemplo), el vector de estado para un oscilador ACPO simple NO converg´ıa al atractor c´ıclico deseado. El sistema por el contrario diverg´ıa, aumentado continuamente la amplitud de q: el sistema era inestable.

• El sistema es muy sensible a la resoluci´on de paso en la simulaci´on al usar Euler. A diferencia del caso de las CTRNN, donde un paso de 0,1 resultaba suficiente; pero para el ACPO se necesario un paso de simulaci´on menor o igual a 0,001. Este proble- ma puede ser resuelto mediante el uso de otras t´ecnicas para c´alculo con ecuaciones diferenciales.

• El espacio natural de salida de cada vector es una circunferencia descrito por com- ponentes de naturaleza sinusoidal. La generaci´on de se˜nales con diferentes formas de ondas bas´andose solamente en ACPO a´un no ha sido resuelto.

Related documents