Recommendation - CONCLUSION AND RECOMMENDATIONS

CHAPTER 5: CONCLUSION AND RECOMMENDATIONS

5.3 Recommendation

Una vez que se determinó a partir de las pruebas en tiempo de ejecución que los resultados en el simulador y en el robot real son constantes y equivalentes, fué necesario probar el funcionamien- to de las redes de comportamientos y las redes neuronales, para ello se utilizó una función de desempeño, la cuál está constituida por dos funciones; una función que permite evaluar la conducta de evitar obstáculos y una función que evalúa la identificación de la comida.f_dp=feo+fic. La primera función consistió en premiar a la ejecución más rápida del robot, el cual viaja en l´ınea recta evitando los obstáculos que se presenten en su camino, está función se generó tomando como base la fórmula que presentan Floreano y Mondana en su art´ıculo [?]:

f_eo=

1500

En donde vl es la velocidad de rotación lineal en ambas ruedas del robot, vd es la velocidad de rotación diferencial en ambas ruedas y maxir es el valor del sensor infrarrojo más alto. Está fórmula nos permite obtener que tan rápido se desplaza un individuo sin chocar con los obstáculos que se presentan en el camino. As´ı que para lograr nuestro objetivo se implementó di- cha fórmula en los experimentos realizados en el simulador Webots para obtener el valor de la función de desempeño al final de cada corrida y, as´ı poder determinar como se comportan cada una de las redes dependiendo de las situaciones variables que se presenten. Cabe mencionar que para el caso del simulador Webots el valor máximo de velocidad es 20 y el valor más alto para un sensor es de 1023 unidades; por lo que para obtener la velocidad de rotación lineal se deben sumar las velocidades de los motores (derecho e izquierdo) en cada iteración y dividir esta suma entre 20 (velocidad máxima); para la velocidad de rotación diferencial se necesita restar a la velocidad del motor izquierdo la velocidad del motor derecho y esta diferencia debe dividirse entre 20 (velocidad máxima); mientras que para el valor del sensor más alto se debe seleccionar de los ocho sensores del robot, aquel que tenga el valor más alto para dividirse entre 1023. Con estas especificaciones se llevaron a cabo 100 corridas t´ıpicas, es decir, las más representativas tanto en la red neuronal como en la red de comportamientos en el simulador Webots.

Dado que también es importante determinar el impacto que tiene la cantidad de comida que identifica el robot en cada corrida, puesto que uno de los principales propósitos de las ratas es obtener la mayor cantidad de comida posible, as´ı que fué necesario evaluar el desempeño de las redes con respecto a la cantidad de comida que identifican, por lo que la segunda función consistió en premiar a la ejecución que identifica la mayor cantidad de comida a lo largo de su exploración en el ambiente donde se desenvuelve, as´ı que la fórmula que se utilizó para esta evaluación es la siguiente:

f_id=

1500

X tot it

prom it∗(no cil)∗(K)

En dondetot it es el total de las iteraciones que se ejecutan en cada corrida, que para el caso de estos experimentos corresponde a 1500, prom it es el promedio del valor de las iteraciones en las cuales se identificó la comida a lo largo de la corrida,no cil es el número total de cilindros que se identificarón en la corrida yK es una constante, cuya función es premiar la identificación de comida y tiene un valor de 15. Para poder obtener los valores de esta función, fué necesario implementar la fórmula en los experimentos realizados en el simulador Webots y as´ı poder evaluar como se comportan la red neuronal y la de comportamientos en cuanto a la identificación de comida. Las pruebas que se llevaron a cabo con esta fórmula consistieron de 100 corridas t´ıpicas en el simulador Webots con 1500 iteraciones cada una de las corridas para ambas redes.

Una vez que se obtuvieron los valores para cada función a lo largo de las 100 corridas t´ıpicas, se determinó el valor total de la función de desempeño mediante la suma de los valores de las funciones evitar obstáculos e identificar comida para cada una de las 100 corridas t´ıpicas que se ejecutaron y, se obtuvieron los resultados siguientes, los cuáles se presentan en las gráficas??y??

Como podemos observar en la gráfica??las 100 corridas t´ıpicas que se llevaron a cabo con las dos redes, la red de comportamientos tuvo mejor desempeño que la red neuronal ya que los valores obtenidos en las corridas para la función de desempeño, la red de comportamientos obtuvo valores más altos que los que obtuvo la red neuronal, lo cuál ´ındica que la red de comportamientos es más eficientes al momento de evitar obstáculos e identificar comida que la red neuronal, es decir, la red de comportamientos viaja más tiempo en l´ınea recta y es más rápida, as´ı como identifica una mayor cantidad de comida que la red neuronal. Lo anterior puede corroborarse en la gráfica

??, en donde se muestran los valores acumulados de la función de desempeño; en está gráfica el objetivo es determinar si existe algún punto de estabilización, es decir, si el dominio en cuanto a los valores de la función se mantienen constantes a lo largo de las 100 corridas t´ıpicas as´ı como establecer si la diferencia que existe en cada una de las corridas es constante o si var´ıa; pero como podemos observar el dominio de la red de comportamientos sobre la red neuronal es constante ya que no existe un punto de equilibrio en los valores acumulados de la función de desempeño, sino por el contrario los valores de la red de comportamientos incrementan en cada corrida estable- ciendo una diferencia considerable en dichos valores al final de los experimentos y la diferencia en los resultados en cada corrida es variables, es decir no corresponde al mismo valor en cada caso.

Figura 5.9: Gráfica que muestra los resultados obtenidos en la función de desempeño integrada por la función de evitar obstaculos y la de identificar comida, para evalúar el de- sempeño de la red de comportamientos y la neuronal y, establecer un parámetro de comparación en cuanto a su funcionamiento

Figura 5.10: Gráfica que muestra los resultados obtenidos de la acumulación de los valores de la función de desempeño en las 100 corridas t´ıpicas. Se debe observar si existe algún punto de comparación o estabilización en el desempeño de la red de comportamientos y la neuronal, as´ı como determinar si la diferencia entre las redes en cada corrida es constante o variable

Es importante mencionar que en esta sección solo se analizaron las gráficas de la función de de- sempeño total, pero las gráficas de la función de desempeño para evitar obstáculos e identificar comida se encuentran en los apéndice E.

5.3. Res´umen del Cap´ıtulo.

En este cap´ıtulo, se llevaron a cabo una serie de experimentos que como primer objetivo ten´ıan determinar si el funcionamiento de la red de comportamientos y la neuronal en el simulador Webots es equivalente al funcionamiento que se observa de ellas en el robot Khepera en tiempo real; lo anterior fué con el objeto de que en experimentos posteriores en los que sea necesario contar con una mayor cantidad de corridas e iteraciones, pudieran llevarse a cabo únicamente en el simulador sin sacrificar eficiencia y confiabilidad en los resultados, lo anterior se pudo comprobar en los etogramas elaboraborados para cada experimento en los cuales se observó la equivalencia de los resultados en tiempo real y en tiempo de simulación, as´ı mismo, se obtuvieron los porcentajes de activación de cada comportamiento para comparar y determinar si los porcentajes obtenidos en el simulador eran equivalentes a los de tiempo real, lo cual se cum- plió. As´ı que los experimentos para la evaluación del desempeño de las redes, únicamente se llevaron a cabo en el simulador Webots, lo cual nos permitió un ahorro en tiempo y recursos, ya que las ejecuciones en el robot real son más tardadas y se puede poner en riesgo su integridad.

En cuanto al desempeño de la red de comportamientos y la red neuronal, los resultados obtenidos fueron satisfactorios para los propósitos de nuestra tesis ya que fué posible establecer diferencias en el funcionamiento de ambas redes a través de una función de desempeño. Esta función esta integrada por dos funciones, una que evalúa la rapidez de exploración al evitar obstáculos y otra que evalúa la cantidad de comida que identifica. Las diferencias en el desempeño de las redes fueron considerables, ya que en las 100 corridas t´ıpicas que se llevaron a cabo, los resultados obtenidos para la función de desempeño de la red de comportamientos superó en todas las corridas, a los resultados de la red neuronal y nunca llegaron a estabilizarse, por lo que se puede concluir que en cuanto a la solución de tareas de forrajeo, las redes de comportamientos dan mejores resultados que las redes neuronales. As´ı mismo es importante recalcar que la diferencia entre los resultados obtenidos para cada una de las redes en cada corrida, no es constante. A continuación presentamos las conclusiones del trabajo de tesis.

Conclusiones

Para finalizar con el desarrollo y an´alisis de este proyecto de tesis es importante mencionar las ventajas y desventajas de los resultados obtenidos a lo largo de este proyecto para poder determinar si dichos resultados son satisfactorios para sus prop´ositos.

El primer punto que es importante analizar son los resultados obtenidos en el funcionamiento de la red de comportamientos en tiempo real implementada en el robot Khepera, as´ı como el desempeño de esta red en ambientes dinámicos, ya que fué el punto de partida de esta tesis. Como pudimos observar en el cap´ıtulo 5, el comportamiento de la red en tiempo real es con- gruente con el obtenido a nivel simulación, es decir, no existen variaciones en las conductas que se activan a lo largo de las ejecuciones, por lo que no importando la opción que se tome para probar las redes de comportamientos (simulador o robot real) los resultados no se alteran, lo cual nos facilita el análisis de los resultados ya que si en determinado momento no se puede contar con el robot, es posible realizar las pruebas a nivel simulación y los resultados obtenidos serán confiables. Esto se debe en gran parte a que las redes de comportamientos están inspiradas en un marco etológico por lo que modelan de manera natural los comportamientos de animales, asimismo su robustez permite controlar de manera eficiente al robot real. Cabe mencionar que además de una inspiración etológica, las redes de comportamientos se basan en la arquitectura de subsumción y en el mecanismo de selección de acción basado en fusión de sensores.

En cuanto al funcionamiento de las redes de comportamientos en ambientes dinámicos en tiempo real, es importante mencionar que las redes se ajustan a las condiciones del ambiente, las cuales se actualizan constantemente, por lo que van ejecutando las conductas en base a estos cambios sin alterar su desempeño; a pesar de esto, en ocasiones surgen algunos conflictos en el momento en que se activa un comportamiento y las condiciones cambian en ese preciso instante ya que por un momento no se actualizan dichos cambios y la red no actúa correctamente, este retar- do que ocurre en la red al activarse un comportamiento requiere esperar la retroalimentación de la red en la siguiente iteración. Pero en terminos generales podemos concluir que las redes de comportamientos se adaptan a los cambios en tiempo real y funcionan de manera satisfactoria.

Otro de los aspectos relevantes del trabajo fué comprobar que el valor que Maes propone en su art´ıculo, para los valores que determinan la inhibición/activación de comportamientos [?] permiten un buen desempeño en la red de comportamientos, ya que dichos parámetros son los que regulan la activación de las conductas a través de la cantidad de energ´ıa aportada a la red mediante las ligas o conexiones entre las conductas. El problema en estos parámetros radica en que no existe una técnica que determine los valores que debe tomar cada uno de ellos, puesto que los valores dependen de la experiencia del diseñador de la red y del tipo de problema que se desea resolver, por lo cuál sus valores deben irse ajustando de manera artesanal a través de prueba y error hasta encontrar los valores que produzcan los mejores resultados. Actualmente existen trabajos en el área de algor´ıtmos genéticos orientados a la solución de este problema, pero aún no se tienen resultados concretos [?].

Pero considerando que no solo quer´ıamos analizar el desempeño del mecanismo de Maes sino también determinar si éste mecanismo es el más adecuado para emular comportamientos de forrajeo fué necesario tomar un mecanismo alternativo en la simulación de estos comportamientos para poder establecer condiciones de comparación con la red de comportamientos, por lo que se utilizaron las redes neuronales. Las pruebas para establecer criterios de comparación consistieron en programar los comportamientos de forrajeo de la rata en ambos tipos de redes para que a partir de los resultados obtenidos en las ejecuciones, poder determinar cuál de ellas funciona mejor. Antes de evaluar el desempeño de la redes, se analizaron los resultados obtenidos en tiempo real y tiempo de simulación para establecer si existen diferencias en los resultados, para ello se generaron gráficas similares a los etogramas en donde se presentaban la activación de los comportamientos y a través de esto determinar si conservan un mismo patron de conducta (ver figuras ??,??,??y??). As´ı mismo se obtuvieron los porcentajes de activación de cada una de las conductas tanto a nivel simulación como en tiempo real para determiran si los valores de estos porcentajes eran equivalentes (ver figuras??,??,??y??). Dado que estas pruebas fueron satisfactorias pues se obtuvo que los resultados obtenidos para la red de comportamientos y la neuronal son equivalentes, se evalúo el desempeño de las redes mediante una métrica.

La métrica que se utilizó para llevar a cabo el análisis de la red de comportamientos y la neuronal, fué una función de desempeño, la cual estuvo formada por dos funciones; una para evitar obstáculos, la cuál evalúa a los individuos mas rápidos que viajan en l´ınea recta evitando obstácu- los esta función involucra las velocidades de rotación lineal y diferencial de las ruedas del robot as´ı como el valor más alto del sensor infrarrojo y; otra para identificar comida, la cual evalúa a los individuos que identifican la mayor cantidad de comida durante la exploración del ambiente. Los resultados obtenidos al evaluar el comportamiento de cada una de las redes, favorecen a

las redes de comportamiento dado que después de 100 corridas t´ıpicas con 1500 iteraciones los valores de la función más altos fueron obtenidos con la red de comportamientos Los valores de la red de comportamientos fueron los más alto tanto en la función general como en las funciones que la integran, es decir, en todas las pruebas que se realizaron la que siempre gana es la red de comportamientos.

Por lo tanto a partir de los resultados obtenidos en la función de desempeño, se puede determinar que, para el caso de los comportamientos de forrajeo las redes neuronales, a pesar de ser clasificadores robustos, se encuentran en desventaja con las redes de comportamientos ya que estas muestran mayor robustez al momento de establecer las condiciones que predominan en un ambiente dinámico y por lo tanto se obtienen mejores resultados y más consistentes con las redes de comportamientos. Cabe destacar que ambas redes presentan las misma desventaja en cuanto a su diseño, ya que en ambas redes (neuronales y de comportamientos) depende del problema a resolver y de la experiencia del diseñador. En el caso de las redes neuronales no existe una técnica para determinar la topolog´ıa de la red, el número de capas intermedias, el número de neuronas en cada una de las capas ni para el número de ejemplos a entrenar; mientras que para las redes de comportamientos el ajuste de parámetros que coordinan la activación de comportamientos debe hacerse de manera manual y la definición de los comportamientos es subjetiva, ya que dependerá del problema a resolver por lo que en ocasiones son más dif´ıciles de diseñar que las redes neuronales, pero para ello existen metodolog´ıas que te auxilian en su diseño, tal es el caso de la metodolog´ıa utilizada en esta tesis y que fué propuesta por Montes [?]

En base a lo anterior, es importante destacar tres aspectos que este trabajo de tesis proporcio- na. El primero es el hecho de que las redes de comportamientos funcionan adecuadamente en tiempo real y con ambientes din´amicos. El segundo es que el funcionamiento de las redes de comportamientos puede evaluarse mediante los comportamientos de forrajeo. Y por ´ultimo es que las propiedades que presentan las redes de comportamientos demuestren su robutez para resolver tareas dentro de un robot real.

Trabajos Futuros

Dentro de las posibles extensiones que podr´ıan llevarse a cabo a partir de este trabajo de tesis, b´asicamente estar´ıan enfocadas en tres aspectos que le dar´ıan una mayor solidez y trascendencia al trabajo, y son:

1. Dado que el principal reto en el diseño de las redes de comportamientos es el ajuste de parámetros, uno de los trabajos futuros podr´ıa ser incorporar al algoritmo de selección de acción de Maes la metodolog´ıa de algoritmos genéticos propuesta por Darran [?] para obtener el valor de estos parámetros ó también mediante la experimentación de diversos ejemplos que produzcan diferentes valores. Para que posteriormente se implemente lo rea- lizado en este trabajo de tesis con los nuevos valores, ya que no se llevó a cabo el ajuste de parámetros puesto que se tomaron los valores que Maes propone en su art´ıculo [?] y no se presentó problema alguno, el objetivo de esta extensión ser´ıa determinar si con un ajuste

In document Marketing plan for Ramada Resort, Accra (Page 59-66)