CHAPTER 4: EXPERIMENTATION THE-SETUP AND
4.3 Details of experimentation
4.3.1 Experimentation with only solar panel
Los MVA est´an definidos por su posici´on espacial real [xr, yr] (se asume
que vuelan a una altura constantezr) y su posici´on estimada (su orientaci´on,
dada por su ´angulo de gui˜nada, se define por la direcci´on del movimiento y no
se requiere expl´ıcitamente). Tambi´en tienen una precisi´on estimada (ae), que
se describe como la desviaci´on est´andar de su posici´on estimada. La figura 7.4 ilustra el funcionamiento de los MVA. La c´amara permite detectar los diferentes
niveles de exploraci´on del entorno, que tendr´ıa un color diferente seg´un el nivel
de exploraci´on de cada celda. Tambi´en permite detectar la distancia al marcador m´as cercano, en caso de estar en rango de observaci´on de uno de ellos. La capacidad de exploraci´on actual depende del error en la localizaci´on. La unidad de control es una red de neuronas artificiales de tipo “feed-forward” con tres neuronas en la capa de entrada, una neurona en la capa oculta y una neurona en la capa de salida. El genotipo a codificar para cada individuo es un vector de valores reales en el rango [-1,1] que corresponden con los par´ametros de esta red. La salida de la red est´a discretizada en 5 zonas correspondientes a las 5 acciones predeterminas que establecen las salidas de los motores para realizar esas acciones. Estas acciones son: explorar en zona cercana, explorar en zona lejana, incrementar la precisi´on movi´endose hacia un marcador, compartir precisi´on y evitar marcador m´as cercano (movimiento en sentido opuesto).
Las diferentes configuraci´on de la degradaci´on que se estudiar´an en este
Figura 7.4: Esquema de funcionamiento de los MVA
Tabla 7.1: Par´ametros del entorno simulado
Longitud del entorno (L) 768
´
Area total L2
N´umero de marcadores fijos 3
Rango de detecci´on de marcadores fijos L/4
Rango de detecci´on de marcadores m´oviles L/16
´
Angulo m´aximo de detecci´on de marcadores ⇡/2
Velocidad m´axima (Vmax) L/50
M´axima precisi´on proporcionada por un marcador L/10
Error en precisi´on inicial L/10
Degradaci´on de precisi´on {Vmax/16, Vmax/8,0}
Tabla 7.2: Par´ametros del algoritmo can´onico de dEE para la tarea de vigilancia
Iteraciones 100000
Tiempo de vida m´aximo (Tmax) 1000
Tiempo de madurez 1
Criterio de selecci´on Mayor calidad
Tama˜no m´aximo ventana de selecci´on (Smax) 40
Probabilidad de b´usqueda local 0.99
Coeficiente de mediocridad 0.01
Calidad m´axima actual Autom´atica
degradaci´on Vmax/8 y degradaci´on 0, siendo Vmax la velocidad m´axima del
MVA. Debido a que inicialmente los individuos parten con un error en precisi´on (L/10), siendo L la longitud de uno de los lados del entorno, en el caso de no tener degradaci´on este nivel de precisi´on es suficiente como para realizar la tarea
correctamente, y no necesitar´ıan en ning´un momento observar marcadores para
mejorar su estimaci´on de la posici´on.
Los par´ametros del algoritmo can´onico se muestran en la tabla 7.2 y con- cuerdan con las conclusiones sacadas del cap´ıtulo de pruebas te´oricas para el espacio de calidad no separable con ´optimo en dos especies heterog´eneas: el tiempo de madurez se ha fijado a un valor muy bajo, el coeficiente de mediocri-
dad tambi´en ha sido fijado a un valor muy bajo. La probabilidad de b´usqueda
local se ha fijado a un valor muy alto, que era el valor este par´ametro que me-
jor resultados obten´ıa en esa funci´on no separable, y el tama˜no m´aximo de la
ventana de selecci´on se ha fijado a un valor alto. Dada esta configuraci´on expe- rimental se ejecut´o el algoritmo cDEE para optimizar los controladores de 40
MVAs (el an´alisis de tama˜no de equipo en las pruebas te´oricas mostraban que
40 era adecuado) ejecut´andose 25 veces para cada configuraci´on de degradaci´on y obteniendo una calidad global media de todas las ejecuciones. Los resultados se muestran en la figura 7.5, en donde se muestran en el eje horizontal las itera- ciones y en el eje vertical el nivel de exploraci´on media para las 25 ejecuciones. Este nivel de exploraci´on media est´a medido en una divisi´on del entorno de 4x4 celdas, de forma que el m´aximo nivel de exploraci´on te´orico, si todas las celdas estuvieran totalmente exploradas, es 16. Es t´erminos pr´acticos, debido
a la extensi´on del entorno y el n´umero de MVAs, un nivel de 13 ser´ıa ´optimo.
Como era de esperar, el problema sin degradaci´on, que es el m´as sencillo, es el que obtiene mayor nivel de exploraci´on, seguido por degradaci´on Vmax/16 y Vmax/8. Es decir, a medida que la degradaci´on aumenta y el problema se hace m´as complejo, disminuye el nivel de exploraci´on alcanzado. Otro aspecto a tener en cuenta es el r´apido incremento del nivel de exploraci´on en el primer cuarto de todas las iteraciones, en donde el algoritmo es capaz de realizar un primer ajuste de la soluci´on que luego se mantiene a lo largo del tiempo.
Se ha comprobado que los par´ametros definidos para el algoritmo cDEE tienen una respuesta similar en la tarea, y el algoritmo obtiene buenas soluciones
con los par´ametros fijados seg´un los criterios concluidos de las pruebas te´oricas.
Por ello, en este experimento es m´as interesante analizar las soluciones obtenidas
diferentes configuraciones del experimento.
Para analizar lo que ocurre en t´erminos de los comportamientos que est´an seleccionando los individuos, se almacena la frecuencia en la que se selecciona cada uno de los comportamientos de cada individuo en cada paso de tiempo y con estas frecuencias se puede calcular la media de porcentaje de uso de ca- da uno de los comportamientos. Este porcentaje es lo que se representa en las siguientes figuras. En la figura 7.6, se muestra en una gr´afica de ´areas la pro- porci´on de cada uno de los comportamientos obtenidos para la configuraci´on
con degradaci´onVmax/16. Como se puede ver el comportamiento predominante
es la exploraci´on en zona cercana, seguido del comportamiento de incrementar precisi´on. Otro comportamiento interesante es el de compartir precisi´on, que se vuelve relevante a partir de la mitad de las iteraciones. El resto de comporta- mientos: evitar marcador y explorar en zona lejana pr´acticamente no se realizan nunca. Este resultado es el esperado, ya que la funci´on de calidad premia fun- damentalmente explorar y compartir precisi´on actuando como marcador m´ovil. Las condiciones de degradaci´on regular´ıan la necesidad de m´as o menos pro- veedores de degradaci´on pero este caso es una degradaci´on media. La misma
gr´afica, para el caso con degradaci´onVmax/8 se muestra en la figura 7.7. En este
caso, el comportamiento de explorar en zona cercana no es tan predominante, y est´an m´as presentes que en el caso anterior los comportamientos de incremen- tar precisi´on y de compartir precisi´on. Esto es lo esperado, ya que debido al aumento de la degradaci´on, el algoritmo adapta la soluci´on con individuos que realizan con mayor frecuencia los comportamientos que aumentan la precisi´on. Los comportamientos que antes no eran muy frecuentes para este caso tampo- co lo son, aunque aumenta la proporci´on para el comportamiento de explorar
en zona lejana. Por ´ultimo, la gr´afica para la configuraci´on sin degradaci´on se
muestra en la figura 7.8. Resulta clara la diferencia con las otras dos gr´aficas, ya que en esta configuraci´on, al no necesitar aumento de precisi´on, la tarea con
mayor frecuencia y pr´acticamente la ´unica es la de exploraci´on en zona cercana.
Por tanto, se ha mostrado el efecto de la degradaci´on de la precisi´on en la localizaci´on para esta tarea, que modifica el espacio de calidad ya que se elimi- nan algunas subtareas necesarias para la tarea principal. La tarea principal es la de explorar pero para eso se requiere que algunos individuos de la poblaci´on compartan precisi´on en una subtarea diferente. El algoritmo cDEE, al igual que se ha comprobado en funciones te´oricas, es capaz de adaptar su soluci´on a los diferentes espacios de calidad que presenta esta tarea de vigilancia colectiva. El
Figura 7.5: Calidad global media obtenida por el algoritmo con degradaciones Vmax/16, Vmax/8 y sin degradaci´on
Figura 7.7: Proporci´on de porcentajes para degradaci´on Vmax/8
experimento confirma que la tarea sin degradaci´on es una tarea como la funci´on sint´etica de una especie ya que solo es necesaria un solo tipo de comportamiento que es explorar, mientras que la tarea con degradaci´on se necesitan varios com- portamientos, ya que los individuos no pueden explorar si no obtienen precisi´on para navegar.