CHAPTER 4. TAMING ENERGY CONSUMPTION IN DATA CENTERS WITH
4.5 Testbed and CoolCloud Implementation
4.5.4 VMware DRS and DPM
Éstas son, pues, las cuatro reglas de transición que en nuestra simulación pueden determinar el cambio de un estado a otro entre dos generaciones sucesivas. El estado, ya lo hemos indicado, es el conjunto de las estrategias adoptadas por cada uno de los agentes que componen el mundo.
Antes de terminar con este apartado, quisiera hacer un par de consideraciones.
a) Excepto la regla replicator dynamics, las otras tres hacen referencia al modo en que un agente racional podría cambiar (o conservar) la estrategia que ha de emplear, o la que le enseñaría a sus descendientes, o la que éstos copiarían del entorno. Replicator dynamics, sin embargo, difícilmente puede representar un tipo de elección “racional”, pues un agente no puede en principio elegir emplear simultáneamente diversas estrategias en diferentes proporciones. Nos falta trazar un equivalente de lo que sería esta regla entendida como un criterio de elección racional. Podría entenderse que un agente escoge al azar entre ciertas estrategias, valiéndose de una lotería en la que cada opción tiene una cantidad de “números” proporcionales al éxito que ha obtenido. Pronto veremos que de hecho es así cómo funciona el programa cuando esta regla es seleccionada214.
b) Aunque Skyrms la considere “the most thorougly studied model of cultural evolution”215, la ecuación Replicator dynamics (y su correspondiente regla) se usan mayormente en modelos de evolución biológica, mientras que las otras tres reglas representan mejor la evolución cultural. Más en concreto, Replicator dynamics “models [...] random encounters in an
214 Cfr. infra 3.3.3
infinite population”216. En cualquier caso, qué tipo de cambio es el que realmente estarían representando estos diferentes criterios, es algo que queda sujeto a la interpretación que se desee darle a la simulación. Los agentes artificiales, en sentido riguroso, no copian nada; por otra parte, tampoco hay una razón por la cual los pagos de un juego, en un modelo biológico, deban expresar única y exclusivamente el número de descendientes.
Lo cierto es que en todos los juegos que analizaremos en el próximo capítulo (DP, Ultimátum, Gallina, Caza del venado y Trust Game) la aparición y estabilidad de las conductas cooperativas o altruistas es mucho más frecuente cuando el paso de una generación a otra se produce de acuerdo con alguna de las últimas tres reglas (2 – 4), las cuales representan mejor lo que sería una deliberación racional. Esta marcada tendencia se observa incluso cuando la transición de una generación a otra sigue el patrón de lo que sería un proceso de reproducción sexual, esto es, ajeno a cualquier imitación “inteligente” de un agente maximizador.
A fin de comprender mejor este punto, conviene explicar ahora cómo se produce exactamente esta herencia o imitación entre los agentes artificiales. Ya hemos indicado que en
Bichos una estrategia es un conjunto de variables que determinan cómo se efectúan una serie de
instrucciones (algoritmo). Estas instrucciones, a su vez, vinculan una serie de datos obtenidos del entorno (las conductas ajenas) con una respuesta (la conducta del agente, A, que estemos considerando).
El apéndice A está dedicado a la exposición prolija de estos parámetros y cómo definen diferentes tipos de disposición. Por el momento será suficiente considerar sólo algunas de estas variables para ilustrar en qué sentido los jugadores de Bichos pueden reproducirse sexual o asexualmente.
El primer paso en la serie de instrucciones que llevan al agente artificial (A) a tomar una decisión, es observar el grado de cooperación y equidad que el agente con el que interactúa (B) ha mostrado en sus “acciones” previas. Ahora bien, A puede interesarse por una cierta cantidad n de esas jugadas anteriores de B. El jugador B puede haber participado hasta el momento en 10 interacciones, y sin embargo a A podrían “interesarle” sólo lo ocurrido en sus últimos 5 movimientos217. Este número —que en Bichos podría ser cualquier otro comprendido entre 1 y 15— se almacena en una variable que denominamos “memoria”, y será copiado en la variable “memoria” de cualquier otro individuo que decida imitar a A.
216 Skyrms, 2004, p. 23
Otras variables, que llamaremos genéricamente “sensibilidad”, determinan el grado de atención o importancia que una estrategia presta a la cooperación o la equidad mostrada hasta el momento por algún otro jugador. Hay 32 “genes” en total, pero aquí nos bastan estos pocos ejemplos para entender que este conjunto de parámetros —que no son más que posiciones sucesivas en la memoria del ordenador— pueden considerarse el “genoma” de un cierto individuo. La denominación no es arbitraria, ya que cada uno de estas variables o genes puede ser heredada de un individuo a otro al cabo de una generación; y del mismo modo pueden sufrir cambios aleatorios (mutaciones). En sus trabajos más recientes, Axelrod, Skyrms y Danielson estudian las posibilidades de agentes artificiales con “genes”, y además de las mutaciones consideran la recombinación (crossover) como fuente de variación. El proceso de recombinación viene a simular lo que en animales y plantas sería la reproducción sexual: al heredar una estrategia, un agente toma genes de dos estrategias diferentes (las dos más exitosas, de acuerdo con alguna de las reglas vistas anteriormente). Obviamente esto es mucho más apropiado como simulación de evolución biológica que cultural: si se quisiese darse una interpretación cultural a este proceso de recombinación, habría que decir que los agentes “copian” rasgos de dos disposiciones diferentes.
El procedimiento mediante el que se simulan estas mezclas de genes es conocido como “algoritmo genético”. Se trata de una técnica empleada en inteligencia artificial, originalmente desarrollada por Holland218 y aplicada por Axelrod a las simulaciones que siguieron a sus dos primeros torneos organizados219. Según los resultados extraídos de los ensayos de Axelrod, el uso de algoritmos genéticos, además de eliminar cualquier teleología introducida por el programador, favorece el proceso de ensayo y error que permite a la selección natural “experimentar” con una mayor variedad de estrategias hasta encontrar el equilibrio adaptativo.
Por el contrario, si un agente “copia” el genoma completo de un solo individuo, esto es mucho más apropiado como simulación de la evolución cultural. Su equivalente biológico sería la reproducción asexual. Hay que tener en cuenta que la recombinación de genes no representa una especie de “sincretismo” donde cada agente toma lo mejor de dos opciones diferentes. Qué genes son tomados del padre, y cuáles de la madre, está determinado aleatoriamente. Por ello, el modelo adecuado de la evolución cultural o el aprendizaje consiste en copiar la totalidad de las variables de un solo individuo. Desde luego los seres humanos somos capaces de tomar lo que consideramos mejor de dos o más conjuntos diferentes, pero un tipo de razonamiento tan inteligente queda fuera del alcance y del propósito de estas simulaciones.
218 Cfr. Holland, 1992 219 Cfr. Axelrod, 1997, cap. 1
En cualquier caso, que la dinámica evolutiva sea “biológica” o “cultural”220 tiene poca influencia en el éxito de las conductas, en comparación con el tipo de regla de transición que se emplee, que resulta ser un factor mucho más determinante. En particular, “replicator dynamics” es una regla que dificulta la evolución de la cooperación mucho más que las otras tres reglas, que como decíamos serían un modelo más adecuado de decisión racional. A continuación podemos ver una serie de resultados obtenidos simulando una población de 1000 individuos jugando al DP iterado. Cada agente interactúa con sus 8 vecinos más inmediatos221, 4 veces contra cada uno222, y se considera el grado de cooperación medio de toda la población a lo largo de 1000 generaciones223. Subrayo los resultados correspondientes a la regla Replicator dynamics para destacar el grado de cooperación que genera, inferior al de las otras reglas.
Tipo de reproducción Regla de transición Grado medio de cooperación
tras 1000 generaciones Asexual (evolución cultural) Replicator dynamics 0,22 Asexual MaxiMax 0,409 Asexual MaxiMin 0,734
Asexual Utilidad esperada 0,573
Sexual (evolución biológica)
Replicator dynamics 0,349
Sexual MaxiMax 0,572
Sexual MaxiMin 0,836
Sexual Utilidad esperada 0,581
220 Una vez más escribo estos términos entre comillas, porque el que sean un modelo de uno u otro tipo de cambio es
en las simulaciones una cuestión de interpretación.
221 Recordemos que las interacciones con vecinos favorecen las conductas cooperativas.
222 Comparando mi simulación con los experimentos relacionados por Axelrod, salta a la vista que en estos últimos
el número de iteraciones entre cada par de agentes es mucho mayor. En las competiciones de Axelrod el DP se repetía hasta 200 veces. Sin embargo, como en mi simulación los jugadores pueden escoger diversos grados de cooperación, y no sólo los extremos de cooperación y fraude totales, esto puede verse como una “condensación” de varias jugadas en una. Por ejemplo, si en tres jugadas diferentes del DP un agente ha cooperado una vez y defraudado dos, su nivel medio de cooperación sería 1/3. Ahora bien, este grado de cooperación puede manifestarse también si un jugador “coopera 0,33” en una sola jugada. (El análisis de estos juegos continuos lo desarrollo en el capítulo 4.3).
223 Este grado medio de cooperación se mide computando cada uno de los movimientos de todos los jugadores en
sus interacciones reiteradas, a lo largo de las 1000 generaciones. En total, pues, habrá habido 16 millones de decisiones = 500 . 8 . 4 . 1000. La cooperación se mide como 1, y el fraude como 0. Además, en el modelo que propongo es posible cooperar más o menos, es decir, escoger opciones comprendidas en el continuo 0 – 1 (véase la nota anterior).