The sample - Theoretical framework - The influence of BBBEE regulations on entrepreneurs inthe

3. Theoretical framework

4.2 The sample

gramaci´on gen´etica

Los cinco pasos principales para la definici´on de un planteamiento basado en PG se muestran en la figura 4.2 (Koza, 1992). Los pasos preparatorios (mostrados en la parte superior de la figura) son las entradas prove´ıdas por el dise˜nador del algoritmo al sistema de PG, mientras que el programa computacional, que se muestra en la parte inferior de la figura, corresponde a la salida de dicho sistema.

El primer paso consiste en identificar el conjunto de terminales para el problema. Dicho conjunto es representado por la letraT. Las terminales corresponden a las variables y las constantes de entrada del programa, as´ı como las variables y las constantes que serán encontradas por el PG durante el método de búsqueda. Dentro de este conjunto también se encuentran funciones que utilizan cero argumentos. Las constantes que utiliza la PG en el conjunto T son denominadas como constantes ef´ımeras aleatorias y se representan con la letraℜ.

Figura 4.2: Los cinco pasos escenciales para la creaci´on de un algoritmo de PG.

Después de especificar el conjunto de terminales debe definirse el conjunto de funciones (F), las cuales pueden ser operaciones aritméticas (suma, resta, multiplicación), operadores lógicos (and, or, not), funciones trigonométricas (seno, coseno, tangente), condicionales (if, else, case), ciclos (do, while, for) o aún subrutinas predefinidas (move, readSensor, sort). Estas funciones toman como parámetro uno o más de los elementos del conjunto de terminales o de los valores regresados por otras funciones, retornando a su vez algún valor como resultado o realizando alguna modificación en el ambiente del problema que se está resolviendo. El número de argumentos que recibe una función es denominada como la aridad de esa función.

Para la definición del conjunto T y el conjunto F, Banzhaf y Francone(1998) aconsejan que en el principio de un proyecto de PG no se debe invertir mucho tiem- po diseñando funciones y terminales complejas para que estén perfectamente acondi- cionadas con el problema. La PG resulta una técnica lo suficientemente creativa para tomar funciones simples y combinarlas para obtener buenos resultados. De hecho, la PG frecuentemente ignora las funciones más sofisticadas en favor de las funciones más primitivas durante el proceso de evolución. Hasta el momento que la experimentación demuestre que el conjunto de funciones y de terminales más simples no están dando buenos resultados, entonces es ah´ı cuando debe comenzarse a perfeccionar los elementos de los conjuntos T y F.

Dos condiciones importantes que deben ser verificadas en la definici´on de T y

F es que cumplan con los requerimientos de suficiencia y de cerradura. La primera condición indica que los elementos de T y F son suficientes para encontrar una com- binación que pueda expresar una solución para el problema, mientras que la condición de cerradura indica que cada función debe poder aceptar como argumento cualquiera de los valores entregados por los elementos del conjunto T o cualquiera de los posi-

bles valores regresados por cualquiera de las funciones definidas para el problema. Esta ´

ultima condición aunque deseable, no resulta absolutamente requerida. En caso de que en nuestro planteamiento no pueda asegurarse que se cumpla, entonces se pueden uti- lizar otras alternativas como el descartar a los individuos que violen dicha condición o asignarles algún tipo de penalización.

Los programas de PG se pueden expresar mediante árboles con nodos etiquedados siguiendo una estructura semejante a la de programación en LISP. Los nodos internos representan funciones, predicados o acciones que requieren uno o más argumentos. Los nodos hojas representan constantes, acciones o funciones que no necesitan argumentos. Debido a esto último es que este tipo de argumentos reciben el nombre de terminales porque representan los nodos finales de la estructura del árbol. En la figura 4.3 puede verse la representación de una expresión en LISP mediante un árbol de PG.

Figura 4.3: Arbol que representa la expresi´on (+ (* 3 a) (- b (* 2 c))).

Determinar la función objetivo o de aptitud es el tercer paso para la definición de un planteamiento basado en PG. Esta función evalúa que tan bien se desempeña un programa computacional con relación al ambiente definido por el problema. Una función objetivo debe cumplir con el requerimiento de estar completamente definida, es decir, que puede evaluar cualquiera de los programas que pueden ser encontrados en cualquier generación de la población de soluciones. Para hacer esta evaluación en algunos casos se pretende que cada programa sea evaluado por una variedad de instancias seleccionadas y que a partir de estos valores pueda obtenerse un promedio como función de aptitud, mientras que en otros casos es sola una instancia sobre la que se está trabajando y el resultado final para cada programa corresponde al valor de la función de aptitud.

Los tipos de función objetivo más conocidas son las denominadas como función natural (raw fitness), función estandarizada (standardized fitness), función ajustada (adjusted fitness) y función normalizada (normalized fitness).

4.2.1. Par´ametros de control

Los últimos dos pasos para la definición de un problema basándose en PG van más relacionados con el algoritmo en s´ı. El cuarto paso consiste en determinar los parámetros o variables de control, como son M para definir el tamaño de nuestra población y G

para definir su número máximo de generaciones. Koza (1992) ennumera 19 parámetros de control para un algoritmo de PG. Estos parámetros, as´ı como los valores default recomendados por Koza pueden verse en las tablas 4.1 y 4.2.

Tabla 4.1: Par´ametros num´ericos.

par´ametro s´ımbolo default

Tama˜no de la poblaci´on M 500

N´umero de generaciones G 51

Probabilidad de cruce pc 0.9

Probabilidad de reproducci´on pr 0.1

Probabilidad de usar puntos internos para el cruce pip 0.9

Profundidad m´axima de los ´arboles Dc 17

Profundidad m´axima de los ´arboles al momento de ser

generada la poblaci´on inicial Di 6

Probabilidad de mutaci´on pm 0

Probabilidad de permutaci´on pp 0

Frecuencia de edici´on fed 0

Probabilidad de encapsulamiento pen 0

Condición de invocación de la operación de estrago decimation N IL

Porcentaje de estrago pd 0

Tabla 4.2: Variables cualitativas.

par´ametro default

Método de generación de la población inicial ramped half-and-half Método de selección para reproducción por torneo Método de selección para cruce por torneo Medición de aptitud ajustada

Uso de sobre-selecci´on para M > 1000 individuos Estrategia elitista no usada

La probabilidad de cruce, pc es tal que el que el n´umero de individuos producidos

en la siguiente generación como resultado de la operación de cruce corresponde al porcentaje equivalente al valor depc. Por ejemplo, si la población de una generación es

de 4000 y el valor de pc es de 0.9, entonces en la siguiente generaci´on 3600 individuos

son producidos como resultado de la operaci´on de cruce.

La probabilidad de reproducción, pr indica qué porcentaje de la población van a

ser utilizados para ser copiados directamente en la siguiente generación. Lo anterior quiere decir, que si la probabilidad de reproducción es de 0.1 en una población de 4000 individuos, 400 van pasar directamente a la siguiente generación mediante el proceso de reproducción.

Para escoger los puntos de cruce, usamos una distribución de probabilidad basada en el parámetro pip. Este parámetro indica la probabilidad de seleccionar un nodo

interno del ´arbol para realizar el cruce. El complemento de dicha probabilidad es pep

y corresponde a que el nodo seleccionado sea un nodo externo o terminal. Este cruce tiene como restricci´on que si en uno de los individuos es seleccionado como punto de cruce el nodo ra´ız, en el otro individuo no puede ser seleccionado como punto de cruce un nodo terminal.

La profundidad de un nodo dentro de un árbol de PG consiste en el m´ınimo número de nodos que son visitados para llegar desde el nodo ra´ız a dicho nodo. Los parámetros de profundidad Dc y Di indican la profundidad máxima que un nodo puede alcanzar

dentro de un individuo de la poblaci´on. Di corresponde a la profundidad m´axima de

los individuos de la poblaci´on inicial y Dc a la profundidad m´axima de los individuos

pertenecientes a todas las dem´as generaciones. Cuando se genera un individuo con una profundidad mayor a la permitida se inserta un nodo terminal que permita detener su crecimiento.

Además de la operación de cruce y reproducción, en PG tenemos las operaciones de mutación (pm), permutación (pp), edición (fed), encapsulamiento (pen) y porcentaje

de estrago o decimation (pd). Estos operadores fueron casi ignorados por Koza en sus

primeros trabajos de PG, sin embargo, en la actualidad, han recibido una mayor aten- ción para su aplicación (Koza y Bennett, 1999). El resto de los parámetros de control van a ser explicados más adelante en este mismo documento.

El último paso en la definición del algoritmo de PG consiste en determinar el método de aceptación de un individuo como resultado o criterio de terminación de la corrida. Este criterio de terminación puede ser por ejemplo un valor máximo o m´ınimo esperado para la solución, un número de generaciones para la corrida o un número de iteraciones sin obtener un cambio significativo en la mejora de la solución.

In document The influence of BBBEE regulations on entrepreneurs in the (luxury) food industry in the Western Cape of South Africa (Page 30-33)