Difference in Differences Estimation - Empirical Specification

CHAPTER 4: IMPACTS OF DENGUE EPIDEMICS ON HOUSEHOLD LABOR

VI. Empirical Specification

VI.2. Difference in Differences Estimation

El software Splicing versión 1.2 fue desarrollado el curso pasado como resultado de la investigación desarrollada en (Hernández, 2014) . El mismo se desarrolla con el objetivo de encontrar una combinación de clasificadores; de manera tal que se garantice una exactitud superior a la mejor alcanzada por los clasificadores individuales y a la vez, exista la mayor diversidad posible entre las predicciones de estos clasificadores.

El algoritmo desarrollado para lograr lo anteriormente expuesto utiliza una de las meta heurísticas existentes: Algoritmos Genéticos. En la modelación de la función de calidad de la meta heurística anterior se incluyen los resultados de las medidas de diversidad enunciadas en el capítulo 1 como un aspecto importante para lograr una combinación de clasificadores diversos.

En la investigación mencionada anteriormente también se proponen varias formas para combinar los resultados de estas medidas de diversidad, ellas fueron: el promedio, el máximo, el producto y un operador borroso, la explicación de cada una de ellas se encuentra en el capítulo anterior en el subepígrafe 1.4.2

Precisamente las modificaciones que se presentan en este trabajo serán sobre el operador borroso, dicho operador se implementó utilizando solamente la función de pertenencia triangular, para la cual se definieron dos términos lingüísticos: baja diversidad y alta diversidad, por tanto existe una función triangular para cada término lingüístico. El dominio o rango de las funciones estuvo entre 0 y 1 pues las medidas de diversidad fueron estandarizadas en ese intervalo, según la explicación mostrada también en el subepígrafe 1.4.1

38 Es importante destacar que la intercepción de ambas funciones se realiza en el eje de las y en 0.5 que significa grado o nivel de pertenencia igual a ese valor, pues se debe cumplir el criterio de la suma cero que plantea que para todo valor x que pertenezca al universo de discurso X, la suma de los grados de pertenencia correspondiente a cada término lingüístico es igual a uno, es decir,

Mi i

i x

x 1, donde _i x denota el grado de pertenencia de x por cada término lingüístico según la función usada (Cox, 1998). En el caso del eje de las x

que es el dominio, la intercepción también debe ser en 0.5 por lo explicado anteriormente y además las dos funciones o términos lingüísticos quedan equilibrados.

En la implementación del software se encuentran varios paquetes, los cuales se describen brevemente a continuación:

 AG: en el cual se encuentran todas las clases necesarias para la implementación de los Algoritmos Genéticos (Cromosoma, Población y Utility).

 Resources; es el paquete que contiene las imágenes usadas en el software.

 Gryphos: contiene varias clases que trabajan en la parte gráfica del software, en el proceso de ejecución con conexión al WEKA y además permite salvar los resultados (SaveResult, mainframe, PropertyPanelAMH, PropertySheelPanelAMH, PropertyTextAMH,PropertyValueSelectorAMH, NewPropertyPanel, ExecutionProcess, ClassifierConfigurationPanel).

 DiversityMeasure; es uno de los principales paquetes en el cual se encuentra la clase

DiversityMeasure donde se programaron varios métodos, dentro de ellos: las medidas de diversidad pareadas y no pareadas, la estandarización de estas medidas, y el operador borroso que las combina, el cual fue llamado fuzzy_operator, por la traducción en inglés de su nombre debido a que en la implementación los nombres están en este idioma así como la interfaz visual del software.

El método fuzzy_operator maneja una matriz de Nx2 donde N es la cantidad de medidas que se combinan y las dos columnas corresponden con cada término lingüístico: alta diversidad y baja diversidad; cada columna de la matriz se llena con los resultados de la función de pertenencia correspondiente, es decir, la columna de alta diversidad utiliza los resultados de la

39 función triangular modelada para ese término lingüístico y de la misma manera sucede con la otra columna. Las funciones triangulares no serán iguales porque cada una está modelada para un término lingüístico específico. Cada fila de la matriz representa una de las medidas que se está usando en la combinación de ellas, es decir, que el total de filas es la cantidad de medidas que se están combinando. El parámetro de entrada a las funciones de pertenencia es el valor de cada medida de diversidad y las funciones retornan el grado de pertenencia de ese valor para cada término lingüístico.

Una vez que se llena la matriz se aplica un criterio para obtener un único valor como salida del método borroso, y según este valor se decide si hay diversidad en un conjunto de clasificadores donde se aplicó la combinación de medidas por este operador, la interpretación de este valor se realiza de la misma manera que plantea la estandarización realizada para cada una de las medidas, es decir, mientras más alto sea el valor mayor diversidad existe.

El criterio que se usa en el método para obtener un único valor de salida es el promedio, es decir, se suman los valores de la primera columna y el resultado lo dividimos entre el total de filas que representa la cantidad de medidas que se están combinando, luego repetimos el mismo proceso para la segunda columna, se comparan los valores resultantes de las divisiones, nos quedamos con el máximo entre ellos y ese es el valor que se devuelve finalmente. Los valores solo estarán en el intervalo [0,1] pues cada medida se encuentra entre ese intervalo y usando este criterio se sigue garantizando eso en la salida del operador borroso.

Hasta aquí se ha mostrado un breve resumen del funcionamiento general del software en su primera versión y en específico del método fuzzy_operator que esel de mayor interés.

In document Economic Consideration in Vector-Borne Disease Management. (Page 101-104)