CHAPTER 4 The Water Governance Landscape: Structural, functional, and normative dimensions of
4.2 India’s Water Governance Landscape
4.2.3 Function
- Diámetro-Terreno-Presión min-Velocidad max 0,064 5 Diámetro-Material Profundidad-Velocidad med-Velocidad max 0,051 - Diámetro-Terreno-Presión min-Vel. max-Vel. min 0,064
Tabla 27. Mejores modelos por cada orden y grupo.
Destaca la presencia de la variable diámetro en todos los modelos ya sea en los formulados a partir de variables independientes o los de dos variables conjuntas complementadas con variables independientes.
Cabe destacar que la variable terreno está presente en todas las combinaciones de modelos con todas sus variables independientes pero en ninguno de los mejores modelos que incorporan dos variables conjuntas.
De las tres mejores variables independientes según los resultados del modelo de orden uno (diámetro, material y año), destaca que la variable año sólo está presente en uno de los mejores modelos y la variable material sólo aparece en dos de los modelos. Puesto que estas tres variables presentan unos resultados claramente mejores que el resto de manera independiente, en el modelo de orden uno, era de esperar que estuvieran presentes en los mejores modelos. En cambio las variables de velocidad y presión que por sí solas no aportan una capacidad predictiva significativa, es decir que presentan malos resultados en el modelo de orden uno, complementan los modelos de mejor forma que las variables material y año que a priori presentan una mejor capacidad predictiva por sí mismos.
Analizando los modelos formados únicamente con variables independientes se observa una secuencia consistente de las variables seleccionadas. A pesar de que se plantean las
175
múltiples combinaciones en el modelo de orden superior, conforme se van incorporando las variables se mantienen las variables seleccionadas en el modelo de orden inferior. Es decir que la mejor variable de orden uno, diámetro, se le incorpora en el modelo de orden dos la variable terreno, posteriormente el mejor modelo de orden tres añade la variable Presión mínima. La secuencia se repite con los modelos de orden 4 y 5 que incorporan las variables velocidad máxima y mínima.
Esta secuencia lógica en la formación del mejor modelo no se aprecia en los modelos que incorporan dos variables conjuntas. En este caso hay un par de variables conjuntas que se repite (diámetro-material), pero las variables independientes que les acompañan son diferentes en cada orden de modelo. Esta variabilidad observada en el caso de variables conjuntas se justifica en parte por la mayor complejidad en el momento de estimar el modelo de las dos variables conjuntas pues se necesitan muchos más datos, y por tanto tiene menos calidad. Adicionalmente, puede tener incidencia en la diversidad de variables independientes que acompañan a las variables conjuntas el hecho de que la diferencia entre el mejor modelo y los restantes en cada orden es muy pequeña, tal y como se observa en los resultados de los modelos planteados. Así se justifica que exista poca diferencia en cuanto a la capacidad predictiva del modelo según la variable independiente que se incorpore. Orden Variables conjuntas Variable Independiente R2 R1 Pen. Med. Coef. R2 Med. Radio P. Med. Med. de Radio Des. Tip. de Radio 0 - - 1,107 0,975 0,110 0,157 0,125 1 - - 1,021 0,971 0,036 0,085 0,066 2 2 - 1,021 0,972 0,035 0,076 0,055 - 2 1,019 0,971 0,034 0,076 0,054 3 2 1 1,011 0,980 0,023 0,062 0,051 - 3 1,011 0,975 0,027 0,065 0,048 4 2 2 1,033 0,981 0,038 0,052 0,053 - 4 1,010 0,976 0,026 0,064 0,047 5 2 3 1,028 0,990 0,029 0,051 0,059 - 5 1,011 0,976 0,026 0,064 0,047
176
El análisis de los resultados de los mejores modelos de cada una de las categorías estudiadas se recoge en la Tabla 28. Respecto de los resultados obtenidos en el modelo de orden cero donde el radio medio es de 0,157 se obtiene una clara mejoría con el modelo de una variable, donde se reduce el radio a 0,085. Las sucesivas combinaciones de variables consiguen reducir el radio hasta 0,051. Si bien, dado que esa mejoría es apenas perceptible entre el modelo de orden cuatro y el modelo de orden cinco, ante la similitud de resultados resulta más adecuado emplear un modelo de orden cuatro por la menor complejidad en el tratamiento de los datos. Si se analiza en cambio el criterio del radio del punto medio, el mejor modelo es el de orden 3 con dos variables conjuntas. También se aprecia que, dentro de un mismo orden, por lo general el comportamiento de los modelos que incorporan dos variables conjuntas es ligeramente mejor que el modelo con todas las variables independientes en términos de media de radio. Si se analiza el radio del punto medio este comportamiento no se detecta.
6.8
Nivel de desagregación
El nivel de desagregación es otro parámetro que repercute en los resultados obtenidos, en este sentido la metodología contempla un número de grupos entre uno y diez más un caso adicional con el mayor nivel de desagregación posible. Sin embargo, y con el objetivo de limitar el número de combinaciones posibles, la metodología desarrollada plantea un mismo nivel de desagregación para todas las variables incluidas en un mismo modelo. Es decir que no se contempla la posibilidad de que distintas variables dentro de un mismo modelo predictivo tengan niveles de desagregación diferentes. En este sentido se tomaba el nivel que mejor comportamiento ofrecía pero constante dentro del mismo modelo. Para analizar la posible influencia de un nivel de desagregación variable entre las diferentes variables explicativas de un mismo modelo se han realizado varios análisis complementarios consistentes en el estudio de los modelos con niveles de desagregación variables. Este análisis se limita a las combinaciones óptimas de cada tipo de modelo. Para realizar este análisis complementario se comprueban todos los niveles de desagregación posibles para las dos variables conjuntas o para las dos primeras variables independientes según el caso. De entre todos los modelos así generados se selecciona la combinación con mejor comportamiento, y sobre ésta se ha incorporado al modelo una tercera variable. Como con las dos variables iniciales, se realizan múltiples combinaciones para buscar el nivel de desagregación óptimo. Como con las construcciones de modelos se repite el proceso de manera secuencial.
177
Siguiendo este procedimiento la Tabla 29 recoge los resultados de desagregación de variables obtenidos para los modelos construidos con dos variables consideradas conjuntamente y el resto independientes. Se observa que los valores del radio medio obtenido no son los mismos que en apartados anteriores pues como se ha explicado antes, en aquellos análisis el nivel de desagregación era constante para todas las variables. Orden modelo Variables conjuntas Variables independientes Radio Med. V1 V2. V3 V4 V5 2 Diam-Prof - 0.128 6 94 - - - 3 Diam-Mat V min 0.116 2 7 153 - -
4 Diam-Año P med - Prof 0.115 8 4 58 3 -
5 Diam-Material Prof - V med - Vmax 0.106 2 7 5 9 9 Tabla 29. Desagregación de variables para modelos con dos variables analizadas conjuntamente De igual forma, la Tabla 30 recoge los resultados para los modelos con todas las variables independientes.
Orden
modelo Variables independientes
Radio Med. V1 V2. V3 V4 V5 2 Diam-Terr - 0.129 8 4 - - - 3 Diam-Terr-P min V min 0.126 8 4 54 - -
4 Diam-Terr-P min- V max P med - Prof
0.126 8 4 54 6 -
5 Diam-Terr-P min- V max- V min Prof - V med - Vmax
0.126 8 4 54 6 6
Tabla 30. Desagregación de variables para modelos con todas las variables independientes
Se observa que las variables hidráulicas (presión y velocidad) junto con la profundidad toman niveles de desagregación entre cuatro y seis intervalos y puntualmente con el nivel de desagregación máxima. De entre los modelos así seleccionados, la mejor combinación, es decir la de menor radio medio, es la formada por diámetro y terreno como variables conjuntas y las variables profundidad, velocidad media y velocidad máxima.
178
Teniendo en cuenta los resultados de las dos familias de modelos, el pequeño incremento de rendimiento frente a la complejidad que introduce una variable adicional, se opta por el modelo de orden cuatro con dos variables conjuntas y dos independientes con la siguiente desagregación:
Diámetro, con ocho intervalos: (0-80], (80-100], (100-140], (140-150], (150-200], (200-250], (250-300], (300-3000].
Año, con cuatro intervalos: [1900-1940], [1941-1993], [1994-2004], [2005-2015]. Presión media, con toda la desagregación posible (58 valores).