En el presente capítulo se han aplicado y testado 3 métodos estadísticos multivariantes bottom-up para clasificar los ríos de Cantabria partiendo de la distribución espacial de las comunidades de macroinvertebrados. El uso de estos métodos supone un novedoso avance en la definición de clases fluviales, ya que, a excepción del modelo predictivo MEDPACS (Poquet et al., 2009), la mayoría de propuestas desarrolladas en España se han realizado mediante aproximaciones que no han tenido en cuenta la distribución de las comunidades biológicas (e.g. Bonada
et al., 2007; Ugarte et al., 2006). Sin embargo, alguno de estos estudios ha realizado diversos análisis a posteriori, similares a los presentados en este capítulo, para comprobar la concordancia entre las clases resultantes y la distribución de las comunidades de macroinvertebrados. Así, estudios realizados en las cuencas norte de Cantabria han obtenido valores de 0.26 para el estadístico R de ANOSIM y de 0.05 para el CS de MeanSim, tras analizar la composición de las comunidades de macroinvertebrados presentes en las 5 clases propuestas en dicho estudio (Datos no publicados). Por otro lado, estudios similares realizados en las cuencas peninsulares de la vertiente Mediterránea han obtenido valores de R que varían entre 0.18 y 0.39 para las comunidades de macroinvertebrados presentes en las 5 clases identificadas en estas cuencas (Sánchez-Montoya et al., 2007). En este capítulo, el estadístico R obtuvo valores de 0.53 para las 11 clases propuestas por LDA, de 0.52 para las 6 clases propuestas por GDM y de 0.67 para las 12 clases propuestas por RF, lo que indica que las aproximaciones bottom-up desarrolladas en este capítulo presentan una mejoría con respecto a los estudios referidos. Igualmente, en este capítulo se obtuvieron valores de CS (0.06, LDA; 0.07, GDM y 0.11, RF) más altos que los descritos en la anterior clasificación de los ríos de Cantabria. Esta mejoría podría deberse a que en este capítulo se han seleccionado un mayor número de clases (11, 6 y 12) que en los estudios indicados (5), ya que el aumento del número de clases suele incrementar su capacidad de discriminación (Hawkins y Norris, 2000). No obstante, los valores que obtuvieron los estadísticos R y CS cuando LDA, GDM y RF dividieron a la red fluvial teórica de Cantabria en 5 clases (Figuras 2.2, 2.6 y 2.10, respectivamente) también indicaron un mejor ajuste de las clases definidas en este capítulo mediante aproximaciones bottom-up
frente a los estudios referidos. Por lo tanto, las clasificaciones propuestas mediante aproximaciones bottom-up parecen ser más eficaces a la hora de particionar la variabilidad espacial de las comunidades de macroinvertebrados que las aproximaciones top-down las cuales han obtenido valores más bajos en diversas regiones de España.
Como se puede observar en las figuras 2.2, 2.6 y 2.10 los estadísticos R, H y CS indicaron que el método multivariante RF definió clases con un ajuste más robusto que las clases propuestas por LDA y GDM. Random Forest es el único de estos métodos que reajusta la importancia de las variables ambientales para cada nivel jerárquico propuesto, por lo que modela de diferente manera las interacciones entre estas variables en los distintos niveles planteados (Cutler et al., 2007). Por el contrario, LDA y GDM se basan en modelos aditivos que plantean los sucesivos niveles jerárquicos en función de la importancia que las variables ambientales obtienen en el nivel previo. Como resultado, los métodos LDA y GDM establecen clases que se van dividiendo progresivamente en los subsecuentes niveles jerárquicos. Por lo tanto, las clases propuestas para un determinado nivel jerárquico aparecen incluidas en el nivel anterior. Esta característica aporta una ventaja desde el punto de vista de la gestión, ya que una determinada clase se puede dividir en 2 o más clases sin interferir en el resto de la clasificación. Por el
Desarrollo y validación de un sistema de clasificación para los ríos de Cantabria
contrario, RF propone un modelo diferente para cada nivel jerárquico, por lo que las clases de un determinado nivel no tienen porqué guardar relación con las clases definidas en el nivel previo. Los modelos que manejan mejor las diferentes interacciones entre las variables ambientales a diferentes niveles jerárquicos (i.e.
Random Forest) generan clases más robustas en relación a la distribución de las comunidades de macroinvertebrados, ya que los patrones de distribución espacial que siguen los macroinvertebrados tienden a estar relacionados con diferentes factores ambientales a distintas escalas espaciales (Aroviita et al., 2009; Poff, 1997). Así, la selección final de un modelo u otro depende del uso que se vaya a hacer del mismo. En este capítulo se ha seleccionado el modelo propuesto por RF porque matemáticamente es el que aporta unos resultados más robustos. Sin embargo, desde el punto de vista de la gestión, el modelo propuesto por LDA o GDM aporta un marco más sencillo que, además, se muestra más flexible a la hora realizar reajustes posteriores.
Las clases fluviales que propusieron los 3 modelos seleccionados, a partir de los métodos LDA, GDM y RF, presentaron una distribución espacial similar, mostrando una disposición en bandas paralelas a la costa. De estos modelos, el propuesto por LDA fue el que generó clases con una distribución menos ordenada, como se puede ver tras observar, por ejemplo, la cuenca del Río Deva (Figura 2.5). En el modelo generado por LDA las 3 variables geológicas (CatHard, CatCond y
CatPerm) jugaron un papel muy importante (Tabla 2.4). En Cantabria, las diferencias geológicas no siguen un gradiente norte-sur como lo hacen el resto de variables ambientales incluidas en este capítulo (variables topográficas y climáticas; Centro de Investigación y Desarrollo de Santander, 1981), lo que influyó en que las clases propuestas por LDA no siguiesen una ordenación tan definida como las propuestas por GDM y RF. Por otro lado, los modelos propuestos por GDM y RF dieron más peso a las variables topográficas y climáticas, obviando las variables geológicas. La selección de estas variables dio como resultado que ambos modelos reflejasen mejor el fuerte gradiente longitudinal que muestran los ríos de Cantabria, especialmente los situados en la vertiente Cantábrica (Elósegui et al., 2002; Pardo y Álvarez, 2006). Entre GDM y RF la mayor diferencia radicó en que GDM obtuvo el mejor ajuste tras dividir la red fluvial de Cantabria en un número comprendido entre 6 y 9 clases (Figura 2.6), siendo el modelo de 6 clases el más robusto, mientras que RF obtuvo el mejor ajuste tras dividir a la red fluvial entre 12 y 15 clases. Este hecho podría estar relacionado con que GDM tiene la capacidad de incluir en el modelo a la misma variable predictora en más de una ocasión, tras someterla a distintas transformaciones. Así, en el modelo seleccionado en el presente capítulo, el método GDM tomó el valor de la altitud acumulada (CatAlt) después de transformarla mediante Logaritmo neperiano (LnX) y tras elevarla al cubo (X3). Debido a la gran importancia que GDM dio a altitud acumulada, las
clases propuestas por este modelo se dispusieron en bandas paralelas a la costa muy definidas. Además, el modelo GDM agrupó en una misma clase (clase 6) a la práctica totalidad de los tramos situados en las cuencas localizadas al sur de la
cordillera Cantábrica, las cuales mantienen una elevada altitud desde los tramos de cabecera a los tramos situados en la zona más baja dentro del territorio de Cantabria. Por lo tanto, parece que el marcado gradiente ambiental norte-sur que muestra la región de Cantabria hace que los métodos utilizados, principalmente GDM y RF, ofrezcan modelos similares que distribuyen a las clases fluviales en disposición paralela a la costa, como también se refleja en la clasificación propuesta por Elena et al. (1997), así como en la clasificación oficial de los Ríos Cantábricos propuesta por la Confederación Hidrográfica del Cantábrico.