6. Presentation and Discussion of Findings
7.5. Implications for further Research
5.3.3. Axial Coding for Elaborating Analysis
El uso de índices o cocientes es frecuente en morfometría y en ecología, bien sea porque se desea estudiar la variación conjunta de dos variables, o porque se requiere estandarizar una variable X respecto a un tamaño S (por ejemplo, la productividad de un lago por unidad de superficie). Sin embargo, el uso de índices o ratios presenta algunas desventajas importantes desde el punto de vista estadístico. En particular, se puede presentar el problema de las correlaciones espúreas.
Esta cuestión fue anunciada por primera vez por Pearson (1897), quien observó que dos variables no correlacionadas entre sí pasaban a estarlo cuando se dividían ambas por una tercera variable (la correlación entre X e Y es nula (rx,y= 0), pero entre X/Z e Y/Z es diferente de cero (rx/z,y/z≠ 0)).
Más recientemente, y en relación con la biometría, ningún texto moderno de estadística trata las implicaciones estadísticas de los índices (Atchley et al., 1976). Sokal et al. (1981) no denominan “espúreo” a este tipo de correlación, sino que la consideran “una consecuencia lógica de una formulación particular de las variables”; además, entienden que es aceptable la correlación entre una parte y el conjunto.
Actualmente no se dispone de una teoría sobre esta cuestión, ni tampoco se conocen soluciones plenamente satisfactorias al respecto. En efecto, las soluciones
analíticas para los parámetros estadísticos de las variables cocientes suelen ser intratables, o en el mejor de los casos confusas y difíciles de obtener; además, según Atchley et al. (1978) “no resultan asequibles para la mayoría de los biólogos”.
El hecho de que los índices se construyan de modo que sean invariantes frente a cambios de tamaño no implica que sean estadísticamente independientes del tamaño. De hecho, la existencia de alometrías es frecuente en biología.
Abordamos aquí la situación que se presenta más frecuentemente en esta memoria, a saber, la relación entre una variable cociente y su denominador. Sean las variables Y = X1/X2 y Z = X2, donde X1 y X2 son dos variables morfométricas de tamaño (i.e., son distancias), siendo X2la variable cuya influencia se desea eliminar, en lo que se suele llamar “estandarización respecto al tamaño X2" (también son de interés las relaciones entre X1/X2 y X3/X2(e.g, Zr y Dl), o entre X1/X2 y X3/X4(e.g., L/Wmaxy Dl)).
Cuando se construye un índice Y/X, su correlación con X debe ser nula; de lo contrario se suele considerar que esta es espúrea, sobre todo cuando es superior (en valor absoluto) a la correlación existente entre X e Y: aparentemente no sólo no se habría conseguido eliminar el efecto del tamaño Y sobre la variable X, sino que éste habría aumentado. La magnitud en que difiere de cero la supuesta correlación nula entre lo índices depende de la forma de éstos, de los coeficientes de variación originales, y de la correlación entre las variables originales (Jackson et al., 1991). Esta situación queda reflejada en la gráfica de regresión de X1 respecto a X2: la estandarización sólo se consigue (i.e., la esperada correlación nula es realmente igual a cero) cuando las variables originales X1y X2son colineales, y con intersección cero en los ejes de la gráfica (Jackson et al., 1991).
Los problemas surgen porque X/Y no es una función lineal de X e Y. Sin embargo, pueden disminuir, e incluso desaparecer, transformando el cociente a logaritmos. En efecto, log(X/Y) = logX - logY, el cual sí es función lineal de logX y logY. Así se pasa a estudiar la correlación posiblemente espúrea entre V y U-V (siendo V = logY y U = logX), en vez de entre X/Y e Y; se distinguen dos casos principales: 1-Cuando V y U están bastante correlacionadas (por ejemplo, r = 0.8), y tienen desviaciones típicas similares, entonces la correlación entre V y U-V es baja y negativa (por ejemplo, igual a -0.32). Igualmente, cuando se usan logaritmos, a menudo las desviaciones típicas (de U y V) son similares entre sí.
En cambio, cuando no se cumple la similaridad de las desviaciones típicas entre U y V, la correlación posiblemente espúrea entre V y U-V ya no es baja, sino media o alta (y también negativa; Atchley et al., 1978).
2-Por otra parte, si U y V son independientes (r = 0) se produce una correlación espúrea entre V y U-V, en el sentido de que no se ha conseguido eliminar el efecto del tamaño sobre la variable estandarizada, sino más bien lo contrario: siguiendo con el mismo ejemplo anterior, r = -0.71 (si X e Y se distribuyen según una normal) en lugar de r = 0 (Atchley, 1978; Hills, 1978, Albrecht, 1978; Jackson et al., 1990). Pero en la práctica ocurre que en morfometría o en ecología se utilizan ratios con variables correlacionadas entre sí, y no independientes, ya que si X no depende nada del tamaño Y, entonces no tiene sentido estandarizar X respecto a Y (no importa eliminar el efecto del tamaño Y sobre X, puesto que a priori ya no existe), así que sólo consideramos la
situación anterior (U y V bastante correlacionadas), así como el caso intermedio (U y V presentan una correlación moderada).
Por ejemplo, en el Pirineo el logaritmo del índice Ad/A presenta una correlación espúrea con el logaritmo del área del lago (-0.38), a consecuencia de que los logaritmos de Ad y de A están correlacionados entre sí (0.53), y que además presentan una alometría entre sí, como vimos en el apartado sobre “El área de la cuenca de drenaje”(página 65). En cambio, la correlación nula entre el logaritmo de Z/ Z con el logaritmo del área no es espúrea: logZestá correlacionado con log Z, pero se da una isometría entre ambos.
Por lo demás, la relación constante entre una variable de forma y otra de tamaño (i.e., cuando la curva de su gráfica tiene una pendiente nula) sólo puede presentarse en casos muy particulares, y dentro de un estrecho margen de tamaños; en la mayoría de casos, en cambio, la regla será una alometría entre ambas (siendo igualmente raros los casos de isometría), que puede ser positiva o negativa.
A modo de conclusión se puede decir que el uso de logaritmos sobre variables más o menos dependientes entre sí no es la mejor solución al problema de las correlaciones espúreas por dos motivos:
1-Aún estando bastante correlacionadas U y V, y siendo similares sus desviaciones típicas, la correlación entre V y U-V no es necesariamente nula (es igual a -0.32 en el mencionado ejemplo inicial), de modo que no se habría logrado eliminar completamente el efecto del tamaño sobre la variable estandarizada.
2-Por poco que difieran entre sí las desviaciones típicas de U y V, la correlación no deseada será mayor a la mencionada en el caso anterior (superior a - 0.32).
Por todo ello se recomienda el uso de métodos alternativos cuando se desea eliminar completamente el efecto de una variable sobre otra. Uno de ellos consiste en estudiar las relaciones entre las variables X/Y e Y mediante un análisis de la covarianza. Una alternativa sería hacer una regresión en dos pasos: primero se realiza la regresión de la variable independiente (e.g., la profundidad) frente a la dependiente (e.g., el área), y luego se toma el residuo de esta regresión como nueva variable dependiente frente a la profundidad media.
Si lo que se desea es eliminar la influencia del tamaño sobre una variable conviene hacer una regresión o un análisis de la covarianza. En cambio, si un índice tiene un sentido en un contexto teórico dado, entonces sí se recomienda su uso (Sokal et al., 1981). Por ejemplo, al construir el índice de la profundidad relativa (Zr) no se pretende simplemente eliminar la influencia del área (A) sobre la profundidad (Z), sino disponer de un parámetro que mida la forma del lago; de este modo, una correlación no nula entre Zr y A ya no se interpretará como espúrea, sino en el sentido de que la forma estimada por Zr varía con el área del lago. En cambio, al estimar la dimensión fractal (D) mediante la relación de áreas y perímetros (véase el capítulo sobre fractales), lo que se pretende no es eliminar la influencia de A sobre P, sino estudiar la relación entre A y P; independientemente, se puede examinar si en un conjunto de lagos la relación P/A (i.e., D) depende de A (i.e., ver si hay una variación de D entre lagos grandes y pequeños de regiones diversas).
En un modelo de regresión que incluya dos variables, como por ejemplo X e Y/X, si éstas no están significativamente correlacionadas no se producen problemas de colinearidad (e.g., Rasmussen et al., 1989); sin embargo, esta falta de correlación
podría ser espúrea, como hemos visto, por lo cual el uso de índices en el modelo no permite garantizar que esté libre de colinearidades.
Otro inconveniente de los índices es que no dan información sobre el tipo de relación entre las dos variables que lo componen (Sokal et al., 1981), en particular no indica si es lineal o no; y si es no lineal, no indica donde están los puntos de inflexión (por ejemplo, en el mencionado caso de la gráfica entre la profundidad y el área obtenida por Hayes (1957) para lagos de todo el mundo).
Los índices son apropiados para eliminar el efecto del tamaño cuando el cociente de variación del numerador (la variable a estandarizar) es claramente superior al del denominador (el tamaño), lo cual no suele ser el caso. Por otra parte, en caso de que el numerador (la profundidad , por ejemplo) varíe mucho más que el denominador (el área, por ejemplo; este sería el caso de los lagos de origen volcánico de Camerún, cuya profundidad varía bastante dentro de un estrecho intervalo de áreas), la estandarización es posible, aunque no resulta muy útil. En algunos grupos de lagos (lagunas de inundación, por ejemplo) el área presenta cierta variabilidad, pero la profundidad prácticamente ninguna, lo cual desaconseja construir el índice Zr entre la profundidad y el área.
Con todo, estas alternativas no aseguran necesariamente unos buenos resultados, por lo cual cada autor suele seguir el método que mejor se adapte a sus datos, incluido el uso de índices cuando se ha comprobado por experiencia que dan resultados satisfactorios y libres de los mencionados artefactos estadísticos.