La autocorrelación espacial mide la correlación lineal entre los valores de una variable en una determinada posición con valores de la misma variable en otras posiciones en el espacio. Permite evaluar si una variable tiende a asumir valores similares en unidades geográficamente cercanas (Anselin, 2001). Una propiedad de los datos autocorrelacionados espacialmente es que los valores no son aleatorios en el espacio, sino que están relacionados entre sí y la magnitud de esa correlación depende de las distancias que los separan (Lee y Wong, 2001). La autocorrelación espacial puede presentarse con valores positivos o negativos; existe autocorrelación positiva cuando valores similares de una variable aleatoria tienden a aglomerarse en el espacio, es decir valores más cercanos son más parecidos; por otra parte, la autocorrelación negativa se presenta cuando las unidades geográficas de observación más cercanas tienden a tener valores opuestos o más distintos.
El análisis exploratorio de datos espaciales (ESDA, por sus siglas en inglés) se realiza a partir de un conjunto de técnicas utilizadas para describir y visualizar distribuciones espaciales, detectar patrones de asociación espacial y aglomeraciones, así como para sugerir regímenes espaciales u otras formas de heterogeneidad espacial. La autocorrelación espacial puede ser medida en términos de su intensidad; una autocorrelación espacial positiva fuerte significa que los valores de la variable en sitios cercanos geográficamente, están altamente relacionados o son muy parecidos y, consecuentemente, emergen aglomeraciones espaciales de los datos. En otros casos la distribución de la variable de interés puede presentar una autocorrelación débil, o incluso mostrar un patrón de dispersión espacial aleatorio. Para cuantificar la magnitud de la estructuración espacial de una variable existen índices entre los que se encuentran el índice de Moran (Moran, 1948) y el índice de Geary (Geary, 1954).
El cálculo del índice o coeficiente de Moran de autocorrelación espacial en un espacio continuo requiere la definición de una matriz de ponderación espacial. Ésta suele tener elementos binarios (0/1) para indicar cuáles son las observaciones que pertenecen al
14 vecindario de cada dato, o cuáles son las observaciones “conectadas” con cada dato. No obstante, también pueden tener elementos continuos que pueden ser entendidos como un coeficiente de continuidad que mide el grado de conexión entre cada par de datos.
Para calcular el índice de Moran se mide la variable de interés en el sitio i-ésimo y se compara su valor con el valor promedio de la variable en los sitios de su vecindario. La expresión del índice es:
, 2 , ( - )( - ) ( ) ( - ) i j i j i j i j i i j iN
X X X X
MI
X X
W W (1.1)donde N es el número total de observaciones, Xi es el valor de la variable en un sitio particular (posición i) y Xj es el valor de la variable en otro sitio (posición j). El elemento Wij de la matriz de ponderaciones W, es el peso aplicado a la comparación de las observaciones en la posición i y la posición j. Usualmente, para el cálculo del Índice de Moran se utilizan redes de conexión que derivan en un matriz W binaria, es decir compuesta por ceros y unos (si la posición j es adyacente a la posición i, el término ij recibe
un peso de 1 y si no, de 0). Otra posibilidad para construir la matriz W es relacionar los elementos con la distancia d entre las posiciones de manera inversamente proporcional, es decir: ij 1
ij
W d .
La red de vecindarios también puede ser definida en función de la distancia Euclídea considerando puntos vecinos a aquellos contiguos ubicados entre un límite inferior y superior, previamente preestablecido. Otra red de conexión es la obtenida por el método de triangulación de Delaunay (Lee y Schachter, 1980), recomendado para construir gráficos de vecindario cuando las entidades se encuentran distribuidas en forma homogénea en el espacio. La red de conexión de Gabriel (Gabriel y Sokal, 1969) es un subconjunto de la red de Delaunay que no incluye conexiones periféricas. Las redes de conexión también pueden ser adaptadas manualmente pudiéndose excluir contactos entre sitios cercanos o incluir relaciones entre sitios lejanos, siguiendo criterios agronómicos
15 como por ejemplo la existencia de fertilizaciones o controles realizados dentro de un lote en sitios puntuales.
El índice de Moran varía entre –1 y 1. Cuando la autocorrelación es alta, el coeficiente será cercano a –1 o 1. Un valor cercano a 1 indica una alta autocorrelación positiva, mientras que valores cercanos a –1 indican autocorrelación negativa. Un valor de cero significa que no existe un patrón espacial o que la dispersión de las observaciones en el espacio es completamente aleatoria. El índice de Moran es una estadística global que considera los valores de todas las observaciones, el cual sugiere numéricamente la existencia de aglomeraciones espaciales.
Para evaluar la estructura local de autocorrelación espacial se puede utilizar el índice Moran Local (Ii) (Anselin, 1995). El Ii es básicamente el índice de Moran aplicado a cada sitio individualmente, que da idea del grado de similitud o diferencia entre el valor de la observación en un sitio determinado con respecto al valor de los sitios vecinos. Los valores positivos de Ii se corresponden con agrupamiento (clusters), mientras que los valores negativos se corresponden con valores extremos o atípicos (outliers o inliers espaciales), indicando para la observación que su valor rompe con la tendencia observada en sus vecinos (Anselin, 1995).
El Índice de Geary, es similar al índice de Moran, pero en su numerador no mide la interacción a través del producto cruzado de las desviaciones con respecto a la media, sino que expresa la magnitud de las desviaciones entre observaciones en las diferentes localizaciones. La expresión del índice es:
2 , 2 ,1
(
)
2(
)
(
)
i j i j i j i j i i j iN
W
X
X
GI
W
X
X
(1.2)El valor índice de Geary se encuentra en el intervalo [0,2]. Si no hay autocorrelación espacial, el valor esperado de GI es 1. Valores del índice entre 1 y 2 indican autocorrelación espacial negativa, y entre 0 y 1 autocorrelación espacial positiva. Este índice se relaciona inversamente con el índice de Moran, es decir valores más cercanos a 0 sugieren autocorrelaciones positivas más fuerte. Al enfatizar las diferencias
16 entre pares de observaciones más que la covariación entre ellos, el índice de Geary no provee una inferencia agronómica idéntica como el índice de Moran.
Para evaluar la significancia estadística de estos índices es posible utilizar procedimientos del tipo Monte Carlo (Babai et al., 1995). Las ubicaciones son permutadas para obtener la distribución de los índices bajo la hipótesis nula de distribución aleatoria. El índice de Moran y de Geary pueden calcularse en R mediante las librerías “spdep” (Bivand et al., 2013a) y “ape” (Paradis et al., 2004).