El tratamiento estadística de cualquiera fenómenos, en independencia de su naturaleza, trae consigo una responsabilidad operacional para el investigador, pues del mismo modo que un ciudadano que en el extranjero no está exento de cumplir las normas que no conoce, el analista no está ajeno a cumplir los parámetros mínimos del análisis estadístico, para que sus afirmaciones finales no solo sean verídicas sino responsables. Los métodos considerados para efectuar el análisis final fueron:
- Regresión lineal (OLS)
- Comparación de medidas centrales en variables normales (T student)
- Comparación de medianas en variables no normales ( U de Mann – Whitney)
Cada método trae consigo algunas condiciones necesarias para que, al finalizar su implementación, los resultados estadísticos que se obtengan tenga un grado de fiabilidad frente al fenómeno real que buscan describir o inferir; en un primer término se presenta el análisis de regresión. Este análisis demanda de características tales como la normalidad de las variables a contrastar, y una fundamental: que éstas sean de carácter cuantitativo. De entrada es un método a descartar pues como se mencionó, el uso del suelo funge como un dato categórico, luego no es cuantitativo. El uso de regresiones puede darse como insumo de apoyo al evaluar si las variables explicativas tiene relación entre sí, sin embargo su implementación
no estaría en capacidad de otorgar una respuesta fiable al cuestionamiento planteado, ya que no logra entablar un diálogo coherente entre el uso del suelo y la distancia con respecto a estaciones de BRT.
Luego de ello las posibilidades se restringen a métodos con la capacidad de relacionar de manera eficiente variables de tipo cuantitativo y cualitativo, para ello es posible implementar la comparación de medidas de tendencia central, método en el cual resalta la T de Student
pues es un modelo estadístico de gran potencia. Dado que el problema busca evaluar el comportamiento de la distancia con respecto a estaciones BRT teniendo en cuenta la clasificación de uso general de suelo (uso residencial y uso comercial) luego un modelo para la comparación de medias de un factor común (distancia en metros a estaciones) entre grupos independientes (categorías de uso de suelo) se visibiliza como la posibilidad más adecuada.
Sin embargo la prueba T de Student demanda de tres condiciones para su correcta ejecución: distribución normal de los datos, igualdad de varianzas y división categórica por grupos (grupos independientes, para este caso usos de suelo). En el apartado anterior se demostró que las variables cuantitativas a confrontar no lograban ajustarse a una distribución normal, sin embargo nada se ha mencionado sobre la Homocedasticidad o Heterocedasticidad
de las variables. Cualidad que se evalúa por medio del Test de Levene.
A partir de este punto será necesario asumir una de las convenciones generales de la evaluación en estadística, el contraste de hipótesis. Estos análisis se concentran en la evaluación de dos posibles casos numéricos expresados cada uno como H0 o H14, las cuales
toman la forma de:
en dónde M toma el valor del indicador a comparar, sea este la media, mediana o varianza (según el modelo a aplicar). Dicho esto se buscó la afirmación o no de la homocedasticidad de
4 H0 hace referencia a la hipótesis nula o igualdad, en oposición a esta aparece la H1 Hipótesis alterna o del investigador, la cual asume deferencias entre las medidas comparadas. Para cada caso puntual H0 o H1 toman un significado en torno al fenómeno analizado. El contraste entre H0 o H1 es un método se falsación similar al descrito por Popper, por lo cual se advierte de la necesidad de abordar estos resultados con una mirada lógica
H
0: M
1= M
2H
1: M
1≠ M
2M
1< M
2la variable Distancia a estación BRT según los grupos de independientes de uso de suelo previamente definidos.
Gráfico 11. Resultados test de Levene y prueba T de Student. Fuente: Elaboración propia.
Tomando en cuenta que el nivel de confianza asumido para la ejecución de esta prueba se asume un nivel de confianza del 95% el valor de P será entonces 0.05, luego un valor significativo (Sig. De acuerdo a la tabla de resultados SPSS) mayor a 0.05 se toma como un indicador no suficiente para asumir una diferencia de varianzas, en consecuencia se retiene la H0. Para este caso el valor obtenido es menor a 0.05, indicador de que existe una
heterogeneidad de varianzas o heterocedasticidad, para corregir este problema y llevar a la variable a un cumplimiento de dos de tres condiciones para la aplicación de una prueba no paramétrica se tomará en cuenta la variable Distancia a BRT Box la cual ha sido transformada mediante el método de Box-Cox; si bien el resultado de esta transformación no logró dar una distribución normal a la variable, si alivia por completo el problema de la diferencia en las varianzas.
Gráfico 12. Resultados Test de Levene y prueba T de Student para variables normalizadas. Fuente: Elaboración propia
La prueba de Levene realizada para la variable transformada arroja un valor de P > 0.05, con lo cual es posible afirmar que la variable ha tomado una distribución de varianzas
Homocedastica , logrando así cumplir dos de tres características necesarias para evaluar el caso mediante pruebas de distinciones de medidas centrales con medidas paramétricas tales como la U de Mann - Whitney.
4.5.1 U de Mann – Whitney
Al conocer las características que describe la variable fundamental a analizar, las alternativas para la realización de dicha evaluación son cada vez más específicas. Si bien la variable no cuenta con una distribución normal, en algunos casos hay quienes aplican medidas paramétricas, confiando en su gran potencia para el cálculo de estimadores, de ser así la prueba T de Student de la cual se acompañó el Test de Levene ya expuesto expondría un valor de P < 0.05, con lo cual se daría por hecho la diferencia entre la distancia a estaciones BRT según el tipo de uso de suelo, es decir, se dan luces para realizar una inferencia que ligue la distancia a estaciones BRT con el uso del suelo que el predio ostente. Tal afirmación requiere de una prueba que le confirme o desvirtué por completo. Para ello se ha optado por implementar el modelo U de Mann – Whitney, el cual es el modelo no paramétrico alternativo a la prueba T Student; dicho modelo contempla también tres características básicas para la confiabilidad del resultado final, a saber: aplicación en muestras independientes, homocedasticidad y distribución no Gaussiana. La utilidad del mismo está en que es una prueba específica para variables con una distribución no Gaussiana, caso que se presenta con la variable Distancia a BRT. Dicho esto es momento de trasladar la pregunta problema del análisis a la formulación que propone el contraste de hipótesis, con lo cual se obtiene que:
Pregunta problema: cómo se transforma el suelo urbano periférico a estación de BRT en Bogotá, asumiendo el impacto que la implementación de este sistema de transporte ha
causado en el desarrollo reciente de la ciudad.
H0: La variación en la mediana de las distancias a estaciones BRT es la misma en los usos de
suelo identificados en la zona, no hay evidencias que relacionen estos factores.
H1: La variación en la mediana de las distancias a estaciones BRT es diferente en cada uso
de suelo identificado en la zona, existen evidencias suficientes para identificar una relación entre estos factores.
Con la implementación del modelo U de Mann – Whitney se busca comparar las variaciones en las medianas de los datos recolectados, la información sobre distancia a estaciones BRT fue elaborada mediante el cálculo de distancia euclidiana a la estación más
cercana para cada entidad lote, con lo cual el valor en metros obtenido designa la distancia lineal en metros. La obtención de esta información permite confiar en la calidad del insumo. Por lo cual la aplicación busca obtener un indicador que pueda ofrecer un nivel de confianza
del 95% sobre todas las observaciones realizadas. Teniendo en cuenta esto la prueba arroja los siguientes resultados:
Gráfico 13A. Gráficos y estadísticos prueba U de Mann Whitney aplicada a distancia a estaciones BRT – usos de suelo. Fuente: Elaboración propia.
Gráfico 13B. Resultados aplicación prueba U de Mann Whitney aplicada a distancia a estaciones BRT – usos de suelo. Fuente: Elaboración propia.
De acuerdo a los resultados arrojados tras la aplicación del modelo, expresado por el valor de significación, inferior a 0.05, se determina que hay evidencias suficientes para rechazar la hipótesis nula, con lo cual es posible concluir que existe una relación entre la variación de la distancia con respecto a estaciones BRT y el uso del suelo que se ubica en el espacio a
diferentes rangos. La salida grafica del modelo reitera dicha variación, pues se observa cómo
la variación de los rangos se diferencia claramente según el uso de suelo al que éste se asocia; insumo que se añade a la confirmación de la afirmación dada a partir del análisis estadístico. Ahora bien ¿Cuál es la expresión de este análisis en el espacio?
Dado que la prueba arroja un indicador único como síntesis de resultados su espacializacion se hace compleja, sin embargo un análisis en detalle a la distribución de estos usos por rangos de distancia muestran datos concluyentes que reafirman la conclusión generada por la aplicación de la prueba. Mediante una clasificación por rangos de distancia con intervalos de 100 metros es posible evidenciar cómo esta interacción se desenvuelve en el espacio; si bien el número de lotes con uso comercial y residencial inician apareados hasta los primeros 100 metros, posteriormente se configuran heterogeneidades en el total de usos que aparecen, al evaluar el rango de distancia de los 300 a 400 metros es posible identificar un aumento en el uso residencial cruzado con un descenso en los usos comerciales, tendencia que aunque no permanece de esta manera en las siguientes distancias confugura proporciones muy diferentes en la concentracion de usos para la zona de estudio.
Gráfico 14. Líneas apiladas para la relación “Distancia BRT/ Uso del suelo”. Fuente: Elaboración propia. 0 100 200 300 400 500 600 700 0 100 200 300 400 500 600 700 800 900 0 - 100 101 - 200 201 - 300 301 - 400 401 - 500 501 - 600 601 - 700 701 - 885 N º Lo te s "U so c o m e rc ia l" N º Lo te s "U so r e si d e n ci a l"
Rango distancia en metros