• No results found

SAR Image Feature Extraction

Pruebas de heterocedasticidad y normalidad para casas en modelo inicial

Figura 27. Test de Breusch – Pagan (casas)

Prueba de hipótesis:

Ho: No hay heterocedasticidad Ha: Hay heterocedasticidad

Con un nivel de significancia del 5%, se encuentra en el modelo un p-value < 0,05, por lo que se rechaza Ho y, por tanto, hay heterocedasticidad en el modelo.

Se realizaron algunas transformaciones de variables y se concluye que ninguna logra corregir el problema de heterocedasticidad, por lo tanto, se sugiere construir un modelo mixto que incorpore esta estructura heterocedástica en la matriz de varianza y covarianzas. Sin embargo, lo anterior se sale del alcance de este trabajo.

Precio_casai = −0,95513 + 25,93708(Est4) + 88.05646(Est5) + 356,84726(Est6) +

55,77094(Parq) + 30,45809(Baños) + 0,74336(Area_Centro) + 0,57952(Area_Norte) + 0,89660(Area_Oeste) + 0,29113 (Area_Oriente) + 0,74926 (Area_Sur)

Figura 28. Test de normalidad casas

Fuente: elaboración propia, datos procesados en R

a) Residuals vs. Fitted

• Este gráfico muestra los residuos de error frente a los valores ajustados. • La línea punteada en y = 0 indica la línea de ajuste.

• Los residuos forman aproximadamente una "banda horizontal" alrededor de la línea 0. Esto sugiere que las variaciones de los términos de error son iguales.

• La línea roja es la curva polinómica de alto orden suavizada para dar una idea del patrón de movimiento residual.

b) Normal Q-Q

• Los residuos se distribuyen normalmente si los puntos siguen de cerca la línea punteada. • El gráfico QQ muestra claramente que los puntos cuantiles no se encuentran en la línea

normal teórica.

• Se observa que los puntos caen a lo largo de una línea en el medio del gráfico, pero se curvan en las extremidades. Las gráficas QQ normales que exhiben este comportamiento generalmente significan que sus datos tienen valores más extremos de lo que se esperaría si realmente vinieran de una distribución Normal.

c) Scale – Location

• El diagrama de ubicación de escala indica la distribución de puntos en el rango de valores predichos.

• Una de las suposiciones para la regresión es la homocedasticidad, es decir, la varianza debería ser razonablemente igual en todo el rango del predictor.

• La línea roja horizontal indica que los residuos tienen una variación uniforme en todo el rango. A medida que los residuos se extienden más entre sí, la línea de propagación roja sube.

d) Residual vs Leverage

• En esta gráfica, las líneas rojas punteadas son la distancia de Cook.

• Las áreas de interés son las que están fuera de la línea punteada en la esquina superior derecha o en la esquina inferior derecha. Si algún punto cae en esa región, es un indicio de que la observación tiene un alto apalancamiento o el potencial para influir en nuestro modelo es mayor si excluimos ese punto.

Pruebas de heterocedasticidad y normalidad para apartamentos en modelo inicial

Figura 29. Test de Breusch – Pagan (apartamentos)

Prueba de hipótesis:

Ho: No hay heterocedasticidad Ha: Hay heterocedasticidad

Con un nivel de significancia del 5%, se encuentra en el modelo un p-value < 0,05, por lo que se rechaza Ho y, por tanto, hay heterocedasticidad en el modelo.

Se realizaron algunas transformaciones de variables y se concluye que ninguna logra corregir el problema de heterocedasticidad, por lo tanto, se sugiere construir un modelo mixto que incorpore esta estructura heterocedástica en la matriz de varianza y covarianzas. Sin embargo, lo anterior se sale del alcance de este trabajo.

Precio_aptoi = −64,05778 + 22,89327(Est4) + 38,89429(Est5) + 142,63863(Est6) + 80,14611(Parq) + 50,55279(Baños) + 4,572296(Pisos) − 29,66844(Habitaciones) + 1,02247(Area_Centro) + 1,60039(Area_Norte) + 2,13444(Area_Oeste) +

Figura 30. Test de normalidad apartamentos

Fuente: elaboración propia, datos procesados en R

a) Residuals vs. Fitted

• Este gráfico muestra los residuos de error frente a los valores ajustados. • La línea punteada en y = 0 indica la línea de ajuste.

• Los residuos forman aproximadamente una "banda horizontal" alrededor de la línea 0. Esto sugiere que las variaciones de los términos de error son iguales.

• La línea roja es la curva polinómica de alto orden suavizada para dar una idea del patrón de movimiento residual.

• En este caso, los residuos tienen un patrón lineal.

b) Normal Q-Q

• Los residuos se distribuyen normalmente si los puntos siguen de cerca la línea punteada. • El gráfico QQ muestra claramente que los puntos cuantiles no se encuentran en la línea

normal teórica.

• Se observa que los puntos caen a lo largo de una línea en el medio del gráfico, pero se curvan en las extremidades. Las gráficas QQ normales que exhiben este comportamiento generalmente significan que sus datos tienen valores más extremos de lo que se esperaría si realmente vinieran de una distribución Normal.

c) Scale – Location

• El diagrama de ubicación de escala indica la distribución de puntos en el rango de valores predichos.

• Una de las suposiciones para la regresión es la homocedasticidad, es decir, la varianza debería ser razonablemente igual en todo el rango del predictor.

• La línea roja horizontal indica que los residuos tienen una variación uniforme en todo el rango. A medida que los residuos se extienden más entre sí, la línea de propagación roja sube.

d) Residual vs Leverage

• En esta gráfica, las líneas rojas punteadas son la distancia de Cook.

• Las áreas de interés son las que están fuera de la línea punteada en la esquina superior derecha o en la esquina inferior derecha. Si algún punto cae en esa región, es un indicio de que la observación tiene un alto apalancamiento o el potencial para influir en nuestro modelo es mayor si excluimos ese punto.

Pruebas de heterocedasticidad y normalidad para casas en modelo construido con la base de entrenamiento (70%)

Precio_casai = −4,45536 + 25,10265(Est4) + 96,38038(Est5) + 366,29917(Est6) + 56,72785(Parq) + 33,02094(Baños) + 0,69752(Area_Centro) +

0,54902 (Area_Norte) + 0,89358 (Area_Oeste) + 0,26775 (Area_Oriente) + 0,70867 (Area_Sur)

Figura 31. Test de Breusch – Pagan (casas) - Entrenamiento 70%

Ho: No hay heterocedasticidad Ha: Hay heterocedasticidad

Con un nivel de significancia del 5%, se encuentra en el modelo un p-value < 0,05, por lo que se rechaza Ho y, por tanto, hay heterocedasticidad en el modelo.

Se realizaron algunas transformaciones de variables y se concluye que ninguna logra corregir el problema de heterocedasticidad, por lo tanto, se sugiere construir un modelo mixto que incorpore esta estructura heterocedástica en la matriz de varianza y covarianzas. Sin embargo, lo anterior se sale del alcance de este trabajo.

Figura 32. Test de normalidad casas - Entrenamiento 70%

Fuente: elaboración propia, datos procesados en R

a) Residuals vs. Fitted

• Este gráfico muestra los residuos de error frente a los valores ajustados. • La línea punteada en y = 0 indica la línea de ajuste.

• Los residuos forman aproximadamente una "banda horizontal" alrededor de la línea 0. Esto sugiere que las variaciones de los términos de error son iguales.

• La línea roja es la curva polinómica de alto orden suavizada para dar una idea del patrón de movimiento residual.

b) Normal Q-Q

• Los residuos se distribuyen normalmente si los puntos siguen de cerca la línea punteada. • El gráfico QQ muestra claramente que los puntos cuantiles no se encuentran en la línea

normal teórica.

• Se observa que los puntos caen a lo largo de una línea en el medio del gráfico, pero se curvan en las extremidades. Las gráficas QQ normales que exhiben este comportamiento generalmente significan que sus datos tienen valores más extremos de lo que se esperaría si realmente vinieran de una distribución Normal.

c) Scale – Location

• El diagrama de ubicación de escala indica la distribución de puntos en el rango de valores predichos.

• Una de las suposiciones para la regresión es la homocedasticidad, es decir, la varianza debería ser razonablemente igual en todo el rango del predictor.

• La línea roja horizontal indica que los residuos tienen una variación uniforme en todo el rango. A medida que los residuos se extienden más entre sí, la línea de propagación roja sube.

d) Residual vs Leverage

• En esta gráfica, las líneas rojas punteadas son la distancia de Cook.

• Las áreas de interés son las que están fuera de la línea punteada en la esquina superior derecha o en la esquina inferior derecha. Si algún punto cae en esa región, es un indicio de que la observación tiene un alto apalancamiento o el potencial para influir en nuestro modelo es mayor si excluimos ese punto.

Pruebas de heterocedasticidad y normalidad para apartamentos en modelo construido con la base de entrenamiento (70%)

Precio_aptoi = −66,82163 + 32,45363(Est4) + 48,76729(Est5) + 153,01327(Est6) + 84,08816(Parq) + 47,56108(Baños) + 4,19018(Pisos) − 26,73016 (Habitaciones) + 0,96783(Area_Centro) + 1,49885 (Area_Norte) + 2,08351 (Area_Oeste) +

0,92231(Area_Oriente) + 1,32358 (Area_Sur)

Figura 33. Test de Breusch – Pagan (apartamentos) Entrenamiento 70%

Ho: No hay heterocedasticidad Ha: Hay heterocedasticidad

Con un nivel de significancia del 5%, se encuentra en el modelo un p-value < 0,05, por lo que se rechaza Ho y, por tanto, hay heterocedasticidad en el modelo.

Se realizaron algunas transformaciones de variables y se concluye que ninguna logra corregir el problema de heterocedasticidad, por lo tanto, se sugiere construir un modelo mixto que incorpore esta estructura heterocedástica en la matriz de varianza y covarianzas. Sin embargo, lo anterior se sale del alcance de este trabajo.

Figura 34. Test de normalidad apartamentos - Entrenamiento 70%

Fuente: elaboración propia, datos procesados en R

a) Residuals vs. Fitted

• Este gráfico muestra los residuos de error frente a los valores ajustados. • La línea punteada en y = 0 indica la línea de ajuste.

• Los residuos forman aproximadamente una "banda horizontal" alrededor de la línea 0. Esto sugiere que las variaciones de los términos de error son iguales.

• La línea roja es la curva polinómica de alto orden suavizada para dar una idea del patrón de movimiento residual.

b) Normal Q-Q

• Los residuos se distribuyen normalmente si los puntos siguen de cerca la línea punteada. • El gráfico QQ muestra claramente que los puntos cuantiles no se encuentran en la línea

normal teórica.

• Se observa que los puntos caen a lo largo de una línea en el medio del gráfico, pero se curvan en las extremidades. Las gráficas QQ normales que exhiben este comportamiento generalmente significan que sus datos tienen valores más extremos de lo que se esperaría si realmente vinieran de una distribución Normal.

c) Scale – Location

• El diagrama de ubicación de escala indica la distribución de puntos en el rango de valores predichos.

• Una de las suposiciones para la regresión es la homocedasticidad, es decir, la varianza debería ser razonablemente igual en todo el rango del predictor.

• La línea roja horizontal indica que los residuos tienen una variación uniforme en todo el rango. A medida que los residuos se extienden más entre sí, la línea de propagación roja sube.

d) Residual vs Leverage

• En esta gráfica, las líneas rojas punteadas son la distancia de Cook.

• Las áreas de interés son las que están fuera de la línea punteada en la esquina superior derecha o en la esquina inferior derecha. Si algún punto cae en esa región, es un indicio de que la observación tiene un alto apalancamiento o el potencial para influir en nuestro modelo es mayor si excluimos ese punto.