Theoretical clarifications
2.4 Developmental complexity, robustness, and calibration
Uno de los objetivos de este trabajo consiste en identificar un modelo funcional (matemático) que describa de la forma más real –veraz- posible la variación entre la ocurrencia de los sismos y su magnitud en la zona de estudio; el análisis simultáneo de dos variables requiere del uso de ciertas técnicas estadísticas afines al propósito de este estudio.
La introducción de dos variables sobre una unidad experimental lleva a preguntarse si existe alguna relación entre las dos variables a considerar: frecuencia y magnitud, la aplicación del análisis de correlación y el análisis de regresión a los datos obtenidos de la RSNC permitirá saber si conocido el comportamiento de una de las variables se puede predecir el comportamiento de la otra115.
6.1 DELIMITACIÓN DE LA ZONA DE FALLAMIENTO
El objetivo del presente estudio es el cuantificar la relación frecuencia-magnitud en el Borde Llanero: Huila, Meta, Cundinamarca, Boyacá y Casanare a partir de los eventos sísmicos registrados en el período 1993-2017 por la Red Sismológica Nacional de Colombia RSNC. Se consideró esta zona de estudio, una porción importante del denominado Piedemonte Llanero Colombiano, debido a la significativa actividad -número de terremotos- que ocurre en esta zona; la actividad sísmica de esta región representa una fuente cercana de terremotos que hacia futuro (por su ubicación y cercanía) pueden afectar importantes poblaciones urbanas como lo son Villavicencio o Bogotá.
Esta es una zona de fallamiento de tipo compresional116 debido a que este es un antiguo sistema de fallas normales (de los períodos Jurásico y Cretácico) que han tenido un proceso de reactivación compresional durante la era Cenozoica117.
Al observar el número de sismos ocurridos en la zona de estudio118 durante el período de observación se seccionó la región en tres subregiones (I, II y III); los municipios que componen cada una de las subregiones, y el número que las
115
Suárez Rivero, Deivis. (2011). Estadística inferencial. p. 84-85.
116
Segura Hernández, Óscar I. op. cit., p. 50.
117
Durán Tovar, Juan P. y Briceño G, Luis A. op. cit. p. 1.
118
52
constituyen, están en conformidad con el número de terremotos presentes a lo largo y ancho de la región de estudio.
Si se grafica los municipios limítrofes entre departamentos vecinos en el eje horizontal versus el número de terremotos ocurridos a lo largo del borde llanero en el eje vertical, se obtiene una clara agrupación de los sismos en función de las fallas del SFFFCO. A los municipios se les menciona a partir del número que se les asigno en las tablas 1-1 y 1-2 de las páginas 24 y 25 del presente trabajo.
Ilustración 15. Distribución de los sismos a lo largo del Borde Llanero
53
6.2 ESTACIONES DE LA RSNC
El Servicio Geológico Colombiano (antes denominado Ingeominas) es una agencia adscrita al Ministerio de Minas y Energía119 que como Instituto Científico y Técnico de Colombia presta el servicio de Red Sismológica para el país. La Red Sismológica Nacional de Colombia RSNC entró en operación desde el 01 de junio de 1993, hace parte del Sistema de Prevención y Atención de Desastres, y tiene como objetivo el suministrar la información de los eventos sísmicos de la República de Colombia. Son 31 estaciones120: 18 de período corto y 13 de banda ancha.
Ilustración 16. Ubicación de las estaciones sismológicas de la RSNC
Fuente: RSNC para el año 2018
Al 2018 la RSNC posee estaciones sísmicas en la mayor parte del territorio colombiano, la mayoría de estas estaciones se ubican hacia el occidente del país debido a que en esta zona convergen las placas Nazca, Suramérica y Caribe;
119
Decreto 4131 de 2011
120
54
mientras que la Orinoquia y Amazonia colombiana son las regiones naturales en donde menos estaciones sísmicas se establecieron, esto debido a su baja actividad sísmica propia de una zona alejada de los bordes de las placas tectónicas ya mencionadas.
6.3 EVENTOS SÍSMICOS A CONSIDERAR
El análisis estadístico se realizó a partir de los terremotos registrados en las estaciones sismológicas pertenecientes a la RSNC y cuyos epicentros estuvieran ubicados en los municipios/departamentos de las subregiones establecidas en este estudio. En total se registraron 5785 eventos del período 1993-2017.
Se tuvo en cuenta sismos cuya magnitud Richter (ML) fuera mayor a 0 y menores o iguales a 6,9.
6.3.1 Eventos sísmicos Subregión I
Se analizaron 2111 eventos sísmicos registrados por la RSNC, de 26 municipios pertenecientes a la Subregión I del Piedemonte Llanero. Esta subregión corresponde a la falla Guaicáramo-Sector Norte del SFFFCO.
55
Tabla 3-1. Número de eventos sísmicos registrados en la Subregión I
MAGNITUD vs N DE LA SUBREGIÓN I
DEPARTAMENTOS Casanare y Boyacá
No. DE MUNICIPIOS 26
PERÍODO 01 de junio de 1993 a 31 de diciembre de 2017
No. DE EVENTOS 2111
Eventos por magnitud
ML No. de eventos (N) log10 N
0,5 1 0,0000 0,7 2 0,3010 0,8 4 0,6021 0,9 12 1,0792 1,0 18 1,2553 1,1 36 1,5563 1,2 47 1,6721 1,3 63 1,7993 1,4 77 1,8865 1,5 112 2,0492 1,6 99 1,9956 1,7 136 2,1335 1,8 121 2,0828 1,9 149 2,1732 2,0 135 2,1303 2,1 145 2,1614 2,2 127 2,1038 2,3 127 2,1038 2,4 117 2,0682 2,5 75 1,8751 2,6 77 1,8865 2,7 81 1,9085 2,8 55 1,7404 2,9 36 1,5563
56
Tabla 3-2. Número de eventos sísmicos registrados en la Subregión I
MAGNITUD vs N DE LA SUBREGIÓN I
DEPARTAMENTOS Casanare y Boyacá
No. DE MUNICIPIOS 26
PERÍODO 01 de junio de 1993 a 31 de diciembre de 2017
No. DE EVENTOS 2111
Eventos por magnitud
ML No. de eventos (N) log10 N
3,0 39 1,5911 3,1 34 1,5315 3,2 31 1,4914 3,3 25 1,3979 3,4 19 1,2788 3,5 11 1,0414 3,6 14 1,1461 3,7 14 1,1461 3,8 18 1,2553 3,9 9 0,9542 4,0 11 1,0414 4,1 6 0,7782 4,2 6 0,7782 4,3 4 0,6021 4,4 4 0,6021 4,5 1 0,0000 4,7 3 0,4771 4,8 4 0,6021 5,0 1 0,0000 5,1 1 0,0000 5,2 1 0,0000 5,4 1 0,0000 6,0 1 0,0000 6,6 1 0,0000 48 2111 Σ No. de eventos (N)
57
6.3.2 Eventos sísmicos Subregión II
Se analizaron 1034 eventos sísmicos registrados por la RSNC, de 30 municipios pertenecientes a la Subregión II del Borde Llanero. Esta subregión corresponde a las fallas Guaicáramo-Sector Sur, San Juanito, Servitá-Sector Norte, Mirador y Usme del SFFFCO.
Tabla 4-1. Número de eventos sísmicos registrados en la Subregión II
MAGNITUD vs N DE LA SUBREGIÓN II
DEPARTAMENTOS Meta y Cundinamarca
No. DE MUNICIPIOS 30
PERÍODO 01 de junio de 1993 a 31 de diciembre de 2017
No. DE EVENTOS 1034
Eventos por magnitud
ML No. de eventos (N) log10 N
0,9 2 0,3010 1 10 1,0000 1,1 18 1,2553 1,2 41 1,6128 1,3 56 1,7482 1,4 64 1,8062 1,5 53 1,7243 1,6 75 1,8751 1,7 62 1,7924 1,8 77 1,8865 1,9 76 1,8808 2 60 1,7782 2,1 52 1,7160 2,2 48 1,6812 2,3 50 1,6990 2,4 51 1,7076 2,5 38 1,5798 2,6 39 1,5911 2,7 25 1,3979 2,8 20 1,3010 2,9 28 1,4472
58
Tabla 4-2. Número de eventos sísmicos registrados en la Subregión II
MAGNITUD vs N DE LA SUBREGIÓN II
DEPARTAMENTOS Meta y Cundinamarca
No. DE MUNICIPIOS 30
PERÍODO 01 de junio de 1993 a 31 de diciembre de 2017
No. DE EVENTOS 1034
Eventos por magnitud
ML No. de eventos (N) log10 N
3 16 1,2041 3,1 14 1,1461 3,2 6 0,7782 3,3 7 0,8451 3,4 8 0,9031 3,5 5 0,6990 3,6 2 0,3010 3,7 6 0,7782 3,8 2 0,3010 3,9 3 0,4771 4 6 0,7782 4,1 3 0,4771 4,2 1 0,0000 4,3 3 0,4771 4,4 1 0,0000 4,5 2 0,3010 4,8 1 0,0000 5,1 1 0,0000 5,2 1 0,0000 5,7 1 0,0000 41 1034 Σ No. de eventos (N)
59
6.3.3 Eventos sísmicos Subregión III
Se analizaron 2640 eventos sísmicos registrados por la RSNC, de 8 municipios pertenecientes a la Subregión III del Piedemonte Llanero. Esta subregión corresponde a las fallas Servitá-Sector Sur y Algeciras-Uribe del SFFFCO.
Tabla 5-1. Número de eventos sísmicos registrados en la Subregión III
MAGNITUD vs N DE LA SUBREGIÓN III
DEPARTAMENTOS Meta, Cundinamarca y Huila
No. DE MUNICIPIOS 8
PERÍODO 01 de junio de 1993 a 31 de diciembre de 2017
No. DE EVENTOS 2640
Eventos por magnitud
ML No. de eventos (N) log10 N
0,8 5 0,6990 0,9 11 1,0414 1 25 1,3979 1,1 54 1,7324 1,2 72 1,8573 1,3 92 1,9638 1,4 113 2,0531 1,5 138 2,1399 1,6 162 2,2095 1,7 191 2,2810 1,8 189 2,2765 1,9 171 2,2330 2 174 2,2405 2,1 182 2,2601 2,2 169 2,2279 2,3 138 2,1399 2,4 157 2,1959 2,5 118 2,0719 2,6 98 1,9912 2,7 52 1,7160 2,8 67 1,8261 2,9 56 1,7482
60
Tabla 5-2. Número de eventos sísmicos registrados en la Subregión III
MAGNITUD vs N DE LA SUBREGIÓN III
DEPARTAMENTOS Meta, Cundinamarca y Huila
No. DE MUNICIPIOS 8
PERÍODO 01 de junio de 1993 a 31 de diciembre de 2017
No. DE EVENTOS 2640
Eventos por magnitud
ML No. de eventos (N) log10 N
3 35 1,5441 3,1 30 1,4771 3,2 23 1,3617 3,3 16 1,2041 3,4 24 1,3802 3,5 9 0,9542 3,6 15 1,1761 3,7 13 1,1139 3,8 10 1,0000 3,9 3 0,4771 4 4 0,6021 4,1 5 0,6990 4,2 4 0,6021 4,3 3 0,4771 4,4 1 0,0000 4,5 2 0,3010 4,6 1 0,0000 4,7 1 0,0000 4,8 3 0,4771 5,2 1 0,0000 5,3 2 0,3010 5,6 1 0,0000 44 2640 Σ No. de eventos (N)
61
6.4 CORRELACIÓN Y REGRESIÓN
A partir de los datos de la RSNC, comprendidos entre el período 1993 y 2017, se pretende establecer si existe una relación funcional que vincule la frecuencia de los sismos (número de terremotos) ocurridos en el Borde Llanero y su magnitud. El análisis de regresión –análisis estadístico- permitirá establecer la asociación entre las dos variables ya citadas.
6.4.1 Coeficiente de correlación lineal r
La intuición de que dos variables parecen estar relacionas, producto de una buena observación de campo, no revela mayor cosa; se requiere de una medida (hablando en términos cuantitativos) del grado de asociación entre las dos variables121. El término correlación hace alusión a la intensidad de la relación lineal entre dos variables, este coeficiente refleja el efecto que el cambio en una variable tiene sobre la otra; el coeficiente de correlación lineal r [también conocido como coeficiente de correlación producto momento de Pearson122] es una medida numérica de la fuerza de la relación [asociación] entre dos variables que representan datos cuantitativos123.
Ilustración 17. Ejemplos de gráficos donde se evidencia la correlación lineal
Fuente: Emaze.
121
Suárez Rivero, Deivis. op. cit. p. 84-85.
122
Llamado así en honor al científico británico Karl Pearson quien estableció la estadística matemática en el siglo XIX.
123
62
Si se tuviera cada par de los valores poblacionales de x y y el resultado del análisis de correlación sería un parámetro poblacional representado por la letra
ρ124 .
La fórmula para calcular el coeficiente de regresión lineal es:
(∑ ) (∑ )(∑ )
√ (∑ ) (∑ ) √ (∑ ) (∑ )
En donde:
r = coeficiente de relación lineal de una muestra
n = número de pares de datos presentes.
Σ = indica la suma de los elementos señalados
Σx = suma de todos los valores de x Σx2
= indica que cada valor de x debe elevarse al cuadrado y que después deben sumarse
(Σx2
) = indica que los valores de x deben sumarse para luego elevar el total al cuadrado
Σx = indica que cada valor de x debe multiplicarse primero por su valor correspondiente de y. Luego de obtener todos estos productos se calcula la suma.
El coeficiente de correlación lineal siempre tiene un valor entre -1 y +1, un valor de +1 quiere decir que entre las variables existe una correlación lineal perfecta; mientras que un valor de -1 señala una correlación negativa perfecta125. Cuando el valor tiende a cero significa que hay poca correlación lineal o simplemente no existe correlación entre las variables.
A la hora de aplicar el coeficiente de correlación lineal a un conjunto de datos cuantitativos muestrales se debe tener en cuenta que la muestra sea aleatoria
124
Triola, Mario F. (2013). op. cit. p. 522-523.
125
Nieves H., Antonio y Domínguez S., Federico C. Probabilidad y estadística para ingeniería, un enfoque moderno. p. 320.
63
simple, es decir, que no se haya reunido por medio de algún método inadecuado126; además, el análisis gráfico de la disposición de los datos (estimación visual) debe indicar un claro patrón de línea recta127. Por último, se deben eliminar valores atípicos, que sean el producto de errores, ya que los resultados se pueden ver afectados por la presencia de estos valores atípicos128.
La correlación entre dos variables no implica causalidad porque es una condición necesaria, pero no suficiente para que exista una dependencia causal entre estas129; pueda existir una tercera variable (denominada variable interventora) que afecta las variables estudiadas sin que se haya involucrado en el análisis130.
El análisis de correlación lineal no dice el porqué de la forma de asociación entre las variables estudiadas por lo tanto si dos variables siguen una estrella asociación no lineal este coeficiente de correlación no lo medirá131; sin embargo, el coeficiente de relación lineal de Pearson cuantifica el grado de asociación lineal entre ellas.
6.4.2 Análisis de regresión lineal simple
Aunque el análisis de correlación lineal mide el grado de relación lineal entre dos variables; este coeficiente no específica la relación matemática existente entre las variables consideradas132. El término regresión nació a partir de estudios biológicos sobre la herencia realizados por Galton133 en el siglo XIX en dónde encontró que en una población de padres e hijos existía la tendencia de las
126
Triola, Mario F. (2013). op. cit. p. 520.
127
Nieves H., Antonio y Domínguez S., Federico C. op. cit. p. 322.
128
Triola, Mario F. (2013). op. cit. p. 520.
129
Gil, Salvador (2014). Experimentos de física usando las TIC y elementos de bajo costo. p.84-85.
130
Triola, Mario F. (2013). op. cit. p. 525.
131
Suárez Rivero, Deivis. op. cit. p. 103.
132
Nieves H., Antonio y Domínguez S., Federico C. op. cit. p. 328.
133
Sir Francis Galton (1822-1911), biólogo británico, quien estudió el fenómeno de la herencia y demostró que cuando parejas de estatura alta o baja tienen hijos, las estaturas de estos últimos tienen a regresar a la estatura media más común de las personas del mismo género.
64
características de los grupos a moverse (en la siguiente generación) hacia el promedio de dicha población: regresión hacia la media134.
Ilustración 18. Gráficos en dónde se aplica el análisis de regresión lineal en Botánica
Fuente: Revista chilena de historia natural.
134
65
El término se emplea hoy en día para referirse al estudio de las mejores relaciones funcionales [matemáticas] entre variables y permite obtener una ecuación de la recta del mejor ajuste para realizar predicciones135. Cuando dos variables están relacionadas de una manera tal que a partir del valor de una variable el valor de la otra variable se determina automáticamente sin error, se dice que tiene una relación determinista; no obstante, en otros casos una variable no se encuentra determina por completo por la otra variable por lo que se trata de un modelo probabilístico136.
Para el caso de dos variables (frecuencia y magnitud en el caso de este estudio) si se denota como x a la variable independiente y como a y la variable que se denota dependiente de la anterior, se puede decir que y está en función de x para señalar que de acuerdo a los valores dados a x se puede predecir los valores que tomara
y. Si bien el análisis de regresión tiene como objetivo la predicción, es decir, el uso de un modelo matemático para obtener un valor de y en función de un valor dado de x; el análisis de regresión también se encarga de la validación del modelo propuesto y de las pruebas de hipótesis sobre los parámetros del modelo137.
La regresión lineal simple tiene como modelo matemático la función Y = a + bx, su función de ajuste es:
Al emplear el método de los mínimos cuadrados para la ecuación anterior, se tienen las siguientes ecuaciones normales:
∑ ∑ ∑ ∑ ∑
La estimación de los coeficientes de regresión muestral se obtienen de despejar A y B de las ecuaciones anteriores.
135
Nieves H., Antonio y Domínguez S., Federico C. op. cit. p. 319-320.
136
Triola, Mario F. op. cit. p. 544-546.
137
66
6.4.3 Coeficiente de determinación r2
Es una medida de la calidad o bondad del ajuste realizado, es decir, es la cantidad de variación en y, además caracteriza la dispersión de los datos alrededor de la recta obtenida por medio del análisis de regresión lineal138.
El valor de r2 se calcula al elevar al cuadrado el coeficiente de correlación lineal r.
6.4.4 Análisis de regresión en modelos no lineales
Los modelos lineales (describen el comportamiento de un sistema) tienen múltiples aplicaciones debido a la fácil interpretación de sus resultados; no obstante, hay fenómenos naturales que no pueden ser explicados por un modelo lineal.
La regresión lineal se encuentra restringida a la estimación de modelos lineales; cuando se pretende obtener la relación entre dos variables relacionadas arbitrariamente (y en donde no se puede aplicar de una u otra forma el método de los mínimos cuadrados) se emplea el análisis de regresión no lineal usando algoritmos de estimación iterativos.
La estimación de los parámetros estadísticos muestrales, en un modelo no lineal, en algunos casos implica el uso de métodos numéricos. Un algoritmo de estimación empleado es el método de Gauss-Newton, este método también se conoce como método de linealización.
Para los casos en el cual se puede emplear el método de los mínimos cuadrados después de “ajustar” los datos, es decir, después de linealizar las relaciones no lineales, existen diferentes tipos de funciones linealizables: geométrica, exponencial, logarítmica, gamma, gaussiana, etc.
La distribución de los sismos ocurridos en el Borde Llanero, en el período comprendido entre 1993 y 2017, puede ser descrito acertadamente por medio de la aplicación del logaritmo natural (ln) al número de sismos ocurridos (N) para
linealizar la relación entre la frecuencia (número de sismos) y su respectiva magnitud.
138
67
6.5 MÉTODO DE LOS MÍNIMOS CUADRADOS
En el análisis de regresión se pretende encontrar, por medio de un proceso estadístico, las relaciones existentes entre dos o más variables; en el análisis de regresión se pretende entender cómo cambia el valor de una variable llamada
variable dependiente cuando varía el valor de otra denominada variable independiente.
La técnica del método de los mínimos cuadrados intenta hallar una función continua que se aproxime a un conjunto de pares ordenadas de acuerdo con el criterio del mínimo error cuadrático. Este método se fundamenta en hallar la curva (línea) de ajuste que hace mínima la suma de los cuadrados de las desviaciones de los valores observados -conjunto de pares ordenados- respecto a dicha curva; sin embargo, para cada pareja ordenada existe una desviación llamada error típico de la estimación de la regresión.
Ilustración 19. Curvas de ajuste, para datos experimentales, empleando los mínimos cuadrados
68
6.6 MÉTODO DE LA MÁXIMA VEROSIMILITUD
Este método fue desarrollado por Aki/Utsu139 (1965) y estudiado por Weichert (1980), Utsu (1999) y Kagan140 (2005) como aproximación para estimar el valor de
b a partir de una magnitud media de los terremotos ocurridos en la zona. Este método proporciona un valor de b más cercano al valor real entre otras cosas porque da mayor peso a sismos pequeños.
Este método fue ampliamente popularizado por Ronald A. Fisher -entre 1912 y 1922- para una amplia gama de análisis estadísticos, el método se fundamenta en el ajuste que se hace a la recta al valor medio de los datos ( ) sobre la magnitud mínima (Mmin) de homogeneidad, esto incluye también ajustar la máxima magnitud observada y normalizada.
El teorema muestra que el error en el logaritmo de los valores de verosimilitud para la estimación de múltiples muestras independientes se distribuye asintóticamente, esto permite la determinación de una región de confianza alrededor de cualquier estimación de los parámetros. En conclusión, es un método que asume una distribución previa uniforme de los parámetros.
Los parámetros a y b se calculan así:
̅ ( )
La magnitud mínima (Mmín) de la muestra, para efectos de este estudio, será la magnitud de completitud (Mc).
La desviación estándar está dada por:
√
En donde n es el número de terremotos utilizados en el análisis.
139
Garza Girón, Ricardo. (2014). op. cit.p. 54.
140
Castellaro, S.; Mulargia, F. y Kagan, Y. Y. (2006). Problemas de regresión para magnitudes. p. 913-930.
69