Chapter 4. Wage estimations for domestic workers
4.5 Exploratory wage analyses using the SLFS data
El Análisis de Conglomerados, también conocido como “Análisis Clúster o Reconocimiento de Patrones”, es una técnica estadística multivariable cuya finalidad es dividir un conjunto de objetos en grupos (en inglés “cluster”) de forma que los perfiles de los objetos en un mismo grupo sean similares entre sí (cohesión interna del grupo) y los de los objetos de clúster diferentes sean distintos (aislamiento externo del grupo) (Figueras Salvador y Gargallo Valero, 2003). Para este análisis se ha utilizado el
programa BM SPSS software. Predictive analytics software and soluciones, 2015.
El Análisis Clúster no tiene base estadística sobre las que deducir inferencias estadísticas para una población a partir de una muestra, es un método basado en criterios geométricos y se utiliza fundamentalmente como una técnica exploratoria, descriptiva pero no explicativa.
Las soluciones no son únicas, en la medida en que la pertenencia al conglomerado para cualquier número de soluciones depende de muchos elementos del procedimiento elegido. Por otra parte, la solución clúster depende totalmente de las variables utilizadas, la adición o sustracción de variables relevantes puede tener un impacto substancial sobre la solución resultante (De la Fuente Fernández, 2011). Este procedimiento va a permitir contestar a la pregunta de ¿Se pueden clasificar las minas en función de las características relacionadas con el riesgo?
El algoritmo de formación de conglomerados elegido ha sido el jerárquico, concretamente el Disociativo que parte de un solo grupo que contiene todos las minas, un gran conglomerado con las 23 minas abandonadas, y a través de sucesivas divisiones se forman grupos cada vez más pequeños hasta que cada mina queda en un conglomerado distinto.
La decisión sobre el número óptimo de clúster es subjetiva, especialmente cuando se incrementa el número de objetos, pues si se seleccionan pocos, los clúster resultantes son heterogéneos y artificiales, mientras que si se seleccionan demasiados, la interpretación de los mismos suele resultar complicada (Vilà, Rubio, Berlanga yTorrado, 2014).
Una vez realizada la selección de los individuos objeto de estudio, las 23 minas, y seleccionadas las variables que describen y caracterizan la muestra (Tabla V.2) se ha confeccionado la matriz de datos (Tabla V.3).
El siguiente paso ha sido la elección de la medida de proximidad entre los individuos (Distancias) que nos va a ayudar a interpretar las agrupaciones resultantes y a determinar cuál es el punto de corte más adecuado. Se ha optado por la “Distancia euclídea al cuadrado”.
A continuación, utilizando la matriz de datos (Tabla V.3), se han realizado tres análisis: Vinculación de Ward, Vinculación promedio (Inter-grupos) y Vinculación completa.
Solo se presenta en la tesis el proceso seguido en la Vinculación de Ward, que ha sido el que mejor ha respondido a los intereses que se iban buscando. Los otros dos análisis realizados no han respondido a las expectativas. En ambos casos, los grupos que han resultado eran muy heterogéneos y de difícil interpretación (Anexo VI).
La variable 7 (sustancia) se ha eliminado del análisis por ser una variable discreta y no responder a las condiciones que exige este tipo de análisis.
Método de Ward
Este método es uno de los más utilizados; se caracteriza porque maximiza la homogeneidad dentro de los grupos (minimiza la varianza). Tiende a grupos muy compactos.
La decisión e interpretación final sobre el número adecuado de agrupaciones es totalmente subjetiva. A partir de la utilización del SPSS como recurso informático se obtienen dos tipos de información, una numérica: la cuantificación de las distancias entre grupos (abscisas); y otra gráfica que permite visualmente e intuitivamente identificar los grupos o conglomerados que se han formado. En las ordenadas (el número se refiere a la posición de la mina en la Tabla V.3.) se sitúan las minas relacionadas por su afinidad en la distancia más corta (la mayor similitud) (Fig. V.1).
Figura V.1. Agrupación de las minas. Vinculación de Ward (Dendrograma).
Los grupos obtenidos son el resultado de establecer un corte o división en el Dendrograma, a una distancia mayor de 10 y menor de 15, donde los saltos son bruscos y la heterogeneidad responde a lo observado en las fichas de campo. Reflejan una cierta homogeneidad (Tabla V.5). Cortes por debajo, próximo al 5, daría una clasificación de 13 grupos. A medida que se baja en el valor del índice de distancia, nos aproximaríamos a la variabilidad total, 23 grupos, tantos como minas, que no resolverían el problema que se plantea. Por encima del valor 15 resultarían 3 grupos que responden a una clasificación muy prematura con grupos poco definidos.
G1 + Grupos - Grupos G2 G3 G4 G5
Tabla V.4. Grupos formados por la vinculación de Ward
GRUPO Nº DE LA MINA EN EL
ANÁLISIS CLÚSTER MINAS SELECCIONADAS
G1 16, 17, 2, 11, 10 M24, M25, M3, M8, M6 G2 7,14, 18, 22, 21, 23, 9, 5 M49, M18, M26, M45, M36, M57, M52, M47 G 3 4, 6 M42, M55 G4 8, 12, 20, 1 M51, M11, M28, M9 G5 3, 13, 15, 19 M10, M17, M23, M27
De cada grupo se ha elegido una mina representativa que refleja las características más importantes. Del Grupo 3 se han considerado las dos minas que forman dicho grupo por tener ambas elementos patrimoniales y mineralógicos de elevado interés para su conservación y restauración (Tabla V.5).
‐ Grupo 1: M8, Pozo la Cazadora.
‐ Grupo 2: M45, Pozo de La Picaza.
‐ Grupo 3: M42, Antigua Pilar y M55, Nuestro Padre Jesús.
‐ Grupo 4: M9, San Francisco.
‐ Grupo 5: M17, San José.
El Grupo 1 se caracteriza por tener, en general, pocas estructuras mineras, pero con un elevado riesgo para la seguridad.
El Grupo 2 concentra minas con alta accesibilidad, tiene pocas estructuras mineras,
bastante camufladas y poco visibles. Hechosque hacen que su riesgo sea alto.
Estos dos grupos tienen bajo interés patrimonial y mineralógico.
El Grupo 3 está formado únicamente por dos minas (Antigua Pilar y Nuestro Padre Jesús) de fácil accesibilidad. Ambas requieren una restauración urgente, al tener edificaciones valiosas con alto riesgo de derrumbamiento.
Las minas del Grupo 4 están alejadas de núcleos urbanos y presentan numerosas estructuras mineras. Su accesibilidad es variable.
Lo más significativo del Grupo 5, es su mayor número de estructuras mineras y su proximidad a zonas urbanas.