Performance of score combination rules and comparison with the state

5.3 Matching between sequences of frames

5.4.4 Performance of score combination rules and comparison with the state

El modelo propuesto será contrastado empíricamente mediante un análisis de ecuaciones estructurales. Esta metodología ha demostrado ser enormemente útil en la investigación en el campo de las ciencias sociales, en general, y del marketing, en particular. Entre las virtudes de esta metodología destaca su capacidad para tratar de manera integrada y sistemática: 1) los problemas de medición de conceptos teóricos que se hacen operativos a través de variables complejas y abstractas que con frecuencia no son directamente observables, y 2) la estimación de las relaciones existentes entre estos constructos. En otras palabras, los modelos de ecuaciones estructurales permiten analizar de forma holística las relaciones existentes entre múltiples variables teóricas independientes y dependientes, teniendo en cuenta explícitamente los posibles errores de medición de estas variables que no siempre pueden ser observadas de manera directa (Bagozzi, 1994).

En este grupo de técnicas de análisis multivariante que se han dado en llamar “de segunda generación” podemos distinguir dos enfoques. El primero de ellos es el análisis de la estructura de covarianzas (en adelante CBSEM, Covariance-Based Structural Equation Modeling), enfoque que ha gozado de una enorme aceptación y que ha sido aplicado con gran frecuencia en diversas disciplinas en el ámbito de las ciencias sociales, en parte debido al desarrollo de numerosos programas informáticos que permiten estimar este tipo de

modelos, entre los que destacan LISREL, EQS y AMOS. El segundo enfoque, es el de mínimos cuadrados parciales (en adelante PLS, en alusión a las siglas en inglés de Partial Least Squares). Las diferencias entre ambas metodologías de modelización estructural se encuentran fundamentalmente en el objetivo del análisis, los supuestos estadísticos de partida, el tipo de relaciones entre las variables observadas y las no observadas y la naturaleza de los estadísticos de ajuste que se utilizan para evaluar los modelos que se estudian (Gefen et al., 2000; Hair et al., 2014). Conviene aclarar que ambos enfoques, más que alternativos, son complementarios (Hair et al., 2012).

El objetivo de los modelos CBSEM es contrastar si un modelo teórico especificado a priori permite reproducir aceptablemente bien –con la mínima discrepancia posible– la estructura real de varianzas-covarianzas de acuerdo con los datos disponibles. Consecuentemente, la finalidad de este enfoque de ecuaciones estructurales es confirmar teorías examinando si el modelo propuesto es, desde un punto de vista estadístico, congruente con la realidad (Jöreskog y Sörbom, 1993; Byrne, 1998 y 2001; Hair et al., 1999). PLS, por el contrario y como si de una regresión lineal se tratase, persigue básicamente la maximización de la capacidad para predecir (explicar la varianza) de las variables dependientes o endógenas del modelo, lo que equivale a minimizar el error de predicción de estas variables, razón por la que esta metodología aplica una estimación por mínimos cuadrados ordinarios. Se trata, por tanto, de un enfoque apropiado para aplicaciones orientadas a la predicción, así como al desarrollo de nuevas teorías –puede ser muy útil en investigaciones exploratorias en las que no se conocen todas las variables relevantes y sus interrelaciones son conjeturables. Autores como Fornell y Bookstein (1982), Barclay et al. (1995), Chin (1998 a y b), Chin y Newsted (1999) o Gefen et al. (2000) ponen de manifiesto la relevancia de PLS cuando se trabaja con modelos teóricos incipientes y de gran complejidad. En palabras de Chin y Newsted (1999: 313), “aunque cabe utilizar PLS para la confirmación de teorías, también puede emplearse para sugerir dónde pueden o no existir relaciones y proponerlas para un posterior contraste”. Estos mismos autores resaltan que el enfoque PLS se ve menos sometido al problema de falta de especificación o de omisión de variables determinantes relevantes, ya que esto tiene una menor influencia en los parámetros estimados en otras partes del modelo.

CBSEM es muy exigente en cuanto a los supuestos estadísticos que subyacen en sus procedimientos de estimación. La estimación por máxima verosimilitud es la más adecuada, pero requiere que las variables empleadas no se desvíen de la distribución normal multivariante y que el tamaño muestral sea considerablemente grande, más cuanto mayor sea la complejidad del modelo contrastado (Hair et al., 1999). Existen formas alternativas de estimar modelos con variables no normales como la técnica de mínimos cuadrados ponderados, pero obligan a contar con muestras de tamaño aún mayor, en la práctica muy difíciles de obtener. Soluciones para el problema del reducido tamaño muestral como la de imponer restricciones a ciertos parámetros, descartar variables latentes del modelo o disminuir el número de indicadores para algunos de los constructos medidos tampoco son del todo satisfactorias (Raykov y Widaman, 1995). El enfoque de mínimos cuadrados parciales, por el contrario, hace posible el estudio de muestras de pequeño tamaño (Reinartz et al.,

2009). Además, dado que PLS no presupone una distribución de frecuencias determinada, posibilita trabajar con variables observadas que no sigan una distribución normal. PLS aplica de forma iterativa una secuencia de estimación por mínimos cuadrados ordinarios y regresión lineal múltiple, segmentando los modelos y analizando cada bloque de variables por separado, por lo que esta metodología se ve menos afectada por el tamaño de la muestra o la distribución de frecuencias de las variables (Barclay et al., 1995; Gefen et al., 2000). Por esta facilidad para acomodar datos que no cumplan con los rígidos supuestos estadísticos en los que se apoya el enfoque basado en covarianzas es por lo que la metodología PLS ha recibido también la denominación de “modelización flexible” –soft modeling– (Falk y Miller, 1992; Tenenhaus et al., 2005).

Por otra parte, una diferencia importante entre los enfoques basados en covarianzas y los de mínimos cuadrados parciales radica en el tipo de escalas admitidas por uno y otro. PLS es más flexible en cuanto a la escala permitida, ya que se pueden utilizar variables medidas con escalas ordinales e incluso categóricas (Falk y Miller, 1992). Pero, quizás más importante que la diferencia en cuanto al tipo de escalas que se pueden emplear, es la diferencia en cuanto al tipo de relaciones entre las variables observadas y las no observadas que pueden manejarse. Los modelos basados en las covarianzas parten del supuesto de que los ítems utilizados para medir cada variable latente son reflectivos, es decir, se considera que las variables observadas con las que se trata de medir cada concepto teórico son una manifestación o reflejo (un efecto) del mismo. En consecuencia, cabe esperar que los indicadores reflectivos usados para captar la esencia de un determinado concepto teórico estén altamente correlacionados entre sí. Esta manera de medir, claramente inspirada en la noción de unidimensionalidad, ha dominado las investigaciones empíricas en el campo del marketing y de otras ciencias sociales, que se han preocupado sobremanera por la generación de escalas de medida válidas y fiables (Bollen y Lennox, 1991). Una alternativa en el proceso de medición, hasta ahora mucho menos utilizada, pero que poco a poco empieza a extenderse en el mundo académico, es el uso de indicadores formativos o causales, lo que supone la creación de índices compuestos, más que el desarrollo de escalas (Fornell y Bookstein, 1982; Bollen y Lennox, 1991; MacCallum y Browne, 1993; Law y Wong, 1999; Edwards y Bagozzi, 2000; Diamantopoulos y Winklhofer, 2001; Jarvis et al., 2003). En este caso, una variación en alguna de las variables observadas provoca cambios en el constructo –que es inherentemente multidimensional– y no al revés. En otras palabras, el indicador es una de las causas o antecedentes de la variable latente –que bien podría llamarse emergente– con la que se relaciona. Bajo esta perspectiva, el significado conceptual y empírico de una variable latente compuesta queda determinado (formado) por el conjunto de variables observadas empleadas, que no tienen que estar necesariamente correlacionadas entre sí (Jarvis et al., 2003). Debido a que los modelos de ecuaciones estructurales tipo LISREL tratan de tomar en consideración todas las covarianzas entre sus medidas, la inclusión de indicadores formativos es algo más que problemática (Chin, 1998b). PLS, en cambio, permite el análisis de modelos con indicadores tanto formativos como reflectivos (Barclay et al., 1995; Chin, 1998 a y b; Gefen et al., 2000; Hair et al., 2014).

Una última diferencia entre CBSEM y PLS se encuentra en el tipo de estadísticos que las aplicaciones informáticas suministran para efectuar el diagnóstico sobre la bondad del modelo contrastado (Gefen et al., 2000). Los programas estadísticos de ecuaciones estructurales más conocidos (basados en covarianzas) generan estadísticos a tres niveles. Por una parte, se obtienen las estimaciones de todos los parámetros individuales de los modelos de medición y estructural (cargas factoriales, errores de medida, coeficientes path, correlaciones, etc.), así como información sobre los niveles de significación de estos parámetros y sobre la varianza explicada de los constructos endógenos. Por otra parte, se proporciona una batería de estadísticos para evaluar el ajuste global del modelo (Baumgartner y Homburg, 1996). El más importante es el de la 2_{y su probabilidad asociada, que mide la distancia entre la matriz} de datos inicial y la estimada por el modelo, pero que es dependiente del tamaño muestral, por lo que diversos autores han propuesto numerosos estadísticos alternativos para juzgar el ajuste absoluto, incremental y de parsimonia (GFI, AGFI, RMR, RMSEA, ECVI, NFI, CFI, AIC, CAIC, CN, etc.). Por último, también es posible obtener los denominados índices de modificación, que facilitan la tarea del investigador en la identificación de las posibles causas de desajustes en el modelo y la reespecificación del mismo. PLS, dado que no trata de reproducir la matriz de datos original sino de maximizar la varianza explicada de los constructos endógenos, no puede suministrar estadísticos sobre el grado de ajuste del modelo (Chin, 1998 a y b; Hair et al., 2014). Aplicando esta metodología se obtienen las estimaciones de los pesos y cargas factoriales, de las covarianzas residuales del modelo de medición, de los coeficientes que miden las relaciones estructurales, de las correlaciones entre las variables latentes, así como del valor de la R2_{y de la varianza extraída media (AVE)} para cada constructo. La significación de los parámetros estimados se calcula empleando un proceso de remuestreo denominado bootstrapping, ya que no se asume ninguna distribución de frecuencias para las variables observadas, sino que ésta se determina empíricamente. Ante la ausencia de índices de ajuste global en PLS, la bondad de un modelo se evalúa fundamentalmente analizando la significación de los parámetros estimados, la capacidad para predecir las variables dependientes –los valores de la R2_{deben ser aceptablemente altos–,} así como la adecuación de los instrumentos de medida tanto de los constructos reflectivos como de los formativos (Hair et al., 2014; Henseler et al., 2014).

In document Dissimilarity-based people re-identification and search for intelligent video surveillance (Page 77-85)