• No results found

Confiabilidad: Una prueba es confiable en grados diversos. En el dominio de las mediciones comportamentales, la variabilidad es mucho mayor dadas las características del objeto epistémico y de los instrumentos de medición utilizados. La confiabilidad de una medición o de un instrumento, según el propósito de la primera y ciertas características del segundo, puede tomar

31 varias formas o expresiones al ser medida o estimada: coeficientes de precisión, estabilidad, equivalencia, homogeneidad o consistencia interna, pero el denominador común es que todos son básicamente expresados como diversos coeficientes de correlación (Quero, 2010 citado en Alfonso, 2013).

La psicometría, para medir la fiabilidad, hace uso de una metodología que puede tomar varias formas o expresiones al ser medida o estimada. En este sentido, el coeficiente de fiabilidad es el cálculo de la correlación lineal entre los conjuntos de puntuaciones, consideradas como paralelas, que se pueden obtener de diferentes formas. Cuanto más cerca de 1 sea el coeficiente, más cercano al 100% estará la correspondencia, y si el valor llega a ser de 0 indicará la ausencia de relación entre los eventos (Cardoso, Gómez-Conesa y Gómez, 2010 citado en Alfonso, 2013).

Para medir el coeficiente de confiabilidad se han utilizados: Medidas de estabilidad (Confiabilidad test- retest, Método de formas alternativas o paralelas y el Método de las mitades.) y las Medidas de consistencia interna (Alfa de Cronbach, Coeficiente de Kuder y Richardson y la C. de alfa), todos estudiados por la psicometría (Cardoso, Gómez-Conesa y Gómez, 2010 citado en Alfonso, 2013).

El coeficiente alfa de Cronbach, propuesto por Lee J.Cronbach en el año 1951, es un índice usado para medir la confiabilidad del tipo consistencia interna de una escala, es decir, que aporta una fiabilidad basada en la magnitud de las covariaciones entre los diferentes elementos en relación a la varianza total del test, en vez de las medidas paralelas. El valor mínimo aceptable para el coeficiente alfa de Cronbach es 0,70; por debajo de ese valor la consistencia interna de la escala utilizada es baja. Por su parte, el valor máximo esperado es 0,90; por encima de este valor se considera que hay redundancia o duplicación. Usualmente, se prefieren valores de alfa entre 0,80 y 0,90 (Oviedo y Campo, 2005; Cardoso, Gómez-Conesa y Gómez, 2010 citado en Alfonso, 2013).

Entre los factores que afectan la confiabilidad, se pueden citar como los más comunes a los referidos a la construcción del test, a la administración y a la

32 evaluación. A su vez se sugieren como procedimientos para medir la confiabilidad se señalan a los estudios de test re test o examen-reexamen, las formas alternas, paralelas o equivalentes, la división por mitades, la consistencia interna de Kuder-Richardson y el coeficiente alfa y la correspondencia entre evaluadores.

La validez es uno de los temas cruciales en el proceso de construcción de un test, una escala, un inventario o un cuestionario, ya que se requiere comprobar la utilidad de la medida, es decir, el significado de las puntaciones obtenidas. Es precisamente la validez la que permitirá realizar las inferencias e interpretaciones correctas de las puntuaciones que se obtengan al aplicar un test y establecer la relación con el constructo/variable que se trata de medir. Samuel Messick (1995), uno de los autores más influyentes en el estudio de la validez, define el concepto en los siguientes términos: “La validez es un juicio global en el que la evidencia empírica y la lógica teórica apoyan la concepción y conveniencia de las inferencias y acciones que se realizan basándose en las puntaciones que proporcionan los test u otros instrumentos de medida (Barraza, 2007)

La validez se refiere a la comprobación empírica de que el instrumento de que se trate mida la variable que pretende medir. Como señala Cronbach (1990), con el concepto de validez estamos tratando de una cuestión fundamental: hasta qué punto son válidas las interpretaciones que vamos a hacer (Citado en Fernández-Ballestero, 2005).

Algunas de las estrategias o tipos de validez que se registra en la literatura son: la validez de contenido, predictiva, concurrente y de criterio. Reservando para la validez de contenido aquellos test que describirían el desempeño de las personas sobre un universo definido de tareas; la predictiva cuando el test predice el desempeño futuro, la concurrente cuando se demuestra la concurrencia con medidas simultáneas y la de criterio enfatiza en la estructura externa del test, o sea, sus relaciones con el criterio, pero no las posibilidades de generalización de este (R. Fernández-Ballesteros, 2004).

33 Por tanto se considera que el AF es una técnica de reducción de datos que sirve para encontrar grupos homogéneos de variables, a partir de un conjunto numeroso de estas. Esos grupos homogéneos se forman con las variables que más correlacionan entre sí, y tratando, inicialmente, que unos grupos sean independientes de otros. Su propósito último consiste en buscar el número mínimo de dimensiones capaces de explicar el máximo de información contenida en los datos (Fernández, 2013).

Tanto la validez y la confiabilidad son conceptos interdependientes, pero no son equivalentes. Un instrumento puede ser consistente (tener una gran confiabilidad), pero no ser válido; por eso las dos propiedades deben ser evaluadas simultáneamente siempre que sea posible (Oviedo y Campo, 2005, citado en Alfonso, 2013).

Otro métodos alternativo para evaluar la validez y la fiabilidad de un test es el análisis factorial confirmatorio (AFC). Cuando el investigador tiene suficientes conocimientos previos para formular hipótesis concretas sobre la relación entre indicadores y dimensiones latentes, su interés se centra en contrastar estas hipótesis. Por ejemplo, al traducir o adaptar cuestionarios ya desarrollados se sabe qué ítem deberían medir qué dimensiones. El modelo de análisis factorial confirmatorio corrige las deficiencias inherentes a la perspectiva exploratoria y conduce a una mayor concreción de las hipótesis que deben ser contrastadas. Su especificación difiere de la perspectiva exploratoria en aspectos esenciales como:

– Permitir restricciones en algunas saturaciones. Lo habituales suponer la validez de cada ítem, es decir, que satura en un único factor. Se delimita así el concepto de factor común a aquel que subyace únicamente a sus indicadores concretos y se evita introducir factores ad hoc de difícil interpretación.

– Permitir contrastes estadísticos de las hipótesis especificadas.

– Permitir componentes únicas correlacionadas. Aunque es un recurso poco elegante, se justifica por la existencia de otros factores sin interés, como un método de medición común que no se desea explicitar en la especificación.

34 – Permitir analizar la matriz de covarianzas en lugar de la de correlaciones, indispensable para establecer si los indicadores son tau-equivalentes.

En efecto, el AFC sólo asume que los ítems constituyen «mediciones congenéricas», pero no asume la igualdad de las saturaciones ni de las varianzas de error. Además, el AFC somete estos supuestos a contrastes estadísticos que, en caso de rechazarse, desaconsejarían la evaluación de la fiabilidad (Batista-Foguet, Coenders y Alonso, 2013), por lo que se consideró prudente emplearlo en la investigación.