Describiremos a continuación la metodología utilizada para la comparación de concordancia entre los diagnósticos clínicos y urodinámicos de incontinencia de orina realizados según ha quedado expuesto.
Todos los datos del cuestionario de síntomas, de la exploración clínica, maniobras exploratorias, del diario miccional, pad test, volumen de orina residual, diagnóstico clínico y diagnóstico Urodinámico, se recogieron en un cuaderno de datos y se vaciaron en una base de datos Access 2000 de Office. Los trabajos de cálculo y análisis se realizaron mediante el programa de cálculo Excel y el programa estadístico SPSS (versión 10).
Se han analizado las características de las pacientes incluidas en el estudio. Para las variables cuantitativas se han realizado los terciles o cuartiles y se han
categorizado de forma que sea más fácil y comprensible su análisis. Además se han aportado en estas variables datos sobre las medias y rangos de las diferentes categorías.
Se ha realizado un cálculo de la chi cuadrado a través de la comparación de los porcentajes de cada una de las categorías, en aquellas variables en las que la distribución de los porcentajes era diferente en las diferentes categorías.
Respecto a la concordancia, se ha analizado el grado de acuerdo entre el diagnóstico clínico y el diagnóstico Urodinámico de forma que tenemos información sobre la fiabilidad y la validez del diagnóstico clínico.
Debido a la importancia de estos conceptos pasamos a definirlos con un poco más de detalle en el siguiente apartado.
5.12.1 Fiabilidad y validez: concepto y estimadores.
La fiabilidad (precisión, consistencia repetibilidad, concordancia) se puede definir como la medición del acuerdo entre distintos valores de una misma variable o fenómeno, para dos o más observadores, o para dos o más pruebas diagnósticas, (Tabla 4).
Para que ésta pueda ser analizada, las variables han de estar expresadas en el mismo tipo de escala y cada escala ha de contener el mismo número de
categorías (Fletcher et al. 1989).
En el análisis de la concordancia de variables nominales, como el diagnóstico de incontinencia, se han descrito diferentes índices (Po, Kappa, Ppos, y Pneg).
Tabla 4. Tabla de contingencia para dos observadores de un mismo fenómeno. OBSERVADOR 1 Sí No OBSERVADOR 2 Sí a b No c d Total
El porcentaje de acuerdo observado o porcentaje de concordancia simple (Po) mide la proporción de acuerdo respecto al total de observaciones. Su cálculo se realiza a través de la siguiente fórmula Po = [(a+d)/n]*100. El inconveniente que presenta esta medida es que no tiene en cuenta la concordancia que se podría esperar únicamente debido al azar. Para solucionar este problema existe otra medida de concordancia, el índice Kappa simple (K), propuesto por Cohen en el año 1960 (Fleiss 1981).
Este es el mejor índice que se conoce en la actualidad para evaluar la
concordancia entre las variables, ya que corrige la concordancia que aparece debida al azar. Los valores de Kappa se sitúan entre -1 y +1. Un valor de +1 indica un acuerdo perfecto, una concordancia total, un valor negativo de Kappa indica que se ha obtenido un acuerdo menor del que se esperaría simplemente debido al azar.
Fleiss, definió diferentes rangos para los distintos valores de Kappa en relación con el grado de concordancia. Para valores de Kappa superiores a 0.75 consideró que la concordancia podía considerarse excelente; para valores entre 0.75 y 0.40 estableció que el nivel de concordancia se podía considerar bueno; mientras que para valores inferiores a 0.40 acordó que la concordancia era pobre. Landis y Kock establecieron en 1981 otra clasificación algo más desglosada. Ambas clasificaciones se detallan en la Tabla 5, Seigel(1992).
Tabla 5. Valores de los índices Kappa y magnitud de la concordancia según Fleiss y Landis & Kock. Adaptada de Seigel et al. (1992).
Fleiss Kappa Landis
EXCELENTE CASI PERFECTO
0.80 0.75 SUBSTANCIAL JUSTO-BUENO 0.60 MODERADO 0.40 JUSTO 0.20 POCO 0.00 POBRE POBRE
A pesar de que el índice Kappa se ha utilizado vastamente desde su introducción en el análisis de la fiabilidad, también presenta ciertas limitaciones que hay que tener en cuenta en el momento de interpretar su significado.
La limitación más importante es que su valor viene determinado por los valores marginales de la tabla de contingencia o, lo que es lo mismo, por la prevalencia de los diferentes valores de la variable.
Con los estimadores de concordancia aquí citados se puede establecer un amplio estudio de la fiabilidad de las distintas variables. El Po nos permite establecer comparaciones más globales, mientras que el Kappa y los Ppos y Pneg permiten establecer comparaciones individuales.
Otras medidas de concordancia como el índice Kappa ponderado y el coeficiente de correlación intraclase no van a ser utilizados en este estudio, ya que en él no se incluye ni el análisis de variables ordinales, ni el de variables continuas.
5.12.2 Validez
La validez o exactitud es el grado en el que una variable mide realmente el fenómeno para la que esta diseñada (Hulley y Cummings 1993). Las principales medidas de validez son:
5.12.2.1 Sensibilidad: se define como la proporción de sujetos que presentan el fenómeno de interés y que el instrumento de medición clasifica correctamente como positivos, es decir la probabilidad de que el diagnóstico clínico de positivo (para el tipo de incontinencia escogida) cuando el diagnóstico urodinámico era positivo.
5.12.2.2 Especificidad: proporción de sujetos sin el fenómeno de interés y que el instrumento de medición clasifica correctamente como negativos, es decir la probabilidad de que el diagnóstico clínico de negativo cuando el diagnostico urodinámico era negativo.
(E=NV/NV+FN)
En general, hay concesiones entre la sensibilidad y la especificidad de una prueba diagnóstica. Lo mejor sería contar con una prueba altamente sensible así como altamente específica, pero lo que sucede generalmente es que, el aumento de un parámetro va en detrimento del otro. Por este motivo debe intentarse obtener una prueba que conserve unos valores aceptablemente altos para cada uno de estos dos conceptos y, en función del tipo de fenómeno que se pretende medir, aplicar una prueba diagnóstica más sensible o más especifica.
5.12.2.3 Valor predictivo positivo. El valor predictivo de un instrumento de medición con resultado positivo es la probabilidad de que una medición con un resultado positivo presente el fenómeno realidad la enfermedad, es decir es la probabilidad de que el diagnostico urodinámico sea positivo cuando el diagnostico clínico era positivo.
(VPP=VP/VP+FP)
5.12.2.4 Valor predictivo negativo. El valor predictivo de un instrumento de medición con resultado negativo es la probabilidad de que una medición con un
resultado negativo no presente en realidad el fenómeno, es decir la probabilidad de que el diagnostico urodinámico sea negativo cuando el diagnóstico clínico era negativo.
(VPN=VN/VN+FN)
El valor predictivo es una buena medida porque incorpora información tanto sobre el instrumento como sobre la población estudiada. El valor predictivo viene condicionado por la sensibilidad, por la especificidad y por la prevalencia de la enfermedad.
6. RESULTADOS
Se compararon las principales características de las pacientes clasificadas en los tres grupos diagnósticos principales, realizándose un análisis detallado de cada grupo respecto a síntomas, signos y pruebas complementarias sencillas como el Diario miccional y el test de la compresa y su valor para establecer el diagnóstico clínico. Finalmente, se realizó el análisis de concordancia entre el diagnóstico clínico y urodinámico.