The two different uses of economic tools for causation

V. Proof of causation and standards of proof in competition damages actions

5.6. Econometrics and the ‘calculation’ of causation in EU competition law

5.6.2. The two different uses of economic tools for causation

La calidad de los datos es un tema de especial preocupación en cualquier sistema de información. La calidad de un registro de cáncer depende directamente de la calidad de sus datos. La calidad de los datos es fundamental para evitar sesgos de selección y de información. El control de calidad del proceso de registro se puede evaluar mediante dos grupos de indicadores: exhaustividad del registro de casos y validez o exactitud de la información recogida para cada caso de cáncer. La exhaustividad, mide la proporción de población cubierta por el registro para cada localización, se estudia mediante el indicador DCN (Death Certificate Notifications) ocasos identificados por certificado de defunción. Es importante, obviamente, que el registro de los casos de cáncer sea lo más completo posible. Para la validez se emplea el porcentaje de casos con confirmación microscópica, histológica y/o citológica, estadio, edad y el DCO (Death Certificate Only) casos cuya única frente de información es el certificado de defunción. Si el DCN es alto es posible que exista una subestimación de los casos incidentes como consecuencia de una baja cobertura del registro. Si la confirmación microscópica es alta y el DCO bajo, en general se puede asumir que la fiabilidad de que los diagnósticos sea alta y de que los casos sean verdaderos es muy elevada. La proporción de casos de edad desconocida constituye otro indicador de calidad de un registro de cáncer.

MEDIDAS SUMARIZADORAS

Tasas brutas

Las tasas se pueden obtener para la población total (tasas crudas o brutas) o para subgrupos de la misma según determinadas características como edad, sexo, o

TENDENCIA TEMPORAL DE LA INCIDENCIA DE CÁNCER EN NAVARRA 1973-1997 raza.

La tasa bruta o cruda de incidencia (TBI), se calcula dividiendo el número de casos observados, para el tumor y periodo considerado, por la población estimada a mitad del periodo de estudio. Se expresan en tanto por 100.000 para hombres y mujeres, y por periodo.

Supongamos que existen A grupos de edad (0-4, 5-9, 10-14, 15-19... 80-84 y 85 y más) para los cuales se conoce el número de casos y las correspondientes persona-años a riesgo:

000 .

100

1 1

×

=

∑

= = A i i A i i

n

r

TBI

donde ri representa el número de casos nuevos de cáncer del grupo de edad

i

en el

tumor considerado y

n

el número de personas-año en ese grupo de edad en la población.

Tasas específicas por edad.

Las tasas específicas de incidencia (TEI), se calculan dividiendo el número de casos incidentes, para el tumor y periodo considerado en un grupo de edad determinado, por la población correspondiente a este grupo de edad a mitad del periodo de estudio. Se expresan, también, en tanto por 100.000 para hombres y mujeres, y por periodo.

000 .

100 ×

=

i i

n

r

TEI

Las tasas específicas se pueden comparar entre sí, pues se asume que las distribuciones por edad dentro de cada estrato son iguales. Hay que tener en cuenta que cuanto mayor sea el estrato, existen mayores posibilidades de que la distribución por edad sea diferente, por lo que persistiría cierta confusión residual.

TENDENCIA TEMPORAL DE LA INCIDENCIA DE CÁNCER EN NAVARRA 1973-1997

ESTANDARIZACIÓN DE LAS TASAS

Uno de los problemas que más frecuentemente se plantean en epidemiología del cáncer es el comparar tasas de incidencia para un determinado tumor entre dos poblaciones diferentes, o en la misma población con el paso del tiempo. La comparación de simples tasas brutas puede muchas veces dar una falsa apariencia debido a las diferencias en la estructura de edad de las poblaciones a comparar. Si una población tiene una edad media menor que la otra, incluso aunque las tasas específicas por edad fuesen las mismas en ambas poblaciones, aparecerían más casos en la población más envejecida que en la más joven.

Para evitar esta influencia de la edad, existen dos métodos ampliamente utilizados para la estandarización por edad, que se conocen como estandarización directa e indirecta. La tasa estandarizada permite hacer comparaciones entre diferentes periodos de tiempo o entre diferentes poblaciones, si bien no representa el valor real de la incidencia. Debemos tener en cuenta que una tasa estandarizada por el método directo no tiene significado por sí misma, sólo tiene significado comparada con otra tasa de incidencia que ha sido estandarizada de forma similar.

Subrayar, que la dificultad para comparar tasas entre poblaciones con distribuciones por edad diferentes sólo puede superarse por completo limitando las comparaciones a tasas específicas por edad concretas [Doll, 1982]. Las medidas resumen, como las obtenidas con la técnica de ajuste por edad, no pueden sustituir el análisis de las tasas específicas por edad.

En nuestro estudio, se calculan las tasas ajustadas por el método directo, que resultan de aplicar las tasas específicas por edades de nuestra población a una población estándar [Doll, 1967]. El objetivo de esta técnica consiste en calcular las tasas brutas hipotéticas (tasas estandarizadas por edad) que obtendríamos si las poblaciones que comparamos tuvieran la misma distribución por edad. Se obtiene, de este modo, el número de casos de cáncer que se esperaría que ocurrieran si las poblaciones tuvieran idéntica distribución por edad que la población estándar elegida. Se conoce al número de

TENDENCIA TEMPORAL DE LA INCIDENCIA DE CÁNCER EN NAVARRA 1973-1997

personas en cada grupo de edad de la Población Estándar como los «pesos» a emplear en el proceso de estandarización.

Se calculan las tasas ajustadas para todas las edades, truncadas a los grupos de edad 35-64 años y el riesgo acumulado hasta los 74 años de edad.

La elección de la población estándar es arbitraria. Es conveniente utilizar una población que tenga relación con el ámbito geográfico y/o temporal de las comunidades que queremos estudiar. Para facilitar la comparabilidad, se recomienda el uso de las proporcionadas por organismos internacionales. Se ha utilizado como población de referencia la Población Estándar Mundial, Población Estándar Nueva Mundial y Población Estándar Europea.

Tasa ajustada por el método directo todas las edades

Supongamos A grupos de edad (0-4, 5-9, 10-14, 15-19... 80-84 y 85 y más) para cada uno de los cuales se conoce el número de casos nuevos de cáncer para las localizaciones estudiadas y las correspondientes persona-años a riesgo, la expresión para la obtención de las tasas ajustadas de incidencia viene dada por:

n

TAI

i A i i A i ri

∑

= = = 1 1

Donde

r

i es la tasa de incidencia en el grupo de edad

i

para cada tumor

considerado y

_n

_i el número de personas en ese grupo de edad en la población estándar.

Tasas truncadas 35-64 años

Es un tipo de tasa estandarizada que tan sólo tiene en cuenta los grupos de edad comprendidos entre los 35 y 64 años, otorgando un peso nulo al resto de grupos. Doll y Cook –1967– propusieron calcular las tasas para el rango de edades comprendido de 35 a 64 años, fundamentalmente dadas las dudas que se plantean sobre la exactitud de las

TENDENCIA TEMPORAL DE LA INCIDENCIA DE CÁNCER EN NAVARRA 1973-1997

tasas específicas por edad en los viejos, en los que el diagnóstico y el registro del cáncer pueden tener menor fiabilidad [Doll, 1967]. Por otra parte, la probabilidad de aparición de un cáncer en los grupos menores de 35 años es relativamente baja –en numerosos tumores- y, teniéndolo en cuenta, el cálculo de las tasas globales puede distorsionar en cierta medida los resultados.

Tasa acumulada y riesgo acumulado

Day propuso la tasa acumulada como otro tipo de tasa de incidencia estandarizada por edad. La tasa acumuladaentre 0 y 74 años es la suma de las tasas de incidencia específicas por edad, tomadas desde el nacimiento hasta los 74 años. Puede interpretarse bien como una tasa estandarizada por edad por el método directo con el mismo tamaño de población en cada grupo de edad, o como una aproximación al riesgo acumulado. La tasa acumulada representa una forma de estandarización directa que elimina la necesidad de utilizar una población estándar arbitraria [Day, 1987]. Este método es fácil de calcular, tiene una interpretación sencilla y permite realizar comparaciones entre poblaciones con diferentes estructuras de edad.

El riesgo acumulado entre los 0 y 74 años de edad se puede calcular a partir de la tasa acumulada mediante la siguiente expresión [Day, 1987]:

(−_{∑ ∆})

−

=

_r

_i _i

RA

1 exp

*

donde ri es también la tasa de incidencia del grupo de edad

i

para el tumor

considerado y ∆i hace referencia a la amplitud de ese intervalo de edad.

El riesgo acumulado entre 0 y 74 años representa a nivel poblacional la probabilidad que un individuo tiene de desarrollar un determinado tumor hasta los 74 años de edad suponiendo que no existiesen causas competitivas de muerte.

TENDENCIA TEMPORAL DE LA INCIDENCIA DE CÁNCER EN NAVARRA 1973-1997 Modelos de Poisson

Se ajustan modelos multivariantes log-lineales de Poisson para el cálculo de la razón de tasas y de la tendencia relativa anual o cambio porcentual anual, asumiendo que la variable dependiente –el número de casos incidentes de cáncer–sigue una distribución de Poisson. En el caso de modelización de tasas, la herramienta de elección es la regresión de Poisson, en la que la variabilidad aleatoria es atribuida al número de casos observados en el estrato correspondiente. El modelo para el cálculo de la razón de tasas incluye las variables edad y periodo como factores –variables independientes– y el logaritmo de las personas-año como “offset en términos estadísticos”. El logaritmo de las personas-año se declara como OFFSET forzando que su coeficiente sea 1 por ser una constante. El modelo para el cálculo de la tendencia relativa anual o porcentaje promedio de cambio interanual incluye la variable periodo como continua. Para el ajuste de los modelos y las estimaciones de los parámetros se empleó el método de máxima verosimilitud con la función GLM de S-PLUS (S-Plus 2000, MathSoft, Inc., Seattle, WA, 1999).

La formulación matemática de los modelos es la siguiente: Modelo para el cálculo de la razón de tasas:

D

Poisson

( )θ

[ ]

( )

i j ij ij ij

N

r

E

θ

_

=

µ+α

+β











= ln

ln

( )θ

=ln(personas−año)+α

+

factor(edad)+

factor(periodo)

ln

Para cada estrato, el número de casos observados

D

ij se distribuye como una

TENDENCIA TEMPORAL DE LA INCIDENCIA DE CÁNCER EN NAVARRA 1973-1997

El valor estimado por el modelo

( )θ

ij depende de las variables explicativas

incluidas: edad

α

i, periodo

β

j así como del factor de ponderación

N

ij (personas-año

en ese estrato). En este modelo, el resultado de interés es el

exp( )β

_j que representa el Riesgo Relativo de desarrollar el tipo de tumor en estudio entre los periodos 1993-1997 y 1973-1977, o entre los periodos 1993-1997 y 1988-1992.

Modelo para el cálculo de la tendencia relativa anual:

D

Poisson

( )θ

[ ]

( )

i j ij ij ij

N

r

E

θ

=

µ+α

+β













= ln

ln

( )θ

=ln(personas−año)+α

+

factor(edad)+

periodo

ln

En este modelo, el resultado de interés es el exp

( )

βj que representa el incremento

promedio anual de desarrollar el tipo de tumor en estudio entre los periodos 1993-1997 y 1973-1977, o entre los periodos 1993-1997 y 1988-1992.

In document Causation in private enforcement of competition law: a comparative analysis of divergent national approaches (Page 124-127)

The two different uses of economic tools for causation

V. Proof of causation and standards of proof in competition damages actions

5.6. Econometrics and the ‘calculation’ of causation in EU competition law

5.6.2. The two different uses of economic tools for causation

000

.

100

×

=

∑

∑

n

r

TBI

i

n

000

.

100

×

=

n

r

TEI

n

n

TAI

∑

∑

r

i

n

(−∑ ∆)

−

=

r

RA

1

exp

*

i

D

Poisson

( )θ

[ ]

( )

N

r

E

θ



=

µ+α

+β













= ln

ln

( )θ

=ln(personas−año)+α

+

factor(edad)+

factor(periodo)

ln

D

( )θ

α

β

N

exp( )β

D

Poisson

( )θ

[ ]

( )

N

_n

(−_{∑ ∆})

_r

_