• No results found

Data collection and instrument design and development

Chapter 3 Research methodology

3.2 The research design

3.2.3 Data collection and instrument design and development

Cuadro A.I.2. Número de niños elegibles para endis por año,

según cantidad de niños por hogar

Total

de niños 2012 2013 resultadoTotal 2012Total Total 2013 Total

1 1.972 2.678 4.650 1.972 2.678 4.650 2 67 214 281 134 428 562 3 2 9 11 6 27 33 4 1 1 0 4 4 Total resultado 2.041 2.902 4.943 2.112 3.137 5.249

Para la tabla de datos marco_muestral se dispone de una cantidad de atributos correspondientes al hogar, como

 pesos o expansores (existen cuatro sistemas de pesos: anual, semestral, trimestral y mensual);

 categoría del hogar en cuanto a pobreza (pobre/no pobre) (V1);

 estrato al que pertenece el hogar (que usa el ine, con 12 categorías sociogeográficas que luego se reagrupan). Con respecto al total de hogares elegibles, considerando los datos que surgen de la tabla niños (donde están los ni‑ ños efectivamente encuestados), hay que tomar en cuenta que el total finalmente alcanzado es el siguiente:

 Hogares elegibles: 4.943.

 Niños encuestados: 3.077.

 Hogares donde se hicieron las 3.077 encuestas: 2.665. Una primera característica estudiada es la que tiene que ver justamente con la relación entre el número de niños elegibles por mes en cada año, donde parece que siste‑ máticamente son menos para el 2012 que para el 2013. Pensando que podía ser un efecto de que el volumen de encuestas hechas en 2012 era bastante menor que el del 2013, usando los microdatos en línea para ambos años surge que las encuestas estaban distribuidas como se muestra en el cuadro A.I.3.

En general para el 2012 el total de encuestas es de 43.839, y 46.662 para 2013 (el volumen para 2012 es el 95% del de 2013), mientras que en los hogares elegibles para ucc la relación es de 70%.

Si se trabaja con los datos que corresponden a los niños, con la tabla niños es importante considerar algunas va‑ riables, como sexo (V3) y edad (V4), a los efectos de ver cómo se distribuyen estas en la muestra efectiva, teniendo en cuenta cuál era su distribución en el marco muestral donde los niños eran elegibles.

Para eso se trabajó con los microdatos de la ech 2012 y 2013, con los que se podía saber cuáles eran los hogares donde había niños en el tramo etario de interés.

Se construyeron con los microdatos tablas de personas elegibles por edad. Para 2012 se descarta el mes de enero y para 2013 el mes de febrero (P_2012.04 es la tabla para 2012 y P_2013.04 para 2013).

Usando la información que contienen ambas tablas se pueden estimar totales poblacionales de referencia para la distribución de la edad que serían los adecuados en el marco muestral donde están los niños elegibles; de esa manera se puede, para la etapa de calibrado, ver qué tan distorsionada está la muestra efectiva (los 3.077 encues‑ tados que pertenecían a los 2.665 hogares).

Para poder determinar la edad al inicio del trabajo de cam‑ po, que se toma como setiembre de 2013, a cada uno de los elegibles que surgen de las tablas P_2012.04 y P_2013.04 se les actualizó la edad.

De esa manera se tienen dos distribuciones por edad (una para cada año), que podrían ser usadas para ajus‑ tar la muestra efectiva (V4). La otra variable que podría usarse es sexo (V3), que también surge de las tablas P_2012.04 y P_2013.04. Debe recordarse que solamente se dispone de la edad de cada niño elegible en la tabla de la muestra efectiva y no en la de los niños que están en el marco muestral.

Cuadro A.I.3. Número y porcentaje de encuestas de ech y endis

por año según meses

  2012 2013 2012 2013 2012 2013 Mes Frecuencia Frecuencia 281 0,00% 7,46%

Enero 3.604 3.765 192 288 5,52% 7,45% Febrero 3.480 3.866 207 282 5,64% 7,37% Marzo 3.670 3.826 196 285 5,28% 7,18% Abril 3.709 3.970 176 291 4,80% 7,34% Mayo 3.668 3.962 175 265 4,84% 6,87% Junio 3.616 3.859 180 297 4,92% 7,44% Julio 3.661 3.994 191 286 5,22% 7,23% Agosto 3.658 3.956 169 274 4,60% 7,17% Setiembre 3.676 3.821 199 176 5,25% 4,59% Octubre 3.793 3.831 172 177 4,64% 4,51% Noviembre 3.706 3.928 184 5,11% 0,00% Diciembre 3.598 3.844 4,66% 6,22% Total 43.839 46.622

La distribución de la edad estimada de esta manera para cada año tiene algunos aspectos a tener en cuenta. El algoritmo que se aplica difiere por año, ya que para 2013 la actualiza‑ ción de la edad está truncada para los elegibles de setiembre a noviembre 2013. Por otro lado, los niños que tienen edad 0 en la ech al momento de esta encuesta o la edad actuali‑ zada para el relevamiento endis presentan el inconveniente de que es difícil partir ese tramo en dos, que serían los que tienen de 0 a 6 meses y los que tienen de 6 meses a 1 año. Una posibilidad es trabajar con los nacimientos en el pe‑ ríodo entre febrero de 2012 y noviembre de 2013 y ver mes a mes cuál es el aporte de los recién nacidos (rn) a la co‑ horte móvil en el período.

En el cuadro A.I.4 se puede ver cómo es la distribución de personas por año que surge del marco muestral propor‑ cionado por el equipo técnico del ine y que aparecía en el cuadro A.I.1. Los totales son más grandes, ya que son ni‑ ños que pertenecían a los hogares elegibles. Pueden verse en negrita los totales que se deberían considerar por edad tomando en cuenta la edad que tenían en la ech y la edad actualizada a setiembre de 2013.

Cuadro A.I.4. Distribución de la edad de los niños actualizada a setiembre de 2013

Parte entera de la

edad actualizada 2012 Parte entera de la edad actualizada 2013

0 303 0 1.035

1 1.048 1 982

2 812 2 1.120

3 164 3 260

4 151

Total resultado 2.478 Total resultado 3.397 Calibración de la muestra

Para la calibración de la muestra se toman las tablas de da‑ tos que consideran a los niños elegibles para ambos años usando el marco muestral de referencia (marco_mues- tral), el cual se machea con la tabla de datos niños (pro‑ porcionada por el ine), la que contiene los 3.077 niños finalmente evaluados, que pertenecen a los 2.665 hogares encuestados, de los 4.943 del marco original.

De esta manera se puede evaluar la no respuesta a través de modelos lineales generalizados, considerando como variable de respuesta si se realizó o no la ech niñez usando

algunas de las cuatro variables mencionadas en la presen‑ tación de los datos (variables V1 a V4).

Para la estimación se usa la información del estrato geo‑ gráfico y los pesos anuales, para armar el diseño de mues‑ treo a través de la biblioteca survey del R (Lumley, 2012). Además de luego evaluar de esta manera la propensión a la nr (No respuesta), con esta misma tabla de datos —que tiene 5.875 niños de los cuales solo servirían por edad 5.300— se pueden tener los totales poblacionales contra los cuales calibrar.

Observando los resultados que surgen de las tablas de contingencia 2*2 con respecto a la variable de respuesta y las cuatro variables que podían usarse para calibrar, se observan distorsiones que pueden hacer pensar que las ca‑ racterísticas de los niños finalmente encuestados difieran de las de los efectivamente evaluados.

Por otro lado, al considerar esa eventual asociación a tra‑ vés de modelos de rl (regresión logística) surgen re‑ sultados que muestran que hay mayor propensión a ser evaluados según esos cuatro atributos (V1 a V4).

Resta entonces decidir por cuál de las cuatro variables propuestas se deben modificar los pesos usando los totales poblacionales de referencia.

Postestratificación de la muestra

Finalmente se opta (en consulta con el equipo de inves‑ tigación) por modificar los pesos muestrales mediante postestratificación usando las variables V3 y V4, toman‑ do como totales poblacionales los que surgen de estimar la distribución conjunta de sexo y edad sobre el marco muestral de primera fase (formado por los 5.875 niños en‑ cuestables), la cual se presenta en los cuadros A.I.5 y A.I.6:

Cuadro A.I.5. Totales poblacionales para ajustar

Edad Hombre Mujer Total

0 33.149 29.716 62.865 1 30.452 28.314 58.766 2 18.105 18.386 36.491 3 4.819 4.875 9.694 Total 86.525 81.291 167.816

Cuadro A.I.6. Totales poblacionales para ajustar (edades actualizadas)

Edad actual Hombre Mujer Total

0 20.185 19.075 39.260 1 30.928 28.749 59.677 2 29.020 27.120 56.140 3 6.392 6.347 12.739 Total 86.525 81.291 167.816

La diferencia entre los totales poblacionales del cuadro A.I.5 y el cuadro A.I.6 radica en que el primero refleja la distribución por edad y sexo de los niños en las diferentes tomas de la ech, mientras que el segundo muestra cómo sería la distribución por sexo y edad expandida si se logra‑ se ver los 5.724 niños elegibles.

Teniendo en cuenta que solamente hay 3.077 niños final‑ mente relevados, se crea el diseño muestral postestratifica‑ do, donde las variables de ajuste son el sexo y la edad. Con este nuevo diseño se analiza cómo quedan modificados los pesos originales de los 3.077 que respondieron y se usa el cuadro A.I.5 para hacer la calibración (Álvarez Vaz, 2010; Sarndal, 1992).

La gráfica A.I.1 muestra cómo quedan los pesos luego del proceso de calibrado, contrastados por sexo.

Gráfica A.I.1. Relación entre pesos originales y pesos calibrados, según sexo

En la gráfica A.I.2 se presenta cómo quedan los pesos lue‑ go del proceso de calibrado, contrastados por tramo eta‑ rio. El color negro representa a los niños de 0 años, el color naranja a los niños de 1 año, el celeste a los niños de 2 y el verde a los de 3 años.

Gráfica A.I.2. Relación entre pesos originales y pesos calibrados, según edad

Como se ve, hay pesos que tienen originalmente valores muy pequeños (cercanos a 0) o grandes (cercanos a 60). Para eso, en la gráfica A.I.3 se puede ver cuáles son los pe‑ sos ubicados en el cuantil 5 y en el cuantil 95 (los posibles valores de los pesos) en la zona entre las bandas negras; los pesos que están entre las bandas azules son los que están por encima del cuantil 1 y por debajo del cuantil 99 (las bandas azules y negras valen para ambos sistemas de pe‑ sos: originales y calibrados).

Gráfica A.I.3. Relación entre pesos originales y pesos calibrados, según edad

Se analiza a su vez cómo quedarían los pesos calibrados si se les aplica un proceso de recorte (trimming). Para eso se tienen los pesos del diseño calibrado y recortado. Los crite‑ rios de recorte correspondieron al cuantil 5 y al cuantil 95.

De esa manera la situación se muestra en la gráfica A.I.4.

0 10 20 30 40 50 60 05 0 100 150 200 250

1Relación entre pesos originales y pesos calibrados (según sexo)

Pesos originales Pesos calibrados 0 10 20 30 40 50 60 05 0 100 150 200 250

2Relación entre pesos originales y pesos calibrados (según edad)

Pesos originales Pesos calibrados 0 10 20 30 40 50 60 05 0 100 150 200 250

3Relación entre pesos originales y pesos calibrados (según edad)

Pesos originales

Gráfica A.I.4. Relación entre pesos originales y pesos calibrados, según edad

Si se usan los pesos del cuadro A.I.6, el diseño postestra‑ tificado se ajustó de acuerdo al sexo y la edad actualizada. Gráfica A.I.5. Relación entre pesos originales y pesos calibrados,

según sexo

La situación entre pesos originales y pesos calibrados usando el cuadro A.I.6 como totales poblacionales es la que se muestra en la gráfica A.I.6.

Se procede a hacer un recorte de los pesos usando el mismo criterio de antes, es decir, truncando en los cuantiles 5 y 95 de los pesos originales (aparece punteado en negro). Se compara cómo queda la distribución por sexo y edad luego del proceso de calibrado usando los totales de los cua‑ dros A.I.5 y A.I.6. La situación se presenta en los cuadros A.I.7 y A.I.8

Gráfica A.I.6. Relación entre pesos originales y pesos calibrados, según edad

Cuadro A.I.7. Totales poblacionales para ajustar

Edad Hombre Mujer Total

0 31.792 28.489 60.281 1 30.850 28.753 59.603 2 18.602 18.930 37.532 3 5.115 5.323 10.438 Total 86.359 81.495 167.854

Cuadro A.I.8. Totales poblacionales para ajustar

Edad actualizada Hombre Mujer Total

0 19.790 18.325 38.115 1 30.917 28.891 59.808 2 29.183 27.347 56.530 3 6.588 6.772 13.360 Total 86.478 81.335 167.813

Las diferencias encontradas sobre los totales de los cuadros A.I.5 y A.I.7 y los cuadros A.I.7 y A.I.8 se deben al proceso de truncado. Teniendo en cuenta las diferencias encontra‑ das entre los dos sistemas de pesos (pesos calibrados y pe‑ sos calibrados recortados contra ambos sistema de pesos), se sugiere usar los pesos calibrados recortados.

Para eso se libera una tabla de datos que tiene los siguientes:

 peso.cali son los pesos calibrados usando los totales del cuadro A.I.5;

 peso.cali.trim son los pesos calibrados y luego recorta‑ dos usando totales del cuadro A.I.5;

 peso.cali son los pesos calibrados usando totales del cuadro A.I.6;

 peso.cali.trim son los pesos calibrados y luego recorta‑ dos usando totales del cuadro A.I.6.

0 10 20 30 40 50 60

05

0

100

150

4Relación entre pesos originales y pesos calibrados (según se xo)

Pesos originales Pesos calibrados 0 10 20 30 40 50 60 05 0 100 150

5Relación entre pesos originales y pesos calibrados (según edad)

Pesos originales Pesos calibrados 0 10 20 30 40 50 60 05 0 100 150

6Relación entre pesos originales y pesos calibrados (según edad)

Pesos originales