Descriptive decision making

Cluster 3 – Get the work done

5 Chapter Discussion

5.2 Decision making

5.2.2 Descriptive decision making

Zij =θi−βj+ǫij

dondeǫijsinN(0,1), con la cual laZij tiene una distribuci´on normal con mediaθi−βj y

varianza 1.

Yij =

(

1 Si Zij >0,

0 Si Zij ≤0

Entonces la probabilidad de dar respuesta 1 puede ser expresado como: P(Yij = 1) =P(Zij >0)

Considerando D= (Z, Y) tal que: P(D_|θ, β) = n Y i=1 k Y j=1 [ e Zij(θi−βj) 1 +e(θi−βj)]I(ZijYij) (3.27) Donde I es una funci´on indicadora el cual toma valores de 0 y 1:

I(ZijYij) =I(Zij >0)I(Yij = 1) +I(Zij ≤0)I(Yij = 0)

Sabemos por el teorema de Bayes que:

P(θ, β_|D)_∝P(D_|θ, β)P(θ, β) Reemplazando: P(θ, β_|D)_∝ n Y i=1 k Y j=1 [ e Zij(θi−βj) 1 +e(θi−βj)]×I(ZijYij)×e −1 2 ( Pn i=1θ2i+ Pk j=1βj2 σ2 β ) Finalmente tenemos: P(θ, β_|D)_∝ e Pn i=1 Pk j=1Zij(θi−βj)−1₂(Pni=1θ2i+ Pk j=1β2j σ2 β ) Qn i=1 Qk j=1[1 +e(θi−βj)] I(ZijYij) (3.28)

De las ecuaciones (3.27) y (3.28) determinamos la distribuciones condicionales completas: f(Zij|θ, β, Y), f(θ|Zij, β, Y) y f(β|Zij, θ, Y), las cuales estan determinados en (Maris G. y

Con las distribuciones condicionales se puede implementar el muestreo de Gibbs (ver anexo A).

Para implementar el m´etodo Gibbs sampler. Suponemos (t-1) iteraciones de los valores ac- tuales de los par´ametros del modelo que son denotados por [Z_ij(t−1)], [θ_i(t−1)] y [β_j(t−1)], entonces el algoritmo Gibbs Sampling puede ser descrito como sigue:

1. Los valores de la data latente [Zij] son simulados a partir de la distribuci´on condicional

completaf(Zij|θ, β, Y).

2. Los valores de los par´ametros de las personasθi son simulados a partir de distribuci´on

condicional completa f(θ_|Zij, β, Y).

3. Los valores de los par´ametros de los ´ıtemsβj son simulados a partir de la distribuci´on

condicional completa f(β_|Zij, θ, Y).

Se puede implementar fácilmente el muestreo de Gibbs. Las rutinas en R (en MCMCpasck de Mart´ın y Quinn, 2003) y Matlab (Johnson y Albert, 1999) están disponibles en la web para el caso normal o probit; también es posible construir un script en R directamente. Nosotros preferimos en la tesis el uso del WinBugs por que nos brinda mas información y resultados de este método de estimación. Ver el código del programa utilizado en el Anexo B.

Estudio de Simulaci´on

Se desarrollaran simulaciones sobre diferentes escenarios, para comparar los diferentes métodos de estimación y ver cual es el método mas preciso.

4.1. Condiciones de la simulaci´on

4.1.1. Algoritmo para generar una data dicot´omica

Para generar la data dicot´omica bajo el Modelo Rasch:P =P(Y = 1_|θ, β) = e(θ−β)

1+e(θ−β)

Fijamos un número ”n” de personas evaluados y ”k” ´ıtems del instrumento de medición utilizado en la investigación.

Simulamos los par´ametros del modelo bajo una distribuci´on normal: θ _∼ N(0,1) y β _∼N(0,1) .

Una vez simulado los parámetros, los valores son corregidos por la media de modo que el promedio sea 0, con la finalidad de hacer comparables los tres métodos de estimación. Simulamos la probabilidad de responder correctamente al ´ıtem bajo el Modelo Rasch descrito.

Simulamos probabilidades cualquiera (R) mediante n´umeros aleatorios que tengan una distribuci´on entre 0 y 1.

Si ”R” es mayor que el complemento de la probabilidad Rasch simulada entonces la variable aleatoria toma valor ”1”, caso contrario toma valor ”0”.

Mediante el algoritmo mostrado simulamos la data dicotómica aleatoria. Ver el código del programa utilizado para generar una base de datos dicotómica en el Anexo B.

4.1.2. Criterios para evaluar la simulaci´on

Una forma de medir el ajuste es a trav´es del error cuadr´atico medio, definido por:

M SE= k X j=1 (βsimulado−βestimado)2 k (4.1)

Otra forma es considerar la ra´ız cuadrada del error cuadr´atico medio definido por:

RM SE = v u u t k X j=1 (βsimulado−βestimado)2 k (4.2)

Una ultima forma es correlacionar los valores simulados y ajustados: CORR=

j=1(βsimulado−β¯simulado)(βestimado−β¯estimado)

q Pk j=1(βsimulado−β¯simulado)2 q Pk j=1(βestimado−β¯estimado)2 (4.3)

4.2. M´etodos de estimaci´on a estudiar

En el caso de los métodos de estimación de Máxima Verosimilitud Conjunta (MVC) se utilizará el software Winsteps (Linacre, 2009) y (Bond y Fox, 1985), para el método de esti- mación de Máxima Verosimilitud Marginal (MVM) se utilizará el software R bajo el paquete ltm, para el método de estimación de Máxima Verosimilitud Condicional (MVCOND) se utilizará el software R bajo el paqueteeRm(Mair y Hatzinger, 2007) y (Rizopoulos, 2006) y para los métodos de estimación Bayesiana (MB) se utilizará el software WinBUGS (Tantau, 2007) bajo dos esquemas: ARS (Adaptative Rejection Sampling)y DAGS (Data Argumen- tation Gibbs Sampling), presentados en el cap´ıtulo de estimación del modelo de Rasch. Los programas utilizados para cada método de estimación están en el Anexo B.

Con las simulaciones se busca analizar y cuantificar el funcionamiento de los métodos de estimación sujetos a diferentes variaciones del número de personas evaluadas y el número de preguntas de cualquier instrumento de medición utilizado en todo proyecto de investigación.

4.3. Escenarios de Estudio

Son 4 escenarios en los cuales se analizarán los métodos de estimación presentados, sujetos a variaciones del número de ´ıtems del instrumento de medición y números de evaluados. Considerando los siguientes escenarios:

Numero peque˜no de ´ıtems y tama˜no de muestra variable

Escenario 1: Número pequeño de ´ıtems y número grande de personas, en la cual se simulan 10 ´ıtems y 1000 evaluados .

Escenario 2: Número pequeño de ´ıtems y número pequeño de personas, en la cual se simulan 10 ´ıtems y 15 evaluados .

Numero grande de ´ıtems y tama˜no de muestra variable

Escenario 3: N´umero grande de ´ıtems y n´umero grande de personas, en la cual se simulan 100 ´ıtems y 1000 evaluados .

Escenario 4: Número grande de ´ıtems y número pequeño de personas, en la cual se simulan 100 ´ıtems y 15 evaluados .

Para cada escenario de análisis consideramos los cuatro métodos de estimación prop- uesto: Máxima Verosimilitud Marginal (MVM), Máxima Verosimilitud Condicional (MV- COND), Máxima Verosimilitud Conjunta (MVC) y Método Bayesiano (MB). Debido a las parametrizaciones realizadas en el modulo eRm y LTM del software R y WinsSteps, es por ello que para efectos de comparabilidad entre los métodos de estimación y la información simulada corregimos los valores de los parámetros simulados por:β_j∗=βj−β¯yθj∗=θj−θ.¯

Y para la estimación bayesiana se realizó la misma corrección. Otros software realizan otras parametrizaciones, la cuales deben ser definidas adecuadamente para obtener una estimación precisa.

Se obtuvo a continuaci´on los siguientes resultados:

4.3.1. Número pequeño de ´ıtems y tamaño de muestra variable

Consideramos a 10 ´ıtems frente a diversos cambios del tamaño de muestra y mostramos las estimaciones de los parámetros de los ´ıtems en los cuatro métodos de estimación presentados:

Comparación de estimación de parámetros de los ´ıtems

ESC ITEM SIM MVM MVCON MVC MB(ARS) MB(DAGS)

1 1 -0.4842 -0.4837 -0.4826 -0.5376 -0.4840 -0.4823 2 0.1495 0.2011 0.2012 0.2236 0.1997 0.1991 3 -0.061 -0.0023 -0.0017 -0.0022 -0.0017 -0.0033 4 0.9047 0.905 0.9025 1.0077 0.9033 0.9055 5 0.1349 0.0939 0.0949 0.1052 0.0979 0.0938 6 0.3366 0.3564 0.3569 0.3971 0.3535 0.3558 7 -0.5638 -0.6057 -0.6051 -0.6742 -0.6036 -0.6018 8 0.7325 0.6778 0.6767 0.7542 0.6758 0.6774 9 -0.8073 -0.7944 -0.7951 -0.8864 -0.7956 -0.7928 10 -0.3419 -0.3483 -0.3477 -0.3873 -0.3453 -0.3513 2 1 -0.4842 0.5734 0.5314 0.5822 0.4883 0.5020 2 0.1495 0.2587 0.2391 0.2623 0.2503 0.227 3 -0.061 -0.3648 -0.3387 -0.3707 -0.3429 -0.3211 4 0.9047 1.2683 1.1786 1.2925 1.1134 1.095 5 0.1349 -0.3648 -0.3387 -0.3707 -0.3417 -0.3354 6 0.3366 -0.0506 -0.0477 -0.0518 -0.0637 -0.0520 7 -0.5638 -0.0505 -0.0477 -0.0518 -0.0546 -0.0507 8 0.7325 -0.0505 -0.0477 -0.0518 -0.0416 -0.0259 9 -0.8073 -1.478 -1.3678 -1.5026 -1.259 -1.238 10 -0.3419 0.2588 0.2391 0.2623 0.2517 0.1993

Cuadro 4.1: Estimaciones de los par´ametros de los ´ıtems para el escenario 1 y 2

ESC ESTADISTICO MVM MVCON MVC MB(ARS) MB(DAGS)

1 MSE 0.001313 0.001322 0.00479 0.001264 0.001263 RMSE 0.036237 0.036353 0.069211 0.035550 0.035537 CORR 0.997683 0.997671 0.997691 0.997776 0.997776 2 MSE 0.344192 0.309051 0.352834 0.288142 0.277154 RMSE 0.586679 0.555923 0.593998 0.536788 0.526455 CORR 0.547265 0.547385 0.547794 0.542636 0.549451

Cuadro 4.2: Medidas de ajustes de los ´ıtems para el escenario 1 y 2

En el cuadro 4.1 mostramos las estimaciones del parámetro de los ´ıtems con los cuatro métodos de estimación presentados, para una cantidad de ´ıtems pequeños y muestra de personas variable. En el cuadro 4.2: Medidas de ajustes de los ´ıtems para el escenario 1 y 2, observamos que se logra un mejor ajuste para un número pequeño de ´ıtems siempre y cuando la cantidad de personas evaluadas es grande. También observamos que para un número pequeño de ´ıtems sujeto a variaciones del número de personas evaluadas, que el mejor méto- do de estimación es el método bayesiano bajo el esquema DAGS dado que muestra mejores criterios de ajuste, es uno de los métodos mas robustos debido a que no presentan problemas en la estimación de los parámetros de los ´ıtems.

Comparación de estimación de parámetros de las personas

ESC ESTADISTICO MVC MB (ARS) MB (DAGS)

1 MSE 0.6886 0.3616 0.3622 RMSE 0.8298 0.6013 0.6018 CORR 0.8064 0.8133 0.8128 2 MSE 0.2752 0.1876 0.1943 RMSE 0.5246 0.4332 0.4408 CORR 0.8441 0.8240 0.8170

Cuadro 4.3: Medidas de ajustes de las personas para el escenario 1 y 2

Del cuadro 4.3: Medidas de ajustes de las personas para el escenario 1 y 2, para un número pequeño de ´ıtems sujeto a variaciones del número de personas observamos que el mejor método de estimación es el método bayesiano bajos los esquemas ARS y DAGS, dado que presentan mejores ajustes.

4.3.2. N´umero grande de ´ıtems y tama˜no de muestra variable

Consideramos a 100 ´ıtems frente a diversos cambios del tamaño de muestra y mostramos los diferentes métodos de estimación:

Comparación de estimación de parámetros de los ´ıtems

ESC ESTADISTICO MVM MVCON MVC MB (ARS) MB (DAGS)

3 MSE 0.0075 0.0074 0.0078 0.0073 0.0072 RMSE 0.0865 0.0862 0.0882 0.0854 0.0851 CORR 0.9965 0.9965 0.9965 0.9965 0.9965 4 MSE 5.8039 0.5725 0.4918 0.3260 0.3257 RMSE 2.4091 0.7566 0.7013 0.5709 0.5707 CORR 0.5545 0.7677 0.8047 0.8394 0.8404

Cuadro 4.4: Medidas de ajustes de los ´ıtems para el escenario 3 y 4

Del cuadro 4.4: Medidas de ajustes de los ´ıtems para el escenario 3 y 4, observamos que para un número grande ´ıtems el ajuste disminuye si es que se reduce la muestra de personas evaluadas y para un número grande de ´ıtems sujeto a variaciones del número de personas observamos que el mejor método de estimación es el método bayesiano bajo el esquema DAGS. Este es uno de los métodos más robustos dado que no presentan problemas en la estimación de los parámetros a comparación de los métodos de Máxima Verosimilitud Condicional y Conjunta.

Comparación de estimación de parámetros de las personas

ESC ESTADISTICO MVC MB (ARS) MB (DAGS)

3 MSE 0.0584 0.0543 0.0541 RMSE 0.2416 0.2330 0.2325 CORR 0.9739 0.9737 0.9738 4 MSE 0.0465 0.0342 0.0355 RMSE 0.2157 0.1849 0.1885 CORR 0.9752 0.9755 0.9746

Cuadro 4.5: Medidas de ajustes de las personas para el escenario 3 y 4

Del cuadro 4.5: Medidas de ajustes de las personas para el escenario 3 y 4, para un número grande de ´ıtems sujeto a variaciones del número de personas observamos que el mejor método de estimación es el método bayesiano bajos los esquemas ARS y DAGS, dado que presenta mejores ajustes que el método de máxima verosimilitud conjunta. Adema´s este uno de los métodos mas robustos dado que no presentan problemas en la estimación de los parámetros.

4.3.3. Conclusi´on del estudio de simulaci´on

Del estudio de simulación realizado observamos que el método de estimación mas robusto es el Método Bayesiano, dado que a comparación de los otros métodos de estimación men- cionados no presentan problemas en la estimación de parámetros de ´ıtems ni de personas. El Método de Máxima Verosimilitud Marginal y Condicional no puede estimar los parámetros de los ´ıtems cuando las personas han respondido correctamente a todos los ´ıtems o haber fallado todos los ´ıtems; para estimar los parámetros de las personas hay que aplicar méto- dos bayesianos. En cambio el Método de Máxima Verosimilitud Conjunta, para estos casos sobrestima los parámetros de las personas. Observamos que el método de estimación mas optimo es el Método Bayesiano bajos los esquemas ARS y DAGS, dado que presenta mejores indicadores de ajustes para los 4 escenarios analizados. Haciendo comparaciones en los escenarios 1 y 2 se logra tener un mejor ajuste cuando se tienen muestras grandes para numero de ´ıtems pequeños. Cuando la cantidad de ´ıtems es grande, sujeto a variaciones del tamaño de muestra el ajuste es similar. Al comparar los escenarios 2 y 4 observamos que cuando se tienen tamaños pequeños de muestra se logra un mejor ajuste siempre y cuando la cantidad de ´ıtems es grande.

Aplicaci´on

5.1. Descripci´on del problema de investigaci´on

La aplicación de la tesis, esta orientado al ámbito educacional, en la cual mediante las respuestas de los estudiantes de primero de secundaria de las instituciones educativas estatales a una prueba de Comprensión Lectora a nivel nacional, se estimarán las variables latentes: habilidades que tienen los estudiantes para responder correctamente a un ´ıtem y dificultad de los ´ıtems de la prueba representado mediante un modelo log´ıstico o modelo de Rasch, que modela la probabilidad de responder correctamente a un ´ıtem de la prueba, bajo métodos de estimación desde una perspectiva clásica y bayesiana. Dentro de los métodos de estimación clásica presentamos los métodos de Máxima Verosimilitud Marginal, Máxima Verosimilitud Condicional y Máxima Verosimilitud Conjunta. Dentro de los Métodos Bayesianos presentamos a aquellos basados en los métodos de MCMC por el algoritmo Gibbs Sampling para la estimación de las habilidades de los estudiantes.

5.2. Tipo de instrumento de medici´on

Para estimar los parámetros del modelo y obtener las respuestas de los estudiantes se utilizó como instrumento de medición una prueba de Compresión Lectora de primer grado de secundaria, utilizada en el Proyecto de Movilización por la Comprensión Lectora (DIG- BER,2009). En el Proyecto de Movilización por la Comprensión Lectora, se evaluaron a los estudiantes de los 5 grados de educación secundaria provenientes de las instituciones estatales de todas las regiones del pa´ıs. Se consideraron 5 pruebas, una prueba para cada grado de educación secundaria y cada prueba esta compuesta por dos formas las cuales se detallan:

GRADO FORMA N ITEMES 1 1 17 2 18 2 1 21 2 18 3 1 24 2 24 4 1 26 2 26 5 1 25 2 24

Cuadro 5.1: Distribuci´on de los instrumentos de medici´on

Para la tesis se trabaj´o con la prueba correspondiente a la segunda forma de primero de secundaria, el cual consta de 18 ´ıtems. La prueba esta compuesta por textos que agrupan varios ´ıtems distribuidos de la siguiente manera:

TEXTOS ITEMES 1 1 2 3 2 4 5 6 7 8 9 3 10 11 12 13 14 4 15 16 17 18

Cuadro 5.2: Distribuci´on ´ıtems en los textos del instrumentos de medici´on

Cada ´ıtem consta de 4 alternativas de respuesta (A, B, C, D), en la cual si el estudiante tiene que escoger solo una de las alternativas, si es la respuesta correcta al ´ıtem es codificada como 1 caso contrario como 0.

5.3. Dise˜no muestral

Para efectos de comparabilidad entre los 4 métodos de estimación que mostraremos, analizaremos a todos los estudiantes de primer grado de educación secundaria de instituciones educativas estatales, que hayan sido evaluados con el segundo cuadernillo y hayan

respondido todas las preguntas de la prueba. Esto nos dá 1536 estudiantes de las distintas regiones del Perú. El tipo de muestreo utilizado es un muestreo complejo de varias etapas. La prueba que utilizamos en la tesis ha sido parte del Proyecto Nacional por la Comprensión Lectora, en la cual se evaluaron a los estudiantes de los 5 grados de educación secundaria de las instituciones educativas estatales en todas las Regiones del Perú (DIGBER, 2009). Población Objetivo

La población objetivo está conformada por los estudiantes primer grado de educación secundaria de instituciones educativas estatales.

Unidades de muestreo

En la investigaci´on las unidades de muestreo son: instituciones educativas estatales de primero de secundaria de todas las regiones.

Unidades de an´alisis

La unidad de análisis es un estudiante de primer grado de educación secundaria de una in- stitución educativa seleccionada.

Tama˜no de muestra y errores muestrales

Hay que tener en cuenta los errores muestrales dado que son de vital importancia para las inferencias que realizaremos en la investigación. Los errores muestrales nos van a indicar el nivel de precisión de las inferencias a realizar. Además hay que tener en cuenta que los errores muestrales dependen mucho del presupuesto que se tenga, ya que es posible lograr minimizar el error muestral agrandado la muestra. Para obtener los errores del muestreo, teniendo en cuenta que es un muestreo complejo, se aplicaron técnicas de remuestreo, concretamente métodos Jackniffe (ver Anexo A)

REGION NATURAL N MUESTRA E JACKNIFFE

COSTA 721 0.0271

SIERRA 518 0.0382

SELVA 297 0.0443

Cuadro 5.3: Tama˜no de muestra y errores muestrales por regi´on natural

Consideramo el tipo de muestreo observamos que en las regiones naturales los errores muestrales son menores al 5 % con lo cual garantizamos una buena precision en las inferecias de los estimadores en las regiones naturales.

Se consideraron en laCosta los siguientes departamentos: Callao, Lambayeque, Lima, Ica, La Libertad, Moquegua, Arequipa, Tacne, Ancash, Tumbes y Piura. En la Sierra: Junin, Puno, Apurimac, Cusco, Cajamarca, Huanuco, Ayacucho, Pasco y Huancavelica. Y en la Selva: Amazonas, Loreto, Madre de Dios, San Mart´ın y Ucayali.

5.4. Recolecci´on de informaci´on y base de datos

Para obtener la base de datos del trabajo se utilizaron fichas ópticas, en la cual los estudiantes marcan sus respuestas a cada ´ıtem de la prueba. Para minimizar errores ya están predefinidos en la ficha óptica la región, provincia, distrito, nombre de la institución educativa, el código modular, código de la institución educativa, el grado, número de estudiantes. Con la lectura de las fichas ópticas se obtiene la base de todas las respuestas de los estudiantes evaluados.

Una vez obtenida la base de datos se realiza un control de calidad de la data, con el instrumento de medición que tiene las respuestas de los estudiantes y con listas de asistencia. Las listas de asistencia son documentos en los cuales se registran los nombres y apellidos de los estudiantes que asistieron y no asistieron a rendir la prueba, el tipo de forma que rindieron, la institución educativa, el departamento, la provincia, el distrito, la sección evaluada y el total de pruebas evaluadas en esa sección (DIGBER, 2009).

Finalmente se califica la prueba, en la cual la respuesta correcta es codificada como 1 y las incorrecta es codificada como 0; obteni´endose de este modo una base de datos dicot´omica.

5.5. An´alisis cl´asico de la prueba

Seg´un Mu˜niz (1998), para analizar los ´ıtems y la prueba se consideraron los siguientes criterios:

5.5.1. Proporci´on de aciertos

Con la proporci´on de aciertos (ACIERTOS) analizamos que tanto han acertado o no al ´ıtem, la forma de cuantificarlo es a trav´es de la frecuencia de respuesta a los ´ıtems por parte

de los estudiantes evaluados:

ACIERT OSj =

n (5.1)

Dondeaj es la cantidad de estudiantes que acertaron correctamente al ´ıtem j y ”n” es el

n´umero de estudiantes evaluados.

Desde un punto de vista de la Teor´ıa Clásica de los Test (TCT), se dice que si la proporción de aciertos es mayor o igual a 0.8 entonces el ´ıtem ha resultado fácil al estudiante. Y cuanto la proporción de aciertos más se aproxime a 0 decimos que el ´ıtem resultó dif´ıcil al estudiante evaluado.

5.5.2. Indice de discriminaci´on

Se dice que un ´ıtem tiene poder discriminativo si distingue, discriminan entre aquellos estudiantes que puntúan alto en la prueba y los que puntúan bajo. Se define como la correlación entre las puntuaciones de los estudiantes en el ´ıtem y sus puntuaciones totales obtenido en la prueba. Como se van a correlacionar una variable dicotómica con una variable de escala de razón el tipo de correlación a utilizar es la correlación tetracorica y es definida como sigue:

ρpj= µa−µx σx r_p q (5.2) Donde

µa es promedio de las puntuaciones cuando el estudian ha acertado al ´ıtem.

µx es el promedio de las puntuaciones obtenidas por los estudiantes.

σx es el promedio de las puntuaciones obtenidas por los estudiantes.

pj es la proporci´on de aciertos para ´ıtem j.

qj es la proporci´on de fallas para ´ıtem j.

Desde una perspectiva de la teor´ıa cl´asica de los test (TCT), si el indice de discriminaci´on es menor a 0.25 entonces el ´ıtem no discrimina.

5.5.3. Confiabilidad de la prueba

Medimos la confiabilidad de la prueba mediante el alfa de cronbach, el cual se define como: α= k k₋1(1− Pk i=1σi2 σ2 x ) (5.3)

Donde:k: N´umero de ´ıtems. σ2_i: Varianza de los ´ıtems.

σ2_x: Varianza de los puntajes totales.

Mostramos los resultados del análisis clásico en función a los criterios presentado: ITEM ACIERTOS DISCRIMINACION

1 0.6302 0.3166 2 0.8164 0.4715 3 0.9408 0.4265 4 0.8392 0.5500 5 0.7826 0.5501 6 0.8750 0.4923 7 0.6426 0.4423 8 0.8503 0.4741 9 0.4089 0.2097 10 0.9466 0.3665 11 0.7617 0.4476 12 0.4564 0.3724 13 0.7806 0.4871 14 0.4915 0.3594 15 0.2969 0.3266 16 0.8320 0.4420 17 0.3626 0.3698 18 0.3177 0.3298

Del cuadro 5.4, observamos que los ´ıtems 2, 3, 4, 6, 8, 10 y 16 han sido bastante acertados por parte de los estudiantes de primero de secundaria, dado que las probabilidades de acertar al ´ıtem son superiores a 0.8 y se acercan a 1 y los ´ıtems 15 y 18 no han sido muy acertados por los estudiantes evaluados dado que las probabilidades de acertar al ´ıtem se acercan a 0. Observamos que las correlaciones son mayores a 0.25, con lo cual concluimos que los ´ıtems de la prueba discriminan. De la prueba con que se evaluaron a los estudiantes de primer grado de secundaria observamos el alfa de cronbach es 0.68795. Con lo cual podemos decir que la prueba con que fueron evaluados los estudiantes de primero de secundaria es confiable.

In document Self-directed learning and apprentices: a constructivist grounded study (Page 124-126)