En la minería de datos se utilizó dos algoritmos en diferentes herramientas; primeramente se aplicó el algoritmo Simple K-means que proporciona el WEKA, luego se incluyó el algoritmo Fuzzy C-means disponible en el R; en la tabla 26 se observan los resultados obtenidos en los algoritmos.
El resultado más óptimo en los algoritmos fue con la configuración de tres grupos, consiguiendo así tres niveles de interacción: alta, media y baja. Estos niveles describen de manera general el comportamiento interactivo de los estudiantes con las herramientas colaborativas del entorno virtual, generando las siguientes interpretaciones:
- Ambos algoritmos señalan que el menor número de alumnos tienen interacción alta, lo que refleja el poco aprovechamiento de las herramientas por parte de los estudiantes.
- El Fuzzy C-means agrupa con baja interacción al mayor número de estudiantes, en cambio el simple K-means coloca al mayor número de estudiantes con interacción media.
Aunque existe una discrepancia entre los resultados de interacción media y baja de los dos algoritmos, se podría decir que existe una elevada cantidad de usuarios que no usan las herramientas lo suficiente. Con estos datos no es factible comprobar la
Nivel de
interacción Simple K-means Weka Fuzzy C-means R
Alta 7 3
Media 18 13
Baja 14 23
Tabla 26. Comparación de los resultados entre Simple K-means y Fuzzy C-mean
Fuente: Resultados obtenidos en WEKA y R Elaboración: Ruth Hidalgo
hipótesis pues apenas se presentan datos muy generales, en el caso del Simple K- means únicamente se adicionan los valores medios para cada uno de los atributos y que corresponden a los centros de los diferentes grupos.
En la tabla 27 se recopilan los valores correspondientes a las medias tanto del algoritmo simple k-means como del fuzzy c-means; se puede notar una mínima diferencia entre la mayoría de los atributos, aunque las cantidades del c-means difuso son más específicas y un poco más estrictas. Estas cifras representan los centros de los grupos, es decir son los prototipos ejemplo de los miembros que conforman los grupos.
Como ya se mencionó el fuzzy c-means a diferencia del simple k-means de WEKA proporciona un grado de pertenencia a los grupos de cada uno de los datos, lo que dio resultados más específicos que permitieron corroborar la hipótesis planteada: “Existen indicadores de interacción colaborativa que reflejan el aprendizaje de los estudiantes de la UTPL”. Para determinar si ello se cumple, es indispensable tratar la nota como característica referida al nivel de aprendizaje del alumno; considerando esta variable en la tabla 28 se analiza los resultados obtenidos para el grupo de interacción alta. Este
Grupo 1 Grupo 2 Grupo 3
Atributos simple fuzzy simple Fuzzy simple Fuzzy
prom_Msg_Foro 0 0,440 1 0,893 1 0,906 Acceso_Foro 10,214 18,873 34,833 45,581 70,571 61,765 prom_Acceso_Foro 1,357 2,459 4,444 5,640 8,714 7,750 Acceso_Disc 10,786 13,353 26,500 51,756 81,571 67,955 prom_Acceso_DisxForo 1,357 1,676 3,389 6,597 10,286 8,581 Acciones_Foros 2,50 4,860 7,56 9,736 12,71 8,347 msn_enviados 0,286 0,250 0,278 2,886 5,286 0,753 msn_recibidos 2,429 2,363 2,278 3,270 4,714 3,534 Tweets 0,143 0,036 0,278 0,962 2,286 3,704 Accesos_Curso 38,786 28,958 50,611 86,122 138,286 241,789 Acc_PerfilUsuario 2,929 3,555 5,556 13,522 21,571 20,476 Nota 18,357 19,930 24,778 27,743 29,429 30,436
Tabla 27. Comparación de las medias obtenidas del Simple K-means y Fuzzy C-mean
Fuente: Resultados obtenidos en WEKA y R Elaboración: Ruth Hidalgo
grupo está conformado por tres alumnos, los cuales aprobaron la asignatura y tuvieron la mayor interacción con las herramientas, visualizándose efectivamente en la figura 10 la absoluta aprobación de los alumnos.
100% 0%
Aprobados Reprobados
1 2 3 grupo Nota Estado
[17,] 0.170529680 0.37841175 0.451058574 3 35 Aprobado [33,] 0.008720607 0.01707137 0.974208027 3 32 Aprobado [36,] 0.008428705 0.01601853 0.975552766 3 28 Aprobado
Tabla 28. Datos del grupo de interacción alta
Gráfico 10. Porcentajes de aprobados en interacción alta Fuente: Resultados obtenidos de R
Elaboración: Ruth Hidalgo
Fuente: Resultados obtenidos de R Elaboración: Ruth Hidalgo
El grupo de interacción media es mostrado en la tabla 29 y representados en el gráfico 11, en este agrupamiento la mayor cantidad de alumnos aprobaron la materia.
1 2 3 grupo Nota Estado
[2,] 0.472512206 0.50099803 0.026489761 2 27 Reprobado [3,] 0.155257709 0.80606222 0.038680067 2 34 Aprobado [4,] 0.245092095 0.71945812 0.035449781 2 30 Aprobado [6,] 0.226068917 0.74206842 0.031862663 2 36 Aprobado [9,] 0.168391089 0.80837992 0.023228989 2 17 Reprobado [10,] 0.102259376 0.83674691 0.060993718 2 17 Reprobado [22,] 0.310844520 0.65988785 0.029267630 2 26 Reprobado [23,] 0.245120914 0.72640839 0.028470694 2 32 Aprobado [28,] 0.136399072 0.74399754 0.119603392 2 34 Aprobado [32,] 0.119809129 0.82438972 0.055801150 2 34 Aprobado [35,] 0.290123497 0.49530604 0.214570465 2 30 Aprobado [38,] 0.131148509 0.80838716 0.060464335 2 25 Reprobado [39,] 0.085458468 0.89104306 0.023498476 2 31 Aprobado 62% 38% Aprobados Reprobados
Tabla 29. Datos del grupo de interacción media
Gráfico 11. Porcentaje de aprobados en interacción media Fuente: Resultados obtenidos de R
Elaboración: Ruth Hidalgo
Fuente: Resultados obtenidos de R Elaboración: Ruth Hidalgo
Los estudiantes que forman el grupo de interacción baja son recopilados en la tabla 30; la segunda columna contiene el valor más alto del grado de pertenencia al grupo 1, y en la gráfico 12 se muestra el porcentaje de alumnos reprobados y aprobados, abarcando la mayor cantidad los alumnos reprobados.
1 2 3 grupo Nota Estado
[1,] 0.747294908 0.23277194 0.019933147 1 25 Reprobado [5,] 0.530480713 0.43792694 0.031592349 1 2 Reprobado [7,] 0.935997898 0.05600505 0.007997049 1 29 Aprobado [8,] 0.879060330 0.11070436 0.010235314 1 8 Reprobado [11,] 0.868674796 0.11031285 0.021012354 1 1 Reprobado [12,] 0.910269031 0.07677201 0.012958959 1 4 Reprobado [13,] 0.942545867 0.05093337 0.006520763 1 30 Aprobado [14,] 0.966657434 0.02941951 0.003923054 1 14 Reprobado [15,] 0.944760845 0.05006459 0.005174560 1 35 Aprobado [16,] 0.916002284 0.07182989 0.012167823 1 24 Reprobado [18,] 0.922509213 0.07009605 0.007394737 1 24 Reprobado [19,] 0.956875954 0.03854437 0.004579671 1 9 Reprobado [20,] 0.950855664 0.04329909 0.005845246 1 13 Reprobado [21,] 0.945786199 0.04874080 0.005473005 1 14 Reprobado [24,] 0.956517978 0.03936090 0.004121120 1 28 Aprobado [25,] 0.787795468 0.19928665 0.012917881 1 25 Reprobado [26,] 0.730007710 0.25452483 0.015467456 1 22 Reprobado [27,] 0.915189284 0.07254097 0.012269745 1 10 Reprobado [29,] 0.784872056 0.19031003 0.024817919 1 23 Reprobado [30,] 0.954674816 0.04092911 0.004396070 1 31 Aprobado [31,] 0.852318127 0.13358913 0.014092744 1 29 Aprobado [34,] 0.916496128 0.07411392 0.009389951 1 29 Aprobado [37,] 0.949834158 0.04364625 0.006519588 1 12 Reprobado
Tabla 30. Datos del grupo de interacción baja
Fuente: Resultados obtenidos de R Elaboración: Ruth Hidalgo
Como observamos en los gráficos 10, 11 y 12, que son el resultado de las técnicas de minería aplicadas; se ratifica la hipótesis planteada, ¿Existen indicadores de interacción colaborativa que reflejan el aprendizaje de los estudiantes de la UTPL?, sí existen estos indicadores, se los demuestra en la Gráfico 13, donde el 100% de estudiantes que corresponden al grupo de interacción alta aprobaron la asignatura; el 62% de los estudiantes con interacción media aprobaron mientras que el 38% reprobaron; y el 70% con interacción baja perdieron la asignatura por tener una nota menor a 28 puntos, y el 30% aprobaron.
30% 70% Aprobados Reprobados 100 62 30 0 38 70 0 20 40 60 80 100 120
Alta Media Baja Aprobados Reprobados
Gráfico 13. Porcentajes de aprobados y reprobados Gráfico 12. Porcentaje de aprobados en interacción baja
Fuente: Resultados obtenidos de R Elaboración: Ruth Hidalgo
Fuente: Resultados obtenidos de R Elaboración: Ruth Hidalgo
Para traducir estos resultados y obtener los indicadores que reflejen el nivel de interacción, se utilizó el algoritmo OneR (en WEKA), el mismo que proporciona reglas basadas en el atributo Accesos_curso, que permite medir el nivel de interacción del estudiante con las herramientas. Los indicadores obtenidos son los siguientes:
- Si (Accesos_curso <= 46) entonces Interacción = BAJA
- Si (Accesos_curso > 46) y (Accesos_curso <= 146) entonces Interacción = MEDIA
En la presente tesis se realizó un análisis cuantitativo de las interacciones de los estudiantes de la UTPL con las herramientas colaborativas (foro, twitter, mensajería y chat), mediante la integración de tres técnicas: estadística, SNA y minería de datos; con la finalidad de obtener indicadores de interacción.
Resultados del análisis estadístico
La estadística permitió realizar un análisis general del uso de las herramientas colaborativas durante el periodo académico octubre 2010 – febrero 2011, cuyos resultaron mostraron la baja utilización de estos medios, en especial el chat que tiene la mínima cantidad de uso. A demás permitió identificar las herramientas más utilizadas, que son la mensajería y el twitter, también se midió el nivel de uso de las herramientas por alumno, encontrando que casi el 50% de la población no hacen uso de ninguna de las herramientas, mientras que apenas el 0,1% han utilizado los cuatro medios de comunicación y un 25% utilizó sólo una herramienta.
Resultados del análisis de redes sociales
Siendo el análisis de redes sociales (SNA) una de las técnicas más populares en la actualidad en el campo del análisis de las interacciones, se lo aplicó también en la investigación, utilizándose el software Gephi, el mismo que facilita la visualización de las redes que se crearon para cada una de las herramientas; obteniéndose indicadores tanto a nivel individual como a nivel grupal, estos son centralidad y cohesión respectivamente, que describen el comportamiento de los usuarios durante la interacción.
Una de las dificultades presentes en esta parte estuvo enmarcada en la enorme cantidad de interacciones de algunas herramientas que superaban el límite máximo del software escogido para la investigación, por lo que se optó en disminuir la población y así conseguir representaciones más óptimas para el análisis.
Resultados de la aplicación de minería de datos
Se utilizó técnicas de minería de datos para determinar el comportamiento interactivo de los estudiantes y verificar la hipótesis “Existen indicadores de interacción colaborativa que reflejan el aprendizaje de los estudiantes de la UTPL.” Ya que evidentemente los resultados mostraron que las interacciones de los estudiantes afectan el aprendizaje.
Se hicieron algunas pruebas con la finalidad de encontrar el mejor agrupamiento que muestre la interacción con relación a la nota de los estudiantes; después de experimentar con dos, tres y cuatro grupos, se determinó que el de tres grupos daba el resultado más preciso. El algoritmo que proporcionó los resultados más óptimos fue el fuzzy c-means, el cual está disponible en R; se utilizó un curso como muestra, cuyos agrupamientos definieron los niveles de interacción: alta, media y baja. En el agrupamiento de nivel alto el 100% de los estudiantes aprobó la asignatura, en la media el 62% aprobó mientras que en la baja apenas el 30% pasó la asignatura.
Finalmente se aplicaron algoritmos de reglas de asociación para representar mediante un indicador los agrupamientos encontrados en la interacción de los estudiantes; el algoritmo que presentó el menor grado de error fue el OneR, el cual definió como atributo principal al número de accesos al curso (Accesos_cursos), determinando al valor de 146 como mínimo para considerar una interacción alta y el valor de 46 como límite entre una interacción media si es mayor o baja caso contrario.
Después de haber realizado el análisis correspondiente a la presente investigación se ha llegado a las siguientes conclusiones:
- Sabemos que el hombre es social por naturaleza y necesita de otros para crecer; este principio de colaboración, no se podría dar en la universidad puesto que los resultados señalan que el medio para realizarlo no es explotado lo suficiente, la estadística aplicada nos demuestra que casi el 50% de alumnos y profesores no usan ninguna herramienta de comunicación. De ese 50% de usuarios que utilizan las cuatro herramientas; la mensajería es la más usual, el twitter le sigue con poca diferencia, luego los foros con más del 40% de variación y por último el chat con una relación de casi el 1% de uso.
- Es necesario que todas las herramientas estén completamente a disposición del alumno para que las cifras de interacción en las mismas sean altas, como lo es en la mensajería y el twitter, siendo éstas las que mayor uso tienen de acuerdo a los resultados obtenidos, mientras que, el foro y el chat no obtuvieron el mayor porcentaje de uso debido a que es el profesor quien habilita estas herramientas.
- El análisis visual a través del SNA permite identificar el nivel de participación que han tenido los estudiantes y el profesor en cada una de las herramientas (foro, chat, mensajería y twitter); muestran el comportamiento interactivo a nivel individual y de grupo, en la investigación se obtuvieron indicadores de centralidad y cohesión, proporcionando resultados más altos para la red de los foros.
- A través de la minería de datos se encuentra la verdadera importancia de la buena utilización de las herramientas que provee la universidad en el EVA, ya que aquellos estudiantes (en mínimo porcentaje) que tienen interacción alta alcanzan mayor aprendizaje y por lo tanto aprueban la materia. Comprobándose de esta manera la hipótesis de la presente investigación.
- Existe relación entre las interacciones de los estudiantes con las herramientas colaborativas y el aprendizaje.
- El algoritmo que proporciona los mejores resultados en el agrupamiento es el fuzzy c-means ya que aparte de agrupar a los individuos con características similares, asigna a cada uno un valor de pertenencia a los grupos, lo que permite obtener resultados más precisos.
- La combinación de las técnicas de análisis estadístico, visual y de minería, dieron un resultado completo y de fácil interpretación para el análisis cuantitativo de las interacciones producidas en el periodo académico octubre 2010 – febrero 2011.
- Los indicadores obtenidos en la investigación son fundamentales para el proceso de evaluación de los estudiantes, ya que proveen información exacta sobre el nivel de comunicación en la asignatura.