Analysis of the significant deviations compared to the ATAF/SADC/EAC Models

A partir del ciclo de datos definido por el framework para el descubrimiento de OERs, el componente de gestión de datos de los recursos educativos aborda tres aspectos principales: i) la gestión de metadatos de un recurso educativo; ii) la anotación semántica a partir del reconocimiento de entidades nombradas -como personas, instituciones, tópicos o localizaciones- en el contenido del recurso; y iii) la clasificación temática de los OERs de acuerdo a un tesauro predefinido. En el capítulo 5, se define el modelo de datos para OERs que soporta estas tres tareas.

De los tres aspectos mencionados, los dos primeros son detallados en esta inves- tigación. En el capítulo 7 se presentan las funciones requeridas para completar estas actividades. El primer aspecto, la gestión de datos de los recursos educativos abiertos forma parte del ciclo de publicación de datos enlazados de otro trabajo de investigación desarrollado en GICAC-UPM.

Para que el flujo de datos se realice de forma adecuada, el aseguramiento de ciertas características base deben ser cumplidas durante el proceso.

1. Flexibilidad con información faltante o desconocida.

El escenario ideal para encontrar recursos en grandes repositorios de material es que éste esté etiquetado y debidamente catalogado. Sin embargo, como se ha dis- cutido, el modelo abierto de compartición según el cual se publican los materiales educativos no asegura que las descripciones de un recurso estén completas. Esto afecta negativamente al uso de estos materiales por parte de los usuarios, sobre- todo de aquellos que utilizan buscadores especializados ya que material educativo valioso podría ser omitido si éste no tiene las descripciones necesarias o si éstas son incompletas.

Para hacer frente a esta situación, dos enfoques complementarios pueden ser com- binados: i) cuando es posible coleccionar metadatos de un OER, proponemos un modelo semántico que lo caracteriza con atributos clave que ayuden a mejorar su descubrimiento por parte de agentes automáticos; y ii) los recursos educativos abiertos son enriquecidos con conceptos del dominio encontrados en repositorios de datos organizados según esquemas de conocimiento abiertos.

A través de sistemas de organización de conocimiento abiertos, es posible realizar inferencias, recorrer taxonomías de conceptos, ampliar palabras clave, y en general, aprovechar la semántica de las relaciones entre conceptos.

2. Categorizar los recursos educativos abiertos de acuerdo a características compartidas.

Una de las tareas comunes que se realizan en grandes colecciones de datos es agrupar los recursos de acuerdo a su similitud, de esta manera, los sistemas reco- mendadores pueden ofrecer objetos de información parecidos a alguno visto por un usuario.

Por tanto, cómo determinar la similitud entre dos documentos, ha sido una de las cuestiones más abordadas por las diferentes propuestas de sistemas recomendado- res.

Dependiendo del enfoque utilizado para representar o caracterizar al recurso educativo, se puede optar por: i) técnicas de procesamiento de datos si la descripción de OER está basada en metadatos. En este caso, técnicas de learning machine

pueden ser aplicadas sobre los diferentes atributos del recurso; y, ii) técnicas de recuperación de información, si se tiene acceso al contenido del OER, en esta si- tuación, modelos booleanos, probabilísticos, o el modelo de vector semántico, y otros pueden ser aplicados.

Para poder aplicar técnicas supervisadas de aprendizaje automático o modelos probabilísticos, se requieren grandes cantidades de datos correspondientes a OER previamente categorizados y de calificaciones que los usuarios hayan proporciona- do a los materiales.

Considerando que en el caso de los OERs es más difícil acceder a un corpus de recursos previamente clasificados de acuerdo a si son interesantes o no de acuerdo a un tópico, en el caso de la presente propuesta, que está basada en conocimiento, se ha optado por combinar enfoques aplicables a modelos semánticos y técnicas de recuperación de información con el objetivo de crear enlaces semánticos entre

dos recursos que compartan un subconjunto de características en común.

En el capítulo 7 se describe de forma detallada la propuesta para clasificar OERs de acuerdo a un tesauro de conocimiento.

3. Gestionar datos distribuidos y heterogéneos mediante tecnologías se- mánticas y datos enlazados.

En los últimos años el acceso a fuentes de datos heterogéneas en un entorno distribuido se ha convertido en un problema de creciente interés (Francesconi et al. 2008). La heterogeneidad de metadatos y datos que describen los recursos educativos online dificultan el acceso automático e integrado a esta información. Esta puede ser una de las razones por la que los OERs pueden permanecer ocultos y por tanto subutilizados por los usuarios.

En un trabajo previo (Piedra et al. 2014b), se analizó el problema del acceso a los repositorios OER. En este trabajo se extrajeron los metadatos de los recursos disponibles en los sitios OCW de los miembros de la OCWC y de UNIVERSIA, durante este proceso, se pudo evidenciar que uno de los mayores desafíos de ini- ciativas OCW es hacer frente a la heterogeneidad de los repositorios existentes. La heterogeneidad conduce a problemas de interoperabilidad y accesibilidad de contenido abierto entre instituciones y al interior de ellas. La falta de interoperabilidad afecta el descubrimiento, la reutilización, la re-mezcla y la adaptación de los materiales.

Para lidiar con los tres aspectos mencionados, enfoques basados en tecnologías se- mánticas se han convertido en una tendencia consiguiendo mejorar el acceso e interoperabilidad de repositorios de material educativo distribuido en la Web.

In document Seeking deviations from South Africaﾒs tax treaty policy with respect to treaties in Africa: evidence from the treaty practice (Page 50-54)