• No results found

Chapter 3 SARS interpretation of „effective management‟

4. Criticism of IN6

idf(ai, G) = log2( NG f(ai, G) ) (7.3)

Mediante la expresión (7.1) es posible determinar la relevancia básica de cada entidad, de acuerdo a un determinado contexto o concepto de interés. Si no se proporciona un determinado contexto, se calcularía la métrica considerando el universo de tripletas encontradas. En trabajos como?se proponen otros métodos para rankear a entidades de bases de conocimiento.

7.2.2. Creación de la Base de Conocimiento

A partir de la función de expansión o recorrido presentada en el apartado anterior es posible crear la base de conocimiento que servirá para anotar semánticamente y clasificar los recursos educativos abiertos.

Como se explicó previamente, la capa central que permitirá conectar a usuarios y OERs está formada por un grafo de conceptos interconectados provenientes de dos sistemas de organización de conocimiento. Por una parte, se trata de un sistema de clasificación de conocimiento formal, como un tesauro, y por otra parte, está un sistema abierto de conocimiento.

Como se puede ver en la Figura 7.4, el flujo de trabajo para la creación de la base de conocimiento inicia con la selección de un vocabulario de conocimiento controlado y aprovecha los datos, las relaciones semánticas y la estructura de grafo dirigido de las fuentes de conocimiento social o vocabularios abiertos. A partir de este sistema se enriquece el sistema controlado.

Figura 7.4: Enfoque general para la creación de la base de conocimiento

Por tanto, al menos dos tipos de fuentes de datos son requeridas para efectuar el proceso: i) vocabulario controlado, como la Nomenclatura de 6 dígitos de la UNESCO, y un ii) un vocabulario abierto, como la DBPedia, que describe todo tipo de conceptos. A partir de las correspondencias establecidas entre pares de conceptos equivalentes de ambos vocabularios, se realiza el respectivo proceso de expansión con el objetivo de enriquecer y buscar conceptos relacionados a cada uno de los tópicos definidos por el tesauro controlado.

Mediante este proceso, se consigue enriquecer las áreas de conocimiento definidas por el tesauro formal o vocabulario controlado, a partir de los recursos semánticos encontrados en fuentes abiertas de datos RDF. El resultado es un catálogo de entidades como personas, lugares o conceptos relacionados con un tema específico. Como se puede ver en la Figura 7.4, dos tareas se realizan de manera offline:

Mapeo entre el sistema de clasificación formal o controlado y el sistema de organi- zación social y abierto, esto supone afrontar el problema de definir la equivalencia entre dos conceptos (Francesconi et al. 2008).

De forma concreta, durante la creación de enlaces entre las entidades de ambos esquemas, se deben enfrentar desafíos importantes como: variaciones del nombre de cada categoría, ambigüedad de entidades o falta de datos. Para asumir el primer desafío, se debe realizar una tarea previa de pre-procesamiento de texto; para resolver los problemas de ambigüedad, puede ser necesario obtener o proporcionar información adicional; y en cuanto al tercer aspecto, éste puede ocurrir debido al hecho de que algunas sub-disciplinas definidas por el tesauro controlado han perdido vigencia, por tanto, no se produce un impacto importante si es que no es han encontrado recursos equivalentes.

das y almacenadas en la base de conocimiento. En el futuro estas equivalencias son utilizadas para anotar y clasificar los recursos.

Enriquecimiento de entidades mediante la expansión de conceptos. Durante este paso se realiza la expansión de los conceptos del tesauro controlado a través de las categorías correspondientes encontradas en las fuentes de datos sociales. Esta tarea inicia con la recolección de datos desde fuentes de datos enlazados, luego de un proceso de pre-procesamiento de datos es posible realizar una serie de tareas que permitirán extraer entidades y vincular OERs mediante relaciones semánticas.

De forma concreta, para encontrar entidades relacionadas (por ejemplo, tópicos o áreas de conocimiento) a cada una de las sub-disciplinas del sistema formal, se aplica el método de expansión descrito en el apartado anterior. De forma recursiva se recorre el grafo definido por la fuente social y estructurada; en cada iteración, los nodos vecinos a cada nodo que está activo son visitados.

En este punto, es clave elegir los predicados que representen las relaciones semán- ticas que unan los nodos más influyentes. Como se explicó en el apartado 7.2.1.1, se propone asociar un peso a cada relación seleccionada de tal manera que al final se determine una calificación para cada nodo -según la expresión 7.1-, de esta manera, se podrán seleccionar los tópicos de mayor influencia. Para terminar esta tarea, atributos descriptivos de cada entidad, como etiqueta, resumen, nombres alternativos y comentario en varios idiomas, pueden ser recuperarlos. Toda esta información se almacena en el repositorio local de conocimiento.

Más adelante, los datos obtenidos en esta etapa son utilizados para anotar y conectar los recursos digitales que se ofrecen para el aprendizaje y conectar a todos los usuarios de OERs.

Como resultado de este proceso, en la Figura 7.5 se observa un subgrafo enriquecido entre dos sistemas de organización de conocimiento. Por ejemplo la sub-disciplina de la UNESCO 120323 la cual corresponde a <Lenguajes de Programación>es mapeada al categoría DBPedia <Programming_languages>. En el tesauro original de la nomen- clatura de la UNESCO, únicamente existe una relación desde esta sub-disciplina a su concepto superior 1203 -correspondiente a Ciencias de la Computación-; pero si se nave- ga por el subgrafo obtenido desde la DBPedia a través del predicado <owl:sameAs>se pueden llegar a establecer más conexiones que lleven a encontrar una amplia gama de tópicos relacionados como: MATLAB, lenguajes de programación numéricos, entre otros.

Figura 7.5:Mapeo y enriquecimiento de campos de conocimiento de la UNESCO a partir de conceptos SKOS disponibles en DBPedia

Related documents