PART II CONTRIBUTIONS: LANGUAGE FEATURES AND CO-DESIGN
6.1 Language Design
6.1.5 Thread Communication
Taxonomías. Según la Real Academia de la Lengua - RAE 11 Taxonomía es la Ciencia que trata de los principios, métodos y fines de la clasificación. Se aplica en particular, dentro de
la biología, para la ordenación jerarquizada y sistemática, con sus nombres, de los grupos de animales y de vegetales. Se relaciona el término con el concepto clasificación, como acción y efecto de clasificar.
En el trabajo de (Centelles, 2005) se realiza un exhaustivo trabajo de identificación y confrontación de los rasgos semánticos con que se define. Para ello, realizaron una amplia búsqueda de definiciones en todos los ámbitos de estudio, desarrollo y/o aplicación del término taxonomía. Localizaron 36 definiciones publicadas en el periodo comprendido entre 2000 y 2005 en diferentes fuentes:
• Diccionarios y enciclopedias especializadas.
• Artículos de consultores en gestión de contenidos y arquitectura de la información. • Artículos de especialistas vinculados al ámbito académico.
• Documentos técnicos y comerciales de aplicaciones informáticas para el desarrollo de taxonomías.
En el contexto de nuestro estudio, las definiciones que vinculan las taxonomías al entorno digital destacan, como finalidades prioritarias, la mejora de la navegación y el desarrollo de sistemas de búsqueda basados en la exploración ("browsing") y en la recuperación ("searching"). Las definiciones que vinculan las taxonomías al entorno corporativo destacan el valor estratégico de las taxonomías en áreas como la gestión del capital intelectual y, en general, del conocimiento. Una muestra de una definición que otorga a la taxonomía una posición estratégica en el desarrollo de sitios web corporativos es Taxonomy strategies (Centelles, 2005).
Respecto a la Web 2.0 hacemos referencia a (O’Reilly, 2007) respecto a la identificación de aplicaciones o enfoques como Web 1.0, refiriéndose al concepto directories/taxonomies y su correspondencia con los identificados como Web 2.0, referidos al de tagging/folksonomy, estos últimos vinculados al estilo colaborativo de categorización de sitios y documentos con palabras claves elegidas libremente, frente al contenido estático de los términos introducidos en las taxonomías, como cambio de uso con respecto a la descripción de recursos en Internet.
Ontología12. Desde el punto de vista de la informática, el término ontología hace referencia
a la formulación de un exhaustivo y riguroso esquema conceptual dentro de uno o varios dominios dados; con la finalidad de facilitar la comunicación y el intercambio de información entre diferentes sistemas y entidades. Aunque toma su nombre por analogía, esta es la diferencia con el punto de vista filosófico de la palabra ontología.
Un uso común tecnológico actual del concepto de ontología, en este sentido semántico, lo encontramos en la inteligencia artificial y la representación del conocimiento. En algunas aplicaciones, se combinan varios esquemas en una estructura de facto completa de datos, que contiene todas las entidades relevantes y sus relaciones dentro del dominio.
Desde el prisma filosófico, la ontología estudia la manera en que se relacionan las entidades que existen. Por ejemplo, la relación entre un universal (manzana) y un particular que "lo tiene" (el color "rojo"), o la relación entre un evento (Sócrates bebió la cicuta) y sus participantes (Sócrates y la cicuta).
Es indudable que las ventajas que ofrece Internet son enormes a la hora de buscar información, pero adolece de precisión a la hora de encontrar información y poder realizar deducciones con ella. Se trata de convertir la información en conocimiento, referenciando datos dentro de las páginas Web, anotando páginas Web, mediante metadatos con un esquema común consensuado sobre algún dominio. Los metadatos no sólo especificarán el esquema de datos que debe aparecer en cada instancia, sino que además portarán información adicional de cómo hacer deducciones con ellos. Una Ontología es “una especificación explícita y formal de una conceptualización”. Más concretamente, una Ontología estará formada por una taxonomía relacional de conceptos y por un conjunto de axiomas o reglas mediante las cuales se podrá inferir nuevo conocimiento.
En el ámbito de la Web semántica, vienen desarrollándose múltiples iniciativas en relación con la creación de Ontologías de dominio. BioPortal proporciona acceso a ontologías de uso biomédico y herramientas para trabajar con ellos. Es un repositorio de acceso abierto de ontologías biomédicas que incluye diversas funcionalidades: navegar, buscar y visualizar ontologías. La interfaz Web también facilita la participación comunitaria en la evaluación y evolución del contenido de la ontología, proporcionando funciones para añadir notas a los términos de la ontología, las asignaciones entre los términos de la ontología y críticas sobre la base de criterios como la usabilidad, la cobertura de dominio, la calidad del contenido y la documentación y apoyo. Otras iniciativas merecen mención como es el caso de Onto Gene y otras muchas vinculadas a diversos proyectos de investigación, como se puede apreciar consultando el 7º programa marco de la UE.
Para la creación y desarrollo de ontologías existen diversas metodologías, una de ellas es la metodología Methontology (Fernández-López, Gómez-Pérez, & Juristo, 1997), desarrollada por el Laboratorio de Inteligencia Artificial de la Universidad Politécnica de Madrid; muy utilizada en el ámbito internacional para la creación de ontologías jerárquicas.
Lenguaje controlado: tesauros. Al igual que en las entradas anteriores de este punto, es
importante hacer constar y referenciar a un tipo de publicación muy usado tradicionalmente en el campo de la biblioteconomía y documentación para la indexación de documentos en una base de datos. Nos referimos a los tesauros. Según la definición hallada en wikipedia, en biblioteconomía Tesauro es una lista que contiene los "términos" empleados para representar los conceptos, temas o contenidos de los documentos, con miras a efectuar una normalización terminológica que permita mejorar el canal de acceso y comunicación entre los usuarios y las Unidades de Información (entiéndase unidad de información como: biblioteca, archivo o centros de Documentación). Aunque en la práctica tradicional se habla de unitérminos, en la actualidad se ha efectuado grandes variaciones dando incorporación a términos o descriptores compuestos, es decir, descriptores que se componen de dos o más palabras.
Figura 12. Tesauro de la Unesco
Los términos que conforman el tesauro se interrelacionan entre ellos bajo tres modalidades de relación:
1. Relaciones jerárquicas: Establecen subdivisiones que generalmente reflejan estructuras de TODO/Parte.
2. Relaciones de equivalencia: Controlan la sinonimia, homonimia, antonimia y polisemia entre los términos.
3. Relaciones asociativas: Mejoran las estrategias de recuperación y ayudan a reducir la polijerarquía entre los términos.
Es un intermediario entre el lenguaje que encontramos en los documentos (lenguaje natural) y el que emplean los especialistas de un determinado campo del saber (lenguaje controlado). Aunque los incluye, las entradas de un tesauro no deben ser consideradas sólo como una lista de sinónimos.
Otros sistema de clasificación de la terminología: WordNet13 es una enorme base de datos léxica del idioma inglés. Agrupa las palabras en conjuntos de sinónimos llamados 'synsets', proporcionando definiciones cortas y generales, y almacenando las relaciones semánticas entre estos conjuntos de sinónimos. El propósito del proyecto es doble: por un lado producir una combinación de diccionario y tesauro cuyo uso es más intuitivo, y ayudar al análisis automático de textos y a las aplicaciones de inteligencia artificial. La base de datos y las herramientas se han liberado bajo una licencia BSD y pueden ser descargadas y usadas libremente. Además la base de datos puede consultarse online.
WordNet fue creado y es mantenido por el Cognitive Science Laboratory de la Universidad de Princeton bajo la dirección del profesor de psicología George A. Miller. El desarrollo comenzó en 1985.
Las taxonomías, como los tesauros y las ontologías, son mecanismos que permiten estructurar datos e información para dotar a los sistemas de recuperación de información de al menos, un mínimo de semántica. En el web, pueden utilizarse para ayudar a los usuarios/clientes a encontrar productos y servicios, así como para representar mejor sus necesidades de información. Como estructuras enfocadas a la clasificación de contenido, posibilitan que los motores de búsquedas y otras aplicaciones que utilizan taxonomías como los servicios web, localicen entidades de información más rápido y con mayor grado de precisión y exhaustividad.