Sin embargo, son los aspectos técnicos los que van a concitar nuestra atención y, en particular, el análisis de los documentos publicados en el verano de 2010 y cuyos resultados quizá puedan empezar a verse, siendo optimistas, en el mes en el que se celebran estas XII Jornadas Españolas de Documentación. Los tres documentos son los siguientes:
• Definition of the Europeana Data Model elements6 de 30 de julio de 2010, versión 5.2. • Europeana Data Model Primer7 de 5 de agosto de 2010
• Functional Specification for the Europeana Danube Release8 de 31 agosto de 2010
Palabras clave: Europeana Data Model, Linked Library Data, Linked Open Data, Agenda Digital 2020, Europeana, Hispana, Bibliotecas Digitales, Bibliotecas Virtuales, Modelos de datos semánticos,
Keywords: Europeana Data Model, Linked Library Data, Linked Open Data, Digital Agenda 2020, Europea- na, Hispana, Digital Libraries, Virtual Libraries, Semantic data models for libraries.
INTRODUCCIÓN
Para alcanzar la actual fase de Europeana ha sido necesario realizar un camino jalonado de normativa. El 28 de abril de 2005, seis Jefes de Estado o de Gobierno dirigieron una propuesta al Presidente de la Comisión Europea para apoyar la coordinación de las actividades de digitalización que venían desarrollán- dose en Europa y constituir una Biblioteca Digital Europea9 En 2006 se lanzó el proyecto European Digital Library Project (EDLProject o EDL) que basándose en los desarrollos y funcionalidades de The European Library10 creó a finales de enero de 2008 la primera maqueta de Europeana. Uno de los principales logros de este proyecto fue el análisis de la situación y necesidades de interoperabilidad entre archivos, bibliote- cas y museos y la acertada propuesta11, en nuestra opinión, del protocolo Open Archives Initiative-Protocol for Metadata Harvesting (OAI-PMH). Los esfuerzos de EDL para recoger tanto las experiencias de The European Library como de otros proyectos y establecer un marco de interoperabilidad quedan reflejados en el documento Towards metadata interoperability between Archives, Audio-Visual Archives, Museums and Libraries: What can we learn from The European Library metadata interoperability model? (2007). De hecho, la implantación efectiva de OAI-PMH no se realizó en Europeana, una vez finalizado ya el proyecto EDL, hasta su apertura en noviembre de 2008 y aún así no todas las colecciones digitales se han incorpo- rado por medio de este protocolo. Esto puede apreciarse en que el incremento del número de registros de aquellos proveedores de contenido que no disponen de este protocolo se mantiene prácticamente fijo. Sin embargo, el gran avance de Europeana no puede atribuirse sino a la implementación de OAI-PMH.
Comunicaciones
6 http://goo.gl/fy50g 7 http://goo.gl/8bYKg 8 http://goo.gl/36d1a 9 http://goo.gl/8vlsJ
10 Hay una línea de continuidad que va desde el proyecto inicial de The European Library (TEL) al que siguió TEL-ME-MORE con el objetivo de expandir la
formación de una biblioteca digital europea incluyendo a más instituciones que las bibliotecas nacionales, núcleo de TEL y que a su vez fue el predecesor de European Digital Library Project. The European Library es en la actualidad uno de los agregadores de Europeana.
[32]
Como se sabe, el protocolo OAI-PMH implica como elemento mínimo el uso de los 15 elementos básicos de Dublin Core (ISO 15836:200912). La adopción de esta normativa por parte de Europeana, es decir OAI- PMH / Dublin Core, coincidía exactamente con la del Directorio y Recolector de Recursos Digitales que en marzo de 2006 había puesto en producción el Ministerio de Cultura13. El objetivo de esta aplicación era disponer de un medio para registrar tanto los proyectos de digitalización que venían desarrollándose en España como las propias obras digitalizadas. DIGIBÍS, Producciones Digitales ganó el concurso público correspondiente y ofreció como mejora el desarrollo de un repositorio OAI específico para la Biblioteca Virtual de Prensa Histórica. Esta mejora constituía una prueba de concepto de que el mecanismo de la recolección de metadatos podría funcionar correctamente y aplicarse de una forma relativamente sencilla a una biblioteca digital ya en funcionamiento.
Efectivamente, el Directorio y Recolector se puso en explotación con 119.014 objetos digitales, proceden- tes fundamentalmente de los repositorios de universidades y de la Biblioteca Virtual de Prensa Histórica, y 55 colecciones digitales, de las que 25 contaban con repositorio OAI. En noviembre de 2010 contaba con 2.574.913 objetos digitales procedentes de 131 repositorios OAI y 503 proyectos de digitalización, según información suministrada por María Antonia Carrato14, Subdirectora General de Coordinación Bibliotecaria en la Jornada de Difusión de EuropeanaLocal.
La primera ventaja de esta aplicación está no sólo en la aplicación del protocolo OAI, sino, y esto está al margen de este protocolo, en el desarrollo dinámico de un repositorio asociado a un sistema de gestión bibliográfica, lo cual era novedoso en España en esa fecha (2006) y todavía (2011) es, por desgracia, muy infrecuente. De hecho, todas las bibliotecas digitales o virtuales desarrolladas por DIGIBÍS y construidas sobre su sistema DIGIBIB disponen de un repositorio OAI que se actualiza en el mismo momento que se modifica la base de datos bibliográfica y que no requiere otra intervención por parte del administrador que la configuración del o los conjuntos de datos que deben figurar en el repositorio. Un caso particular es la Biblioteca Virtual Larramendi de Polígrafos15 que cuenta también con un repositorio OAI para registros de autoridad.
El 25 de marzo de 2010 se presentó16 oficialmente Hispana, heredera del Directorio y Recolector de Colecciones digitales, que había experimentado un cambio técnico trascendental al asociar a la base de datos con los metadatos obtenidos en el proceso de recolección un repositorio OAI. De este modo, Hispa- na, que era ya un recolector de metadatos, se transformaba en un repositorio, lo que permitiría que fuera a su vez recolectado por otros grandes servicios de agregación. De este modo, la visibilidad de la ‘colección digital’ española aumentó considerablemente figurando en OAIster, ROAR17 y OpenDOAR. Sin embargo, el principal e inmediato efecto fue que Hispana podía ser recolectada por Europeana, minimizando los problemas de mantenimiento. Así, la información recolectada se constituyó en un repositorio dinámico y configurable sobre el que el administrador del sistema puede establecer las características de los sets a partir de campos específicos o bien como resultado de una búsqueda sobre la base de datos. Esta es la explicación de que el equipo de trabajo que mantiene con tanto éxito Hispana sea menor que los que mantienen más de un repositorio institucional.
Comunicaciones
12 Por su interés acostumbramos a recordar algo que es familiar para quienes consultan con frecuencia el catálogo de ISO; cada norma dispone de una
suscripción RSS que da puntual información de las modificaciones, cambios de estado, revisiones, etc. Así la 15836:2003 [http://goo.gl/WOe8M] ha pasado, tras el proceso de revisión realizado para incorporar cambios menores y alinearla con la norma ANSI/NISO Z39.85:2007, a ser la 15836:2009 [http://goo.gl/mRp23]. Además, el 11 de octubre de 2010 se publicó la última revisión de la recomendación DCMI Metadata Terms, cuyas modificacio- nes pueden consultarse en http://goo.gl/Tvbqt
Hay que tener presente que la ISO 15836:2009 define recurso como “todo lo que pueda ser identificado” y proporciona para ello los elementos usuales para todo tipo de aplicaciones y que no proporciona detalle para su implementación. Esto hace que este modelo sea especialmente apropiado para el entendimiento entre dominios o con otros esquemas más específicos. En el momento de redactar esta comunicación el Comité Técnico 50 de AENOR está procediendo a la fase de votación de la norma UNE-ISO 15836:2009.
13 La presentación del Directorio y Recolector de Colecciones Digitales tuvo lugar en el marco de las Jornadas sobre Preservación del Patrimonio Digital
[http://goo.gl/fwKk1] celebradas los días 14 al 16 de marzo de 2006 y fue realizada por la Subdirectora de Coordinación Bibliotecaria María Antonia Carrato http://goo.gl/xJEne
14 Hispana y las iniciativas del Ministerio de Cultura. [http://goo.gl/jkNX1] 15 http://goo.gl/zbItj
16 http://goo.gl/hNOCm
17 Cuando se redacta esta nota [1 de diciembre de 2010] Hispana figura en primera posición en el Registry of Open Access Repositories (ROAR) [http://
Es el momento de recordar que, una vez pasado el hito de la inauguración del portal y a la vista de la com- plejidad de administrar la recolección de miles de repositorios y coordinar decenas de proyectos similares, Europeana estableció una red formada por agregadores nacionales, entre los que se encuentra Hispana, agregadores transversales y repositorios individualizados. Así se recomendó que cada país formara un agregador nacional que recopilara los repositorios de cada país, mientras que los agregadores transver- sales (p.e., The European Library18 es en la actualidad un agregador de este tipo) recogen los registros de proyectos europeos temáticos como Europeana Regia19, mientras otros están formados por determina- dos tipos de instituciones (p.e., APEnet para archivos) o por determinados tipos de documentación (p.e., Europeana Film Gateway20). En esta complicada y cambiante red los proveedores de contenido individua- les aportan sus datos bien a través de los agregadores nacionales o bien por medio de los agregadores transversales21.
Así, y para clarificar la situación, tomando ejemplos españoles la Fundación Ignacio de Larramendi es un proveedor de contenido que contribuye al agregador nacional Hispana (1.234.252 objetos digitales) que a su vez es recolectado por Europeana. A diferencia de la Fundación, la Biblioteca Digital Hispánica (23.547 objetos digitales) de la Biblioteca Nacional de España o la Biblioteca Virtual Miguel de Cervantes (19.062 objetos digitales)22 son proveedores de contenidos individuales que aportan directamente su información a Europeana; es decir, no son agregadores. Por su parte los Archivos Estatales de la Subdirección General de Archivos del Ministerio de Cultura son proveedores de contenido del agregador transversal APEnet23 que aportará información de los archivos europeos a Europeana.
Por otro lado, la gestión del proceso de recolección de metadatos establecido por Europeana y el diseño y funcionalidades de su propio sitio Web hizo necesario contar con algunos elementos más que los previstos en el modelo básico de Dublin Core24 para dar cabida a la totalidad de datos proporcionados por los pro- veedores y para evitar algunos problemas en la presentación de contenidos. Estos problemas se centra- ban en la ausencia de miniaturas, en la necesidad de distribuir los contenidos en pestañas correspondien- tes a los tipos de objetos establecidos en el portal (textos, imágenes, sonido y vídeo) y en el registro de la entidad proveedora de los metadatos.
A esta nueva relación de elementos se le denominó Europeana Semantic Elements (ESE), cuya última ver- sión publicada es la 3.325. Esta nueva versión aporta dos elementos nuevos, el <europeana:dataProvider> que permite consignar la entidad creadora de los metadatos, atendiendo así una extendida petición de los proveedores de contenido para que figurasen explícitamente sus nombres; y <europeana:rights> para incluir los términos de uso de los objetos digitales. Para aclarar un tanto el proceso hay que decir que, sin embargo, el lanzamiento de Europeana se realizó en noviembre de 2008 sobre las bases de OAI-PMH y Dublin Core sin cualificar.
Comunicaciones
18 www.theeuropeanlibrary.org/ 19 http://group.europeana.eu/web/guest/details-europeanaregia/ 20 www.europeanfilmgateway.eu/ 21 http://www.europeana.eu/portal/europeana-contributors.html 22 Datos de 25 de febrero de 2011 23 http://www.apenet.eu/24 Cfr. Xavier Agenjo: Perspectivas tecnológicas en el libro y la biblioteca del futuro, pp. 177-191. En: El libro, las bibliotecas y los archivos en España a
comienzos del tercer milenio [Texto impreso] / Luis A. Ribot García, coordinador. Madrid : Sociedad Estatal España Nuevo Milenio, 2002. Recoge las ponencias presentadas en el Foro de Debate sobre el Libro, las Bibliotecas y los Archivos en España, a comienzos del Tercer Milenio, celebrado en Santander del 12 al 15 de noviembre de 2001. Véase además, en el mismo libro, El acceso a la información digital de María Luisa Martínez-Conde, ob. cit., pp. 131-140
Ya desde la reunión de Poznań de 3 de diciembre de 200926, Europeana había adoptado para su fase de poslanzamiento el nombre de Rin27 que, en resumidas cuentas, venía a significar el objetivo de alcanzar 10 millones de objetos digitales en el verano de 2010. Y se había previsto el nombre de la siguiente fase con el nombre de otro de los ríos europeos, Danubio. Puede decirse que las distintas versiones de ESE, y en concreto la 3.3, es lo que ha caracterizado a la Fase Rin y lo que ha permitido alcanzar la cifra de 14 millones de objetos digitales a fecha 18 de noviembre de 2010, que mencionamos al principio.
Las cifras son enormes y hablan elocuentemente de la ventaja que supone la aplicación del protocolo OAI ya que en cuatro meses Europeana28 se ha incrementado con 4 millones de objetos. Es pues, evidente que el aumento, prácticamente del 40 %, se debe al incremento, verdaderamente considerable, tanto de la actividad de los distintos tipos de agregadores como, en último término, de los proveedores de la información. De hecho, esta circunstancia guarda un paralelismo estricto con la situación en España. En efecto, como ya se ha dicho, en marzo de 2006 el Directorio y Recolector ofrecía 119.014 objetos digitales de 15 repositorios OAI y 55 colecciones digitales. Mientras los datos que se presentaron en las Jorna- das de Difusión de EuropeanaLocal,l antes citadas eran de 131 repositorios y 503 colecciones digitales y 2.574.913 objetos digitales.
Esta es, pues, la situación de partida para fundar la nueva fase Danubio cuya entrada en producción está prevista para mayo de 2011, aunque se trata de una fecha tentativa y ya se están mencionando en distin- tas reuniones demoras de algunos meses. Para los proveedores de contenidos estos cambios representan un esfuerzo notable y no son pocas las llamadas de atención acerca del coste de adaptarse a las nuevas propuestas que plantea Europeana. En toda Europa (y desde luego en España) se pueden señalar casos en los que en un plazo de dos o tres años el proveedor de contenido ha debido implantar no sólo un repo- sitorio OAI, sino también adaptarlo a las distintas versiones de ESE. Ante el anuncio de un nuevo modelo de datos, el Europeana Data Model (EDM), que será el sustento de los nuevos requisitos funcionales para la fase Danubio es lógico que haya cundido la alarma. Sin embargo, hay que mencionar también que para todos los proveedores de contenido Europeana supone no sólo un aumento de la visibilidad de las colec- ciones sino también una actualización tecnológica y en muchos casos, por no decir en todos, el empuje, la justificación política y económica para normalizar las colecciones nacionales, lo cual era absolutamente imprescindible. Por ello, es presumible, y así está anunciado, que Europeana siga recolectando metadatos desde los distintos agregadores por medio del Europeana Semantic Elements, v.3.3, sin que sea descarta- ble, incluso, una actualización menor de este esquema hasta la entrada en producción del EDM. Algo que se respira en las últimas reuniones de Europeana es por un lado la dificultad de adoptar un nuevo modelo, pero también el gran interés, la preocupación y un esfuerzo decidido para que esto pueda ser posible. Quizá sea necesario hacer un pequeño excurso y explicar algo más a qué nos referimos exactamente con normalización. Incluimos aquí el proceso, seguido en muchos países, para adoptar un esquema de meta- datos mínimos como Dublin Core y por implementar repositorios conformes con OAI. Esto ha significado para muchos realizar procesos de conversión desde bases de datos con una estructura no normalizada (en Excel, Access, Filemaker, y cualquier otro software que se pueda imaginar) que habitualmente implican, aunque sean mínimos, procesos de normalización de datos. No debe olvidarse que la implantación de un repositorio OAI requiere un sitio web de acceso público al que referir la visualización de los metadatos o re- cursos digitales, lo que ha supuesto la difusión pública de contenidos digitales no accesibles. Además, las recomendaciones de Europeana, a poco que se sigan, significarán también cambios en los procedimien- tos de trabajo de los proveedores de contenidos, lo que redundará en una mayor calidad de los datos. Sin lugar a dudas, Europeana ha propiciado, y el caso español es clarísimo, un gran avance en la normaliza- ción y accesibilidad de las colecciones digitales. Hemos asistido a algunas reuniones de Europeana en las cuales los representantes de algunos países miraban con envidia la situación española comparándola con su mapa de centenares de bases de datos no normalizadas, alojadas en ordenadores de pequeñas y grandes instituciones sin acceso alguno a través de la web. En este sentido, no nos cansaremos de re- saltar que Europeana es no sólo un portal sobre el patrimonio cultural europeo, sino una línea estratégica, económica y política de toda Europa.
A pesar de los costes de implantació, las ventajas para los estados nacionales son tan notables que no hay una negativa para su adopción sino peticiones para que la Europeana Office y la Europeana Foun- dation se esfuercen en facilitar la transición al nuevo modelo. No podemos dejar de mencionar aquí la in-
fluencia que tendrá para los repositorios españoles el hecho de que el software sobre el que están creados muchos repositorios no permita una adaptación rápida al nuevo modelo. Esperemos, como ya ha ocurrido con la adopción de ESE, que alguna otra institución europea (española, por ejemplo) en la misma situación desarrolle el código que posibilite la adaptación a EDM.
El Europeana Data Model
Es necesario hacer un inciso muy importante porque las diferencias entre ESE y EDM son de tal calibre que es muy probable que muchos proveedores o muchos agregadores tarden un tiempo, o no lo consigan nunca, incorporar el nuevo modelo. De hecho, dentro de Europeana se mantiene la tesis de que ESE y EDM son retrospectivamente compatibles, o al menos esa es la opinión oficial que se hace circular dentro de EuropeanaLocal. Sin embargo, creemos que el riesgo fundamental para las nuevas funcionalidades de la fase Danubio se encuentra en la capacidad de los proveedores de contenido para relacionar semántica- mente sus datos con otros externos y no tanto en la compatibilidad de los modelos.
Es necesario recalcar que EuropeanaLocal agrupa a instituciones que pudiendo ser muy ricas desde el punto de vista de sus contenidos, puede que no lo sean tanto a la hora de crear e incorporar radicales modificaciones en la estructura de datos y en último término modificar los procesos técnicos para la crea- ción de los objetos digitales conforme al modelo EDM. Stefan Grandmann, uno de los padres del modelo funcional, ha señalado ya públicamente29 el riesgo de una Europeana de dos velocidades que vendría provocado no sólo por la falta de adaptación al EDM sino por la ausencia de relaciones semánticas en los datos que aporten los proveedores de contenido.
Tampoco debe perderse de vista que EuropeanaLocal es un proyecto financiado por el programa eCon- tentPlus con una fecha de caducidad muy próxima, junio de 2011, que coincide con la fecha prevista de entrada en producción de la Fase Danubio. En cualquier caso, es de suponer que la ya citada acción 15 de la Agenda Digital Europea producirá los mecanismos (para utilizar una expresión muy frecuente en el ámbito comunitario) para agregar contenidos de todo tipo de instituciones, con unas estructuras temáti- cas, caracteriológicas en último término, distintas a las actualmente en vigor. Tampoco es descartable que estos proyectos se renueven durante un periodo que es difícil de precisar en estos momentos, lo que pue- de ser imprescindible, dado el plazo de seis meses en el que nos estamos moviendo parece muy breve