Table 23: Distribution of firms by NACE activity in each cluster (share of firms in per cent)
S: Other service activities 1.1 1.7 1.1 0.9 0
8.5 Background to regression model specifications
Nadie duda que, actualmente, la Web es el sistema de distribución de bases de datos documentales más utilizado y el que cuenta con mejores perspectivas de futuro. El
motivo es sencillo: el usuario que consulta la base de datos sólo tiene que contar con un navegador para poder acceder a los registros de forma actualizada y disponiendo, en algunos casos, de las mismas prestaciones de consulta y explotación que tienen los sistemas de gestión documental.
Es decir, el usuario no necesita instalar ninguna versión cliente del programa que gestiona la base de datos, sino que es el propio navegador de Internet (Internet Explorer,
Netscape, Mozilla u Opera) el que actúa como cliente de la base de datos. Desde el
navegador, tan sólo tendrá que indicar su petición mediante un formulario html para recibir las respuestas también en este formato que el navegador no tendrá ninguna dificultad en reproducir en el monitor del usuario.
Ahora bien, para que este método de acceso sea posible, es necesario en el lado del servidor un programa o un conjunto de programas que permita establecer la comunicación entre dos entornos en principio incompatibles o distintos: la base de datos gestionada por el SGBD, por un lado, y el navegador web, que utiliza el usuario y que sólo es capaz de interpretar páginas html transmitidas mediante el protocolo http, por el otro. Estos programas suelen recibir la denominación CGI (Common Gateway
Interface) o pasarelas.
El principal y único inconveniente de este sistema de distribución no es otro sino el coste de la adquisición del programa que actúa como pasarela, ya que, por el momento, adquirir un SGDB junto con los programas CGI o similares para la distribución en Web implica pagar unos poco asequibles para las disponibilidades de centros de pequeñas y medianas dimensiones.7 Esto último no deja de tener su lógica, puesto que adquirir una tecnología que permite consultar la base de datos a través de Internet es equivalente a adquirir en algunos casos una licencia de uso limitada únicamente por la capacidad del servidor web. Hay excepciones, afortunadamente, a esta lógica. En algunos casos, para un pequeño número de accesos concurrentes el SGBD no incrementa su precio (p.e.
FileMaker).
4.2.1 Estructura
Vamos a explicar con un cierto detalle los elementos básicos que intervienen en este proceso y su funcionamiento. Son los siguientes:
- Navegador (P.e. Explorer, Netscape, Mozilla, etc.).
- Servidor httpd (p.e. Internet information server, Apache, etc.). - Programa CGI (p.e. Knosys Internet, WwwIsis, WebPublisher). - Interfaz de consulta.
- Base de datos.
Los programas (el servidor httpd y el CGI) estarán instalados en un servidor, que contará con tarjeta de red y una dirección IP.
7 P.e. Wwwisis, Knosys Internet, o Inmagic WebPublisher son las CGI correspondientes a CDS/ISIS,
De todas las piezas enumeradas, quizá la menos conocida sea el programa CGI (Common Gateway Interface) que actúa de sistema de comunicación o pasarela8 entre los registros de la base de datos, que no están codificados en html, y el navegador web, que sólo puede interpretar información codificada en html. El protocolo CGI es un estándar desarrollado originalmente para Unix. La creación de esta especificación fue obra de los principales autores de los servidores http (Tony Saunders, entre otros) y se explica porque no querían tener que ir ampliando constantemente las funciones de los servidores para irlos adaptando a los nuevos programas. Es por ello que prefirieron crear un núcleo para el servidor web y proporcionarle un instrumento que le permitiera extender sus servicios y capacidades.
Así pues, el protocolo CGI es un estándar por medio del cual un servidor web (httpd) se puede comunicar con un programa externo, obteniéndose documentos html dinámicos (es decir, que se generan al momento, ya que varían según cuál haya sido la petición del usuario). Este protocolo establece una forma de enviar datos desde una página web –por medio de un formulario– y de procesarlos mediante un fichero ejecutable –programa CGI– que está situado en el directorio cgi-bin, o equivalente, de un servidor.
Por otro lado, un programa CGI es una aplicación informática escrita en lenguaje de programación (Perl, C, C++, etc.) que posteriormente es ejecutada e interpretada por un servidor web para poder contestar peticiones de información de los usuarios. El
programa CGI es capaz de leer e interpretar las órdenes que se le transmiten desde un formulario html, algunas de ellas introducidas por el usuario (p.e. los términos de búsqueda) y otras correspondientes a parámetros generales (p.e. la ubicación del
programa y de la base de datos en el servidor, el formato de visualización, el número de documentos a visualizar, etc.). A continuación, los ejecuta y el resultado lo transfiere al usuario en formato html.
Además de la CGI es necesario preparar una interfaz de consulta adaptada a la base de datos que tenga en cuenta los campos que se han definido, los formatos de
visualización, etc. Esta interfaz, que se describirá con más detalle en el apartado 4.3, se construye con el lenguaje de programación del programa CGI, entremezclada con código html y consta básicamente de tres elementos: pantalla de consulta; pantalla de visualización de resultados (listado); y pantalla de visualización del documento completo.
4.2.2 Funcionamiento del proceso
A continuación, vamos a intentar resumir los pasos que se producen en la consulta a una base de datos por medio de un navegador web, desde que el usuario se conecta hasta que recibe una lista de resultados a su petición. De esta manera se puede comprobar cuál es la función de cada uno de los elementos descritos anteriormente.
Figura 4.4. Esquema de funcionamiento de la consulta web
– Conexión
El navegador abre una conexión con el servidor httpd en el cual está instalado el
programa CGI y la base de datos y se le muestra un formulario de consulta de la base de datos en html (interfaz de consulta).
Petición del servidor
El usuario introduce los términos de búsqueda y las especificaciones para la
visualización (formato, número de registros, orden, etc.) y ordena su ejecución (es decir, hace clic en el botón “Buscar”, o equivalente).
– Transferencia desde el servidor a la CGI
El servidor ejecuta el programa CGI y le transfiere los valores y las variables introducidos por el usuario en el formulario a través de la entrada estándar. (Estas variables se almacenan en un registro “virtual”, cada una de ellas con una etiqueta y un valor).
– Proceso de la petición
El programa CGI interpreta las variables y los valores que ha introducido el usuario y los ejecuta. Es decir, que efectúa una consulta a la base de datos con los términos y especificaciones indicados.
– Resultado
El programa CGI presenta los resultados de acuerdo con las instrucciones del usuario y genera un documento html (página de listado) que se envía al servidor httpd por medio de la salida estándar y éste, a su vez, transmite la información al navegador.
4.2.3 Mercado
La mayoría de sistemas de gestión documental disponen de aplicaciones (programas CGI) que permiten que las bases de datos se puedan consultar desde un formulario web. Anteriormente ya hemos avanzado algunos nombres comercializados. A continuación, se van a resumir las principales prestaciones que permiten distinguir entre los
programas CGI y se va a presentar también una breve descripción de aquellos que tienen una mayor presencia en el mercado español. Hay que recordar, no obstante, que las CGI no pueden solventar las limitaciones que pueda tener un determinado sistema de gestión documental. Así pues, si FileMaker o Knosys son dos programas de la gama media y CDS/ISIS o Inmagic de la gama alta, ésto no se va a poder mejorar por el hecho que las CGI de unos sean mejores que las de otros.
- Asistente
La mayoría de las aplicaciones cuentan con un asistente que permite crear de forma simple una interfaz de consulta básica (es decir, con página de consulta, listado y
documento). Este asistente, no obstante, no permite generar aplicaciones complejas para las cuales normalmente será necesario conocer el lenguaje de programación de la CGI y desarrollarlas directamente.
- Mantenimiento de la base de datos
No es frecuente encontrar, en los programas que describimos en este apartado, con la posibilidad de realizar operaciones de mantenimiento de la base de datos (introducir, modificar o borrar registros). WwwIsis sería la excepción ya que es posible configurarlo no tan sólo para la consulta de los registros sino también para incorporar nuevos
registros de la base de datos, y así facilitar su mantenimiento desde un formulario web. - Consulta
Entre las prestaciones de consulta que pueden diferenciar un programa de otro se
pueden destacar las siguientes: poder consultar más de una base de datos a la vez; poder relacionar bases de datos; poder consultar los índices de todos los campos, etc.
- Visualización
En lo que respecta a este apartado se puede hacer referencia a diversas prestaciones entre las que resaltamos las siguientes: poder establecer uno o diversos criterios de ordenación de los resultados (p.e. fecha, autor, título, etc.); poder escoger el formato de visualización, o el número de registros a visualizar.
- Estadísticas
Algunos de los programas a los que nos vamos a referir llevan incorporada una
funcionalidad que facilita la generación de estadísticas o de informes sobre las consultas realizadas a la base de datos. Estos datos pueden ser muy útiles, posteriormente, para contribuir a la evaluación del uso de las bases de datos soportadas.
Nombre File Maker
Productor Claris <www.filemaker.com> <www2.filemaker.fr/spain>
Distribuidor Claris
Comentarios - Dispone de un asistente que permite elaborar rápidamente la
interfaz de consulta.
Ejemplos BIGPI (Geología de la Península Ibérica): http://www.bib.ub.es/bigpi/bigpi.htm
Nombre Knosys Internet
Productor Micronet <http://www.micronet.es/menu/prof/mki.htm>
Distribuidor Micronet
Comentarios - Dispone de un asistente, aunque es un poco limitado.
- No permite ordenar los registros por ningún criterio.
Ejemplos En el apartado “Clientes” de las páginas dedicadas a KnosysInternet se puede encontrar una lista de usuarios.
Nombre WebPublisher
Productor Inmagic <www.inmagic.com>
Distribuidor Doc 6 <www.doc6.es>
Comentarios - Dispone de un buen asistente.
- Se pueden mostrar los índices de campo. - Se pueden relacionar bases de datos.
Ejemplos Coordinadora Documentació Biomèdica - http://www.doc6.es/cdb
Nombre WwwIsis + GenIsis
Productor Bireme <http://www.bireme.br/wwwisis.htm> <http://perso.wanadoo.fr/pierre.chabert/>
Distribuidor Bireme
Comentarios - Dispone de asistente (GenIsis).
- Se pueden realizar operaciones de mantenimiento desde el web (entrada, modificación, supresión de registros).
- Se pueden relacionar bases de datos. - Se pueden mostrar los índices de campo.
- Permite ordenar los registros de acuerdo a distintos criterios.
Ejemplos Ejemplos de instalaciones en:
<http://www.bireme.br/wwwisis/I/listsites.htm>