Contenido
5.1 Introducción 162 5.2 Bases de datos multidimensionales 162
5.3 Tecnologías OLAP 169 5.4 Integración entre bases de datos y herramientas OLAP 173
5.5 Arquitecturas OLAP y OLTP 174 5.6 OLAP: multidimensional contra relacional 175
5.7 Evaluación de servidores y herramientas OLAP 182
5.8 Desarrollo de aplicaciones OLAP 184 5.9 Áreas de aplicación de las tecnologías OLAP 185
5.10 Ventajas y desventajas de OLAP 186
5.11 Resumen 187 5.12 Contenido de la página Web de apoyo 188
Objetivos
• Introducir en el uso de las bases de datos multidimensionales. • Aplicar tecnologías OLAP sobre
bases de datos multidimensio- nales o relacionales.
• Diferenciar los modelos transac- cionales (OLTP) y los modelos relacionles (OLAP).
5.1 Introducción
La inteligencia del negocio utiliza los datos internos y externos de una organización para analizar los posibles escenarios y, de esta manera, proyectar futuras situaciones.
El modelo OLTP se ocupa del trabajo diario de la empresa, analiza las ven- tas y las compras, los pagos a los pro- veedores, etc. El modelo OLAP utiliza un sistema unifcado de análisis que resume, integra y, también, distribuye la información por las diferentes áreas de una organización.
En este capítulo y en los subsiguientes, se hará hincapié en la gestión de los datos, pero a diferencia de los apartados precedentes —en los que se analizaba la informa- ción desde su procesamiento transaccional—, aquí se buscarán los parámetros que facilitarán la obtención de pronósticos de los entes que suelen interactuar con una organización.
Este proceso —denominado inteligencia del negocio (o, en inglés, Business Intelligence)— utiliza los datos internos y externos de una organización para —como se afrmó en el párrafo anterior— analizar los posibles escenarios y, de esta manera, proyectar futuras situaciones.
Las organizaciones —para garantizar su subsistencia— necesitan ciertos pará- metros de efciencia que les permitan, en primer lugar, la maximización de su inversión y, en segundo lugar, su subsistencia en el tiempo mediante una correcta planifcación de su futuro.
Por esta razón, establecen dos modelos que se ejecutan en forma simultánea y que permiten, por un lado, el procesamiento de la operación diaria de la organización (On-line Transaccional Processing u OLTP) y, por otro, el procesamiento analítico de las situaciones pasadas que faciliten la planifcación de su futuro (On-line Analytical Processing u OLAP).
El modelo OLTP que, como se dijo, se ocupa del trabajo diario de la empresa, ana- liza —entre otras cuestiones— las ventas y las compras, los pagos a los proveedores, etc. En cambio, el modelo OLAP que, como se mencionó, considera lo ya acontecido, utiliza un sistema unifcado de análisis que resume e integra o distribuye la información por las diferentes áreas de una organización.
En una economía globalizada, las empresas necesitan el establecimiento de cier- tos parámetros de calidad que contribuyan con la diferenciación de sus productos en el mercado y les permita, además, su expansión hacia nuevos escenarios. Por esta razón, es fundamental —si se quiere buscar nuevas oportunidades de mercados y nichos específcos— el análisis exhaustivo de la información.
5.2 Bases de datos multidimensionales
El modelo multidimensional utiliza bases de datos más grandes que permiten al mercado decidir el futuro de sus negocios de manera rápida y efciente.
5.2.1 Evolución de las bases de datos
El Dr. Codd, creador del modelo relacional —Relational Data Base Management Systems (RDBMS) o bases de datos relacionales—, posicionó su descubrimiento como la solución adecuada para el almacenamiento y la manipulación de datos. Sin embargo, se dio cuenta de que los RDBMS, si bien servían para almacenar la información, no satisfacían plenamente las necesidades de los negocios, porque el análisis de los datos requería de movimientos electrónicos y de procedimientos muy complejos. Para solucionar las limitan- tes de este modelo, Codd diseñó el denominado modelo multidimensional.
El modelo multidimensional (MMD) utiliza —a diferencia de los RDBMS, que esta- ban limitados a dos dimensiones— bases de datos más grandes que permiten al mercado decidir el futuro de sus negocios de manera rápida y efciente.
En la década del setenta, Ken Iverson creó el APL, A Program Language, que fue la primera herramienta de aplicaciones OLAP. Esta herramienta —implementada por IBM— tenía, gracias a la utilización de datos multidimensionales, aplicaciones empresariales con funcionalidades muy similares a las de los productos OLAP de la actualidad. Sin embargo, por su alto grado de complejidad —aun para programadores expertos— no logró un alto grado de adhesión.
En los años noventa, algunas empresas de software investigaron —sobre la base de las reglas establecidas por Codd— la implementación de un método (o arquitec- tura) que unifcara la tecnología multidimensional con las bases de datos relacionales. De esta manera, se llegó a que las herramientas de apoyo que se utilizaban para la toma de decisiones tuvieran una nueva defnición de requerimientos que debían incluir el uso de datos relacionales y la tecnología multidimensional.
En los últimos años, la demanda del mercado se orientó hacia el uso de aplica- ciones multidimensionales de mayor potencia que ampliaran las posibilidades a la hora de trabajar con bases de datos multidimensionales. Para suplir las falencias de las bases de datos, nacieron las herramientas OLAP relacionales. Éstas, además de incluir la visión multinivel, en algunos casos, utilizan hojas de cálculo y almacenan los datos en un RDBMS.
En la actualidad, ciertas herramientas OLAP permiten, para su procesamiento, que se almacenen en las computadoras personales pequeños cubos generados a partir de grandes bases de datos. Como esto ha resultado de mucha utilidad, las empresas distribuidoras ofrecen la herramienta de consultas relacionales y las herra- mientas de análisis multidimensionales.
Las bases de datos multidimensionales (MDB), al ofrecer una visión multidimensio- nal de los datos en un concepto de dimensión, permiten la observación de cada uno de los patrones de interés que se evaluarán como una dimensión determinada. De esta manera, no se necesita del concepto de relaciones para la integración y unifca- ción de datos y, además, se evitan las flas y columnas.
La Fig. 5 . 1 , que se muestra a continuación, describe cómo se distribuyen los pa- trones de interés sin la utilización de flas o de columnas.
En los últimos años, la demanda del mercado se orientó hacia el uso de aplicaciones multidimensionales. Para suplir las falencias de las bases de datos, nacieron las herramientas OLAP relacionales que, además de incluir la visión multinivel, utilizan hojas de cálculo y almacenan los datos en un RDBMS.
Kenneth Iverson (17 de diciembre de 1920-19 de octubre de 2004). Cien-
tífco informático y matemático, se destacó por el desarrollo del lenguaje de programación de APL.
En las bases de datos multidimensio- nales, la información se almacena en forma dimensional y no relacional. Las dimensiones determinan la estruc- tura de la información almacenada y defnen caminos de consolidación.