Julio -Setiembre     2011 55
Ricardo Chinchilla Arley1
1. Máster en Computación, Instituto Tecnológico de Costa Rica. Profesor en la Escuela de Bibliotecología y 
Ciencias de la Información, Universidad de Costa Rica. Correo electrónico: ricardo.chinchilla@ucr.ac.cr
Fecha de recepción: 20/09/2010
Fecha de aceptación: 05/10/2010
Chinchilla Arley, Ricardo.
Mercado de datos: conceptos y metodologías de desarrollo
Tecnología en Marcha, Vol. 24, N.° 3, Julio-Setiembre 2011, P. 55-66
Mercado de datos: conceptos y 
metodologías de desarrollo
Palabras clave 
Bases de datos, mercados de datos, 
depósitos de datos, procesamiento analítico 
en línea.
Resumen
En este artículo se ofrece una descripción 
sobre la importancia del depósito y del 
mercado de datos. Además, identifican 
y formulan las principales definiciones, 
esquemas y términos básicos relacionados 
con el mercado de datos. Igualmente, se 
establecen y desarrollan los modelos de 
implementación y las metodologías para 
el desarrollo de un mercado de datos. 
Por último, se consideran las formas 
tecnológicas de procesamiento analítico 
en línea (OLAP) y su utilidad en el análisis 
del mercado de datos.
Key words
Database, datamart, datawharehouse, 
online analytical processing.
Abstract
In this article a description offers on the 
importance of the data warehouse and 
the data mart. There are identified and 
formulate the principal definitions, schemes 
and basic terms related to the data mart. 
There establish and develop the models of 
implementation and the methodologies for 
the development of a data mart. Finally, 
they are considered to be the technological 
forms of analytical processing in line 
(OLAP) and this usefulness in the analysis 
of the data mart.
Introducción
El mercado de datos constituye una 
tecnología de bases de datos que ha tomado 
gran auge debido al crecimiento y muchas 
veces subutilización de los grandes bancos 
de datos históricos almacenados en las 
organizaciones. Es por ello aquí que se 
presentan algunas precisiones sobre los 
conceptos y las metodologías utilizadas en 
el desarrollo del mercado de datos. En la 
primera parte, se establece la importancia 
del depósito y del mercado de datos. En 
este sentido, se deja claro que el mercado 
de datos (MD) es un elemento sustantivo 
dentro de la ultima generación de bases 
de datos, constituida por el repunte de los 
depósitos de datos (DD). Según Poe (1998), 
Vol. 24,  N.° 3     201156
alguno de ellos dependerá de los alcances 
y limitaciones del proyecto que se desee 
llevar a cabo. En cuanto a los modelos de 
implementación, existen tres básicos: el de 
estrella, el de constelación de hechos y el 
esquema “copo de nieve”. El más utilizado 
es el esquema estrella, que consiste en 
una tabla central construida con llaves 
foráneas provenientes de un conjunto de 
tablas llamadas dimensiones. 
En la cuarta parte, se consideran algunas 
formas de OLAP (Procesamiento Analítico 
en Línea - Online Analytical Processing) y 
su utilidad en el análisis del MD; en este 
sentido, las herramientas OLAP permiten 
el análisis de datos en forma interactiva.
Importancia del depósito y  
del mercado de datos
Un MD es un elemento sustantivo dentro 
de la última generación de bases de 
datos, constituida por el repunte de los 
DD. Un MD proporciona un esquema 
de almacenamiento que permite realizar 
consultas complejas, por medio de la 
interacción e interrelación de múltiples 
entidades, manteniendo solo un repositorio 
con la información agregada y ordenada, 
según las necesidades de los usuarios. 
Además, provee de una interfase de consulta 
que permite al usuario la posibilidad de 
análisis de la información para la toma de 
decisiones.
Los DD también son conocidos como 
hipercubos multidimensionales o cubos 
n-dimensionales, debido a que presentan 
la información en más de tres dimensiones 
(>3Dim). Se puede esquematizar de la 
siguiente manera:
González indica que “el hipercubo funciona 
como una representación intuitiva de un 
evento [generador de datos de más de 
tres dimensiones] debido a que todas las 
dimensiones coexisten para cada punto 
de este y son independientes entre sí” 
(González, 1998:8).
DD constituye, “una base de datos de solo 
lectura, donde la información extraída de 
los sistemas operacionales corrientes de 
la empresa es transformada, integrada 
y resumida para luego ser usada con 
efectividad en el soporte de decisiones”.
En la segunda parte, se desarrollan los 
principales conceptos, esquemas y 
términos básicos relacionados con el MD. 
La exposición se centra, particularmente, 
en que el modelo del MD está definido 
por la forma en que el usuario necesita 
ver la información y cómo quiere que se 
le presente; en este sentido, el MD posee 
las mismas características de un DD pero 
a un nivel más específico, ya que contiene 
diferentes combinaciones y selecciones de 
los datos que se encuentran en el DD y ofrece 
una mayor personalización de los datos 
del departamento, permitiendo un manejo 
más eficiente de la información histórica, 
ejecución de procesamiento independiente 
del resto de los departamentos y un costo de 
almacenamiento y procesamiento inferior.
En la tercera parte, se presentan 
varios modelos de implementación y 
metodologías para el desarrollo de un DD 
y un MD, y se aclara que la utilización de 
Figura 1. Representación de un hipercubo
Fuente: Elaboración propia a partir de 
“Construindo um hipercubo” (2004).
Julio - Setiembre    2011 57
históricos y puntuales optimizados para la 
consulta. 
No obstante, se apoyan en bases de datos 
transaccionales, las cuales trabajan con 
datos en tiempo real. Además, muchas 
empresas tienen diferentes plataformas de 
bases de datos, por lo que una búsqueda 
inteligente de información puede tomar 
gran cantidad de tiempo, degradando la 
efectividad de la decisión tomada con base 
en ella. Es aquí donde se hace presente 
el DD, que ha tenido un desarrollo muy 
discreto, a la sombra de los sistemas de 
información, pero actualmente ha tenido 
un repunte debido principalmente a los 
avances tecnológicos.
Con la incorporación de los DD, las 
empresas han tratado de minimizar la 
herencia negativa de los sistemas 
transaccionales con que cuentan, aumentar 
el rendimiento, lograr administrar los datos 
en el tiempo y brindar un apoyo efectivo a 
la toma de decisiones, con las ventajas 
competitivas que esto trae consigo.
Mercado de datos:  
definiciones y términos 
básicos
Un DD contiene información detallada y 
datos integrados e históricos comunes a 
toda la organización. Cada departamento 
de una empresa utilizará el DD para sus 
análisis internos y es probable que una 
gran cantidad de datos no sea de su interés, 
ya que solamente querrá trabajar con un 
rango definido. Por otro lado, en la medida 
en que se incrementa el volumen de datos, 
se aumentará el costo de procesamiento.
Corey define un MD o datamart como “bases 
de datos multidimensionales orientadas a 
una materia específica” (Corey, 1997:33). 
González lo define como “una extensión 
natural” del DD (González, 1998:24), 
siendo una base de datos con información 
de interés para un determinado sector de 
la organización, contribuyendo con los 
sistemas de apoyo a la toma de decisiones 
La combinación de n-dimensiones y 
varios niveles o jerarquías por dimensión 
constituyen la esencia del hipercubo.
Poe define un DD como “una base de 
datos de solo lectura donde la información 
extraída de los sistemas operacionales 
corrientes de la empresa es transformada, 
integrada y resumida para luego ser usada 
con efectividad en el soporte de decisiones” 
(Poe, 1998:20). La implementación de 
este tipo de tecnología implicará una 
transformación profunda en la forma de 
manipular los datos. De hecho, el DD por 
sí mismo traerá consigo el consumo de 
gran cantidad de recursos y requerirá de un 
largo tiempo de implementación. 
Sin embargo, su utilización es necesaria 
debido a la necesidad de mejorar la 
administración general de los datos y 
de tener una visión más amplia de la 
información, al disponer de un acceso 
a esta sin importar su ubicación. Con 
el DD se pretende solucionar problemas 
derivados de la dispersión de los datos en 
las diferentes aplicaciones transaccionales, 
muchas veces heterogéneas, y proporcionar 
información para la toma de decisiones.
Según Grill (1996), la idea del DD surge 
inmediatamente después del nacimiento 
del usuario como tal (1970-75). Ahora 
este debe solucionar problemas que antes 
estaban del lado de los programadores y 
analistas, al usar soluciones tecnológicas 
particulares. En la década de los 80 casi 
todo lo relacionado con datos ha sido 
automatizado y se hace prioritario el apoyo 
a la toma de decisiones con base en dichos 
datos almacenados. 
La primera técnica de toma de decisiones se 
dio con la automatización de reportes. Ya 
para los 90 se ha dado una gran evolución 
en cuanto a aplicaciones de usuario final 
y surge una gran cantidad de sistemas 
de información que, a diferencia de los 
sistemas operacionales enfocados en la 
producción, se especializan en el apoyo a 
la toma de decisiones, manipulando datos 
Vol. 24,  N.° 3     201158
La tecnología de DD presenta una forma 
de manejo de datos que difiere del 
modelo relacional tradicional desde las 
restricciones hasta la propia terminología. 
Por tal motivo, se incluyen algunos 
términos básicos para clarificación de 
conceptos.
Datos multidimensionales
Según Weldon (1995), cualquier dato 
en teoría puede ser multidimensional. 
El término se refiere a datos (objetos 
o eventos) que se pueden describir o 
clasificar por dos o más atributos.
Bases de datos multidimensionales
Son repositorios grandes de datos, que 
son descritos de acuerdo con distintas 
perspectivas o dimensiones. Según 
Cox (2000), deben cumplir con cuatro 
características básicas: rapidez, capacidad 
analítica, soporte multiusuario y 
multidimensionalidad.
Análisis multidimensional
Podría definirse como la clasificación de 
la información de acuerdo con categorías. 
Gill (1997) lo define como el análisis 
simultáneo de múltiples dimensiones de 
los datos.
Dimensiones
Son las variables sobre las que se califican 
los datos, pueden ser descriptivas o de 
hechos. Las descriptivas proporcionan 
una explicación de los datos que serán 
de los departamentos con una arquitectura 
fundamentada en la del DD.
Por su parte, Wolff define el mercado de 
datos como
 “un conjunto de hechos y datos 
organizados para soporte decisional 
basados en la necesidad de un área o 
departamento específico. Los datos son 
orientados a satisfacer las necesidades 
particulares de un departamento dado 
teniendo solo sentido para el personal 
de ese departamento y sus datos 
no tienen por qué tener las mismas 
fuentes que los de otro datamart” 
(Wolff, 2000).
El modelo del MD está definido por 
la forma en que el usuario necesita 
ver la información y cómo quiere 
que se le presente. Posee las mismas 
características de un DD pero a un nivel 
más específico, pues contiene diferentes 
combinaciones y selecciones de los datos 
que se encuentran en el DD y ofrece 
una mayor personalización de los datos 
del departamento, permitiendo un manejo 
más eficiente de la información histórica, 
ejecución de procesamiento independiente 
del resto de los departamentos y un costo 
de almacenamiento y procesamiento 
inferior. La figura 2 esquematiza al MD 
dentro del contexto del DD.
Un conjunto de mercado de datos podría 
constituirse en un futuro DD, según la 
posición de Wolff (2000), quien expone 
que la construcción de mercados de datos 
constituye la construcción incremental 
de un DD total. Dicha construcción es 
una aproximación práctica para construir 
un DD a escala empresarial de forma 
evolutiva. Con base en esta posición, se 
podría desarrollar un DD como lo muestra 
la figura 3.
Partiendo de esta base, un MD es una 
excelente plataforma sobre la cual se 
podrá desarrollar un futuro DD. Cada uno 
de los incrementos o MD generados en la 
organización se convertirían en piezas del 
hipercubo general.
Figura 2. Mercado de datos.
Fuente: Elaboración propia.
Julio - Setiembre    2011 59
medio de sus respectivas llaves. La cantidad 
de estas tablas le otorgan la característica de 
multidimensionalidad al modelo.
Rotación
Consiste en cambiar o reacomodar 
la orientación dimensional de una 
presentación en pantalla.
Rool-up y Drill-down
Es posible transformar fácilmente la 
vista dentro de las jerarquías, subiendo 
o bajando niveles. Aprovechándolas es 
posible empezar en un nivel de resumen 
y selectivamente ir obteniendo detalle 
adicional para explicar observaciones 
hechas en el nivel de resumen. Cuando 
se pasa a un nivel más fino, como por 
ejemplo de mes a semana, se conoce con 
drill-down. Por el contrario, el pasar de un 
nivel más fino a otro más global, se conoce 
como roll-up.
Agregaciones
Para Wolff (2000), es la actividad de 
combinar datos desde múltiples tablas 
analizados. En una librería, las dimensiones 
descriptivas detallarían un producto, como 
por ejemplo cuadernos, clasificándolos 
en tamaño, cantidad de hojas, colores, 
pasta dura o suave... La dimensión de 
hechos, por su parte, contendría los valores 
cuantitativos o de medida, como las 
cantidades, las ventas totales y los precios. 
Jerarquías
Thomsen (1997) las describe como una 
estructura de árbol, con una raíz en la parte 
superior y las ramas en la parte inferior. Si 
todas las ramas se encuentran en un mismo 
nivel, se denomina jerarquía simétrica, pero 
si esto no ocurre, se denomina jerarquía 
asimétrica. Por su parte, en Oracle (1996) 
se define como una colección de miembros 
de dimensión con series en cascada de 
relaciones del tipo 1 a muchos, donde 
miembro es un valor de una dimensión. 
Por ejemplo, un miembro de la dimensión 
“tiempo” sería el mes “abril”.
Tabla dimensional
Dentro del esquema estrella, corresponde a las 
tablas que están unidas a la tabla central por 
 
MD 1 MD 2 MD 3 
Incremento 1 Incremento 2 Incremento 3  
Operación y mantenimiento  
Figura 3. Esquema de desarrollo incremental de un DD.
Fuente: Wolf, (2000).
Vol. 24,  N.° 3     201160
Las llaves foráneas en conjunto 
corresponden a la llave primaria 
de dicha tabla central, que, conforme 
a la terminología de base de datos 
multidimensional también es llamada 
tabla de hechos. Según Cortéz (1999), 
cada una de las tablas de dimensión tiene 
una sola llave primaria que corresponde 
exactamente a uno de los componentes 
de la llave primaria compuesta en la tabla 
de hechos.
La tabla de hechos contiene, además de las 
llaves foráneas, una o más medidas (hechos 
numéricos) que ocurren como resultado de 
combinar las dimensiones que definen 
cada registro. Las tablas de dimensiones 
contienen información descriptiva.
En cuanto a las metodologías para el 
desarrollo de un DD, existen varias 
alternativas; sin embargo, se destacan dos 
representativas de tendencias diferentes, 
las cuales se describen a continuación.
Metodología de Poe
Poe presenta una visión general para la 
construcción de un DD por medio de 
una guía de desarrollo, la cual, en primer 
término, plantea una pregunta a primera 
vista muy obvia: ¿porqué se quiere un 
depósito de datos? La respuesta influirá 
en los alcances del desarrollo, afectará la 
calidad de los datos y la arquitectura de los 
sistemas que se elijan para llevarlo a cabo. 
Lo que esta pregunta busca es tener claro 
el objetivo que se persigue.
El segundo punto es entender cómo encaja 
el DD dentro de la empresa. Para cumplir 
este punto, se debe revisar el entorno 
automatizado de la empresa mediante la 
determinación de las redes instaladas de 
que dispone, las herramientas de consulta 
que utiliza, el sistema operacional en 
producción, las plataformas de uso, entre 
otros. Se debe tener presente que el fin 
del DD es proporcionar información 
para la toma de decisiones, por lo cual 
requerirá una nueva forma de pensar con 
respecto a la información. En resumen, 
para formar una unidad de información 
más compleja. Para Madsen (1996), las 
agregaciones consisten en la totalización 
y almacenamiento de datos disponibles 
en tablas de hechos para mejorar las 
búsquedas desarrolladas por el usuario 
final. Estrictamente hablando, las define 
como “una totalización precalculada de 
filas en una tabla de hechos a través de una 
o más jerarquías de dimensión” (Madsen, 
1996:7). 
En una base de datos multidimensional se 
pueden dar tres casos: 1- sin agregaciones, 
cuando el volumen de datos en pequeño, 
2- selectivo, cuando la mayoría de las 
bases de datos de apoyo a las decisiones 
es suficientemente grande para requerir 
alguna agregación selectiva, y 3- completa, 
cuando se requiere una ejecución óptima, 
es decir, que una consulta lea un número 
mínimo de filas para devolver una 
respuesta.
La manera más eficiente para la 
implementación de las agregaciones es la 
construcción de una tabla separada para cada 
agregación creada, lo cual permite hacer y 
remover agregaciones independientes y 
agilizar su mantenimiento.
Modelos y metodologías  
para el desarrollo
Existen varios modelos de implementación 
y metodologías para el desarrollo de un 
DD. La utilización de alguno de ellos 
dependerá de los alcances y limitaciones 
del proyecto que se desee llevar a cabo.
En cuanto a los modelos de implementación, 
existen tres modelos: el de estrella, el de 
constelación de hechos y el esquema copo 
de nieve. El esquema estrella presenta 
el modelo básico de sobre el cual las 
aplicaciones pueden extenderse hacia los 
otros dos modelos. Consiste en una tabla 
central construida con llaves foráneas 
provenientes de un conjunto de tablas 
llamadas dimensiones. 
Julio - Setiembre    2011 61
la compra de bases de datos diseñadas para 
el procesamiento de los datos.
El desarrollo o compra de las herramientas 
Front-End y de acceso a los datos con base 
en las habilidades y necesidades de los 
usuarios es el sétimo punto. La elección de 
la herramienta de consulta puede afectar 
significativamente la aceptación del DD 
por parte de los usuarios hacia los cuales 
va dirigido. Es de vital importancia ser 
realista sobre las necesidades y condiciones 
de los usuarios con respecto a la parte del 
sistema que está en contacto con ellos.
En el octavo y último punto, Poe 
recomienda buscar toda la experiencia 
necesaria, ya que se debe lidiar con 
tecnología nueva y de rápida evolución. A 
fin de contar con experiencia de primera 
mano, es importante tener contactos con 
empresas que ya hayan implantado un DD 
con éxito. Indica que el equipo de expertos 
debe estar compuesto por: 1- analistas de 
datos, diseño y administración de base 
de datos, 2- analistas de negocios con 
experiencia en trabajo con usuarios, 3- 
personas con experiencia en los actuales 
sistemas de información de la empresa, 
4- administradores de proyectos con 
experiencia en el desarrollo de sistemas de 
apoyo a las decisiones y 5- programadores 
y diseñadores de interfaces gráficas de 
usuario (GUI).
Metodología de Corey
Una metodología novedosa la plantea 
Corey (1997) con su ciclo de vida del 
desarrollo de sistemas hacia atrás, o “la 
teoría de la evolución”. Para este autor, 
no se debe realizar una especificación 
de requerimientos, en contraposición con 
muchos autores, pues, según su postura, los 
usuarios finales todavía no conocen cómo 
analizarán los datos. Es necesario que 
usuarios clave vean los datos sin limpiar. 
Se trata de un proceso de crecimiento, 
donde desarrolladores y usuarios 
trabajan conjuntamente determinando 
las herramientas apropiadas tanto para el 
es necesaria la identificación exacta de 
los requerimientos, por medio de una 
revisión integral de la empresa, tanto en 
su infraestructura tecnológica como en las 
necesidades de los usuarios.
En su tercer punto, Poe hace una llamada de 
atención bastante fuerte: según su criterio, 
se debe eliminar la idea de que un DD 
puede implementarse en uno o dos meses, 
subestimando la cantidad de análisis que 
se requiere y la potencial complejidad de 
trabajar con tecnologías nuevas a la vez. 
El tiempo de desarrollo dependerá de los 
recursos disponibles, las plataformas sobre 
las que se trabajará y de la experiencia que 
se tenga.
El cuarto punto se refiere a la responsabilidad 
del equipo desarrollador con respecto a las 
actividades que se deben completar para 
llevar a cabo un proyecto exitoso. Dichas 
actividades son: 1- el análisis de los datos 
y su modelaje, 2- la definición de los 
requerimientos de los datos, 3- hallar y 
correlacionar las fuentes de información 
que se requerirán, 4- reconciliar los 
conflictos existentes entre los datos de 
diferentes fuentes, 5- transformar, integrar 
y calcular, según sean las especificaciones 
del proyecto y 6- diseñar la base de datos 
para acceso de solo lectura.
Un quinto punto se refiere a la educación del 
usuario con respecto a la diferencia entre 
los datos transaccionales y los de soporte 
a la toma de decisiones. En este sentido, 
en la mayoría de las organizaciones que 
manejan datos para la toma de decisiones 
aún no se tiene clara la diferencia entre los 
dos tipos de datos mencionados.
El sexto punto de la metodología 
tiene que ver con el presupuesto para 
el proyecto. Este debe contemplar la 
adquisición de herramientas costosas 
para la automatización de los procesos de 
transformación, extracción y generación 
de código, la contratación de personal 
especializado y experimentado, así como 
Vol. 24,  N.° 3     201162
información desde distintas perspectivas, 
de manera rápida e interactiva.
El OLAP incluye, principalmente, la 
incorporación de grandes cantidades de 
datos dispersos y puede abarcar millones 
de datos con relaciones complejas. Su 
objetivo es contribuir al análisis de estas 
relaciones mediante la facilitación de 
la búsqueda de patrones, tendencias y 
excepciones. Debe soportar procesamiento 
lógico y estadístico de los resultados 
sin que el usuario tenga que programar, 
además de incluir los requerimientos de 
seguridad para la confidencialidad y las 
actualizaciones concurrentes.
El OLAP logra proveer una visión 
multidimensional de los datos por medio 
de la consulta interactiva y el análisis de 
datos. Permite la profundización sobre 
niveles cada vez más detallados o el ascenso 
a distintos niveles de resumen. Ofrece 
opciones de medición de datos numéricos 
mediante múltiples dimensiones, creando 
resúmenes y consolidaciones. Debe 
responder con rapidez a las consultas, de 
forma tal que el proceso de análisis no 
sea interrumpido y la información para la 
toma de decisiones no pierda valor.
desarrollo como para la puesta en marcha 
del DD.
Para este autor, lo primero que se debe 
hacer es crear el equipo del proyecto, el 
cual debe estar en un continuo diálogo 
con el usuario, a fin de identificar sus 
preferencias acerca de las formas en que 
quiere representar los datos, tal y como se 
muestra en la figura 4.
MD y formas de procesamiento 
analítico en línea: MOLAP,  
ROLAP, HOLAP
Los DD y los MD almacenan información 
para su posterior búsqueda y análisis, a 
diferencia de los sistemas transaccionales, 
que la almacenan para operación y control. 
Es por ello que se requiere de la tecnología 
de OLAP encargada de realizar dicho 
análisis.
Las herramientas OLAP permiten el 
análisis de datos en forma interactiva. 
Cox lo define como la “tecnología que 
permite que la información sea analizada 
de forma rápida, amigable e interactiva 
y que facilite la construcción de modelos 
cuantitativos complejos” (Cox, 2000:30).
Es una característica del software que permite 
al usuario organizar, visualizar y resumir 
Figura 4. Equipo de proyecto de DD.
Julio - Setiembre    2011 63
forma lógica en arreglos matriciales con 
estructura multidimensional.
El sistema MOLAP utiliza una arquitectura 
de dos niveles: la base de datos 
multidimensional y el motor analítico (ver 
figura 5).
•	 La	 base	 de	 datos	 multidimensional	
es la encargada del manejo, acceso y 
obtención del dato. 
•	 El	nivel	de	aplicación	es	el	responsable	
de la ejecución de los requerimientos 
OLAP. El nivel de presentación 
se integra con el de aplicación y 
proporciona una interfaz mediante la 
cual los usuarios finales visualizan 
los análisis OLAP. Una arquitectura 
cliente/servidor permite a varios 
usuarios acceder a la misma base de 
datos multidimensional.
Aquí los datos son redundantes, por lo 
que se requiere mucha capacidad de 
almacenamiento y puede contener totales 
precalculados. La estructura permite la 
reservación de espacio para todas las 
combinaciones de los posibles valores de las 
dimensiones de cada una de las variables, 
incluyendo los valores de dimensión que 
representan acumulados. Es decir, un 
Al estar vinculadas las distintas dimensiones, 
una instancia de su intersección produce 
una celda, la cual contiene los valores de 
medida intersecados de las dimensiones 
involucradas. Una celda es un punto que 
corresponde a la intersección definida por 
el valor de cada una de las dimensiones del 
vector multidimensional.
En general, estos sistemas OLAP deben:
•	 Soportar	requerimientos	complejos	de	
análisis. 
•	 Analizar	 datos	 desde	 diferentes	
perspectivas. 
•	 Soportar	análisis	complejos	contra	un	
volumen ingente de datos.
Los términos MOLAP, ROLAP y HOLAP, 
se refieren a las formas de almacenamiento 
de los datos. Ahora bien, la decisión se debe 
tomar dependiendo de si se quiere que el 
almacenamiento refleje los análisis que se 
harán (multidimensional), o los datos se 
almacenarán sin tomar en cuenta para qué 
serán utilizados (de forma relacional).
El primero de los casos se denomina MOLAP 
(Multidimensional On-Line Analytical 
Processing) y los datos se almacenan en 
Figura 5. Multidimensional On-Line Analytical Processing (MOLAP).
64 Vol. 24,  N.° 3     2011
niveles: la base de datos relacional maneja 
los requerimientos de almacenamiento de 
datos, y el motor ROLAP proporciona la 
funcionalidad analítica (ver figura 6).
•	 El	 nivel	 de	 base	 de	 datos	 usa	 bases	
de datos relacionales para el manejo, 
acceso y obtención de los datos. 
•	 El	 nivel	 de	 aplicación	 es	 el	
motor que ejecuta las consultas 
multidimensionales de los usuarios. 
•	 El	 motor	 ROLAP	 se	 integra	 con	
niveles de presentación, a través de 
los cuales los usuarios realizan los 
análisis OLAP. 
En ROLAP, al contener solo las 
combinaciones de valores de dimensión 
que representan detalle, es decir, al no 
haber redundancia, el archivo de base de 
datos es pequeño. Los procesos batch de 
carga son rápidos (ya que no se requiere 
agregación); sin embargo, las consultas 
pueden ser muy lentas, por lo que se aplica 
sistema MOLAP contiene precalculados 
(almacenados) los resultados de todas las 
posibles consultas a la base de datos.
MOLAP consigue consultas muy 
rápidas a costa de mayores necesidades 
de almacenamiento, retardos en las 
modificaciones (que no deberían producirse 
salvo excepcionalmente), y largos procesos 
batch de carga y cálculo de acumulados.
El segundo caso denominado ROLAP 
(Relational On-Line Analytical 
Processing) es la arquitectura de base 
de datos multidimensional en la que la 
información se encuentra almacenada 
en una base de datos relacional, la cual 
tiene forma de estrella. En ROLAP, en 
principio, la base de datos solo almacena 
información relativa a los datos en detalle, 
evitando acumulados (redundancia). Aquí 
se crea una capa semántica de metadatos 
en una base de datos relacional, que 
permite presentar los datos en término de 
dimensiones. Su arquitectura es de tres 
Figura 6. Esquema del procesamiento analítico en línea relacional (ROLAP)
Fuente: http://www.csae.map.es/csi/silice/DW2251.html
Julio - Setiembre    2011 65
por los usuarios meta. La creación de 
OLAP constituye todo un reto para los 
desarrolladores, debido a la complejidad 
que representa. Un buen programa de 
consulta podrá explotar las capacidades 
de los MD y constituye la base para la 
explotación eficiente de la información.
Bibliografía
“Construindo um hipercubo”, consulta del 10 de 
agosto del 2004, http://inga.ufu.br/~silvestr/
artigos/bigbang/11/
Corey, Michael; Abbey, Michael. (1997) Oracle 
Data Warehousing: guía práctica para 
analizar, construir e implantar con éxito un 
sistema data warehouse. Madrid: McGraw-
Hill.
Cortez Araniva, Sonia Elizabeth. (1999) 
Desarrollo de un Modelo para el Diseño de 
Bases de Datos Multidimensionales. Cartago: 
Instituto Tecnológico de Costa Rica.
Cox Alvarado, Alexander. (2000) Propuesta 
de un álgebra para modelar bases de 
datos multidimensionales. Cartago, Instituto 
Tecnológico de Costa Rica.
Chinchilla Arley, Ricardo; Vargas Murillo, José 
Luis. (2002) Prototipo de mercado de datos 
para la División de Control, y Fiscalización de 
la Dirección General de Aduanas. Cartago: 
Instituto Tecnológico de Costa Rica.
Devlin, Barry. (1996) Data warehouse: from 
architecture to implementation. New York: 
Addison-Wesley.
Ebel, Doug. (1998) Data Warehousing: start to 
start. NCR Business Solution Architect. S.l.: 
NCR Corporation. http://www.sdw.bull.com/
ncr/dwstart.pdf
Gill, H.S; Rao, P.C. (1997) Data Warehousing: 
la integración de información para la mejor 
toma de decisiones. Prentice-Hall.
González Alvarado, Carlos. (1996) Sistemas 
de bases de datos. Cartago: Editorial 
Tecnológica de Costa Rica.
González Alvarado, Carlos. (1998) Depósito 
de datos. Cartago, Instituto Tecnológico de 
Costa Rica.
González Alvarado, Carlos. (1998) 
Procesamiento analítico en línea. Cartago, 
Instituto Tecnológico de Costa Rica.
la solución de tener al menos algunas 
consultas precalculadas.
Por último, el HOLAP se refiere al sistema 
mixto o híbrido, donde la configuración 
típica es un motor multidimensional basado 
en una tecnología de almacenamiento 
relacional. Gill (1996) dice que en esta 
configuración las consultas e información 
frecuentes o de cómputo intensivo se 
calculan a priori y se almacenan en el 
depósito multidimensional.
Conclusiones
La tecnología de DD conlleva una 
nueva forma de pensar por parte de los 
desarrolladores, acostumbrados a trabajar 
sobre sistemas relacionales transaccionales. 
La utilización de modelos estrella, el manejo 
de redundancia y la falta de normalización 
muchas veces chocan con los esquemas de 
desarrollo de bases de datos y requieren de 
tiempo para ser asimilados. Pero para el 
manejo de bases de datos con información 
masiva para la toma de decisiones no es 
posible con los sistemas convencionales 
de administración transaccional.
Los DD y los MD vienen a llenar el vacío 
existente en cuanto a la utilización de esa 
valiosa veta de conocimientos, almacenada 
en los datos históricos.
Existen muchas metodologías de desarrollo 
de los MD; sin embargo, están enfocados 
en el modelo tradicional de cascada o 
espiral. Por el contrario, las metodologías 
expuestas en este artículo, se enfocan en 
brindar consejos prácticos, en el caso de 
Poe, y en escuchar siempre al usuario 
como elemento esencial para el éxito del 
proyecto. Sin embargo, la utilización de 
uno u otro dependerá siempre del tipo 
de proyecto que se emprenderá y las 
capacidades económicas y técnicas con 
que se cuenten.
Pero un MD no podría funcionar como 
tal sin un OLAP eficiente, capaz de 
procesar las consultas ad-hoc requeridas 
Vol. 24,  N.° 3     201166
Weldon, Jay; Weldon, Louise. (1995) 
Managing multidimensional data. Database 
programming and design.
Thomsen, Erik. (1997) OLAP solution: building 
multidimensional information system. New 
York: John Wiley & Sons.
Wolff, Carmen. [2000] Implementando 
un DataWarehouse. Revista Ingeniería 
Informática: revista electrónica del DIICC. 
Edición 5, año 3.
Madsen, Mark. (1996) Warehouse Design in 
the Aggregate. Database programming and 
design.
Oracle Corporation. (1996) Design a database 
for OLAP. March/April. http://www.oramag.
com/oracle/96-mar/26meth.html
Poe, Vidette. (1998) Building a data warehouse 
for decision support. New Jersey: Prentice-Hall.
Simon, Alan. (1996) Beyond the warehouse. 
Database programming desing.