Un Datawarehouse es una base de datos corporativa que
se caracteriza por integrar y depurar información de una o más fuentes
distintas, para luego procesarla permitiendo su análisis desde infinidad
de pespectivas y con grandes velocidades de respuesta. La creación de
un datawarehouse representa en la mayoría de las ocasiones el primer
paso, desde el punto de vista técnico, para implantar una solución
completa y fiable de Business Intelligence.
La ventaja principal de este tipo de bases de datos radica en las
estructuras en las que se almacena la información (modelos de tablas en
estrella, en copo de nieve, cubos relacionales... etc). Este tipo de
persistencia de la información es homogénea y fiable, y permite la
consulta y el tratamiento jerarquizado de la misma (siempre en un
entorno diferente a los sistemas operacionales).
El término Datawarehouse fue acuñado por primera vez por Bill Inmon, y se traduce literalmente como almacén de datos.
No obstante, y como cabe suponer, es mucho más que eso. Según definió
el propio Bill Inmon, un datawarehouse se caracteriza por ser:
Integrado: los datos almacenados en el datawarehouse
deben integrarse en una estructura consistente, por lo que las
inconsistencias existentes entre los diversos sistemas operacionales
deben ser eliminadas. La información suele estructurarse también en
distintos niveles de detalle para adecuarse a las distintas necesidades
de los usuarios.
Temático: sólo los datos necesarios para el proceso de
generación del conocimiento del negocio se integran desde el entorno
operacional. Los datos se organizan por temas para facilitar su acceso y
entendimiento por parte de los usuarios finales. Por ejemplo, todos los
datos sobre clientes pueden ser consolidados en una única tabla del
datawarehouse. De esta forma, las peticiones de información sobre
clientes serán más fáciles de responder dado que toda la información
reside en el mismo lugar.
Histórico: el tiempo es parte implícita de la
información contenida en un datawarehouse. En los sistemas
operacionales, los datos siempre reflejan el estado de la actividad del
negocio en el momento presente. Por el contrario, la información
almacenada en el datawarehouse sirve, entre otras cosas, para realizar
análisis de tendencias. Por lo tanto, el datawarehouse se carga con los
distintos valores que toma una variable en el tiempo para permitir
comparaciones.
No volátil: el almacén de información de un
datawarehouse existe para ser leído, pero no modificado. La información
es por tanto permanente, significando la actualización del datawarehouse
la incorporación de los últimos valores que tomaron las distintas
variables contenidas en él sin ningún tipo de acción sobre lo que ya
existía.
Otra característica del datawarehouse es que contiene metadatos, es
decir, datos sobre los datos. Los metadatos permiten saber la
procedencia de la información, su periodicidad de refresco, su
fiabilidad, forma de cálculo... etc.
Los metadatos serán los que permiten simplificar y automatizar la
obtención de la información desde los sistemas operacionales a los
sistemas informacionales.
Los objetivos que deben cumplir los metadatos, según el colectivo al que va dirigido, son:
Dar soporte al usuario final, ayudándole a acceder al
datawarehouse con su propio lenguaje de negocio, indicando qué
información hay y qué significado tiene. Ayudar a construir consultas,
informes y análisis, mediante herramientas de Business Intelligence como
DSS, EIS o CMI.
Dar soporte a los responsables técnicos del datawarehouse en aspectos de auditoría,
gestión de la información histórica, administración del datawarehouse,
elaboración de programas de extracción de la información, especificación
de las interfaces para la realimentación a los sistemas operacionales
de los resultados obtenidos... etc.
Por último, destacar que para comprender íntegramente el concepto de
datawarehouse, es importante entender cual es el proceso de construcción
del mismo, denominado ETL (Extracción, Transformación y Carga), a
partir de los sistemas operaciones de una compañía:
Extracción: obtención de información de las distintas fuentes tanto internas como externas.
Transformación: filtrado, limpieza, depuración, homogeneización y agrupación de la información.
Carga: organización y actualización de los datos y los metadatos en la base de datos.
Una de las claves del éxito en la construcción de un datawarehouse es el
desarrollo de forma gradual, seleccionando a un departamento usuario
como piloto y expandiendo progresivamente el almacén de datos a los
demás usuarios. Por ello es importante elegir este usuario inicial o
piloto, siendo importante que sea un departamento con pocos usuarios, en
el que la necesidad de este tipo de sistemas es muy alta y se puedan
obtener y medir resultados a corto plazo.
Principales aportaciones de un datawarehouse

Proporciona una herramienta para la toma de decisiones en cualquier
área funcional, basándose en información integrada y global del negocio.

Facilita la aplicación de técnicas estadísticas de análisis y
modelización para encontrar relaciones ocultas entre los datos del
almacén; obteniendo un valor añadido para el negocio de dicha
información.

Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios.

Simplifica dentro de la empresa la implantación de sistemas de gestión integral de la relación con el cliente.

Supone una optimización tecnológica y económica en entornos de Centro
de Información, estadística o de generación de informes con retornos de
la inversión espectaculares.
No hay comentarios:
Publicar un comentario