Data Warehouse

Data Warehouse

¿Qué es un Data Warehouse?


Un Data Warehouse es un lugar donde se almacenan los datos con fines de archivamiento, análisis de efectos y seguridad. Por lo general, un Data Warehouse es un único equipo o varios ordenadores (servidores) atados juntos para crear un sistema gigante de computadoras.


Los datos pueden consistir en datos primarios o datos con formato y pueden ser de diversos tipos de temas, incluyendo una organización de ventas, los salarios, los datos operativos, resúmenes de los datos incluidos, los informes, copias de los datos, los datos de los recursos humanos, los datos de los inventarios, los datos externos y para proporcionar simulaciones, análisis, etc.


Además de ser una Depósito (Warehouse) para almacenar grandes cantidades de datos, poseen sistemas que facilitan el acceso a los datos y su utilización en operaciones de día a día.

Un Data Warehouse es importante ya que sirve como un sistema de apoyo a las decisiones. Además sirve para organizar la utilización de los datos para llegar a los hechos, las tendencias o las relaciones que pueden ayudarles a tomar decisiones efectivas o crear estrategias eficaces para lograr sus objetivos.


Hay muchos modelos diferentes de Data Warehouse incluyendo el “procesamiento de transacciones en línea” que es un modelo construido para la velocidad y la facilidad de uso. Otro tipo de Data Warehouse se llama “procesamiento analítico en línea”, este tipo de Data Warehouse es más difícil de utilizar y agrega un paso adicional en el análisis de los datos.

Por lo general, requiere más medidas que hacen más lento el proceso de datos y mucho más difícil el analizar algunas consultas.


Además de este modelo, uno de los modelos más comunes de almacenamiento de datos incluye un Data Warehouse orientado al sujeto, variante en el tiempo, no volátil y integrado. Orientado al sujeto se refiere a que los datos sean unidos y organizados por las relaciones.


Variante en el tiempo significa que cualquier dato que se cambia en el Data Warehouse puede ser rastreado. Por lo general, todos los cambios de datos son marcados con un tiempo y con una fecha antes y después, de modo que se pueden mostrar los cambios a lo largo de un período de tiempo.


No volátil, que los datos nunca sean eliminados o borrados. Esta es una gran manera de proteger sus datos más importantes. Debido a que estos datos se retienen, pueden seguir siendo utilizados en un análisis posterior.

Por último, los datos están integrados, lo que significa que en un Data Warehouse, los datos son utilizados por toda la organización en lugar de sólo un departamento.

Además del término almacenamiento de datos, un término que se utiliza con frecuencia es una base de “data mart”, data mart son más pequeños y menos integrados almacenes de datos. Podrían ser sólo una base de datos sobre los recursos humanos o de los registros de datos de ventas en una sola división.


Con las mejoras en la tecnología, así como las innovaciones en el uso de técnicas de almacenamiento de datos, los Data Warehouse han cambiado a partir de bases de datos operacionales sin conexión a una línea integrada de almacenamiento de datos.

Tipos de Data Warehouse


Data Warehouse operacionales fuera de línea son almacenes de datos donde los datos son copiados y pegados por lo general en tiempo real. Por lo general, son la más simples y menos técnicos de los Data Warehouse.


Data Warehouse fuera de línea son almacenes de datos que se actualizan con frecuencia, ya sea diaria, semanal o mensual y donde los datos se almacenan en una estructura integrada, donde los demás puedan acceder a ella y llevar a cabo la presentación de informes.


Data Warehouse en Tiempo Real son almacenes de datos en los que se actualiza cada momento a medida que llegan nuevos datos. Por ejemplo, un Data Warehouse en tiempo real podría incluir datos de un sistema de Punto de Venta y se actualiza con cada venta que se haga.


Data Warehouse integrados son almacenes de datos que pueden ser utilizados por otros sistemas. Algunos Data Warehouse integrados son utilizados por otros Data Warehouse, lo que les permite acceder a ellos para procesar los informes, así como buscar los datos actuales.

Entonces, ¿por qué debería usted o su organización utilizar un Data Warehouse? Estos son algunos de los pros y los contras de utilizar este tipo de estructura de datos.


La razón numero uno, por la que deberían utilizar un Data Warehouse es para que los empleados o los usuarios finales puedan acceder a los datos para generar informes, realizar análisis y tomar decisiones. La utilización de los datos en un Data Warehouse puede ayudarle a localizar las tendencias, y lo ayudará a entender más sobre el medio ambiente que su negocio opera.


Los Data Warehouse también refuerzan la coherencia de los datos y le permite comprobar una y otra vez para determinar la relevancia de la información. Debido a que la mayoría de los Data Warehouse están integrados, se puede extraer datos de diferentes áreas de su negocio, por ejemplo, recursos humanos, finanzas, informática, contabilidad, etc.

Si bien hay muchas razones por las cuales se debe tener un Data Warehouse, cabe señalar que hay algunos aspectos negativos de tener un Data Warehouse como el hecho de que consumen mucho tiempo y recursos al crearlos y mantenerlos en funcionamiento.


También podría tener un problema con que los sistemas actuales fueran incompatibles con él. También es importante considerar los requerimientos futuros y las actualizaciones de software, que tienen que ser compatibles con los anteriores.


Por último, la seguridad puede ser una gran preocupación, especialmente si sus datos son accesibles a través de una red abierta como Internet. Usted no desea que sus datos sean vistos por su competidor o peor, hackeados y destruidos.