• 0
      1. Tu carrito está vacío.
    • artículo(s)0,00

¿Qué es un datawarehouse y un data lake?

mayo 7, 2020

Data warehouse, ¿qué es?

Un data warehouse o almacén de datos, según Bill Inmon, es una colección de datos que se encuentra dentro de una determinada área donde los datos almacenados deben guardarse de manera segura, fiable, fácil de recuperar y administrar y se caracteriza por ser no volátiles, integrados, temáticos e históricos. 

  • No volátil: la información es permanente, es decir, el almacén de información de un datawarehouse existe para ser leído pero no modificado. 
  • Integrado: los datos guardados deben estar integrados a través de una estructura consistente, por lo que las inconsistencias existentes entre distintos sistemas operacionales deben ser eliminadas. Además, la información se debe estructurar en diferentes niveles de detalle en función de las necesidades de los usuarios. 
  • Temático: los datos deben encontrarse organizados por temáticas para facilitar su acceso y entendimiento a los usuarios finales.
  • Históricos: en sistemas operacionales, los datos reflejan siempre la información del presente. En cambio, en los sistemas datawarehouse, los datos toman distintos valores en función de una variable en el tiempo. Esto permite llevar a cabo comparaciones y analizar tendencias.

Consideraciones de un datawarehouse

En el funcionamiento de los datawarehouse, es muy importante tener en mente la separación de los datos utilizados en operaciones diarias de los datos utilizados en el datawarehouse para propósitos como la ayuda en la toma de decisiones ya que al tener objetivos finales, podrían generar confusión. Además, se deben tener descripciones globales y análisis comprensivos de toda la organización el los datawarehouse. 

Data lake, ¿qué es?

Un data lake se define como un repositorio de almacenamiento centralizado que contiene big data de varias fuentes en un tipo de formato conocido como “en crudo” o “raw”. Esto significa que no ha sido procesado. Este tipo de repositorio permite almacenar tanto datos estructurados, semiestructurados como no estructurados, lo que hace que los datos puedan ser conservados en un formato más flexible para su uso futuro. 

Ventaja del uso de un data lake

La principal ventaja de un data lake es que funciona a través de un tipo de estructura denominada schema-on-read o también llamado esquema contra escritura. Dicho concepto significa que los datos no deben seguir un esquema predefinido para ser guardados. Esto hace que se ahorre una gran cantidad de tiempo dedicada a la definición de la estructura. 

Principales diferencias entre un datawarehouse y un data lake

Las principales diferencias entre un datawarehouse y un data lake se encuentran en que un data lake no tiene una estructura predefinida mientras que un datawarehouse sí. Además, dado que en un data lake los datos no se encuentran organizados en un formato simplificado antes de ser almacenados, requieren de expertos que comprendan perfectamente los distintos tipos de datos junto con sus relaciones para poder ser leídos. En cambio, un datawarehouse es fácilmente accesible tanto para técnicos como para usuarios finales gracias a su esquema bien definido. 

Artículos y formaciones relacionadas:

Los árboles de decisión

Tendencias en Ecommerce para 2020

Data Literacy: Qué es la alfabetización de datos

 

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Get in Touch
newsletter

Suscríbete al newsletter sobre ecommerce y transformación digital

Tendencias, consejos
y lo último en tecnologías
para vender online.

Además, te regalamos el primer capítulo del libro
“Conecta tu negocio. La transformación digital de los canales de venta”

newsletter
Get in Touch
Contact
conecta-logo-blanco-retina

Producto

Info

Soporte

Conecta tu Negocio.

Branding

En HUB 360 encontrarás toda la tecnología y servicios para tu estrategia de comercio electrónico.

Ecommerce

Integra tu ecommerce con tu ERP sistema de gestión y todos tus canales para vender online.

Analytics

Los cuadros de mando de BI Studio son tu herramienta de Business Intelligence de última generación.

922-014-341

Proyecto Cofinanciado por el Fondo Europeo de Desarrollo Regional. Beneficiario: Conecta Software Soluciones SLU. Nº expediente: PI2019010001. Inversión Aprobada: 6.444,80 €. Comienzo: 17/10/2018. Finalización: 16/10/2019. El presente proyecto tiene como objetivo el desarrollo de un software conector que automatiza la generación de catálogos virtuales para que la empresa pueda ofrecer en su Tienda online productos con una amplia descripción y con imágenes que hagan la experiencia del usuario más rica y completa.

© 2020 TODOS LOS DERECHOS RESERVADOS. CONECTA SOFTWARE

Contact