Data Lake: Definición y tecnologías
Data Lakes: Características y tecnologías

Data Lake: Definición y tecnologías

En esta entrada aprenderemos qué es un Data Lake y sus diferencias con Data Silos y Data Warehouses. Además, exploraremos las tecnologías que existen para construir data lakes modernos

Sin comentarios
Databricks: Introducción a Spark en la nube
Que es Databricks

Databricks: Introducción a Spark en la nube

En esta entrada vamos a entender en qué consiste Databricks. Cómo nos puede ayudar esta solución cloud en nuestras necesidades de procesamiento y analítica Big Data y cuáles son sus particularidades para poder tomar decisiones con criterio.

Sin comentarios
Introducción a Amazon S3
Introducción a AWS S3 Simple Storage Service

Introducción a Amazon S3

¿Quieres saber qué es el servicio S3 de Amazon? En este post aprenderemos en qué consiste, cómo funciona a alto nivel y por qué es una excelente opción para centralizar datos en la nube. Además, lo comparamos con HDFS.

Sin comentarios
¿Qué es HDFS? Introducción
Qué es HDFS Apache Hadoop

¿Qué es HDFS? Introducción

En esta entrada explicamos en qué consiste HDFS, el sistema de ficheros distribuido de Hadoop. Aprende cuales son sus aplicaciones y funcionamiento para almacenar grandes cantidades de datos.

Sin comentarios
¿Qué es Apache Airflow? Introducción
¿Qué es Apache Airflow? Introducción

¿Qué es Apache Airflow? Introducción

Aprende qué es Apache Airflow, una de las herramientas de automatización de flujos de trabajo más potentes que existen para gestionar cargas Big Data. En el artículo explicamos sus características y evolución

2 comentarios