Guía de Servicios de Datos en Cloud (Azure, AWS y GCP)

  • Tiempo de lectura:6 minutos de lectura
  • Autor de la entrada:
  • Última modificación de la entrada:21/10/2024

El cloud computing ha habilitado soluciones de datos escalables y más rentables para su uso en analítica. Este artículo resume en una tabla los Servicios de datos Cloud de los proveedores más usados en la industria (Azure, AWS y GCP).

Guía de servicios de datos en Cloud

Muchos de los servicios de datos en la nube son evoluciones de productos open source, en los que están basados. Por ejemplo, AWS Kinesis está basado en los principios de Apache Kafka. Otros servicios imitan a otros productos open source en funcionalidades, por ejemplo Step Functions con Apache Airflow.

Para comprender mejor los servicios que ofrecen los proveedores cloud, podemos clasificarlos en varios grupos en función de sus características:

  • Ingesta
  • Procesamiento
  • Almacenamiento
  • Análisis

Principales Servicios de Datos en Cloud

En la siguiente tabla se muestran estos grupos de servicios, con la categoría a la que pertenecen, las alternativas en los principales proveedores de servicios cloud (Azure, AWS y GCP) y su opción Open Source.

GrupoCategoríaAzureAWSGCPOpen Source
IngestaETLData FactoryGlueDataprepApache NiFi
IngestaMessage Queue
Streaming
Event HubsKinesisPub/SubApache Kafka
IngestaSchedulingLogic Apps
Batch
Stepfunctions
Cloudwatch
EventBridge
Cloud Scheduler
Cloud Batch
Cloud Workflows
Cloud Composer
Apache Airflow
ProcesamientoProcesamientoFunctions
Data Factory
Databricks
Lambda
EMR
Glue
Databricks
Cloud Functions
DataProc
DataFlow
Apache Flink
Apache Spark
Apache Hadoop
AlmacenamientoRelacionalAzure SQL DBRDSCloudSQL
BigTable
MySQL
MariaDB
PostgreSQL
AlmacenamientoNoSQLCosmosDBDynamoDB
DocumentDB
Datastore
Firestore
Elasticsearch
Apache Cassandra
MongoDB
AlmacenamientoOLAP
Data Warehouse
Synapse Analytics
Snowflake
Redshift
Athena
Snowflake
BigQuery
Snowflake
Apache Druid
Apache Hive
Presto
AlmacenamientoObjetosBlob StorageS3Cloud StorageMinio
Ceph
AlmacenamientoCacheCache for RedisElastiCacheMemorystoreMemcached
Redis
AlmacenamientoGrafoCosmosDBNeptuneVertex AINeo4j
AnálisisMachine LearningAzure MLSageMakerCloud datalab
Vertex AI
Tensorflow
Keras
PyTorch
AnálisisBusiness IntelligencePower BIQuicksightData Studio
Looker
Grafana
Apache Superset

Aprende más sobre servicios de datos cloud y especialízate en Ingeniero de Datos en cloud con mis guías de certificación:

Deja una respuesta