Servicios de Big Data y Bases de Datos en Azure

Última actualización: 21/05/2023

En este artículo continúo la serie de servicios de la nube de Microsoft Azure. Vamos a introducir los servicios de Bases de Datos y Big Data más populares en Azure. Sigue leyendo para aprender cuáles son estos servicios y cómo pueden ayudar a tu organización a implementar una estrategia de datos correcta en la nube.

Big Data y Bases de Datos en Azure

Servicios de Bases de Datos

Azure Cosmos DB

Cosmos DB es una base de datos en Azure totalmente gestionada. Nos permite almacenar datos con y sin esquema definido y realizar consultas en SQL.

Está distribuida geográficamente y es escalable. Proporciona APIs para conectar con múltiples sistemas y de consulta, por lo que es compatible con otras bases de datos muy populares como MongoDB, Cassandra, Tables y Gremlin.

Azure SQL Database

Es una base de datos relacional basada en Microsoft SQL Server con un modelo PaaS. Puede gestionar de forma transparente las actualizaciones y las copias de seguridad.

Azure SQL Database tiene una disponibilidad del 99.99%. Además de datos relacionales, también podemos almacenar en formato JSON, XML y grafos.

También existe otro servicio similar a Azure SQL Database llamado Azure SQL Managed Instance. Este servicio usa el motor Microsoft SQL Server con un modelo PaaS totalmente administrado. Podemos explorar las diferencias en detalle en el siguiente enlace:

https://docs.microsoft.com/es-es/azure/azure-sql/database/features-comparison

Bases de Datos Relacionales

Azure También nos proporciona servicios de bases de datos relacionales muy conocidas. Los más populares son los siguientes:

  • MySQL: Usa el motor de bases de datos MySQL Community Edition.
  • PostgreSQL: Se basa en la versión de PostgreSQL open source. Permite realizar consultas distribuidas con Citus.

Servicios de Big Data

Entre los servicios de azure que integran herramientas de análisis optimizadas para Big Data se encuentran los siguientes:

Databricks logo
  • Azure Synapse Analytics: Nos permite desplegar recursos con o sin servidores para realizar anlítica SQL y con Apache Spark a modo de data warehouse.
  • HDInsight: Este servicio nos permite desplegar cargas Big Data con un stack de tecnologías open source como Hadoop, Spark, HBase o Kafka.
  • Azure Databricks: Plataforma basada en Apache Spark que implementa notebooks colaborativos en los que desarrollar y ejecutar aplicaciones.
  • Data Lake Analytics: Plataforma de analítica que nos permite desplegar trabajos de transformación de datos sin servidores.

Servicios de Almacenamiento

Azure Storage es el servicio de Azure que nos permite almacenar datos sin límites de espacio. Para usar Azure Storage debemos crear una cuenta de almacenamiento. Los clientes pueden acceder para realizar operaciones de lectura y de escritura usando HTTP y HTTPs.

Para proporcionar discos a las máquinas virtuales Azure usa Azure Disk Storage. Estos discos se conectan a las máquinas virtuales y almacenan los datos de forma persistente. Pueden ser SSD o HDD de distintos tamaños y rendimientos.

Otro servicio de almacenamiento de datos es Azure Blob Storage. Se trata de almacenamiento de objetos no estructurado. Podemos usar Blob Storage para almacenar todo tipo de ficheros de vídeo, imágenes, documentos o copias de seguridad. Además, se puede elegir el nivel de acceso a los datos, y de esta forma optimizar los costes del servicio. Existen 3 niveles: frecuente, esporádico y archivo en función de la frecuencia de acceso y la latencia.

Si necesitamos almacenamiento de bloques, podemos usar el servicio Azure Files. Este servicio de almacenamiento de datos nos proporciona un espacio compartido accesible en la nube. Este directorio remoto se puede montar en nuestras máquinas y acceder simultáneamente desde varias de ellas.

Estos dos servicios nos proporcionan URIs únicas para acceder al contenido fácilmente a través de internet.

Puedes encontrar las diferencias entre almacenamiento de objetos y almacenamiento de bloques en este artículo.

Sigue Aprendiendo y Cursos Recomendados

Acelera tu aprendizaje en bases de datos en Azure con estos cursos recomendados de Udemy que te prepararán para las certificaciones de Azure como la DP-900 y de ingeniería de datos:

Curso oficial de preparación al examen Microsoft Azure Data Fundamentals DP-900

Si quieres prepararte el examen de certificación de Azure Data Fundamentals (DP-900) este es tu curso. Lo ofrece Microsoft en la plataforma Coursera y te enseñará los conceptos que necesitarás para aprobar la certificación en 4 módulos: Conceptos básicos de datos en Azure, Microsoft Azure SQL, Azure Cosmos DB, Analítica en Data Warehouses en Azure.

Tecnologías de ingeniería de datos de Azure para principiantes

Tecnologías de ingeniería de datos de Azure para principiantes

Este curso te enseñará desde cero las tecnologías de ingeniería de datos disponibles en Azure como Microsoft Azure SQL Database, Data Lake, Data Factory, Synapse Analytics, Cosmos DB, Databricks y HDInsight. Una buena base para certificaciones como DP-200 y DP-203.

También puedes seguir aprendiendo sobre tecnologías cloud y Microsoft Azure con estos artículos relacionados:

Preguntas Frecuentes Bases de Datos en Azure: FAQ

¿Cuál es la diferencia entre Azure SQL Database y Cosmos DB?

Cosmos DB es una base de datos replicada geográficamente que acepta varios modelos de datos con consistencia eventual. Por otro lado, Azure SQL Database es una base de datos relacional que no reemplaza a Cosmos DB ya que los casos de uso son diferentes.

¿Azure Disk Storage puede almacenar discos de máquinas virtuales?

Azure Disk Storage es el servicio de Azure que nos permite almacenar los discos de las máquinas virtuales. Sin embargo, este servicio no se puede usar sin las máquinas virtuales.

¿Cómo elegir el nivel de acceso adecuado en Azure Blob Storage?

Azure Blob Storage permite establecer tres niveles de acceso o de temperatura de los datos. El nivel frecuente almacenará datos que se accedan con frecuencia. El nivel esporádico es para datos a los que se accede con menos frecuencia almacenados al menos durante 30 días y el nivel de archivo hasta al menos 180 días con gran latencia de acceso.


A continuación, el vídeo-resumen. ¡No te lo pierdas!


Deja una respuesta