Servicios de Big Data y Bases de Datos en Azure

Última actualización: 22/02/2021

En este artículo continúo la serie de servicios de la nube de Microsoft Azure. Vamos a introducir los servicios de Bases de Datos y Big Data más populares en Azure. Sigue leyendo para aprender cuáles son estos servicios y cómo pueden ayudar a tu organización a implementar una estrategia de datos correcta en la nube.

Big Data y Bases de Datos en Azure

Servicios de Bases de Datos

Azure Cosmos DB

Cosmos DB es una base de datos en Azure totalmente gestionada. Nos permite almacenar datos con y sin esquema definido y Permite realizar consultas en SQL.

Está distribuida geográficamente y es escalable. Proporciona APIs para conectar con múltiples sistemas y de consulta, por lo que es compatible con otras bases de datos muy populares como MongoDB, Cassandra, Tables y Gremlin.

Azure SQL Database

Es una base de datos relacional basada en Microsoft SQL Server con un modelo PaaS. Puede gestionar de forma transparente las actualizaciones y las copias de seguridad.

Azure SQL Database tiene una disponibilidad del 99.99%. Además de datos relacionales, también podemos almacenar en formato JSON, XML y grafos.

También existe otro servicio similar a Azure SQL Database llamado Azure SQL Managed Instance. Este servicio usa el motor Microsoft SQL Server con un modelo PaaS totalmente administrado. Podemos explorar las diferencias en detalle en el siguiente enlace:

https://docs.microsoft.com/es-es/azure/azure-sql/database/features-comparison

Bases de Datos Relacionales

Azure También nos proporciona servicios de bases de datos relacionales muy conocidas. Los más populares son los siguientes:

  • MySQL: Usa el motor de bases de datos MySQL Community Edition.
  • PostgreSQL: Se basa en la versión de PostgreSQL open source. Permite realizar consultas distribuidas con Citus.

Servicios de Big Data

Entre los servicios de azure que integran herramientas de análisis optimizadas para Big Data se encuentran los siguientes:

Databricks logo
  • Azure Synapse Analytics: Nos permite desplegar recursos con o sin servidores para realizar anlítica SQL y con Apache Spark a modo de data warehouse.
  • HDInsight: Este servicio nos permite desplegar cargas Big Data con un stack de tecnologías open source como Hadoop, Spark, HBase o Kafka.
  • Azure Databricks: Plataforma basada en Apache Spark que implementa notebooks colaborativos en los que desarrollar y ejecutar aplicaciones.
  • Data Lake Analytics: Plataforma de analítica que nos permite desplegar trabajos de transformación de datos sin servidores.

Servicios de Almacenamiento

Azure Storage es el servicio de Azure que nos permite almacenar datos sin límites de espacio. Para usar Azure Storage debemos crear una cuenta de almacenamiento. Los clientes pueden acceder para realizar operaciones de lectura y de escritura usando HTTP y HTTPs.

Para proporcionar discos a las máquinas virtuales Azure usa Azure Disk Storage. Estos discos se conectan a las máquinas virtuales y almacenan los datos de forma persistente. Pueden ser SSD o HDD de distintos tamaños y rendimientos.

Otro servicio de almacenamiento de datos es Azure Blob Storage. Se trata de almacenamiento de objetos no estructurado. Podemos usar Blob Storage para almacenar todo tipo de ficheros de vídeo, imágenes, documentos o copias de seguridad. Además, se puede elegir el nivel de acceso a los datos, y de esta forma optimizar los costes del servicio. Existen 3 niveles: frecuente, esporádico y archivo en función de la frecuencia de acceso y la latencia.

Si necesitamos almacenamiento de bloques, podemos usar el servicio Azure Files. Este servicio de almacenamiento de datos nos proporciona un espacio compartido accesible en la nube. Este directorio remoto se puede montar en nuestras máquinas y acceder simultáneamente desde varias de ellas.

Estos dos servicios nos proporcionan URIs únicas para acceder al contenido fácilmente a través de internet.

Puedes encontrar las diferencias entre almacenamiento de objetos y almacenamiento de bloques en este artículo.

Preguntas Frecuentes Big Data en Azure: FAQ

¿Cuál es la diferencia entre Azure SQL Database y Cosmos DB

Cosmos DB es una base de datos replicada geográficamente que acepta varios modelos de datos con consistencia eventual. Por otro lado, Azure SQL Database es una base de datos relacional que no reemplaza a Cosmos DB ya que los casos de uso son diferentes.

¿Azure Disk Storage puede almacenar discos de máquinas virtuales?

Azure Disk Storage es el servicio de Azure que nos permite almacenar los discos de las máquinas virtuales. Sin embargo, este servicio no se puede usar sin las máquinas virtuales.

¿Cómo elegir el nivel de acceso adecuado en Azure Blob Storage?

Azure Blob Storage permite establecer tres niveles de acceso o de temperatura de los datos. El nivel frecuente almacenará datos que se accedan con frecuencia. El nivel esporádico es para datos a los que se accede con menos frecuencia almacenados al menos durante 30 días y el nivel de archivo hasta al menos 180 días con gran latencia de acceso.

Sigue Aprendiendo

Puedes seguir aprendiendo sobre tecnologías cloud y Microsoft Azure con estos artículos:

También, puedes acelerar tu aprendizaje con estos cursos recomendados de Udemy que te prepararán para las certificaciones de Azure:


¡Echa un ojo a mis listas de reproducción de Big Data y suscríbete al canal de Youtube para no perderte ningún vídeo nuevo!

Si te ayuda el contenido del blog, ¡considera unirte a la lista de correo para reconocer el trabajo!

Deja una respuesta